处理器存储器子系统中的SoC功耗优化设计
发布时间:2008/5/28 0:00:00 访问次数:472
有些eda工具具有门控时钟、降压、降频和减少漏电电流等功能,有些芯片制造商能够提供低功耗库和工艺,所有这些工艺都非常费时;在最好情况下能够提供两倍的性能提升,因为这些提升是在设计周期的后端进行的。
功耗优化的最佳时间是在设计周期的一开始进行,即在确定体系结构的系统级进行优化。确定系统级体系结构对功耗影响非常大,如局部存储器和高速缓存的数量和容量。在设计周期的一开始进行优化可以减少功耗十倍以上。
tensilica公司的xenergy是业界第一个用于评估功耗对整个处理器子系统(处理器、高速缓存和局部存储器)影响的软件工具,该工具基于在子系统上实际执行应用程序代码。这种在设计周期的一开始就进行功耗估计的方法只需要几分钟时间,而那种基于rtl的功耗分析方法则需要几个小时甚至几天。soc体系结构设计人员可以使用这些数据对软件程序和tensilica的xtensa处理器进行功耗优化。对tensilica公司的钻石标准处理器用户而言,该工具有助于软件优化,但钻石标准处理器不能改变。
处理器和存储器功耗优化
xenergy工具包括一个二进制代码软件及相关信息,前者表示目标处理器,后者表示制造工艺及工作条件。xenergy工具使用tensilica的指令集仿真器iss来执行二进制代码软件,其输出是一个处理器核及存储器功耗和能量报告,包括动态功耗、漏电功耗、全部功耗以及处理器核与紧密耦合的本地存储器功耗。设计人员可以修改程序软件或者xtensa配置硬件来优化处理器功耗分布,并重新运行xenergy工具。整个流程如图1所示。
设计人员可以使用xenergy工具来执行两项基本任务。一是通过修改应用程序软件来减少存储器访问次数,进而减少处理器和存储器功耗;二是可以调整xtensa可配置处理器及其相关存储器,这通过选择不同的配置选项,增加指令扩展、寄存器文件、新执行部件,并改变本地存储器和高速缓存的数量和容量。
考虑的焦点是整个系统的能量消耗,在有些情况下具有一定的欺骗性。整个系统的功耗是功耗系数(mw/mhz)和执行一定负载所需要的时钟周期数(毫秒)的乘积。如果一条新指令加到xtensa可配置处理器后,虽然增加了功耗系数,但却减少了整个时钟周期数。例如,功耗系数增加20%,但导致程序执行速度提高3倍。在这种情况下,整个系统功耗实际上降低了60%。
图1:xenergy能量估计软件能够对运行在tensilica xtensa可配置处理器或者钻石标准处理器上的应用程序进行功耗评估。
工作原理
针对各种处理器配置情况以及不同的制造工艺,tensilica生成的访存(读和写)功耗统计模型和每条指令的功耗统计模型均经过详细的综合、rtl代码设计以及门级仿真。xenergy工具使用这些模型,即使采用tensilica指令扩展(tie)语言编写的由设计人员定义的指令也不例外。
xenergy工具使用访存功耗统计模型和指令功耗统计模型,包括了用tensilica指令扩展语言编写的由设计人员定义的扩展指令。针对各种处理器配置情况以及不同的制造工艺,这些统计模型的开发包括了详细的综合、rtl代码设计以及门级仿真。
xenergy工具采用tensilica的指令集仿真器iss对应用程序进行仿真,仿真精度达到时钟周期。仿真后可以给出每条指令执行以及每次访存的综合统计信息。针对采用的处理器和存储器,xenergy工具可以估计出相应的动态功耗、漏电功耗和全部功耗。
存储器和应用程序代码效应
有些tie指令可以改善应用程序的性能,但极大地增加了访存次数,进而增加了系统功耗。而且,对高速缓存的更新(容量和关联度)有助于功耗优化。xenergy程序能够帮助设计人员理解整个处理器的变化所造成的影响,这些变化是在处理器配置过程中随着存储器的不同所引起的。
类似地,xenergy工具能够帮助开发人员修改应用程序代码来减少处理器和存储器的能量消耗。例如,在应用程序中对数据结构进行重构能够降低访存次数。通过使用tensilica的标准软件工具,开发人员可以发现应用程序的改善情况。通过使用xenergy工具,开发人员能够发现通过修改程序代码来降低系统功耗。
一个例子
我们采用eembc(嵌入式微处理器典型程序联盟,参见网址www.eembc.org)中的rgb到yuv颜色转换典型程序来说明xenergy工具是如果在实际应用程序中使用的。
我们也可以采用tensilica的xpres(xtensa处理器扩展综合)编译器,该编译器利用c或者c++编写的应用程序软件作为输入数据,并
有些eda工具具有门控时钟、降压、降频和减少漏电电流等功能,有些芯片制造商能够提供低功耗库和工艺,所有这些工艺都非常费时;在最好情况下能够提供两倍的性能提升,因为这些提升是在设计周期的后端进行的。
功耗优化的最佳时间是在设计周期的一开始进行,即在确定体系结构的系统级进行优化。确定系统级体系结构对功耗影响非常大,如局部存储器和高速缓存的数量和容量。在设计周期的一开始进行优化可以减少功耗十倍以上。
tensilica公司的xenergy是业界第一个用于评估功耗对整个处理器子系统(处理器、高速缓存和局部存储器)影响的软件工具,该工具基于在子系统上实际执行应用程序代码。这种在设计周期的一开始就进行功耗估计的方法只需要几分钟时间,而那种基于rtl的功耗分析方法则需要几个小时甚至几天。soc体系结构设计人员可以使用这些数据对软件程序和tensilica的xtensa处理器进行功耗优化。对tensilica公司的钻石标准处理器用户而言,该工具有助于软件优化,但钻石标准处理器不能改变。
处理器和存储器功耗优化
xenergy工具包括一个二进制代码软件及相关信息,前者表示目标处理器,后者表示制造工艺及工作条件。xenergy工具使用tensilica的指令集仿真器iss来执行二进制代码软件,其输出是一个处理器核及存储器功耗和能量报告,包括动态功耗、漏电功耗、全部功耗以及处理器核与紧密耦合的本地存储器功耗。设计人员可以修改程序软件或者xtensa配置硬件来优化处理器功耗分布,并重新运行xenergy工具。整个流程如图1所示。
设计人员可以使用xenergy工具来执行两项基本任务。一是通过修改应用程序软件来减少存储器访问次数,进而减少处理器和存储器功耗;二是可以调整xtensa可配置处理器及其相关存储器,这通过选择不同的配置选项,增加指令扩展、寄存器文件、新执行部件,并改变本地存储器和高速缓存的数量和容量。
考虑的焦点是整个系统的能量消耗,在有些情况下具有一定的欺骗性。整个系统的功耗是功耗系数(mw/mhz)和执行一定负载所需要的时钟周期数(毫秒)的乘积。如果一条新指令加到xtensa可配置处理器后,虽然增加了功耗系数,但却减少了整个时钟周期数。例如,功耗系数增加20%,但导致程序执行速度提高3倍。在这种情况下,整个系统功耗实际上降低了60%。
图1:xenergy能量估计软件能够对运行在tensilica xtensa可配置处理器或者钻石标准处理器上的应用程序进行功耗评估。
工作原理
针对各种处理器配置情况以及不同的制造工艺,tensilica生成的访存(读和写)功耗统计模型和每条指令的功耗统计模型均经过详细的综合、rtl代码设计以及门级仿真。xenergy工具使用这些模型,即使采用tensilica指令扩展(tie)语言编写的由设计人员定义的指令也不例外。
xenergy工具使用访存功耗统计模型和指令功耗统计模型,包括了用tensilica指令扩展语言编写的由设计人员定义的扩展指令。针对各种处理器配置情况以及不同的制造工艺,这些统计模型的开发包括了详细的综合、rtl代码设计以及门级仿真。
xenergy工具采用tensilica的指令集仿真器iss对应用程序进行仿真,仿真精度达到时钟周期。仿真后可以给出每条指令执行以及每次访存的综合统计信息。针对采用的处理器和存储器,xenergy工具可以估计出相应的动态功耗、漏电功耗和全部功耗。
存储器和应用程序代码效应
有些tie指令可以改善应用程序的性能,但极大地增加了访存次数,进而增加了系统功耗。而且,对高速缓存的更新(容量和关联度)有助于功耗优化。xenergy程序能够帮助设计人员理解整个处理器的变化所造成的影响,这些变化是在处理器配置过程中随着存储器的不同所引起的。
类似地,xenergy工具能够帮助开发人员修改应用程序代码来减少处理器和存储器的能量消耗。例如,在应用程序中对数据结构进行重构能够降低访存次数。通过使用tensilica的标准软件工具,开发人员可以发现应用程序的改善情况。通过使用xenergy工具,开发人员能够发现通过修改程序代码来降低系统功耗。
一个例子
我们采用eembc(嵌入式微处理器典型程序联盟,参见网址www.eembc.org)中的rgb到yuv颜色转换典型程序来说明xenergy工具是如果在实际应用程序中使用的。
我们也可以采用tensilica的xpres(xtensa处理器扩展综合)编译器,该编译器利用c或者c++编写的应用程序软件作为输入数据,并