基于事件的微处理器系统功率仿真
发布时间:2007/8/24 0:00:00 访问次数:380
获得精确的电路功率估计并不是件轻松的事,象SPICE这样的业界标准仿真工具虽然能够预测出较精确的功耗,但要花很多的运行时间。本文以PowerPC 405GP的处理器内核为例,说明基于事件的功率模型可以提供良好的微处理器功率估计。
为了更好地研究计算所用的功率,需要建立能对程序和操作系统进行快速、精确地功率与性能估计的仿真基础架构。为此我们开发出了针对PowerPC 405GP内核的基于事件的功率与性能仿真引擎。其中的前期工作表明,通过观察处理器内部发生的一系列事件可以计算得到相对精确的功耗估计。这种方法可以进一步拓展到整个系统的功率估计。为了验证推论,我们开发了一种405GP内核的周期精确模型,并补充了对不同处理器内核事件的能量估计,最终生成了一张动态处理器功耗图。能量估计的基础是针对用于功率测量的已有405GP板的测试结果。目前正在运行着相同操作系统和应用程序的硬件上确认仿真器的时序和功率精度。初步的时序比较表明,仿真时间平均是使用4个EEMBC基准应用的硬件仿真时间的4.57%。在应用程序的稳定状态期间仿真功率中的平均错误是5.12%。仿真器本身速度慢了300倍,在相同的4个应用程序上的平均速度是每秒436,000条指令。
图1:PowerPC 405GP的模块框图。
问题的引出
在计算机系统的功率研究方面有许多问题需要解决。低功率VLSI电路、创新的微结构、新的半导体技术和制造工艺、关注功率的创新编译器算法、应用程序和操作系统技术在能量高效的系统设计中被广为使用等等。我们对问题涉及的系统软件和架构比较感兴趣。不幸的是,许多象我们这样的研究小组都无法接触为运行着实际操作系统和应用软件的系统准备的快速精确的功率仿真环境。获得精确的电路功率估计并不是件轻松的事。象SPICE这样的业界标准仿真工具虽然能够预测出较精确的功耗,但要花很多的运行时间。也有一些工具(如Sequence Design的WattWatcher和PowerTheater试图通过在较高抽象层(如Verilog或VHDL寄存器传输模型)执行仿真来改善功率估计的性能。不幸的是,即使是这样的工具也需要在训练和运行上支出大量的时间,以致于对操作系统和整个应用程序的研究变得不切实际。这也是我们目前努力开发快速、精确的基于事件的功率模型的原因。该功率模型将作为CycleSim周期精确执行驱动仿真器的一部分。CycleSim仿真器包含在IBM的奥斯汀研究实验室开发的Mambo仿真环境中。
图2:贝塞尔曲线硬件功率。
以往的经验表明,基于事件的功率模型可以提供良好的微处理器功率估计。不幸的是,在研究新的硬件上不支持事件跟踪的架构或系统时这种模型无法派上用场。我们的仿真工具可以填补这一空白。为了证明这种观念的有效性,我们为PowerPC 405GP内的处理器内核开发了一个功率和性能模型。一旦该方法得到证实,就能为其它微处理器建立模型,并用最好的可用VLSI设计工具建立功率估计,从而正确地预测出运行操作系统和实际应用软件的未来计算机系统的功率行为。
图3:贝塞尔曲线仿真功率。
下面首先概括地介绍CycleSim和PowerPC 405GP模型,然后详细描述获取405GP的基于事件的功率模型的方法,接着讨论仿真器的时序和功率精度的有效性,最后是总结,同时指出了将来需要进一步开展的工作。
CycleSim介绍
CycleSim是一个为PowerPC架构设计的以事
获得精确的电路功率估计并不是件轻松的事,象SPICE这样的业界标准仿真工具虽然能够预测出较精确的功耗,但要花很多的运行时间。本文以PowerPC 405GP的处理器内核为例,说明基于事件的功率模型可以提供良好的微处理器功率估计。
为了更好地研究计算所用的功率,需要建立能对程序和操作系统进行快速、精确地功率与性能估计的仿真基础架构。为此我们开发出了针对PowerPC 405GP内核的基于事件的功率与性能仿真引擎。其中的前期工作表明,通过观察处理器内部发生的一系列事件可以计算得到相对精确的功耗估计。这种方法可以进一步拓展到整个系统的功率估计。为了验证推论,我们开发了一种405GP内核的周期精确模型,并补充了对不同处理器内核事件的能量估计,最终生成了一张动态处理器功耗图。能量估计的基础是针对用于功率测量的已有405GP板的测试结果。目前正在运行着相同操作系统和应用程序的硬件上确认仿真器的时序和功率精度。初步的时序比较表明,仿真时间平均是使用4个EEMBC基准应用的硬件仿真时间的4.57%。在应用程序的稳定状态期间仿真功率中的平均错误是5.12%。仿真器本身速度慢了300倍,在相同的4个应用程序上的平均速度是每秒436,000条指令。
图1:PowerPC 405GP的模块框图。
问题的引出
在计算机系统的功率研究方面有许多问题需要解决。低功率VLSI电路、创新的微结构、新的半导体技术和制造工艺、关注功率的创新编译器算法、应用程序和操作系统技术在能量高效的系统设计中被广为使用等等。我们对问题涉及的系统软件和架构比较感兴趣。不幸的是,许多象我们这样的研究小组都无法接触为运行着实际操作系统和应用软件的系统准备的快速精确的功率仿真环境。获得精确的电路功率估计并不是件轻松的事。象SPICE这样的业界标准仿真工具虽然能够预测出较精确的功耗,但要花很多的运行时间。也有一些工具(如Sequence Design的WattWatcher和PowerTheater试图通过在较高抽象层(如Verilog或VHDL寄存器传输模型)执行仿真来改善功率估计的性能。不幸的是,即使是这样的工具也需要在训练和运行上支出大量的时间,以致于对操作系统和整个应用程序的研究变得不切实际。这也是我们目前努力开发快速、精确的基于事件的功率模型的原因。该功率模型将作为CycleSim周期精确执行驱动仿真器的一部分。CycleSim仿真器包含在IBM的奥斯汀研究实验室开发的Mambo仿真环境中。
图2:贝塞尔曲线硬件功率。
以往的经验表明,基于事件的功率模型可以提供良好的微处理器功率估计。不幸的是,在研究新的硬件上不支持事件跟踪的架构或系统时这种模型无法派上用场。我们的仿真工具可以填补这一空白。为了证明这种观念的有效性,我们为PowerPC 405GP内的处理器内核开发了一个功率和性能模型。一旦该方法得到证实,就能为其它微处理器建立模型,并用最好的可用VLSI设计工具建立功率估计,从而正确地预测出运行操作系统和实际应用软件的未来计算机系统的功率行为。
图3:贝塞尔曲线仿真功率。
下面首先概括地介绍CycleSim和PowerPC 405GP模型,然后详细描述获取405GP的基于事件的功率模型的方法,接着讨论仿真器的时序和功率精度的有效性,最后是总结,同时指出了将来需要进一步开展的工作。
CycleSim介绍
CycleSim是一个为PowerPC架构设计的以事