嵌入式中C和汇编的一些技巧

发布时间:2008/8/18 0:00:00 访问次数:748

　　arm汇编部分：

　　a. 条件执行

　　cmp r0,#5

beq bypass

add r1,r1,r0

sub r1,r1,r2

　　bypass ......

　　可以替代为：

　　cmp r0,#5

　　addne r1,r1,r0

　　subne r1,r1,r2

......

　　如果被跳过的指令序列并不进行复杂的操作，使用条件执行都要比使用转移好，因为arm转义指令一般要用3个周期来执行。

　　对于以下的条件执行可以这样来写汇编：

　　; if ( (a = = b) && (c = = d) ) e++

　　cmp r0,r1

　　cmpeq r2,r3

　　addeq r4,r4,#1

　　c语言部分：

　　a. 很多人认为以下两种变量定义空间效率一样的：

① char a;

short b;

char c;

int d;

② char a;

char b;

short c;

int d;

　　其实不然，定义次序的不同导致最终映像中不同的数据布局，实际中第二种定义方式能够节约更多的存储空间，所以在变量声名时，最好把所有相同类型的变量放在一起定义，这样可以优化存储器布局。

　　b. 我们总是设法使用short或者char来定义变量，认为这样能够节省存储空间，但也有例外，我们先来看下这几段c代码及其相应的汇编：

　　① c代码：

int addition(int a)

{ return a+1; }

　　汇编：

add a1,a1,#1

　　② c代码：

short addition(short a)

{ return a+1; }

　　汇编：

add a1,a1,#1

mov a1,a1,lsl #16

mov a1,a1,asr #16

mov pc,lr

　　③ c代码：

char addition(char a)

{ return a+1; }

　　汇编：

add a1,a1,#1

and a1,a1,# &ff

mov pc,lr

　　因为char 类型、short类型分别是8位、16位，完成加法操作后，需要在32位的寄存器中进行符号扩展，所以使用32位的int以及unsinged int做加法效率最高。

　　c．冗余变量要消耗空间，许多人都不赞同使用它，但是下面这种情况就不同了。

int m ( void );

int n ( void );

int fg;

　　① void func_1 ( void )

{

fg += m ( );

fg += n ( );

}

　　② void func_2 ( void )

{

int tmp = fg;

tmp += m ( );

tmp += n ( );

fg = tmp;

}

　　在func_1 ( ) 中每次对全局变量fg的加法操作都需要从存储器load到寄存器里，加完数据后还要store回原来的存储器，所以这个函数就进行了两次load和两次store操作。在func_2 ( ) 中，tmp作为局部变量，系统为其分配一寄存器，首先执行一次load操作后，由tmp进行加法，最后只需一次store操作把结果送给fg，节省了很多时间，毕竟读/写存储器的时间耗费要比读/写寄存器高得多。

　　d．关于计数循环的问题，一般我们都会使用累加计数的方式，递减计数用得比较少，虽然从c代码上看累加和递减两种方式时间复杂度相同，但是在对时间要求严格的嵌入式领域，这两者执行时间还是有差别的。

　　① 累加计数方式：

for ( i = 1; i < times; i ++ )

{

tmp = tmp * i ;

}

　　汇编：

……

0x06: mul r2,r1,r2

0x10: add r1,r1,#1

0x14: cmp r2,r0

0x18: ble 0x06

……

　　② 递减计数方式：

for ( i = times; i > 1; i -- )

{

tmp = tmp * i ;

}

　　汇编：

……

0x06: mul r0,r1,r0

0x10: sub r1,r1,#1

0x14: bne 0x06

……

　　从上面的汇编可以看出，累加计数需要用到专门的cmp指令来判断条件，而递减计数只需要利用条件执行的ne进行判别，当循环次数的量很大的话时间效率就有差别了。

　　欢迎转载,信息来自维库电子市场网（www.dzsc.com）

　　arm汇编部分：

　　a. 条件执行

　　cmp r0,#5

beq bypass

add r1,r1,r0

sub r1,r1,r2

　　bypass ......

　　可以替代为：

　　cmp r0,#5

　　addne r1,r1,r0

　　subne r1,r1,r2

......

　　如果被跳过的指令序列并不进行复杂的操作，使用条件执行都要比使用转移好，因为arm转义指令一般要用3个周期来执行。

　　对于以下的条件执行可以这样来写汇编：

　　; if ( (a = = b) && (c = = d) ) e++

　　cmp r0,r1

　　cmpeq r2,r3

　　addeq r4,r4,#1

　　c语言部分：

　　a. 很多人认为以下两种变量定义空间效率一样的：

① char a;

short b;

char c;

int d;

② char a;

char b;

short c;

int d;

　　b. 我们总是设法使用short或者char来定义变量，认为这样能够节省存储空间，但也有例外，我们先来看下这几段c代码及其相应的汇编：

　　① c代码：

int addition(int a)

{ return a+1; }

　　汇编：

add a1,a1,#1

　　② c代码：

short addition(short a)

{ return a+1; }

　　汇编：

add a1,a1,#1

mov a1,a1,lsl #16

mov a1,a1,asr #16

mov pc,lr

　　③ c代码：

char addition(char a)

{ return a+1; }

　　汇编：

add a1,a1,#1

and a1,a1,# &ff

mov pc,lr

　　因为char 类型、short类型分别是8位、16位，完成加法操作后，需要在32位的寄存器中进行符号扩展，所以使用32位的int以及unsinged int做加法效率最高。

　　c．冗余变量要消耗空间，许多人都不赞同使用它，但是下面这种情况就不同了。

int m ( void );

int n ( void );

int fg;

　　① void func_1 ( void )

{

fg += m ( );

fg += n ( );

}

　　② void func_2 ( void )

{

int tmp = fg;

tmp += m ( );

tmp += n ( );

fg = tmp;

}

　　① 累加计数方式：

for ( i = 1; i < times; i ++ )

{

tmp = tmp * i ;

}

　　汇编：

……

0x06: mul r2,r1,r2

0x10: add r1,r1,#1

0x14: cmp r2,r0

0x18: ble 0x06

……

　　② 递减计数方式：

for ( i = times; i > 1; i -- )

{

tmp = tmp * i ;

}

　　汇编：

……

0x06: mul r0,r1,r0

0x10: sub r1,r1,#1

0x14: bne 0x06

……

上一篇：基于构件技术的嵌入式系统复用软件设计

上一篇：嵌入式系统软件及编程语言

相关技术资料: 7-12PWM输入功率驱动器工作原理; 7-12隔离式 DC/DC 变换器和模块优势特征; 7-12解读集成4 个高效降压 DC/DC 变换器; 7-12数字隔离功能全集成 DC/DC 电源变换器简述; 7-12集成低噪声电流输入模数转换器 (ADC)应用详解; 7-12128 通道20 位电流数字转换器应用探究; 7-11最新12kW量产电源参考设计简述; 7-11第三代快速碳化硅MOSFET技术参数应用; 7-11800 V高压直流 (HVDC)全新架构电源系统; 7-11串行千兆位媒体独立接口（SGMII和RGMII）; 7-11Analog Devices ADIN3310应用详情; 7-11干簧传感器MK17系列应用详解

相关IC型号

嵌入式中C和汇编的一些技巧

热门点击

推荐技术资料