嵌入式中C和汇编的一些技巧
发布时间:2008/8/18 0:00:00 访问次数:745
a. 条件执行
cmp r0,#5
beq bypass
add r1,r1,r0
sub r1,r1,r2
bypass ......
可以替代为:
cmp r0,#5
addne r1,r1,r0
subne r1,r1,r2
......
如果被跳过的指令序列并不进行复杂的操作,使用条件执行都要比使用转移好,因为arm转义指令一般要用3个周期来执行。
对于以下的条件执行可以这样来写汇编:
; if ( (a = = b) && (c = = d) ) e++
cmp r0,r1
cmpeq r2,r3
addeq r4,r4,#1
c语言部分:
a. 很多人认为以下两种变量定义空间效率一样的:
① char a;
short b;
char c;
int d;
② char a;
char b;
short c;
int d;
其实不然,定义次序的不同导致最终映像中不同的数据布局,实际中第二种定义方式能够节约更多的存储空间,所以在变量声名时,最好把所有相同类型的变量放在一起定义,这样可以优化存储器布局。
b. 我们总是设法使用short或者char来定义变量,认为这样能够节省存储空间,但也有例外,我们先来看下这几段c代码及其相应的汇编:
① c代码:
int addition(int a)
{ return a+1; }
汇编:
add a1,a1,#1
② c代码:
short addition(short a)
{ return a+1; }
汇编:
add a1,a1,#1
mov a1,a1,lsl #16
mov a1,a1,asr #16
mov pc,lr
③ c代码:
char addition(char a)
{ return a+1; }
汇编:
add a1,a1,#1
and a1,a1,# &ff
mov pc,lr
因为char 类型、short类型分别是8位、16位,完成加法操作后,需要在32位的寄存器中进行符号扩展,所以使用32位的int以及unsinged int做加法效率最高。
c.冗余变量要消耗空间,许多人都不赞同使用它,但是下面这种情况就不同了。
int m ( void );
int n ( void );
int fg;
① void func_1 ( void )
{
fg += m ( );
fg += n ( );
}
② void func_2 ( void )
{
int tmp = fg;
tmp += m ( );
tmp += n ( );
fg = tmp;
}
在func_1 ( ) 中每次对全局变量fg的加法操作都需要从存储器load到寄存器里,加完数据后还要store回原来的存储器,所以这个函数就进行了两次load和两次store操作。在func_2 ( ) 中,tmp作为局部变量,系统为其分配一寄存器,首先执行一次load操作后,由tmp进行加法,最后只需一次store操作把结果送给fg,节省了很多时间,毕竟读/写存储器的时间耗费要比读/写寄存器高得多。
d.关于计数循环的问题,一般我们都会使用累加计数的方式,递减计数用得比较少,虽然从c代码上看累加和递减两种方式时间复杂度相同,但是在对时间要求严格的嵌入式领域,这两者执行时间还是有差别的。
① 累加计数方式:
for ( i = 1; i < times; i ++ )
{
tmp = tmp * i ;
}
汇编:
……
0x06: mul r2,r1,r2
0x10: add r1,r1,#1
0x14: cmp r2,r0
0x18: ble 0x06
……
② 递减计数方式:
for ( i = times; i > 1; i -- )
{
tmp = tmp * i ;
}
汇编:
……
0x06: mul r0,r1,r0
0x10: sub r1,r1,#1
0x14: bne 0x06
……
从上面的汇编可以看出,累加计数需要用到专门的cmp指令来判断条件,而递减计数只需要利用条件执行的ne进行判别,当循环次数的量很大的话时间效率就有差别了。
欢迎转载,信息来自维库电子市场网(www.dzsc.com)
a. 条件执行
cmp r0,#5
beq bypass
add r1,r1,r0
sub r1,r1,r2
bypass ......
可以替代为:
cmp r0,#5
addne r1,r1,r0
subne r1,r1,r2
......
如果被跳过的指令序列并不进行复杂的操作,使用条件执行都要比使用转移好,因为arm转义指令一般要用3个周期来执行。
对于以下的条件执行可以这样来写汇编:
; if ( (a = = b) && (c = = d) ) e++
cmp r0,r1
cmpeq r2,r3
addeq r4,r4,#1
c语言部分:
a. 很多人认为以下两种变量定义空间效率一样的:
① char a;
short b;
char c;
int d;
② char a;
char b;
short c;
int d;
其实不然,定义次序的不同导致最终映像中不同的数据布局,实际中第二种定义方式能够节约更多的存储空间,所以在变量声名时,最好把所有相同类型的变量放在一起定义,这样可以优化存储器布局。
b. 我们总是设法使用short或者char来定义变量,认为这样能够节省存储空间,但也有例外,我们先来看下这几段c代码及其相应的汇编:
① c代码:
int addition(int a)
{ return a+1; }
汇编:
add a1,a1,#1
② c代码:
short addition(short a)
{ return a+1; }
汇编:
add a1,a1,#1
mov a1,a1,lsl #16
mov a1,a1,asr #16
mov pc,lr
③ c代码:
char addition(char a)
{ return a+1; }
汇编:
add a1,a1,#1
and a1,a1,# &ff
mov pc,lr
因为char 类型、short类型分别是8位、16位,完成加法操作后,需要在32位的寄存器中进行符号扩展,所以使用32位的int以及unsinged int做加法效率最高。
c.冗余变量要消耗空间,许多人都不赞同使用它,但是下面这种情况就不同了。
int m ( void );
int n ( void );
int fg;
① void func_1 ( void )
{
fg += m ( );
fg += n ( );
}
② void func_2 ( void )
{
int tmp = fg;
tmp += m ( );
tmp += n ( );
fg = tmp;
}
在func_1 ( ) 中每次对全局变量fg的加法操作都需要从存储器load到寄存器里,加完数据后还要store回原来的存储器,所以这个函数就进行了两次load和两次store操作。在func_2 ( ) 中,tmp作为局部变量,系统为其分配一寄存器,首先执行一次load操作后,由tmp进行加法,最后只需一次store操作把结果送给fg,节省了很多时间,毕竟读/写存储器的时间耗费要比读/写寄存器高得多。
d.关于计数循环的问题,一般我们都会使用累加计数的方式,递减计数用得比较少,虽然从c代码上看累加和递减两种方式时间复杂度相同,但是在对时间要求严格的嵌入式领域,这两者执行时间还是有差别的。
① 累加计数方式:
for ( i = 1; i < times; i ++ )
{
tmp = tmp * i ;
}
汇编:
……
0x06: mul r2,r1,r2
0x10: add r1,r1,#1
0x14: cmp r2,r0
0x18: ble 0x06
……
② 递减计数方式:
for ( i = times; i > 1; i -- )
{
tmp = tmp * i ;
}
汇编:
……
0x06: mul r0,r1,r0
0x10: sub r1,r1,#1
0x14: bne 0x06
……
从上面的汇编可以看出,累加计数需要用到专门的cmp指令来判断条件,而递减计数只需要利用条件执行的ne进行判别,当循环次数的量很大的话时间效率就有差别了。
欢迎转载,信息来自维库电子市场网(www.dzsc.com)
上一篇:嵌入式系统软件及编程语言