1.5.2.汇编写启动代码之设置栈和调用C语言1
1.5.2.1、C语言运行时需要和栈的意义
“C语言运行时(runtime)”需要一定的条件,这些条件由汇编来提供。C语言运行时主要是需要栈
C语言与栈的关系:C语言中的局部变量都是用栈来实现的。如果我们汇编部分没有给C部分预先设置合理合法的栈地址,那么C代码中定义的局部变量就会落空,整个程序就死掉了。
我们平时在编写单片机程序(譬如51单片机)或者编写应用程序时并没有去设置栈,但是C程序还是可以运行的。原因是:在单片机中由硬件初始化时提供了一个默认可用的栈,在应用程序中我们编写的C程序其实并不是全部,编译器(gcc)在链接的时候会帮我们自动添加一个头,这个头就是一段引导我们的C程序能够执行的一段汇编实现的代码,这个代码中就帮我们的C程序设置了栈及其他的运行时需要。
1.5.2.2、CPU模式和各种模式下的栈
在ARM中37个寄存器中,每种模式下都有自己的独立的SP寄存器(r13),为什么这么设计?
如果各种模式都使用同一个SP,那么就意味着整个程序(操作系统内核程序、用户自己编写的应用程序)都是用一个栈的。你的应用程序如果一旦出错(譬如栈溢出),就会连累操作系统的栈也损坏,整个操作系统的程序就会崩溃。这样的操作系统设计是非常脆弱的,不合理的。
解决方案就是各种模式下用不同的栈。我的操作系统内核使用自己的栈,每个应用程序也使用自己独立的栈,这样各是各的,一个损坏不会连累其他人。
我们现在要设置栈,不可能也懒的而且也没有必要去设置所有的栈,我们先要找到自己的模式,然后设置自己的模式下的栈到合理合法的位置,即可。
注意:系统在复位后默认是进入SVC模式的
我们如何访问SVC模式下的SP呢?很简单,先把模式设置为SVC,再直接操作SP。但是因为我们复位后就已经是SVC模式了,所以直接设置SP即可。
1.5.2.3、查阅文档并设置栈指针至合法位置
栈必须是当前一段可用的内存(可用的意思是这个地方必须有被初始化过可以访问的内存,而且这个内存只会被我们用作栈,不会被其他程序征用)
当前CPU刚复位(刚启动),外部的DRRAM尚未初始化,目前可用的内存只有内部的SRAM(因为它不需初始化即可使用)。因此我们只能在SRAM中找一段内存来作为SVC的栈。
栈有四种:满减栈 满增栈 空减栈 空增栈
满栈:进栈:先移动指针再存; 出栈:先出数据再移动指针
空栈:xxx
减栈:进栈:指针向下移动; 出栈:指针向上移动
增栈:xxx
在ARM中,ATPCS(ARM关于程序应该怎么实现的一个规范)要求使用满减栈,所以不出意外都是用满减栈
结合iROM_application_note中的memory map,可知SVC栈应该设置为0xd0037D80
上一篇:汇编写启动代码之开iCache
下一篇:汇编写启动代码之关看门狗
led.c 可以定义宏的方式如下优化:
#define GPJ0CON 0xE0200240
#define GPJ0DAT 0xE0200244
#define rGPJ0CON *((volatile unsigned int *)GPJ0CON)
#define rGPJ0DAT *((volatile unsigned int *)GPJ0DAT)
//因为现在delay函数写在主程序之后,所以要在程序前面先声明
//如果把delay函数直接写在这里就不需要多加这个声明了
void delay(void);
//该函数要实现led闪烁效果
void led_blink(void)
{
//led初始化,也就是把GPJ0CON中设置为输出模式
//unsigned int *p = (unsigned int *)GPJ0CON;
//unsigned int *p1 = (unsigned int *)GPJ0DAT;
rGPJ0CON = 0X11111111;
while(1)
{
//led亮
rGPJ0DAT = ((0<<3) | (0<<4) | (0<<5));
//延时
delay();
//led灭
rGPJ0DAT = ((1<<3) | (0<<4) | (1<<5));
//延时
delay();
}
}
//延时函数
void delay(void)
{
volatile unsigned int i = 100000; //volatile 让编译器不要优化,这样才能真正的循环减
while(i--); //才能消耗时间,实现delay
}
1.5.3.汇编写启动代码之设置栈和调用C语言2
1.5.3.1、C函数的编写和被汇编调用
在工程中新建并且添加一个C语言源文件(led.c),注意添加时要修改Makefile
在汇编启动代码中设置好栈后,使用bl xxx的方式来调用C中的函数xxx
1.5.3.2、使用C语言来访问寄存器的语法
寄存器的地址类似于内存地址(IO与内存统一编址的),所以这里的问题是用C语言读写寄存器,就是用C语言来读写内存地址。用C语言来访问内存,就要用到指针
unsigned int *p = (unsigned int *)0x0xE0200240;
*p = 0x11111111;
上面这两句其实可以简化为1句:*((unsigned int *)0x0xE0200240) = 0x11111111;
1.5.3.3、神奇的volatile
volatile的作用是让程序在编译时,编译器不对程序做优化。优化有时候是ok的,但是有时候是自作聪明会造成程序不对。如果你的一个变量是易变的,不希望编译器帮我们做优化,就在这个变量定义时加volatile。
加不加有没有差别,取决于编译器。如果编译器做了优化则有差异;如果编译器本身没做优化,那就没有差别。
在我们这里(编译器是arm-2009q3),实际测试加不加效果是一样的。
1.5.3.4、总结:
C和汇编函数的互相调用(函数名和汇编标号的真实意义)
C语法对内存访问的封装方式(使用指针来访问内存的技巧)
汇编的意义(起始代码&效率关键部位)
1.5.3.5、编译报错(实际上是连接阶段报错):undefined reference to `__aeabi_unwind_cpp_pr1'
解决方法:把错误信息直接贴到baidu搜索(baidu搜索不到找google),根据搜索到的内容一个一个看,一个一个尝试,直到解决。
解决:在编译时添加-nostdlib这个编译选项即可解决。nostdlib就是不使用标准函数库。标准函数库就是编译器中自带的函数库,用-nostdlib可以让编译器链接器优先选择我程序内自己写的函数库。
Makefle
led.bin: start.o led.o
arm-linux-ld -Ttext 0x0 -o led.elf $^
arm-linux-objcopy -O binary led.elf led.bin
arm-linux-objdump -D led.elf > led_elf.dis
gcc mkv210_image.c -o mkx210
./mkx210 led.bin 210.bin
%.o : %.S
arm-linux-gcc -o $@ $< -c -nostdlib
%.o : %.c
arm-linux-gcc -o $@ $< -c -nostdlib
clean:
rm *.o *.elf *.bin *.dis mkx210 -f
start.S
/*
* 文件名: led.s
* 作者: 中宇工控-宗虎冬
* 描述: 汇编设置栈 并且调用c语言来点亮LED
*/
#define WTCON 0XE2700000
#define SVC_STACK 0XD0037D80
.global _start // 把_start链接属性改为外部,这样其他文件就可以看见_start了
_start:
//第1步关看门狗
ldr r0, =WTCON
ldr r1, =(0<<5)
str r1, [r0]
//第2步:设置栈
ldr sp, =SVC_STACK
//从这之后就可以开始调用c程序了
bl led_blink // led_blink是c语言实现的一个函数
//汇编最后的这个死循环不能丢
b .
led.c
#define GPJ0CON 0xE0200240
#define GPJ0DAT 0xE0200244
//因为现在delay函数写在主程序之后,所以要在程序前面先声明
//如果把delay函数直接写在这里就不需要多加这个声明了
void delay(void);
//该函数要实现led闪烁效果
void led_blink(void)
{
//led初始化,也就是把GPJ0CON中设置为输出模式
unsigned int *p = (unsigned int *)GPJ0CON;
unsigned int *p1 = (unsigned int *)GPJ0DAT;
*p = 0X11111111;
while(1)
{
//led亮
*p1 = ((0<<3) | (0<<4) | (0<<5));
//延时
delay();
//led灭
*p1 = ((1<<3) | (0<<4) | (1<<5));
//延时
delay();
}
}
//延时函数
void delay(void)
{
volatile unsigned int i = 100000; //volatile 让编译器不要优化,这样才能真正的循环减
while(i--); //才能消耗时间,实现delay
}
//下面注释
#if 0
//之后为功能代码
// 第一步:把所有引脚都设置为输出模式,代码不变
ldr r0, =0x11111111 // 从后面的=可以看出用的是ldr伪指令,因为需要编译器来判断这个数
ldr r1, =GPJ0CON // 是合法立即数还是非法立即数。一般写代码都用ldr伪指令
str r0, [r1] // 寄存器间接寻址。功能是把r0中的数写入到r1中的数为地址的内存中去
// 要实现流水灯,只要在主循环中实现1圈的流水显示效果即可
flash:
// 第1步:点亮LED1,其他熄灭
//ldr r0, =((0<<3) | (1<<4) | (1<<5)) // 清清楚楚的看到哪个灭,哪个是亮
ldr r0, =~(1<<3)
ldr r1, =GPJ0DAT
str r0, [r1] // 把0写入到GPJ0DAT寄存器中,引脚即输出低电平,LED点亮
// 然后延时
bl delay // 使用bl进行函数调用
// 第2步:点亮LED2,其他熄灭
ldr r0, =~(1<<4)
ldr r1, =GPJ0DAT
str r0, [r1] // 把0写入到GPJ0DAT寄存器中,引脚即输出低电平,LED点亮
// 然后延时
bl delay // 使用bl进行函数调用
// 第3步:点亮LED3,其他熄灭
ldr r0, =~(1<<5)
ldr r1, =GPJ0DAT
str r0, [r1] // 把0写入到GPJ0DAT寄存器中,引脚即输出低电平,LED点亮
// 然后延时
bl delay // 使用bl进行函数调用
b flash
// 延时函数:函数名:delay
delay:
ldr r2, =9000000
ldr r3, =0x0
delay_loop:
sub r2, r2, #1 //r2 = r2 -1
cmp r2, r3 // cmp会影响Z标志位,如果r2等于r3则Z=1,下一句中eq就会成立
bne delay_loop
mov pc, lr // 函数调用返回
#endif
相关手册下载
S5PV210_iROM_ApplicationNote_Preliminary_20091126.pdf
/*
* 文件名: led.s
* 作者: 中宇工控-宗虎冬
* 描述: 汇编设置栈
*/
#define GPJ0CON 0xE0200240
#define GPJ0DAT 0xE0200244
#define WTCON 0XE2700000
#define SVC_STACK 0XD0037D80
.global _start // 把_start链接属性改为外部,这样其他文件就可以看见_start了
_start:
//第1步关看门狗
ldr r0, =WTCON
ldr r1, =(0<<5)
str r1, [r0]
//第2步:设置栈
ldr sp, =SVC_STACK
//从这之后就可以开始调用c程序了,下面的流水灯汇编程序多可以删了,用c写了
bl bl cfuncion
//之后为功能代码
// 第一步:把所有引脚都设置为输出模式,代码不变
ldr r0, =0x11111111 // 从后面的=可以看出用的是ldr伪指令,因为需要编译器来判断这个数
ldr r1, =GPJ0CON // 是合法立即数还是非法立即数。一般写代码都用ldr伪指令
str r0, [r1] // 寄存器间接寻址。功能是把r0中的数写入到r1中的数为地址的内存中去
/*
* 文件名: led.s
* 作者: 中宇工控-宗虎冬
* 描述: 汇编设置栈
*/
#define GPJ0CON 0xE0200240
#define GPJ0DAT 0xE0200244
#define WTCON 0XE2700000
#define SVC_STACK 0XD0037D80
.global _start // 把_start链接属性改为外部,这样其他文件就可以看见_start了
_start:
//第1步关看门狗
ldr r0, =WTCON
ldr r1, =(0<<5)
str r1, [r0]
//第2步:设置栈
ldr sp, =SVC_STACK
//之后为功能代码
// 第一步:把所有引脚都设置为输出模式,代码不变
ldr r0, =0x11111111 // 从后面的=可以看出用的是ldr伪指令,因为需要编译器来判断这个数
ldr r1, =GPJ0CON // 是合法立即数还是非法立即数。一般写代码都用ldr伪指令
str r0, [r1] // 寄存器间接寻址。功能是把r0中的数写入到r1中的数为地址的内存中去
// 要实现流水灯,只要在主循环中实现1圈的流水显示效果即可
flash:
// 第1步:点亮LED1,其他熄灭
//ldr r0, =((0<<3) | (1<<4) | (1<<5)) // 清清楚楚的看到哪个灭,哪个是亮
ldr r0, =~(1<<3)
ldr r1, =GPJ0DAT
str r0, [r1] // 把0写入到GPJ0DAT寄存器中,引脚即输出低电平,LED点亮
// 然后延时
bl delay // 使用bl进行函数调用
// 第2步:点亮LED2,其他熄灭
ldr r0, =~(1<<4)
ldr r1, =GPJ0DAT
str r0, [r1] // 把0写入到GPJ0DAT寄存器中,引脚即输出低电平,LED点亮
// 然后延时
bl delay // 使用bl进行函数调用
// 第3步:点亮LED3,其他熄灭
ldr r0, =~(1<<5)
ldr r1, =GPJ0DAT
str r0, [r1] // 把0写入到GPJ0DAT寄存器中,引脚即输出低电平,LED点亮
// 然后延时
bl delay // 使用bl进行函数调用
b flash
// 延时函数:函数名:delay
delay:
ldr r2, =9000000
ldr r3, =0x0
delay_loop:
sub r2, r2, #1 //r2 = r2 -1
cmp r2, r3 // cmp会影响Z标志位,如果r2等于r3则Z=1,下一句中eq就会成立
bne delay_loop
mov pc, lr // 函数调用返回