当前位置: 首页 > article >正文

ARM学习(19)交叉编译工具链的理解

笔者来聊聊ARM的函数的调用规则

1、ARM函数调用规则介绍

首先介绍几个术语,

  • AAPCS:Procedure Call Standard for the ARM Architecture
  • APCS:ARM Procedure Call Standard
  • TPCS:Thumb Procedure Call Standard
  • ATPCS:ARM-Thumb Procedure Call Standard
  • ABI:Application Binary Interface
  • EABI:Embedded Application Binary Interface

前三个基本就是ARM 架构的程序调用标准(包括ARM指令以及thumb指令),最后两个是程序二进制接口,描述是汇编下面寄存器名使用、函数调用、压栈、参数传递以及程序返回等一系列接口标准。

比如x86与arm架构的ABI 就不兼容,寄存器都不一样,肯定就是无法互相使用,包括最近比较火热的RISC-V架构。

2、ARM32/64 函数调用规则

ARM架构下面分为32位以及64位的程序,其标准有些不同以及扩展,可分开来讲。

2.1、ARM

  • 机器寄存器
    对于ARM以及thumb指令集来说,总有16个寄存器使用,不管大小写,在汇编语言里面都是可以识别的,一般来说大写的有特殊用途,详情见下文。
    • R0-R3 作为函数参数传递以及返回值使用,也可以在程序中保存立即数。
    • R12 (IP)链接器使用的暂存器
    • R9 平台寄存器,ARM不推荐使用,避免平台依赖
    • R4-R8,R10,R11 暂存器
    • R11 作为栈指针,指向程序调用中开辟空间的栈底,可用来栈回溯,具体可以参考ARMARM学习(1) 寄存器的理解 ===》FP、SP、LR寄存器。
    • R13 SP 栈指针
    • R14 LR 链接寄存器
    • R15 PC 程序计数器
    • CPSR 状态寄存器 详情介绍见ARM学习(2) 寄存器的理解 ===》通用寄存器及状态寄存器。
    • cp15 协处理 监控通用寄存器的使用
      在这里插入图片描述
  • 程序处理、内存以及栈
    一个程序的内存通常会划分为几部分:Code、read-only static data、writeable static data、heap and stack,Code段里面会包括read-only static data,DATA段会包括初始化好的全局变量,BSS包括堆栈以及未初始化和初始化为0的全局变量
    • stack 临时存储变量以及传递额外的参数(程序调用时寄存器数量不足),
    • 栈有范围限制,Limit < SP < Base
    • 其次必须4 byte对齐,
    • 程序必须访问栈的部分范围内区域(SP ,base-1),不能访问之外的区域,
      在这里插入图片描述
  • 子程序调用
    • BL指令会跳到目标程序,并且修改LR为当前PC的按顺序下一条指令地址,指的是没跳转之前的PC的下一条。
    • 需要注意修改LR最低位表示当前为什么状态,,0:是arm状态,无需修改(因为地址都是word 2Byte对齐的),1:是thumb状态,需要修改,
      在这里插入图片描述
      可以看到R14以及PC的值都是奇数,代表是thumb指令。
      在这里插入图片描述
      在这里插入图片描述
      R15(PC):0x0801247E 位于 DMA_GetFlagStatus,
      R14:0x08014ECB 位于 UART1_SentMsgL,保存了其返回的地址。
  • 返回值

    • R0:返回值是D-Word(32 bit),或者是单精度浮点型float,
    • R0-R1:返回值是Q-Word(64 bit),或者双精度浮点型double
    • R0-R3:返回值是128bit的向量
      在这里插入图片描述
      调用GetSysTime之后,r0则获取到值,然后r1计算好之后,则cmp进行比较r0,r1.
  • 参数传递

    • R0-R3 和栈进行传递
    • 参数少的函数,只用寄存器就可以了,减少访问内存带来的负载
    • 优先寄存器,然后栈,寄存器从小到大,栈地址从小到大。
      1、函数声明:void OLED_DrawBMP_test(unsigned char x0, unsigned char y0,unsigned char x1, unsigned char y1,unsigned char BMP[],unsigned char state1,unsigned char state2);
      2、共用7个参数:x0,y0,x1,y1,BMP[],state1,state2
      3、前四个参数都分别存储在r0-r3,
      4、后面三个参数存储在栈中,strd r7,r6,[r13] 以及str r6,[r13,#0x8] ,前面指令存储r7 r6 两个参数,后面地址偏移8之后,又存储一个参数,总计三个参数,存储顺序依次都是参数从左向右去存储。
      5、不符合__cdecl、__stdcall、__fastcall这三种调用标准。
      在这里插入图片描述
  • 内部联合工作(ARM与Thumb指令)

    • 子程序调用和程序返回支持两张状态切换。bx或者blx都可以切换状态。

2.2、ARM64

参考文档

1、ARM Procedure Call Standard
2、Procedure Call Standard for the ARM 64-bit Architecture (AArch64)


http://www.kler.cn/a/478.html

相关文章:

  • MacOS安装Xcode(非App Store)
  • EleutherAI/pythia-70m
  • 【windows】组合的 Windows 系统调用表
  • 费舍尔信息矩阵全面讲述
  • Nmap基础入门及常用命令汇总
  • 【自留】Unity VR入门
  • 解析带小数的字节流
  • Graphics2D绘制图形详解
  • IIS发布.net6 api+微信小程序/H5真机调试接口的流程
  • 【SpringMVC】获取 -请求参数- 的多种方式
  • 《深入浅出WPF》——XAML语法及基础知识
  • 过来人告诉你:Java学到什么程度可以找工作?
  • C++【list容器模拟实现函数解析】
  • 【数据结构】万字超详解顺序表(比细狗还细)
  • 【MapGIS精品教程】013:如何制作三维电子沙盘?
  • 微信小程序开发学习笔记
  • spring cloud 企业工程项目管理系统源码+项目模块功能清单
  • Python人脸识别
  • 求最大公约数和最小公倍数---辗转相除法(欧几里得算法)
  • ConvMixer:Patches Are All You Need
  • MySql分页查询性能优化
  • 【c++类与对象 -- 补充 】
  • 编辑商品按钮显示商品对应数据
  • 时序预测 | MATLAB实现基于EMD-GRU时间序列预测(EMD分解结合GRU门控循环单元)
  • 【linux】:进程地址空间
  • 每周一算法:计数排序