汇编带你深入了解字符串类型底层数据结构

  

字符串作为最基础的数据类型,在程序开发中使用最为频繁,是每一个程序员必须掌握的基础,但是又有多少程序员知道它的工作原理呢?
作为一名合格的程序员,知其然,当然也要知其所以然!
一、思考

  

在迅速开发使用字符串的过程中,你是否有思考过以下问题?

  
      <李> 1个字符串变量占用多少内存?李   <李>字符串str1, str2的底层存储有什么不同?李   
  

汇编带你深入了解字符串类型底层数据结构

  
      <李>如果对str1, str2进行拼接操作,str1, str2的底层存储又会发生什么变化?
    汇编带你深入了解字符串类型底层数据结构   
  

如果你能准确地回答以上问题,那说明对斯威夫特字符串的底层存储机制还是比较了解的。

  

二,1个字符串变量占用多少内存?

  

方法1:MemoryLayout

  

首先,可以借助迅速自带的MemoryLayout来测试一下

  

汇编带你深入了解字符串类型底层数据结构

  

方法2:汇编

  

另外,我们也可以借助一个强有力的底层分析助手——汇编语言,来窥探一字符串的下底层存储

  
      <李>   

    实际上分析其他语法,系统库的底层,都可以借助汇编语言

      
        <李>比如多态的原理,泛型的原理,数组的底层,枚举的底层等等李   
      李   <李>   

    另外,不仅仅是迅速,C, c++, OC的底层分析,依然可以借助汇编语言

      
        <李>毕竟你写的每一行有效代码,最终都是要转成机器指令(0和1)   <李>而机器指令是跟汇编指令一一对应的,每一条机器指令都能翻译成与之对应的汇编指令李   <李>能读懂汇编指令,就相当于能读懂机器指令,知道CPU具体在干嘛(操作了什么寄存器,操作了哪块内存)   
      李   <李>本教程的代码是直接跑在Mac的命令行(CommandLineTools)项目上   
        <李>因此展示的汇编代码是基于X64的AT& T格式汇编,并非iOS真机设备的手臂汇编   <李>其实不同种类的汇编之间有极大的相似性,只是有些指令的叫法不一样李   李
      
  

跟微软的Visual Studio一样,Xcode也内置了非常方便的反汇编功能,可以轻松查看每一句代码对应的汇编指令,打开反汇编界面的步骤如下

  
      <李>   

    在某一行需要调试的代码打上断点(反汇编界面会在断点调试状态下显示出来)

      李   <李>   

    菜单:<代码>调试> 调试工作流> 总是显示拆卸

      
        <李> <代码>组装译为汇编,<代码>拆卸译为反汇编
      汇编带你深入了解字符串类型底层数据结构   
      李   <李>运行程序,看到反汇编界面李   
  

汇编带你深入了解字符串类型底层数据结构

  

如果你的反汇编经验十足,根据第16日17日行的汇编就可以推敲出来,字符串是占用16个字节

  
      <李>因为它用了伸展,rdx寄存器存放字符串str的内容,而伸展,rdx都是8字节的李   
  

汇编的内容太多了,因为时间和篇幅关系,文章里并不会对每一句汇编指令进行详细地讲解,更多的是想说明汇编的重要性。

  

三,字符串的底层存储

  

窥探内存

  

此前我写了个可以窥探迅速变量内存的小工具:https://github.com/CoderMJLee/Mems

  
      <李>   

    现在用它来窥探下字符串的16字节里面,究竟存储着什么数据

      李   <李>   

    <代码> Mems.memStr (ofVal:) 默认情况下按照8个字节一组来显示内存数据

      李   <李>传递参数<代码>对齐:。是按照1个字节一组来显示内存数据李   
  

汇编带你深入了解字符串类型底层数据结构”> <br/>字符' 0 ' ~ ' 9 '的ASCII值是0 x30 ~ 0 x39,认真观察最初str1的16个字节数据,你发现了什么? <h2 class=汇编带你深入了解字符串类型底层数据结构