汇编 - 字符串

我们已经在前面的示例中使用了可变长度字符串。 可变长度字符串可以包含所需数量的字符。 一般我们通过两种方式之一来指定字符串的长度 −

  • 显式存储字符串长度
  • 使用哨兵字符

我们可以使用 $ 位置计数器符号来显式存储字符串长度,该符号表示位置计数器的当前值。 在下面的例子中 −

msg  db  'Hello, world!',0xa ;our dear string
len  equ  $ - msg            ;length of our dear string

$ 指向字符串变量msg最后一个字符之后的字节。 因此,$-msg给出了字符串的长度。 我们也可以写

msg db 'Hello, world!',0xa ;our dear string
len equ 13                 ;length of our dear string

或者,您可以存储带有尾随哨兵字符的字符串来分隔字符串,而不是显式存储字符串长度。 哨兵字符应该是不会出现在字符串中的特殊字符。

例如 −

message DB 'I am loving it!', 0

字符串指令

每个字符串指令可能需要源操作数、目标操作数或两者。 对于 32 位段,字符串指令使用 ESI 和 EDI 寄存器分别指向源操作数和目标操作数。

但是,对于 16 位段,SI 和 DI 寄存器分别用于指向源和目标。

处理字符串有五个基本指令。 他们是 −

  • MOVS − 该指令将 1 个字节、字或双字的数据从内存位置移动到另一个位置。

  • LODS − 该指令从内存中加载。 如果操作数是一个字节,则加载到 AL 寄存器,如果操作数是一个字,则加载到 AX 寄存器,如果操作数是双字,则加载到 EAX 寄存器。

  • STOS − 该指令将数据从寄存器(AL、AX 或 EAX)存储到内存。

  • CMPS − 该指令比较内存中的两个数据项。 数据可以是字节大小、字或双字。

  • SCAS − 该指令将寄存器(AL、AX 或 EAX)的内容与内存中项目的内容进行比较。

上述每条指令都有字节、字和双字版本,字符串指令可以通过使用重复前缀来重复。

这些指令使用 ES:DI 和 DS:SI 寄存器对,其中 DI 和 SI 寄存器包含引用内存中存储的字节的有效偏移地址。 SI 通常与 DS(数据段)相关联,而 DI 始终与 ES(额外段)相关联。

DS:SI(或ESI)和ES:DI(或EDI)寄存器分别指向源操作数和目标操作数。 假定源操作数位于内存中的 DS:SI(或 ESI),目标操作数位于 ES:DI(或 EDI)。

对于 16 位地址,使用 SI 和 DI 寄存器,对于 32 位地址,使用 ESI 和 EDI 寄存器。

下表提供了各种版本的字符串指令和假定的操作数空间。

基本指令 操作数位于 Byte 操作 Word 操作 Double word 操作
MOVS ES:DI, DS:SI MOVSB MOVSW MOVSD
LODS AX, DS:SI LODSB LODSW LODSD
STOS ES:DI, AX STOSB STOSW STOSD
CMPS DS:SI, ES: DI CMPSB CMPSW CMPSD
SCAS ES:DI, AX SCASB SCASW SCASD

重复前缀

当在字符串指令之前设置 REP 前缀时,例如 - REP MOVSB,会导致基于 CX 寄存器中的计数器重复指令。 REP执行该指令,将CX减1,并检查CX是否为零。 它重复指令处理,直到 CX 为零。

方向标志(DF)决定操作的方向。

  • 使用CLD(清除方向标志,DF = 0)进行从左到右的操作。
  • 使用STD(设置方向标志,DF = 1)使操作从右到左。

REP 前缀还有以下变体:

  • REP:无条件重复。 它重复该操作,直到 CX 为零。

  • REPE或REPZ:有条件重复。 当零标志指示等于/零时,它会重复该操作。 当 ZF 指示不等于/零或 CX 为零时,它会停止。

  • REPNE 或 REPNZ:也是有条件重复。 当零标志指示不等于/零时,它会重复该操作。 当 ZF 指示等于/零或 CX 递减至零时,它会停止。