在前一節(jié)中的x86基本寄存器的介紹,對于一個匯編語言編程人員來說是不可或缺的,F在你知道,寄存器是處理器內部的一些保存數據的存儲單元。僅僅了解這些是不足以寫出一個可用的匯編語言程序的,但你已經可以大致讀懂一般匯編語言程序了(不必驚訝,因為匯編語言的祝記符和英文單詞非常接近),因為你已經了解了關于基本寄存器的絕大多數知識。
在正式引入第一個匯編語言程序之前,我粗略地介紹一下匯編語言中不同進制整數的表示方法。如果你不了解十進制以外的其他進制,請把鼠標移動到這里。
匯編語言中的整數常量表示
|
需要說明的是,這些方法是針對宏匯編器(例如,MASM、TASM、NASM)說的,調試器默認使用十六進制表示整數,并且不需要特別的聲明(例如,在調試器中直接用FFFF表示十進制的65535,用10表示十進制的16)。
現在我們來寫一小段匯編程序,修改EAX、EBX、ECX、EDX的數值。
我們假定程序執(zhí)行之前,寄存器中的數值是全0:
? | X | ||
H | L | ||
EAX | 0000 | 00 | 00 |
EBX | 0000 | 00 | 00 |
ECX | 0000 | 00 | 00 |
EDX | 0000 | 00 | 00 |
正如前面提到的,EAX的高16bit是沒有辦法直接訪問的,而AX對應它的低16bit,AH、AL分別對應AX的高、低8bit。
mov eax, 012345678h mov ebx, 0abcdeffeh mov ecx, 1 mov edx, 2 |
; 將012345678h送入eax ; 將0abcdeffeh送入ebx ; 將000000001h送入ecx ; 將000000002h送入edx |
則執(zhí)行上述程序段之后,寄存器的內容變?yōu)椋?/P>
? | X | ||
H | L | ||
EAX | 1234 | 56 | 78 |
EBX | abcd | ef | fe |
ECX | 0000 | 00 | 01 |
EDX | 0000 | 00 | 02 |
那么,你已經了解了mov這個指令(mov是move的縮寫)的一種用法。它可以將數送到寄存器中。我們來看看下面的代碼:
mov eax, ebx mov ecx, edx |
; ebx內容送入eax ; edx內容送入ecx |
則寄存器內容變?yōu)椋?/P>
? | X | ||
H | L | ||
EAX | abcd | ef | fe |
EBX | abcd | ef | fe |
ECX | 0000 | 00 | 02 |
EDX | 0000 | 00 | 02 |
我們可以看到,“move”之后,數據依然保存在原來的寄存器中。不妨把mov指令理解為“送入”,或“裝入”。
練習題
把寄存器恢復成都為全0的狀態(tài),然后執(zhí)行下面的代碼:
mov eax, 0a1234h mov bx, ax mov ah, bl mov al, bh |
; 將0a1234h送入eax ; 將ax的內容送入bx ; 將bl內容送入ah ; 將bh內容送入al |
思考:此時,EAX的內容將是多少?[答案]
下面我們將介紹一些指令。在介紹指令之前,我們約定:
|
在寄存器中載入另一寄存器,或立即數的值:
mov reg32, (reg32 | imm8 | imm16 | imm32) |
例如,mov eax, 010h表示,在eax中載入00000010h。需要注意的是,如果你希望在寄存器中裝入0,則有一種更快的方法,在后面我們將提到。
交換寄存器的內容:
xchg reg32, reg32 xchg reg16, reg16 xchg reg8, reg8 |
例如,xchg ebx, ecx,則ebx與ecx的數值將被交換。由于系統(tǒng)提供了這個指令,因此,采用其他方法交換時,速度將會較慢,并需要占用更多的存儲空間,編程時要避免這種情況,即,盡量利用系統(tǒng)提供的指令,因為多數情況下,這意味著更小、更快的代碼,同時也杜絕了錯誤(如果說Intel的CPU在交換寄存器內容的時候也會出錯,那么它就不用賣CPU了。而對于你來說,檢查一行代碼的正確性也顯然比檢查更多代碼的正確性要容易)剛才的習題的程序用下面的代碼將更有效:
mov eax, 0a1234h mov bx, ax xchg ah, al |
; 將0a1234h送入eax ; 將ax內容送入bx ; 交換ah, al的內容 |
遞增或遞減寄存器的值:
inc reg(8,16,32) dec reg(8,16,32) |
這兩個指令往往用于循環(huán)中對指針的操作。需要說明的是,某些時候我們有更好的方法來處理循環(huán),例如使用loop指令,或rep前綴。這些將在后面的章節(jié)中介紹。
將寄存器的數值與另一寄存器,或立即數的值相加,并存回此寄存器:
add reg32, reg32 / imm(8,16,32) |
例如,add eax, edx,將eax+edx的值存入eax。減法指令和加法類似,只是將add換成sub。
需要說明的是,與高級語言不同,匯編語言中,如果要計算兩數之和(差、積、商,或一般地說,運算結果),那么必然有一個寄存器被用來保存結果。在PASCAL中,我們可以用nA := nB + nC來讓nA保存nB+nC的結果,然而,匯編語言并不提供這種方法。如果你希望保持寄存器中的結果,需要用另外的指令。這也從另一個側面反映了“寄存器”這個名字的意義。數據只是“寄存”在那里。如果你需要保存數據,那么需要將它放到內存或其他地方。
類似的指令還有and、or、xor(與,或,異或)等等。它們進行的是邏輯運算。
我們稱add、mov、sub、and等稱為為指令助記符(這么叫是因為它比機器語言容易記憶,而起作用就是方便人記憶,某些資料中也稱為指令、操作碼、opcode[operation code]等);后面的參數成為操作數,一個指令可以沒有操作數,也可以有一兩個操作數,通常有一個操作數的指令,這個操作數就是它的操作對象;而兩個參數的指令,前一個操作數一般是保存操作結果的地方,而后一個是附加的參數。
我不打算在這份教程中用大量的篇幅介紹指令——很多人做得比我更好,而且指令本身并不是重點,如果你學會了如何組織語句,那么只要稍加學習就能輕易掌握其他指令。更多的指令可以參考Intel提供的資料。編寫程序的時候,也可以參考一些在線參考手冊。Tech!Help和HelpPC 2.10盡管已經很舊,但足以應付絕大多數需要。
聰明的讀者也許已經發(fā)現,使用sub eax, eax,或者xor eax, eax,可以得到與mov eax, 0類似的效果。在高級語言中,你大概不會選擇用a=a-a來給a賦值,因為測試會告訴你這么做更慢,簡直就是在自找麻煩,然而在匯編語言中,你會得到相反的結論,多數情況下,以由快到慢的速度排列,這三條指令將是xor eax, eax、sub eax, eax和mov eax, 0。
為什么呢?處理器在執(zhí)行指令時,需要經過幾個不同的階段:取指、譯碼、取數、執(zhí)行。
我們反復強調,寄存器是CPU的一部分。從寄存器取數,其速度很顯然要比從內存中取數快。那么,不難理解,xor eax, eax要比mov eax, 0更快一些。
那么,為什么a=a-a通常要比a=0慢一些呢?這和編譯器的優(yōu)化有一定關系。多數編譯器會把a=a-a翻譯成類似下面的代碼(通常,高級語言通過ebp和偏移量來訪問局部變量;程序中,x為a相對于本地堆的偏移量,在只包含一個32-bit整形變量的程序中,這個值通常是4):
mov eax, dword ptr [ebp-x] |
而把a=0翻譯成
mov dword ptr [ebp-x], 0 |
上面的翻譯只是示意性的,略去了很多必要的步驟,如保護寄存器內容、恢復等等。如果你對與編譯程序的實現過程感興趣,可以參考相應的書籍。多數編譯器(特別是C/C++編譯器,如Microsoft Visual C++)都提供了從源代碼到宏匯編語言程序的附加編譯輸出選項。這種情況下,你可以很方便地了解編譯程序執(zhí)行的輸出結果;如果編譯程序沒有提供這樣的功能也沒有關系,調試器會讓你看到編譯器的編譯結果。
如果你明確地知道編譯器編譯出的結果不是最優(yōu)的,那就可以著手用匯編語言來重寫那段代碼了。怎么確認是否應該用匯編語言重寫呢?
使用匯編語言重寫代碼之前需要確認的幾件事情
|
曾經在一份雜志上看到過有人用純機器語言編寫程序。不清楚到底這是不是編輯的失誤,因為一個頭腦正常的人恐怕不會這么做程序,即使它不長、也不復雜。首先,匯編器能夠完成某些封包操作,即使不行,也可以用db偽指令來寫指令;用匯編語言寫程序可以防止很多錯誤的發(fā)生,同時,它還減輕了人的負擔,很顯然,“完全用機器語言寫程序”是完全沒有必要的,因為匯編語言可以做出完全一樣的事情,并且你可以依賴它,因為計算機不會出錯,而人總有出錯的時候。此外,如前面所言,如果用高級語言實現程序的代價不大(例如,這段代碼在程序的整個執(zhí)行過程中只執(zhí)行一遍,并且,這一遍的執(zhí)行時間也小于一秒),那么,為什么不用高級語言實現呢?
一些比較狂熱的編程愛好者可能不太喜歡我的這種觀點。比方說,他們可能希望精益求精地優(yōu)化每一字節(jié)的代碼。但多數情況下我們有更重要的事情,例如,你的算法是最優(yōu)的嗎?你已經把程序在高級語言許可的范圍內優(yōu)化到盡頭了嗎?并不是所有的人都有資格這樣說。匯編語言是這樣一件東西,它足夠的強大,能夠控制計算機,完成它能夠實現的任何功能;同時,因為它的強大,也會提高開發(fā)成本,并且,難于維護。因此,我個人的建議是,如果在軟件開發(fā)中使用匯編語言,則應在軟件接近完成的時候使用,這樣可以減少很多不必要的投入。
第二章中,我介紹了x86系列處理器的基本寄存器。這些寄存器對于x86兼容處理器仍然是有效的,如果你偏愛AMD的CPU,那么使用這些寄存器的程序同樣也可以正常運行。
不過現在說用匯編語言進行優(yōu)化還為時尚早——不可能寫程序,而只操作這些寄存器,因為這樣只能完成非常簡單的操作,既然是簡單的操作,那可能就會讓人覺得乏味,甚至找一臺足夠快的機器窮舉它的所有結果(如果可以窮舉的話),并直接寫程序調用,因為這樣通常會更快。但話說回來,看完接下來的兩章——內存和堆棧操作,你就可以獨立完成幾乎所有的任務了,配合第五章中斷、第六章子程序的知識,你將知道如何駕馭處理器,并讓它為你工作。