《汇编语言学习笔记.doc》由会员分享,可在线阅读,更多相关《汇编语言学习笔记.doc(63页珍藏版)》请在三一办公上搜索。
1、汇编语言学习笔记-傻瓜学汇编前言当我在学汇编的时候发现一到了实际编程就发现学过的那些指令串不起来,什么浮点数啊整数啊,怎么跳转啊,怎么循环啊,脑袋立马变成浆糊。下面的文档是我的学习经历,希望对初学者在学习加密解密,软件调试,单片机编程有点帮助。目录1. 编程环境的搭建2. 深入理解汇编语言的数据3. 顺序程序设计4. 分支结构程序设计5. 循环6. 数组及指针7. 函数8. 结构9. 综合运用10. 参考文献一:编程环境的搭建首先装好masm32v10 和windbg,和editplus,然后在editplus中输入下面的程序,具体的请参考罗云彬的那本书,里面有详尽的说明,编译运行看看:.38
2、6.model flat,stdcalloption casemap:noneincludelibmsvcrt.libprintfproto C :VARARG.datamsgdb hello,this is the first test program!, 0dh ,0ah,0.codestart:callmainretmain procpushoffset msgcallprintfaddesp,4pushoffset msgcallprintfaddesp,4retmainendpendstart下面是运行结果:这里输出两行消息主要是我在写这个最简单的程序的时候发现他不换行,于是我在数据
3、定义后面我加了“0ah,0dh”,呵呵,就是回车换行的十六进制表示,你也可以用其他方法试试,程序就不多解释了,后面会有更多的解释,不过你一定要走到这以步,才能进行下一章。2.深入理解汇编语言的数据整数常量及变量,先看一段很简单的汇编程序:.386.model flat,stdcalloption casemap:noneincludelibmsvcrt.libprintfproto C :VARARG.dataPRICEEQU30msg1dbtotal=%d,0dh,0ah,0.codestart:callmainretmain proclocalnum:dwordlocaltotal:dwo
4、rdmovnum,10moveax,numimuleax,eax,PRICEmovtotal,eaxpushoffset msg1callprintfaddesp,4retmainendpendstart程序的意思很简单就是在屏幕上打印出某个东西的价格,如过要你拿笔和纸算,拿你肯定很快就能算出来,但你让电脑怎么算呢?当电脑执行到第一个语句的时候,也就是num=10,它就把10放到某个地方并且记住这个值,寄存器或者内存,呵呵,它也就这两个地方,为什么要这么做呢?因为后面要用它来计算啊,为了算出这个值,电脑好的办法就是放在它的内存里,为什么不是寄存器?因为寄存器太少了,就那么几个,呵呵,所以了它就
5、把10存在一个叫num的内存里,注意了哦,num是程序里的变量名,是存中里的一个位置的名称,它的值是10,你可能会问,不起名不行么?行,等下在调试器中你看到的就是没名的。来看看它在调试器中的样子:num变成了ebp-4了,现在你想象有个几千行的程序如果都用ebp-4这样的名字的话,那我们会疯的,所以汇编程序就让我们给程序里面的变量起个直观的名字,而不是用具体的数字去让你去记住变量内存的位置。程序中imul eax,eax,1eh中的1eh就是个整形常量,也就是30.现在你应该对常量和变量有点感觉了吧。再看个例子:.386.model flat,stdcalloption casemap:non
6、eincludelibmsvcrt.libprintfproto C :VARARG.dataadb12hbdw1234hc1dd12345678hmsg1dbthe number is=%xh,0dh,0ah,0.codestart:callmainretmain procmoval,acbwcwdepusheaxpushoffsetmsg1callprintfaddesp,8movax,word ptr acwdepusheaxpushoffset msg1callprintfaddesp,8moveax,dword ptr apusheaxpushoffsetmsg1callprintf
7、addsp,8retmainendpendstart首先,你得想a,b,c1三个变量在程序中到底是怎么存的,是12 12 34 12 34 56 78,还是 78 56 34 12 34 12 12呢?呵呵,用调试器载入程序看看就知道了:哈哈,看到了没,正确的是这个:00403000: 12 34 12 78 56 34 12 74-68,这是为什么?还有就是这个程序打印的三个结果又是什么呢?是12h和0012h和00000012h吗?如果是,那你就错了哦,应该是:the number is=12h the number is=3412h the number is=78123412h呵呵,首
8、先,你得明白这三个你定义的数据在内存是怎么存的,一个原则就是你定义的数据的高位存在内存中的高字节地址,你定义的第二个数据:1234h,高位字节是12吧,低位字节是34吧,所以编译器它先存34字节存在内存的低地址,然后再把12存在高地址,当然如果是你只定义了一个字节那顺序就没反了,就像你定义的第一个字节数据12好一样,同样第三个双自数据12345678h,编译器它就先存78好字节了,然后是56好字节,34h字节,12h字节。下面我们来看看程序:moval,a,就是是把12h放到al中,movzxax,al 0扩展指令,将al中的字节扩展到ax中,不足的位用0填充,不改变al的值,al里面是什么值
9、,扩展后ax的值还是等于al中的值。movzxeax,ax;0扩展指令,将ax中的字节扩展到eax中,不足的位用0填充,不改变ax的值,al里面是什么值,扩展后eax的值还是等于ax中的值。然后pusheax,和 pushoffsetmsg1,callprintf 就是调用c语言库函数printf打印消息,就相当于c语言里面的:printf(the number is=%xhn,a);下面的和这段一样,我就不写废话了。如果面对的是有符号数,那就得用movsx了,当然还有其他指令,后面再介绍。浮点数:在计算机内部,浮点数是以二进制表示的,所以,要先转换为二进制浮点数,转换分两部,整数部分的装换,
10、采用“除2取余法”,小数部分的装换,采用“乘2取整法”,例如19.2,先将19 转换成二进制:10011,然后将0.2转换成二进制:001100110011,它是个无穷循环小数,然后就是规格化,分三种情况:如果定义的数据类型是dword或者是real4,那么符号位占一位,阶码占8位,位数占23位,总共是32位,如果定义的类型是qword或real8,那么符号位占一位,阶码占11位,位数占52位,总共64位,如果定义的类型是real10或者是tword,那么阶码占15位,位数占64位,符号位占一位,总共80位。怎么算阶码呢?如果是32位,就将阶码加上127,然后转换成二进制,如果是64位,就加上
11、1023,如果是80位,就加上16383。我们看看怎么将19.2转换成32位的二进制浮点数:首先将19转换成二进制:10011,然后将0.2转换成二进制:001100110011,整理成32位就是:10011,001100110011001100110011001。然后规格化为:1,0011001100110011001100110011001x2的4次方,阶码为127加4等于131:10000011。所以当浮点数19.2表示为三种不同的数据类型为:32位(dword,real4):0,10000011,001100110011001100110164位(qword,real8):0,1000
12、00000011,001100110011001100110011001100110011001100110011001180位:0,100000000000011,001100110011001100110011001100110011001100110011001100110011001100110011。转换成16进制就是4199999Ah,40333333 33333333 h,403999999999999999ah。然后我们yong程序来验证一下对不对。例子如下:.386.model flat,stdcalloption casemap:noneincludelibmsvcrt.l
13、ibprintfproto C :VARARG.dataf1real419.2f2real819.2f3real1019.2msg1dbthe floating number is=%g,0dh,0ah,0.codestart:callmainretmain proclocalf:real8flddword ptr f1fstpfpushdword ptr f+4pushdword ptr f+8pushoffset msg1callprintfaddesp,12pushdword ptr f2+4pushdword ptr f2pushdword ptr offset msg1callpri
14、ntfaddesp,12fldf3fstpqword ptr fpushdword ptr f+4pushdword ptr f+8pushoffset msg1callprintfaddesp,12retmainendpendstart程序很简单,就是分别在屏幕上打印三个浮点值,如下图:在这里我要说明下,我只有把32位和80位的转换为64位的,才能打印成功,这可能是库函数printf的原因,怎么转换呢?32位浮点转换64位浮点:首先得借助一个64位的浮点局部变量:localf:real8flddword ptr f1fstpf第一句定义了f位一个64位的浮点局部变量,第二句就是把32位浮点数
15、转换为80位的,然后第三句就是把80位的转换位64位的。80位浮点转换位64位浮点数:同样借助一个64位的浮点局部变量:fldf3fstpqword ptr f第二句就是把80位的浮点转换位60位的。但是这两句怎么解释呢:pushdword ptr f2+4 pushdword ptr f2为什么要先把f2的高4位字节入栈呢?好,我们先来看看这个数转换成64位的16进制为:40333333 33333333h,前面我说了高低对应原则,那么这个64位的16进制在内存中高4字节地址应该存40333333h,也就是存它的高4字节,然后是33333333h,但是,呵呵,在堆栈中的地址是从高往低增长的,
16、所以我们应该先把这个数的高四字节入栈,也就是40333333h,怎么在内存中得到这高4字节呢?就是从f2+4处压入4字节就可以了,然后就是低4字节入栈。如果还没理解,用cdb调试一下就清楚了。浮点与整数之间的转换:先看例子成ch2-4:.386.model flat,stdcalloption casemap:noneincludelibmsvcrt.libprintfproto C :VARARG.dataf1real819.2f2dword20msg1dbthe floating to int number is=%d,0dh,0ah,0msg2dbthe int to floating
17、number is=%f,0dh,0ah,0.codestart:callmainretmain proclocalf:real8fldf1fistpdword ptr fpushdword ptr fpushoffset msg1callprintfaddesp,8fildf2fstpfpushdword ptr f+4pushdword ptr f+8pushoffset msg2callprintfaddesp,12retmainendpendstart运行结果为:浮点数转换成整数:fldf1fistpword ptr f首先我们还是借助了一个64位的局部变量,先把浮点数装入浮点寄存器,
18、然后用装换整行的指令变成整数再存入一个局部变量就行了。整数转换成浮点数:fildf2fstpf先把整数用装换指令装入浮点寄存器,然后把浮点数存到一个局部变量就可以了。我在后面会详细说名浮点数的运算和浮点寄存器的。字符与字符串常量:怎么定义他们?他们是以什么形式存在计算机中?首先我们怎么在汇编中定义他们呢:先看看例子ch2-5:.386.model flat,stdcalloption casemap:noneincludelibmsvcrt.libprintfproto C :VARARG.datastr1dbthis is a string test,0ah,0dh,0str2dbthis
19、is a string test,0ah,0dh,0.codestart:callmainretmain procmoveax,offset str1pushoffset str2callprintfaddesp,4pushoffset str1callprintfaddesp,4retmainendpendstart程序就是在屏幕上打印两行消息,下面是运行结果:然后我们用cdb调试器看看定义的那两个字符串变量在内存中到底是怎么样的:恩,它们是以asii码的形式存在的。其他的数据类型我会在下面的各个章节会随着编程的算法和调试一起讲解。3:顺序程序设计汇编语言的顺序编程比较好理解,就是在编程的时
20、候没有跳转,没有循环,看看例子ch3-1:例 ch3-1:输入三角形的边长,求三角形的面积。我假设输入的三边长都是能构成三角形的,求三角形面积的公式为area=s(s-a)(s-b(s-c)。s=(a+b+c)/2.这里要用到浮点指令,那就先回顾下浮点指令的用法:这里要加减乘除和平方根五种指令,由于Intel的浮点数据寄存器是种堆栈结构,我们要记住这一点。先看看数据传送指令:fld和fild,fst,fstp:fld 源操作数,源操作数可以是浮点寄存器和内存,这个指令主要是把源操作数压入浮点寄存器堆栈(其实就是st0),如果源操作数是整数,那就用fild。Fst和fstp是把st(0)浮点寄存
21、器中的数弹出到目的操作数中,目的操作数可以为浮点寄存器和内存。加减法指令:fadd,faddp,fub,fsubp第一种形式:fadd 目的操作数,源操作数。其中目的操作数,源操作数可以为浮点寄存器和内存。第二种形式:fadd源操作数,我本人比较喜欢这种,它不会把我脑海里的浮点寄存器的顺序弄乱,这种形式的源操作数只能是内存。减法指令同加法指令,就不多说了。乘除法指令:fmul,fdiv浮点的乘除法是不区分有符号和无符号数的,他们也有两种形式:fmul目的操作数,源操作数 和 fmul 源操作数这两种形式,第一种 操作数和源操作数可以为浮点寄存器和内存,但第二种 源操作数 值能为内存。平方根指令
22、:fsqrt这个指令就一种形式就是fsqrt,就是把第0个浮点寄存器st0 的值变成平方根值然后存在st0中。再回到例题中,我们应该先算s值,然后再算平方根下面的值然后求平方根就行了。S值是三边长除以2,转换成浮点指令就是:flda ;先把a值放到浮点寄存器st0中再就是fadd b ;这个就是a+b,结果存在st0中然后fadd c ;同上,结果存在st0中现在算出了三边长的和,在除以2就ok了fivtwo;结果在st0中,最后把st0里面的值用fstps 存到s中就把s值算出来了。再来算根号下面的值,这里有乘法和减法,我们先算减法:fld sfsub,a;这个就是s-a,结果在st0里再f
23、ldsfsub b;这个结果还是在st0里,但是上面那个s-a已经被推到st(1)这个浮点堆栈了啊,记住了。再fldsfsubc;这个结果还是在st0里,那么s-a被推到st(2)了,s-b被推到st(1)了,s-c的值在st(0)中,这里千万不能及乱了啊,下一步算乘法,先算s*(s-c),muls;果在st0lifmul st(0),st(1)这一步是算s*(s-a)*(s-b)最后算s*(s-a)*(s-b)*(s-a)fmul st(0),st(2),然后把s*(s-a)*(s-b)*(s-a)的结果再求平方根fsqrt 再把这个平方根的值弹出到area中。这是按照上面的想法写出的程序:
24、.386.model flat,stdcalloption casemap:noneincludelibmsvcrt.libprintfproto C :VARARGscanfproto C :VARARG.datamsg1db%f,%f,%f,0msg2dbarea=%7.2f,0ah,0dh,0msg3dbplease input three floating numbers,0ah,0dh,0tworeal42.0.codestart:callmainretmain proclocala:real4localb:real4localc1:real4locals:real4localare
25、a:real8pushoffset msg3callprintfaddesp,4leaeax,c1pusheaxleaeax,bpusheaxleaeax,apusheaxpushoffset msg1callscanfaddesp,16fldafaddbfaddc1fdivtwofstpsfsubafsubbfsubc1fmulsfmulst,st(1)fmulst,st(2)fsqrtfstpareapushdword ptr area+8pushdword ptr area+4pushoffset msg2callprintfaddesp,12retmainendpendstart编译运
26、行:下面是结果:但是出乎意料哦,错了,怎么办呢?你发现什么问题了没?那只有调试看看了,用cdb -2 C:wbch3ch3-1ch3-1打开程序然后逐步调试看看,当跟踪到下面这句是就发现有问题了:就是fstp,s,也就是00401041 d95df0 fstp dword ptr ebp-10h ss:0023:0013ffac=a9e45d08,然后发现st中的值被弹走了,但紧接着又用st(0)用与下一步进行计算了,先推出调试,改动下再运行看看对不对,但结果还是错的:那还得继续调试了,发现我对fsub指令理解错了,原来这个指令执行完之后它不把结果推到下一个浮点堆栈:那只能用fsubp了,改动
27、如下:fldafsubpst(1),stfldsfldbfsubpst(1),stfldsfldc1fsubpst(1),st;然后改成这种了但结果还是错的,一看到这句pushdword ptr area+8 pushdword ptr area+4想一下“高低原则”,改成 pushdword ptr area+4 pushdword ptr area+8编译运行,哈哈,ok了:最后正确的代码:.386.model flat,stdcalloption casemap:noneincludelibmsvcrt.libprintfproto C :VARARGscanfproto C :VARA
28、RG.datamsg1db%f,%f,%f,0msg2dbarea=%7.2f,0ah,0dh,0msg3dbplease input three floating numbers,0ah,0dh,0tworeal42.0.codestart:callmainretmain proclocala:real4localb:real4localc1:real4locals:real4localarea:real8;这里是变量定义pushoffset msg3callprintfaddesp,4;这里是提示输入三个边长leaeax,c1pusheaxleaeax,bpusheaxleaeax,apu
29、sheaxpushoffset msg1callscanfaddesp,16;这里是调用库函数scanffldafaddbfaddc1fdivtwo;fstps这一句其实是有问题的,你可以调试看看fsts;改成这句;fsuba;fsubb;fsubc1;经调试发现这三句都是错的fldafsubpst(1),stfldsfldbfsubpst(1),stfldsfldc1fsubpst(1),st;然后改成这种了fmulsfmulst,st(1)fmulst,st(2)fsqrtfstpqword ptr area;这一段是计算area值,我的文档上有详细解释pushdword ptr area
30、+4pushdword ptr area+8pushoffset msg2callprintfaddesp,12;打印结果retmainendpendstart呵呵,定义的时候用了c1,因为c是汇编里面的关键字,所以我就改了下,你可能会说,你怎么不优化一下呢?呵呵,先把程序写对了,把指令理解透了再去优化也不晚。练习ch2-2:求下面x1和x2的值:x1=(b+b*b-4ac)/2a, x2=(b- b*b-4ac)/2a, a,b,c由键盘输入。提示下真确运行结果:a=1,b=3,c=2x1=-1.00x2=-2.004.选择分支结构程序设计前面我们看到的程序都是从上到下这样执行的,程序的执行
31、流程没有跳转和循环,cpu为我们实现程序的跳转提供了硬件环境和一些指令,首先cpu它有个处理器状态寄存器,跳转指令就是无条件跳转jmp和有条件跳转指令jcc(里面包含了很多种形式的),总的来说就是你在你写的程序里面用跳转指令让cpu取改变程序的执行流程,cpu会根据那个状态寄存器的一个或多个值的改变来执行程序,我们先来看个例子:例 4.1:输入3个整数a,b,c,请输出其中最大的数。我们只要一次把这三个数比较一次,在每次比较中,把那个大值继续和下一个数来做比较,然后再输出那个最大值就行了。代码如下:.386.model flat,stdcalloption casemap:NONEinclud
32、elibmsvcrt.libprintfproto c:VARARGscanfproto c:VARARG.datamsg1dbplease input three int numbers,0ah,0dh,0msg2dbThe Max of three numbers is =%d,0ah,0dh,0msg3db%d,%d,%d,0.codestart:callmainretmainproclocala:dwordlocalb:dwordlocalc1:dwordpushoffset msg1callprintfaddesp,4leaeax,c1pusheaxleaeax,bpusheaxle
33、aeax,apusheaxpushoffset msg3callscanfaddesp,16;提示用户输入三个整型数moveax,acmpeax,bjga_compare_c ;跳转到将a与c比较moveax,bcmpeax,c1jgprint_max;到这里三个数已经全部比较完,跳转到打印最最大值:moveax,c1;到这里三个数已经全部比较完,跳转到打印最最大值jmpprint_maxa_compare_c:cmpeax,c1jgprint_max;到这里三个数已经全部比较完,跳转到打印最最大值jmpbprint_max:pusheaxpushoffset msg2callprintfad
34、desp,8retmainendpendstart运行结果:无论是整数还是负数,结果都是正确的。这里的cmp指令相当于减法,只是它不保存运算结果,而是改变前面说的状态寄存器,具体的就是状态寄存器的符号位,零标志位,溢出标志位和进位位,然后那个条件跳转指令jg就会根据上面那些状态位来确定怎么跳转,这里的jg即使指令就是根据符号位和零标志位来确定跳转的,你可以用windbg验证一下。在分支程序设计中,在前面有比较,比较完之后看当前情况满足哪种情况,然后用跳转指令跳取即可,前面这个判断中是个最简单的判断,下面我们来看看比较复杂的情况,先看例子ch4-2:例ch4-2 输入一个年份,判断是否闰年。在判
35、断是否是闰年时,我们可以用一个复杂的判断表达式来包含所有的闰年条件,也就是当输入的年份(year%4=0&year%100!=0)|year%400=0则输出这个年份是闰年,否则输出不是,现在的问题就是怎么把上面的那个复杂的判断用汇编语言来正确的表达,下面是代码:.386.model flat,stdcalloption casemap:NONEincludelibmsvcrt.libprintfproto c:VARARGscanfproto c:VARARG.datamsg1dbplease input a year,0ah,0dh,0msg2db%d is not a leap year
36、,0ah,0dh,0msg3db%d isa leap yaer ,0ah,0dh,0msg4db%d.codestart:callmainretmainproclocalyear:dwordlocalleap:dwordpushoffset msg1callprintfaddesp,4;到这里是输出提示信息leaeax,yearpusheaxpushoffset msg4callscanfaddesp,8;这几句是调用输入函数把输入的年份存到year变量里moveax,yearxoredx,edxmovebx,400divebxtestedx,edxjzis_a_leap_year ;这里先
37、测试年份除以400,如果满足就直接跳转到打印是闰年的代码处moveax,yearxoredx,edxmovebx,4divebxtestedx,edx ;到这里就是判断闰年的第二种情况了,如果除以4,不能整除就直接跳到打印不是闰年的代码处jnzis_not_a_year;如果能整除就继续判断moveax,yearxoredx,edxmovebx,100divebxtestedx,edxjzis_not_a_year ;这里是继续判断这个年份能不能整除100,如果你能整除就跳到打印不是闰年代码处is_a_leap_year:pushyearpushoffset msg3callprintfadd
38、esp,8;打印是闰年的信息jmpout_this_program ;然后跳转到退出本程序is_not_a_year:pushyearpushoffset msg2callprintfaddesp,8;打印不是闰年消息out_this_program:ret;退出本程序的地方mainendpendstart下面是运行结果:C:wbch4ch4-2ch4-2please input a year20082008 is a leap yaerC:wbch4ch4-2ch4-2please input a year20002000 is a leap yaerC:wbch4ch4-2ch4-2ple
39、ase input a year19891989 is not a leap year这里我们先判断那个比较简单的测试点就是看年份能不能能整除400,如果为真,就直接跳转到打印是闰年的代码处,然后再判断看能不能整除4,如果为假,就直接跳转到打印不是闰年的代码处,然后下面的就不用再判断了,呵呵,因为这里是&逻辑与哦,就是著名的“短路表达式”,程序本身比较简单,就不多解释了。下面来看看判断语句的嵌套。判断语句的嵌套:判断语句的嵌套就是判断里面又有判断,呵呵,先看例子:例 ch4-3:有一函数:从题意可以看出,当输入一个x值,程序就得先判断是不是小与0啊,然后紧接着判断是不是等于0啊,再判断是不是大
40、于0 啊,然后才算判断完全,下面是代码:.386.model flat,stdcalloption casemap:NONEincludelibmsvcrt.libprintfproto c:VARARGscanfproto c:VARARG.datamsg1dbplease input a int number,0ah,0dh,0msg2dbthe Y value is %d,0ah,0dh,0msg4db%d.codestart:callmainretmainproclocalx:dwordpushoffset msg1callprintfaddesp,4;输出提示信息leaeax,xpu
41、sheaxpushoffset msg4callscanfaddesp,8;调用scanf将输入的一个值存在局部变量x里面;moveax,x;cmpeax,-1;jeY_equal_minus_one;testeax,eax;jzY_equal_zero;cmpeax,1;jeY-equal_one未优化的嵌套判断语句;下面是有点优化的嵌套判断语句moveax,xinceax;x如果是-1加1就是0啦,呵呵jleY_equal_minus_one;如果是0 就跳转到打印y值的代码处moveax,xtesteax,eax;用test来判断寄存器是否为0,感觉要比cmp eax,0要好很多,你可以用cdb看看jzY_equal_zeromoveax,xdeceax;x如果是1减1就是0