《linux教程网络高级编程.ppt》由会员分享,可在线阅读,更多相关《linux教程网络高级编程.ppt(21页珍藏版)》请在三一办公上搜索。
1、I/O模式,五种 I/O操作方式:阻塞 I/O 非阻塞 I/O I/O多路复用 信号驱动 I/O(SIGIO)异步 I/O一般来说,程序进行输入操作有两步:1等待有数据可以读 2将数据从系统内核中拷贝到程序的数据区。对于一个对套接字的输入操作,第一步一般来说是等待数据从网络上传到本地。当数据包到达的时候,数据将会从网络层拷贝到内核的缓存中;第二步是从内核中把数据拷贝到程序的数据区中。,阻塞 I/O模式,阻塞 I/O模式是最普遍使用的 I/O模式。大部分程序使用的都是阻塞模式的 I/O。缺省的,一个套接字建立后所处于的模式就是阻塞 I/O模式。对于一个 UDP套接字来说,数据就绪的标志比较简单:
2、已经收到了一整个数据报 没有收到。而 TCP这个概念就比较复杂,需要附加一些其他的变量。一个进程调用 recvfrom,然后系统调用并不返回直到有数据报到达本地系统,然后系统将数据拷贝到进程的缓存中。(如果系统调用收到一个中断信号,则它的调用会被中断)我们称这个进程在调用 recvfrom一直到从 recvfrom返回这段时间是阻塞的。当 recvfrom正常返回时,我们的进程继续它的操作。,非阻塞模式 I/O,当我们将一个套接字设置为非阻塞模式,我们相当于告诉了系统内核:“当我请求的 I/O操作不能够马上完成,你想让我的进程进行休眠等待的时候,不要这么做,请马上返回一个错误给我。”我们开始对
3、 recvfrom的三次调用,因为系统还没有接收到网络数据,所以内核马上返回一个 EWOULDBLOCK的错误。第四次我们调用 recvfrom函数,一个数据报已经到达了,内核将它拷贝到我们的应用程序的缓冲区中,然后 recvfrom正常返回,我们就可以对接收到的数据进行处理了。当一个应用程序使用了非阻塞模式的套接字,它需要使用一个循环来不听的测试是否一个文件描述符有数据可读(称做 polling)。应用程序不停的 polling内核来检查是否I/O操作已经就绪。这将是一个极浪费 CPU资源的操作。这种模式使用中不是很普遍。,I/O多路复用,在使用 I/O多路技术的时候,我们调用 select
4、()函数和 poll()函数的时候阻塞,而不是调用 recvfrom(或 recv)的时候阻塞。当我们调用 select函数阻塞的时候,select函数等待数据报套接字进入读就绪状态。当 select函数返回的时候,也就是套接字可以读取数据的时候。这时候我们就可以调用recvfrom函数来将数据拷贝到我们的程序缓冲区中。和阻塞模式相比较,select()和 poll()并没有什么高级的地方,而且,在阻塞模式下只需要调用一个函数:读取或发送,在使用了多路复用技术后,我们需要调用两个函数了:先调用 select()函数或 poll()函数,然后才能进行真正的读写。多路复用的高级之处在于,它能同时等
5、待多个文件描述符,而这些文件描述符(套接字描述符)其中的任意一个进入读就绪状态,select()函数就可以返回。假设我们运行一个网络客户端程序,要同时处理套接字传来的网络数据又要处理本地的标准输入输出。在我们的程序处于阻塞状态等待标准输入的数据的时候,假如服务器端的程序被 kill(或是自己 Down掉了),那么服务器程端的 TCP协议会给客户端(我们这端)的 TCP协议发送一个 FIN数据代表终止连接。但是我们的程序阻塞在等待标准输入的数据上,在它读取套接字数据之前(也许是很长一段时间),它不会看见结束标志我们就不能够使用阻塞模式的套接字。IO多路技术一般在下面这些情况中被使用:当一个客户端
6、需要同时处理多个文件描述符的输入输出操作的时候(一般来说是标准的输入输出和网络套接字),I/O多路复用技术将会有机会得到使用。当程序需要同时进行多个套接字的操作的时候。如果一个 TCP服务器程序同时处理正在侦听网络连接的套接字和已经连接好的套接字。如果一个服务器程序同时使用 TCP和 UDP协议。如果一个服务器同时使用多种服务并且每种服务可能使用不同的协议(比如 inetd就是这样的)。I/O多路服用技术并不只局限与网络程序应用上。几乎所有的程序都可以找到应用 I/O多路复用的地方。,信号驱动 I/O模式,我们可以使用信号,让内核在文件描述符就绪的时候使用 SIGIO信号来通知我们。我们将这种
7、模式称为信号驱动 I/O模式。使用这种模式,我们首先需要允许套接字使用信号驱动 I/O,还要安装一个 SIGIO的处理函数。在这种模式下,系统调用将会立即返回,然后我们的程序可以继续做其他的事情。当数据就绪的时候,系统会向我们的进程发送一个 SIGIO信号。这样我们就可以在 SIGIO信号的处理函数中进行 I/O操作(或是我们在函数中通知主函数有数据可读)。对于信号驱动 I/O模式,它的先进之处在于它在等待数据的时候不会阻塞,程序可以做自己的事情。当有数据到达的时候,系统内核会向程序发送一个 SIGIO信号进行通知,这样我们的程序就可以获得更大的灵活性,因为我们不必为等待数据进行额外的编码。信
8、号 I/O可以使内核在某个文件描述符发生改变的时候发信号通知我们的程序。异步 I/O可以提高我们程序进行 I/O读写的效率。通过使用它,当我们的程序进行 I/O操作的时候,内核可以在初始化 I/O操作后立即返回,在进行 I/O操作的同时,我们的程序可以做自己的事情,直到 I/O操作结束,系统内核给我们的程序发消息通知。基于 Berkeley接口的 Socket信号驱动 I/O使用信号 SIGIO。有的系统 SIGPOLL信号,它也是相当于 SIGIO的。为了在一个套接字上使用信号驱动 I/O操作,下面这三步是所必须的。(1)一个和 SIGIO信号的处理函数必须设定。(2)套接字的拥有者必须被设
9、定。一般来说是使用 fcntl函数的 F_SETOWN参数来进行设定拥有者。(3)套接字必须被允许使用异步 I/O。一般是通过调用 fcntl函数的 F_SETFL命令,O_ASYNC为参数来实现。注意:我们在设置套接字的属主之前必须将 SIGIO的信号处理函数设好,SIGIO的缺省动作是被忽略。因此我们如果以相反的顺序调用这两个函数调用,那么在 fcntl函数调用之后,signal函数调用之前就有一小段时间程序可能接收到 SIGIO信号。那样的话,信号将会被丢弃。在 SVR4系统中,SIGIO在 头文件中被定义为 SIGPOLL,而 SIGPOLL信号的缺省动作是终止这个进程。所以我们一定要
10、保证这两个函数的调用顺序:先调用 signal设置好 SIGIO信号处理函数,然后在使用 fcntl函数设置套接字的属主。,信号驱动 I/O模式,虽然设定套接字为异步 I/O非常简单,但是使用起来困难的部分是怎样在程序中断定产生 SIGIO信号发送给套接字属主的时候,程序处在什么状态。1UDP套接字的 SIGIO信号在 UDP协议上使用异步 I/O非常简单这个信号将会在这个时候产生:套接字收到了一个数据报的数据包。套接字发生了异步错误。当我们在使用 UDP套接字异步 I/O的时候,我们使用 recvfrom()函数来读取数据报数据或是异步 I/O错误信息。2TCP套接字的 SIGIO信号不幸的
11、是,异步 I/O几乎对 TCP套接字而言没有什么作用。因为对于一个 TCP套接字来说,SIGIO信号发生的几率太高了,所以 SIGIO信号并不能告诉我们究竟发生了什么事情。在 TCP连接中,SIGIO信号将会在这个时候产生:在一个监听某个端口的套接字上成功的建立了一个新连接。一个断线的请求被成功的初始化。一个断线的请求成功的结束。套接字的某一个通道(发送通道或是接收通道)被关闭。套接字接收到新数据。套接字将数据发送出去。发生了一个异步 I/O的错误。举例来说,如果一个正在进行读写操作的 TCP套接字处于信号驱动 I/O状态下,那么每当新数据到达本地的时候,将会产生一个 SIGIO信号,每当本地
12、套接字发出的数据被远程确认后,也会产生一个 SIGIO信号。对于我们的程序来讲,是无法区分这两个 SIGIO有什么区别的。在这种情况下使用 SIGIO,TCP套接字应当被设置为无阻塞模式来阻止一个阻塞的 read和 write(recv和 send)操作。我们可以考虑在一个只进行监听网络连接操作的套接字上使用异步 I/O,这样当有一个新的连接的时候,SIGIO信号将会产生。,异步 I/O模式,当我们运行在异步 I/O模式下时,我们如果想进行 I/O操作,只需要告诉内核我们要进行 I/O操作,然后内核会马上返回。具体的 I/O和数据的拷贝全部由内核来完成,我们的程序可以继续向下执行。当内核完成所
13、有的 I/O操作和数据拷贝后,内核将通知我们的程序。异步 I/O和信号驱动 I/O的区别是:信号驱动 I/O模式下,内核在操作可以被操作的时候通知给我们的应用程序发送 SIGIO消息。异步 I/O模式下,内核在所有的操作都已经被内核操作结束之后才会通知我们的应用程序。当我们进行一个 IO操作的时候,我们传递给内核我们的文件描述符,我们的缓存区指针和缓存区的大小,一个偏移量 offset,以及在内核结束所有操作后和我们联系的方法。这种调用也是立即返回的,我们的程序不需要阻塞住来等待数据的就绪。我们可以要求系统内核在所有的操作结束后(包括从网络上读取信息,然后拷贝到我们提供给内核的缓存区中)给我们
14、发一个消息。,socket编程,socket()函数,#include#include int socket(int domain,int type,int protocol);domain需要被设置为“AF_INET”type参数告诉内核这个 socket是什么类型,“SOCK_STREAM”或是“SOCK_DGRAM”。把 protocol设置为 0。套接字创建时没有指定名字客户机用套接字的名字读写它。socket()函数只是简单的返回一个你以后可以使用的套接字描述符。如果发生错误,socket()函数返回 1。全局变量 errno将被设置为错误代码。,bind()函数,#include#
15、include int bind(int sockfd,struct sockaddr*my_addr,int addrlen);参数说明:sockfd是由 socket()函数返回的套接字描述符。my_addr是一个指向 struct sockaddr的指针。addrlen可以设置为 sizeof(struct sockaddr)。bind()函数可以帮助你指定一个套接字使用的端口。当你需要进行端口监听 listen()操作,等待接受一个连入请求的时候,一般都需要经过这一步。如果你只是想进行连接一台服务器,也就是进行 connect()操作的时候,这一步并不是必须的。bind()函数调用错误
16、的时候,返回1作为错误发生的标志。errno的值为错误代码。,connect()函数,#include#include int connect(int sockfd,struct sockaddr*serv_addr,int addrlen);sockfd:套接字文件描述符,由 socket()函数返回的。serv_addr是一个存储远程计算机的 IP地址和端口信息的结构。addrlen应该是 sizeof(struct sockaddr)。一定要检测 connect()的返回值:如果发生了错误(比如无法连接到远程主机,或是远程主机的指定端口无法进行连接等)它将会返回错误值 1。全局变量 er
17、rno将会存储错误代码。,listen()函数,#include int listen(int sockfd,int backlog);sockfd是一个套接字描述符,由 socket()系统调用获得。backlog是未经过处理的连接请求队列可以容纳的最大数目。每一个连入请求都要进入一个连入请求队列,等待 listen的程序调用 accept()函数来接受这个连接。当系统还没有调用 accept()函数的时候,如果有很多连接,那么本地能够等待的最大数目就是 backlog的数值。listen()如果返回 1,那么说明在 listen()的执行过程中发生了错误。全局变量 errno中存储了错误代
18、码。在 listen()函数调用之前,需要使用 bind()函数来指定使用本地的哪一个端口数值。如果你想在一个端口上接受外来的连接请求的话,那么函数的调用顺序为:socket();bind();listen();/*在这里调用 accept()函数*/,accept()函数,#include int accept(int sockfd,void*addr,int*addrlen);sockfd是正在 listen()的一个套接字描述符。addr一般是一个指向 struct sockaddr_in结构的指针;里面存储着远程连接过来的计算机的信息(比如远程计算机的 IP地址和端口)。addrlen
19、是一个本地的整型数值,在它的地址传给 accept()前它的值应该是 sizeof(struct sockaddr_in);accept()不会在 addr中存储多余addrlen bytes大小的数据。如果accept()函数在 addr中存储的数据量不足 addrlen,则 accept()函数会改变 addrlen的值来反应这个情况。如果调用 accept()失败的话,accept()函数会返回 1来表明调用失败,同时全局变量 errno将会存储错误代码。当调用accept()的时候,大致过程是下面这样的:有人尝试调用 connect()来连接你的机器上的某个端口(当然是你已经在 lis
20、ten()的)。他的连接将被 listen加入等待队列等待 accept()函数的调用(加入等待队列的最多数目由调用 listen()函数的第二个参数 backlog来决定)。你调用 accept()函数,告诉他你准备连接。accept()函数返回一个新的套接字描述符,这个描述符就代表了这个连接。这时候你有了两个套接字描述符,返回给你的那个就是和远程计算机的连接,而第一个套接字描述符仍然在你的机器上原来的那个端口上listen()。这时候你所得到的那个新的套接字描述符就可以进行 send()操作和 recv()操作了。,send()函数,#include#include int send(in
21、t sockfd,const void*msg,int len,int flags);sockfd是代表你与远程程序连接的套接字描述符。msg是一个指针,指向你想发送的信息的地址。len是你想发送信息的长度。flags发送标记。一般都设为 0。send()函数在调用后会返回它真正发送数据的长度。注意:send()所发送的数据可能少于你给它的参数所指定的长度!因为如果你给 send()的参数中包含的数据的长度远远大于 send()所能一次发送的数据,则 send()函数只发送它所能发送的最大数据长度,然后它相信你会把剩下的数据再次调用它来进行第二次发送。所以,记住如果 send()函数的返回值小
22、于 len的话,则你需要再次发送剩下的数据。幸运的是,如果包足够小(小于 1K),那么 send()一般都会一次发送光的。send()函数如果发生错误,则返回 1,错误代码存储在全局变量 errno中。,recv()函数,#include#include int recv(int sockfd,void*buf,int len,unsigned int flags);sockfd是你要读取数据的套接字描述符。buf是一个指针,指向你能存储数据的内存缓存区域。len是缓存区的最大尺寸。flags是 recv()函数的一个标志,一般都为 0(具体的其他数值和含义请参考 recv()的 man pa
23、ges)。recv()返回它所真正收到的数据的长度。(也就是存到 buf中数据的长度)。如果返回 1则代表发生了错误(比如网络以外中断、对方关闭了套接字连接等),全局变量 errno里面存储了错误代码。,sendto()函数,#include#include int sendto(int sockfd,const void*msg,int len,unsigned int flags,const struct sockaddr*to,int tolen);sockfd是代表你与远程程序连接的套接字描述符。msg是一个指针,指向你想发送的信息的地址。len是你想发送信息的长度。flags发送标记
24、。一般都设为 0。(你可以查看 send的 man pages来获得其他的参数值并且明白各个参数所代表的含义)to是一个指向 struct sockaddr结构的指针,里面包含了远程主机的 IP地址和端口数据。tolen只是指出了 struct sockaddr在内存中的大小 sizeof(struct sockaddr)。和 send()一样,sendto()返回它所真正发送的字节数(当然也和 send()一样,它所真正发送的字节数可能小于你所给它的数据的字节数)。当它发生错误的时候,也是返回 1,同时全局变量 errno存储了错误代码。,recvfrom()函数,#include#incl
25、ude int recvfrom(int sockfd,void*buf,int len,unsigned int flags,struct sockaddr*from,int*fromlen);sockfd是你要读取数据的套接字描述符。buf是一个指针,指向你能存储数据的内存缓存区域。len是缓存区的最大尺寸。flags是 recv()函数的一个标志,一般都为 0(具体的其他数值和含义请参考 recv()的 man pages)。from是一个本地指针,指向一个 struct sockaddr的结构(里面存有源 IP地址和端口数)fromlen是一个指向一个 int型数据的指针,它的大小应该
26、是 sizeof(struct sockaddr)当函数返回的时候,formlen指向的数据是 from指向的 struct sockaddr的实际大小 recvfrom()返回它接收到的字节数,如果发生了错误,它就返回1,全局变量 errno存储了错误代码如果一个信息大得缓冲区都放不下,那么附加信息将被砍掉。该调用可以立即返回,也可以永久的等待。这取决于你把 flags设置成什么类型。你甚至可以设置超时(timeout)值。注意:如果你使用 cnnect()连接到了一个数据报套接字的服务器程序上,那么你就可以使用 send()和 recv()函数来传输你的数据不要以为你在使用一个流式的套接字
27、,你所使用的仍然是一个使用者数据报的套接字,只不过套接字界面在 send()和 recv()的时候自动帮助你加上了目标地址,目标端口的信息,close()和 shutdown()函数,程序进行网络传输完毕后,需要关闭这个套接字描述符所表示的连接。只需要使用标准的关闭文件的函数:close()。close(sockfd);执行 close()之后,套接字将不会在允许进行读操作和写操作。任何有关对套接字描述符进行读写操作都会接收到一个错误。如果想对网络套接字的关闭进行进一步的操作的话,可使用函数 shutdown()。它允许进行单向的关闭操作或是全部禁止。#include int shutdown
28、(int sockfd,int how);sockfd是一个你所想关闭的套接字描述符 how可以取下面的值。0表示不允许以后数据的接收操;1表示不允许以后数据的发送操作;2表示和 close()一样,不允许以后的任何操作(包括接收,发送数据)shutdown()如果执行成功将返回 0,如果在调用过程中发生了错误,它将返回1,全局变量 errno中存储了错误代码如果你在一个未连接的数据报套接字上使用 shutdown()函数,它将什么也不做。,socket数据结构,1struct sockaddr这个结构用来存储套接字地址。struct sockaddr unsigned short sa_fa
29、mily;/*address族,AF_xxx*/char sa_data14;/*14 bytes的协议地址*/;sa_family一般来说,都是“AF_INET”。sa_data包含了一些远程电脑的地址、端口和套接字的数目,它里面的数据是融杂在一起的。,socket数据结构,struct sockaddr_in short int sin_family;/*Internet地址族*/unsigned short int sin_port;/*端口号*/struct in_addr sin_addr;/*Internet地址*/unsigned char sin_zero8;/*添0(和str
30、uct sockaddr一样大小)*/;这个结构提供了方便的手段来访问 socket address(struct sockaddr)结构中的每一个元素。虽然 socket()函数需要一个 structaddr*,你也可以给他一个 sockaddr_in*。在 struct sockaddr_in中,sin_family相当于在 struct sockaddr中的 sa_family,需要设成“AF_INET”。最后一定要保证 sin_port和 sin_addr必须是网络字节顺序,socket数据结构,2struct in_addrstruct in_addr unsigned long s_addr;如果你声明了一个“ina”作为一个 struct sockaddr_in的结构,那么“ina.sin_addr.s_addr”就是 4个字节的 IP地址(按网络字节顺序排放)。需要注意的是,即使你的系统仍然使用联合而不是结构来表示 struct in_addr,你仍然可以用上面的方法得到 4个字节的 IP地址(一些#defines帮了你的忙)。,