(点击上方蓝字,快速关注我们)
前言之前有看到用很幽默的方式讲解Windows的socket IO模型,借用这个故事,讲解下linux的socket IO模型; 老陈有一个在外地工作的女儿,不能经常回来,老陈和她通过信件联系。
下面就以老陈接收信件为例讲解linux的 Socket I/O模型。 一、同步阻塞模型老陈的女儿第一次去外地工作,送走她之后,老陈非常的挂心她安全到达没有;于是老陈什么也不干,一直在小区门口收发室里等着她女儿的报平安的信到;这就是linux的同步阻塞模式; 在这个模式中,用户空间的应用程序执行一个系统调用,并阻塞,直到系统调用完成为止(数据传输完成或发生错误)。 Socket设置为阻塞模式,当socket不能立即完成I/O操作时,进程或线程进入等待状态,直到操作完成。 如图1所示: 显然,代码中的connect, send, recv都是同步阻塞工作模式,在结果没有返回时,程序什么也不做。
优势在于非常简单,等待的过程中占用的系统资源微乎其微,程序调用返回时,必定可以拿到数据;但简单也带来一些缺点,程序在数据到来并准备好以前,不能进行其他操作,需要有一个线程专门用于等待,这种代价对于需要处理大量连接的服务器而言,是很难接受的。 二、同步非阻塞模型收到平安信后,老陈稍稍放心了,就不再一直在收发室前等信;而是每隔一段时间就去收发室检查信箱;这样,老陈也能在间隔时间内休息一会,或喝杯荼,看会电视,做点别的事情; 这就是同步非阻塞模型;
这可能效率不高,因为在很多情况下,当内核执行这个命令时,应用程序必须要进行忙碌等待,直到数据可用为止,或者试图执行其他工作。
如图2所示: 这种模式在没有数据可以接收时,可以进行其他的一些操作,比如有多个socket时,可以去查看其他socket有没有可以接收的数据;实际应用中,这种I/O模型的直接使用并不常见,因为它需要不停的查询,而这些查询大部分会是无必要的调用,白白浪费了系统资源;
如果read(设备1)是阻塞的,那么只要设备1没有数据到达就会一直阻塞在设备1的read调用上,即使设备2有数据到达也不能处理,使用非阻塞I/O就可以避免设备2得不到及时处理。
三、I/O 复用(异步阻塞)模式频繁地去收发室对老陈来说太累了,在间隔的时间内能做的事也很少,而且取到信的效率也很低.于是,老陈向小区物业提了建议;小区物业改进了他们的信箱系统:住户先向小区物业注册,之后小区物业会在已注册的住户的家中添加一个提醒装置,每当有注册住房的新的信件来临,此装置会发出 “新信件到达”声,提醒老陈去看是不是自己的信到了。 这就是异步阻塞模型; 在这种模型中,配置的是非阻塞 I/O,然后使用阻塞 select 系统调用来确定一个 I/O 描述符何时有操作。
I/O复用模型能让一个或多个socket可读或可写准备好时,应用能被通知到;
用select来管理多个I/O,当没有数据时select阻塞,如果在超时时间内数据到来则select返回,再调用recv进行数据的复制,recv返回后处理数据。 下面的C语言实现的例子,它从网络上接受数据写入一个文件中: perl实现: 四、信号驱动 I/O 模型老陈接收到新的信件后,一般的程序是:打开信封-掏出信纸 -阅读信件-回复信件 ……为了进一步减轻用户负担,小区物业又开发了一种新的技术:住户只要告诉小区物业对信件的操作步骤,小区物业信箱将按照这些步骤去处理信件,不再需要用户亲自拆信 /阅读/回复了! 这就是信号驱动I/O模型 我们也可以用信号,让内核在描述字就绪时发送SIGIO信号通知我们。
无论如何处理SIGIO信号,这种模型的优势在于等待数据报到达期间,进程不被阻塞,主循环可以继续执行,只要不时地等待来自信号处理函数的通知:既可以是数据已准备好被处理,也可以是数据报已准备好被读取。 五、异步非阻塞模式 linux下的asynchronous IO其实用得很少。
这就是异步非阻塞模式 以read系统调用为例 steps: a. 调用read; server端程序: 用户进程发起read操作之后,立刻就可以开始去做其它的事。
然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了。 六、总结到目前为止,已经将四个IO Model都介绍完了。
先回答最简单的这个:blocking vs non-blocking。前面的介绍中其实已经很明确的说明了这两者的区别。
在说明synchronous IO和asynchronous IO的区别之前,需要先给出两者的定义。 Stevens给出的定义(其实是POSIX的定义)是这样子的:
两者的区别就在于: synchronous IO做”IO operation”的时候会将process阻塞。 按照这个定义,之前所述的blocking IO,non-blocking IO,IO multiplexing都属于synchronous IO。 有人可能会说,non-blocking IO并没有被block啊。这里有个非常“狡猾”的地方,
各个IO Model的比较如图所示: 经过上面的介绍,会发现non-blocking IO和asynchronous IO的区别还是很明显的:
.而asynchronous IO则完全不同。它就像是用户进程将整个IO操作交给了他人(kernel)完成,然后他人做完后发信号通知。在此期间,用户进程不需要去检查IO操作的状态,也不需要主动的去拷贝数据。 最后,再举几个不是很恰当的例子来说明这五个IO Model: 有A,B,C,D,E五个人钓鱼:
关注「Linux爱好者」 看更多精选 Linux 技术文章 ↓↓↓ |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|