前面实现了线程池,如果我们使用线程池就是有一个连接到来就把它丢进工作队列,然后让线程竞争,在这个过程中又会产生一个问题,我们浪费了主进程,它只是干了一件把任务丢进线程池工作队列的操作,然后就啥也没干了,所以我们把IO操作单独拿出来给主线程来干,线程池里的线程就只干解析的事情。
IO多路复用
所谓IO多路复用就是在一个线程上可以对多个对象进行IO操作, 这里主要使用了epoll,epoll可以监视多个文件描述符上的多个事件,没有事件发生的时候就会阻塞在epoll_wait上,当有事件发生时就会返回已经准备好的那些事件,就可以对这些文件描述符进行操作。
epoll有两个触发模式分别为水平触发(LT)和边缘触发(ET),LT就是当某个文件描述符上的事件发生后它会一直通知,ET是当某个文件描述符上是事件发生后它只会通知一次,直到下一次该事件再次发生。
例如有一个文件现在有10个字节可读,LT模式下它会通知你,你读取了一个字节后不读了,下一次循环epoll还会返回该文件描述符,而ET模式下一个循环就不会再通知了,直到有新的数据到该文件
模式选取
connfd
对于connfd
,如果用LT模式,但是我一次没有读完数据(比如缓冲区满了),那么下一次还会接着读,但是可能我前一次读的数据给了一个线程,后一次读是数据又给了另一个线程,这样数据就不完整了,所以选择ET模式,由于ET模式只通知一次,所以要一次把数据读完,就在读取外面加一个while
,知道读完或连接关闭。
同时还是上面的情况,如果一个现在再处理某个文件描述符的时候这个文件描述符上又有新的数据来了,那么这时候会把这个fd给另一个线程,还是会出问题,所以还要给它加上一个ONESHOT
也就是只通知一次,先要下一次通知需要重置该epoll中的该fd
listenfd
对于listenfd
,我们用LT就可以了,这样不会有连接丢失(边缘触发时,accept只会执行一次接收一个连接,内核不会再去通知有连接就绪),所以使用水平触发的fd就不存在丢失连接的问题)
描述符的阻塞还是非阻塞
connfd
对于用ET模式的描述符必须设置成非阻塞模式,因为ET模式下我们要用一个循环来读写所有文件,那么当读写完了之后,阻塞模式的描述符会阻塞在这里,而非阻塞模式会返回一个EAGAIN
代表当前不可读写,所以为了程序能正常运行下去必须使用非阻塞读写
listenfd
对于listenfd
,好像阻塞非阻塞都无所谓,但是有这么一直情况,比如现在来了一个连接,epoll通知了现在listenfd
可以读了,那么主线程往下运行,在运行到accept
这句话之前连接就断开了,那么现在accept
就会阻塞在这里,epoll里其他事件都得不到处理,直到下一个连接到来,这显然不好,所以要把listenfd
设置成非阻塞,当客户在服务器调用accept之前中止某个连接时,accept调用可以立即返回-1
具体实现
首先要把IO操作从工作线程中分离出来,那么之前的HttpConn
类中就只需要一个读缓冲区和写缓冲区,然后在主线程中进行IO,将读取的数据放到类的写缓冲区让类去处理,然后类处理后生成的响应放到写缓冲区,让主线程来读取并写入sockfd
首先是在主线程中调用的两个非阻塞的读写函数
1 | bool http_conn::HttpConn::readall()//读取所有数据放入读缓冲区 |
这两个函数还是放在HttpConn
内,因为要访问类的成员,但是类的内部不会调用它们,由主线程来调用
这两个函数里有一些操控epoll的函数,放到下面
1 | void http_conn::addfd(int epollfd,int fd,bool et,bool oneshot)//将文件描述符添加进epoll进行监听 |
也就是上面的写函数里在暂时写不了的时候重置监听当前描述符的写事件,等待下一次通知
还有一个设置文件描述符为非阻塞的函数
1 | void http_conn::setnoblock(int fd)//设置文件描述符非阻塞 |
然后是主线程,也就是main.cpp
,在这里需要创建线程池,然后进行几乎所有的IO操作
1 |
|
其中忽略的SIGPIPE信号是在程序尝试写一个已经被客户端关闭的信号时会发生的信号,它会结束当前线程,所谓我们要忽略它。
然后是各个线程的入口函数
1 | void http_conn::HttpConn::run() |
当数据读取是正确的,但是不完全,比如只读到了请求行,没有读到请求头那么会返回一个NO_REQUEST
,然后将文件描述符重置,等待接下来的读取,如果都处理完了,响应生成了,那么重置文件描述符监听可写事件。
测试
使用webbench进行测试
从上到下为1线程。2线程,4线程,8线程(线程池内的线程数量),在1000并发量的情况下线程多了吞吐量反而有所下降,不过是在同一台虚拟机上测试的,可能会有一些影响