网络系统

羊小鱼

2025-05-09 (Updated: 2025-05-09)

网络

磁盘可以说是计算机系统最慢的硬件之一，读写速度相差内存10倍以上，所以针对优化磁盘技术非常多，比如零拷贝，直接IO，异步IO等，这些优化的目的就是为了提高系统的吞吐量，另外操作系统内核中的磁盘告诉缓存区可以有效减少磁盘访问次数

在没有DMA技术前，IO的过程是这样的：

CPU发出对应指令给磁盘控制器，然后返回
磁盘控制器收到指令后，开始准备数据，会把数据放入到磁盘控制器内部的缓冲区，然后产生一个终端
CPU收到中断信号后，停下手头的工作，接着把磁盘控制器的缓冲区的数据一次一个字节的读进自己的寄存器，然后再把寄存器里的数据写入到内存，而在数据传输期间CPU是无法执行其他任务的

因此在进行IO设备和内存的数据传输的时候，数据搬运的工作全部交给DMA控制器，而CPU不再参与任何与数据搬运相关的事情

具体流程

CPU不再参与将数据从磁盘控制缓冲区搬运到内核空间的工作，这部分工作全程由DMA完成。

如果服务端要提供文件传输功能，两个步骤：

1 2	read(file, tmp_buf, len); write(socket, tmp_buf, len);

期间发生了4次用户态和内核态的上下文切换。
4次数据拷贝：其中两次是DMA拷贝，另外两次是通过CPU拷贝:

我们可以发现很多次的数据拷贝，同时存在冗余的上下文切换和数据拷贝，多了很多不必要的开销，影响系统性能。
所以，要提高文件传输的性能，必须减少用户态和内核态的上下文切换和内存拷贝的次数

如何减少数据拷贝次数？

在上面那个场景中，我们会历经4次数据拷贝，而因为我们并没有对数据再加工，所以数据实际上可以不用搬运到用户空间，因此用户的缓冲区是没有必要存在的。

这里存在两种零拷贝技术:

mmap + write
read() 系统调用会把内核缓冲区的数据拷贝到用户缓冲区中，于是为了减少这一步开销，我们可以用mmap()替换read()系统调用函数。

1 2	buf = mmap(file, len); wrtie(sockfd, buf, len);

mmap() 系统调用函数会直接把内核缓冲区里的数据映射到用户空i教案，这样操作系统内核与用户空间就不需要再进行任何的数据拷贝操作。

具体流程

sendfile可以替换前面的read和write两个系统调用，这样可以减少一次系统调用，减少了2次上下文切换的开销

真正的零拷贝技术，因为我们没有在内存层面去拷贝数据，也就是说全程没有CPU来搬运数据，所以数据都是通过DMA来进行传输的。简单来说就是，网卡控制器可以直接将内核缓冲区的数据拷贝到网卡缓冲区中，减少了一次CPU的拷贝