进程

Node.js的多进程机制基于操作系统的进程创建原语，通过child_process和cluster模块封装实现。以下从底层原理到上层API，深入解析其实现机制：

一、操作系统层面的进程创建

Node.js多进程的底层依赖于操作系统的进程创建机制：

Unix/Linux
- 使用fork()系统调用创建子进程：
  - 子进程复制父进程的内存空间、文件描述符等资源。
  - fork()返回两次：在父进程中返回子进程PID，在子进程中返回0。
- 通过exec()系列函数在子进程中执行新程序。
Windows
- 没有fork()，通过CreateProcess()API创建进程：
  - 需显式加载可执行文件，无法直接复制父进程状态。
- Node.js通过模拟fork()行为实现跨平台一致性。

二、Node.js的child_process模块实现

child_process模块提供四种创建子进程的方法：

spawn(command, [args], [options])
- 底层调用操作系统的进程创建API（如fork()+exec()）。
- 返回ChildProcess对象，通过流（stdin/stdout/stderr）通信。
- 示例：
```
const { spawn } = require('child_process');
const child = spawn('ls', ['-lh', '/']);

child.stdout.on('data', (data) => {
  console.log(`输出: ${data}`);
});
```
exec(command, [options], callback)
- 基于spawn实现，封装了回调处理和输出缓冲区。
- 适用于执行简单命令并获取完整输出。
execFile(file, [args], [options], callback)
- 直接执行文件，跳过shell解析，比exec更高效。
fork(modulePath, [args], [options])
- 专门用于创建Node.js子进程。
- 内部使用spawn，自动建立IPC通道（通过process.send()通信）。

三、cluster模块的实现原理

cluster模块基于child_process.fork实现多进程负载均衡：

主从模式（Master-Worker）
- 主进程（Master）：负责创建工作进程（Worker）和分发TCP连接。
- 工作进程（Worker）：实际处理HTTP请求的进程。
TCP连接分发机制
- Unix/Linux：主进程创建TCP服务器，监听端口，通过socket文件描述符将连接分发给工作进程。
- Windows：每个工作进程独立创建TCP服务器，绑定相同端口（需设置IP_PORT_BLOCK选项）。
负载均衡策略
- Round-Robin（默认）：主进程按顺序将请求分发给工作进程。
- Windows直接绑定：每个工作进程竞争接受连接，操作系统负责负载均衡。

示例代码

const cluster = require('cluster');
const http = require('http');
const numCPUs = require('os').cpus().length;

if (cluster.isMaster) {
  // 创建与CPU核心数相同的工作进程
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();
  }
  
  // 监听工作进程退出事件，自动重启
  cluster.on('exit', (worker, code, signal) => {
    console.log(`工作进程 ${worker.process.pid} 退出，重启中...`);
    cluster.fork();
  });
} else {
  // 工作进程处理HTTP请求
  http.createServer((req, res) => {
    res.end(`Hello from worker ${process.pid}\n`);
  }).listen(3000);
}

四、进程间通信（IPC）实现

Node.js通过**Unix Domain Socket（Unix）或命名管道（Windows）**实现进程间通信：

底层通信机制
- 主进程与工作进程通过IPC通道交换消息。
- 消息以JSON格式序列化后传输，支持Buffer、对象等类型。
API使用
- 发送消息：child.send(message[, sendHandle]) 或 process.send(message)。
- 接收消息：监听message事件：child.on('message', callback)。

示例：主进程与子进程通信

// 主进程
const { fork } = require('child_process');
const child = fork('worker.js');

child.on('message', (msg) => {
  console.log('收到子进程消息:', msg); // 输出: { status: 'working' }
});

child.send({ command: 'start' });

// worker.js（子进程）
process.on('message', (msg) => {
  if (msg.command === 'start') {
    process.send({ status: 'working' });
  }
});

五、关键技术细节

文件描述符共享
- 主进程创建的TCP服务器通过文件描述符传递给工作进程，实现端口复用。
零拷贝机制
- 通过sendmsg()系统调用传递文件描述符，避免数据复制。
进程崩溃恢复
- 主进程监听工作进程的exit事件，自动重启崩溃的进程，实现高可用。
内存隔离
- 每个进程有独立的V8实例和内存空间，避免相互影响。

六、多进程 vs. 多线程

特性	多进程（cluster）	多线程（worker_threads）
内存隔离	完全隔离，每个进程有独立内存空间	共享内存，需处理线程安全问题
创建开销	高（需复制内存空间）	低（仅创建线程栈）
通信效率	低（通过IPC）	高（直接访问共享内存）
适用场景	CPU密集型任务、需隔离的服务	I/O密集型任务、需共享状态的场景

七、性能优化建议

进程数与CPU核心匹配
- 工作进程数通常设为os.cpus().length，充分利用多核资源。
避免过度创建进程
- 进程创建开销大，优先使用线程处理轻量级并发任务。
使用PM2等进程管理器
- PM2基于cluster模块，提供自动重启、负载均衡、监控等功能：
```
pm2 start app.js -i max # 自动创建与CPU核心数相同的进程
```
进程间负载均衡
- 对于非HTTP服务，可通过自定义IPC实现更灵活的负载均衡策略。

通过理解Node.js多进程的底层实现，开发者可合理设计架构，充分发挥多核CPU性能，同时避免常见的性能陷阱。

一、操作系统层面的进程创建​

二、Node.js的child_process模块实现​

三、cluster模块的实现原理​

四、进程间通信（IPC）实现​

五、关键技术细节​

六、多进程 vs. 多线程​

七、性能优化建议​