进程与线程到底啥区别？并发和并行又是什么？

lichen360
工作日记
30天前
64热度
0评论

进程与线程核心区别解析：彻底搞懂并发与并行

一、从计算机开机说起：程序如何真正运行？

当我们在任务管理器看到数十个进程运行时，很多人会产生这样的疑问：为什么浏览器开几个标签页就会产生多个进程？为什么Python多线程有时反而不如多进程效率高？理解进程与线程的本质差异，是掌握现代编程技术的基石。

1.1 程序、进程、线程的三层架构

程序是存储在硬盘上的静态代码文件，好比烹饪食谱的文字记录。
进程是程序执行的动态实例，相当于厨师按照食谱开始烹饪的过程。每个进程拥有独立的内存空间，就像不同厨房之间食材不互通。
线程则是进程内的执行单元，如同一个厨房里多个厨师共享食材和厨具。每个Python解释器进程都包含多个执行线程，共享相同的全局变量。

1.2 关键差异对比表

维度	进程	线程
资源开销	大（约10MB级）	小（约1MB级）
切换成本	高（涉及内核调度）	低（用户态完成）
内存隔离	独立地址空间	共享堆内存
通信方式	管道/信号量/共享内存	全局变量/队列

二、并发与并行的本质区别

2.1 咖啡店里的操作系统原理

想象咖啡店有4个收银台（CPU核心）和20个顾客（任务）：
并行（Parallelism）：4个收银台同时工作，每个处理一个顾客订单——这是真正的多核同时执行。
并发（Concurrency）：1个收银员快速切换处理多个顾客点单，营造"同时服务"的假象——单核的线程切换实现。

2.2 Python中的特殊现象

由于GIL全局解释器锁的存在，多线程在CPU密集型任务中会出现伪并发：
```python
CPU密集型任务示例
import threading

def compute():
sum = 0
for i in range(107):
sum += i

多线程执行时间反而更长
threads = [threading.Thread(target=compute) for _ in range(4)]
[t.start() for t in threads]
[t.join() for t in threads]
```
此时切换为多进程模式，效率可提升300%以上：
```python
from multiprocessing import Pool

if __name__ == '__main__':
with Pool(4) as p:
p.map(compute, [None]4)
```

三、工程实践中的选择策略

3.1 多进程适用场景

优势场景：
需要绕过GIL限制（科学计算/图像处理）
高可靠性需求（进程崩溃不影响主程序）
CPU密集型任务（视频编码/机器学习）

典型应用：Django/Flask等Web服务器通常采用多进程架构处理请求。

3.2 多线程最佳实践

优势场景：
IO密集型任务（网络请求/文件读写）
GUI程序保持界面响应
需要共享数据状态的应用

风险控制：当多个线程修改同一变量时，必须使用锁机制：
```python
from threading import Lock

counter = 0
lock = Lock()

def increment():
global counter
with lock:
counter += 1
```

四、现代编程的发展趋势

随着协程和异步IO的普及，开发者有了更多选择：
1. 协程：比线程更轻量级的执行单元（Python的asyncio）
2. 线程池：避免频繁创建销毁线程（concurrent.futures模块）
3. 多进程池：平衡资源消耗与计算效率

终极选择建议：
单核环境优先考虑协程
多核CPU密集型选多进程
高并发IO操作选异步+多线程
关键任务系统用进程隔离

理解这些概念的区别，将帮助开发者在构建高并发系统、优化程序性能时做出正确架构决策。记住：没有银弹，只有适合特定场景的最佳实践。