Focus on FE learning

1. 引入线程

首先回忆一下为什么会有进程 —— 在以前，程序是串行执行的，为了让多道程序并发执行，引入了进程。进程虽然显著提高了资源利用率和系统吞吐量，满足了并发的需求，但是这种并发能不能做得更好呢？事实上，进程既是一个携带资源的独立单位，也是独立调度的基本单位，因此，在进程的创建、撤销和切换时，系统必须为之付出较大的时间空间开销（没办法“轻装上阵”）。鉴于此，系统不宜设置过多的进程，也不宜频繁地切换进程，这对于并发来说是一种限制。

如何解决这个问题呢？可以把进程看作是管理初创公司的老板，一开始人手不足，老板既要管理公司，也要四处奔跑沟通业务；但是一旦人手充足，那么老板仍然可以管理公司，只是沟通业务的工作就可以交给手下人去执行了。同理，我们可以考虑依然让进程作为拥有资源的独立单位，但是独立调度的基本单位则不再是进程，而是新引入的线程了。

2. 线程与进程

调度的基本单位

引入线程后，调度的基本单位不再是进程，而是线程。线程能够独立运行，且切换的时候，代价远远小于进程切换的代价。同一进程不同线程的切换，不会引起进程的切换。

执行的基本单位

通常认为进程不再作为可执行的实体。也即，可以说进程处于“执行”状态，但其实指的是该进程的某个线程正在执行；可以说进程处于“挂起”状态，但其实指的是该进程的所有线程都被挂起。其他同理。

并发性

进程间仍然能够并发，不仅如此，一个进程中的多个线程间也能并发，不同进程中的线程也能够并发，大大提高了 OS 的并发性。

资源

资源依然掌握在进程手中。为了性能考虑，线程仅占有一点必不可少的资源（比如 TCB，程序计数器等）。那么如何访问其它资源呢？事实上，同一进程的线程共享该进程所拥有的资源。另外，这些线程还共享同一片内存地址空间，所以也可以方便地进行通信。

独立性

同一进程中的线程间独立性要比不同进程间独立性低很多。前者独立性高，因为要防止进程之间彼此干扰和破坏；后者独立性低，因为同一进程的多个线程通常需要协作完成任务，互相之间可访问程度相对来说会比较高。

系统开销

在创建和撤销进程时，系统需要分配或者回收 PCB，分配或者回收资源，所以需要付出一定的时空开销；但是线程的创建和撤销的时空开销则明显小很多，尤其是在同一进程内的线程创建和撤销，这种开销会更加地小。

支持多处理机系统

传统的单线程进程，即使处理机再多，一个进程也只能运行在一个处理机上；但是引入了线程后，一个进程的多个线程可以分配到多个处理机上、并行执行。

3. 线程的状态和线程控制块

线程的状态类似于进程的状态，同样有：执行态、就绪态、阻塞态。

进程有进程控制块 PCB，线程也有线程控制块 TCB（Thread control block）。TCB 记录了所有用于控制和管理线程的信息。具体来说包括：

① 线程标识符：为每个线程赋予一个唯一的线程标识符

② 组寄存器：包括程序计数器PC、状态寄存器和通用寄存器的内容

③ 线程运行状态：用于描述线程正处于何种运行状态
④ 优先级：描述线程执行的优先程度

⑤ 线程专有存储区：用于线程切换时存放现场保护信息，和与该线程相关的统计信息等

⑥ 信号屏蔽：即对某些信号加以屏蔽

⑦ 堆栈指针：在线程运行时，经常会进行过程调用，而过程的调用通常会出现多重嵌套的情况，这样，就必须将每次过程调用中所使用的局部变量以及返回地址保存起来。为此，应为每
个线程设置一个堆栈，用它来保存局部变量和返回地址。相应地，在 TCB 中，也须设置两
个指向堆栈的指针:指向用户自己堆栈的指针和指向核心栈的指针。前者是指当线程运行
在用户态时，使用用户自己的用户栈来保存局部变量和返回地址，后者是指当线程运行在
核心态时使用系统的核心栈。