主要介绍 VSYNC、三重缓存

Synopsis

Google 在 Android4.1 提出了 Project Butter 用于提升系统流畅度。Project Butter 对 Android Display 系统进行了重构，引入了 VSYNC（垂直同步）、Triple Buffer（三重缓存）和 Choreographer。

Problems

在一个典型的显示系统中，一般包括 CPU、GPU、display 这3个部分。CPU 用于计算数据然后交给 GPU 进行渲染，渲染好后放到 buffer 中存起来，然后 display 会将 buffer 里的数据显示到屏幕上。但显示后会出现2种问题：

tearing

即撕裂。当 CPU/GPU 将数据准备好存入 buffer 中，但 display 还没来得及显示，这时 CPU/GPU 把下一帧的数据往 buffer 中写，还没写完的时候，display 开始读取 buffer 来显示（也就是绘图速度大于显示速度）。这时就会出现显示的上半部分是下一帧的数据，下半部分为上一帧的数据，就是所说的撕裂。

jank

绘图速度过慢的时候，同一帧在屏幕上至少出现2次。

Solutions

1.tearing

撕裂的原因是 display 还没来得及读 buffer 就被重写了，那么就可以准备2个 buffer 即双缓冲。back buffer 用于 CPU/GPU 后台绘制，frame buffer 用于显示。back buffer 准备好后才可以交换，这样就可以避免撕裂问题。但是此时屏幕还没有完整显示上一帧的内容时是不能交换的。那么只有等屏幕处理完成当前帧才能进行交换操作。当扫描完一屏后，会回到第一行进入下一次的循环，中间会有一段空隙（VBI），这个空隙为缓冲区交换的最佳时间。VSYNC 就是利用这个空隙出现的垂直刷新脉冲来保证双缓冲的最佳时间点。

2.jank

我们来看下在双缓冲下，没有 VSYNC 的情况： Display 为显示屏， VSYNC 仅仅指双缓冲的交换。我们来看下将会发生的异常：

Step1：Display 显示第0帧，此时 CPU/GPU 渲染第1帧画面，并且在 Display 显示下一帧前完成。
Step2：Display 正常渲染第一帧。
Step3：出于某种原因，如 CPU 资源被占用，系统没有及时处理第2帧数据，当 Display 显示下一帧时，由于数据没处理完，所以依然显示第1帧，即发生“Jank”。
上图出现的情况就是第2帧没有在显示前及时处理，导致屏幕多显示第一帧一次，导致后面的帧都延时了。那么如何让第2帧及时绘制呢？
可以看出，当且仅当 VSYNC 出现时，CPU 就会立即处理下一帧数据，大大降低了 Jank 的概率。而且也杜绝了 CPU/GPU 不停的绘制，导致帧生成速度高于屏幕刷新速度，生成的帧不能显示而被丢弃，这样导致的丢帧情况。引入 VSYNC 后，绘制速度和屏幕刷新速度保持一致了。现在 Android 设备的屏幕刷新频率为 60HZ，那么 CPU/GPU 渲染的时间需要在 16ms 内。当 CPU/GPU 的 FPS 高于 60 HZ 显示效果会很完美，如果设备硬件性能较差，无法达到这个要求会出现什么情况呢？我们先来看下正常情况，A 和 B 分别代表2个缓冲区。整个过程很顺滑。现在来看下FPS低于屏幕刷新率的情况：可以看出当第1个 VSYNC 到来时 GPU 还在处理数据，这时 B 缓冲区被占用了，那么就无法进行交换，屏幕依然显示 A 缓冲区的数据。下一个信号到来时，此时 GPU 已经处理完了，那么就可以交换缓冲区，此时屏幕显示 B 缓冲区，CPU/GPU 开始操作 A。下一个信号到来时，A 被占用，那么屏幕依然显示 B 的数据。这种情况就是因为 GPU/CPU 无法在 16ms 内处理完数据而导致缓冲区交换延迟。
那么有没有办法避免呢？
因为设备不能升级硬件，我们无法改变 CPU/GPU 渲染的时间，那么第一次 Jank 是无法避免的。我们重点关注 CPU 第一次和第二次执行中间浪费的时间。当第1次信号到来时，由于 GPU 占用了 B，导致屏幕会一直占用 A。两个缓冲区都被占用了，即使此时 CPU 是空闲的，它也没有办法处理下一帧的数据。如果增加一个 buffer,会不会有所改善？当第一个信号到来时，A、B 都被占用，此时 CPU 开始使用 C 缓冲区来处理下一帧数据。之前第二次发生的 Jank 就避免了。有效的降低了显示错误的几率。可以看出双缓冲和三重缓冲都会有 lag（延时）问题。C 缓冲区延时了16ms才显示。

渲染过程CPU和GPU的分工

我们知道，渲染的过程需要2个核心组件：CPU 和 GPU。

CPU：负责 Measure、Layout、Record、Execute 的计算操作。
GPU：负责 Rasterization（栅格化）操作

CPU 负责把 UI组件计算成 Polygons（多边形）和 Texture（纹理），然后交给 GPU 进行栅格化。 GPU 的栅格化过程是绘制 Button、Shape、Path、String、Bitmap 等组件最基础的操作。它将这些组件拆分到不同的像素中显示，这是一个耗时操作，GPU 的引入就是为了加快栅格化。
每次从个CPU 转移到 GPU 是一件很麻烦的事，所幸的是 OpenGL ES 可以将需要渲染的纹理 hold 在 GPU Memory 中，在下次需要渲染的时候直接进行操作。