虚拟化与 Hypervisor
云的第一笔生意,是把一台昂贵物理机安全地切给很多租户。Hypervisor 维护的不是一个幻觉,而是一整套可出售的隔离边界。
0先把地图摊开
云的第一笔生意,是把一台昂贵物理机安全地切给很多租户。Hypervisor 维护的不是一个幻觉,而是一整套可出售的隔离边界。 本章不会把概念排成术语表,而是沿着一条真实系统路径走:先看它解决什么痛点,再看 OS/云平台怎样实现,最后回到工程取舍。
6.1虚拟机是完整机器的抽象
进程抽象的是程序,虚拟机抽象的是整台电脑。它有自己的内核、磁盘、网卡和启动流程。云商卖给你的 EC2/ECS 实例,本质就是这个抽象的商品化版本。
6.2特权指令必须被接管
guest OS 以为自己是内核,但真正的硬件控制权在 hypervisor 手里。CPU 硬件虚拟化让敏感操作 trap 到 hypervisor,由它检查、模拟或安全执行。
6.3内存虚拟化叠在虚拟内存之上
guest 自己有页表,host 也要管理真实物理页。现代硬件用 EPT/NPT 做二级地址翻译,减少 hypervisor 介入,但 TLB、huge page、NUMA 仍会影响性能。
6.4设备是虚拟化最难的部分
CPU 和内存可以靠硬件辅助高效虚拟化,设备 I/O 更麻烦。云商会在模拟设备、半虚拟化 virtio、SR-IOV 直通之间做取舍:兼容、性能、隔离不能全都最大化。
6.5云实例规格是资源承诺的语言
2 vCPU / 8GB RAM 不是一台小物理机,而是一组调度和隔离承诺。理解这个,你才会读懂 steal time、burst credit、dedicated host 和 noisy neighbor。
↔云与 OS 的桥
这一章不是孤立知识点。下面这张表把它和前后章节接起来:你会看到,同一个机制在单机、云平台和 AI 基建里会换名字,但问题结构没变。
| 本章机制 | 云上形态 | 为什么重要 |
|---|---|---|
| vCPU | 云实例规格、Kubernetes node allocatable | 你买到的是可调度份额,不是裸核所有权。 |
| 设备虚拟化 | 云盘、ENA 网卡、GPU passthrough | 性能敏感设备会推动更接近硬件的虚拟化方案。 |
| 隔离边界 | 多租户安全、机密计算 | 云商最核心的能力之一是让陌生租户安全共处。 |
深潜 读完本章后,怎么确认自己真的懂了?›
不要只背定义。你应该能把一个线上现象翻译回机制:慢在哪里、谁在排队、哪个抽象漏了、哪个资源被过度承诺。下面三个检查点可以当成小作业。
本章收束 · 你现在握住了什么
- 虚拟机抽象的是整台机器,hypervisor 维护隔离与资源分配。
- 多数指令直接执行,敏感操作和 I/O 需要 trap 或虚拟化。
- 云实例规格是资源承诺,不是物理硬件切片的简单照片。
- 超售让云便宜,也带来 noisy neighbor 和性能不确定性。
虚拟机完整但重。下一章看容器:不虚拟一整台机器,只隔离进程,为什么也能像一个小世界?