Part V · 通往 AI 基建 · 第 13 章
13
Serverless 与正在消失的机器
Serverless 不是没有服务器,而是你不再把服务器作为思考和付费的基本单位。机器消失在接口背后,冷启动、状态和成本模型留下来。
0先把地图摊开
Serverless 不是没有服务器,而是你不再把服务器作为思考和付费的基本单位。机器消失在接口背后,冷启动、状态和成本模型留下来。 本章不会把概念排成术语表,而是沿着一条真实系统路径走:先看它解决什么痛点,再看 OS/云平台怎样实现,最后回到工程取舍。
函数即服务以单个函数/事件处理器为部署和计费单位。
冷启动没有热实例可用时,需要创建运行环境导致额外延迟。
事件驱动对象上传、队列消息、HTTP 请求等事件触发计算。
状态外置函数实例短暂且可替换,持久状态放到外部服务。
13.1Serverless 把容量规划换成接口约束
你不再预先声明几台机器,而是交一个函数和触发器。平台按请求创建、复用、销毁执行环境。省心的代价是执行时间、内存、并发、网络等约束变成产品边界。
13.2冷启动是抽象漏出来的声音
当没有热环境可复用,平台要下载代码、准备 runtime、初始化依赖、建立网络。用户看到的是一个慢请求;系统看到的是一次被隐藏的部署。
13.3无状态不是建议,是生存条件
函数实例可能随时消失,也可能并发复制。把会话存在内存里会出事;状态必须放数据库、对象存储、队列或缓存。
13.4事件驱动让 glue code 变少,也让链路更隐蔽
对象上传触发缩略图,队列消息触发处理,定时器触发清理。系统更松耦合,但调试从“看一台服务”变成“追一串事件”。
13.5Serverless 是经济模型
低流量、突发、不稳定任务非常适合按调用付费;持续高负载可能比常驻服务更贵。架构选择最终要落到 workload 曲线。
↔云与 OS 的桥
这一章不是孤立知识点。下面这张表把它和前后章节接起来:你会看到,同一个机制在单机、云平台和 AI 基建里会换名字,但问题结构没变。
| 本章机制 | 云上形态 | 为什么重要 |
|---|---|---|
| 冷启动 | AI 推理服务模型加载 | 加载大依赖/大模型时,冷启动成本会被放大。 |
| 事件驱动 | 数据管道、异步任务 | 队列和对象存储把计算串成云上工作流。 |
| 状态外置 | 数据库、缓存、对象存储 | 无状态 worker 是扩缩容和容错的基础。 |
深潜 读完本章后,怎么确认自己真的懂了?›
不要只背定义。你应该能把一个线上现象翻译回机制:慢在哪里、谁在排队、哪个抽象漏了、哪个资源被过度承诺。下面三个检查点可以当成小作业。
本章收束 · 你现在握住了什么
- Serverless 隐藏服务器,但不消除服务器。
- 冷启动是执行环境准备成本暴露到用户请求上。
- 函数实例短暂可替换,状态必须外置。
- Serverless 首先是适合特定 workload 的经济模型。
最后一章把所有线索汇到 AI 基础设施:GPU、KV cache、batching、调度和云平台如何共同服务大模型。