Part V · 通往 AI 基建 · 第 13 章
13

Serverless 与正在消失的机器

Serverless 不是没有服务器,而是你不再把服务器作为思考和付费的基本单位。机器消失在接口背后,冷启动、状态和成本模型留下来。

难度 现代云 用时 约 45 分钟 交互 函数调用路径 · 冷启动取舍 路线 螺旋式:先抓大图,再深入机制

0先把地图摊开

Serverless 不是没有服务器,而是你不再把服务器作为思考和付费的基本单位。机器消失在接口背后,冷启动、状态和成本模型留下来。 本章不会把概念排成术语表,而是沿着一条真实系统路径走:先看它解决什么痛点,再看 OS/云平台怎样实现,最后回到工程取舍。

函数即服务以单个函数/事件处理器为部署和计费单位。
冷启动没有热实例可用时,需要创建运行环境导致额外延迟。
事件驱动对象上传、队列消息、HTTP 请求等事件触发计算。
状态外置函数实例短暂且可替换,持久状态放到外部服务。
Serverless · 核心流程 分步动画 点击节点或用键盘 ← →
图 13.1核心机制路径。把这一章最容易散掉的流程压成可播放的五步。

13.1Serverless 把容量规划换成接口约束

你不再预先声明几台机器,而是交一个函数和触发器。平台按请求创建、复用、销毁执行环境。省心的代价是执行时间、内存、并发、网络等约束变成产品边界。

13.2冷启动是抽象漏出来的声音

当没有热环境可复用,平台要下载代码、准备 runtime、初始化依赖、建立网络。用户看到的是一个慢请求;系统看到的是一次被隐藏的部署。

13.3无状态不是建议,是生存条件

函数实例可能随时消失,也可能并发复制。把会话存在内存里会出事;状态必须放数据库、对象存储、队列或缓存。

13.4事件驱动让 glue code 变少,也让链路更隐蔽

对象上传触发缩略图,队列消息触发处理,定时器触发清理。系统更松耦合,但调试从“看一台服务”变成“追一串事件”。

13.5Serverless 是经济模型

低流量、突发、不稳定任务非常适合按调用付费;持续高负载可能比常驻服务更贵。架构选择最终要落到 workload 曲线。

Serverless · 取舍实验 可玩模拟器 切换策略,看指标怎么变
图 13.2工程取舍。云和 OS 的概念真正进入工程时,几乎都不是“选最好”,而是在约束之间找一个诚实的点。

云与 OS 的桥

这一章不是孤立知识点。下面这张表把它和前后章节接起来:你会看到,同一个机制在单机、云平台和 AI 基建里会换名字,但问题结构没变。

本章机制云上形态为什么重要
冷启动AI 推理服务模型加载加载大依赖/大模型时,冷启动成本会被放大。
事件驱动数据管道、异步任务队列和对象存储把计算串成云上工作流。
状态外置数据库、缓存、对象存储无状态 worker 是扩缩容和容错的基础。
深潜 读完本章后,怎么确认自己真的懂了?

不要只背定义。你应该能把一个线上现象翻译回机制:慢在哪里、谁在排队、哪个抽象漏了、哪个资源被过度承诺。下面三个检查点可以当成小作业。

本章收束 · 你现在握住了什么

  • Serverless 隐藏服务器,但不消除服务器。
  • 冷启动是执行环境准备成本暴露到用户请求上。
  • 函数实例短暂可替换,状态必须外置。
  • Serverless 首先是适合特定 workload 的经济模型。

最后一章把所有线索汇到 AI 基础设施:GPU、KV cache、batching、调度和云平台如何共同服务大模型。