Queue-Proxy以边车容器（Sidecar） 形式部署在 Knative Service 的每个 Pod 中，核心功能包括：收集 Pod 级别的请求指标（供 Autoscaler 决策）；转发请求到用户业务容器时，强制执行预设的并发限制；必要时可作为本地请求队列，缓冲突发流量。

Webhooks属于控制平面组件，包含多个验证和变异 Webhook，作用是在 Knative 资源（如 Service、Route）被创建或更新时，对资源配置进行合法性校验，或自动注入必要的配置（如默认标签、注解），确保资源符合 Knative 运行规范。

组件之间的关系

控制平面与数据平面的协作

Controller 负责资源的状态管理，当用户创建 Knative Service 后，Controller 会生成对应的 Revision 和网络路由规则，并触发 Queue-Proxy 随业务容器一同部署。

Webhooks 作为 Controller 的前置环节，在资源提交至集群时完成校验和变异，保证 Controller 处理的资源配置合法有效。

流量处理与扩缩容联动

当 Service 缩容至零时，外部请求会被路由至 Activator，Activator 排队请求并通知 Autoscaler 进行扩容。

Autoscaler 基于 Queue-Proxy 收集的 Pod 指标和 Activator 上报的排队请求数，计算需要的 Pod 副本数，通知 Controller 完成 Pod 调度。

Pod 启动后，Queue-Proxy 接管本 Pod 的请求转发和并发控制，Activator 则将排队的请求转发至新启动的 Pod，后续请求直接路由至 Pod 内的 Queue-Proxy。

指标与决策的闭环

Queue-Proxy 收集的 Pod 实时指标（如并发数、请求延迟）会上报给 Autoscaler，Autoscaler 根据指标动态调整 Pod 数量，而 Controller 则根据 Autoscaler 的决策执行 Pod 的创建或销毁，最终实现服务的弹性伸缩与流量的稳定处理。

网络路由部分

比如，当选用 Istio 作为网络层实现时，knative-serving 命名空间下的 net-istio-controller 会监听 KIngress 资源，并据此创建 Istio 的 VirtualService 等路由资源；Istio 自身控制器会将这些抽象路由规则转化为具体的网络层配置，最终完成流量的正确路由。

Knative Service创建时有哪些资源我们需要关注？

Queue Proxy

单pod内Sidecar模式

业务流量、管理接口、指标采集三个平面节藕

Queue proxy是knative中运行单位（一个serverless服务）唯一对外入口

AutoScaler

autoscaler scale deployment replica 源码阅读

Activator

activator 流量暂存能力源码阅读

流量的分发逻辑

流量暂存的实现逻辑

流量暂存不是显式存储请求数据，而是让处理请求的 goroutine 阻塞等待,请求数据始终在堆上。

一个goroutine 2KB+

每个等待请求: 约 10-50 KB（取决于请求大小）

Channel: 几乎不占内存（只存储信号）

队列深度 10000: 最多约 100-500 MB

内容	位置
http.Request struct 本体	堆
Header / Body / URL	堆
`*http.Request` 指针	goroutine 栈
`ResponseWriter` 接口值	goroutine 栈
是否继续执行	goroutine 状态