Forrest’s 博客

Ctrl+K

如果去做，还有一丝希望；但是不去做，就毫无希望

个人总结

🎭 读「阿里巴巴管理三板斧」

🔇 2025年终总结

🏐 我的MBTI

🎯 2024年终总结

技术分享

🧲 GLM 系列音频模型总结：输入、输出与文件格式全解析

⛓️ 阿里云核心服务概念梳理： FC / ECS /ECI / ACK /ACS

🧵 prometheus为代表的监控构建

📹 限流、熔断与降级：微服务高可用性的核心保障机制

🏹 kubebuilder 总结

🌚 版本控制规范

🕹️ kafka学习笔记

📽️ 如何构建一个短链系统

🎤 mac VMware Fusion 虚拟机安装

💈 MongoDB 总结

🎯 深入理解 IO 多路复用：从 select、poll 到 epoll 的演进

🎰 常见的网络设备

🚍 高可用的常见手段

🌇 基于Casbin的RBAC权限认证｜权限管理

🪩 从0到1，利用kubevirt构建ubuntu虚拟机

🧩 iptables in linux

🏓 在mac中，如何将标准输出保存到剪切板中

🌦️ nvidia驱动和cuda安装记录

🌞 正则表达式

🧮 内存对齐

👨‍💻 go中常见的内存泄露场景

🐒 常用限流组件及其实现

⛺ pprof的使用

🏁 sqlite内存模式下的性能测试

🌐 全局唯一ID生成方案

🌑 linux笔记

LLM

🔐 超大规模MaaS System Design

🎉 OpenAI API格式

🔇 读「大模型训练与推理加速实战：基于CUDA计算平台（python版）」

📔 读「大模型时代的基础架构：大模型算力中心建设指南」

🚡 深度学习模型架构解析：以Encoder-Decoder为核心的分类体系

k8s

🏞️ 初探 Volcano Scheduler

🧭 AI 时代下的 Kubernetes 调度器：架构、挑战与演进路径

🛑 Kubelet → CRI → containerd/CRI-O → runc/kata：Kubernetes 容器运行时完整调用链

🎎 CloudEvents

🏪 深入解析 Kubernetes Informer 架构

♠️ K8s网络深度解析：CNI、VXLAN与主流插件的实现差异

♦️ Kube-proxy 机制深度解析：API Server 交互与 iptables 规则生成

☄️ openEBS lvm_localpv

📱 CNI In k8s

🛻 k8s架构简介

🚓 Kind相关操作

knative

🌑 Knative Service 多版本管理指南

🌑 Knative + Istio 环境下的会话亲和性实现方案

🛻 Knative Architecture

🎻 Knative Hands-on

🎎 Knative-Overview

agentic

🎣 从模型视角看上下文工程

🚪 Function Calling、MCP、Skill 三者本质区别与适用场景

⚱️ Prompt Engineering

🥌 vLLM 初体验

istio

🩻 服务网格 | istio

HAMI

♦️ 在k8s环境中使用vgpu | HAMI

Golang

🎗️ Golang map

🔒 如何避免channel重复关闭

🪝 Golang channel

🔒 golang的单机锁

🔂 sync/atomic包

📂 Golang 内存分配与管理机制

转发

🧿 【转】如何阅读源码

计算机网络

📌 计算机网络-网络层

📌 计算机网络-传输层

📌 计算机网络-应用层

Redis

📌 Redis-内存过期和内存淘汰策略

🥎 Redis-大key问题

🛩️ Redis-高可用

📅 Redis-缓存

✨ Redis-持久化

⛑️ Redis-基础数据类型

MySQL

☃️ MySQL-日志

✂️ MySQL-事务

Mysql

⌚ MySQL-索引

⌚ MySQL-存储引擎

⚱️Prompt Engineering

type

Post

status

Published

date

Dec 2, 2025

slug

prompt-engineering

summary

category

agentic

tags

prompt

icon

password

AI summary

Blocked by

Blocking

Category

🥅

从方法论角度总结常用的 Prompt 技法。

提示工程的核心方法论

提示技术

notion image

提示工程本质上是在不改变模型权重的情况下，通过精心设计的输入文本，最大化引导大语言模型产生期望输出的过程。

它可以被看作以下几个层级的递进式优化策略：

基础层：让模型“明白我要什么”

示范层：让模型“知道怎么做才对”

推理层：让模型“学会思考”

可靠性层：让模型“减少出错”

探索层：让模型“考虑多种可能性”

工具层：让模型“走出封闭世界”

风格/约束层：让模型“按指定格式和角色输出”

常用技法分类与方法论对比

notion image

层级	技法名称	核心方法论思路	典型提升场景	主要适用任务类型	实现成本	代表性触发词 / 做法
基础	Zero-shot	直接指令，依赖模型已有知识	简单、常见任务	翻译、摘要、简单问答	极低	直接写任务描述
示范	Few-shot	通过少量高质量示例“教”模型输出格式与逻辑	需要严格格式或特定风格	分类、抽取、改写、结构化输出	低	给 2–6 个 input → output 示例
推理	Chain-of-Thought (CoT)	强制显式生成中间推理步骤，降低单步跳跃难度	数学、逻辑、复杂推理	数学题、逻辑推理、多步问题	低	“一步一步思考”“Let's think step by step”
推理	Zero-shot CoT	极简版 CoT，无需示例	快速提升推理能力	同 CoT	极低	只加一句“让我们一步一步思考”
可靠性	Self-Consistency	多次独立采样 + 多数投票 / 最一致答案	减少单次推理的偶然错误	数学、选择题、确定性答案	中	CoT + 多采样（5–15次）+ 投票
探索	Tree-of-Thoughts (ToT)	树状多路径生成 → 评估 → 选择/剪枝/回溯	需要探索多种可能性的复杂问题	规划、策略、解谜、创意设计	高	生成多个思路 → 打分 → 深入最优分支
探索	Graph-of-Thoughts (GoT)	更自由的非树状依赖关系图推理	高度非线性、相互依赖的推理	复杂分析、多维度综合	很高	思路之间建立显式连接关系
工具	ReAct	交替进行思考(Thought) → 行动(Action) → 观察(Observation)	需要外部信息、工具、实时知识	知识问答、搜索、计算、API 调用	中–高	Thought → Action → Observation 循环
工具	RAG	检索 → 注入上下文 → 生成	知识密集型、最新信息、私有数据	问答、文档检索、知识库查询	中–高	先检索 → 把检索结果塞进 prompt
风格/约束	Role / Persona Prompting	赋予模型特定身份，激活对应知识与表达风格	需要专业性、特定语气	写作、咨询、客服、教学	低	“你是一位……资深……专家”
风格/约束	System Prompt	设置全局行为规则、输出格式、禁止事项	产品化、批量任务、格式严格	API 调用、结构化输出、长期对话	低	系统消息中写规则 + 格式模板
风格/约束	Format Constraint	强制输出特定结构（JSON、表格、Markdown等）	后处理自动化、程序调用	分类、抽取、结构化生成	低	明确写出期望的 JSON 结构或表格格式
自动优化	APE / OPRO / Auto-CoT	让模型自己生成/优化 prompt	追求极致效果、批量任务	任何任务（尤其是已知效果不佳时）	中–高	让模型“写一个更好的 prompt”

方法论选择快速决策路径

工程实践中的关键取舍

成本 vs 效果：Zero-shot → Few-shot → CoT → Self-Consistency → ToT/ReAct（成本递增，效果递增）

速度 vs 质量：temperature 低 + 单次推理更快；temperature 高 + Self-Consistency 更稳

确定性 vs 创造性：低 temperature / 低 top_p → 更确定；高 temperature / 高 top_p → 更多样

可解释性：CoT、ToT、ReAct 推理过程可见，Self-Consistency 本身不可解释但结果更可靠

OpenAI 模型调用参数设置推荐

场景	temperature	top_p	max_tokens	frequency_penalty	presence_penalty	推荐理由 / 备注
数学、逻辑、结构化输出	0.0–0.3	0.9–1.0	任务所需（通常 512–2048）	0.0–0.2	0.0–0.1	最高确定性，减少幻觉
普通 CoT / 推理任务	0.3–0.6	0.95	1024–4096	0.1–0.3	0.1–0.2	平衡确定性与少量多样性
Self-Consistency	0.5–0.8	0.95–1.0	1024–4096	0.0–0.2	0.0	需要多样性推理路径，之后再投票
创意写作、脑暴	0.8–1.0	0.95–1.0	2048–8192	0.3–0.6	0.3–0.6	增加多样性，减少重复
角色扮演、长文本生成	0.7–0.9	0.95	4096+	0.2–0.5	0.2–0.4	保持风格一致，同时有一定创造性
结构化 JSON 输出	0.0–0.2	1.0	按需	0.0	0.0	配合 response_format={"type": "json_object"} 使用
批量处理 / 成本敏感	0.0–0.4	0.9	严格限制	0.0	0.0	优先速度与成本

通用建议

大多数时候只调 temperature 就够了，top_p 保持默认 1.0

Self-Consistency 必须把 temperature 调高，否则采样路径会高度重复。

强制 JSON 输出时一定要加 response_format={"type": "json_object"}（o1、gpt-4o、gpt-4-turbo 等支持）

生产环境推荐同时设置 max_tokens + stop 序列，避免无限输出

阿里云核心服务概念梳理： FC / ECS /ECI / ACK /ACS

Loading...

Catalog

Last update: 2025-12-02

Article List

如果去做，还有一丝希望；但是不去做，就毫无希望

个人总结

🎭 读「阿里巴巴管理三板斧」

🔇 2025年终总结

🏐 我的MBTI

🎯 2024年终总结

技术分享

🧲 GLM 系列音频模型总结：输入、输出与文件格式全解析

⛓️ 阿里云核心服务概念梳理： FC / ECS /ECI / ACK /ACS

🧵 prometheus为代表的监控构建

📹 限流、熔断与降级：微服务高可用性的核心保障机制

🏹 kubebuilder 总结

🌚 版本控制规范

🕹️ kafka学习笔记

📽️ 如何构建一个短链系统

🎤 mac VMware Fusion 虚拟机安装

💈 MongoDB 总结

🎯 深入理解 IO 多路复用：从 select、poll 到 epoll 的演进

🎰 常见的网络设备

🚍 高可用的常见手段

🌇 基于Casbin的RBAC权限认证｜权限管理

🪩 从0到1，利用kubevirt构建ubuntu虚拟机

🧩 iptables in linux

🏓 在mac中，如何将标准输出保存到剪切板中

🌦️ nvidia驱动和cuda安装记录

🌞 正则表达式

🧮 内存对齐

👨‍💻 go中常见的内存泄露场景

🐒 常用限流组件及其实现

⛺ pprof的使用

🏁 sqlite内存模式下的性能测试

🌐 全局唯一ID生成方案

🌑 linux笔记

LLM

🔐 超大规模MaaS System Design

🎉 OpenAI API格式

🔇 读「大模型训练与推理加速实战：基于CUDA计算平台（python版）」

📔 读「大模型时代的基础架构：大模型算力中心建设指南」

🚡 深度学习模型架构解析：以Encoder-Decoder为核心的分类体系

k8s

🏞️ 初探 Volcano Scheduler

🧭 AI 时代下的 Kubernetes 调度器：架构、挑战与演进路径

🛑 Kubelet → CRI → containerd/CRI-O → runc/kata：Kubernetes 容器运行时完整调用链

🎎 CloudEvents

🏪 深入解析 Kubernetes Informer 架构

♠️ K8s网络深度解析：CNI、VXLAN与主流插件的实现差异

♦️ Kube-proxy 机制深度解析：API Server 交互与 iptables 规则生成

☄️ openEBS lvm_localpv

📱 CNI In k8s

🛻 k8s架构简介

🚓 Kind相关操作

knative

🌑 Knative Service 多版本管理指南

🌑 Knative + Istio 环境下的会话亲和性实现方案

🛻 Knative Architecture

🎻 Knative Hands-on

🎎 Knative-Overview

agentic

🎣 从模型视角看上下文工程

🚪 Function Calling、MCP、Skill 三者本质区别与适用场景

⚱️ Prompt Engineering

🥌 vLLM 初体验

istio

🩻 服务网格 | istio

HAMI

♦️ 在k8s环境中使用vgpu | HAMI

Golang

🎗️ Golang map

🔒 如何避免channel重复关闭

🪝 Golang channel

🔒 golang的单机锁

🔂 sync/atomic包

📂 Golang 内存分配与管理机制

转发

🧿 【转】如何阅读源码

计算机网络

📌 计算机网络-网络层

📌 计算机网络-传输层

📌 计算机网络-应用层

Redis

📌 Redis-内存过期和内存淘汰策略

🥎 Redis-大key问题

🛩️ Redis-高可用

📅 Redis-缓存

✨ Redis-持久化

⛑️ Redis-基础数据类型

MySQL

☃️ MySQL-日志

✂️ MySQL-事务

Mysql

⌚ MySQL-索引

⌚ MySQL-存储引擎