gstack 拆解(一):Y Combinator CEO Garry Tan 的 Claude Code 技能包,扒开看到底是什么
最近你一定刷到过这个东西
如果你关注 AI 编程圈,最近一定被 gstack 刷屏了。
GitHub 上 44k+ stars,各种技术博主争相推荐,评论区一片”太强了”、“改变游戏规则”、“一个人顶一个团队”。
但我翻了一圈,发现一个有意思的现象:夸它的人很多,讲清楚它到底是什么的人几乎没有。
大部分推荐文都是这个套路:先介绍 Garry Tan 的身份,然后贴一下 28 个 skill 的名字列表,最后来一句”赶紧装上试试”。至于每个 skill 里面写了什么、为什么这么设计、你用了之后到底会发生什么——没人说。
所以我决定自己扒一遍源码,写一个系列文章,把 gstack 里的每个 skill 都拆开给你看。
这是第一篇,先讲清楚:gstack 到底是个什么东西。
Garry Tan 是谁,为什么他来做这个
Garry Tan 是 Y Combinator 的现任 CEO。YC 是硅谷最知名的创业孵化器,投出过 Airbnb、Stripe、Dropbox 等一大批公司。
他本人是工程师出身,之前做过设计师和程序员,后来转型做投资人。按他自己的说法,他在全职管理 YC 期间,用 gstack + Claude Code 在 60 天内写了 60 万行生产代码。
这个数字你信不信另说,但至少说明一件事:他确实在大量使用 Claude Code,而且对怎么用它有自己的方法论。 gstack 就是这套方法论的产物。
揭秘:gstack 的本质是什么
说穿了很简单——gstack 就是一套精心编写的 prompt 模板。
没有魔法,没有黑科技,没有什么特殊的 AI 调用。它做的事情就是:当你在 Claude Code 里输入 /plan-ceo-review 这样的命令时,系统会加载一大段预写好的 prompt,告诉 Claude 应该扮演什么角色、按什么流程思考、输出什么格式的结果。
你可以把它理解成一个高级版的 prompt 库,只不过它:
- 和 Claude Code 深度集成 — 不是简单的文本模板,而是利用了 Claude Code 的 skill 系统,可以调用文件读取、代码搜索、终端命令等工具
- 有流程控制 — 不是一次性丢给 AI 一大段话,而是分步骤执行,每一步都会停下来和你确认
- skill 之间有依赖关系 — 比如
plan-ceo-review可以在中途调用office-hours这个 skill
但归根结底,核心就是 prompt engineering。 用结构化的方式告诉 AI 该怎么思考。
28 个 Skill 都有什么
gstack 把软件开发的完整流程拆成了 28 个 skill,模拟一个完整团队的角色分工:
规划阶段(想清楚要做什么)
| Skill | 模拟角色 | 干什么 |
|---|---|---|
/office-hours | 产品顾问 | 用 6 个关键问题帮你想清楚到底要做什么 |
/plan-ceo-review | CEO | 从战略层面审查方案,挑战前提假设 |
/plan-eng-review | 技术总监 | 审查架构设计和数据流 |
/plan-design-review | 设计总监 | 从设计维度审计方案 |
开发阶段(把东西做出来)
| Skill | 模拟角色 | 干什么 |
|---|---|---|
/design-consultation | 设计师 | 生成完整的设计系统 |
/review | 高级工程师 | 代码审查,找 bug 并自动修复 |
/investigate | 调试专家 | 系统化根因分析 |
/design-review | 设计 QA | 设计审计 + 原子提交修复 |
/qa | 测试负责人 | 浏览器测试 + 回归测试 |
/qa-only | 测试员 | 只报 bug 不改代码 |
发布阶段(把东西上线)
| Skill | 模拟角色 | 干什么 |
|---|---|---|
/ship | 发布经理 | 测试同步、覆盖率审计、创建 PR |
/land-and-deploy | 运维 | 合并代码、等 CI、验证生产环境 |
/canary | 监控值班 | 部署后监控错误和性能 |
/benchmark | 性能工程师 | Core Web Vitals 基准对比 |
/document-release | 文档工程师 | 自动更新文档 |
工具和安全
| Skill | 干什么 |
|---|---|
/browse | 内置无头浏览器,可以操作网页 |
/careful | 危险命令拦截 |
/freeze | 锁定文件编辑范围 |
/cso | OWASP Top 10 + 安全威胁建模 |
/codex | 调用 OpenAI 做交叉代码审查 |
还有几个辅助性的就不一一列了。
扒一个 Skill 给你看
光说”就是 prompt”你可能没有直观感受。我们打开 plan-ceo-review 这个 skill 的源码看看。
每个 skill 的核心是一个 SKILL.md.tmpl 文件(模板文件),构建时会生成最终的 SKILL.md。
先看文件头部的元数据:
---
name: plan-ceo-review
description: |
CEO/founder-mode plan review. Four modes:
SCOPE EXPANSION, SELECTIVE EXPANSION, HOLD SCOPE, SCOPE REDUCTION.
allowed-tools:
- Read
- Grep
- Glob
- Bash
- AskUserQuestion
- WebSearch
---
注意 allowed-tools——它限制了 AI 在这个 skill 里只能读代码和搜索,不能改代码。这是审查类 skill 的合理设计:审查就是审查,不要动手改。
然后是角色设定(简化版):
“You are not here to rubber-stamp this plan. You are here to make it extraordinary.”
(你不是来走过场的,你是来让这个方案变得卓越的。)
接着定义了四种审查模式:
- SCOPE EXPANSION:做梦模式,往大了想——“10 倍的投入只需要 2 倍的努力,值不值?”
- SELECTIVE EXPANSION:守住基线,但展示扩展机会让你挑选
- HOLD SCOPE:范围不变,只管把方案审到无懈可击
- SCOPE REDUCTION:外科手术式删减,砍到最小可用版本
然后是审查步骤。光 Step 0 就包含:
- Premise Challenge — 先问”这个问题本身对不对?“不急着审方案
- Existing Code Leverage — 现有代码有没有已经解决的部分?
- Dream State Mapping — 画出 “现状 → 方案 → 12个月后理想状态” 的路径
- Implementation Alternatives — 强制要求提出 2-3 种不同实现方案做对比
- Mode Selection — 让你选审查模式
之后还有 11 个审查维度:架构、错误处理、安全、数据流、代码质量、测试、性能、可观测性、部署、长期维护、UI/UX。
最厉害的是,它还内嵌了 18 条”CEO 思维模式”,引用 Bezos、Munger、Jobs 等人的决策框架,比如:
- Bezos 的单向门/双向门理论 — 大多数决策可逆,快速行动就好
- Munger 的逆向思维 — 不光问”怎么赢”,也问”什么会让我们失败”
- Jobs 的减法聚焦 — 350 个产品砍到 10 个
整个文件大约 3000 行。 就为了一个 /plan-ceo-review 命令。
你现在明白为什么我说它本质是 prompt engineering 了吧?它把一个资深 CEO 做方案审查时的完整思维过程,编码成了结构化的 AI 指令。
我的看法
gstack 有价值,但不是魔法。
它的价值在于:
- 知识固化 — 把”一个好的方案审查应该检查哪些维度”这种隐性知识变成了显性的 checklist。你可能知道要看安全性,但你会忘记检查”数据流的四条路径(正常/nil/空/错误)“这种细节。
- 流程纪律 — 强制 AI 按步骤来,不跳过不偷懒。比如每发现一个问题就停下来问你,而不是一次性丢一堆建议。
- 角色扮演 — 通过精心设计的 prompt 让 AI 进入特定”角色”,输出质量确实比你随便问一句要好。
但你需要知道它不是什么:
- 不是 AI 能力的提升 — Claude 还是那个 Claude,gstack 只是告诉它该怎么思考
- 不适合所有项目 — 28 个 skill 是为有一定复杂度的软件项目设计的。如果你只是写个脚本或者维护个博客,这套东西太重了
- 不是装了就会用 — 你需要理解每个 skill 的设计意图,才能在正确的时机使用正确的 skill
最关键的一点:如果你本身就知道怎么跟 AI 沟通,很多 skill 的效果你可以用自然语言达到。 gstack 解决的核心问题是”我不知道该问 AI 什么问题”,如果你已经知道了,它就是个方便的快捷方式而已。
这个系列接下来会写什么
后续文章会逐个拆解 gstack 的每个 skill,看看它们的 prompt 到底写了什么,设计思路是什么,有没有值得学习的地方。
下一篇我们先从 /office-hours 开始——这是 gstack 推荐你最先使用的 skill,也是整个流程的起点。
如果你觉得这个系列有价值,欢迎关注后续更新。