gstack 拆解（一）：Y Combinator CEO Garry Tan 的 Claude Code 技能包，扒开看到底是什么

最近你一定刷到过这个东西

如果你关注 AI 编程圈，最近一定被 gstack 刷屏了。

GitHub 上 44k+ stars，各种技术博主争相推荐，评论区一片”太强了”、“改变游戏规则”、“一个人顶一个团队”。

但我翻了一圈，发现一个有意思的现象：夸它的人很多，讲清楚它到底是什么的人几乎没有。

大部分推荐文都是这个套路：先介绍 Garry Tan 的身份，然后贴一下 28 个 skill 的名字列表，最后来一句”赶紧装上试试”。至于每个 skill 里面写了什么、为什么这么设计、你用了之后到底会发生什么——没人说。

所以我决定自己扒一遍源码，写一个系列文章，把 gstack 里的每个 skill 都拆开给你看。

这是第一篇，先讲清楚：gstack 到底是个什么东西。

Garry Tan 是谁，为什么他来做这个

Garry Tan 是 Y Combinator 的现任 CEO。YC 是硅谷最知名的创业孵化器，投出过 Airbnb、Stripe、Dropbox 等一大批公司。

他本人是工程师出身，之前做过设计师和程序员，后来转型做投资人。按他自己的说法，他在全职管理 YC 期间，用 gstack + Claude Code 在 60 天内写了 60 万行生产代码。

这个数字你信不信另说，但至少说明一件事：他确实在大量使用 Claude Code，而且对怎么用它有自己的方法论。 gstack 就是这套方法论的产物。

揭秘：gstack 的本质是什么

说穿了很简单——gstack 就是一套精心编写的 prompt 模板。

没有魔法，没有黑科技，没有什么特殊的 AI 调用。它做的事情就是：当你在 Claude Code 里输入 /plan-ceo-review 这样的命令时，系统会加载一大段预写好的 prompt，告诉 Claude 应该扮演什么角色、按什么流程思考、输出什么格式的结果。

你可以把它理解成一个高级版的 prompt 库，只不过它：

和 Claude Code 深度集成 — 不是简单的文本模板，而是利用了 Claude Code 的 skill 系统，可以调用文件读取、代码搜索、终端命令等工具
有流程控制 — 不是一次性丢给 AI 一大段话，而是分步骤执行，每一步都会停下来和你确认
skill 之间有依赖关系 — 比如 plan-ceo-review 可以在中途调用 office-hours 这个 skill

但归根结底，核心就是 prompt engineering。 用结构化的方式告诉 AI 该怎么思考。

28 个 Skill 都有什么

gstack 把软件开发的完整流程拆成了 28 个 skill，模拟一个完整团队的角色分工：

规划阶段（想清楚要做什么）

Skill	模拟角色	干什么
`/office-hours`	产品顾问	用 6 个关键问题帮你想清楚到底要做什么
`/plan-ceo-review`	CEO	从战略层面审查方案，挑战前提假设
`/plan-eng-review`	技术总监	审查架构设计和数据流
`/plan-design-review`	设计总监	从设计维度审计方案

开发阶段（把东西做出来）

Skill	模拟角色	干什么
`/design-consultation`	设计师	生成完整的设计系统
`/review`	高级工程师	代码审查，找 bug 并自动修复
`/investigate`	调试专家	系统化根因分析
`/design-review`	设计 QA	设计审计 + 原子提交修复
`/qa`	测试负责人	浏览器测试 + 回归测试
`/qa-only`	测试员	只报 bug 不改代码

发布阶段（把东西上线）

Skill	模拟角色	干什么
`/ship`	发布经理	测试同步、覆盖率审计、创建 PR
`/land-and-deploy`	运维	合并代码、等 CI、验证生产环境
`/canary`	监控值班	部署后监控错误和性能
`/benchmark`	性能工程师	Core Web Vitals 基准对比
`/document-release`	文档工程师	自动更新文档

工具和安全

Skill	干什么
`/browse`	内置无头浏览器，可以操作网页
`/careful`	危险命令拦截
`/freeze`	锁定文件编辑范围
`/cso`	OWASP Top 10 + 安全威胁建模
`/codex`	调用 OpenAI 做交叉代码审查

还有几个辅助性的就不一一列了。

扒一个 Skill 给你看

光说”就是 prompt”你可能没有直观感受。我们打开 plan-ceo-review 这个 skill 的源码看看。

每个 skill 的核心是一个 SKILL.md.tmpl 文件（模板文件），构建时会生成最终的 SKILL.md。

先看文件头部的元数据：

---
name: plan-ceo-review
description: |
  CEO/founder-mode plan review. Four modes:
  SCOPE EXPANSION, SELECTIVE EXPANSION, HOLD SCOPE, SCOPE REDUCTION.
allowed-tools:
  - Read
  - Grep
  - Glob
  - Bash
  - AskUserQuestion
  - WebSearch
---

注意 allowed-tools——它限制了 AI 在这个 skill 里只能读代码和搜索，不能改代码。这是审查类 skill 的合理设计：审查就是审查，不要动手改。

然后是角色设定（简化版）：

“You are not here to rubber-stamp this plan. You are here to make it extraordinary.”

（你不是来走过场的，你是来让这个方案变得卓越的。）

接着定义了四种审查模式：

SCOPE EXPANSION：做梦模式，往大了想——“10 倍的投入只需要 2 倍的努力，值不值？”
SELECTIVE EXPANSION：守住基线，但展示扩展机会让你挑选
HOLD SCOPE：范围不变，只管把方案审到无懈可击
SCOPE REDUCTION：外科手术式删减，砍到最小可用版本

然后是审查步骤。光 Step 0 就包含：

Premise Challenge — 先问”这个问题本身对不对？“不急着审方案
Existing Code Leverage — 现有代码有没有已经解决的部分？
Dream State Mapping — 画出 “现状 → 方案 → 12个月后理想状态” 的路径
Implementation Alternatives — 强制要求提出 2-3 种不同实现方案做对比
Mode Selection — 让你选审查模式

之后还有 11 个审查维度：架构、错误处理、安全、数据流、代码质量、测试、性能、可观测性、部署、长期维护、UI/UX。

最厉害的是，它还内嵌了 18 条”CEO 思维模式”，引用 Bezos、Munger、Jobs 等人的决策框架，比如：

Bezos 的单向门/双向门理论 — 大多数决策可逆，快速行动就好
Munger 的逆向思维 — 不光问”怎么赢”，也问”什么会让我们失败”
Jobs 的减法聚焦 — 350 个产品砍到 10 个

整个文件大约 3000 行。 就为了一个 /plan-ceo-review 命令。

你现在明白为什么我说它本质是 prompt engineering 了吧？它把一个资深 CEO 做方案审查时的完整思维过程，编码成了结构化的 AI 指令。

我的看法

gstack 有价值，但不是魔法。

它的价值在于：

知识固化 — 把”一个好的方案审查应该检查哪些维度”这种隐性知识变成了显性的 checklist。你可能知道要看安全性，但你会忘记检查”数据流的四条路径（正常/nil/空/错误）“这种细节。
流程纪律 — 强制 AI 按步骤来，不跳过不偷懒。比如每发现一个问题就停下来问你，而不是一次性丢一堆建议。
角色扮演 — 通过精心设计的 prompt 让 AI 进入特定”角色”，输出质量确实比你随便问一句要好。

但你需要知道它不是什么：

不是 AI 能力的提升 — Claude 还是那个 Claude，gstack 只是告诉它该怎么思考
不适合所有项目 — 28 个 skill 是为有一定复杂度的软件项目设计的。如果你只是写个脚本或者维护个博客，这套东西太重了
不是装了就会用 — 你需要理解每个 skill 的设计意图，才能在正确的时机使用正确的 skill

最关键的一点：如果你本身就知道怎么跟 AI 沟通，很多 skill 的效果你可以用自然语言达到。 gstack 解决的核心问题是”我不知道该问 AI 什么问题”，如果你已经知道了，它就是个方便的快捷方式而已。

这个系列接下来会写什么

后续文章会逐个拆解 gstack 的每个 skill，看看它们的 prompt 到底写了什么，设计思路是什么，有没有值得学习的地方。

下一篇我们先从 /office-hours 开始——这是 gstack 推荐你最先使用的 skill，也是整个流程的起点。

如果你觉得这个系列有价值，欢迎关注后续更新。