写代码越来越便宜，什么在变稀缺

vibe coding这件被聊烂了的事。最近还能看到很多的讨论，有点从褒义转向只会vibe，贬义的意思了，但这大部分讨论都停在表面，没人认真聊聊什么东西反而变稀缺了。

2025年初，Andrej Karpathy在推文里造了一个词：vibe coding。他描述的是一种状态，完全顺着感觉走，把代码全权交给AI，甚至忘记代码这个东西存在。

这个词迅速出圈了。因为它说中了某种真实在发生的事。

一年后，却用了新名字 agentic engineering 代替，为什么？

先说说这件事已经走到哪里了。

Snap在今年四月裁了1000人，16%的员工，一次。CEO对外的理由是：65%的代码现在是AI写的，小团队用AI能做以前大团队的事。裁员公告发出去，股价涨了11%。

YC最新一批创业公司，95%的代码是AI生成的。App Store今年新提交的应用量暴涨了60%。Claude Code写了GitHub上4%的公共commits，每25行代码里有1行不是人写的。连Linus Torvalds都在用，最近vibe了一个音频工具，在README里直接写：这部分基本是vibe coding写出来的。

这件事已经是主流了，不是趋势。

但另一边，翻车也是真实的。有人做了一个完全vibe出来的操作系统Vib-OS，界面挺好看，桌面上还有个Doom游戏图标——但点上去没反应，那个程序根本不存在，是AI顺手加进去的。有开发者花了6小时追一个bug，最后发现是AI在两个不同时间生成了两个名字极其相近的函数，做的是完全不同的事，互相干扰，而且没有任何人注意到。审计报告说，AI生成的代码有1.7倍于人类代码的严重问题概率，96%的开发者声称不信任AI写的代码，但是，该用还是用。

这就是Karpathy改名之前的现状。正面的数据和负面的数据同时都是真的。体感上为什么这么割裂？

老板和产品经理的视角是这样的。

V0、Bolt这类工具，几分钟生成一个带数据库、带后端服务的demo，功能跑通，界面像真的，核心流程能演示。用这个去跟客户谈，去做内部评审，够了。

MVP验证才是第一步。想法还没跑通，稳定性、并发、内存管理这些都是后面的事。能快速验证、降低试错成本，这是真实的价值，没什么好否认的。验证完才有后续，这个顺序没问题。

而且老板在他的位置上，本来就不该去深挖这些细节。他有更重要的判断要做，不可能也不应该去拍板每一个技术细节。

工程师那边，接到demo，表关联不对，查询没有索引，数据量稍微上来就慢查询。两个用户同时操作会冲突，没有处理并发。内存里有个对象在某些路径下会一直涨，没有人告诉AI这里需要管理生命周期。错误处理基本没有，接口失败了页面直接白屏。

改成能上生产的版本，相当于重写了一遍。出了问题，背锅的是工程师和运维。

这是工程师抵制vibe coding的原因，是抵制这种甩过来的结果。

但工程师自己用不用vibe coding？用。只是用法完全不同。

他会把一个大问题拆成很多个小任务，表关联的问题是一个，索引优化是一个，并发处理是一个，单独验证，单独跑。他知道哪些地方能让AI跑，哪些地方要自己判断，把AI关在一个精确的范围里工作。不是扔给AI"帮我优化这个项目"，是带着AI按自己的判断一步步往前走。

两边都在用同一个工具，但关注点完全不重叠。老板只能说自己那层，工程师只能说自己那层，说的都是真话。Gap就在这中间，不是谁的错。

我做Xisper语音输入法的时候，全量vibe，两种体感都有。

作为MVP探索，半天就能让我体验到了Demo。 vibe coding让我可以快速把一个想法变成能跑的东西，验证流程，发现问题，继续迭代。这个速度是真实的，没有它我一个人做不到现在这个程度。

作为执行层的时候，才知道成本在哪里。

语音输入法有个功能：按下按键开始录音。就这一件事，里面有一串决策要拍板。建连接和开始录音，顺序执行还是并行？并行的话，连接失败了已经录进去的音频怎么处理？是否播提示音，是否静音其他声音，如果都要，先静音还是先播——顺序不同，用户听到的是两种完全不同的体验。录音超时了怎么反馈，重试几次，超出之后怎么告诉用户？如果再加上limit呢？

这些细节要一点点根，一点点磨，每一个都要拍板。AI能给你列方案，但该选哪个只有你自己知道。coding本来就很吃耐心，要带着AI一步步按你期望的方向走。不会用的人，报错了就跟AI说"还是报错"、“问题还在”，这条路走不通。

架构也是。语音识别底层我想做成可以随时换模型的结构，今天用fun-asr，明天换qwen3，上层不用动。两个模型的入参格式不同，批量发帧的方式不同，不能改公共接口，只能各自消化各自的差异。设计说清楚，AI帮实现。加第二个adapter的时候，AI改了公共的抽象层，从局部看合理，但整个结构的可替换性就没了。AI不知道那条约束为什么在那，我知道。

这就是执行层真正花时间的地方。把需求翻译成架构，把架构里的每一个边界想清楚，把每个业务流程节点上的决策拍板，把demo和生产之间所有藏着的坑挖出来。这些不是写代码，但这才是变稀缺的东西。

所以什么变稀缺了。

执行力成本在降，这是真的。但执行力本来就不是稀缺的东西。软件工程里20%的问题占了80%的时间，这个规律AI没有改变。那20%是判断力——知道要做什么、为什么这样做、出了问题往哪里看。

Karpathy把vibe coding改名，说的正是这件事：vibe是你描述要什么，接受AI给的结果；agentic engineering是你想清楚了，用AI去实现。区别不在工具，在你保留了多少判断。

Snap裁掉的是执行层，留下来的是能划定边界的人。

这个时代对有判断力的人来说是真的好时代，门槛在降，能做的事比以前多得多。但判断力这件事，AI目前还没有办法替你做。