vibe coding这件被聊烂了的事。最近还能看到很多的讨论,有点从褒义转向只会vibe,贬义的意思了,但这大部分讨论都停在表面,没人认真聊聊什么东西反而变稀缺了。
2025年初,Andrej Karpathy在推文里造了一个词:vibe coding。他描述的是一种状态,完全顺着感觉走,把代码全权交给AI,甚至忘记代码这个东西存在。
这个词迅速出圈了。因为它说中了某种真实在发生的事。
一年后,却用了新名字 agentic engineering 代替,为什么?
先说说这件事已经走到哪里了。
Snap在今年四月裁了1000人,16%的员工,一次。CEO对外的理由是:65%的代码现在是AI写的,小团队用AI能做以前大团队的事。裁员公告发出去,股价涨了11%。
YC最新一批创业公司,95%的代码是AI生成的。App Store今年新提交的应用量暴涨了60%。Claude Code写了GitHub上4%的公共commits,每25行代码里有1行不是人写的。连Linus Torvalds都在用,最近vibe了一个音频工具,在README里直接写:这部分基本是vibe coding写出来的。
这件事已经是主流了,不是趋势。
但另一边,翻车也是真实的。有人做了一个完全vibe出来的操作系统Vib-OS,界面挺好看,桌面上还有个Doom游戏图标——但点上去没反应,那个程序根本不存在,是AI顺手加进去的。有开发者花了6小时追一个bug,最后发现是AI在两个不同时间生成了两个名字极其相近的函数,做的是完全不同的事,互相干扰,而且没有任何人注意到。审计报告说,AI生成的代码有1.7倍于人类代码的严重问题概率,96%的开发者声称不信任AI写的代码,但是,该用还是用。
这就是Karpathy改名之前的现状。正面的数据和负面的数据同时都是真的。体感上为什么这么割裂?
老板和产品经理的视角是这样的。
V0、Bolt这类工具,几分钟生成一个带数据库、带后端服务的demo,功能跑通,界面像真的,核心流程能演示。用这个去跟客户谈,去做内部评审,够了。
MVP验证才是第一步。想法还没跑通,稳定性、并发、内存管理这些都是后面的事。能快速验证、降低试错成本,这是真实的价值,没什么好否认的。验证完才有后续,这个顺序没问题。
而且老板在他的位置上,本来就不该去深挖这些细节。他有更重要的判断要做,不可能也不应该去拍板每一个技术细节。
工程师那边,接到demo,表关联不对,查询没有索引,数据量稍微上来就慢查询。两个用户同时操作会冲突,没有处理并发。内存里有个对象在某些路径下会一直涨,没有人告诉AI这里需要管理生命周期。错误处理基本没有,接口失败了页面直接白屏。
改成能上生产的版本,相当于重写了一遍。出了问题,背锅的是工程师和运维。
这是工程师抵制vibe coding的原因,是抵制这种甩过来的结果。
但工程师自己用不用vibe coding?用。只是用法完全不同。
他会把一个大问题拆成很多个小任务,表关联的问题是一个,索引优化是一个,并发处理是一个,单独验证,单独跑。他知道哪些地方能让AI跑,哪些地方要自己判断,把AI关在一个精确的范围里工作。不是扔给AI"帮我优化这个项目",是带着AI按自己的判断一步步往前走。
两边都在用同一个工具,但关注点完全不重叠。老板只能说自己那层,工程师只能说自己那层,说的都是真话。Gap就在这中间,不是谁的错。
我做Xisper语音输入法的时候,全量vibe,两种体感都有。
作为MVP探索,半天就能让我体验到了Demo。 vibe coding让我可以快速把一个想法变成能跑的东西,验证流程,发现问题,继续迭代。这个速度是真实的,没有它我一个人做不到现在这个程度。
作为执行层的时候,才知道成本在哪里。
语音输入法有个功能:按下按键开始录音。就这一件事,里面有一串决策要拍板。建连接和开始录音,顺序执行还是并行?并行的话,连接失败了已经录进去的音频怎么处理?是否播提示音,是否静音其他声音,如果都要,先静音还是先播——顺序不同,用户听到的是两种完全不同的体验。录音超时了怎么反馈,重试几次,超出之后怎么告诉用户?如果再加上limit呢?
这些细节要一点点根,一点点磨,每一个都要拍板。AI能给你列方案,但该选哪个只有你自己知道。coding本来就很吃耐心,要带着AI一步步按你期望的方向走。不会用的人,报错了就跟AI说"还是报错"、“问题还在”,这条路走不通。
架构也是。语音识别底层我想做成可以随时换模型的结构,今天用fun-asr,明天换qwen3,上层不用动。两个模型的入参格式不同,批量发帧的方式不同,不能改公共接口,只能各自消化各自的差异。设计说清楚,AI帮实现。加第二个adapter的时候,AI改了公共的抽象层,从局部看合理,但整个结构的可替换性就没了。AI不知道那条约束为什么在那,我知道。
这就是执行层真正花时间的地方。把需求翻译成架构,把架构里的每一个边界想清楚,把每个业务流程节点上的决策拍板,把demo和生产之间所有藏着的坑挖出来。这些不是写代码,但这才是变稀缺的东西。
所以什么变稀缺了。
执行力成本在降,这是真的。但执行力本来就不是稀缺的东西。软件工程里20%的问题占了80%的时间,这个规律AI没有改变。那20%是判断力——知道要做什么、为什么这样做、出了问题往哪里看。
Karpathy把vibe coding改名,说的正是这件事:vibe是你描述要什么,接受AI给的结果;agentic engineering是你想清楚了,用AI去实现。区别不在工具,在你保留了多少判断。
Snap裁掉的是执行层,留下来的是能划定边界的人。
这个时代对有判断力的人来说是真的好时代,门槛在降,能做的事比以前多得多。但判断力这件事,AI目前还没有办法替你做。