AI编码工具推高代码产出 业界质疑“代币最大化”生产力含金量

richlovec 1500_400 (1)
 

有一句在管理学领域广为流传的说法是:只有被衡量的事情才会被重视,组织也往往会在这些被衡量的指标上获得更多“成果”。在软件工程领域,围绕“如何衡量生产力”的争论已持续数十年,从早期以代码行数为核心的粗放指标,到如今在 AI 编码代理推动下代码量创出新高,管理者面临的新问题是:究竟该看什么,才能真实反映生产效率。

在这一背景下,“代币预算”正在硅谷部分开发团队中成为一种新的“荣誉象征”。所谓代币预算,本质上是开发者被授权使用的 AI 计算资源额度。然而,以投入的计算资源(代币消耗)来衡量开发者生产力,被不少业内人士视为一种异乎寻常的做法:它更接近对过程投入的统计,而非对产出质量和价值的衡量。如果目标是推动更多 AI 工具的采用或增加代币使用量,这一指标或许有其意义,但若目标是提升效率,其参考价值则相当有限。

近期,一批专注“开发者生产力洞察”的新兴公司开始给出更系统的数据。它们普遍发现,使用 Claude Code、Cursor、Codex 等 AI 编码工具的开发者,提交并被团队接受的代码数量明显上升。但与此同时,工程师在随后的数周内不得不频繁回头修改这些已被接受的代码,从而削弱了表面上看似可观的生产力提升。

成立于 2017 年、专注开发者分析的 Waydev 正在尝试为这一现象建立一套“智能追踪层”。该公司 CEO 兼创始人 Alex Circei 表示,其平台目前服务约 50 家客户,覆盖超过 10,000 名软件工程师。他介绍,许多工程管理者看到的,是 AI 生成代码在初次审查时的“接受率”高达 80% 至 90%——即开发者批准并保留的比例。但如果将后续几周内的修改和回滚计算在内,实际真正“沉淀下来”的生成代码比例会大幅缩水,仅约为 10% 至 30%。

AI 编码工具的快速普及,也推动 Waydev 在过去六个月对其平台进行重构,以适应“快速编码”工具的激增。该公司近期推出的新功能,可以追踪 AI 代理生成代码的相关元数据,并对代码质量和成本进行分析,帮助工程管理者更细致地了解团队对 AI 工具的采用情况及其效果。

除 Waydev 外,其他工程分析公司也在发布类似结论。GitClear 在今年 1 月发布的一份报告中指出,AI 工具确实在一定程度上提升了开发者生产力,但其数据同时显示,“常规 AI 用户的代码变动率是非 AI 用户的 9.4 倍”。报告称,这一变动率的增幅超过了工具带来的生产力提升幅度。

工程分析平台 Faros AI 则基于两年客户数据,在 2026 年 3 月发布报告称,在高强度采用 AI 工具的环境下,代码变动率(删除代码行数与新增代码行数之比)上升了 861%。

另一家自称为 AI 集成工程智能平台的 Jellyfish,在 2026 年第一季度收集了 7,548 名工程师的数据。该公司发现,代币预算最高的工程师往往产生了最多的拉取请求(对共享代码库的变更提议),但其生产力提升并未与代币投入成正比。相关数据表明,这些工程师以 10 倍的代币成本,仅换来约 2 倍的产出。Jellyfish据此认为,这类工具目前更显著地放大了“数量”,而非“价值”。

从行业整体数据来看,一个相对一致的图景正在形成:代码总量显著增加,但其中相当一部分并未真正被长期采纳或稳定保留。多家分析公司也指出,大型组织仍在探索如何更高效地使用 AI 编码工具。大型企业开始通过并购等方式加快布局。Atlassian 去年以 10 亿美元收购工程智能初创公司 DX,目的之一就是帮助客户更好理解编码代理的投资回报情况。

在开发者层面,这些统计结果与一线体验也有一定契合度。部分工程师反映,在享受新工具带来更高自由度的同时,代码审查压力和技术债务正在累积。一个被多方提及的现象是,资深工程师与初级工程师在使用 AI 生成代码上的差异:后者往往更大比例地直接接受生成结果,随后需要投入更多时间进行重写和修正。

尽管如此,开发者普遍并未计划在短期内放弃这些工具,而是试图更好理解各类 AI 代理在实际工作流程中的具体作用和边界。Circei 在接受 TechCrunch 采访时表示:“这是软件开发的新纪元,公司必须适应,也被迫适应。这不会是一个会过去的周期。”


分享:


发表评论

登录后才可评论。 去登录