从“作坊式”到“工厂式”:自动驾驶企业描绘AI生产方式转型

richlovec 1500_400 (1)
 

2025年第三季度,自动驾驶卡车企业 Bot Auto 宣布,其卡车在高速公路上完成了首次“无人驾驶”行驶:车辆在无人工干预的情况下自主行驶,且车内没有任何人员。公司称,这一成果是目前少数自动驾驶卡车项目才达到的里程碑。

Bot Auto 同时披露,从公司成立到实现这一里程碑,用于人工智能训练数据人工标注的累计支出为 212,552 美元。该项支出主要用于请人工在图像中为车辆、行人等目标绘制边框,以便神经网络进行学习。

公司表示,在当前行业普遍认知中,这一数字容易引发质疑:外界可能会怀疑是否存在未计入的成本、未披露的项目,或其他未公开的操作方式。原因在于,在人工智能应用,尤其是自动驾驶领域,数据标注通常是一项重要成本。

以自动驾驶领域广泛使用的数据集 nuScenes 为例,其总计仅包含约 5.5 小时的驾驶数据。公开信息显示,人工标注人员需要逐帧识别并精确标注场景中的每一辆车、每一名行人及其他物体,这一过程 reportedly 耗时 7,937 小时,成本约 10 万美元。

Bot Auto 认为,外界关注的“缺口”并不在账目本身,而在于对生产方式的假设。公司提出,当前人工智能行业正在经历一场从“人工标注驱动”向“算力驱动”的转变:过去依赖人工添加标签的数据驱动阶段,正在被通过计算大规模生成监督信号的阶段所取代。

从“作坊模式”到“工厂模式”

公司将过去十年人工智能应用,尤其是自动驾驶项目的运作方式,比作“作坊模式”。在这种模式下,系统能力的提升高度依赖人力:企业需要雇佣大量标注人员处理数据、标记边缘案例,并围绕人工劳动搭建完整流程。原始数据并不稀缺,真正稀缺的是带标签的信号,人力成为机器学习持续推进的核心资源。

与之相对,公司提出了“工厂模式”的概念。其描述称,在工业革命中,蒸汽动力取代人力,随后电力又取代蒸汽;在人工智能领域,“工厂模式”的企业则通过算力替代大规模人工标注,将计算本身作为生成监督信号的主要来源。

在这一模式下,人类角色并未消失,而是从具体的“画框”操作转向系统验证和质量控制。公司认为,这一变化的关键在于:带标签的信号不再被视为稀缺资源,智能系统的能力上限因此被抬升。

Bot Auto 指出,这一转变并非简单依赖于采购更多 GPU,而是形成了一种新的工业化能力。公司称,直到近几年,计算机才开始有可能在大规模上接管部分原本由人工完成的标注工作,而不仅仅是辅助工具。其提到,Meta 推出的 Segment Anything 等模型,被视为首次在大规模上展示这一方向可行性的案例。不过,公司同时表示,目前真正能够在实践中大规模运用这一能力并产生实际影响的企业仍然有限。

大模型与自博弈系统的相似路径

Bot Auto 将这一“工厂模式”的转变,与大规模语言模型和围棋人工智能的发展路径进行了类比。

公司指出,围绕 ChatGPT 的讨论多集中在其应用层面,例如写作、编程或控制家用设备等。但在其看来,更关键的变化在于训练方式:模型并非依赖人工为其阅读的全部内容添加标签,而是通过在互联网规模的文本上进行自监督学习,通过预测下一个词来获取训练信号。一旦不再受限于人工标注规模,模型规模便可以持续扩展,直至受到算力约束,从而带来能力的跃升。

在围棋领域,公司提到,AlphaGo 主要依赖人类棋谱进行学习,而 AlphaZero 则仅基于规则,通过自我对弈生成经验数据,不再依赖有限的人类对局样本。公司认为,当学习过程不再受限于人类示例的数量时,系统能力的上限被显著提高,新一代系统不仅在性能上超越旧模式,也使旧模式显得过时。

关注“带标签信号”的来源

Bot Auto 引用物理学家理查德·费曼的表述称,“对于一项成功的技术,现实必须优先于公关,因为自然无法被愚弄”。公司认为,在人工智能领域,这一观点可被用作检验企业技术路径的标准。

在公司看来,当前市场上大量企业在对外宣传中强调自身“原生人工智能”或“面向未来”的定位,但这些表述并不能直接反映其内部技术和生产流程。公司提出,一个值得向所有人工智能企业提出的核心问题是:其带标签的训练信号主要来源于何处。

公司表示,如果主要依赖大规模外包标注服务,说明其仍处于“作坊模式”;如果监督信号主要由计算在大规模上自动生成,则更接近“工厂模式”。在 Bot Auto 的表述中,这两种模式之间的差异并非细节问题,而是决定整个技术与生产体系形态的关键。

文末署名显示,相关观点来自 Bot Auto 创始人兼首席执行官侯晓迪。


分享:


发表评论

登录后才可评论。 去登录