
数据基础设施初创公司Encord已完成6000万美元新一轮融资,旨在帮助机器人、无人机和其他自主物理人工智能系统从实验室走向真实世界的生产环境。
本轮C轮融资由Wellington Management领投,新投资者Bright Pixel和Isomer Capital参与。现有投资方包括Y Combinator、CRV、N47、Crane Venture Partners和Harpoon Ventures也继续跟投,使该初创公司的融资总额达到1.1亿美元。
Encord,正式名称为Cord Technologies Inc.,是一个自动化"数据开发平台"的创造者,帮助企业准备训练物理AI模型所需的数据,这些模型为自动驾驶汽车、机器人和无人机提供动力。该软件帮助解决创建AI训练数据集的四个关键步骤,即数据管理、数据整理、模型评估和数据标注。
平台将这些任务整合到一个平台中并实现自动化。通过这种方式,它创建了一个审计轨迹,开发人员可以使用它深入研究其物理AI模型,理解它们为什么会产生特定的输出结果。反过来,这使得完善和改进模型、实现更好的结果变得更加容易。
此轮融资正值物理AI行业接近拐点之时,经过多年的密集研究开发和试点项目,全球数千台机器人和自动驾驶车辆开始上线运行。据Encord预测,未来四年内将有超过4亿台智能机器人上线,推动物理AI行业年产值超过300亿美元。
Encord将其数据基础设施定位为处理机器人和自主系统生成的复杂多模态数据流的完美平台,这些数据流由音频、视频、传感器数据、3D点云和其他信号组成。该初创公司表示,传统基础设施并非为处理这些复杂数据类型而设计。
挑战在于,与主要在公共互联网上训练的标准大语言模型不同,物理AI模型需要大量专有的真实世界数据。大部分数据来自专有来源,包括机器人遥测数据、传感器信息流和现场捕获的视频素材。此类数据集往往庞大、极其多样化且计算处理非常密集。
Encord联合创始人兼联合首席执行官Ulrik Stig Hansen表示,人们仍然过于关注模型规模,而瓶颈实际上不是模型算力,而是数据准备就绪程度。"你可以拥有世界上最先进的模型,但如果输入的数据不完整、不一致且与真实世界条件不匹配,它仍然会失败,"他说。"这就是我们要解决的问题。"
自大约18个月前的上一轮融资以来,Encord已经显著增长,其平台上的数据量从刚刚超过1PB增长到超过5PB,相当于OpenAI用于训练GPT-4的信息量的三倍。在同一时期内,该公司表示其收入飙升了10倍以上。
Encord与全球300多个物理AI团队合作,服务的客户包括丰田汽车公司的移动出行子公司Woven(开发自动驾驶汽车软件)、无人机开发商Zipline International Inc.和Skydio Inc.。这些客户使用其平台支持整个模型开发生命周期,从预训练数据生成到部署后将模型与人类反馈对齐。
Encord的另一位联合创始人兼联合首席执行官Eric Landau表示,公司将使用本轮融资资金拓展新市场并加速平台开发。"在物理AI领域获胜的公司理解其他人刚刚开始意识到的事情,"他说。"那就是模型只能和其背后的数据一样好。我们正在构建让数据可用的基础设施,不仅仅是一次性的,而是在这些系统学习和改进的过程中持续可用。"
Q&A
Q1:Encord主要做什么业务?
A:Encord是一家数据基础设施公司,创造了自动化"数据开发平台",帮助企业准备训练物理AI模型所需的数据,这些模型为自动驾驶汽车、机器人和无人机提供动力。该平台整合数据管理、数据整理、模型评估和数据标注四个关键步骤。
Q2:物理AI模型的数据处理有什么特殊挑战?
A:与主要在公共互联网上训练的标准大语言模型不同,物理AI模型需要大量专有的真实世界数据,包括机器人遥测数据、传感器信息流和现场视频素材。这些数据往往庞大、极其多样化且计算处理非常密集,传统基础设施并非为处理这些复杂的多模态数据类型而设计。
Q3:Encord的发展前景如何?
A:根据Encord预测,未来四年内将有超过4亿台智能机器人上线,推动物理AI行业年产值超过300亿美元。自18个月前的上一轮融资以来,Encord平台数据量从1PB增长到超过5PB,收入飙升10倍以上,目前与全球300多个物理AI团队合作。