2025-03-12
3月5日上午,十四届全国人大三次会议开幕,国务院政府工作报告中,“具身智能” 首次被提及,明确提出要培育生具身智能、6G等未来产业。这一举措为具身智能的发展注入了强大的政策动力,预示着具身智能将从理论研究迈向更广阔的产业化、规模化发展阶段。
公司充分发挥自身技术优势与创新能力,积极融入国家战略布局与北京等地方发展规划,在具身智能领域持续深耕,努力构建具身智能通用AI Agent,推动具身智能技术从实验室走向实际应用,助力产业升级。
迈入工业应用的关键技术
目前AI集中在内容、创作、客服、编程等桌面应用,在工业领域应用较少,原因在于工业场景是3D空间,而目前绝大部分大模型为语言、图形、视频等2D模型,在工业场景应用时存在空间计算鸿沟。
具身智能将AI深度嵌入3D物理环境,在理解真实世界方面具备更全面的感知、理解、交互与决策能力,重新定义人、机器与真实世界、虚拟世界之间的关系,拥有更强的泛化能力和涌现特性,极大地拓展了AI认知世界的深度与广度,使其能够做出更为科学、合理且适应性强的决策。
人形机器人是具身智能的关键载体
近一段时间,以VLA(视觉-语言-行为)等为代表的具身智能大模型技术开始与人形机器人本体融合、进化,让人形机器人大脑、小脑加速进化,让人形机器人更加聪明,成为具生智能的关键载体,这是一场从“机械躯壳”到“数字生命”的进化革命,让门槛大幅降低、场景快速增多。
基于大模型的模仿学习技术让人形机器人通过观察和模仿人类的行为,直接从人类的示范中学习动作和技能,快速掌握一些复杂的操作,省去了过往复杂且耗时的编程工作。下一步,基于海量3D数据,通过世界模型+具身智能,机器人可以创建对世界运作方式的内部表征,并具备行动后果的推理能力,从而显著提升对真实世界的感知、推理、执行与预测能力,使机器人认识和理解3D世界,并能够像人类一样进行推理和规划,不仅可以适应复杂多变的环境和任务需求,更为重要的是,具备自主决策、行动与操作能力,这是人形机器人从动起来,到跑起来,再到用起来的关键。
规模化发展的关键平台
目前产业共性问题是缺乏通用平台。缺乏算法(大脑、小脑)通用开发平台,多数企业都要从0到1独立研发,导致重复投入和资源分散,影响成本更影响效率。
缺乏通用3D数据平台,高质量3D数据集稀缺,3D数据采集设备未普及,3D数据获取成本高、标准化程度低,制约具身智能深度训练。缺乏通用标准认证平台,硬件接口、通信协议、数据格式等缺乏统一规范,不同厂商的机器人本体构型与软件架构互不兼容,具身智能难以跨本体,制约规模化应用。
为实现具身智能在各领域、各行业的规模化落地,天娱数科将具身智能通用AI Agent列为研发重点,以Behavision命名的AI Agent集“算法+数据+算力”三位一体,可实现空间智能MaaS平台+3D数据平台+云边端算力协同,打造通用的大脑(感认知-决策-控制一体化的具身智能大模型)+小脑(技能模型)开发平台,实现跨本体互通互用,让每家机器人本体企业即插即用,用通用AI Agent推动人形机器人和泛智能机器人产业迈入“安卓时刻”。
目前,天娱数科自研的为AI Agent提供多模态交互感知及复杂任务处理能力的天星基座大模型,以及面向3D智能领域的行业大模型“智者千问”两款大模型已通过中央网信办备案。3D数据平台已积累超百万组3D数据和50万组多模态数据,端侧算力已集成在视觉模组中。