给机器人提供用来训练的可交互数据一直是世界级难题,也是未来具身智能工作的重点之一,针对传统端到端具身操作的数据瓶颈,真机数据已成为具身智能时代的“石油”,是推动机器人泛化能力突破与规模化落地的核心资源。
11月21日,睿尔曼正式宣布开源全球首个高质量、模态数量最多的真机数据集,旨在突破机器人研发中的数据壁垒,为全球学术界与工业界提供关键数据支撑,助力智能机器人算法的创新与产业化落地。此次开源的数据全部基于北京人形机器人数据训练中心的十大真实场景,以“高质量”与“多模态”两大特点,精准应对当前真机数据不足、模态不完整的行业痛点。
项目主页:https://realmanrobot.github.io/real_source_dataset
数据基座:十大应用场景锻造高质量真机数据集
睿尔曼此次开源的真机数据均来源于人形机器人数据训练中心,中心占地3000平方米,创新性地划分为“九年一贯制”训练区和“机器人大学”场景区。训练区专注于机器人基础抓拿取放能力的高效、批量训练,为算法模型打下坚实根基;场景区则精准复现了包括家庭康养、智能生活、农业采摘、新零售、汽车装配、新餐饮等十大核心场景。
其中智能生活区还原真实家居场景,包括客厅、卧室、卫生间、厨房等核心空间,可以实现机器人开关冰箱门、叠衣服、清洁卫生间等任务。工业场景模拟工厂流水线,可以实现物料分拣、包装打包、物流搬运等。能够真正做到数据采集并非在理想的“实验室温室”中进行,而是直面现实世界的复杂性与多样性,能够有效保证数据集的高保真度、强实用性及卓越的泛化能力。
数据集在多模态数据质量方面展现出全面优势,其模态完整性达到100%,确保了数据的全面与完备。同时,数据抗噪声评分达到78%,数据平滑性评分超过优秀线达到82.1%,有效保障了数据的低波动性与高稳定性。综合核心维度的评估显示,睿尔曼此次开源的数据集在数据的完整性、稳定性等关键指标上均表现均衡且出色,构筑了其坚实、可靠的高质量数据基础。
本次开源的数据集由睿尔曼全资子公司睿源机器人(RealSource)发布,作为全球具身智能真机数据服务的引领者,睿源机器人始终以“让真机数据照亮人工智能,走进物理世界的最后一公里”为使命,以“构建全球真机数据生态,赋能千行百业智能跃迁”为愿景,依托自研数采机器人本体和场景化数据采集技术为各行业提供高质量真机数据解决方案。致力于打造一个开放、共享、创新的真机数据平台,促进高质量数据的流通与融合,推动各行业在智能化进程中实现跨越发展。
技术基座:六大核心优势定义多模态数据集新标准
睿尔曼此次发布的数据集涵盖机器人感知、决策、执行的全链路多模态数据,该数据集集成了包括但不限于图像数据、关节位置、关节速度、末端六维力、末端位姿、动作指令、时间戳、相机参数等多种传感模态。以六大核心技术优势,定义多模态数据集标准:
通过硬件级同步信号,为所有视觉传感器建立了一个全局统一的精确时钟源,对每一帧数据进行精确的时间硬同步和打戳。确保在任一时刻,所有模态的数据都处于同一真实的物理时空坐标系下,确保跨模态数据的一致性和准确性。
设定了低于0.5% 的严苛丢帧率标准,并通过优化的数据传输流水线与缓存机制,确保了从采集、传输到存储的全流程稳定。即使在高速运动或大规模数据写入的场景下,也能维持数据的无缝衔接。
系统以高频率,实时采样并记录全关节的角度、速度、加速度等状态数据。不仅实现了对机器人运动状态的毫秒级洞察,更支持实时的高精度关节速度控制,确保动作平滑、精准。
每一台出厂的数据采集机器人都经过了严格的出厂级标定,并提供完整的相机标定参数,用户获取数据后,无需进行任何额外的标定工作,即可直接投入算法开发与模型训练。
超越简单的任务演示,针对同一核心任务,系统性地在物体材质/形状/尺寸、环境光照/布局、操作轨迹与视角等多样化变量下,执行海量重复采集。这种“同一任务,万般变化”的设计,旨在将现实世界的复杂性与不确定性内嵌于数据集之中。
采用外骨骼式高精度遥操作设备,其同构于数据采集机器人的机械臂,实现了1:1高度还原人类操作员的全身运动意图与决策过程,从根源上避免了计算误差与延迟。
产品基座:高性能采集平台保障数据质量与采集效率
睿尔曼机械臂设计对标成年男性胳膊的长短、粗细、灵活度及负载能力,力求在外观与性能上实现与人、工作、生活环境的友好共融,达成“人能干,它能干”的效果。单臂(全臂展)额定负载5公斤,最大负载可达9公斤,TCP线速度1.8m/s。
睿尔曼自成立以来始终以技术创新为核心驱动力,从“一体化关节的超轻量”,延展至“机械臂的超轻量”,最终实现“机器人本体的超轻量”,能够做到综合功耗小于100w,并大幅降低制造成本,使高性能机械臂具备普及基础,并已通过了CR L3级别认证,无故障运行时间(MTBF)已达到5万小时,能完成开关冰箱门、洗衣机门等真实生活任务,展现了具身智能迈向更高级别自主性与适应性的未来趋势。
本次开源数据集采用的本体来自睿源机器人专为数据采集而设计的高性能智能机器人RS-01、RS-02、RS-03,三款机器人面部与腕部均搭载大FOV相机(水平90°/垂直65°),并结合全域时空硬同步技术,实现精准协同作业,成为集视觉、力控、灵活机械臂与自主移动能力的高性能采集平台,适用于工业自动化、家居服务、科研实验等多种复杂场景。
强劲灵活:它能轻松承载5公斤重物自如作业,自重却控制得很好,兼具力量与灵活性。
敏锐精准:全身20个自由度结合多模态视觉与空间导航系统,让它能精准感知环境、自主移动并完成复杂任务。
手巧力控:末端配备高精度六维力传感器,可灵活更换从夹爪到五指灵巧手等多种“手型”,无论是精密装配还是复杂抓取都应对自如。
看得准:头部RGB & 深度相机让它能准确识别物体并测量距离,轻松应对场景感知需求。
能干活:双臂各7个关节自由度,能灵活执行复杂动作轨迹;单臂高达9公斤的负载能力,让它能稳定抓持重型工件。
感知全面:末端六维力传感器实时感知力度变化,确保操作精准;顶部鱼眼相机提供大范围环境监控,作业更安全。
视觉增强,洞察入微:在RS-02基础上,强化了双目视觉系统,近距离观察与操作更为精细精准。
力控灵敏,收放自如:同样具备9公斤单臂负载与末端力控感知,能完成高要求的抓取、握持等力控作业。
视觉增强,数据为本:在RS-02基础上,升级为仿人眼布局的双目视觉系统。其核心目的在于为具身智能研究提供更接近人类立体视觉的高质量感知数据,为算法模型训练打下坚实基础。
数据采集设备支持“真机遥操、动捕、VR”等多种主流技术采集方式,丰富的数据采集感知的周边可以选配,包括触觉、力觉、导航等。外骨骼遥操作设备采用同构设计,使主从机械臂及夹爪的结构完全一致,从而建立起高度直接的映射关系——操作者的动作能够以相同的关节角度实时映射到从臂,无需经过复杂的逆向运动学(IK)解算。
在计算层面,系统由于大幅简化了运动学与动力学求解过程,显著提升了控制运算效率,无需依赖SoC等高性能计算单元即可达成高响应频率,系统延迟可被稳定控制在10毫秒以内,保证了操作的实时性与流畅性。
此外,这种“所见即所动”的直观操作方式,使得操作者的动作与机器人动作完全同步,不仅增强了使用过程中的临场感和操控直观性,也大幅降低了培训成本与学习门槛,进一步拓展了其应用易用性与普及潜力。
此次睿尔曼开源全球首个高质量、多模态真机数据集,其核心价值在于以开放共享的姿态,打破数据壁垒,为全球机器人技术发展注入关键动力。未来,睿尔曼将持续迭代并开源更多高质量数据集,构建一个覆盖更广、维度更丰富的机器人开源生态矩阵,全力打造一个贯通技术研发与产业落地的赋能平台,与全球开发者及合作伙伴形成紧密的创新循环,为推动机器人技术普惠深化、开启人机协作新篇章奠定数据基石。