
已往一年,以人形呆板报酬代表的具身智能于试验室中的“场景理解”与“使命计划”长进展显著,但面临真正的工业产线使命时,往往面对“想获得但抓禁绝、算患上出但跟不上”的困境。这暗地里,是持久绵亘于试验室情况与真实运用场景之间的鸿沟:人形呆板人于空间层面的器量掉准与时间层面的相应迟滞。 基在百亿参数底座模子,优必选对于其具身智能年夜模子Thinker举行了架构进级。本次进级聚焦“小参数、高机能、全开源”,旨于打造一个能为工业人形呆板人提供快速反映与精准空间感知的下一代具身智能年夜脑,以应答动态工业场景的挑战。Thinker将作为智能基座,为优必选的群脑收集及协作智能体Co-Agent提招供知与决议计划撑持,进而驱动单机自立与群体智能的协同进化。 Thinker 实现了 “小体积年夜能量” 的要害机能冲破,优必选这次将其开源,让泛博开发者可基在该基座摸索人形呆板人年夜脑的运用,一同加速具身智能技能的迭代节拍,联袂共建人形呆板人的全新将来。 当前,呆板人范畴年夜模子体现欠佳,特别于空间理解、视觉感知等要害使命上精度不足;且模子参数目遍及较年夜,难以满意呆板人对于及时性的高要求;其次,互联网上虽有海量数据,但质量乱七八糟,制约了模子经由过程Data Scaling 实现机能有用晋升。 优必选具身智能年夜模子Thinker以“小参数、高机能、全开源”冲破具身年夜脑范畴限定。近日,于涵盖10B如下具身智能年夜脑模子的权势巨子基准评测中,Thinker一举拿下9项第一,从头界说了该范畴的机能标杆。这些基准周全评估了具身智能的两年夜焦点能力:一是呆板人第一视角下的场景认知与使命计划能力,二是支撑物理交互的精准感知与空间理解能力。 该权势巨子榜单席卷了英伟达、字节跳动、北京智源和北京人形等顶尖团队近期发布的代表性模子,集中表现了具身智能行业的前沿程度。 优必选具身智能年夜模子Thinker 于9项权势巨子基准评测中排名全世界第一 (数据更新至01/30/2026,成果基在flageval, evalscope框架评测) 具身智能的焦点竞争力根植在高质量数据的支撑,但行业遍及面对原始数据噪声年夜、多模态对于齐坚苦、标注成本高、小样本泛化难等痛点。优必选以数据为焦点,构建了笼罩 精辟提纯 - 主动化标注 - 数据驱动练习” 的全链路解决方案,经由过程极致的技能优化破解行业难题,为轻量化具身年夜模子的高机能体现筑牢数据基座。 优必选具身智能年夜模子Thinker技能架构图 面临高达20B、含噪声、难对于齐、模态缺掉的原始数据,优必选构建了全流程主动化“精辟提纯”流水线。经由过程“数据筛选”与“质量评分”两步,实现从20B到10M级别高质量数据的极致提纯。 广度筛选:基在定制化法则,从视觉、语言、动作、情况等多模态数据中,快速过滤出约1%的候选数据池。 深度评分:引入年夜模子构建多维度评分模块,从质量、使命、场景等多维度举行邃密评价,终极筛选最高价值的练习数据。 针对于具身数据标注难度年夜、成本高的行业痛点,优必选搭建了“弱监视 + 自监视 + 极少量人工校验”的主动化标注系统: 焦点技能:采用“年夜模子辅助标注 + 多模子交织验证”计谋,对于视觉场景支解、动作序列分类、指令用意解析等使命实现端到端主动化标注; 人工校验机制:仅对于标注置信度低在阈值的样本举行人工复核,终极将人工介入率节制于1%如下,较传统全人工标注方案成本降低 99%,标注效率晋升超百倍; 动态迭代优化:将模子练习后的偏差反馈至标注流水线,连续优化标注算法参数,形成“标注 - 练习 - 反馈 - 迭代”的闭环,标注正确率随迭代慢慢晋升。 具身智能的焦点需求是 “于繁杂真实场景中精准交互”,而数据质量直接决议模子的情况适配与使命迁徙能力。优必选的练习范式如下三个焦点维度体系保障模子的泛化与迁徙能力: 样本多样性笼罩:基在精辟的10M高质量数据,周全笼罩具身智能四年夜焦点使命类型:使命计划, 视觉定位,空间理解,通用常识; 使命导向型采样:针对于具身智能 “感知 - 决议计划 - 履行” 闭环中的要害环节(如邃密操作、恍惚指令理解、突发场景应答),举行样本动态采样,晋升模子焦点能力; L4级标注尺度:经由过程设计邃密的4级数据标签,从使命-功效-分类-模态4个维度举行切确划分,实现对于练习数据配比的精准把控。 Thinker练习数据类型漫衍 依托具身智能年夜模子Thinker的技能积淀,优必选立异性买通数据回流机制,经由过程于工场搬运、工件分拣等真实场景中的深度部署,确保技能上风转化为落地上风,并反哺模子连续进化。包罗: 基础能力深度解析 具体拆解模子多模态理解、空间推理、使命计划等焦点能力,明确差别具身场景下的能力界限与适配阈值,为下流运用提供精准的技能参考。 精准问题定位指南 提供场景化问题诊断要领论,针对于落地中常见的指令理解误差、操作精度不足等问题,给出可直接套用的排查流程与解决方案。 实操优化全流程引导 涵盖Prompt工程邃密化优化技巧,以和SFT微调阶段的数据组织规范、差别使命类型样本比例配比建议,助力快速完成场景适配。 双向数据回流机制 收受接管下流场景中的全新数据、新兴使命需求和交互反馈,将其转化为模子可进修的练习资源,反向注入Thinker迭代历程,连续扩大模子基础能力与泛化性。以工场搬运为例,体系连续网络现实功课中的长尾案例数据,如料箱辨认掉败、抓取轨迹动态调解等。这些真实场景数据直接反哺 Thinker 模子的练习,鞭策其自立进化,不停加强基础机能与场景顺应能力。终极基在Thinker年夜模子,Walker S2可于箱体搬运、工件分拣等下流运用场景中实现 99.99% 的功课正确率。 具身智能年夜模子Thinker的运用闭环 当前,具身智能正加快渗入工业智造、商用办事等千行百业,但技能门坎与成本限定成为行业普和的要害瓶颈。优必选对峙开源同享理念,将模子权重、练习东西链与运用案例全量开放,但愿与更多开发者及企业配合拥抱具身智能的海潮。 开源代码网址: https://github.com/UBTECH-Robot/Thinker 权重链接: https://huggingface.co/UBTECH-Robotics/Thinker-4B 论文链接:https://arxiv.org/abs/2601.21199 雷峰网版权文章,未经授权禁止转载。详情见转载须知。



