- FAIR plus機器人全產業鏈接會
- 2025智能機器人關鍵技術大會
- 第六屆中國機器人學術年會
- 中國機器人峰會暨智能經濟人才峰會
- 全國人工智能與機器人關鍵技術大會
- 世界機器人大會
- 2023中國(太原)人工智能大會主題展覽
- 2025科技創變者大會
9月5日,由智友·雅瑞 科創平臺主辦的“2025科技創變者大會”在北京成功舉辦。在圓桌對話環節,主持人智友·雅瑞 科創平臺投資合伙人王晶與星源智創始人兼CEO劉東、INDEMIND聯合創始人兼CTO閆東坤、知行機器人創始人兼CEO白國超、悟通感控創始人兼CEO陳立洋共同探討具身智能臨界點的算力、數據與商業化的三重博弈。
圖注:智友·雅瑞 科創平臺投資合伙人 王晶
王晶:數據是具身智能發展離不開的一個重要議題,因為它是具身智能從實驗室走向規模化落地的重要引擎,它決定的泛化和穩健性的上限,算力又決定訓練的效率和端側的實時性,但是當前具身智能海量數據場景中,現實中有很多“臟數據”“小數據”,各位嘉賓是如何看待具身智能發展中的數據問題?
圖注:星源智創始人兼CEO 劉東
劉東分享了星源智收集數據的做法和經驗。他介紹說,公司孵化于北京智源人工智能研究院,研究院承接具身數據訓練場的一些項目,因此公司投入了大量的資源去采集一些真機數據,這些數據在完成AI自動化標注后,質檢人員和人工也會將數據中的小數據、臟數據、不合格數據剔除。在這些高質量人工采集的數據基礎上,團隊將數據擴增——將這些高質量真機數據放到仿真環境去調節變量,以生成和擴增用來訓練具身大腦模型的數據。真機采集的數據若有1,擴增數據可以達到10,幫助團隊迅速完成數據增量工作。在此基礎上,團隊也會采用純仿真和互聯網數據去訓練抓取等操作任務;他認為,在真機數據、擴增數據以及純仿真和互聯網數據這三種數據融合之下,訓練出泛化性比較強的跨本體的具身大腦。
圖注:INDEMIND聯合創始人兼CTO 閆東坤
閆東坤介紹了所在的INEDMIND公司數據積累進展情況:自公司2021年商用機器人落地以來,產品已在全球幾十個國家運行超300萬小時,依托量產機器人獲取海量數據(可復用至家用場景),目前已脫離 “依賴仿真數據+外采數據” 的階段,進入 “量產數據為主、仿真數據為輔” 的新階段,這些海量數據未來也可以在家庭場景中復用。不過,他也提出公司產品所采集的數據都來自家庭、商業、超市等非標場景,具有“非標化、動態化”特征,例如數據經常會受不同光線、空間布局影響,易產生臟數據、小數據問題。為解決上述問題,目前公司正在聯合合作客戶在保障信息安全的前提下,基于量產機器采集真實場景數據,以此為基礎訓練AI模型;同時,也在基于真實數據搭建仿真平臺,通過平臺自動化生成極端場景數據,解決(Carol Case)相關的數據缺口問題。
圖注:知行機器人創始人兼CEO 白國超
白國超圍繞機器人靈巧手及末端執行器相關的數據問題進行了觀點闡述。他認為,機器人靈巧手和末端執行器是與環境、物品直接接觸的關鍵部件,在抓取過程中會產生大量數據,主動采集這些數據對企業非常重要。當前,不同場景下的數據特點與處理是不同的。在工業場景中,數據確定性強,抓取物品的品類、數量等相對固定,公司會提前采集數據并預訓練,以提升執行成功率與可靠性;目前,航空領域及其他制造業愈發重視數據,公司已經積累大量航空零部件相關數據——一部分由企業自行采集,一部分來自客戶的脫敏數據;公司與客戶共同開發數據,形成共享資源的同時,會保障客戶工廠的數據安全與隱私。他認為,數據問題已經航空工業場景中的技術壁壘,它包含核心的工業現場工藝流程數據、工藝操作數據。
圖注:悟通感控創始人兼CEO 陳立洋
陳立洋認為,傳感器是具身智能重要的數據源,承擔著采集數據的重要任務,因此產品穩定性與一致性對數據采集工作十分重要。在時間一致性方面,傳感器需長期穩定工作,避免因使用時長導致數據偏差,例如血壓計需每1~2年校準以保證基線準確,進而確保數據可靠。在批次一致性方面,受材料學、物理量產特性影響(如芯片分I3/I5/I7),傳感器易存在批次差異,需通過工藝優化控制,確保不同批次產品數據來源一致,提升下游產業應用穩定性,同時行業內會傳遞自動或非自動標定方法輔助解決該問題。
他也指出了當前觸覺傳感行業的核心痛點,即觸覺傳感行業成熟度較低,存在材料性能短板——金屬疲勞、材料蠕變問題未妥善解決,導致傳感器在過載、長時間高壓加載下易出現數據漂移;同時,傳感器還須具備抗干擾的魯棒性,例如在受到意外沖擊后仍能恢復基線、正常工作。這些問題使得看似科研簡單的電子皮膚、足底壓力傳感等產品難以實現量產落地。他認為,提供更穩定的傳感器產品是保證具身智能的高質量數據采集的重點。當前觸覺傳感的量產落地還有一些問題亟須解決,例如工業基礎能力需要進一步提升,工藝層面的基本功需攻克,傳感器穩定性、一致性、抗漂移、抗蠕變及魯棒性問題也需要重點解決。