最近看物理 AI 和具身智能,一個(gè)明顯變化是:行業(yè)注意力正在從“機(jī)器人本體有多強(qiáng)”,轉(zhuǎn)向“機(jī)器人到底在哪里訓(xùn)練”。
機(jī)器人從 Demo 走向家庭、園區(qū)、工廠和城市后,真正難的不是完成一次展示動(dòng)作,而是在真實(shí)世界里穩(wěn)定完成千百次任務(wù)。這需要足夠多、足夠真實(shí)、足夠低成本的訓(xùn)練環(huán)境。今年以來,北京、上海、長(zhǎng)三角、常州等地都在推進(jìn)具身智能訓(xùn)練場(chǎng)、數(shù)據(jù)采集基地和虛實(shí)融合訓(xùn)練平臺(tái)。訓(xùn)練場(chǎng)熱起來,本質(zhì)上是因?yàn)樾袠I(yè)開始重新認(rèn)識(shí)真實(shí)空間數(shù)據(jù)的價(jià)值。

圖源網(wǎng)絡(luò)
下一階段的機(jī)器人訓(xùn)練場(chǎng),可能不只是固定實(shí)驗(yàn)室,也不只是仿真軟件,而是由真實(shí)空間數(shù)據(jù)驅(qū)動(dòng)的數(shù)字訓(xùn)練場(chǎng)。
這也是我最近重新看如視時(shí),覺得它很有意思的原因。
很多人認(rèn)識(shí)如視,是因?yàn)?VR 看房、三維空間重建和數(shù)字孿生。過去十年,如視一直在做空間數(shù)字化:用三維重建和 AI 技術(shù),把真實(shí)空間轉(zhuǎn)化為可展示、可管理、可分析的數(shù)字資產(chǎn),也因此形成了自己的技術(shù)壁壘。
但放到物理 AI 時(shí)代看,這件事有了新的含義。
如視真正沉淀下來的,不只是三維重建能力,也不只是空間智能解決方案,而是一批來自真實(shí)世界、高質(zhì)量、可計(jì)算、可用于具身智能訓(xùn)練的空間數(shù)據(jù)。

公開信息顯示,截至 2026 年一季度,如視累計(jì)采集數(shù)字空間已突破 5800 萬,覆蓋面積超過 48 億平方米。這些空間來自真實(shí)世界,覆蓋居住空間、商業(yè)空間、城市空間、產(chǎn)業(yè)園區(qū)等多元場(chǎng)景,天然包含復(fù)雜戶型、真實(shí)尺度、遮擋關(guān)系、空間連接和大量長(zhǎng)尾環(huán)境。
在具身智能訓(xùn)練的語境下,如視數(shù)據(jù)規(guī)模的價(jià)值會(huì)被重新放大。
相比人工搭建的有限訓(xùn)練場(chǎng),如視的真實(shí)空間數(shù)據(jù)擁有更大的規(guī)模和更豐富的場(chǎng)景覆蓋;相比純合成仿真數(shù)據(jù),它又更接近真實(shí)世界本身。
更關(guān)鍵的是,如視的數(shù)據(jù)并不是簡(jiǎn)單的全景影像或空間圖片。通過激光設(shè)備采集、三維重建、語義結(jié)構(gòu)化和空間理解,這些真實(shí)空間可以轉(zhuǎn)化為具備幾何結(jié)構(gòu)、語義信息和場(chǎng)景關(guān)系的訓(xùn)練樣本。

機(jī)器人可以從中學(xué)習(xí)真實(shí)環(huán)境里的通行規(guī)則、遮擋關(guān)系、區(qū)域連接、物體分布和任務(wù)約束;進(jìn)一步看,還可以支持對(duì)單體物品材質(zhì)、接觸關(guān)系、摩擦力等物理屬性的建模,為操作、導(dǎo)航、避障和任務(wù)規(guī)劃提供更接近現(xiàn)實(shí)的訓(xùn)練基礎(chǔ)。
這也是如視切入具身智能訓(xùn)練場(chǎng)的獨(dú)特位置。
在行業(yè)里,很多訓(xùn)練場(chǎng)是從機(jī)器人本體或數(shù)據(jù)采集任務(wù)出發(fā),先搭場(chǎng)地,再組織機(jī)器人進(jìn)入場(chǎng)景采集數(shù)據(jù)。如視則是從真實(shí)空間數(shù)字化出發(fā),過去多年已經(jīng)沉淀了大規(guī)模真實(shí)三維空間數(shù)據(jù),并形成了“采集、重建、結(jié)構(gòu)化、任務(wù)生成、高保真增強(qiáng)、開放交付”的數(shù)字空間能力鏈條。
換句話說,當(dāng)行業(yè)開始意識(shí)到“真實(shí)場(chǎng)景數(shù)據(jù)”稀缺時(shí),如視手里已經(jīng)有了一張覆蓋大量真實(shí)空間的底圖。而且這張底圖不是一座不變的“固定資產(chǎn)”,而是每天都在增長(zhǎng)的“動(dòng)態(tài)數(shù)據(jù)庫”。如視每天都有數(shù)千名專業(yè)攝影師持續(xù)采集真實(shí)空間數(shù)據(jù),新的空間、新的場(chǎng)景、新的細(xì)節(jié)不斷進(jìn)入這套數(shù)據(jù)體系。
從技術(shù)路徑看,如視的價(jià)值也不止于提供靜態(tài)空間。真實(shí)空間可以被持續(xù)采集、重建和結(jié)構(gòu)化,再進(jìn)一步轉(zhuǎn)化為適合機(jī)器人訓(xùn)練、評(píng)測(cè)和迭代的數(shù)據(jù)形態(tài)。例如,基于真實(shí)空間生成具備幾何一致性的多視角操作運(yùn)動(dòng)視頻,構(gòu)建高質(zhì)量 3DGS 訓(xùn)練場(chǎng)景數(shù)據(jù),沉淀帶有空間結(jié)構(gòu)、業(yè)務(wù)語義和任務(wù)約束的訓(xùn)練樣本。
更有想象力的是,如視這些真實(shí)場(chǎng)景,經(jīng)過三維重建、語義結(jié)構(gòu)化、任務(wù)生成和多視角運(yùn)動(dòng)軌跡擴(kuò)展后,可以進(jìn)一步衍生出近 3000 萬小時(shí)的訓(xùn)練數(shù)據(jù)。
更進(jìn)一步,如視正在構(gòu)建的 Real2Sim2Real 閉環(huán),也契合當(dāng)前具身智能行業(yè)的主流方向。
Real 階段,如視通過高精度激光設(shè)備伽羅華采集和重建真實(shí)空間場(chǎng)景;Sim 階段,通過空間理解、結(jié)構(gòu)化提取等能力打造1:1仿真的訓(xùn)練環(huán)境,機(jī)器人可在孿生體進(jìn)行低成本、安全可控的訓(xùn)練和評(píng)測(cè);再回到 Real 階段,模型部署到真實(shí)場(chǎng)景后,新的運(yùn)行數(shù)據(jù)繼續(xù)回流,反向優(yōu)化仿真環(huán)境和訓(xùn)練效果。如視打造的這條閉環(huán),正是緩解 Sim2Real gap 的關(guān)鍵路徑。

從北京、上海到長(zhǎng)三角,具身智能訓(xùn)練場(chǎng)正在成為新型 AI 基礎(chǔ)設(shè)施。它不再只是讓機(jī)器人“練動(dòng)作”的地方,而是生產(chǎn)高質(zhì)量物理世界數(shù)據(jù)、驗(yàn)證模型泛化能力、連接真實(shí)場(chǎng)景和仿真環(huán)境的數(shù)據(jù)工廠。
如視的不同之處在于,它不是等風(fēng)口來了才去搭一個(gè)訓(xùn)練場(chǎng),而是早已把真實(shí)空間數(shù)據(jù)、三維重建能力和數(shù)字孿生底座準(zhǔn)備好。過去,如視把真實(shí)空間數(shù)字化,是為了讓人更好地看房、看店、看展、巡檢和管理空間;現(xiàn)在,這些真實(shí)空間數(shù)據(jù)正在成為機(jī)器人理解真實(shí)世界的訓(xùn)練場(chǎng)。
當(dāng)機(jī)器人訓(xùn)練場(chǎng)成為新風(fēng)口,如視已經(jīng)站在了真實(shí)空間數(shù)據(jù)的入口處。
關(guān)鍵詞: