機器人技術永遠不會出現“ChatGPT時刻”

2025-01-07 01:35:29 來源:InfoQ

作者 | Ben

譯者 | 平川

策劃 | 褚杏娟

今年可能是通用機器人技術有史以來最激動人心的一年。我在年初的一篇文章中,大致預測了該領域的發展,以及我認為成立哪類初創公司會有意義。2024 年有一些令人驚歎的進展,在這個背景下重讀那篇文章,感覺非常有趣。在這篇文章中,我想再預測一下明年會發生什麼。

硬體趨同

預測:到 2025 年底,人型機器人將實現商用。

我的意思是,大多數人型機器人將由大致相同的元件構成,而且任何組織都可以自由地生產這些元件。規模經濟將促使現有的企業放棄自己的專有元件,轉而生產商用元件。

以下是原因:

基於 RL 的閉環控制(使用透過模擬訓練出的策略)已成為實現實時控制的最佳方法 1。

使用 RL 策略控制機器人,意味著你無需關心執行器的大量特性,而這是機器人公司歷來關心或試圖使自己與眾不同的元件。

一旦弄清了如何利用它,大多數仍在觀望的公司也將轉向開源的 MIT Cheetah 執行器。

規模經濟和製造成本意味著其他執行器設計不再具備競爭力。

說明:

雖然硬體元件將趨於一致,但不同機器人的設計仍會存在一些差異。

在機器人設計決策的合理性方面仍然存在一些未決的問題,比如如何安排臀部的自由度,是否在頸部或軀幹中加入自由度,以及使用哪種夾持器。

我認為,根據不同的應用場景,不同的機器人仍有充分的理由做出不同的設計決策。

這會有什麼影響?

優秀的通用機器人硬體將成為商品。特斯拉、Figure 或 1X 等現有機器人公司都不會獲得任何實質性優勢。

到 2025 年底,一個好的全尺寸人型機器人的市場價將低於 8000 美元,一個好的家用機器人的市場價將低於 4000 美元。

不會有 ChatGPT 時刻

預測:機器人技術永遠不會出現“ChatGPT 時刻”。

我將此定義為,某家公司在一段時間內一直在單獨開發一種模型,然後將其釋出到某個商用機器人平臺上,非常神奇地,使該機器人能夠完成通用任務,而且有很高的可靠性。

以下是原因:

訓練一個通用機器人模型所需的各種資料的規模遠遠超過人們目前的認知。

僅僅讓一個非常好的語言模型或多模態模型來控制機器人是不夠的。要想實現 “ChatGPT 級別”的通用智慧,唯一的辦法就是收集大量(數百萬小時的數量級)的特定智慧體資料。

這就需要反覆改進。

試圖為一個特定的領域構建一個機器人,然後以這些資料為基礎來達成通用性。這個策略也是行不通的,因為:π0模型 證明了我們距離擁有一個優秀的通才智慧體 AI 模型還有多遠。

說明:

即使沒有“ChatGPT 時刻”,2025 年也會出現更好的機器人,而且我們很可能會邁過這樣一個門檻,即機器人的成本低於它為大部分人提供的價值,這意味著它們將成為可行的產品。

我們可以迅速接近 ChatGPT 的效能水平,但這會是個漸進的過程,而不是一次性的突破。

這會有什麼影響?

一些規模最大、資金最雄厚的企業需要轉向,致力於將真正的產品推向市場,或與已經在這樣做的企業合作。

消費市場增長

預測:到 2025 年底,美國銷售的人型機器人中將有一半以上是面向消費者的。

我所說的“消費者 ”是指購買機器人主要用於個人用途的人,人們會自己嘗試使用機器人,但也會有很多與商業用途重疊的情況。

以下是原因:

與前幾代機器人相比,通用機器人的效用將截然不同。

起初,通用機器人的“殺手級應用”將是語音和視覺。

早期使用者將更關注“仿人”方面,而不是“機器人”方面。

任何固守傳統機器人企業客戶 SLA(服務水平協議)的組織,最終都會落入過去曾讓許多機器人公司深陷其中的陷阱。他們將被迫放棄構建良好的通用模型,轉而在自由度超高的平臺上重新實現經典控制。

說明:

我認為,除了消費者會採用外,企業也會採用,但大多數真正的企業採用看起來更像是專業消費者,而不是企業,這與傳統的機器人採用方式存在明顯的不同。

將一類新的消費電子產品推向市場很難。很多人都會為了找到一種辦法而浪費大量的資金。

這會有什麼影響?

機器人公司需要開始關注品牌、對消費者的廣泛吸引力、消費者市場細分以及其他傳統上不需要關注的問題。

服務水平協議(SLA)將變得不再重要。機器人公司將開始變得更像矽谷的科技公司,轉而關心使用者參與度和留存率等問題。

24小時熱文

編輯推薦

最新推薦