Figure:為人類部署數(shù)十億臺(tái)人形機(jī)器人
編譯:Lavida,zhoujin
編輯:Siqi
排版:Scout
本文編譯自 Peter H.Diamandis 和 Figure 創(chuàng)始人 Brett Adcock 的訪談。
Brett Adcock 是一位成功的連續(xù)創(chuàng)業(yè)者,在其創(chuàng)立的 eVTOL 公司 Archer Aviation 成功 IPO 之后,更早之前,他創(chuàng)立的 Vettery 則以 1 億美元被收購(gòu)。今年年初,Brett Adcock ?宣布創(chuàng)立了通用人形機(jī)器人 Figure,并表示自己會(huì)投入至少 1 億美元到 Figure。Figure 的目標(biāo)是開發(fā)能夠在不同環(huán)境中工作并處理各種任務(wù)的通用型人形機(jī)器人,從倉(cāng)儲(chǔ)到零售,甚至看護(hù)服務(wù)。上個(gè)月,Brett 發(fā)布了 Figure 的第一款通用人形機(jī)器人 Figure 01 行走的視頻。
在本篇訪談中,Brett 分享了 Figure 01 是如何被設(shè)計(jì)的,以及他對(duì)于通用人形機(jī)器人領(lǐng)域的預(yù)期。Brett 認(rèn)為人形機(jī)器人研發(fā)一定是軟硬件一體的過(guò)程,LLM 為機(jī)器人提供了強(qiáng)大的大腦,是軟件層面的重要補(bǔ)足,而硬件角度,幾乎沒有成熟的供應(yīng)鏈可供使用,要求團(tuán)隊(duì)在設(shè)計(jì)產(chǎn)品的同時(shí)就要考慮到機(jī)器人重量、計(jì)算處理、現(xiàn)實(shí)環(huán)境等細(xì)節(jié)。
Figure 最先開拓的商業(yè)場(chǎng)景是勞動(dòng)力市場(chǎng),Brett Adcock 表示相較于取代人類就業(yè),人形機(jī)器人最大的價(jià)值是解決勞動(dòng)力不足的現(xiàn)實(shí)情況,這些機(jī)器人可以被投入到經(jīng)濟(jì)活動(dòng)中做“Dangerous, dull, dirty”的工作,讓體力勞動(dòng)成為人類的一種選擇而非負(fù)擔(dān)。
01.
Figure 是什么
Peter:可以簡(jiǎn)單介紹一下 Figure 嗎?你們的使命和目標(biāo)是什么?
Brett:Figure 是一家 AI 機(jī)器人公司,專注于設(shè)計(jì)自動(dòng)通用人形機(jī)器人(Autonomous General-purpose Humanoids)。自動(dòng)通用人形機(jī)器人是指具備自主能力,能夠自動(dòng)執(zhí)行多種任務(wù),并且在外觀和行為上類似于人類的機(jī)器人。我們的目標(biāo)是在長(zhǎng)期能夠部署和人類數(shù)量一樣多的人形機(jī)器人,讓體力勞動(dòng)成為一種選擇而非必然。
我們所處世界的操作系統(tǒng)是與人類相適應(yīng)的,例如門把手、倉(cāng)庫(kù)貨架,設(shè)計(jì)初衷都是適應(yīng)人類的形態(tài)和能力,而通用人形機(jī)器人就是一個(gè)系統(tǒng)的通用界面(General Purpose Interface),可以直接與我們的物理世界互動(dòng)。它的出現(xiàn)將為人類帶來(lái)諸多益處,有助于解決勞動(dòng)力市場(chǎng)中的重要問(wèn)題,例如提高人們?cè)诠ぷ髦械纳a(chǎn)率,減輕家務(wù)和護(hù)理老人的負(fù)擔(dān)。我們的遠(yuǎn)期計(jì)劃是在全球部署 100 億個(gè)人形機(jī)器人。
未來(lái) 1-2 年內(nèi),我們的重點(diǎn)將放在開發(fā)具有里程碑意義的產(chǎn)品上,希望在未來(lái)一兩年內(nèi),能向公眾展示大量人形機(jī)器人產(chǎn)品的研發(fā)成果,包括 AI 系統(tǒng)、低級(jí)控制(Low-Level Control)等,最終展示能在日常生活中發(fā)揮作用的機(jī)器人。
低級(jí)控制(low-level control))是機(jī)器人或自動(dòng)化系統(tǒng)的基礎(chǔ),它們負(fù)責(zé)處理底層的物理操作,主要包括運(yùn)動(dòng)控制、傳感器反饋、實(shí)時(shí)響應(yīng)、硬件控制等。
Peter:你預(yù)計(jì)到 2030 年或 2040 年,地球上會(huì)有多少個(gè)人形機(jī)器人?
Brett:在接下來(lái)的幾十年里,我們真正面臨的挑戰(zhàn)將是如何擴(kuò)大人形機(jī)器人的生產(chǎn)規(guī)模,以及如何將足夠數(shù)量的人形機(jī)器人供應(yīng)到市場(chǎng)。長(zhǎng)期來(lái)看,每個(gè)人、每個(gè)家庭都會(huì)想要一個(gè)人形機(jī)器人,就像現(xiàn)在的汽車或手機(jī)一樣。并且在勞動(dòng)力市場(chǎng)上也會(huì)有數(shù)十億個(gè)人形機(jī)器人,去做那些對(duì)人類來(lái)說(shuō)危險(xiǎn)、單調(diào)和乏味的工作。人形機(jī)器人也將應(yīng)用于航空事業(yè),例如在太空中建立人類居住點(diǎn)、照看老人等各類工作場(chǎng)景。如果給我們足夠長(zhǎng)的時(shí)間去進(jìn)行大規(guī)模制造,我們可以制造出數(shù)十億個(gè)人形機(jī)器人。
短期內(nèi),人型機(jī)器人的性能以及可靠性是主要的限制因素,F(xiàn)igure 正在努力解決這個(gè)問(wèn)題,我們希望能在兩年內(nèi)完成實(shí)際生活的機(jī)器人應(yīng)用測(cè)試演示。
Peter:如果能成功降低制造成本、提高生產(chǎn)量,一個(gè)功能完善的人形機(jī)器人制作成本能降低多少?
Brett:如果我們回顧消費(fèi)品或汽車行業(yè)的發(fā)展歷史時(shí),可以看到產(chǎn)品的價(jià)格與生產(chǎn)量之間存在強(qiáng)相關(guān)。根據(jù)經(jīng)驗(yàn)曲線(Experience Curve),每當(dāng)生產(chǎn)數(shù)量翻倍,產(chǎn)品的價(jià)格或成本就可能下降 20%或 30%。因此,我們可以認(rèn)為價(jià)格取決于生產(chǎn)量。
Experience Curve
經(jīng)驗(yàn)曲線(Experience Curve)是一個(gè)經(jīng)濟(jì)學(xué)概念,隨著個(gè)體或組織在特定領(lǐng)域的生產(chǎn)量增加,經(jīng)驗(yàn)的積累會(huì)帶來(lái)生產(chǎn)效率的提高,生產(chǎn)成本將會(huì)下降。
這個(gè)原理同樣適用于人形機(jī)器人的生產(chǎn)。目前,一個(gè)人形機(jī)器人大約有 1000 個(gè)零件,重量約為 150 磅(68 公斤)。相比之下,一個(gè)電動(dòng)汽車可能有大約 1 萬(wàn)個(gè)零件,重量可能在 4000-5000 磅(1800-2250 公斤)之間。
因此,從長(zhǎng)期來(lái)看,一個(gè)人形機(jī)器人的成本應(yīng)該低于一臺(tái)廉價(jià)電動(dòng)汽車。這主要取決于機(jī)器人的執(zhí)行器、電機(jī)組件、傳感器的成本以及計(jì)算成本。
Peter:關(guān)于生產(chǎn)速度,未來(lái)幾年內(nèi)有可能生產(chǎn)幾百臺(tái) Figure 機(jī)器人嗎?你預(yù)計(jì)到 2030 年會(huì)達(dá)到什么水平?
Brett:現(xiàn)階段我們需要先打造出更成熟的產(chǎn)品,才能進(jìn)一步考慮生產(chǎn)速度的問(wèn)題。我們當(dāng)前面臨的主要問(wèn)題是確保人形機(jī)器人在客戶場(chǎng)景中的實(shí)用性、安全性和可靠性,讓機(jī)器人能夠持續(xù)運(yùn)行,不出故障,并且不需要大量人員來(lái)維護(hù)和操作。否則,機(jī)器人的價(jià)值就沒法體現(xiàn)了。也無(wú)法為客戶創(chuàng)造理想的回報(bào)率。
如果我們能夠做到的話,我相信我們有能力在未來(lái)幾十年內(nèi)生產(chǎn)數(shù)千萬(wàn)個(gè)人形機(jī)器人。以 Tesla 和福特汽車為例,它們分別花了 10 年以上的時(shí)間生產(chǎn)并投放市場(chǎng) 100 萬(wàn)輛汽車。如果我們的目標(biāo)是全球范圍內(nèi)投放 100 萬(wàn)臺(tái)機(jī)器人,可能需要 5 年或者 10-12 年的時(shí)間。
與制造汽車相比,制造機(jī)器人的過(guò)程更加簡(jiǎn)單。特斯拉 Model 3 有大約 1 萬(wàn)個(gè)零件,而我們的機(jī)器人只有大約 1 千個(gè)零件,并且更輕巧。
因此,我認(rèn)為在這 10 年的后半段,我們可以以相當(dāng)高的產(chǎn)量進(jìn)行機(jī)器人制造。但在接下來(lái)的 2-4 年內(nèi),我們的首要目標(biāo)是制造出實(shí)用的人形機(jī)器人。
Peter:AI 已經(jīng)能夠用于編寫其他 AI 程序了,你認(rèn)為你們也會(huì)利用機(jī)器人來(lái)協(xié)助制造機(jī)器人,從而形成一種反饋循環(huán)嗎?
歡迎關(guān)注海外獨(dú)角獸視頻號(hào)
獲取最前沿的科技行業(yè)資訊
Brett:是的,我們的目標(biāo)是在制造過(guò)程中只有人形機(jī)器人來(lái)制造人形機(jī)器人。我覺得在制造過(guò)程中任何需要人類勞動(dòng)力的工作都會(huì)發(fā)生重大變革,我們上周參觀的汽車制造基地到處都有巨大的機(jī)器臂,數(shù)量多達(dá)數(shù)百個(gè),那是我一生中見過(guò)的自動(dòng)化程度最高的地方之一,但還有另外約 10,000 名員工在工作。
Peter:工廠制造應(yīng)該是人形機(jī)器人最先投入應(yīng)用的地方,機(jī)器人離家用還有多遠(yuǎn)?
Brett:人形機(jī)器人會(huì)優(yōu)先在相對(duì)更結(jié)構(gòu)化的環(huán)境中得到應(yīng)用,所以相較于復(fù)雜多變的家庭環(huán)境,工廠制造的產(chǎn)品具有更清晰一致的規(guī)格和參數(shù),生產(chǎn)過(guò)程更易于統(tǒng)一和自動(dòng)化,也更容易控制成本、保證安全性,因此工廠會(huì)是最初的應(yīng)用場(chǎng)景。
為了讓人形機(jī)器人的操作技能、高級(jí)行為和感知策略更加成熟,我們需要將這些機(jī)器人投入到企業(yè)勞動(dòng)力市場(chǎng)中,并建立一個(gè)全面的 AI 數(shù)據(jù)管道(AI data pipeline),這個(gè)過(guò)程需要時(shí)間。我的推測(cè)是預(yù)計(jì)到 2030 年左右,我們有可能看到人形機(jī)器人在家庭環(huán)境中的廣泛應(yīng)用。
Peter:讓人形機(jī)器人成為可能的一個(gè)關(guān)鍵因素是 AI 能力的飛躍,而具有物理實(shí)體的 AI 機(jī)器人將在 AI 的進(jìn)化中扮演重要角色。一個(gè)被裝在盒子里或只能通過(guò)攝像頭或揚(yáng)聲器觀察外界的 AI,與能真正與物理世界互動(dòng)的 AI 有很大不同,你怎么看?
Brett:我相信,最終我們將有能力對(duì) AGI 產(chǎn)生重大影響。2023 年大家持續(xù)討論的一個(gè)問(wèn)題是,在模型訓(xùn)練和規(guī)模拓展中,一旦互聯(lián)網(wǎng)上沒有足夠的文本用來(lái)訓(xùn)練新一代模型,AGI 是否還能實(shí)現(xiàn)?我認(rèn)為,通過(guò)人形機(jī)器人與環(huán)境互動(dòng)來(lái)獲取人類數(shù)據(jù),并使用視覺語(yǔ)言模型來(lái)理解和處理這些數(shù)據(jù),可能會(huì)是能持續(xù)推進(jìn) AGI 研究向前的一個(gè)主要途徑,雖然這可能需要更長(zhǎng)時(shí)間。
Peter:Figure 的團(tuán)隊(duì)是如何組建的?
Brett:我一直在努力找到世界上最優(yōu)秀的人才,還有那些鮮為人知的小眾實(shí)驗(yàn)室,以更深入地了解執(zhí)行器或運(yùn)動(dòng)控制。同時(shí),我也在看書學(xué)習(xí)全身逆動(dòng)力學(xué)(whole-body inverse dynamics)或 NPC 控制器(NPC controller)等相關(guān)知識(shí),我花了大量時(shí)間在這上面。
全身逆動(dòng)力學(xué)(whole-body inverse dynamics)是機(jī)器人控制領(lǐng)域的一個(gè)概念,它涉及研究和計(jì)算機(jī)器人身體各部分的運(yùn)動(dòng)和受力情況,以便更好地理解和控制機(jī)器人的運(yùn)動(dòng)。這個(gè)概念通常用于開發(fā)機(jī)器人的動(dòng)態(tài)控制系統(tǒng),以使機(jī)器人能夠在執(zhí)行任務(wù)時(shí)保持平衡、穩(wěn)定和高效。
NPC 控制器(NPC controller)是一種用于控制機(jī)器人的控制算法,它代表“非線性模型預(yù)測(cè)控制”(Nonlinear Model Predictive Control)。這種控制方法使用機(jī)器人的數(shù)學(xué)模型來(lái)預(yù)測(cè)未來(lái)的運(yùn)動(dòng)和行為,然后根據(jù)這些預(yù)測(cè)來(lái)生成控制命令,以實(shí)現(xiàn)所期望的機(jī)器人行為。NPC 控制器通常用于高級(jí)機(jī)器人應(yīng)用,如動(dòng)態(tài)步行、操縱和避障等領(lǐng)域,以提高機(jī)器人的性能和穩(wěn)定性。
作為初創(chuàng)公司的創(chuàng)始人,最重要的是證明你能做出來(lái)產(chǎn)品,即使是一個(gè)最小可行產(chǎn)品(MVP),因?yàn)槲覀兊哪繕?biāo)都是推出產(chǎn)品或服務(wù)。在創(chuàng)立 Archer 的時(shí)候,我在佛羅里達(dá)大學(xué)建了一個(gè) 372 平方米的 Archer Aviation eVTOL 實(shí)驗(yàn)室,與一個(gè)博士團(tuán)隊(duì)合作在那里制造了第三、四代電動(dòng)飛行器,這個(gè)過(guò)程讓我對(duì)技術(shù)原理和產(chǎn)品的認(rèn)證決策(certification decisions)有了更深入的了解。
如果能事先知道 Archer 和 Figure 有多難,也許就不會(huì)有人去做了,因?yàn)樗鼈兇_實(shí)非常有挑戰(zhàn)性。我當(dāng)時(shí)完全沒有意識(shí)到供應(yīng)鏈的成熟度問(wèn)題,很多機(jī)器人的初創(chuàng)公司也是。他們可能會(huì)認(rèn)為硬件采購(gòu)很容易,真正的難題在于軟件,但實(shí)際情況并非如此。因?yàn)橐屲浖樌\(yùn)行就需要優(yōu)質(zhì)的硬件,特別是對(duì)于 eVTOL 飛行器和 Figure 機(jī)器人,獲取硬件供應(yīng)非常困難。
Peter:在 Figure 公司的發(fā)展過(guò)程中,有哪些技術(shù)層面的限制推動(dòng)你做出了當(dāng)前的決策?是電池壽命、材料重量或者 AI 嗎?
Brett:我們花了很多時(shí)間來(lái)了解需求,整個(gè)設(shè)計(jì)流程非常嚴(yán)格,也進(jìn)行了大量的交易研究,確保我們能夠做出正確決策。
我們很多決定都取決于硬軟件的供應(yīng)鏈情況,其中驅(qū)動(dòng)器(actuator)、中間件(middleware)、操作系統(tǒng)、電池、控制軟件(control software)是主要的限制因素,一些情況下感知系統(tǒng)是比較容易獲得并內(nèi)置于機(jī)器人中的。
我本來(lái)以為能很容易買到現(xiàn)成的,但市場(chǎng)上根本沒有好的驅(qū)動(dòng)器、電池、控制軟件和中間件操作系統(tǒng)解決方案。傳感器雖然有一些現(xiàn)成的,但我們幾乎都是自己制造下一代機(jī)器人的電子元件,并不是因?yàn)槲覀兿耄遣坏貌弧?/p>
Figure 研制的執(zhí)行器(左) vs?
具有相同扭矩的現(xiàn)成執(zhí)行器(右)
Source: IEEE Spectrum
02.
如何設(shè)計(jì)一臺(tái)人形機(jī)器人
Peter:Figure 機(jī)器人的身高是大概 168 cm,這個(gè)高度不會(huì)讓人類感到害怕,同時(shí)又足夠接觸到貨架頂層,你們?cè)谠O(shè)計(jì)的時(shí)候是如何考慮的?
Brett:我們?cè)谠O(shè)計(jì)機(jī)器人身高的時(shí)候經(jīng)歷了一個(gè)復(fù)雜的決策過(guò)程,因?yàn)檫@個(gè)過(guò)程中的兩個(gè)決定性因素之間是互相矛盾的,我們需要在二者之間找到平衡。
一方面,從物理角度來(lái)看,機(jī)器人身高低于 168cm 是最理想的,因?yàn)檫@樣的設(shè)計(jì)可以降低能源消耗、增強(qiáng)穩(wěn)定性,并且較矮的機(jī)器人部件更易于控制,并且在跌倒時(shí)能更快地恢復(fù)平衡。
然而,從商業(yè)實(shí)用性角度上,我們又需要機(jī)器人有足夠長(zhǎng)的手臂、可以靈活從高處和低處獲取物品,就像“神探加杰特”(Inspector Gadget )中的機(jī)器人那樣具有超人的能力。
因此,綜合考慮這兩方面的因素,我們確定了這個(gè)高度作為理想身高。我們正在設(shè)計(jì)的下一代機(jī)器人會(huì)和第一代產(chǎn)品的身高保持一致。
Inspector Gadget 中擁有超長(zhǎng)手臂的特工
Peter:你認(rèn)為機(jī)器人有必要看起來(lái)和人類一模一樣嗎?
Brett:根據(jù)恐怖谷效應(yīng),當(dāng)機(jī)器人的外觀越來(lái)越接近人類時(shí),人們對(duì)它的信任感會(huì)增加,但是當(dāng)它們過(guò)于接近人類時(shí),人們會(huì)感到不安和恐懼。所以我們的目標(biāo)并不是追求讓機(jī)器人在外觀上看起來(lái)像人類,比如說(shuō)有五官和表情,而是希望機(jī)器人在功能上能夠模仿人類的操控和移動(dòng)能力。這樣的話機(jī)器人就能夠執(zhí)行需要與人類操作系統(tǒng)交互的任務(wù)。
這也意味著我們無(wú)需改變工作環(huán)境,就能將機(jī)器人投入到人類不愿意從事的工作中,比如倉(cāng)庫(kù)管理和制造業(yè),或者做家務(wù)。這正是人形機(jī)器人的目的。我們的最終目標(biāo)是讓機(jī)器人融入經(jīng)濟(jì)活動(dòng)中,從事對(duì)人類有用且有益的工作。
Peter:據(jù)你了解現(xiàn)在市場(chǎng)上有多少人形機(jī)器人公司?比如很多人都知道特斯拉的 Optimus 機(jī)器人,現(xiàn)在應(yīng)該也聽說(shuō)過(guò) Figure ,你覺得還有多少公司像你們一樣募到了充足的資金來(lái)發(fā)展人形機(jī)器人?
Brett:我們關(guān)注到的應(yīng)該已經(jīng)獲得融資的有 6 個(gè)左右,過(guò)去十年大多數(shù)人形機(jī)器人項(xiàng)目仍處于研發(fā)階段,比如 Boston Dynamics 的 Atlas。美國(guó)也有許多非常優(yōu)秀的實(shí)驗(yàn)室,比如加州理工學(xué)院和 UC Berkeley 也展示過(guò)他們的一些研究成果。
商業(yè)化方面,我們會(huì)去看這幾個(gè)公司是不是商業(yè)化團(tuán)隊(duì),研發(fā)的機(jī)器人是否可以行走,以及有沒有手。據(jù)我們所知,目前只有我們和特斯拉的 Optimus 滿足這三個(gè)特質(zhì)。
Peter:我們的 Abundance 360 CEO 峰會(huì)每年都會(huì)聚焦不同的機(jī)器人公司。幾年前我們邀請(qǐng)了波士頓動(dòng)力的 Mark Robert,在峰會(huì)上演示了 Atlas 機(jī)器人。去年來(lái)自英國(guó)的 Engineered Arts 公司展示了 Ameca 人形機(jī)器人,她最大的特點(diǎn)是擁有面部表情,而且動(dòng)作非常類似人類,雖然看起來(lái)有點(diǎn)怪,但讓人感覺很新鮮。Ameca 接入的是 GPT-4,Atlas 則是由自有系統(tǒng)驅(qū)動(dòng)。可能大部分人沒有意識(shí)到的是,作為機(jī)器人,Atlas 實(shí)際上非常重,它的液壓系統(tǒng)非常危險(xiǎn)。而你們?cè)谠O(shè)計(jì)時(shí)采取了不同的方法,F(xiàn)igure 的重量相對(duì)較輕,不容易傷害到人,可以介紹一下它的其他參數(shù)嗎?
能實(shí)現(xiàn)表情功能的 Ameca 機(jī)器人
Source: Engineered Arts?
Brett:我們的目標(biāo)重量是 60 公斤,而現(xiàn)在 Figure 的實(shí)際重量略高于 61 公斤,結(jié)果還是很理想的,因?yàn)槲抑白龅暮芏囗?xiàng)目都有明顯的超重問(wèn)題,比如 Archer(拾象注:Archer Aviation 是 Brett 創(chuàng)立的一家專注于開發(fā)電動(dòng)垂直起降(eVTOL)飛機(jī)的航空制造公司)。我們希望 Figure 在充滿電的狀態(tài)下能續(xù)航 5 小時(shí),然后經(jīng)過(guò) ~2C 快速充電后再次投入工作。
C-rate(充電倍率)指充電電流相對(duì)電芯額定容量( Ah )的倍數(shù),表示電池充電到最大容量所需要的時(shí)間,是衡量電池充電速度的一個(gè)指標(biāo),C 前面的數(shù)字越大,表示充電速度越快。1C 表示電池在一小時(shí)內(nèi)可以充滿電,文中提到的 “2C 快速充電”就是說(shuō)電池在半小時(shí)內(nèi)可以充電到 100%。
另外就是讓 Figure 能以幾米/秒的步行速度快走,不需要跑步或沖刺,但有時(shí)候機(jī)器人可能需要在倉(cāng)庫(kù)里走大概 400 米,所以想讓他走快點(diǎn)。
我們需要通過(guò)一些特定操作實(shí)現(xiàn)快速、可靠和安全的目標(biāo),當(dāng)前的硬件已經(jīng)能夠完成大部分人類工作,主要的限制在于軟件。通過(guò)軟件更新,我們將會(huì)不斷提升機(jī)器人的能力。
Peter:我很興奮你們專注于讓機(jī)器人模仿人類形態(tài)。我對(duì)另一件事情非常感興趣,那就是與肌肉相關(guān)的硬件設(shè)計(jì)。我曾經(jīng)讀過(guò)關(guān)于肌動(dòng)蛋白和肌肉收縮等方面的文章,一直希望能研發(fā)出一種材料,只要施加電流就會(huì)像肌肉一樣收縮——這種材料將是人形機(jī)器人的理想驅(qū)動(dòng)器,而不是傳統(tǒng)的旋轉(zhuǎn)或螺旋功能。你是否了解這方面的研究?我們是否有望看到電機(jī)肌肉技術(shù)(Electromechanical Muscle-tech)的發(fā)展?
Brett:人體的結(jié)構(gòu)非常復(fù)雜,尤其是肌肉工作和關(guān)節(jié)運(yùn)動(dòng)。例如,人的肩關(guān)節(jié)有三個(gè)自由度,所以我們的機(jī)器人需要通過(guò)三個(gè)不同的執(zhí)行器實(shí)現(xiàn)俯仰和翻滾,這些執(zhí)行器被設(shè)計(jì)成按特定的順序依次激活或啟動(dòng),以執(zhí)行復(fù)雜的運(yùn)動(dòng)任務(wù)。要使機(jī)器人達(dá)到與人類相似的自由度和效率非常困難,所以在很長(zhǎng)時(shí)間內(nèi),機(jī)器人與人類之間的差距將持續(xù)存在。
Figure 01 肩關(guān)節(jié)設(shè)計(jì)細(xì)節(jié)
Source: IEEE Spectrum
我們已經(jīng)研究了很多種技術(shù),包括液壓技術(shù)以及其他類型的執(zhí)行器,而不僅僅局限于旋轉(zhuǎn)或線性電機(jī)。我們的電機(jī)驅(qū)動(dòng)器(Electromechanical Actuator)可以滿足各種需求,因?yàn)樗鼈兙哂凶銐虻哪芰?、?dòng)力和自由度以及合適的速度和扭矩來(lái)執(zhí)行這些任務(wù)。只要能夠滿足需求,我們就可以進(jìn)行大批量生產(chǎn),從而大幅降低生產(chǎn)成本。
我們還在進(jìn)行一些有趣的學(xué)術(shù)研究,但我們認(rèn)為其中一些研究成果與實(shí)際應(yīng)用還有距離,還不能將其應(yīng)用到一個(gè)人形機(jī)器人上,并在未來(lái)幾年內(nèi)進(jìn)行有用的工作。
Peter:在 Figure 的設(shè)計(jì)中,數(shù)據(jù)處理和計(jì)算任務(wù)是都在機(jī)器內(nèi)部進(jìn)行,還是需要部分在云端完成處理?
Brett:我們所有的短期、低級(jí)別的處理都在機(jī)身上操作,所以我們需要在機(jī)器人上集成足夠強(qiáng)大的計(jì)算和圖形處理能力,以便運(yùn)行機(jī)器人內(nèi)部的計(jì)算機(jī),來(lái)驅(qū)動(dòng)整個(gè)運(yùn)動(dòng)控制器、運(yùn)行感知系統(tǒng)以及執(zhí)行我們所需的各項(xiàng)功能。
我們的機(jī)器人也具備與云端通信的能力,因此對(duì)于一些不需要高帶寬、不必?fù)?dān)心延遲問(wèn)題的任務(wù),例如規(guī)劃?rùn)C(jī)器人的下一步行動(dòng)等高級(jí)行為,這些任務(wù)可以在云端進(jìn)行處理。
總體而言,我們希望在機(jī)器人上盡可能多地完成任務(wù),例如在一個(gè) 5G 信號(hào)不穩(wěn)定的環(huán)境中,控制器仍能以非常快的頻率運(yùn)行,所以我們的機(jī)器人需要具備在內(nèi)部高速完成大量任務(wù)的能力。
Peter:關(guān)于機(jī)器人的視覺系統(tǒng),你們的方案是什么樣的?完全使用攝像頭視覺(Camera Visual)方案還是使用激光雷達(dá)?
Brett:如果我們回顧消費(fèi)品或汽車行業(yè)的發(fā)展歷史時(shí),可以看到產(chǎn)品的價(jià)格與生產(chǎn)量之間存在強(qiáng)相關(guān)。根據(jù)經(jīng)驗(yàn)曲線的理論,每當(dāng)生產(chǎn)數(shù)量翻倍,產(chǎn)品的價(jià)格或成本就可能下降 20%或 30%。因此,我們可以認(rèn)為價(jià)格是生產(chǎn)量的函數(shù)。
Peter:你是否關(guān)注過(guò)《星際迷航》中的 Data 機(jī)器人以及 R2-D2 、 C-3PO?他們的哪些設(shè)計(jì)是值得借鑒的?哪些不太合理?
Brett:我喜歡 C-3PO,但我不太喜歡它手臂上帶有小型執(zhí)行器的杠桿式裝置。R2-D2 的形狀和結(jié)構(gòu)我覺得不太實(shí)用,后部的加速器可能有些用處。但其實(shí)我并不是《星際迷航》的科幻迷,我童年接觸更多的是阿西莫夫這些科幻作家的作品。
星際迷航中的 Data 指揮官
Source: Memory Fandom
R2- D2 讓我想到,很多人都建議我們給機(jī)器人裝上輪子,而不是采用雙足行走這種更復(fù)雜的方式。
《星球大戰(zhàn)》中的 R2-D2 機(jī)器人
Source: Wikipedia
但我認(rèn)為固定輪距的設(shè)計(jì)是不合理的,盡管采用這種設(shè)計(jì)的機(jī)械臂在市場(chǎng)上表現(xiàn)出色,并且很多人也花了大量時(shí)間去實(shí)現(xiàn)這個(gè)設(shè)計(jì)。
考慮一個(gè)實(shí)際情況,如果我們讓一臺(tái)輪式機(jī)器人進(jìn)入倉(cāng)庫(kù),它需要具備垂直移動(dòng)的能力,這意味著它需要配備能夠上下移動(dòng)的電梯。為了到達(dá)貨架的后面或者類似的地方,你需要先把它推向前方,然后再向后倒車。
為了完成這些復(fù)雜的動(dòng)作,輪式機(jī)器人必須具備與雙足行走的機(jī)器人類似的復(fù)雜性、驅(qū)動(dòng)力和自由度。因此,那些試圖讓我把機(jī)器人建造成 R2-D2 樣式的建議實(shí)際上是不切實(shí)際的。
03.
為什么需要軟硬件一體開發(fā)
Peter:Oculus 的創(chuàng)始人 Palmer Lucky 最近在做一家國(guó)防科技公司,在外界看來(lái),他們像是一個(gè)專注于硬件制造的公司,但實(shí)際他們做的大概是 60% 的軟件和 40% 的硬件。Figure 的硬件和軟件的比例如何?
Brett:如果包含做控制系統(tǒng)(control)、中間件(middleware)和自主決策與行動(dòng)能力(autonomy)的人,我們的軟件占比會(huì)比硬件稍微多一些,因?yàn)橛布?team 的員工只有 15 個(gè)左右,軟件規(guī)模要明顯大一些。
長(zhǎng)遠(yuǎn)來(lái)看,軟件會(huì)成為公司最大的業(yè)務(wù)板塊。Figure 作為一家專注于 AI 的公司,以后會(huì)有一個(gè)龐大的 autonomy 團(tuán)隊(duì),并且研發(fā)出關(guān)鍵的 AI 數(shù)據(jù)引擎。
但硬件方面也同樣重要。如果我們真的想做出實(shí)現(xiàn)高性能、高可靠性、高安全性和低成本的人形機(jī)器人,就需要開發(fā)自己的執(zhí)行器、電子設(shè)備、電池和幾乎所有軟件,因?yàn)檫@些都沒有現(xiàn)成的解決方案。做硬件我們經(jīng)常說(shuō)“唯一的出路就是繼續(xù)前進(jìn)”,因?yàn)槊看螁?dòng)機(jī)器人都會(huì)出現(xiàn)各種新問(wèn)題,這確實(shí)是一項(xiàng)嚴(yán)峻的挑戰(zhàn)。
長(zhǎng)時(shí)間從事軟件開發(fā)再進(jìn)入硬件領(lǐng)域是真的很困難,研發(fā)硬件需要經(jīng)過(guò)一個(gè)漫長(zhǎng)的迭代周期,這也是我們受挫的主要因素。
Peter:LLM 如果能夠應(yīng)用于人形機(jī)器人,我們就可以與機(jī)器人交流,讓它理解我的意圖,進(jìn)行有效對(duì)話。你們打算訓(xùn)自己的模型,還是會(huì)集成其他模型?在你們制造機(jī)器人的哪個(gè)環(huán)節(jié)會(huì)引入 LLM?
Brett:要讓人形機(jī)器人從工廠走進(jìn)家庭,關(guān)鍵在于語(yǔ)言,所以 LLM 或視覺語(yǔ)言模型對(duì)我們的業(yè)務(wù)幫助很大。我們要讓機(jī)器人能夠從語(yǔ)義層面理解世界,做到理解和回應(yīng)用戶的需求和指令,恰好 LLM 可以做到這點(diǎn)。
因此,我們會(huì)逐步將視覺語(yǔ)言模型加入機(jī)器人的研發(fā)過(guò)程,從高層次的行為角度來(lái)幫助人形機(jī)器人理解人類在說(shuō)什么,讓它能與人類進(jìn)行對(duì)話,同時(shí)也能推斷和理解人們?cè)谡f(shuō)什么以做出回應(yīng)。我們很可能不會(huì)自己訓(xùn)模型,但我們可以在機(jī)器人系統(tǒng)上訓(xùn)練視覺語(yǔ)言模型,關(guān)聯(lián)傳感器數(shù)據(jù)。
打造一個(gè)正確的 AI 數(shù)據(jù)引擎對(duì)我們來(lái)說(shuō)非常重要,它能確保我們對(duì)機(jī)器人產(chǎn)生的數(shù)據(jù)進(jìn)行準(zhǔn)確的訓(xùn)練,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行正確的訓(xùn)練,以便未來(lái)能夠有效地部署和使用。這也是驅(qū)動(dòng)我們盡快讓產(chǎn)品進(jìn)入市場(chǎng)的動(dòng)力,我們希望將更多的機(jī)器人投放市場(chǎng),收集數(shù)據(jù),從而讓我們未來(lái)的機(jī)器人隊(duì)伍將變得更加智能、學(xué)會(huì)更多技能。
Peter:人們沒有意識(shí)到機(jī)器人之間的 AI 和數(shù)據(jù)集是相互連接的,當(dāng)一個(gè)機(jī)器人學(xué)會(huì)了如何執(zhí)行某項(xiàng)任務(wù),或者如何應(yīng)對(duì)某種情況,不僅僅是那個(gè)機(jī)器人學(xué)會(huì)了,所有的機(jī)器人都會(huì)學(xué)到,這個(gè)是很棒的。
Brett:就像我的孩子們一樣,在他們學(xué)習(xí)做某件事的過(guò)程中,盡管可能失敗了很多次,但他們一旦掌握了就不會(huì)忘記,然后他們會(huì)不斷積累新的技能。
對(duì)于機(jī)器人也是一樣的,一旦我們成功地教會(huì)一個(gè)機(jī)器人如何成功地卸貨或處理特定情況下的箱子,整個(gè)機(jī)器人隊(duì)伍都會(huì)學(xué)到這個(gè)技能。因此,機(jī)器人的性能提升將非常迅速和顯著。
04.
機(jī)器人會(huì)取代人類就業(yè)嗎?
Peter:你預(yù)計(jì)市場(chǎng)最早什么時(shí)候會(huì)看到 Figure 的第一個(gè)商業(yè)應(yīng)用?
Brett:我預(yù)計(jì)會(huì)在明年,如果我們明年還做不到,那可能會(huì)延后一兩年,這是個(gè)比較理想的計(jì)劃。我們會(huì)盡量多發(fā)布一些產(chǎn)品物料讓公眾了解我們的進(jìn)度并獲得市場(chǎng)支持,這非常重要。我們計(jì)劃在未來(lái) 2-3 個(gè)月內(nèi)發(fā)布首個(gè)人形機(jī)器人在辦公室里行走的視頻。未來(lái),我們還將在感知、操縱和其他傳統(tǒng)操作領(lǐng)域做更多工作。
Figure 01 動(dòng)態(tài)行走
Source: Figure.ai
我們發(fā)布視頻的目的不僅僅是讓機(jī)器人展示花哨的動(dòng)作,而是展示它在重復(fù)性工作中的出色性能。我們會(huì)把機(jī)器人放在倉(cāng)庫(kù)里,一遍又一遍地完成工作,我認(rèn)為這才是具有突破性的進(jìn)展。
我們目前正與客戶合作,看怎么讓 Figure 在我們的實(shí)驗(yàn)室中開始工作,并盡量模擬客戶的工作環(huán)境,這樣明年就可以更容易地將它部署到客戶的工作場(chǎng)景中。
Peter:高盛的預(yù)測(cè)是,未來(lái) 15 年內(nèi),機(jī)器人可能會(huì)創(chuàng)造 1540 億美元的收入,你也提到過(guò)全球 GDP 的一半來(lái)自勞動(dòng)力,這是 Figure 的潛在市場(chǎng)。是否有人擔(dān)憂機(jī)器人尤其是人形機(jī)器人的出現(xiàn)會(huì)導(dǎo)致人們失去工作,引發(fā)類似于 AI 引起的就業(yè)問(wèn)題?
Brett:我的觀點(diǎn)是在接下來(lái)的 10-20 年里,機(jī)器人業(yè)務(wù)的發(fā)展將與自動(dòng)駕駛汽車的發(fā)展路徑類似。就像自動(dòng)駕駛汽車,高速公路的測(cè)試視頻會(huì)比城市街道的更早公開,是因?yàn)槌鞘薪值烙懈叩陌踩蠛透嗟牟淮_定性。
同樣,人形機(jī)器人也會(huì)首先解決相對(duì)容易的問(wèn)題,比如在預(yù)知環(huán)境和任務(wù)的情況下搬運(yùn)貨物。這類任務(wù)就像在高速公路上駕駛,相對(duì)簡(jiǎn)單易行。然而,更復(fù)雜的任務(wù),例如在家中烹飪或照顧老年人,就像在城市街道上駕駛,更具挑戰(zhàn)性。
Source: Figure Master Plan
盡管大家對(duì)人形機(jī)器人的期望往往集中在復(fù)雜任務(wù)的解決上,比如谷歌的機(jī)器人做垃圾分類,豐田研究院在雜貨店等場(chǎng)景的研究,但這些都是非常困難的挑戰(zhàn)。我很高興有這些研究,但從商業(yè)角度出發(fā),我們的首要任務(wù)應(yīng)該是解決那些簡(jiǎn)單但必要的問(wèn)題,然后逐漸將 AI 數(shù)據(jù)引擎應(yīng)用到更復(fù)雜的任務(wù)中。
所以 Figure 和其他研究團(tuán)隊(duì)關(guān)注的事情恰恰相反。我們的目標(biāo)是在倉(cāng)儲(chǔ)制造領(lǐng)域應(yīng)用人形機(jī)器人,這個(gè)領(lǐng)域的勞動(dòng)力短缺問(wèn)題最為嚴(yán)重。全球約一半的 GDP 來(lái)自勞動(dòng)力,我們正在面對(duì)全球范圍內(nèi)的勞動(dòng)力短缺問(wèn)題。隨著嬰兒潮一代的退休和生育率的下降,這個(gè)問(wèn)題將越來(lái)越嚴(yán)重。
Peter:大家沒有意識(shí)到,我們面臨的最大挑戰(zhàn)不是人口過(guò)多,而是人口不足。
Brett:這必然會(huì)是一個(gè)重大問(wèn)題。我們有時(shí)候去拜訪客戶,比如一個(gè)大型財(cái)富 100 強(qiáng)公司時(shí),他們首先考慮的不是如何讓機(jī)器人與員工協(xié)同工作,而是讓機(jī)器人解決勞動(dòng)力短缺的問(wèn)題。去年他們的倉(cāng)庫(kù)員工流失率高達(dá) 140%,因?yàn)闆]有人愿意做這些危險(xiǎn)且冬冷夏熱的工作。
Peter:未來(lái)幾年內(nèi),你是否會(huì)把所有機(jī)器人首先投入到倉(cāng)庫(kù)環(huán)境中,讓它們從事包裝、解包、貨運(yùn)和物流等工作,并且著重去提升在這些場(chǎng)景下的能力?
Brett:我們現(xiàn)在大部分時(shí)間都投入到了機(jī)器人在物流方面的應(yīng)用,也在一些大型汽車制造商(OEMs)上花費(fèi)了不少時(shí)間,這些制造商的生產(chǎn)設(shè)施需要大量員工來(lái)操作。上周我們?nèi)チ艘粋€(gè)美國(guó)著名 OEM 的廠房,那里有近 1 萬(wàn)名員工。他們問(wèn)題很多,人手不夠,很多工作都很危險(xiǎn),工人在機(jī)器旁做點(diǎn)焊工作,你都可以聞到焊接煙霧的味道。
在訂單履行和物流操作的領(lǐng)域內(nèi)也存在很多問(wèn)題,因?yàn)樗鼈冃枰皶r(shí)進(jìn)行庫(kù)存管理。我們看到每天大約有四、五百萬(wàn)個(gè)零件需要人工處理,都集中在同一個(gè)設(shè)施或同一位置,這個(gè)任務(wù)量是很龐大的,此外還有大量的鋼板被移動(dòng)到不同的機(jī)器上,員工需要在數(shù)百個(gè)工作站做點(diǎn)焊這種重復(fù)工作。
Peter:工廠是 7 × 24 無(wú)休,還是每天 8 小時(shí)?
Brett:不,他們是每天運(yùn)作 21 至 22 個(gè)小時(shí),有兩個(gè) 10 小時(shí)的班次。
Peter:所以這些機(jī)器人可以在沒有人員干預(yù)的情況下全天候工作,不需要像人類員工一樣進(jìn)行藥物測(cè)試,也不需要提供假期和保險(xiǎn)。對(duì)于這種工種,如果有一個(gè)良好的 PMF,機(jī)器人是非常理想的勞動(dòng)力。
Peter:接下來(lái)你是否計(jì)劃進(jìn)軍物流、倉(cāng)儲(chǔ)和送貨服務(wù)領(lǐng)域?你認(rèn)為下一個(gè)潛在的大市場(chǎng)是什么,我們何時(shí)會(huì)看到這些人形機(jī)器人出現(xiàn)在這個(gè)領(lǐng)域?
Brett:我們計(jì)劃先在未來(lái)十幾年內(nèi)持續(xù)擴(kuò)大在商業(yè)勞動(dòng)力市場(chǎng)的規(guī)模。我們關(guān)注的領(lǐng)域包括醫(yī)療保健、房地產(chǎn)、建筑和零售等,我相信這些領(lǐng)域都有巨大的市場(chǎng)潛力。
另外,還有一些市場(chǎng)尚未應(yīng)用人形機(jī)器人,比如房地產(chǎn)??萍挤康禺a(chǎn)公司開發(fā)的在線平臺(tái)可以使用人形機(jī)器人來(lái)代替人類經(jīng)紀(jì)人提供服務(wù)。人們可以通過(guò)訪問(wèn)網(wǎng)站預(yù)約看房,然后由人形機(jī)器人打開門迎接他們,在一個(gè)虛擬的房屋中全程介紹。這是一個(gè)價(jià)值數(shù)萬(wàn)億美元的市場(chǎng),但科技公司迄今為止還未涉足,因?yàn)槟壳胺康禺a(chǎn)領(lǐng)域的工作仍然過(guò)于依賴人力。
此外,還有許多行業(yè)的工作可以通過(guò)遠(yuǎn)程操作或其他技術(shù)來(lái)完成,人形機(jī)器人可以為這些行業(yè)帶來(lái)新的發(fā)展機(jī)會(huì)。
Peter:我個(gè)人很期待人形機(jī)器人進(jìn)入支持老齡人口的市場(chǎng),這也是一個(gè)相對(duì)迫切需要補(bǔ)充勞動(dòng)力的市場(chǎng)。如果我們希望讓機(jī)器人為老年人提供高質(zhì)量的看護(hù)服務(wù),需要哪些技術(shù)上的突破和創(chuàng)新?
Brett:這需要我們的人形機(jī)器人具備足夠的可靠性、安全性以及合理的成本。從硬件的角度來(lái)看,這種機(jī)器人將能夠執(zhí)行在家庭環(huán)境中所需的幾乎所有工作。在商業(yè)市場(chǎng)上,我們需要建立對(duì)產(chǎn)品的信任和其他方面的成熟度。
通過(guò)將人形機(jī)器人應(yīng)用于擁有大量勞動(dòng)力的大型企業(yè)中,提高機(jī)器人的智能性、靈活性、可靠性,最終進(jìn)行大規(guī)模生產(chǎn)以降低成本。機(jī)器人在老年護(hù)理領(lǐng)域的應(yīng)用將在大約十年后發(fā)生,并且非常重要,甚至可能創(chuàng)造更大的市場(chǎng)。但這只是我們計(jì)劃的第二步,而第一步是商業(yè)市場(chǎng)。
Peter:當(dāng) Figure 發(fā)展到第 5、6、7 代的時(shí)候,是否會(huì)出現(xiàn)一個(gè)擁有面部特征和個(gè)性的人形機(jī)器人,從而增加用戶的舒適感?有面部表情的機(jī)器人可以讓人感覺到它們與你建立了連接。隨著 AI 朝著 AGI 的方向發(fā)展,識(shí)別用戶的情感狀態(tài)并傳達(dá)情感回應(yīng)的能力將會(huì)變得越來(lái)越重要。你對(duì)此有什么看法?
Brett:我們完全可以做到這一點(diǎn)。我們的機(jī)器人頭部今天已經(jīng)有了一個(gè)全封閉的屏幕,可以傳遞信息,告訴用戶機(jī)器人正在做什么,還可以提供提示等等。我們?cè)陬^部還配備了攝像頭和各種傳感器。無(wú)論我們的機(jī)器人是照顧者還是在為企業(yè)提供服務(wù),都可以向用戶傳遞面部表情信息,以使他們感到舒適。
Figure 01 頭部可傳遞信息的全封閉屏幕
Source: Figure.ai
現(xiàn)在 NLP 已經(jīng)足夠成熟,可以讓機(jī)器人與用戶進(jìn)行對(duì)話性的交流。我們也可以讓機(jī)器人的外觀看起來(lái)更舒適??紤]到我們的業(yè)務(wù)還處于早期階段,我們需要花費(fèi)很多時(shí)間來(lái)實(shí)現(xiàn)。如果可以,我們一定會(huì)向消費(fèi)者提供這樣的體驗(yàn)。
Peter:我們聊了工業(yè)物流、制造業(yè)還有醫(yī)療保健,你最期待的下一個(gè)重要市場(chǎng)是什么?
Brett:我真的很愿意在消費(fèi)者領(lǐng)域、家庭領(lǐng)域和照顧老年人方面提供幫助。長(zhǎng)期而言,這些是非常重要的業(yè)務(wù),每個(gè)人都會(huì)擁有一個(gè)人形機(jī)器人作為助手來(lái)做事情。而另一個(gè)并沒有得到很多關(guān)注的市場(chǎng)是,我認(rèn)為人形機(jī)器人將會(huì)被應(yīng)用于宇宙探索。
Peter:你提到了我要說(shuō)的領(lǐng)域,太空探索。
Brett:我們正處在太空探索的黃金時(shí)代,這讓我感到非常興奮。這是由于正在建設(shè)的基礎(chǔ)設(shè)施為火箭發(fā)射提供了支持。我認(rèn)為人形機(jī)器人將是一個(gè)對(duì)人類非常有幫助的工具,可以幫助我們?cè)谠虑蚝突鹦堑鹊亟⒕幼〉亍?/p>
轉(zhuǎn)載請(qǐng)注明來(lái)自浙江中液機(jī)械設(shè)備有限公司 ,本文標(biāo)題:《Figure:為人類部署數(shù)十億臺(tái)人形機(jī)器人》
還沒有評(píng)論,來(lái)說(shuō)兩句吧...