大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

本期影片傳送門:「大小馬聊科技41(上)」

話題1、AI打遊戲,到底有啥用?

話題2、極氪為谷歌Waymo造車,靠譜嗎?

話題3、臉書新CFO,竟是成都妹子?

大小馬聊科技,用毒辣視角,聊科技熱點。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

每週聊3個科技熱點,我是小蛋泥,我是大衛,我是電動 Emma。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

AI打遊戲,到底有啥用?

我們先聊第一個話題, AI 打遊戲到底有啥用?這是我們之前挖的一個坑,因為很多觀眾留言都想聽大衛講 AI 打遊戲。其實說實話,我剛開始聽到 AI 打遊戲話題時,我內心還是有點猶豫的,因為我覺得遊戲設計本身不就是給人玩的?然後你讓 AI 打遊戲,比如說讓 AlphaGo 下圍棋或者是打星際爭霸,那這不是就是讓遊戲失去本來的意義和魅力了,我就挺懷疑的。大衛能不能先給大家講講我們為什麼要關注 AI 打遊戲?

其實我們不要把它理解為打遊戲,大家知不知道博弈論的英文怎麼說?叫 game theory 對不對?這個中文翻譯成博弈論,實際上英文的原本的意思叫什麼遊戲理論,所以實際上這裡面更多的講究的是一種博弈的套路。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

換成我們更接近現實的一個意義,這裡面涉及到一個叫 automated planning 這個 automated planning 翻譯成中文叫做自動化的規劃。 那麼我拿遊戲當中舉例子,大家再往現實生活中套,比如說我們打星際爭霸,對於沒有打過的朋友,我可以給你科普一下,就是它裡面有采礦,跟所有的即時戰略遊戲差不多的,都是要採礦。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

它還有一個人口,你不斷的要 build up 房子,來滿足人口需求。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

其次還有它的科技樹,就是你造不同的建築物的順序,讓你生產出來兵種可以高階或者不高階,始終我們是面臨三個 constrain ,三個限制條件。

第一個條件是說當條件理想的時候,我們既有錢又有人口的時候,我們可以想造什麼就造什麼。這個時候的 model ,在星際爭霸裡面叫做 concurrent model 就是我有錢我有人口,我想造什麼就造什麼,當沒錢的時候,那我們是有一種策略對吧,是先造建築物還是先怎麼樣幹別的。還有一種就是資源優先,我是不是要先去獲取資源?

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

所以大家在看,比如說我們現實生活中在施工在做一個工程的時候,假設我們要造一艘船,造船你就面臨著要提前規劃,你需要多少工人,多少 man power 然後你有什麼樣的工具,比如說吊車,你有多少電焊機?其次你的工序是什麼樣子的?那這些問題實際上都是 AI 可以幫助我們解決的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

也就是說遊戲不只是說只是打遊戲,而是把強化學習後的 AI 模型放到之後,我們工程生產當中的這種軟體當中,它可以快速幫我們規劃出一個生產線或者一個造房子。

比如說造房子當中的 BIM 就是很多行業的人都用這個,叫 building information management 它就可以幫我們說那你什麼時候鋼筋要到位,什麼時候你的電纜要到位?你的人工要怎麼算?如果遇到節假日,你要怎麼休息?你可以往當中加那些 constrain 限制條件,所以我覺得這是它的現實意義。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

是的,這個大衛也提醒我,我記得之前我在愛丁堡讀碩士的時候,我的專業是 computer science ,就是計算機科學。其中有一門選修課就是 game theory ,我剛開始看標題,我本來以為是講遊戲的呢,我覺得應該挺有意思,結果就選了,結果這個課淨講什麼演算法,講什麼博弈論納什均衡什麼,這些的感覺搞了一門數學課似的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

後來我還聽不懂那個課,因為感覺教授口音有點重,而且我上課也不專心聽講,後來就為了補課,我還去可汗學院,就是一個線上的教學平臺,這個也推薦大家可以去關注一下。後來我就透過看線上課,過了那門課的考試,反正我覺得這個還挺有意思的,確實它不只是遊戲這麼簡單。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

這個遊戲相對於之前大家熟悉的 Deepmind AlphaGo 最大的不同的就是大家下圍棋也好下,象棋也好下,無論什麼樣的棋,其實都是一種全資訊博弈。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

什麼叫全資訊博弈,就是咱們兩個看的是一個棋盤,你也不會說擋著不讓我看,那樣咱們怎麼玩,但是星際爭霸當中,實際上這個地圖雖然是一個很大的地圖,但是它是有迷霧的,你不用你的兵種過來,或者說你不用探測器,或者像人類的可以撒一個雷達。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

神族是有那個叫 observer 就是小叮噹,它可以飛過去看敵軍的整個狀況,這個時候你就可以實現了一種全資訊博弈。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

但是大多數情況下是一種非完全資訊博弈,非完全資訊博弈如果日常生活中大家比較喜歡打德州撲克,實際上德州撲克就是一種非完全資訊博弈,雖然檯面上有我們要去湊的牌,但是我們每個人手裡的牌對方是不知道的。那這種博弈狀況下實際上你還要猜對吧?所以我們還要拼心態,對不對?就是你可能看看我的微表情,大衛這個嘴角上揚了,是不是要贏了要 all in 了?然後其實我騙你的對吧。

所以就是你不知道別人全資訊的這種是不是跟我們現實生活是更加接近的。

對的,跟我們現實世界是更加接近的。因為我們網際網路時代已經解決了很多之前資訊不對稱的問題,比如說跨國交易,跨國做貿易,這個已經是解決了很多這方面的問題,但是還是一個非完全資訊博弈的一個狀態。

還有幾點我覺得這個遊戲很有意思的點,我給大家列出來,它是一個長時間規劃,叫做 long term planning 什麼叫 long term planning 呢?就是你不能一波推了,比如說大家 LOL 有的時候會面臨一個說這邊五個人對那邊五個人。 OK 我這邊給你那邊一波推了,是有這種可能。

但是星際當中其實不太存在這種我一波給你推了,為什麼呢?因為這個遊戲構成是比較複雜的,而且這個地盤也比較大,你如果一波沒有把我全推倒,因為 AlphaStar 它對面的人也是高手,其實都是大師級的高手,就是幾乎不存在一波推倒的可能。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

你沒推倒我,但是你一直在發展低階兵種,比如說你上來一直造小狗,就是蟲族造小狗,無限的造小狗,把所有的錢拿來造小狗,但是我這邊已經開發出空軍了,所以你推不掉我反而會被我反噬。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

這種叫是策略上的錯誤,導致科技樹沒有提升,我這邊高階兵種都能出來。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

所以這個遊戲當中還有一些博弈論是在於 long term planning 當中的。雖然它是 long term planning 但是它還有一個特點叫 real time 即時,大家玩圍棋也好,中國象棋也好,它是回合制的。比如說我跟小蛋泥我下一個子,然後我拍一下那個表,小蛋泥在開始計時再拍一下這個表。所以當他在拍表的時候,我是隻能思考不能動手對吧?但是星際這邊你可以動腦動手,我也可以動腦動手,它是這種狀態。

這裡面還有一個概念,就是所有玩遊戲的人都很清楚的叫做 APM ,就是 action per minute 就是你一分鐘你手速有多快?這是拼手速。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

但是恰巧在這個遊戲當中,我仔細觀察了一下,AlphaStar 的手速並不是特別快的,它是300 多 APM 也很快,但是人類能達到最高400多 APM ,而且平均下來也是 400 左右的 APM 。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

那就說明什麼,說明機器它每一個點它點的精確度是比人點的要高的。玩過遊戲的人都知道,有的時候手是瞎點的,噠噠噠噠的一直點讓它不斷的走線,這樣點但是機器在這裡面它是很精準的在走線。

還有一個點是跟圍棋不一樣的,或者說跟象棋不一樣的,象棋一般來說就是我往左邊,比如說我跟你攻守雙方,我拿炮打你,然後你拿車打我對吧,咱們兩邊相當於說在一個小範圍內做攻守,但是星際爭霸是可以同時多開的,我可以派兵偷襲你的家,你可以派兵偷襲我的家,咱倆還可以在地圖上很多個點正面交戰,它可以同時開五六個戰場,這個時候不僅考驗的是你的手速,還有你的地圖上還不斷的切換,你切換的時候還要再想,就是你這個時候打的是我這個兵,那我後面的要生產什麼?

所以它是多戰場同時開的,就是一個 large action space ,所以剛才我講的這五點都是跟象棋完全不一樣的,所以它的難度是非常高的。

跟那個圍棋不一樣吧?對,我這裡稍微補充一下資訊,大衛剛才講的 AlphaStar 應該是AlphaGo 的升級版。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

之前大家都是關注 AlphaGo 下圍棋,後來其實 Deepmind 的公司我們之前影片也聊過,它又做了 AlphaStar 用個人工智慧去打星際爭霸。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

星際爭霸就是我們小的時候很多人玩的,就暴露年齡的一款遊戲,主要是星際2。

對星際爭霸 2 ,我剛才聽大衛講 AI 打遊戲打星際爭霸。我覺得在現實生活中的比較有意義的比如說在商場上打商戰,比如說公司和公司之間這種博弈的,我覺得會比較有用,因為它一方面是你在生產方面就在資源怎麼匹配的時候有用,另外你不能純粹的 all in 。還有比如說在你不知道對方有什麼資源的情況下去怎麼進行你的策略,我覺得這個是 AI 打星際爭霸可能在現實生活中的一個應用場景。

然後 AlphaStar 剛開始拿來的訓練模型它不是上來就用很低階的訓練方式的,它其實上來就用league 當中比較,就是鑽石以上的 league 拿它來訓練的,所以它的起點就很高。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

這個裡面有個特別逗的,它還有自我博弈,就是自己跟自己玩,剛開始快速推對方特別容易獲勝,就是 rush 。

咱們都知道,無論是拿蟲族的小狗,就是小狗的那種 rush ,還是說神族拿 zealot ,就是狂徒把別人 rush 掉。剛開始勝率就很高,後來換了一個大師的錄影,然後大師就上來打防守戰,防守後來就長期戰,後來 AlphaStar 就不行了,但是訓練,然後 AlphaStar 也學會上來先發展經濟,就弄一堆民工採礦,然後先堆科技樹,後來又把人類給推了。

後來這個又拿別人訓練說可以偷襲,我空降到你這或者在你家邊上造一個水晶塔,然後放隱形刀客。這個時候 AlphaStar 就有點吃癟了,你知道嗎?我還沒見過這種操作,你上來給我放隱形,但是經過幾百輪訓練,它也學會了。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

所以它這是每一次在一個自我迭代的過程中,而他這種自我迭代不是說長期打法就忘了 rush 了,它也會用 rush ,它每一次都是一個新的進化體,它就是透過學習人類的比較大師級的操作,然後去訓練自己的模型對吧?

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

對,而且他每一個兵種,比如說舉個簡單的例子,這個 stalker 他是一個相對於 zealot 相對於狂徒的一個高階兵種。打 stalker 更高階的其實是用 immortal 就叫什麼不朽者,不朽者特別擅長打帶裝甲的。

那麼它們是怎麼訓練呢?就是我上來造很多 stalker ,然後看它什麼時候達到一個納什均衡要輸了,然後在那個時候它會把它記錄下來。這個就是我訓練兵種達到一個 optimum ,然後再開始第二個兵種,第三個兵種第四個兵種,所以它其實是全兵種作戰的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

不是說你們可能看影片看 AlphaStar 和 Liquid Mana 在打仗的時候就只用到了陸軍,實際上他們在訓練的時候是一直打到空軍打到最高的 ladder, 就是科技樹當中打到最高,但是為什麼就沒用呢?因為人類太菜了,就 10 比0。還沒打到空軍,每一場都輸,最後 Deepmind 為了給人類點面子,說把規則稍微調一下,人類最後 1 比 10 慘敗。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

但是我有一個問題,今天的話題是說 AI 打遊戲到底有什麼用嗎?但是聽完你說我感覺不是所有的遊戲,它對於模擬生產模擬發展這些都是同等積極的作用。

這個是即時戰略遊戲,叫 real time strategy ,這種遊戲更類似以前,比如說咱們在牛津劍橋的時候看到有那種 war game store 你知道吧,就是賣那種 war game 的,類似棋牌的那種 war game 它其實是一種電腦版的 war game ,就是你有棋盤格,你上面有兵種,兵種有各種屬性,還有科技樹,然後你還要根據時間軸來積攢你的礦。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

它是有很多很多 constrain 的,但是有些遊戲它是沒有這方面的 constrain 的。比如說像大家愛打的 LOL,它其實就少了很多 constrain ,它其實更多的是在配置和控制上面的。

除了大衛講的星際爭霸,我也仔細想一下到底 AI 打遊戲對我們有什麼實際的用處,我其實想到了三點。首先第一點我感覺現在遊戲不只是這種即時策略,我之前比較愛玩的遊戲是 switch 上面的叫塞爾達。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

那它這種遊戲是一種開放世界的這種遊戲,之前像大家玩的吃雞也都是這種開放世界的。因為我們其實只是開放世界的玩家之一,如果有更像人的這種 NPC ,就這種電腦玩家的話,然後用 AI 的實時的跟你一起玩的話,我覺得在開放世界當中它是一個相當於角色之一,我覺得這個是第一點。

第二點的話我覺得現在遊戲這個概念我們應該把它想得更寬泛一些,把它當做現實世界和虛擬世界的一個連線口,比如說我們之前經常講的自動駕駛模擬,你不可能在所有的情況下都是用實際的車去撞,實際的去碰。而且你把引數扒下來,其實是可以去更高效地去訓練自動駕駛的,所以我覺得遊戲的概念也可以是一種就虛擬場景的在一些產業方面的訓練的作用。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

第三個方面我其實還想到了,就是比較發散,有點科幻片的,我感覺以後會不會就是像我們做的 AI,機器人,就這些它會有自己的自主性,有點像終結者電影,就施瓦辛格演的那種,我感覺會不會以後有可能人類不是特別好控制 AI 機器人的時候的話,那相當於我們可能透過遊戲,相當於給它找個事幹,有點這種訓練的方法一樣,所以這個是比較我瞎想的一個開放的點,目前我是想到這三點。

你三點,我逐一回答一下。首先第一個你剛才提到那個遊戲就是像吃雞遊戲,就 PUBG 它是一種沙盤類的遊戲,而沙盤類的遊戲實際上是很難做到強化學習的,或者說它是一種純無監督模型。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

我知道之前在給大家講特斯拉 FSD 的時候也給大家講過什麼叫監督模型,什麼叫無監督模型?就是為什麼那種沙盤遊戲對於電腦來說特別難玩呢?因為裡面的變化太多,比如說你可以藏在哪偷貓人家一下。

我之前遇到更搞笑更搞笑的一個影片,就是兩邊組隊,這邊五個人,那邊五個人,然後有這邊的一個高手,就拿一個大狙,就是一個長瞄來瞄去,那邊梆打死一個,呀怎麼沒死,等我又打一下,明明死了咋沒死呢?他就一直待在那又打一下,又死一個。怎麼還沒死呢?後來這人就納悶地走過去,梆梆一下,被對方打死了。

你知道為什麼嗎?因為對方五個人穿了五件一模一樣的衣服和頭盔,你知道這有多扯淡嗎?他穿了五件一模一樣的頭盔,倒下一個,另外的兄弟就拿包紮給他治,然後又站起來一個健康的,然後倒下一個又站起來一個健康的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

這邊這個人就覺得,你怎麼四次你都不死,我就跑過去看一下,梆檔被對方一槍爆頭。所以你說這種玩法 AI 是沒有見的,就沒見過你人類這麼騷的操作。對於這種無監督學習來說,其實強化學習已經失效了。

不過這也是這種沙盤遊戲或者開放世界這種遊戲的魅力,它就是各種隨機性,各種不可控性,贏得遊戲不一定是玩家的最終目標,大家有可能在遊戲裡頭各種搞笑,然後各種瞎搞,其實生存就是他玩遊戲的目標。

笑死我了,你想人類有多騷氣,就是在面對這種操作上,但是星際本身它還是一個比較規範化的。雖然我剛才講了它有很多相對於圍棋更高維度的策略和玩法,但是它還不是那種純開放性的遊戲。比如說像 PUBG 就是吃雞,它是一個特別開放的遊戲,所以電腦過來肯定吃悶棍。

剛剛小蛋泥講的第二個關於自動駕駛模擬的問題,這裡面有一個比較貼切的例子,機器在做 planning ,比如說我們公司的工程師在用遊戲引擎訓練汽車在 planning 的時候,它也是製造了一個強化學習,而且也是有標準的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

這個標準其實不是人的標準,你看剛才我已經講了像 PUBG 這種遊戲,你的對手是人,人是很騷氣的,人是沒有標準的。但是車行駛在路面,它不是為了戰勝人,這個本質是不一樣的,它是為了讓人或者說機器本身是有一個限制的。那麼這個限制當中無非幾個維度,有時間維度,有空間維度對吧,我這個車在路面上我還有限速的資訊。

如果對面是行人,行人相對於車行人是 top priority ,那我肯定要讓你,我不可能跟你玩一個很騷氣的操作,我別你一下,你看你爽不爽對吧,機器是沒有這種操作的。所以這個時候我們還是在用一個強化學習,就是有範本的。

只是說好一點的自動駕駛的 planning 相對於弱一點的,它是會讓你的體驗感更好,它的流暢性更高。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

比如說舉個例子,如果一個單行線兩邊的車只能透過一輛,就是一條路兩條線這種單行線,如果有一個車佔到你前面的車道,這個時候你就要逆行,你要 Sidepass 到逆行,然後再穿過它。那這個時候就有很多情況出現了,比如說這個車它雖然佔了你的道,但它是溜著往前走的,或者這個車是停下來打雙閃的,那你的策略就不一樣,你這個時候如果要 Sidepass 它,如果對面來了一個車,那你肯定是要先讓那個車對吧。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

如果對面有一個行人,你也要先讓這個行人,所以這裡面你是可以枚舉出來一些 scenario ,然後針對這些 scenario 再做訓練,做出時間更快,然後讓車運轉的更平穩的這個策略的。

因為我剛才已經講了你的終極目標不是戰勝人,而是讓車它跑得更平穩,所以這是一些區別。然後第三個關於小蛋泥講的就是說它會不會成為一個 terminator ,我理解機器跟人打仗機器只能打得準,但是它沒有人那麼騷氣。

所以戰爭實際上是沒有一個嚴格意義上說我要怎麼打,你要怎麼打的。當然大家要遵守日內瓦公約,你不能虐待對方戰俘等等,但是在我把你打敗這件事情上實際上是沒有什麼限制的,我可以埋在土裡對吧,我把我自己埋在土裡,然後你一出來梆給你一槍。但這個時候機器就需要更高級別的感測器等等它才能發現。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

如果是一個純的 terminator ,就是我大膽的想象,它其實是很難跟人進行對抗的,因為人有各種各樣很騷氣的操作,它只是能比你跑得快,比你看得準,比你打得準。但是戰爭往往不是以這個為最終的決定目標的。

剛才你們說了一個很有意思的點,就是說現在遊戲它變成一個現實世界和虛擬世界的連線,我覺得如果是按照這個邏輯的話,它的意義就不只是像你們剛才說的很多科技領域的意義。其實在人文領域,比如說我認識一個導演朋友,他也轉行去在遊戲行業裡面去創作了。

其實這個再往深推一步,它有可能就是一種新的更加立體的電影的形式。也是我們現在很火說的那種元宇宙,所以在除了剛才我們說的這些科技領域的應用,其實它對於藝術的創作,還有整個影視發展其實也會有很顛覆性的印象。

我覺得對,我這回為了準備咱們節目,我 review 了幾篇論文。當然作為一個談話類聊天節目,堪比《鏘鏘三人行》,我們並不想把節目拉得特別深。所以我之後會把論文的連結讓小蛋泥放在它下面,對於有需要的觀眾朋友們可以去看一下。

這裡面有幾個比較讓我覺得很有意思的如何做 building order 就是建築策略,就是在你有錢的時候,沒有錢的時候,還有比如說突然你的礦不夠了,或者說你被一個隱形的敵人被攻擊的時候,你都有很多,就是它在策略上突然中斷我之前所有的神經網路模型,拿一個新的模型處理這件問題,因為這個問題更棘手,所以這時候就是它一個策略中斷,然後它再重新把策略開啟,所以跟人的邏輯還是挺不一樣的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

對是的,等到時候大衛把論文發給我,我會上傳到小丹尼知識星球,大衛負責提供彈藥,我負責來賣。

進貨上了。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

我覺得即使是像我這種既打遊戲不多,然後對 AI 理解也有限的人,也很值得看看。因為像我們剛才說的,其實 AI 打遊戲對於一些產業的發展甚至是世界的構建都越來越重要。那世界上絕大部分人連這一點其實都不知道,更不要說它裡面的什麼邏輯、戰略什麼的。

所以你這些不知道的情況下,你怎麼參與到這個新世界的構建呢?所以我覺得就是還是要在這方面多學習,即使你不是這一行的人。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

這個遊戲的模型特別適合做沙盤推演,不只是說軍事上的沙盤推演,我一直在想,就是說在工業生產上的沙盤推演也是很有用的。

比如說你一個生產線如何爬坡產能對吧,你現在就這麼點錢,就這麼一條生產線。那你如何在這麼多 constrain 的狀態下,你就這麼多 man power ,然後做出一個最優解,那這裡面都是可以用到一些強化學習模型。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

其實我覺得這裡面也是一個很好的商機,如果誰利用 AlphaStar 這套東西來重新訓練一個 BIM ,就是 building information management 把這個東西加進去,那之後我們在造樓,比如說做造價的時候,就是建築造價的時候,或者說在造船行業、汽車生產行業都可以有明顯的效率提升。

我很早之前就知道其實寶馬公司自己做了一套模擬引擎,就是這些生產線上面是怎麼去給料,然後工人哪怕,就是它可以模擬出來人休息了調班了怎麼樣,如果給料給的不及時是怎麼樣的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

後來我有一次跟我那個朋友他是做汽車行業的研究員,他說他去訪問了豐田公司,就豐田第六代的生產線,因為豐田給 Tesla 實際上是第五代生產線,豐田它有一個第六代生產線,它第六代生產線精確到什麼程度呢?就是說把產線上的工人從 144 步減少到 72 步,它整整減少了一半的步數。所以他們其實在做組裝的時候是很精確的,就是你多少步之內完成這件事情,相比之下,我覺得中國在做這方面還是粗獷很多的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

我其實聽下來我感覺 AI 打遊戲對我們的現實意義,我把它總結為兩個方面。第一個方面就是大衛比較強調的偏理性的,就是在你資源有限的情況下,你是如何把它效率最大化,回報最大化。

就比如說在生產線,在這些製造方面怎麼去,比如說透過打星際爭霸這種策略性的遊戲去獲得最高的收益,這個是第一個方面。

第二個方面主要是 Emma 說的比較創新性、比較感性的方面,比如說做這種藝術創作什麼的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

其實之前我們做《 DannyPal 》的節目也類似《大小馬聊科技》,我們請過嘉賓是博柔和嘉劍。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

他們是原來在清華讀的本科,然後耶魯讀的碩士,他們主要是搞建築的,我看現在他們在哈佛也在做一些事情,就是和遊戲元宇宙相關的。我感覺這個方面也是相當於把遊戲做成現實世界和虛擬世界的視窗,把它做成一種手段。那我覺得這個其實是兩方面,我聽到的對現實意義的價值。

還有一個剛才大衛說的很有趣的,這裡面也會有一些商機,就是你用 AI 打遊戲的那些技術去賦能原來的一些傳統行業,這其實就是另一種網際網路+只不過是 AI 打遊戲+了。

那你說的這個騰訊很愛聽,這騰訊,之前大家不是老說它遊戲公司,感覺這種不是很符合社會主義價值觀對吧,有點毒害青少年的感覺。但是騰訊這兩年我自己作為騰訊的一個小股東,我就發現現在騰訊搞遊戲也經常要往這種主旋律上靠對吧,比如說用遊戲的手段去恢復古長城,或者是做一些公益相關的事情,我覺得還挺有意思的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

我小時候玩過一個遊戲,叫做足球經理,我不知道小蛋泥玩沒玩過,是可以經營一個足球俱樂部,然後買賣球星對吧,其實這就是一個我覺得很有意思的遊戲,如果現在用強化學習來玩這個遊戲,估計直接幹出一個宇宙第一足球隊。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

是的,就是一個足球遊戲,但是你上不了足球場的,都是全是在幕後的操作那種感覺。

實際上我們就講到現實,現實一點我們永遠都面臨了很多 constrain ,有一次我跟我母親聊天,他說如果有足夠的錢和足夠的時間,那你可以造出一個足夠牛的,甚至是一個石油平臺航空母艦都是可以的。

但是現實往往它不同的點就是,我們沒有足夠的時間,也沒有足夠的錢。那我們怎麼造出一個優秀的產品?其實國與國之間也是這樣的,沒有一個國家擁有所有的資源對吧?然後每一個國家在這個地球上都是隻有一塊地盤,有這麼多人,那你怎麼造出來就是相對於別的國家更先進的更發達的技術和產品,這就是一個很龐大的星際爭霸的一個體繫了。當然這裡面的 constrain 更多,不只是人的問題、錢的問題,還有很多可能我都一下子想象不到的這些 constraints。

大衛說這一點很有意思,我們最近不是在迪拜,大家都知道迪拜阿聯酋肯定是特別的有錢,也是這種網紅城市,我們上集影片也聊了。但是我們明顯感覺其實哪怕像迪拜這麼有錢,阿聯酋這麼有錢,它也是有各種這種限制的,也是有這種資源需要去匹配的。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

比如說我們前兩天登哈利法塔,它也就是在 2008 年出現經濟危機的時候沒錢了,也還是需要阿布扎比的酋長去支援它。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

還有哪怕它投入錢再多的一些酒店,大樓什麼的,其實你過了十來年再去看的話,我們像常駐北上廣的這種人的話再來迪拜看,說實話就並沒有那麼的驚豔。所以我想說就是我很贊同大衛說的這點,就是哪怕你感覺再有錢,但你其實也是有各種限制的對吧,有時間限制、有錢的限制,所以我們還是可以透過這種遊戲的模擬的手段,去各種的試,對吧。

剛開始很有錢的國家拼命造小狗,然後科技樹沒拔起來,被人家反噬。實際上這個例子在世界當中是很多的,也有很多後起之秀,單純靠策略就贏了。

其實像迪拜這種地方,就迪拜和阿布扎比是既有錢,如果放在星際爭霸裡,你上來就感覺無限黃金了,你錢特別多,但人口不行,就是你沒有那麼多人,所以這時候怎麼開始造房子,開始把人堆上來,你就可以玩命的造了。但是迪拜我覺得他們還是選擇了一個比較好的科技樹,就是沒有做特別吃老本的事。

我想提出一個代表那種不喜歡玩遊戲然後反遊戲的人的問題。第一個問題就是市面上有多少遊戲是真正對這種科技有用?對這種訓練技術規劃這些有用,有多少是真的就是讓大家上癮的。第二個問題就是你們剛才說的很多訓練的用處,其實是不是用另一個東西也可以訓練?比如說你如果是去廚房做菜,它也是要有限的資源人匹配料對吧。那為什麼我們要選擇一個這麼男性化的場景去訓練這些東西呢?

主要是星際爭霸是一個明星遊戲,當然你也可以用什麼足球經理對吧,還有專門你剛才說的廚房,廚房裡面有一個遊戲,就專門經營一個廚房,經營一個餐館的,就是你放多少椅子,放什麼菜,吸引多少顧客來僱多少店員也可以。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

但是還是維度有點低了,所以當時 AlphaGo 整個 Deepmind 團隊選遊戲的時候就選了這麼個星際2的網紅遊戲,它沒有選 Dota 或者 LOL,我覺得還是因為覺得 Dota 和 LOL 維度太少了,星際2確實是一個你能找到維度比較多的一個場景。

還有剛才第一個問題什麼來著,第一個問題就是有多少的遊戲真的是為了技術的發展,就像你們說的有多少是就是純玩的純玩的上癮的,然後掙錢的。

這個問題很好,我記得我上大學的時候打星際,我本來是複習累了,想打會星際打完更累。就這遊戲實在太燒腦子,然後手還疼,因為你手速要快,所以這個遊戲不是那種休閒放鬆類遊戲,它是一個就是說讓你很集中精力,很拼手速的這麼一個遊戲,說實話它不放鬆。所以我有時候覺得人家打職業聯賽,比如韓國那些打星際職業聯賽的,我這份錢該人家賺,太難了。

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」

我也覺得 Emma 問題特別好,我感覺真正對現實世界有用的遊戲比例是特別少的,我覺得這個其實是我們做 AI 打遊戲,它主要的目的是提升一種能力。遊戲只是它的一個載體,比如說選了圍棋,選了星際爭霸 2 什麼的,最主要是看我們訓練的它的能力,而不是說看它載體到哪個遊戲方面。

我感覺就是絕大部分遊戲還都是供娛樂使用的,確實是會出現那種比如說沉迷或者什麼的。但是我對遊戲的感覺其實我很贊同段永平的觀點,就是說其實遊戲就是一個放鬆的,如果你不打遊戲的話,你還是有其它的這種容易上癮的酒煙什麼的,所以不能怪遊戲本身,要怪的話就怪那些容易上癮的人,這個是我的觀點。

人性之惡,這個就是人對很多東西都上癮,你說你不讓抽菸,他還可以對別的上癮。但癮這個事情實際上是在於人而不是在於載體對吧,那倒是不讓抽香菸了,還有電子煙,電子煙抽多了也就上癮。那你說不能把電子煙再戒了,那還有很多東西。

那倒是,因為我們就在阿聯酋這種穆斯林的國家,女性都是我們上一節也聊了,女性都是黑布裹起來的,但是還是能在街上看到那些外圍女,所以這些東西是封不住的。

極氪為谷歌Waymo造車,靠譜嗎?

臉書新CFO,竟是成都妹子?

更多內容掃碼檢視原文:

大廠都搞AI打遊戲,到底圖啥?「大小馬聊科技41」