“烏合之眾”和“眾愚成智”:為何“群體”有著兩副矛盾的面孔?

如果要開列一份現在市面上最知名的心理學、社會學作品清單,古斯塔夫·勒龐的《烏合之眾》一定會榜上有名。這本首版於1895年的作品為“群眾”勾勒了一個“臭名昭著”的畫像:即使一個頭腦清明的人,一旦置身於群體之中,就會瞬間失去自己獨立的判斷力,盲目地追隨群體的觀點與行動。不過,這本書所享有的盛名多少有些依賴於讀者的心理而非文字的質量,在許多學者看來,勒龐並未採取科學合理的研究方法,通篇充滿了斷言和偏見。人們對其的熱捧,恰恰源於一種“第三人心理”:我讀《烏合之眾》,但我自己不是烏合之眾中的一員。

勒龐之後,“大眾研究”日漸成為一個熱門的研究領域,時至今日,來自心理學、政治學、社會學、動物行為學等多個領域的學者都在為研究人類群體的行為貢獻自己新的創見,“群體”的面孔也不再侷限於“烏合之眾”這一面。法國心理學家、認知學者邁赫迪·穆薩伊德在《新烏合之眾》中呈現了當今最新的一些大眾研究成果。在他看來,群體其實遠比勒龐描繪的更有智慧,即使個體的才智有限,但一旦他們共同行動,往往能“眾愚成智”。不過,“眾愚成智”的群體也同樣具有“烏合之眾”的一面,這兩副看似矛盾的面孔同時體現在當代的群體身上。以下內容經出版社授權摘編自《新烏合之眾》,有刪改,小標題為摘編者所加。

“烏合之眾”和“眾愚成智”:為何“群體”有著兩副矛盾的面孔?

《新烏合之眾》,[法] 邁赫迪·穆薩伊德,版本: 中信出版集團·新思文化,2021年6月。

群體的智慧

“女士們,先生們,看過來!快來試試您的財運吧!”

說話的農民拔高了嗓音,想蓋過身邊的一片豬叫聲和雞鳴聲。在他身邊的木製看臺上站著一頭壯牛。它體形龐大,毛色光亮,用一雙懷疑的牛眼打量著身邊圍觀的人群。“ 只要您掏半個先令,女士們,先生們,這頭漂亮的大牲口就歸您啦!”這是 1906 年一個深秋的午後,英國西南部港口小城普利茅斯正在舉辦一年一度的牲畜與家禽博覽會。這裡聚集著各色人等,牽著牲口的農戶與穿修身長大衣的花花公子擦肩而過,農業專家和維多利亞時代的老幼婦孺擠在一起,他們都是來這裡觀賞全國最優質的牲口的。女人們都穿上了最好的鯨骨蓬裙,孩子們足蹬漆皮高幫鞋在泥水裡亂踩。

那一天,一位農戶照常組織著有獎競猜以招徠路人在他的攤位前駐足。參加者只要花 6 便士,就有機會猜測這頭公牛屠宰後能夠產生多少公斤的牛肉。經過稱重驗證之後,答案最接近正確數值的競猜者就能贏得全部的肉。

在一片攢動的高禮帽中間,有一位鬢髮茂盛的 84 歲老紳士正盯著場子中間賣牛的農戶收取下注的錢。他就是弗朗西斯·高爾頓(Francis Galton)爵士,19 世紀最活躍的知識精英之一。在他看來,芸芸眾生的智力水平只到他的腳後跟,而眼下這群圍著牛下注的烏合之眾,並不比地上啄著他靴子的母雞更有腦子。彷彿是為了證實這一點,這位研究者本人也上前到農戶那裡下了一注,然後轉身回家,確信自己又找到了優生學理論的最新證據。這些牛肉、這位科學家和 787 個參與下注的人,就這樣成了科學史上一場驚人發現中的重要角色。一個世紀以後,這個發現引發了大眾研究的全面革新。

弗朗西斯·高爾頓出身英國貴胄。他的家族在兩代人之內誕生了不少當時英國最重要的知識分子,有醫生、植物學家、探險家、詩人和大實業家。他的表哥不是別人,正是查爾斯·達爾文。本著英國人的精神,高爾頓甚至研究了茶的化學成分和蛋糕的幾何分割。比如他認為把圓形蛋糕切割成扇形,一片一片吃掉是“ 錯誤的方法”,而且他列了方程式來證明這一點。按照爵士的計算,應該沿蛋糕的直徑從中間切出一條來吃,然後把剩下的兩個半圓合起來,這樣蛋糕留到第二天也不失美味。謝謝您啊,爵士!

但高爾頓如今為我們所知,主要因為他是“ 優生學之父”。高爾頓深信,他本人的家族中智者輩出,絕非偶然。因為聰明和愚蠢一樣會遺傳,父傳子,子傳孫。因為擔心大英帝國裡會誕生越來越多“ 低能蠢笨”之人,他提出了優生學的基本理論。他強調,為了人類的共同利益,應該鼓勵聰明的人多生育。與他的表兄達爾文幾十年前在《物種起源》中提出的“ 自然選擇”理論恰恰相反,高爾頓推崇“ 理性選擇”。

高爾頓同時也是一位出眾的統計學家。他建立了人類形態研究實驗室,測量不同人種的認知能力與他們各自外貌特徵的聯 系。像他自己這樣的白人顱骨光滑碩大,位於人種等級的頂層, 而下等人、女性,還有他在英國殖民地各處旅行時考察的非洲當 地人處於等級底端。這一套優生學理論在隨後幾十年中傳遍世界。在其影響下,美國 1909 年首度立法,給“ 罪犯和智障者” 絕育。而這樣的“ 優生學”理論在納粹德國手裡發揮到了極致。

在高爾頓的時代,類似的精英主義觀點並不少見。與他同時代的很多知識分子都深信烏合之眾是愚昧無知的,而且他們數量越龐大,就越愚蠢。古斯塔夫·勒龐(Gustave Le Bon)在其1895 年的著作《烏合之眾:大眾心理研究》中也說:“ 人獨處時智慧,成集體時愚昧。”而早在 1841 年,查爾斯·麥凱(CharlesMackay)在《非同尋常的大眾幻想與群眾性癲狂》(Extraordinary Popular Delusions and the Madness of Crowds)中指出:“大眾”缺乏反思能力。

“烏合之眾”和“眾愚成智”:為何“群體”有著兩副矛盾的面孔?

《烏合之眾》,(法) 古斯塔夫·勒龐,版本: 上海譯文出版社 2019年10月

高爾頓先生正是在這樣一種時代背景下去普利茅斯“ 趕集”的,他的目的是收叢集氓無腦的新證據。在翻遍 787 張下注的單子之後,他滿意地記錄下了結果:大多數人的預估與正確答案謬之千里,有的過低,有的則太高了。然而,這些預估數字裡卻藏著一個驚人的秘密。農戶將牛屠 宰以後,這頭大牲口變成牛肉的淨重是 543 公斤。而參與競猜者集體估算的平均值是 542 公斤,幾乎堪稱神算!

這難道純屬巧合?每個個體的預測都是錯的,而且誤差範圍很大,為什麼所有答案的平均值恰好是正確答案?“也許大眾的民主決策,比我們以前想象的更值得信賴。”驕傲的高爾頓爵士,作為“優生學之父”,於 1907 年發表了他的這一研究結論, 這顯然對他本人的優生學理論是個諷刺。

在高爾頓研究成果發表後的 97年裡,這個驚人的發現一直無人問津,被引用數加在一起也沒超過10次。但在 2004 年,它藉助暢銷書《群體的智慧》(The Wisdom of Crowds)的問世重見天日。這本《紐約客》專欄作家詹姆斯·索羅維基(James Surowiecki)的力作寫的是集體智慧正在改變我們今日的社會和經濟。為了證明“ 群體的智慧”,索羅維基旁徵博引,這才舉出了高爾頓爵士當年的經歷,吸引了當時研究者的目光。

此書掀起了一陣對這個驚人結論的科學探求之風,在數年內開啟了大眾研究的新局面。高爾頓爵士無意間揭示的這個現象還沒有一個專門的名稱,研究人員便順手以索羅維基這本書的名字“ 群體的智慧”來指代它。這個現象的規律很簡單:當人們預估一個數值時,無須任何專業資質,所有普通個人估值的平均值最接近正確的答案,它肯定比這群人當中任何一個優秀個體的估計更準確。比如,如果 你想知道埃菲爾鐵塔有多高,只需要到大街上隨便攔住 50 個人, 不經過任何挑選,再問他們:“ 您覺得埃菲爾鐵塔有多高?”然後求出 50 個答案的平均值,或找出中位數更好,你會得到“324 米”的答案,這就是埃菲爾鐵塔的高度。

奇怪的是,在 2011 年進入心理學領域以前,我聽都沒聽過這個現象。研究大眾的人,不知道大眾很聰明。過分了!我為這一現象在科學研究中的可能性感到興奮,開始自己組織一系列實驗。我大概做了十幾個估值測試類實驗,比如猜測紀念碑有多高,兩個城市之間有多遠,一條河的長度,一個屋子裡的溫度,一個公園的面積……結果屢試不爽!每一次,大眾都給出了令人滿意的答案,哪怕實驗中個體的答案大多數錯得離譜。如果問題更復雜一些,不只是簡單的猜數遊戲,那集體的判斷還有意義嗎?在我的研究過程中發生的一件大事,也許是這個問題的最好註腳,那就是大眾與加里·卡斯帕羅夫的傳奇棋賽。

1999 年,微軟遊戲平臺向全世界發出一份邀約,邀請玩家來挑戰國際象棋界的標杆、來自俄羅斯的國際象棋世界冠軍卡斯帕羅夫。不問棋藝如何,不需要任何資歷,誰都可以參加。受到這樣一個前所未見的挑戰的吸引,來自75個國家的超過5萬名棋手上了場。他們中既有業餘棋迷,也有俱樂部選手,還不乏一小撥棋壇新銳,但不管怎麼說,5萬人中沒有一個跟卡斯帕羅夫屬於同一個級別的。

這麼多人要怎樣相互配合,才能下出一盤邏輯連貫的棋?微軟平臺給大眾隊每一步 24 小時的時間,在此期間每個參賽者都可以提出自己的建議。平臺收集所有建議,在一天結束之時,最多數成員共同選擇的棋著兒會體現在棋盤上。

這場比賽情況特殊。兩年之前,這位俄羅斯世界冠軍剛遭 計算機“ 深藍”重創,如今又不得不忍耐這麼一堆非常規選手。比賽的結果具有很大的不確定性,這 5 萬個平凡的小腦瓜,到底能否攻破棋壇“老大”的棋局?

1999年6月21日,棋賽開始。俄羅斯棋王執白子,首先挪動了他的“國王”。在24小時的懸念之後,大眾隊做出了迴應: 一招“西西里防禦”,給出了對卡斯帕羅夫開局的最佳回擊!大眾隊看來不是外行,主辦方放心了。讓對決繼續吧!

這一盤棋下得高著兒迭出。業餘大眾隊不僅玩得十分專業, 還不乏出其不意的奇著兒。比如他們走的第 10 步,在高水平國際象棋賽事中前所未見,足以載入史冊。那一步究竟是斷送勝利的爛著兒,還是大眾創造出的神來之筆?實際上,這步棋事後被卡斯帕羅夫本人贊為“ 卓越的理論創新”,也成為後來國際象棋比賽中常用的著數。很明顯,從這一步開始,大眾隊佔了上風。然而棋王終究是棋王,沒那麼容易扳倒。在連續4個月的艱苦廝殺之後,棋王卡斯帕羅夫僅餘3子,下出了他的第64 步……將! 大眾隊可謂雖敗猶榮。他們不僅一直與棋王不相上下,還創造了新的國際象棋經典招式。“烏合之眾”的判斷遠遠超出我們的預期。

研究者們的注意力越來越多地轉向更實際的問題,比如依靠 綜合數十人給出的解決方案,來尋找困難問題的最優解。我的一部分同事走得更遠,甚至開始專門關注“ 醫生群體的智慧”。同事們的研究顯示,在一系列臨床問題上,諸如患者是否需要手術,或者乳腺超聲檢查是否真的查出了癌細胞等,情況就像網路大眾隊與棋王卡斯帕羅夫勢均力敵那樣,一群醫科大學生的綜合判斷似乎比一位經驗豐富的專科醫生的個人判斷更為準確。

我們今天正逐漸認識到這一現象的內在邏輯:它並不屬於哲學或心理學的範疇,而是一個機率論和統計學的現象。事實上, 對於上述無論哪一類“挑戰”,大家對正確答案都有一個模糊的想法。當然他們會出錯,估計得太高或太低,但如果樣本量足夠大,個人之間的誤差會相互抵消,讓人們思維中的共同之處凸顯出來,從而得出接近正確答案的估計。

“烏合之眾”和“眾愚成智”:為何“群體”有著兩副矛盾的面孔?

《群氓之族:群體認同與政治變遷》,[美] 哈羅德·伊羅生,版本: 廣西師範大學出版社·理想國2015年1月。

要把這個現象視覺化,不妨想象一下擲飛鏢遊戲。一大群人一起玩飛鏢,當然是有的人甩高了,有的人扎低了,有的人偏左,有的人偏右。但這些飛鏢落點的平均值還是會相當接近靶心。那些誤差彼此抵消了。即便你喝醉酒又蒙著眼,投出了幾次極差的成績,最終的平均落點也不會離正中太遠,畢竟所有玩家投飛鏢時瞄準的都是靶心在這種情況下,人多勢眾確實勝過專家的單槍匹馬。假如你約上 20 來個朋友,就能輕易擊敗荷蘭的世界飛鏢冠軍邁克爾·範格文(Michael van Gerwen),前提是裁判同意讓大眾隊每人投一次,然後求平均值。

然而,並不是所有情況下“ 烏合之眾”都最聰明。首先,參與群眾得對問題的解決方向有基本的直覺才行。還是以飛鏢來舉例,如果群眾隊中的成員根本不知道靶心在哪兒,那他們的飛 鏢將完全是隨機投出的,即使求落點的平均值也沒用。真正關鍵的因素還在於,群眾不能都犯一樣的錯,必須錯得花樣百出才 行。如果所有沒扎準的鏢全在靶心的左邊,平均落點也會向左偏 移。只有當扎歪的飛鏢分佈均勻,平均值才可能在中間。這就是斯科特·佩奇(Scott Page)著名的“ 多樣性預測”定理:判斷的多元化,包括錯誤的多樣性,是“ 群體的智慧”生效時必不可少的因素。

不幸的是,多樣性這一關鍵因素恰恰是相當脆弱的,它的頭號敵人就是我們前面研究過的人際網路中的社交影響力。同樣的競猜遊戲,如果個人在發表各自的估計之前有機會先跟別人討論上5分鐘,那麼大多數人的判斷都會趨向同一種錯誤。就好像有的飛鏢上裝有磁鐵,當其中的一枚接觸飛鏢盤後,其他的飛鏢全 都會朝著它的方向偏,從而失去錯誤的多樣性。

社交影響力的負面效應可以表現得很快。近來有大量的研究證明,一個小小的暗 示就足以讓大眾判斷的平均結果偏離正確答案。這就是為什麼 我在日常生活中從來都沒辦法向朋友們證明“ 群體的智慧”有多妙;不管我如何三令五申不能跟其他人透露自己的猜測,在我 說完題目的那一秒鐘,總有那麼一位缺心眼兒的朋友直接喊道:“埃菲爾鐵塔?至少得有 500 米吧?”這下誰也玩不成了。因為他的這個小小提示會在其他人的腦海裡深深紮根,把整群人的平均預測值帶離正確答案。

當大眾也找不著北

在網路的世界裡,求大眾觀點的平均值已經成為一種流行做法。亞馬遜、貓途鷹(TripAdvisor)、谷歌+等眾多網路聚合平臺都採用類似於“群體的智慧”的模式,邀請網民到自己的網站來評價產品,然後透過權重演算法得出一個集體的評分。通常,藉助從一星到五星的量表,使用者就能對一本書好看不好看,一雙鞋子舒服不舒服,一款相機的畫素如何給出自己的感受,並讓其他網民知道。

這個做法如今變得如此普及,是時候把它當作一個社會現象來認真研究了。今時今日,什麼都可以評分。喜歡昆汀·塔倫蒂 諾的新片?去電影網站 Allociné 給個五星吧。覺得某家酒吧的氣氛有點悶?上餐館點評網站 Yelp 給它打個三星。覺得這個蘋果撻的食譜實在太甜了?立刻上食譜網站 Marmiton 給個一星差評。

人也可以打分。不管是你的數學老師,還是上次跟你拼車的同路人,是你家附近的麵包店師傅,或是你的一夜情物件……誰都逃不開。連私人醫生也不能倖免!谷歌+上,那些被評為“ 冷漠”“ 粗心”“ 毫無同情心”的大夫會立刻被判低分,而另一些“熱情又有能力”的大夫會得到五星好評。雖說國家醫師協會理事會始終不認可這套評分系統,那些鑽牙時下手太重的牙醫照樣會在網上得零分。

評分體系如今無處不在,舉足輕重。因為群體判斷在網路上公開後,一件商品能否暢銷,或者服務能否得到認可,網民的打分很關鍵。他人對網民個體的打分也是如此。那些得到差評的個體很容易失去他人的信任,下一次去度假時,很可能在愛彼迎(Airbnb)上找不到房子,在優步(Uber)上也叫不到車。美國專 門給飯店、酒吧評分的網路平臺 Yelp,現已變成普羅大眾的米其林指南。大眾只要用手指輕鬆點選,就能決定哪家飯店火爆,哪家飯店破產。商戶在這個網站上每上漲或降低一顆星,營業額就會增加或損失 10%。如果湯裡掉了一根頭髮,或者服務員像門神一樣凶神惡煞,那麼飯店要小心了。網民們可不會客氣。

你可能會問,這有什麼問題?科學不是已經完美證明了群體智慧有用而且集體判斷值得參考嗎?事實並非如此,因為社會影響力依然存在。比如錫南·阿拉爾的團隊做過一個讓網民評價他 們對網路新聞感興趣程度的實驗。實驗者隨機抽取了 10 萬條新聞,每篇文章剛發出來,科學家就先上去給它打上第一個分數。結果顯示,如果首條評價是肯定的,這則新聞的總平均分會升高25%,不管隨後跟進了多少真實的網民評價。這是因為網民打分前都習慣先看看前人打的分,難免會受先前意見的影響。“ 從眾效應”的強大之處在於,不管被評價物件的真實水平和質量到底如何,只要第一個“假評”是好評,後面的人也更傾向於給好評。

另外,使用者間心照不宣的“互賄”心理是使評分系統失衡的另一個因素。在一個人人互評的世界裡,為了給自己換回一個好評,還有什麼比先給對方一個好評更有效呢?在優步上,司機跟乘客之間要互評;在愛彼迎上,房客跟房東互相打分。在北美的一些中學裡,老師給學生的分數寫在成績單上,而學生給老師的分數體現在“評師網”(Rate My Professors)上。在這種情況下,也許老師在給學生的家庭作業打分時高抬貴手,就會使自己的網評多一顆星。事實上,2002年的一項研究顯示,美國高校出現了普遍高分的現象,部分原因確實在於引入了學生給教師打分的系統。簡單來說,我們每個人都有小辮子在別人手裡,膽敢第一個打差評的人,就等著受到報復吧。

“烏合之眾”和“眾愚成智”:為何“群體”有著兩副矛盾的面孔?

《群體的智慧:如何做出最聰明的決策》,[美] 詹姆斯·索羅維基,版本: 中信出版社 2010年10月。

鑑於評分系統已遍佈網路,無處不在,某些網際網路企業趁機在網路上推出了一種“聚合通行證”。比如 2015 年成立的法國初創公司 Famust 把個人在不同網站上得到的分數集中起來,給每個人製作出一套社交聲譽證件。最終我們可以依此獲得任何人的性格綜述:讓·克勞德,谷歌 + 得分 4。3 的敬業藥劑師,網約車軟體Blablacar 得分 4。2 的好司機,下廚軟體 Marmiton 上的 4。7 星大廚,不過,他對追女人可不大在行,在交友軟體 Tinder 上只有 1。5 分。這不禁讓人想起英國電視劇《黑鏡》的一集,未來城市的居民們在每一次互動後都互相評分。這個反烏托邦故事描 繪了社會聲譽不斷惡化的主人公是如何一步步墜入地獄深淵的, 意在警醒我們小心此類系統的濫用。

然而 Peeple 等應用軟體的開發者似乎對此充耳不聞。2016 年 Peeple 上架,專用來給你身邊的人打分。鄰居太吵,可以給兩星。本區郵遞員和藹可親,給五星。在手機應用商店裡,Peeple 自己收穫了百餘條評價,平均得分慘不忍睹:1。7 星。看來,普羅大眾的肩膀上頂著的並不是擺設。

藝術和文化領域的情形又是怎樣的?如果人們評頭論足的物件不是一家飯館或者一個司機的服務,而是一部電影、一本書或者一首歌,他們的集體判斷又會不會失之偏頗呢?或者換個問法:單曲《江南 Style》曾一舉登上 YouTube 觀看次數最多影片的寶座,是不是意味著這是一首傑作而必將載入史冊呢?

鄧肯·瓦茨的團隊從 2006 年起就投身於這個問題的研究了。他們模擬了網際網路音樂市場,建立了一個叫“ 音樂實驗室”(MusicLab)的網路平臺,在上面放了 48 首專業團隊製作的音樂作品,都是首次面世的新作。之後,他們邀請15 000名網民來聽音樂並打分,以及免費下載他們喜歡的那些。

實驗分了好幾個階段。第一階段,聽眾在不知曉旁人好惡的前提下先做出獨立的判斷,結果這 48 首曲子的得分都差不多,並沒有特別突出的。第二階段,曲子還是那些曲子,不過聽眾換了一組,而且在聽每首曲子之前,他們能先看到別人對音樂的評價。只需要這一步改變,就能使 48 首中的一首單曲脫穎而出,成為這個小社會里最受人喜歡的流行歌曲了。

照這麼看來,評分系統真的能幫助消費者識別市場上的最佳產品嗎?當上述實驗做到第三階段,結論很快引起了我們的擔憂。在實驗者換上新一組聽眾之前,這 48首曲子的既往評分被清零了。這一次又產生了 48 首曲子中的當紅歌曲,但和上次的不一樣。實驗不斷重複,每一次都將前一輪的結果清零。於是,人們就會愛上一首不同的歌。似乎音樂本身的品質對於獲勝歌曲來說根本不重要,大眾每回都隨機捧紅一支曲子,把它推到流行榜首。人們被各類社交資訊淹沒,失去了審慎分析的能力。

不過根據研究者們的觀察,被選中的當紅歌曲並不是完全隨機的。不管實驗怎麼做,最好的那些音樂從來沒跌到谷底,最難聽的那些也沒能登上榜首。但在保持這種大趨勢以外,任何結果都是有可能的。

以上你所瞭解的只是冰山一角而已。事實上,大眾研究的這一細分領域才剛起步,但在短短的 20 年時間裡積累的知識已經多到令人頭暈目眩。新的群體智慧模型正在形成,可以預見,它們將很快被應用到你的日常生活中。投資者們個個摩拳擦掌,大眾研究早已引起市場的興趣。

摘編 | 劉亞光

編輯 | 劉亞光