華為5G與土耳其有什麼關係?

這篇文章你也許看不懂,其實我也不懂只知道一點皮毛,我沒有辦法用自己也看不懂的數學公式來揭示這項領先世界的技術,只能透過自己可憐的認知來詮釋一點皮毛。

2018年任正非為土耳其數學家Arican教授頒獎,獎牌由巴黎造幣廠精製,鑲嵌了紅水晶,這是華為為他所做出的貢獻給予的極高榮譽。他發明了PolarCode極化碼,這是華為5G核心技術之一,它使華為成為世界領跑者。任正非說Arican曾寫過一篇數學論文,我們發現的比別人早,所以先下手為強並投入了極大力量將5G率先做出來。

教授當年寫的論文標題是,通道極化:一種對稱二進位制無記憶構造容量實現碼的方法。光是標題就沒幾個人能看的明白。整篇論文不是公式就是符號,你看完若能知道他在說啥,你應該馬上去華為報到。在論文摘要中,他提到:夏農證明噪聲通道編碼一個迷人方面是隨機編碼方法。它用來證明容量可達的編碼是存在的。

這怎麼理解呢?資訊理論其實正是由夏農開創,我們試圖理解他的理論須從摩爾斯電碼開始,當人類開始透過電報電話進行溝通時卻始終沒搞懂資訊的本質,而夏農是世界上第一個試圖嘗試資訊量化的人。

夏農定義:消除世界的不確定性即資訊本質。舉例來說,天氣預報能給你比較確定的資訊,就是明天會不會下雨。但是股市黑嘴無論他說什麼都不會包含明天漲跌的任何確定資訊。但是正是因為你不知道股市明天行情,所以你才會感興趣,希望建立與黑嘴之間的通訊聯絡想多套一點資訊。

不過你是否能夠從資訊流中去度量並消除多少不確定性?我們可以從一段簡短的網路問答中來了解其中奧秘。

A:你今年在美國有沒有無緣無故地被黑人襲擊過?

B:是的,我總是被黑人莫名其妙的襲擊。

A:啊!那太糟糕了,你八成是華人。

一個越難猜的答案往往蘊含著更多不確定性,利用機率的不確定性度量資訊,這個不確定度叫做資訊熵。在上面的問答中A只用1個問題就確定了B的身份,如果換一個人,假設是C,那麼C可能會用10個問題才能確認B是華人,那麼C的資訊熵就比A要大。

夏農實現了把資訊進行量化的理論,當然他並沒有解決有關通道容量的問題,而這正是土耳其科學家Arican所要達到的目標。通道就是資訊通道,你可以理解成水管,但是你可能會認為通道如果太小不妨換成粗一點不就行了?但通道並非是水管那麼簡單,夏農也給出了數學公式,簡單理解就是通道容量就是單位時間所傳輸的資訊量。既然如此,那麼我們在單位時間加快資訊傳送不就得了?但事實上當兩個大媽互相對罵時,他們的罵聲越快自然罵出的詞彙就越多,但是周圍的人反而聽不懂她們到底說了什麼,這樣就造成了資訊丟失。因此通道容量必須要有一個還原資訊的上限。這與工程無關,你換大水管也沒有用,這是要求接收方必須要有還原資訊的能力。

用數學公式來表達很麻煩,也沒人愛看,我就通俗點舉個例子,如果女友告訴你“晚上一起去吃自助餐”,但是由於網路故障,你只收到了“晚上一起去”。這就會讓你產生疑問,她晚上想幹啥?用夏農的定義,這叫疑義度。用資訊熵公式表達是I(X:Y)=H(X)-H(X|Y),前者是互資訊,H(X)是完整資訊減去後面的是丟失的資訊。所以你得到的結果是互資訊。你應該能理解損失的資訊越少,自然你所得到的互資訊越大。而Arican教授就是要解決傳輸過程中所能傳輸的最大資訊問題,也叫做Chanel Capacity即通道容量問題。

電磁干擾或者你媳婦拔了你的網線都會造成資訊傳輸故障,這些統稱為噪聲。降低噪聲無疑是好方案但是噪聲的產生並非是以人的意志為轉移,就像華人根本不知道何時會被黑人老拳痛打。你平常遇到的最大問題就是與媳婦溝通,當你媳婦不知道你在說啥時,一種辦法就是不斷重複,但這容易產生誤解而導致她很生氣,另一種方式就是突然提高嗓門讓她能聽清楚點,但這同樣會造成她的誤解而生氣。怎麼辦呢?夏農教你如果想讓媳婦明白你想說什麼就必須注意說話方式,當你不得不重複你說過的話時要用不同的方式來表達,用資訊理論學術名次就是要有一個好的編碼,儘管如此為避免你媳婦產生誤解,你還需要增加一個萬無一失的糾錯碼“我愛你”。

隨著科技進步人們都認為未來資訊傳輸速率會越來越快,但是當你在電話中與你媳婦通話時造成的誤解,除了編碼,噪聲也是導致你們吵架的原因,還有人認為克服噪聲是不可能的。夏農認為正確編碼透過通道以V的速率傳送時,而錯誤頻率或疑義度可以小到令人滿意時,你媳婦就不會和你吵架。這一表述對於任何大於V的速率並不成立,也就是說盡管噪聲會干擾通訊,但是隻要編碼優秀在資訊速率小於通道容量V的情況下可以毫無差錯的傳遞資訊。如果速率超過V就會造成差錯,這就是資訊理論的核心問題。有噪聲的資訊編碼問題也稱作夏農極限。他實際上就是透過一系列普通人看不懂的數學公式來告訴人們,噪聲其實是完全可以克服的。然而夏農極限就像光速,人們一直都是可望而不可求。

當Arican透過極化碼達到夏農極限時就引起了世界震動,幸好是華為搶先下手與教授取得了聯絡併成功合作。Arican的極化碼遠遠強於高通的LDPC方案,LDPC由於過於複雜在工程運用實踐中實際使用並不多,LDPC碼僅僅接近了夏農極限,但是Arican的PolarCode卻給出了更高的增益已經達到了夏農極限。但是在2016年的一次有關標準制定的投票中,據說聯想投了LDPC一票,當時聯想給出的說法是科學無國界。最後LDPC和PolarCode同時成為5G標準編碼。

不過不管選擇誰作為標準,其實與中國關係並不是太大,LDPC碼的發明人正是Arican的導師Robert Gallager,而Robert Gallager的導師正是夏農!Arican教授正是在麻省理工學院讀書時遇到了Robert Gallager,從而作為他的學生開始研究資訊理論。

資訊理論實際上在上世紀八十年代曾是熱門,但後來美國人漸漸對這個理論失去了興趣,但是Arican教授卻沒有放棄,他從麻省理工畢業後就一直默默無聞地從事自己的研究並在土耳其一所大學從事教書工作,一晃二十多年,你也許會問在中國為什麼沒有像他這樣的學者能夠靜下心來連續鑽研二十多年?實際上我相信這樣的中國學者有很多,但是像華為這樣的伯樂可能很少,因此我們只知道在中國的大學裡有叫獸,卻忘記了中國的大學裡其實教授更多。

華為5G與土耳其有什麼關係?