第104章 每個領域都有天下第一(1/2)
庫克教授的主要研究方向「計算複雜性理論」,這種專業術語大多數人肯定聽不懂,
用兩句人話翻譯一下,大致就是這樣的:
首先,用一台電腦來假設人腦面對問題時的處理模型。比如,當一個人走進一個滿是人群的禮堂時,想知道「禮堂里有沒有我認識的人」這個問題的答案,那麼他就得一步步搜尋,從頭到尾一個個認,如果全部人看完都沒有一個認識的人,才能得出「禮堂里沒有我認識的人」。而只要找到一個認識的人,就能下「這裡有我認識的人」的判斷。
所以,常識一般認為,「從科學嚴謹的角度而言,證明一件事情比證偽一件事情要耗費更多的判斷/計算資源,因為證偽只需要找到一個反例就可以結束論證、不再繼續往下耗費計算資源。而證明需要推翻所有反例」。
可是實際情況下,人腦在「不刻意追求絕對科學嚴謹」的前提下,做很多大致粗略的判斷時,要比電腦快得多。
比如讓人看一張照片,判斷照片上的東西是不是「貓」,人一眼就判斷出了,而不需要去驗證「圖片上這個疑似貓的生物是否有xxxxx等生物學上的特徵」。
換句話說,人類懂得如何抓大放小、用「模糊算法」儘快得到一個勉強可用、但不太嚴謹的結論。
而1980年代以前,人類根本就不知道如何讓計算機「不嚴謹」。
所以計算機在求解一切問題時都是用嚴謹到爆的暴力算法硬扛的,導致很多因為分支可能性多到天量級別而無法窮盡的問題,計算機就沒法解決。
比如圍棋。因為哪怕以2010年代的計算機硬體運算速度,如果要暴力算法「科學嚴謹」地窮究一切可能性,全世界的計算機加起來分布式運算都算不動。所以在那種思想指導下,人類只能滿足於「用暴力算法攻克西洋棋之類窮盡運算量也不大的腦力運動」。而平行時空的「阿爾法狗」幹掉那麼多高手,就絕對不能靠近乎低能兒蠻幹的暴力算法。
史蒂芬.庫克的畢生研究,就是在解決「如何讓計算機在資源不允許其徹底嚴謹的前提下、學會像人腦一樣抓大放小、用有限的計算資源得到一個相對準確的大概結果」。
顧誠覺得,或許多倫多大學計算機系裡,在庫克麾下,藏著更多從不同角度試探這一領域的人才。而傑夫辛頓有可能只是因為歷史的選擇而恰好最早在人工智慧領域出頭引起了重視。
但這絕不代表這一體系內,其他分支的人才就沒有價值了。
如果可以折服史蒂芬.庫克教授,對於顧誠的全盤、系統挖人大計,顯然是很有幫助的。
……
下午3點,密西沙加校區,神經網絡實驗室。
顧誠見到了早已收拾妥當、一臉侷促的傑夫.辛頓教授。
還有成名天下垂20載、剛剛從聖喬治主校區風塵僕僕趕來的史蒂芬.庫克教授。
一番簡單的客套之後,顧誠說出了此行的主要來意,首先向傑夫辛頓發出了延攬的邀約,而且出價不菲。
「辛頓教授,我可以為你成立一個基於『深度學習算法』的研究所,你個人可以得到200萬美元的年薪,以及每年1000萬美元的研究經費,合同期至少5年。你的助手和帶的研究生,我也可以給予最優厚的條件。唯一的問題是,你可能會終生失去在學術界的地位。你的論文只有很少一部分有發表的潛力,而且還得簽保密協議。你自己看著辦吧。」
傑夫.辛頓有些尷尬,畢竟資格比他老20年的學界泰斗史蒂芬.庫克就坐在旁邊。顧誠這樣直截了當地談錢,實在有辱斯文。
「到企業去做事,我們從來是不反對的,學術應該跟產業界結合。不過,就不知道一個明明只是做社交裹挾和遊戲攀比的公司,能有什麼課題讓人拿出可以上ieee系列期刊的成果呢。」
庫克教授直接就點出了顧誠的短板。
別的產業界大牛,無論微軟還是谷歌,好歹有一水兒的頂級大學研究所支撐。顧誠雖然也是搞網際網路的,但他的技術含量是最低的那一型。
就像後世bat三巨頭當中,騰雲是技術含量最低的一個。
「你提到了神經網絡算法這個擬研究方向,但我看不出來這和你的產業有什麼結合。讓我們多倫多大學的教授去做那種看不到學術前景的花里胡哨東西,有違本校的學風。」
庫克教授也不管自己只是個所長,直接就蓋棺定論了。
所謂「神經網絡式算法」,庫克教授十幾年前就有涉獵,相比於80年代以來的其他「np窮盡理論」而言,其最大的特點是「沒有運算核心」。
用人體來舉例,人作為一個生物個體而言,是有中樞神經的——絕大多數機體行動,都是大腦控制肢體,眼口耳鼻手足感知到了外部信號之後先要通過反射弧傳遞到大腦(部分最低級的反射,至少也要到延髓/脊髓處理)等大腦作出處理指令之後,手足才會作出反應。
但是如果把大腦單獨作為一個獨立個體解剖開來看,大腦內部上千億個神經元是平等的。並不存在「某一小撮神經元高於其他周邊神經元、從而在處理信息時先由這一撮神經元預處理、預處理完之後再交給下一撮神經元處理」這樣的先後順序。
(神經網絡當然還有其他很多基礎特點,這裡僅僅討論和「遺傳算法/退火算法」的主要區別,所以不多贅述了。否則能水幾萬字,大家還看不懂。)
當年「神經網絡」的概念被提出時,就是為了探討一種讓電腦高效處理類似於「找到禮堂里到底有沒有我認識的人」問題的新方法:如果可以有多個電腦,自然隨機地分配任務,並行從多個點開始用就近算法尋找,那麼自然可以在「單核cpu」性能比較弱的情況下,通過堆砌cpu數量加快問題的解決速度。
但這個概念並沒有「節約計算資源」,因為理論上它只是把「1台電腦10小時工作量」變成了「10台電腦1小時的工作量」而已。而且這種最原始的「神經網絡」也依然沒法解決那些「似是而非」的模糊問題——他們只能回答「有我認識的人/沒有我認識的人」這種非此即彼的問題。
本章未完,點選下一頁繼續閱讀。