第二千四百九十二章 亂拳打死老師父(1/2)
「研發圍棋軟體,還是足以挑戰圍棋一流高手的圍棋軟體,怎麼可能繞得開中國棋院?」周至反問道:「棋院的領導們對我們的想法是大力支持的,雖然他們認為小智想要擁有和他們對弈的能力,基本上不大現實。」
「棋聖給你們的答案是啥?他總不會說自己下棋是靠直覺吧?」楊宏輝笑道。
「誒!還真給你說對了,就是靠的直覺。」周至說道:「不過這種直覺是經過成體系訓練之後的直覺行為。」
「而且不僅僅只有他這麼說,好幾個九段都說他們是靠直覺那樣走的,具體原因也無法描述。」說道這裡周至就得意起來了:「不過我們小苗卻用數學語言,大體解釋清楚了這種思維的形成過程。」
「你的意思是說,小苗可以用計算機把人的思維摹擬出來了?」梁紅嚇了一大跳:「你們那個小智,已經能夠像人那樣思考了?」
「我去!終結者嗎?!」楊宏輝更是聯想到了這幾年那部火到不行的大片。
「沒有那麼誇張了。」周至笑道:「準確的說是讓小智的神經網絡得到一定的訓練,然後通過大量圍棋棋局的學習,去預測人類下一步將要做出的決定,對人類可能做出的前五步或者前十步的位置進行概率的判定。」
「這裡涉及到兩個神經網絡的體系,一個是決策網絡體系。我們利用網上成百萬盤的圍棋遊戲的棋局,通過監督學習,我們讓小智獲得了判定能力,可以模擬人類下圍棋的行為;」
「從棋盤上任意選擇一個落子點,訓練系統去預測下一步人類將作出的決定;系統的輸入是在那個特殊位置最有可能發生的前五或者前十的位置移動;這樣,只需看那最近的五到十種可能性就好,而不用分析全部的兩百種可能性,這就極大地降低了運算量。」
「一旦小智學會了這個,我們便可以引入誤差加強學習,對系統進行幾百萬次的實戰訓練。對於贏了的情況,讓小智意識到,下次出現類似的情形時,就可以做出相似的決定。相反,如果輸了,那麼下次再出現類似的情況,小智就不會選擇這種走法。」
「形成決策神經網絡體系後,我們就可以開始第二個構建神經網絡體系——數值體系。」
「如果說決策體系是為了形成『直覺』,數值體系就是對『直覺』進行量化,通過百萬次的遊戲,對系統進行訓練,讓小智對不同的落子點,經過置信區間學習,將贏機率定義在0到1之間,0表示根本不可能贏,1表示百分之百贏。讓小智統計機率。」
「最終的結果就是把這兩個神經網絡結合起來,我們可以大致預估出當前的情況。這其實和高手學習圍棋的過程很類似——通過嚴格的訓練,比如打譜和局部拆解,研究透近幾步的最優下法,然後形成人腦裡邊的『類直覺決策』。」
「不過人腦對信息的處理能力可謂誇張,而且面對的情況也是多種多樣的,即便小智最後能夠達到圍棋九段的能力,那也僅僅是人類上百萬種能力中的一種而已,終結者里機器人那種和人一樣擁有誇張的信息處理能力,只能是一種想像。」
「不過話也得反過來再說一遍,雖然小智的能力沒法與人腦相比,但是無論是硬體架構,軟體體系還是算法思路,都是人類科技的一大進步,是遠超深藍,銀河這種傳統算力解決方案的跨時代的技術思路,其重要性……我覺得大概得相當於牛頓前後的物理學分野吧。」
「哇?那小苗就是活牛頓了?」梁紅都傻了。
「沒有沒有。」麥小苗嚇得連連擺手:「肘子是在說類神經元技術方案的重要性,但是這個技術不是我發明的,數學模型也不是我發明的,只不過我們將之在系統設計上實現了它們而已。」
本章未完,點選下一頁繼續閱讀。