第784章 計算機學習(2/2)
周不器緩緩的道:「不知道許亮傑跟你說沒說過,紫微星目前有兩個內部項目,也屬於人工智慧的範疇。」
沈向陽道:「他沒跟我談業務的事。」
周不器點了點頭,「嗯,這算是公司機密。我跟你說說。其中有一個項目,是個性化的內容分發,根本不同的用戶信息,來通過信息流的方式分發相應的GG和內容。」
「朋友網的GG?」
「對,主要是今日頭條,這是我們內部的一個項目,9月份會上線,會有內容的分發。」
周不器就簡單的說了一下今日頭條內容分發的理念。
沈向陽略作思考,沉吟道:「如果是這種模式,簡單的個性化分發是不夠的,這不夠精確。必須要有更複雜的算法支持,這需要使用到深度的計算機學習。」
「什麼說?」
「嗯……」
沈向陽有些頭疼,他最煩跟外行探討深度的技術問題,可對方是老闆,又不能不解釋,想了一下,說道:「這樣,你問我5+5等於幾。然後我模擬計算機,給你解釋一下。如果我說錯了,你要給出正確的答案,然後多問幾遍。」
周不器覺得挺有趣,笑道:「行,那我問啦。咳咳,5+5等於多少?」
沈向陽道:「88。」
周不器微微一愣,明白了他的意思,幫他改正,「不對,是10。5+5等於多少?」
沈向陽道:「24。」
「不對,是10。5+5等於多少?」
「17。」
「不對,是10。5+5等於多少?」
「12。」
「不對,是10。是5+5等於多少?」
「10。」
「對了。5+5等於多少?」
「10。」
「5+5等於多少?」
「10。」
沈向陽做出了這個解答,然後接結束了這個問題,「這就是機器學習的邏輯。當然不是算術了,而是計算用戶對GG或者內容的喜好度。其實針對GG的個性化投放,不能根據GG本身,而是根據內容。朋友網的個性化GG我看了,主要就是根據用戶的個人信息,這略顯粗糙,準確率也不高。」
「那應該怎麼做?」
「通過機器學習,把GG和內容捆綁。比如閱讀內容A的用戶,都喜歡GGA,兩者就可以對接了。這個比較簡單。更複雜的是內容投放,要結合統計學習和神經網絡,通過機器學習,讓計算機學習用戶的閱讀習慣。就像剛才的算術題一樣,一開始,錯誤率比較大,越是學習,錯誤率就越小,就越貼近正確答案,即用戶的閱讀習慣。」
周不器不太服氣,透露了點小秘密,「朋友網的個性化GG分發算法,是Facebook做出來的呢!嗯,我們是合作夥伴。」
「這樣啊……」沈向陽笑了笑,「Facebook的技術也不怎麼樣。」
「呃……」
口氣真大!
好吧,這哥們的確夠資格諷刺Facebook技術差。
周不器接著說:「還有一個項目,我們都做了半年了,一點頭緒都沒有,我們派出了一個很厲害的技術大牛,叫徐銘,他也沒辦法。他本來是搜索事業群的技術總監,不過項目沒進展,接下來就把他調進研究院,你來帶吧。」
「什麼項目?」
「智能搜索,個性化搜索,千人千頁。」
其實就跟個性化內容推薦差不多,不同的是,這次是針對搜索結果的個性化推薦。
沈向陽臉色就凝重起來,「這可難多了!比那個朋友網的個性化GG,今日頭條的個性化內容都難。」
「是嗎?不都是個性化推薦嗎?」
「級別不一樣。」
「嗯?」
沈向陽解釋道:「技術難題往往是兩點,一類是複雜度,一類是規模量。比如Photoshop、MATLAB這種工程軟體,就是太複雜了,我們國內做不出來。規模量指的是數據多少。一個算法,處理小數據時可能很奏效。可是涉及到大規模數據,算法就失效了。就像手工製作和機械化批量生產一樣,沒有可比性。」
周不器點了點頭,「嗯,大數據。」
沈向陽道:「大數據算法是一套,個性化算法是一套,大數據下的個性化算法,又是另外一套。這並不是簡單的1+1=2的關係,需要從算法框架方面有更優化的設計。智能搜索這個概念前兩年就提過了,可是做不到。」
現在,全世界連大數據都沒搞明白呢,對大數據下的衍生算法,更是想都別想。
這麼一看,還是老沈技術更高、視野更廣、認知更清楚啊!
智能搜索這個項目,是許亮傑、程秉皓、王小船和徐銘共同決定的,覺得這個方向大有可為。可沈向陽卻給否了,說做不到。
嗯,一家公司,肯定是技術最好的人當首席技術官。
老沈實至名歸啊!