第541章 Hadoop(1/2)
聽過許亮傑的話,周不器又叫來首席技術官程秉皓,也詳實溝通了一下搜索的事。
新浪的愛問搜索,就是他帶隊做出來的。
如果他去年不離開新浪,說不定憑藉此功勞,就能晉升為新浪的CTO了。
不過,他現在是紫微星的CTO,也一點不差。
程秉皓的看法跟許亮傑差不多,而且更加地本土化。
「百度為什麼做內容?因為在國內做搜索,做內容是唯一能夠生存下去的方式。」
程秉皓的看法更加的銳利直接。
在國內做搜索,跟矽谷不一樣,要根據法律法規,要移除和屏蔽一些內容。以及要貼心的為用戶考慮,通過一些深度算法,幫助用戶移除一些深度的專業化內容。
因為越專業越小眾,越庸俗越大眾。
要想獲取最多的大眾用戶的喜愛,不能提供太專業的內容,而是要提供一些淺白易懂、不那麼複雜的搜索結果。
比如百度那邊已經在做機器學習,也就是最早期的人工智慧。即通過用戶搜索結果以及對搜索結果的反饋,來讓機器學習。從而在未來搜索的時候,讓機器幫忙推薦更符合大眾口味的最優解。
這就又產生了一個好處,可以進一步的縮小檢索範圍。
百度的搜索技術比不上谷歌,差距之大……遠遠超出想像。其實也不止百度了,雅虎、微軟也一樣。
谷歌能在最短的時間內,在海量的網際網路數據中搜索出相關內容,然後根據算法排列,呈現在用戶電腦前。
可其他的搜尋引擎不行。
要想給用戶提供最快的響應速度,怎麼辦?
最簡單的方法,就是縮小檢索目標。
谷歌檢索10億條信息,百度就檢索1億條信息。
信息來源少了,搜不出想要的答案,也就不奇怪了。
所以,百度要想坐穩國內第一的寶座,就一定、只能、必須做內容。通過自產的內容,來彌補檢索技術方面的弱項。
這種方法,沒法滿足高端用戶的需求,卻可以滿足全社會中80%的用戶需求了,這就夠了。
可以說,百度的李總通過正面退怯、背後游擊的方式,完成了對谷歌在搜索領域霸權的挑戰,並且成功了。單從這一點來說,可比微軟、雅虎等巨頭強了不少,那伙人還在苦哈哈的想跟谷歌玩技術呢。
玩個屁啊,根本不是一個量級的。
在大數據處理的領域,全球科技公司都要依靠一個叫Hadoop的開源核心架構。這個架構來源,就是谷歌對自身算法理論的公開,卻沒有公開算法細節。所以雅虎和阿帕奇就牽頭合作,召集了一大批頂尖科學家,根據谷歌的算法理論,做出了這個大數據處理系統。
可問題很多,距離谷歌公布的一些關鍵指標存在數倍的差距,苦苦沒法解決,只能咬牙接受。包括微軟、亞馬遜、阿里、華為、臉書、雅虎、百度等巨頭,都要使用這個開源系統。
只有谷歌不用。
不僅不用,他們還在2010年完成了系統的更新……把原來的理論推翻,上線了一個更先進更高端的大數據管理系統。
也就是說,全世界科技巨頭們使用的大數據管理系統的底層架構,比谷歌淘汰的那個舊版本,還要落後幾倍的效率。
巨頭們當然也抗爭,想做出超越Hadoop的東西。
國內的代表就是百度。
在07年的時候,百度股價一路飛起,上下振奮。李彥紅決定代表華夏,做一個世界級的開創性項目出來,起名「金字塔」計劃。
抽調了百度最精英的核心技術人員,又從外面招來了一個專家團隊,帶頭人赫然就是現在紫微星研發中心的負責人楊振坤!
這個大計劃,不用JAVA、Python,甚至連C++都不用,直接用C語言寫代碼。
可謂是雄心壯志。
當時,百度從最高層到一線開發人員,都充滿激情,畢竟這是一次叫板矽谷的大事,做成了足以揚我國威。
項目組瘋狂加班,百度大廈12層西側的燈每天晚上都亮一宿。
做了兩年,項目成功了!
可是,最後百度還是回歸到了Hadoop的陣營中。
為什麼?
因為有一個小項目組,拿來Hadoop的代碼簡單包裝,重寫了API,然後拿過去跟百度耗時兩年、斥巨資打造的金字塔系統比較性能。
結果,小項目組以微弱的優勢取勝了!
李彥紅看到這個結果,頓時心灰意冷,如同被潑了一盆涼水。
Hadoop是開源項目,是全世界的開發者們一起去更新、促進,潛力巨大。原創的如果沒有巨大優勢,再加上職場政治,就只能是朝開源的方向走了……
阿里雲的初期,曾遇到過巨大困難,被業內深深質疑。因為最早期的時候,王建博士判斷錯了,也要搞一個類似Hadoop的大數據系統,半抄半改,還是糊了。後來看到亞馬遜雲成功了,才恍然大悟,趕緊調頭改變方向,這才取得了成功。
企鵝、盛大、新浪、華為、金山等科技公司看到阿里在前面趟地雷,還真是趟出來了一條道。這個時候,大家也就不說什麼「新瓶裝舊酒」、「阿凡達時代才能誕生」的風涼話了,趕緊跟進,也都很順利的做出了自己的雲計算平台。
這背後都要依託著開源項目Hadoop。
程秉皓道:「我在新浪時,就意識到了內容的重要性,開始對愛問搜索補充內容來源,比如愛問知識人,比百度知道還早一年。可是公司給的支持有限。我99年最早做搜索時,整個搜索部就我一個人。到了去年,也才120多人的團隊,別說跟百度比了,連搜狗都不如。」
周不器問:「如果做內容,你覺得還需要做什麼?」
本章未完,點選下一頁繼續閱讀。