首頁 > 現代都市 > 我的投資時代 > 1296、自動駕駛立項

1296、自動駕駛立項(1/2)

目錄

「我們和誘Tube現在正在聯合研發一款智能識別圖片及視頻的系統。

研發完成後,它將用於甄別、封禁油管平台上發布的仇恨、種族歧視、血腥、黃/暴及其他違反各國法律規定的圖片、視頻。」

得知夏景行前來視察工作,吳恩達和李飛飛作為復興工業(美國)人工智慧研究院的正、副院長親自帶著大老闆在各個實驗室參觀了起來。

一行人邊走邊聊。

夏景行笑著說道:「這段時間辛苦你們了,違禁視頻一直是油管的一塊心病。

因為這玩意兒,油管經常被社會各界抨擊,快被形容成傳播毒瘤的網站了。」

吳恩達笑道:「油管每個月有來自幾十個國家的幾億人訪問和上傳視頻,這種大型平台的管理確實是件令人頭疼的事情……

光依靠人工審核視頻,很難實現高效的審核,同時還會造成大量的人力支出。

擁有一款高識別精準率的審核系統,可以為油管省很多事。

不過現階段的aI識別精準率很難達到完全不依賴人工審核的程度。

未來很長一段時間內,還是需要aI和人工一起搭配審核,aI為主,人工為輔。」

夏景行笑了一下,「我明白,人工智慧也會出錯,把正常視頻判別成違禁視頻。」

吳恩達點點頭,道:「要想徹底解決這個問題,還需要繼續訓練我們的算法模型,才能使它的識別更精確。

怎麼訓練人工智慧呢?我們需要更多的標註數據。」

李飛飛在一旁補充道:「我之前曾開發了一個Image資料庫,下載了10億張圖片,為了找人標註這些圖片,我使用了亞馬遜的眾包服務平台amT,但幾年時間過去了,僅僅只標註了幾百萬張圖片。」

夏景行微微點頭,亞馬遜amT,又名aI富土康。

顧名思義,這就是一個網上接單做兼職的平台,其中最多的任務就是標註數據。

怎麼標註呢?很簡單,坐在電腦前,對數據進行手工輸入、分類,區分出一張照片中是否有「狗」,辨別語句中的「bass」到底是低音還是鱸魚。

每標註一張圖片、一段語音,可以掙3美分。

看起來掙得很少,但積少成多,IT外包業務發達的印度就有很多家庭婦女把這份兼職工作做成了全職工作,每天工作8小時,一個月能掙700美元。

聽起來感覺好像還不錯,但其實比工廠打螺絲還枯燥乏味。

不過畢竟是兼職工作,也沒人站在旁邊督促,想干就干,算是比較自由的工作。

夏景行問道:「我們開發的Fx資料庫,現在標註了多少張照片?」

吳恩達嘆了口氣,「就一百多萬張,因為找不到那麼多人幹這活,亞馬遜amT上面的活躍用戶太少,很多人幹著幹著就不幹了。」

夏景行皺起了眉頭,「太少了,標註數據就是人工智慧的飼料,要趕緊想個辦法把標註數量提升上去。」

說到這,夏景行心中突然一動,脫口而出道:「哎,我們可以考慮把這個產業引入中國啊?

一個月掙四五千塊,應該還是能吸引一些人當數據標註員的。」

夏景行一下子聯想到了很多東西,西哥可以在老家辦個外呼中心,自己也可以在老家辦個數據標註中心啊!

找一幫有一定化基礎的婦女,培訓一下就可以上崗了,而且還可以在家裡幹活,相當於補貼家用了。

夏景行把自己的想法給吳恩達和李飛飛講了一下。

李飛飛老家也是蓉城的,而且這是為婦女提供工作崗位,她對這件事很感興趣,立馬針對性的提出了不少建議。

吳恩達提出了不同意見:「選擇眾包模式,估計標註員只能標註一些簡單的圖片。

而視頻標註和3D標註有些複雜,每一幀畫面都需要標註數據。

尤其是戴倫你提過的自動駕駛,想想都覺得數據量恐怖。」

夏景行記得前世湧現出了一些專業的數據標註公司,他們的主要服務對象就是自動駕駛技術公司。

為了完成一些高質量、高難度的標註,那些數據標註公司沒少研究如何高效標註數據的小工具。

「我們可以開發輔助標註工具,把圖像和視頻進行分割,標註員只需要在每個物體框裡面打鉤打叉,或者選擇綠色、紅色就行了。」

吳恩達眼睛頓時一亮,「這是一個好辦法啊,不然一個圖像標註幾百上千組數據,能夠把人活活折磨死。」

夏景行笑了一下,這可不是他自己想出來的,而是前世那些數據標註公司總結設計出來的小方法。

眾所周知,數據標註越多,投食越多,餵養出來的人工智慧就越精準。

開啟自動駕駛模式的汽車,需要行駛在複雜的城市路況,這就對人工智慧、計算機視覺提出了更高的技術要求。

周邊的汽車、道路、指示牌等等,全都需要經過數據標註員無數次的標註,然後將大量的數據匯集在一起,最終才能培養出能夠安全上路的自動駕駛汽車。

不過自動駕駛是漸漸走向成熟、精準的一個發展過程,在此之前,估計少不了各種翻車事件。

假如某位車主運氣不好,在自動駕駛模式下,遇到了一個沒有收錄在自動駕駛資料庫里的路況場景,機器不認識,那就只能全村開席了。

「說到自動駕駛,戴倫你打算什麼時候開始研發這個項目啊?」

本章未完,點選下一頁繼續閱讀。

目錄
返回頂部