第758章 流形學習(1/2)
姚夢娜提出的這個問題,對於常浩南來說,不難理解。
只是很難解決。
真要說起來的話,這涉及到文本挖掘、數據可視化、信息檢索、數據挖掘、機器學習乃至人工智慧等一系列問題。
如果真做到姚夢娜所設想的那樣全自動化生產,那就是工業0了。
在1999年這個時間點上,顯然不大現實。
但不可能完全實現這一整套東西,並不意味著其中沒有可以作為突破口的部分。
比如數據挖掘和信息檢索,就是千禧年附近很火熱的研究方向。
也就是一維數據。
再假設X中的數據樣本來自於或近似來自於低維嵌入空間中的數據Y={y1,y2,…,yn}Rd。
倒是旁邊的小超市,來來往往的人流量不少。
但當年的他作為一個工科出身的普通技術人員,並沒有太多理論功底。
「信息……」
「這個麼……」
姚夢娜看了看紙上的一個名詞和三句話,也知道常浩南大概是沒什麼思路,乾脆站起身道:
「要不先去吃個飯?」
給定一組高維數據X={x1,x2,…,xn}RD,n為數據樣本個數,D為高維數據的維數。
不過,這個思路卻是可以被借鑑的。
3、提取到高質量的數據特徵,提升後續的數據表示和分類任務的效果。
而對於稍複雜一些的情況來說,要完全描述一個含義,往往需要一組數據。
姚夢娜的反應稍微慢了一點,剛想起身,又意識到還沒結帳,只好掏出錢包,無奈地走向收銀台。
「在封裝步驟之前,專門找個人在流水線旁邊看著不就行了麼?」
餐桌周圍又恢復了平靜,只剩下偶爾發出的微弱咀嚼聲。
2、消除,或者至少降低隱藏在原始高維數據中的噪聲。
「?」
但與此同時,這一組數據又往往不只能描述這一個含義。
但主成分分析法只相當於找到投影距離最小的意義下的最佳線性映射,而現實中卻沒有那麼多簡單的線性問題。
常浩南思索半晌,又在紙上寫下了三個基本條件:
幾分鐘之後,當朱雅丹都快要吃完面前盤子裡的炒麵時,常浩南突然開口道:
確實有點餓了。
1、對原始高維數據進行壓縮,降低原始高維數據的維度,進而節省存儲空間,同時也降低高維數據的計算複雜度。
朱雅丹瞬間縮了縮頭:
「我只是隨便一說……但有些時候人腦的作用或許還是沒辦法代替的……」
實際上,在常浩南重生之前,飛機設計和製造領域已經開始應用這方面的技術,他本人也接觸過不少。
正在低頭吃飯的姚夢娜一愣,旋即意識到常浩南這還是在思考剛才她提出來的問題。
顯然,這並不能被算作是「完整且可行」的思路。
更何況數學這種東西,光靠俺尋思是尋思不出個一二三的。
小學和中學時候做的應用題,大體上就是這樣。
常浩南放下只吃了一口的羊湯麵,蹭地站起身,快步離開食堂。
不如先放鬆一下,換個思路。
……
常浩南搖搖頭否定道。
姚夢娜猜測道:
雖然她覺得在兩位博士面前有點班門弄斧,但最後還是沒忍住:
沒有反應。
但到了99年這會,大學生在宿舍備上幾袋甚至一箱,都不算什麼稀罕事了。
而對於理論研究來說,明確地提出問題,幾乎也就相當於走完了成功之路的一半。
朱雅丹滿腦袋問號地抬起頭,但看著常浩南思考的樣子,很有自知之明地沒有打擾。
實際生活中面臨的,其實大多數也是這種問題。
十五分鐘後,三人(連同朱雅丹)已經圍坐在了食堂二層的一個圓桌旁邊。
直到一陣來自腹部的叫聲把它從深思中吵醒。
本章未完,點選下一頁繼續閱讀。