第六十七章 獲得好處,解析文件(2/2)
隨後,他立刻開始了破譯工作。
破譯文字遠比解析科技要簡單得多,而如果這份文件就是某個科技的詳細報告的話,那破譯這份文件等於獲得了一個科技。
「我心心念的啟靈裝置啊!」蘇御又感嘆到,啟靈裝置關乎他能否再度進化,可他卻遲遲沒發現關於啟靈裝置的情報。
蘇御給自己倒了杯咖啡,隨後立刻開始了破譯工作。
這份文件里的文字全都是用【、O、】、〖〗、Ш、╁、□之類的框框和線組成的,像極了Word里進行加密的亂碼文字。
但蘇御立刻找到了規律,他發現「【」「(」這樣的符號非常常見,那說明這類是語言的基本詞彙量、常用詞、常用固定搭配等等。
比如中文裡的「的地得」、「這」、「那」、「是」、「不」「你我他」。
比如英文裡的「is」、「the」、「to」
比如日文里的「の」「て」
理解這一點,那就比較好辦了,文件中但凡是這類的文字全部都可以先用這幾種常用詞彙套入。
隨後是斷句,蘇御發現有些方塊字直接由一個空格將其隔開,因此將不同的字區分成不同的區域,每一個區域便可以理解成一句話。
然後是標註,作為一份報告,肯定是有標註,有特別說明,比如中文論文裡的「注1」「注2」,或者()。
而這些文件內也有類似這樣的標註,有了這些標註後,再去破解原文,難度就會降低許多。
而隨後,就是紛繁複雜的統計學工作,將文件中所有的文字全部提取出來,提取出所有的常用文字,提取出偶爾使用的文字,提取出只是用過一次的文字。
從而再進行統計學分析,和目前人類已知的文字進行對照,尋找語法相似的文字。
眾所周知,中文和英文互為倒裝句。
簡單來說,中文是:今天你吃了嗎?
英文是:你吃了嗎?今天。
而經過蘇御長達數天的分析,萬界統合的文字和中文的語法更為接近,這讓蘇御鬆了口氣,因為中文的文字數量更多,更利於進行統計學對照分析。
蘇御繼續那萬界統合的文字和中文進行對比,並用這種很笨的方法來破譯萬界統合的文字。
這將是一個漫長的過程,但蘇御有的是時間。
而且,蘇御可以偷懶,那就是他可以將算法和程序編入計算機,並藉助計算機來為他破譯萬界統合的文字。
確定目標後,蘇御立刻開始行動,他直接找到了世界上運算速度最快的「銀河」超級計算機,並藉助這台計算機進行破譯。
重複性的工作全部交給計算機完成,蘇御只需要從計算機給出的答案中篩選出錯誤的。
如此一遍又一遍,不斷地將錯誤的破譯篩選出去,留下正確的破譯,直到文件中出現的大部分字都能正確地對照中文。
那時候,破譯工作就會完成。
如此,蘇御不斷地堅持進行破譯工作,在第三年,破譯終於完成,文件中除了部分只出現過一次的詞語,和部分專有名詞外,其他的文字全部完成了破譯。
而雖然只破譯了85%的內容,但蘇御也完全看懂這份文件上寫的是什麼了。
在看完這份報告後,蘇御深吸了一口氣。
他知道男爵為什麼會遭到機械族的追殺了。