首頁 > 現代都市 > 重生之乘風而起 > 第二千五百八十一章 將優勢發揮出來

第二千五百八十一章 將優勢發揮出來(2/2)

目錄

「其實關於古文文法邏輯在信息產業上的應用,我們也是很早就開始了嘗試的,那就是基於元資料庫研發的數據檢索引擎。」周至笑道:「這個引擎後來走向了兩個分支,一個成了現在的數字圖書館配套的瀚文搜尋引擎,在做《集韻疏證》三校的時候發揮過大作用的。」

「嗯,的確好用,直到現在我還在用。」辜老點頭:「節省了好些查閱資料的功夫,聽說還搞出了一些『名人行狀』之類的東西?」

「對,這個分支的大作用是在學術上,供大家進行數據檢索用,同時還可以讓程序學會我們檢索數據的思路,讓它去檢索海量的典籍,最後將我們想要的一系列知識點尋找出來,建立起邏輯關係,最後形成一部檢索成果。」

「我同學張辛夷就在做《蘇東坡軼事彙編》的三蘇軼事的檢索程序腳本分析研究,作為自己的畢業論文課題。」

「等做出來後寄給我看看。」辜老對這個當然很感興趣:「你中學同學吧?時間真快,這都要本科畢業了。要考研嗎?」

「要,好像還挺有信心的。」肘子笑道:「不過我們先不說它,現在還有一個通用類的引擎,是我們與四葉草瀏覽器相配套的,方便大家在網上查詢信息的網絡黃頁標籤類搜尋引擎。」

「舉這兩個例子其實就是想說,這類文法邏輯分析類的工具其實已經存在了,只要小智掌握了這類工具的使用方法,理論上是可以根據邏輯關係解讀並檢索出有效信息的。」

「比如蘇東坡行狀,我們可以先給蘇軾打上一堆的標籤如蘇軾,子瞻,和仲,鐵冠道人、東坡居士眉山蘇家,三蘇,嘉佑龍虎榜進士,制科三等,大理評事簽書鳳翔府判官,杭州、密州、徐州、湖州知州,烏台詩案,黃州團練副使,舊黨,文豪,豪放派詞人,蘇黃,蘇辛,歐蘇,唐宋八大家,宋四家,宋六家,《東坡七集》,《東坡易傳》,《東坡樂府》,《寒食帖》,《瀟湘竹石圖》,《枯木怪石圖》等等標籤,利用這些標籤檢索資料庫,得到合用的信息,再從這些信息里提取出更多更複雜的標籤,最後完成蘇軾的行狀畫像,將曾經在歷史典籍,古人筆記,朝代公文章奏當中出現過的蘇軾事跡全部擷取出來,形成一個完整的《東坡行狀》來。」

「這套方法我們是成功了的,現在的做法,就有點類似於讓給小智掌握這套方法,我們只需要給他下達一個『請搜集歐陽修行狀』的指令,他就可以用我們搞出《東坡行狀》的方法,去搞出《六一居士行狀》來,進而也可以使用於其餘的歷史人物。」

「至於說聲韻檢索,雖然相比名人行狀檢索要複雜一些,還涉及到從方言標本庫中選取樣本進行拼合和驗證的工作,但是底層的研究邏輯規律,對海量數據利用大數據統計分析方法進行檢索比對,最後找到最優解,這套思路其實是相似的。」

「聲韻在文字上的體現是相當多的,包括了前朝留下來的詩詞,駢文,古人筆記里記錄的俗諺,歌詞,曲詞,更重要的,還有歷朝官方頒布的聲韻文獻,以及歷朝學者們對聲韻的研究成果。」

「將這些東西都儘量搜掘出來,分時代進行規律總結,再從方言樣本中選取出最優解,將之確定為最接近當時的讀音,最後整合出一套中古聲韻擬構表來,我覺得從思路上來說,是沒有毛病的。」

「主要是要將現代信息技術的優勢發揮出來。」(本章完)

目錄
返回頂部