第一千四百二十九章 合作項目(1/2)
周至倒是不怕這些,畢竟島國和國內一樣,能夠處理河豚的廚師是需要考取執照的。
馬爺不吃正好,周至正好順便把他的那一份給幹掉了。
反倒是池田丘這樣的年輕女士,對於吃這個部位一點沒有異樣,還笑吟吟地跟周至討論口感,讓周至感慨這女的要是在國內遇到付霞,指定聊得到一處去。
之後坂本五郎對於周至和馬爺的態度就好像有了點細微的差別,好像給周至的笑臉更多,對於馬爺就有點應付了。
聽聞周至提出想要去靜嘉堂訪問,同時和靜嘉堂文庫的負責人討論將文庫數位化的工作,不由得對周至刮目相看:「周桑,這個想法,是在瀚文大字庫創立之前就有了的?」
說實話的確是如此,不過周至心目中的數位化圖書館遠比現在任何人心目中的結構都要宏大得多。
但是腦海裡邊的東西提前說出來一點用都沒有,事情只能一步一步地做起來,現在第一步的瀚文大字庫已經完成,才說得到第二步上來。
第二步,當然就是將典籍的內容數位化。
周至心目中的圖書館,絕不是簡單的掃描,轉字,存儲這樣簡單的功能。
這裡面涉及到版本格式的數位化,文字內容的數位化,書目索引體係數字化,段落標籤的數位化,特殊詞庫數位化,訪問檢索功能的開發,以及典籍內部與外部的聯想特徵接口。
就拿《資治通鑑》來舉例,周至要的不是一個TXT文檔,而是一個立體化的資料庫,研究者可以根據自己的需要,輸入「漢武帝」三個字,就能夠檢索到資治通鑑里提到漢武帝的所有內容,由此拼合出一篇漢武帝的傳記,同時還能夠檢索出每一個段落的具體出處,以及與漢武帝這個關鍵詞有關係的一級標籤索引段落,二級標籤索引段落,三級標籤索引段落。
比如漢武帝的五服內親人,父母,后妃,子女,重臣,重要制度,新立官制,政策,戰爭,災異,這些就屬於與之相關的一級索引。
在位期間的其餘地方大事,諸侯,番邦等,這些內容屬於二級索引。
以此類推。
這樣就會把編年體的《資治通鑑》,剖析出一篇紀傳體的《漢武帝傳》,而這篇傳記上的許多內容,還可以一層一層地向下鑽取,比如皇后這一索引,就可以鑽取出衛子夫,從衛子夫,又可以鑽取出衛青,劉據。
這些是內部接口,還有外部的,比如將《資治通鑑》和《史記》、《漢書》、《後漢書》、《五代史》、《資治通鑑長編》等再度關連起來。
當然這些已經是屬於將來要幹的事情了,當務之急是先要將典籍的內容數位化完成。
也就是說,這一切的基礎,是先要得到一個「《資治通鑑》」。
還有一個步驟,也是要和這一步同時進行的,就是「版本格式設置」。
這個是用來展示用的,周至想要讀者在瀏覽古籍的時候,體驗到翻閱古籍的效果。
要是再過幾十年,這事兒就很簡單,將典籍的高清掃描圖片和隱藏的數碼文字連結到一起,就能夠輕鬆實現。
不過現在卻不行,因為如今的存儲空間是非常珍貴的,高清掃描圖片動則一兩兆,《資治通鑑》一共三百萬字,只需要6M的存儲空間。
本章未完,點選下一頁繼續閱讀。