第一千一百零三章 時來天地同運力(2/2)
冷玉龍補充道:「此外,為了充分反映漢字的實際情況,《中華字海》還酌量收錄了歷代文獻中的新舊筆形與訛字。」
「這一部分的收字標準,我們採用『單體字從寬,合體字從嚴』的規則。一般單體儘量收錄,合體字儘量不錄。」
「還有最後一部分工作,就是整理過程中的清理。」韋一心說道:「《中華字海》在前任字書未及的異體字與錯訛字方面,進行了一些清理與合併工作。在釋義當中,儘量將諸多典籍中的釋義和釋疑儘量找齊,合併到一個字的釋義之下。」
「如(木舟)字,《漢語大字典·補遺·木部》:『(木舟),樹名。』《太平御覽》卷七百七十引周處《風土記》:預章(木舟)諸木,皆以多曲理盤結為堅勁也。』但是並未注音。」
「而《字海》綜合《漢語大字典》出版後的一些考釋成果釋為:「(木舟),同『楠』。見《龍龕》。」
「類似這樣的後補考證成果,我們也將之補充進《字海》的(木舟)字釋義之下。」
「加上我們自己未能考訂確實的《補遺》部分,《字海》其實一共收錄了87019個漢字。」
「太了不起了。」周至不禁感慨:「這可不是把我們要乾的活都幹了啊?」
「要點臉。」辜開來不禁翻起了白眼:「什麼叫你要乾的活?」
「兩位師兄的搜字範圍,幾乎已經囊括了我們所能想像的全部啊。」周至樂得都不行了:「還是用楷體建卡,我估計自動程序掃描識別的問題應該不大。」
「那就走吧,先去庫房看看。」冷玉龍比周至還急:「要是合用那就撿大便宜了,咱們可以把《字海》的出版工作儘快提上日程!」
「嗯,等到確定了可行性,我們就去找李國傑教授打擂台!」
「李國傑教授?」韋一心搜索了一下自己認識的文字學大擘,似乎沒有這麼個人,轉頭問冷玉龍:「冷泉你聽過這人嗎?」
見韋一心誤會,周至方才笑道:「李國傑教授是曙光超算中心負責人,之前我們想要一點運算資源,國傑教授那叫一個摳門啊……這次我們找上門去,堵著他打擂台!」
北大中文系幾間資料室里,冷玉龍和韋一心八年多的心血,靜靜地躺在這裡。
整個資料室分作了兩百多個部分,按照《中華字海》的字頭索引方式,分門別類地歸納在文件櫃裡。
每一個柜子里都有幾個紙箱,箱子裡是一個個的文件袋,裡邊一沓一沓的都是硬紙卡片。
對於翻習慣了字典的人來說,每一張卡片,其實就是字典上關於一個文字的本字及註解區域。
卡片左上角是一個標準的大田字格,文字端正的楷書就寫在那裡,接著是拼音注音,釋義,摘引文獻等等「凡例類目」。
將幾間大屋子的所有資料一頁頁鋪起來,影印縮小,就是一部《中華字海》。
或者說,將未來的一部《中華字海》放大,裁剪開,就是這幾大屋的資料。
「應該沒問題。」周至看著一絲不苟的字卡,不由得大感佩服:「這連標點的大小和寫法,都有規範,每個逗號都幾乎一模一樣啊……」
「這是門裡的老傳統了,逗號需要按照『日』字格分作上下兩個部分,上部為圓形,圓周與『日』字格邊框相切,斜弧線那一筆要頭粗尾細,頭部從圓與日字格右切點開始,寬度占圓周八分之一,然後收細畫弧,筆尖到日字格左下結束。」韋一心笑道:「當然是有規矩的。」
「時來天地同運力。」周至都樂壞了:「確認了,一個老師教出來的!瀚文字庫逗號的矢量化規則也是這樣!」