第一千一百零三章 時來天地同運力(1/2)
「不過對於構建信息化字庫來說,讓程序識別字根,會讓我們的效率得到巨大的提高。」
「原來如此。」冷玉龍點頭:「那我們再說回《字海》。」
「漢字有新舊字形之別,因此我們在《字海》,字頭還是採用新字形;而在《印刷通用漢字字形表》以外的字頭,則依該表原則作了整理;」
「那就是相當於製作了一部新的,概括範圍更大的《印刷通用漢字字形表》?」周至問道。
「是的。」韋一心點頭:「不過你們的字根法更加科學,不必用回來。」
冷玉龍也點頭表示認可:「《字海》里的繁體字字頭後,也附有相應的簡化字,簡化字範圍限於《簡化字總表》之內。」
「《字海》注音用漢語拼音字母,並在其後加注直音,直音以現代讀音為據;」
「多音字讀音按常見音項在前,非常見音項在後的順序排列,無法判斷常見或非常見的字音則按引例時代先後排序。」韋一心補充道:「有異讀的字,則按普通話語音審定委員會審定音來標註。而方言字,則依方言與普通話讀音對應規律或實際讀音來注音。」
「差不多就這些了吧?」冷玉龍問道:「辭書的釋義部分和字碼沒什麼關係了,還用講嗎?」
「講,我也學習學習。」周至聽得美滋滋的,這還是他第一次曉得如何編纂一本《字典》,尤其是釋義部分,和字庫編纂沒有什麼關係,因此興趣更加的濃厚。
冷玉龍對周至的好學精神很滿意,笑道:「釋義的話,我們先解本意,次引申義。」
「對於異體字、簡化字、二簡字、錯訛字,不單獨釋義,也不注音,但云『同『某』』,『『某』的簡化字』,『曾作『某』的簡化字』,後停用』,『『某』的訛字』等,同時,還要以『見』或『字見』的方式,指明其出處。」
「字以楷書隸書作成字卡,共收漢語單字85568個。主要收字依據一共有十一個來源。」韋一心如數家珍:
「一是歷代辭書,如《說文》、《玉篇》、《廣韻》、《集韻》、《康熙字典》等書中收錄的漢字。」
「二是歷代辭書未收而見於文獻典籍的漢字。」
「三是國家語言文字工作委員會頒布的《簡化字總表》中的全部簡化字。」
「四是甲骨文、金文和竹簡、帛書中學術界比較公認的隸定字。」
「五是歷代碑刻中的異體字。當然了,訛字除單體字外,我們一般不收。」
「六是地方文獻和方言辭典中的方言字。」
「七是近現代出現的科技新字。」
「八是當今還在使用的人名和地名用字。」
「九是當今出版物中出現的超出《簡化字總表》範圍之外的類推簡化字。」
「十是七七年中國文字改革委員會公布的那一版《第二次漢字簡化方案草案》中的漢字。」
「最後就是流行於港、澳、台地區的漢字。在日本、韓國、新加坡等國使用的漢字,本書也酌量收錄。」
冷玉龍補充道:「此外,為了充分反映漢字的實際情況,《中華字海》還酌量收錄了歷代文獻中的新舊筆形與訛字。」
本章未完,點選下一頁繼續閱讀。