第二千六百一十八章 中文的精妙(2/2)
「漢字每一筆畫都承載重要信息,這樣的極致高效也帶來了許多的問題。」
「首先就是學習困難,一個人一般需要經過多年的學習,才能夠掌握漢字的讀寫能力,我們甚至可以將這個問題分成三個,有不少在中國居住多年的外國人,他們甚至已經可以熟練使用漢語進行對話交流,但是在閱讀上還很生疏,在書寫上則完全不會。」
「而這個現象在注音字符型文字上就要簡單得多,只要知道單詞的讀音,也能夠大致根據拼寫寫出單詞來,因此學習起來簡單得多。」
「對於信息產業來說,要輸入漢字到信息系統,也會遇到類似的困難。」
「好在我們的統一碼和瀚文字庫輸入法,便捷地解決了這個問題,輸入法的聯想造詞功能,甚至跳過了以前輸入者必須懂得書寫這一步,可以利用拼音和輸入法給出的選擇列表,只需要會讀會認,便可以在信息系統完成輸入。」
「有了較為完美的輸入法解決方案,現在中文信息字符的輸入速度,已經遠超英文信息的輸入速度,以前最大的瓶頸,現在反過來成了漢字輸入優越性的表現。」
台下又響起了一片掌聲。
「這個有研究數據予以證實嗎?」劉副部長再次問道。
「有的。現在最快的輸入法已經可以讓熟練使用者在每分鐘內錄入兩百到三百個漢字。很多系統如郵電,銀行,他們的內部技能競賽都證明了這一點。」
「而對於英文錄入者來說,即便是經過長期強化訓練的文員,客服,一般只能達到每分鐘120個單詞。」
劉副部長不再說話,只滿意地點了點頭。
「綜上所述,我們目前已經解決了人機互動『人』的這個層面,但是卻面臨了第二個巨大的困難,那就是人機互動中『機』的這一面,即讓機器能夠理解漢語文字指令的問題。」
「因為漢語信息量巨大,往往導致『一詞多意』這種現象的產生,故而漢字語言的真實意義,不能將詞語割裂開來,而是需要結合上下的銜接詞彙,甚至是銜接段落,才能夠準確地闡釋與理解。」
「換言之,就是漢語為了實現如此巨大的信息承載量,自身會依賴漢語語法和文法,構建出一套內容深厚邏輯體系,這套邏輯體系加上文字本身,才能夠準確地表達出真實的意思。」
「比如『太』,『土』等字,具有的含義可能不下十來種,要構擬出一套可以理解中文的信息系統,遠比構擬出一套字符型文字系統來,更加的困難。」
「這也是信息產業到目前為止,都是依靠邏輯性更佳直白簡潔的字符型文字來處理的關鍵原因所在。」
「其次,漢語文義本身,往往是一個作者和讀者雙方『共建』的過程,這一點在中國古代文學的表現上,尤其的明顯。」(本章完)