首頁 > 現代都市 > 重生之乘風而起 > 第二千五百七十九章 萬事具備,恰遇東風

第二千五百七十九章 萬事具備,恰遇東風(1/2)

目錄

光有這個協議是不夠的,要將之推廣開,就需要一個非常適合的應用場景。

嵌入個人作業系統,是最好的選擇,於是就產生了瀚文大字庫,這個字庫以其優異卓越的性能,可以分級使用的靈活配置,能夠滿足從日常家用電腦到專業級圖書出版社的使用,得到了微軟的青睞。

再往上一層就是擴展應用,這一層的產品包括了給各種專業設備如印表機,彩印機,排版系統,通信設備所使用的軟硬體升級套餐。

硬體中包括了字庫晶片,漢卡;軟體里包含了輸入法,編輯軟體,漢化工具包等等。

如果不是一開始周至就將和漢字編碼相關的這一系列問題予以了全局性的考慮,麥明東可以想像得到,哪怕以瀚文字庫如此優越的性能,在推廣當中也會遇到諸多的麻煩,每一道坎,都可能讓瀚文大字庫最後和許多所謂「科研成果」一般,成為束之高閣的的東西。

要按照「正常」的方式來,恐怕直到現在瀚文字庫都還會處在艱難的推廣階段,不可能成為全世界默認的惟一通用字庫軟體。

「亞洲區統一編碼現在被證實命名為UTF-8編碼,命名大會下周會在首都召開,由UNICODE組織在會後對外證實公布。」麥明東說道:「這是中國對世界信息產業做出的一項巨大貢獻,也是中國在信息學層面將傳統文字融入到資訊時代的最完美,最成功的案例,你的貢獻很大,這一次可不能缺席了。」

「他們是要和信息交換標準委員會打擂台,故意造出這麼大的聲勢,我就不去給他們助興了吧?」周至笑道。

「我其實一直有一個問題。」麥明東想了一下,還是決定問出來:「你在搞瀚文大字庫的時候,就已經考慮好了後來基於UNIX系統研發出來的COiniCOS了?」

UTF是Unicode Tranation Format的縮寫,意為Unicode轉換格式。

8代表的是八比特,也就是四個字節,意味著UNICODE字符由4個字節表示。因為UTF是一種變長的編碼,因此這個8其實指的是編碼規則的比特上限,其實大多數的UNICODE字符用不到這麼長的字節數,

傳統的信息系統基本採用的是最知名可能要數被稱為ASCII的7位字符集。它是American Standard Code for Information Interchange的縮寫,意為北美信息交換標準碼,本身是米國英語通信所設計的。

因為是針對英語設計的,別說處理漢字,就連處理帶有音調標號的幾種歐洲文字時都就會出現問題。

為了表示更多字符,人們打起了校驗碼的主意,讓最高位也用作字符表示,這就是ASCII碼擴字符集。

一種擴展是把值為128-255之間的字符用於畫圖和畫線,以及一些特殊的歐洲字符。另一種擴展是把位於128-255之間的字符用於拉丁字母表中特殊語言字符。

隨著信息技術在全世界各個國家的發展,這種修修補補的方法,其局限性就徹底暴露了出來。

作為脫離傳統打字機的後生事物,UTF-8代表著信息技術新時代,即網絡時代和無線通信時代的先進編碼。

除了字符數量可以幾乎不受約束地編制之外,它還可以通過屏蔽位和移位操作快速讀寫,也可以使排序變得更加容易。

但是UTF-8也不是一點問題都沒有,比如目前的部分系統如ISO 2022,4873,6429和8859,會將UTF-8超過百分之五十使用率的碼值100xxxxx解讀成C1控制碼,導致被過濾或者解讀出錯。

但是這個問題很好解決,就是通過一個字節對UTF-8進行修正,因而構成UTF-8修正碼。

本章未完,點選下一頁繼續閱讀。

目錄
返回頂部