第九百七十七章 開會(2/2)
「我可以為大家爭取,」麥克林說道:「但是目前來說,大家最好還是按照D日來進行工作計劃。」
「國傑教授那邊呢?」周至對麥明川問道。
李國傑是負責曙光超算作業系統SNIX的,他們那邊也有大字庫的需要,因此也有一套班子,主要負責對這邊的成果進行驗證,其實主要就是白嫖。
但是蜀大也沒有辦法,因為為了提高工作效率,周至之前開發了一套文字識別系統,這個系統能夠通過一系列的處理,將掃描的圖像字轉化為系統使用的失量字,毫無疑問能夠節約大量的人工勞動。
但是有個問題,就是非常消耗運算資源,蜀大的幾台機子處理不了,這部分工作得交給曙光超級計算機來完成。
雖然部委和超算中心頗有以大欺小的嫌疑,畢竟設計思路和解決方案都是蜀大提出來的,超算中心只負責運算出成果而已,然而拋開這些不談的話,這其實不亞於阿姆斯特朗登錄月球的一步。
文科863工程項目也有了使用超級計算機的資格,周至這也算是給文理之間身後的隔閡撕開了一條縫隙。
「曙光很厲害。」說到這個麥明川也不得不服:「雖然分給我們的工作時間很少,但是采字工作已經全部完成了,就目前我們收集的七萬多個漢字,已經全部完成了失量化的工作。」
「不過配碼工作老李不肯幫忙了,得咱們自己來水磨。」
「這個好辦。」辜開來說道:「肘子根據我編字典的方法編寫了一套計算機算法,能夠將《漢語大字典》里的漢字,按照當時的編目規則,將文字自動轉化成編碼。」
「是嗎?要有這個可就太方便了!」麥明川大喜:「我跟學校建議過對肘子進行特招,你們就是推擋。要干字庫,正需要文理兼通的人才才行!」
「只是這套規則只處理了《漢語大字典》里的五萬字。」周至說道:「而瀚文大字庫一二級就是七萬字,三級加上更是過十萬了,還是需要結合識別系統里的字根與筆畫識別功能,配合文字的讀音和筆畫,給失量字配碼才行。」
「給《漢語大字典》完成編碼,用了多少時間?」
「在失量字現成的情況下,採集字根,參考讀音,分配編碼。」周至笑道:「其實動作很快的,反倒是調試BUG和處理一些系統無法判定的存疑字,耗費的時間更多。」
「我用了兩天時間完成了可行性實驗,在個人電腦上能夠做到五秒處理一個字。」
「那就省大事兒了!」王主任又驚又喜:「如此一來我們D日前按時交付產品,應該就沒有問題了。」
麥明川現在覺得周至簡直就是瀚文大字庫工程的吉祥物,他一來工程就能夠取得巨大的進展,這娃非常喜歡動腦筋,喜歡開發各種各樣的程序來代替繁瑣工作,從最早的手寫字庫,到字根筆畫分析系統,識別系統,轉換系統,再到現在的自動編碼系統,常常使用蠻不講理的方式,給理科生們撞開一條條寶貴的道路。
李紅江團隊下的人的確有些委屈,他們現在也漸漸明白了這個工程的本質,那就是它本身的確是一個文科項目,設計思路、理念、方法論,全都是文科的那一套,具體到了操作層面,才有理科生插手的餘地。
說白了,這就叫管理層和打工仔的區別。