方正電子承擔“當代人名地名用字蒐集與整理”工作 明年10月將完成 各領域系統升級可識生僻字
法制晚報訊(記者 馬曉晴)一些人由於名字裏帶有生僻字,買火車票、辦身份證、申領社保卡等均無法正確顯示全名。到銀行取錢都要被反覆核實身份,耗費很多時間。
近日,《法制晚報》記者從北大方正電子有限公司(以下簡稱“方正電子”)獲悉,該公司將承擔“中華字庫”中第17包“當代人名地名用字蒐集與整理”工作,將收集人口資訊中約3000個未編碼的生僻字。該項目預計在明年10月完成,可有效解決用生僻字取名無法錄入、顯示的問題。
困擾 名字為亂碼 難領社保卡
市民剛女士的名字中,帶有一個“ ”(yan,三聲)字。多年來,她辦理火車票、飛機票都無法正確顯示全名,“電腦打出來的是問號、方塊,或者乾脆是亂碼。”因為電腦“不識字”,工作兩年的她至今未能申領到社保卡,只能自費看病。
由於無法在支付寶上完成實名認證,剛女士用不了滴滴、快滴等打車軟體,就連搶到的紅包都提不了現金。記者在商務印書館出版的第10版《新華字典》中,查到了這個“ ”字。詞條解釋為人名用字,是五代時期南漢的劉 為自己造的字。
剛女士説,父母為她起名時用這個“ ”字,是取“飛龍在天”的寓意,“他們真沒想到會給我帶來這麼多麻煩”。
解決 3000生僻字 明年完成編碼
生僻字取名帶來的問題有望得到解決,記者近日從方正電子獲悉,該公司將承擔“中華字庫”中第17包“當代人名地名用字蒐集與整理”和第20包“字庫製作一:中間字庫、宋体楷體等成果字庫”項目,預計在2016年10月完成。
方正電子字庫業務部副總經理黃學鈞介紹,“中華字庫”工程于2011年啟動,共分為28個包,近30家高校、科研院所和企業參與了研發工作。方正電子負責的第17包,將收集人口資訊中約3000個未編碼的生僻字,將“中華字庫”中的漢字總量擴充到7萬餘個。
第20包將製作完成包含30萬字的宋体、楷體成果字庫以及7萬多字的壓縮字庫,可滿足我國各民族古今各類文獻的出版印刷、數字化處理和傳輸的需要。
剛女士名字中的“ ”字,在家用電腦上可以打出,但在社保和銀行的系統中無法顯示。黃學鈞解釋説,只要是電腦裏能打出的字,都是被編碼過的,“也就是已經收入字庫了”。
他分析認為,可能一些單位的數據庫沒有升級,還是用的老字庫,所以顯示不了“ ”字,“只要升級系統、更新字庫就沒問題了”。他提到,“中華字庫”中的每個字都有對應的編碼,“相當於門牌號”,如“ ”字的編碼為“4DAE”。
黃學鈞表示,生僻字的蒐集範圍應在公安、民政、教育、郵政、測繪、銀行等領域中選取,但必須包含公安和民政部門。“我們完成項目後,也會積極向銀行、社保、醫療、教育等領域推廣,幫助單位、企業升級字庫系統,解決生僻字帶來的煩惱。”
[責任編輯:楊永青]