推薦標簽:于正侵權案|全球百大品牌|掃心地|送詩人去流浪|

您的位置:台灣網  >  兩岸文化  >  大陸文化看點

三千生僻字將入中華字庫 預計2016年10月完成

時間:2015年04月21日 08:54 來源:法制晚報 字號:       轉發 列印

  方正電子承擔“當代人名地名用字蒐集與整理”工作 明年10月將完成 各領域系統升級可識生僻字

  法制晚報訊(記者 馬曉晴)一些人由於名字裏帶有生僻字,買火車票、辦身份證、申領社保卡等均無法正確顯示全名。到銀行取錢都要被反覆核實身份,耗費很多時間。

  近日,《法制晚報》記者從北大方正電子有限公司(以下簡稱“方正電子”)獲悉,該公司將承擔“中華字庫”中第17包“當代人名地名用字蒐集與整理”工作,將收集人口資訊中約3000個未編碼的生僻字。該項目預計在明年10月完成,可有效解決用生僻字取名無法錄入、顯示的問題。

  困擾 名字為亂碼 難領社保卡

  市民剛女士的名字中,帶有一個“ ”(yan,三聲)字。多年來,她辦理火車票、飛機票都無法正確顯示全名,“電腦打出來的是問號、方塊,或者乾脆是亂碼。”因為電腦“不識字”,工作兩年的她至今未能申領到社保卡,只能自費看病。

  由於無法在支付寶上完成實名認證,剛女士用不了滴滴、快滴等打車軟體,就連搶到的紅包都提不了現金。記者在商務印書館出版的第10版《新華字典》中,查到了這個“ ”字。詞條解釋為人名用字,是五代時期南漢的劉 為自己造的字。

  剛女士説,父母為她起名時用這個“ ”字,是取“飛龍在天”的寓意,“他們真沒想到會給我帶來這麼多麻煩”。

  解決 3000生僻字 明年完成編碼

  生僻字取名帶來的問題有望得到解決,記者近日從方正電子獲悉,該公司將承擔“中華字庫”中第17包“當代人名地名用字蒐集與整理”和第20包“字庫製作一:中間字庫、宋体楷體等成果字庫”項目,預計在2016年10月完成。

  方正電子字庫業務部副總經理黃學鈞介紹,“中華字庫”工程于2011年啟動,共分為28個包,近30家高校、科研院所和企業參與了研發工作。方正電子負責的第17包,將收集人口資訊中約3000個未編碼的生僻字,將“中華字庫”中的漢字總量擴充到7萬餘個。

  第20包將製作完成包含30萬字的宋体、楷體成果字庫以及7萬多字的壓縮字庫,可滿足我國各民族古今各類文獻的出版印刷、數字化處理和傳輸的需要。

  剛女士名字中的“ ”字,在家用電腦上可以打出,但在社保和銀行的系統中無法顯示。黃學鈞解釋説,只要是電腦裏能打出的字,都是被編碼過的,“也就是已經收入字庫了”。

  他分析認為,可能一些單位的數據庫沒有升級,還是用的老字庫,所以顯示不了“ ”字,“只要升級系統、更新字庫就沒問題了”。他提到,“中華字庫”中的每個字都有對應的編碼,“相當於門牌號”,如“ ”字的編碼為“4DAE”。

  黃學鈞表示,生僻字的蒐集範圍應在公安、民政、教育、郵政、測繪、銀行等領域中選取,但必須包含公安和民政部門。“我們完成項目後,也會積極向銀行、社保、醫療、教育等領域推廣,幫助單位、企業升級字庫系統,解決生僻字帶來的煩惱。”

[責任編輯:楊永青]

向艷梅:一路走來不容易

  “我是不會放棄(奧運會)的。”4年前在最後時刻落選奧運會,讓女子舉重69公斤級選手向艷梅失落許久,卻沒有讓她就此消沉。

關於我們 | 本網動態 | 轉載申請 | 投稿郵箱 | 聯繫我們 | 版權申明 | 法律顧問
京ICP證130248號 京公網安備110102003391
網路傳播視聽節目許可證0107219號
台灣網版權所有