中國將打造1.2億詞級蒙古文文獻語料庫
2018年11月23日 13:09:00來源:新華網
新華社呼和浩特11月23日電(記者勿日汗)我國正在建設一個總字數將達到1.2億詞的大型蒙古文文獻語料庫,目前已完成800萬字語料的錄入校對工作。
記者從承擔這項工作的內蒙古自治區社會科學院了解到,蒙古文文獻語料庫,將窮盡式收集和納入自蒙古文第一部文獻《成吉思汗碑文》(1225年)以來的中世紀傳統蒙古文文獻和近代蒙古文木刻本文獻。對於現代文獻,將按學科分類,即按法律法規、文學藝術、新聞媒體、醫藥醫學、應用公文、教學教材、軍事、體育等擇優選錄。
蒙古文文獻語料庫建設將通過錄入、校對、數據標注加工等環節,按照國際領先水準,設計蒙古文語料資源管理平臺網路版。其最終目標是建成世界最大、最全、最精的網路版蒙古文文獻語料庫,為保護、開發、利用蒙古文文獻資料提供基礎。
2015年策劃開展的這項工作將於2024年結束。目前,正在進行共109卷的佛教經典蒙古文《甘珠爾經》的錄入工作。
[責任編輯:楊永青]