中新社西寧8月2日電 (記者 羅雲鵬)2日,記者從青海省海南藏族自治州藏語委辦獲悉,由該辦負責開發的全球首個藏文智慧搜索引擎“雲藏”(下稱“雲藏”)開始上線試運作。
“雲藏”一詞是藏文( )的音譯詞,有兩層含義,其一為“上師”或“老師”,意為有求必應、有問必答;其二是將其分為單字,有“全面抓取、提取”之意。
“雲藏”是青海省少數民族事業“十二五”規劃中藏文資訊化建設的重要組成部分,于2013年4月啟動系統平臺項目建設,研發團隊現有150余名工作人員,由藏文資訊錄入組、分詞標注組和技術組3個小組組成,團隊中藏族比例達87%。
青海省海南藏族自治州藏語委辦主任、“雲藏”引擎開發負責人才洛介紹,“雲藏”旨在滿足廣大藏文網民個性化檢索需求,推動藏文資訊化工作邁上新臺階,目前該引擎涵蓋新聞、網頁、圖片、視頻搜索基本功能以及百科、文庫和問答系統。
據了解,目前中國國內如百度、搜狗等主要的搜索引擎中無藏文搜索功能,國外搜索引擎只支援簡單的藏文搜索,如谷歌、雅虎以及微軟的bing搜索引擎等。
“由於谷歌、雅虎等數據索引庫在國外,檢索到的資訊準確性和內容有受制性,對應出自國內的真實和有效的資訊不能被及時檢索,提供的有關藏文化知識準確度不高、資訊量不夠。”才洛坦言,“目前‘雲藏’搜索引擎研發領域內藏文資訊處理技術還未完全成熟,還存在著諸多問題和不足,部分功能和內容仍處於調試和擴充階段,需要不斷地改進和完善。”
據初步估算,“雲藏”運作初期,青、藏、甘、川、滇五省區的藏文用戶數量約為120萬,隨著搜索引擎産品的推廣和宣傳,用戶量將達200萬。
才洛表示,“雲藏”建成後對藏文資訊安全、國內外涉藏輿情監測以及重要輿情分析將提供可靠的參數和依據。(完)