11月10日,“漢字守護計劃”公益行動發(fā)布一周年成果。官方指導(dǎo)“生僻字征集”小程序迄今有2500多萬人次參與,提交生僻字16800個。經(jīng)工信部電子工業(yè)標(biāo)準(zhǔn)化研究院初篩,其中457個尚未獲得強制性國家標(biāo)準(zhǔn)GB 18030《信息技術(shù) 中文編碼字符集》編碼,以地名、人名、方言用字為主,具有較高的實用價值或文化價值。同日,“生僻字征集”小程序內(nèi)上線“救字文檔”功能,繼續(xù)向公眾征集457個生僻字的相關(guān)考證資料,以協(xié)助專家組加快完成考證及編碼申請。
據(jù)不完全統(tǒng)計,全國有6000余萬人的姓名,以及大量地名、古籍、方言中包含生僻字,其中多數(shù)尚未實現(xiàn)數(shù)字化。去年11月,騰訊聯(lián)合工信部電子工業(yè)標(biāo)準(zhǔn)化研究院、光明日報全媒體、北京國家金融標(biāo)準(zhǔn)化研究院、漢儀字庫、OPPO、陜西歷史博物館等機構(gòu)與企業(yè),共同發(fā)起“漢字守護計劃”公益行動,發(fā)揮各自優(yōu)勢并加大投入力度,加速貫通生僻字數(shù)字化全鏈路,旨在助力破解生僻字使用難題,重?zé)ê蛡鞒猩ё直澈蠓e淀的中華傳統(tǒng)文化。該計劃于今年4月20日世界中文日上線“生僻字征集”小程序,直接面向公眾征集無法輸入的生僻字。
生僻字數(shù)字化是一項復(fù)雜的系統(tǒng)工程,每個漢字應(yīng)用于數(shù)字系統(tǒng),都要經(jīng)歷“發(fā)現(xiàn)、考證、編碼、擴容國標(biāo)、字形設(shè)計、輸入顯示、推廣應(yīng)用”等一系列環(huán)節(jié)。其中,漢字編碼環(huán)節(jié)周期長、復(fù)雜性高,要對漢字的實際使用范圍、形音義正確性、字形區(qū)別與認同、文獻用例等進行大量考證,涉及語言文字、文化、信息技術(shù)、標(biāo)準(zhǔn)化等多個領(lǐng)域,需投入大量人力查找文獻古籍、搜尋實際應(yīng)用案例。按照常規(guī)流程和進度估算,完成這457個漢字的申請編碼資料至少需要兩年時間。
工信部電子工業(yè)標(biāo)準(zhǔn)化研究院中文信息研究室主任黃姍姍表示,“生僻字征集小程序以創(chuàng)新方式為‘收字’提供高效支撐,特別是此次篩選的457個未編碼漢字,更多來源于各地居民的日常生活,有著很深的群眾基礎(chǔ)和鮮活的社會生命力。電子工業(yè)標(biāo)準(zhǔn)化研究院正全力優(yōu)先開展此批漢字的考證工作,加快推動編碼,擴容國標(biāo)字庫。”
為進一步助力提升申請編碼資料的考證效率,“生僻字征集”小程序內(nèi)全新上線 “救字文檔”功能,支持全國各地用戶低門檻參與,微信搜索“生僻字征集”小程序即可加入,填寫漢字的讀音、來源等信息。
(用“救字文檔”可快速上傳生僻字考證資料)
騰訊輸入法部總經(jīng)理魯劍表示,“漢字守護計劃關(guān)注全鏈路,‘生僻字征集’小程序初見成效,核心在于以民生與文化為出發(fā)點,以數(shù)字科技匯聚公眾向善之力。此次開發(fā)‘救字文檔’,希望發(fā)揮平臺的連接作用,讓這些未編碼漢字盡早擁有‘?dāng)?shù)字身份’。同時,騰訊搜狗輸入法將繼續(xù)務(wù)實推進生僻字解決方案在金融、醫(yī)療等民生場景落地。”
據(jù)悉,457個未編碼生僻字中,地名用字328個,占比72%,人名用字66個,占比14%。例如,廣東佛山市高明區(qū)的地名用字“土?”(左右結(jié)構(gòu),專家初步考證音同qǐng),該字用于荷城街道一個鄉(xiāng)村的名字——“下長「土?」村”。當(dāng)?shù)鼐用衽南氯粘I钪性撟质褂玫陌咐龍D片,或發(fā)現(xiàn)該字的使用歷史、地方志等文化研究資料,上傳到“救字文檔”,即可助力專家收集考證資料,并實現(xiàn)更高效的針對性考察。
原創(chuàng)文章,作者:蘋果派,如若轉(zhuǎn)載,請注明出處:http://2079x.cn/article/594432.html