中新社北京五月二十二日電(李瓊)基于漢字字形形式化描述方法的漢字輸入暨識別系統(tǒng)和留學生錯字數據庫已研發(fā)成功。這個系統(tǒng)成功解決了漢字教學存在的突出問題,對于外國留學生漢字教學、服務漢語國際教育具有重大意義。
這套系統(tǒng)由北京語言大學教授宋柔和內蒙古師范大學教授林民合作研發(fā)。
宋柔二十二日在北京語言大學召開的漢字字形處理技術研討會上說,這一成果旨在促進信息技術在漢字教學、典籍整理、漢字研究中的深層次應用。該系統(tǒng)也可用于典籍的文字保真輸入、檢索比對分析和出版,從而推進中華文化的保護和傳承推廣工作。
北京語言大學校長崔希亮說,漢語國際推廣的事業(yè)正在蓬勃發(fā)展當中,而怎么解決漢語難學的瓶頸問題是大家關注的焦點。漢語教學的瓶頸問題,有很大一部分是漢字的問題,比如說怎樣處理留學生五花八門的錯別字,就是一個考驗,而這與漢字信息技術的發(fā)展密切相關。
據了解,漢字輸入暨識別系統(tǒng)已輸入國際標準基本字符集中的全部兩萬多個漢字,并輸入了一批典型錯字,建立了歐美留學生錯字數據庫。數據庫中包含了從一千多篇留學生作文中抽取的全部錯字。數據庫還建立了高頻錯誤偏旁庫,對錯字、錯誤偏旁和錯誤筆畫組合進行了統(tǒng)計分析。
這個系統(tǒng)能使用輸入筆或鼠標輸入漢字,包括正字、錯字和變體字,無須訓練就能識別輸入的漢字。這一系統(tǒng)能與各種通用編輯器、數據庫工具結合,從而能在字形保真的前提下輸入留學生的作文,能建立留學生錯字數據庫,并能利用通用工具的各種功能,像處理正字一樣地處理錯字、變體字。(完)
Copyright ©1999-2024 chinanews.com. All Rights Reserved