關於繁簡中文轉換

由於種種歷史問題,漢字系統被割裂爲「簡化字」和「繁體字」,然而「簡化字」並不能完全取代原有的繁體字,一方面是由於古籍、書法、文字學的研究需要,另一方面則是港澳臺日韓越及其他海外地區「簡化字」並不通行。隨着信息技術的發展,這方面的需求不斷突出,因此簡繁轉換便成了一個信息技術界和中文研究界需要共同解決的問題。

精確的簡繁轉換一直以來是一個難題,其原因主要是簡體和繁體互有一對多的現象,而具體用字對應規則需要聯繫上下文分析語義纔能確定。而廣義的「簡繁轉換」,還包括了不同地域習慣用字和用詞差異的轉換(如「软件」「軟體」等),甚至詞和詞之間也有「一對多」的關係,因而使轉換更加複雜。目前現有的簡繁轉換軟件,即使是專業的(收費),也不能完全解決這些問題,在開源界能接近其水平的更是寥寥無幾。

推薦目前可以在網頁上直接轉換的網站:http://38time.artjoey.com/link/trans_ts.htm

沒有留言:

張貼留言

精選文章

解決 MySQL 資料庫插入中文資料時會變成亂碼的問題

MySQL 會出現中文亂碼的原因不外乎下列幾點: MySQL server本身設定問題,例如預設編碼 DEFAULT CHARSET=latin1 MySQL table 的語系設定問題 (包含 character 與 collation (校對)) 客戶端程式(例如 ...

Popular Posts