unicode 繁簡 轉換的問題

如果您覺得您的問題不屬於 debian desktop 或是 debian server 版的範圍內,請在這裡發問。

版主: mufa

unicode 繁簡 轉換的問題

文章訪客 » 週日 4月 24, 2005 12:58 am

抱歉 問一個 和debian 不是很相關的問題.
我知道 iconv 可以 拿來 作轉碼的動作( 就我所知 是 作內碼的轉換 ). 不過 因為 現在我手邊有的檔案 有的 簡體碼是
代碼: 選擇全部
\uxxxx

的格式, 所以 不能直接轉換. 我的想法是先把unicode的簡體碼轉成簡體內碼. 再把 簡體內碼 轉成 big5 的unicode 內碼, 最後才轉成 unicode的 big5 碼(e.g., \u3775).
不過 我對 轉碼的 東西不是很熟悉. 所以想請教一下,
1.) GBK 內碼在 unicdoe的範圍是 多少呢? (\uxxxx <-> gbk內碼)
2.) and Big5的 (or 和正常的big 編碼鄉同嗎)? (\uxxxx <-> big5內碼)
3.) GBK 和 big5之間字的 mapping (比如說, 簡體字的測的試 和 繁體字測試的試 之間的mapping)
我查了一下unicode.org的資料. 覺得還是有點霧紗紗. 希望知道的先進能夠指點一下, 或是 那裡有相關的 資源可以參考.
謝謝.
訪客
 

文章kanru » 週日 4月 24, 2005 11:35 am

http://www.unicode.org/Public/UNIDATA/Unihan.txt
其他還有很多可以參考的, iconv, zh-autoconvert, Perl 的 Encode, Encode::HanConvert, Lingua::ZH::HanConvert

把 \uxxxx 先轉回 binary 格式,轉碼,再轉回來應該也可以。

BTW, 「轉成 big5 的 unicode 內碼, 最後才轉成 unicode 的 big5 碼」很奇怪,big5 碼就是 big5 ,怎麼會跟 unicode 扯在一起 8-)
圖檔
頭像
kanru
榮譽學長
榮譽學長
 
文章: 578
註冊時間: 週六 7月 12, 2003 12:09 pm

文章d2207197 » 週日 4月 24, 2005 5:42 pm

訪客 寫:(or 和正常的big 編碼鄉同嗎)

什麼是正常的 big 編碼?有這種東西?
頭像
d2207197
鑽研的研究生
鑽研的研究生
 
文章: 1763
註冊時間: 週二 5月 27, 2003 9:57 pm
來自: 火星

文章訪客 » 週一 5月 09, 2005 2:41 pm

d2207197 寫:
訪客 寫:(or 和正常的big 編碼鄉同嗎)

什麼是正常的 big 編碼?有這種東西?

抱 歉, 打錯字. 是 Big5 編碼.
訪客
 


回到 debian misc

誰在線上

正在瀏覽這個版面的使用者:沒有註冊會員 和 1 位訪客