Tetralet 寫:在將 LC_ALL 設定為 zh_TW.UTF-8 的情況下,
gcin 能正確輸出 UTF-8 的『~』並不為奇;
因為它的輸入法對應表本來就是以 UTF-8 編碼的。
我只是很好奇的是,
在未將 LC_ALL 設定為 zh_TW.UTF-8 的情況下,
gcin 似乎會呼叫 g_locale_from_utf8 進行 utf8 -> big5 的轉換,
然後系統又似乎會依據 LC_CTYPE 來將 gcin 所輸出的 Big5 文字又轉換回 UTF-8 編碼。
首先,系統是從何得知,gcin 所輸出的是 Big5 碼呢?
而系統又是依據什麼規則,
將『~』(U+FF5E) 轉成錯誤的『∼』(U+223C) 呢?
moto 寫:轉錄果正大哥在 BBS 上說的:
- 代碼: 選擇全部
作者 Edward (L.G.J.) 站內 Edward
標題 Re: BIG5(CP950) vs. BIG5-HKSCS
時間 Thu Nov 4 00:47:52 2004
───────────────────────────────────────
※ 引述《Edward (L.G.J.)》之銘言:
> ps.請參考:
> http://moto.debian.org.tw/viewtopic.php?t=4744
> 的討論,據我所知 mozilla 就有可能把其中一些 BIG5 的字弄成是 BIG5-HKSCS
> 的對應。大概要看原 post 看是在什麼清況下造成的。基本上 glibc 的表格
> 應該是正確的(但應該是說正確的 CP950)。
答案揭曉。原來是使用于廣輝的 autoconvert 轉的。
Big5 的部份是 foka 在修正的,so...
請大家愛用 iconv 來轉檔,因為他是根據 glibc 的表格,而 glibc
的表格就是小虫和居士合作生產的啦!:)
--
※ Origin: SayYA 資訊站 <bbs.sayya.org>
◆ From: 218-169-141-240.dynamic.hinet.net
文章選讀 (y)回應 (=\[]<>-+;'`jk)相關主題 (/?)搜尋標題 (aA)搜尋作者 (T)解碼
正在瀏覽這個版面的使用者:沒有註冊會員 和 1 位訪客