『~』和『∼』...

歡迎提問 debian desktop 相關問題,何謂 desktop ? 舉凡您日常生活會用到的部份,如上網 ( www 、 bbs ..) 、程式設計、繪圖...等等。 通常以 X Window 環境底下問題為主。

re:『~』和『∼』...

文章Tetralet » 週五 11月 05, 2004 9:58 pm

實在太辛苦您囉∼∼ :w_28:
時間並不能治療我心中的疼痛
南方的春天說什麼也溫暖不了我冰冷的血

誦唱大復活咒文,今天的 Tetralet 又在唧唧喳喳了 重生!
Tetralet
俺是博士
俺是博士
 
文章: 3078
註冊時間: 週四 11月 28, 2002 3:02 pm

re:『~』和『∼』...

文章Tetralet » 週五 11月 05, 2004 10:30 pm

在將 LC_ALL 設定為 zh_TW.UTF-8 的情況下,
gcin 能正確輸出 UTF-8 的『~』並不為奇;
因為它的輸入法對應表本來就是以 UTF-8 編碼的。

我只是很好奇的是,
在未將 LC_ALL 設定為 zh_TW.UTF-8 的情況下,
gcin 似乎會呼叫 g_locale_from_utf8 進行 utf8 -> big5 的轉換,
然後系統又似乎會依據 LC_CTYPE 來將 gcin 所輸出的 Big5 文字又轉換回 UTF-8 編碼。


首先,系統是從何得知,gcin 所輸出的是 Big5 碼呢?

而系統又是依據什麼規則,
將『~』(U+FF5E) 轉成錯誤的『∼』(U+223C) 呢?
時間並不能治療我心中的疼痛
南方的春天說什麼也溫暖不了我冰冷的血

誦唱大復活咒文,今天的 Tetralet 又在唧唧喳喳了 重生!
Tetralet
俺是博士
俺是博士
 
文章: 3078
註冊時間: 週四 11月 28, 2002 3:02 pm

re:『~』和『∼』...

文章Tetralet » 週五 11月 05, 2004 11:48 pm

對了,忘了說,
我大略得看了一下 zh-autoconvert 的原始碼,
zh-autoconvert 用的是自行建立的字碼轉換表,
所以基本上和 glibc 無關。
時間並不能治療我心中的疼痛
南方的春天說什麼也溫暖不了我冰冷的血

誦唱大復活咒文,今天的 Tetralet 又在唧唧喳喳了 重生!
Tetralet
俺是博士
俺是博士
 
文章: 3078
註冊時間: 週四 11月 28, 2002 3:02 pm

Re: re:『~』和『∼』...

文章Edward G.J. Lee » 週六 11月 06, 2004 1:01 am

Tetralet 寫:在將 LC_ALL 設定為 zh_TW.UTF-8 的情況下,
gcin 能正確輸出 UTF-8 的『~』並不為奇;
因為它的輸入法對應表本來就是以 UTF-8 編碼的。

我只是很好奇的是,
在未將 LC_ALL 設定為 zh_TW.UTF-8 的情況下,
gcin 似乎會呼叫 g_locale_from_utf8 進行 utf8 -> big5 的轉換,
然後系統又似乎會依據 LC_CTYPE 來將 gcin 所輸出的 Big5 文字又轉換回 UTF-8 編碼。


首先,系統是從何得知,gcin 所輸出的是 Big5 碼呢?

而系統又是依據什麼規則,
將『~』(U+FF5E) 轉成錯誤的『∼』(U+223C) 呢?

這個可能要請教一下作者。我記得原來的規劃,全形字有一些是沒有包括的(因為少用),後來才加進去。

gcin 在沒能正確進入 utf8 的情形下,我猜可能一些後來加入的全形字就無法配對,就會交給 gtk2/pango 去處理這個字符。這方面我就不熟悉了。
LGJ
道隱於小成,言隱於榮華。(莊子.齊物論)
頭像
Edward G.J. Lee
榮譽學長
榮譽學長
 
文章: 211
註冊時間: 週一 11月 10, 2003 9:24 pm
來自: 鄉下

Re: re:『~』和『∼』...

文章zero0w » 週六 11月 06, 2004 10:48 am

moto 寫:轉錄果正大哥在 BBS 上說的:

代碼: 選擇全部
 作者  Edward (L.G.J.)                                      站內  Edward     
 標題  Re: BIG5(CP950) vs. BIG5-HKSCS                                         
 時間  Thu Nov  4 00:47:52 2004                                               
───────────────────────────────────────

※ 引述《Edward (L.G.J.)》之銘言:
> ps.請參考:
> http://moto.debian.org.tw/viewtopic.php?t=4744
> 的討論,據我所知 mozilla 就有可能把其中一些 BIG5 的字弄成是 BIG5-HKSCS
> 的對應。大概要看原 post 看是在什麼清況下造成的。基本上 glibc 的表格
> 應該是正確的(但應該是說正確的 CP950)。

  答案揭曉。原來是使用于廣輝的 autoconvert 轉的。

  Big5 的部份是 foka 在修正的,so...

  請大家愛用 iconv 來轉檔,因為他是根據 glibc 的表格,而 glibc
  的表格就是小虫和居士合作生產的啦!:)

--
※ Origin: SayYA 資訊站 <bbs.sayya.org>
◆ From: 218-169-141-240.dynamic.hinet.net

 文章選讀  (y)回應 (=\[]<>-+;'`jk)相關主題 (/?)搜尋標題 (aA)搜尋作者 (T)解碼


Mozilla 自從 1.6 版起,已把 Big5 和 Big5-HKSCS 的編碼方式區分開來,這個問題仍存在嗎?
以源碼改造你的工作生活。
zero0w
懵懂的國中生
懵懂的國中生
 
文章: 189
註冊時間: 週日 2月 15, 2004 3:38 am

上一頁

回到 debian desktop

誰在線上

正在瀏覽這個版面的使用者:沒有註冊會員 和 1 位訪客