[分享] 打造 Unicode 的環境

常言道:『飲水思源』,在 Open Source 的世界裡,我們常常需要別人的幫助,但是在您有所心得的時候請記得分享給大家,『幫助人是快樂的喔』。歡迎您在使用 debian 的過程中的任何心得分享給大家。

文章twu2 » 週二 3月 15, 2005 2:18 pm

FileZilla 2.2.12b 出來了.
作者自己加上一個 force UTF8 的選項, 所以我的 patch 直接配合這個選項就可以了. 這個大幅縮小了 sftp 使用 UTF8 這個 patch 的大小.
前兩個 unicode 的 patch 應該已經進入 CVS 中了, 剩下下面三個:

修正 status window 無法顯示 unicode 的問題:
http://www.teatime.com.tw/~tommy/mypatc ... atus.patch
http://sourceforge.net/tracker/index.ph ... tid=372243

修正 2.2.12b 中, 如果使用 re-connect 連線, 並不會載入 UTF8 的選項:
http://www.teatime.com.tw/~tommy/mypatc ... nect.patch
http://sourceforge.net/tracker/index.ph ... tid=372243

讓 sftp 也可以使用 UTF8:
http://www.teatime.com.tw/~tommy/mypatc ... utf8.patch
http://sourceforge.net/tracker/index.ph ... tid=372243

這三個 patch 已經 submit 到 sourceforge.

至於加上上述 patch 的 unicode 版本為:
http://www.teatime.com.tw/~tommy/filezilla.zip
twu2
懵懂的國中生
懵懂的國中生
 
文章: 219
註冊時間: 週二 3月 11, 2003 2:58 pm
來自: Taipei

文章garydsun » 週三 3月 16, 2005 9:29 pm

請問 Debian 系統轉入支援 Unicode,X 視窗也設為 Unicode 環境,字型也使用了香港參考宋體,或是中易宋体,都可以正常顯示如『堃』『煊』『喆』等字。(附註:New Sung 在這些特殊的 Unicode 字體會有漏字情況)
問題是不管我用 SCIM 或是 GCIN 還是 XCIN,然後使用詞音或是酷音輸入法,都找不到這些特殊的 Unicode 字體!以上那些字是在 M$ xp 上輸入的。
以上,請先進大大指導。
garydsun
可愛的小學生
可愛的小學生
 
文章: 13
註冊時間: 週二 3月 08, 2005 11:09 pm

文章kanru » 週三 3月 16, 2005 9:39 pm

目前這些支援 UTF-8 的注音輸入法應該都還只能輸入 Big5 區的中文字
除非可以手動加入 UTF-8 字詞(大部分的 table 輸入法),不然是沒有辦法直接輸入得
BTW,新酷音正在移動到 UTF-8 環境,屆時應該就可以直接輸入這些字了
圖檔
頭像
kanru
榮譽學長
榮譽學長
 
文章: 578
註冊時間: 週六 7月 12, 2003 12:09 pm

文章訪客 » 週三 3月 16, 2005 11:26 pm

這些輸入法都可以正常輸入 UTF-8 啊...
xcin 只要用 firefly patch 過的就可以
deb http://debian.linux.org.tw/pub/apt/ unstable main
其他的本來就可以
只要 LC_CTYPE export 為支援 UTF-8 的中文 locale 就行
訪客
 

文章kanru » 週四 3月 17, 2005 1:48 am

sure...
您貼的那個連結上得 xcin 就是我包的(最近 libchewing 0.2.6 釋出了,但這個 xcin 還沒更新,可能會 broken 一陣子)
但實際上某些輸入法是做 Big5 --> UTF-8 這樣的內部處理的,所以會打不出 Big5 範圍以外的 UTF-8 字
直接支援 UTF-8 table 的輸入法也要 table 裡面有相對應的 UTF-8 字才行,scim 的 table 好像是從 xcin 的 table 轉的,而 xcin 的 UTF-8 table 是從他原本 Big5 的 table 轉的,所以還是沒有超出 Big5 的範圍
gcin 我則不知道它的 table 有沒有包含到 UTF-8 的範圍
圖檔
頭像
kanru
榮譽學長
榮譽學長
 
文章: 578
註冊時間: 週六 7月 12, 2003 12:09 pm

文章訪客 » 週四 3月 17, 2005 9:25 am

kanru 寫:
gcin 我則不知道它的 table 有沒有包含到 UTF-8 的範圍

有,「堃煊酶峯蟎]都有,這篇就是用 gcin 的詞音輸入的,gcin 的行列還可以輸入簡體字及日文,LGJ 也弄了一個支援 簡體字/日文的一個嘸蝦米。
如果有用 GTK_IM_MODULE=gcin,gtk2 的程式應該是可以輸入所有的 utf-8 字,不用管 locale,如果是用 XIM,locale 就必須設定成 UTF-8 。
訪客
 

文章Tetralet » 週四 3月 17, 2005 12:55 pm

kanru 寫:但實際上某些輸入法是做 Big5 --> UTF-8 這樣的內部處理的,所以會打不出 Big5 範圍以外的 UTF-8 字

像 Debian 官方的 xcin 就是...

kanru 寫:而 xcin 的 UTF-8 table 是從他原本 Big5 的 table 轉的,所以還是沒有超出 Big5 的範圍

據個人所知,
如果是 firefly 版的 xcin,
它的 [倉五] 輸入法是從 倉頡之友 那裡取得的,
它支援了極完整的 Unicode 倉頡拆碼,
包括了繁、簡體中文及日文字。

kanru 寫:gcin 我則不知道它的 table 有沒有包含到 UTF-8 的範圍

gcin 內附的倉頡是倉頡三代,
所以暫時是不支援的;
有需要的人可以自行加入。

而 gcin 裡其它的輸入法則不清楚...

另外,Debian 官方的 scim 則是使用倉五,
所以也能夠打出大部份的 Unicode 文字。
時間並不能治療我心中的疼痛
南方的春天說什麼也溫暖不了我冰冷的血

誦唱大復活咒文,今天的 Tetralet 又在唧唧喳喳了 重生!
Tetralet
俺是博士
俺是博士
 
文章: 3078
註冊時間: 週四 11月 28, 2002 3:02 pm

文章訪客 » 週四 3月 17, 2005 1:59 pm

kanru 寫:sure...
您貼的那個連結上得 xcin 就是我包的(最近 libchewing 0.2.6 釋出了,但這個 xcin 還沒更新,可能會 broken 一陣子)
但實際上某些輸入法是做 Big5 --> UTF-8 這樣的內部處理的,所以會打不出 Big5 範圍以外的 UTF-8 字


就是用這個 xcin 可以正常用注音打出非 big5 字啊...
訪客
 

文章garydsun » 週五 3月 18, 2005 8:13 pm

有請『訪客』君指導如何設定,或是哪個網站有文獻提供學習:
我的環境是 unstable + gnome,locales 是:
C
POSIX
zh_TW.utf8
我在 /etc/X11/xinit/xinitrc 裡設定:
export LANG=zh_TW.UTF-8
export LC_ALL=zh_TW.UTF-8
export LC_CTYPE=zh_TW.UTF-8
#export XMODIFIERS="@im=gcin"
#scim -d
export XMODIFIERS="@im=gcin"
gcin &
. /etc/X11/Xsession
我的 gcin 是從 http://chuany.net/~asho/debian/ 裝的,0.8.7-2 版。
SCIM 的酷音輸入法是從 http://debian.linux.org.tw/pub/apt 裝的,0.1.1版。
以上,無論我是用 gcin 的詞音,或是 scim 的新酷音,都看不到『堃』『煊』『喆』等字。是否哪裡還需要一些設定才可以?
garydsun
可愛的小學生
可愛的小學生
 
文章: 13
註冊時間: 週二 3月 08, 2005 11:09 pm

文章ginson » 週五 3月 18, 2005 10:00 pm

我使用testing + gnome,許氏注音,『堃』、『煊』、『喆』,可以看到,也打得出來。
我的gcin是從 http://www.csie.nctu.edu.tw/~cp76/gcin/ ... .9.tar.bz2 下載的。
我在家目錄下的.xsession設定:
export LANG=zh_TW.UTF-8
export LC_ALL=zh_TW.UTF-8
export XMODIFIERS=@im=xcin.UTF-8
exec /usr/bin/gcin &

gnome-session
ginson
可愛的小學生
可愛的小學生
 
文章: 27
註冊時間: 週六 11月 06, 2004 1:19 am
來自: 台灣

文章訪客 » 週五 3月 18, 2005 10:08 pm

export LC_CTYPE=zh_TW.UTF-8
export XMODIFIERS="@im=gcin"
gcin &
詞音和注音都可以輸入"堃煊酶峯喆"

export LC_CTYPE=zh_TW.UTF-8
export XMODIFIERS="@im=xcin-zh_TW.UTF-8"
xcin &
注音可以輸入"堃煊酶峯喆"
酷音不行

scim 注音和酷音都不行
(xcin 和 scim 的酷音用的是一樣的 table)
倒是小弟現在才知道 scim 的注音只有 big5 字碼...

如果用上述設定沒辦法打出那些字, 可能是字型的關係
如果所設定的字型本身不包含那些字, 可能會秀不出來...
訪客
 

文章garydsun » 週六 3月 19, 2005 2:22 am

感謝『訪客』君的指導,終於搞定。

gcin 詞音和注音都可以打出大部分的外字,只有少數『烟』『綉』等字,還是找不到,只有 xcin 的注音才可以。

xcin 是用 firefly patch 過的,只有注音可以打出這些外字。

我的系統使用的字集是中易宋体,好像都秀得出來。
原本使用 New Sung,好像有部份的外字顯示不出來。
關於這點不知道是否我的系統有問題?
garydsun
可愛的小學生
可愛的小學生
 
文章: 13
註冊時間: 週二 3月 08, 2005 11:09 pm

文章BBNS » 週六 3月 19, 2005 3:42 pm

twu2 寫:這幾天在試 UTF-8 的環境, 發現 WinSCP 雖然由 3.7.1 版之後, 開始支援 UTF-8 的 sftp, 但是.... 我發現 openssh 中的 sftp-server 仍然是 version 3 的 sftp, 並不符合 WinSCP 所要的 version 4 sftp.

試過改 openssh 中, 簡單的把這個數字由 3 換成 4... 不過, 似乎這中間的差異並不是只有 UTF-8 編碼的差別, 會造成 WinSCP 反而無法正常連線.

所以.... 只好把腦筋動到 WinSCP 本身上頭了. (這真是 OpenSource 的好處)

我加上一個 Force UTF-8 的選項, 如果這個選項設定為 On, 就會認為所連線的 sftp-server 使用 UTF-8 編碼.
在 Environment -> SFTP -> Force remote use UTF-8.

如果你有舊的 session, 最好重新設定一下再儲存一次. 因為我發現這個選項在載入舊的 session 時, 看起來是 On, 實際上... 好像是 Off (我也不確定...)
反正不管是那個... 請重新改一下再存一次, 以確定是使用 On 還是 Off. (Auto 也是 Off....)

另外順便改了一下顯示檔名的地方, 原本檔名有 \ 字元的會被忽略 (安全性修正?)
不過.... 中文檔名常出現 \ 在裡頭. 這個 WinSCP 用 BCB 開發的... 應該是不支援 unicode, 似乎無法改用 unicode 來避免.

patch 放 http://www.teatime.com.tw/~tommy/winscp ... utf8.patch

改過的執行檔放
http://www.teatime.com.tw/~tommy/WinSCP3.zip


剛剛試了一下,似乎出了點小狀況。
登入的時候出現 "Error listing directory '/home/bbns'"
錯誤是Error decoding UTF-8 string.

不能list出來的目錄名稱分別為My Document, My Music, My Video,但是從symbolic link進去My Music和My Video卻又沒問題。Is that bug?
BBNS
懵懂的國中生
懵懂的國中生
 
文章: 156
註冊時間: 週六 2月 22, 2003 3:18 pm

文章twu2 » 週六 3月 19, 2005 5:03 pm

一般英文字母應該都符合 utf-8 的編碼, 解碼應該沒有問題才對.
我有碰過出現 decodeing utf-8 錯誤, 都只有在該目錄有包含某些 big5 編碼的檔名時才發生.

可否先確定 /home/bbns 下頭的所有檔名都是 UTF-8 編碼.

對了, 也可以用 FileZilla 試看看. FileZilla 我記得轉碼失敗時, 會直接使用原來的字串. (不過, 想當然, 後續對這個檔案的處理, 應該是會有問題的)
twu2
懵懂的國中生
懵懂的國中生
 
文章: 219
註冊時間: 週二 3月 11, 2003 2:58 pm
來自: Taipei

文章BBNS » 週六 3月 19, 2005 7:31 pm

原來是一個.ppt的檔案搞鬼,刪除後就解決了。
thanks。

===
patch過的FileZilla和WinSCP真的很好用,
之前使用proftpd的iconv patch,還是很多問題,包括日文片假名無法顯示等。再一次感謝大大的貢獻。/bow
BBNS
懵懂的國中生
懵懂的國中生
 
文章: 156
註冊時間: 週六 2月 22, 2003 3:18 pm

上一頁下一頁

回到 share

誰在線上

正在瀏覽這個版面的使用者:沒有註冊會員 和 1 位訪客