[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

debian 開發版,這個版面主要是要討論 debian@taiwan or debian@chinese 相關開發議題,所謂開發如 debian 中文化問題、文件製作維護問題、程式開發問題...最終目的是能從這個版面的討論成立一個接一個的工作小組來幫助 debian@taiwan or debian@chinese 發展,讓 taiwan 或華人能更方便的使用 debian。

[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章swallowman » 週六 5月 24, 2003 11:46 am

it's not 是非題或選擇題,申論題...,是一個討論題 :-P
想請問目前有無文章在討論這方面的議題,及可行性或發展現況,因為小弟又想惡搞了 :ooops:
control yourself,make it easy~!make it happy~!
debian<->gentoo<->freebsd
頭像
swallowman
懵懂的國中生
懵懂的國中生
 
文章: 230
註冊時間: 週一 3月 10, 2003 5:50 am
來自: taichung(puli)

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章palmpilote » 週六 5月 24, 2003 1:00 pm

意思就是像win2000或xp一樣
把底層都交給utf-8然後big5和gb都是用轉碼的嗎
還是?
圖檔
看啥?沒看過貓有五條腿的嗎?
http://palmpilote.twbbs.org
個人blog啟動
頭像
palmpilote
快樂的大學生
快樂的大學生
 
文章: 524
註冊時間: 週四 10月 17, 2002 4:01 pm
來自: 笨呆星球

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章swallowman » 週六 5月 24, 2003 1:37 pm

palmpilote 寫:意思就是像win2000或xp一樣
把底層都交給utf-8然後big5和gb都是用轉碼的嗎
還是?

應該是如此,從kernel到app的資料處理.原則上大部份的外國軟體都已全面支持沒甚麼問題(因為utf8含ascii),反而目前繁體中文還在堅守big5碼,本土主義作祟嗎?@@,這真得是很奇怪的事情,不知對岸的簡體環境是否也是如此呢?
這是小弟隨便說的一些原因有關為甚麼不換utf8及如何解決:
1.如果是因為要相容漸淘汰的舊軟體或從以前移植舊mswin的軟體,-但小弟是覺得大可不必.反而新軟體的方案有必要加入utf8的支持,如xcin......
2.轉utf8怕掉字元編碼,這就有賴資訊人員修正極少部份的字元.當然重要的是在網路上散發套件的點要能除舊佈新.
TODO~

zh_TW.utf8,zh_CN.utf8雖非一勞"永逸",但猜想20-30年應該也跑不掉,目前正在找尋"一勞"的資料及討論,小弟相信將時間花在這應該是相當值得,不知大家認為呢? :-P
control yourself,make it easy~!make it happy~!
debian<->gentoo<->freebsd
頭像
swallowman
懵懂的國中生
懵懂的國中生
 
文章: 230
註冊時間: 週一 3月 10, 2003 5:50 am
來自: taichung(puli)

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章阿信 » 週六 5月 24, 2003 1:56 pm

目前big5的字碼應該比unicode來的多才是。

而unicode會起來當然是解決了外國顯視的問題,但對中國字來說,有些字體無法表示。

所以才會有那鍋CNS11xx又跑出來了。

unicode的事情可能是因為我們台人比較小聲,所以才無法及時制定對中文字的標準。

但小弟不清楚utf8是否能夠完全解決了中文字數目的問題,這方面不是很熟,有勞各位大大們討論了。
頭像
阿信
版面大總管
版面大總管
 
文章: 4756
註冊時間: 週二 9月 03, 2002 11:58 pm
來自: 台灣 - 嘉義

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章swallowman » 週六 5月 24, 2003 2:24 pm

阿信 寫:但小弟不清楚utf8是否能夠完全解決了中文字數目的問題,這方面不是很熟,有勞各位大大們討論了。

utf8<->utf16<->utf32的可塑性,相信能讓大家接受,當然一般用戶不會想用圖書館層級的utf32編碼^^",那會讓你的小pc跑不動,我是覺得會掉字的一些資料基本上都是由自行造字的軟體所產生,如倚天造的字....,這真得沒辦法,這要有賴原造字者或公司來自行處理.不然只會敷生出越來越多的怪編碼文字.
control yourself,make it easy~!make it happy~!
debian<->gentoo<->freebsd
頭像
swallowman
懵懂的國中生
懵懂的國中生
 
文章: 230
註冊時間: 週一 3月 10, 2003 5:50 am
來自: taichung(puli)

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章高原之狼 » 週六 5月 24, 2003 2:45 pm

我对这个问题是这样的看法:

大陆方面现在也是 GB 编码占绝对优势,其原因显然是历史的:Windows 直到 98 还只有 GB 的输入输出,自然绝大部分人都只熟悉 GB 编码。而且我想与台湾相比,大陆的 Windows 更占绝大多数,很多人根本不知道 Linux 是何物,更不要说 Unicode 了。这样的结果就是绝大多数资料和通信都是 GB 编码的,你如果用 Unicode,就会你写的东西人家看不懂,怎么办?所以只要 Windows 一统天下的情况不改变,UTF-8 的推广就只能是一句空话。

当然,不是说我们就不能先把 Linux 的 Unicode 化做好了,比如我们先检查 application 是不是支持 UTF-8,再把文档的标准语言换成 UTF-8(不幸的是文档体积会增大 50%)等等。对了,下一版的 Debian 无痛起步法可不可以考虑用 UTF-8?

(抱歉用了簡體,忘了改過來了。)
高原之狼
懵懂的國中生
懵懂的國中生
 
文章: 185
註冊時間: 週一 10月 28, 2002 5:54 am

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章haoto » 週六 5月 24, 2003 4:02 pm

FYI: 看樣子 xcin 即將支援 UTF-8輸出囉!8-) 詳見 xcin 的 list archive
haoto
可愛的小學生
可愛的小學生
 
文章: 28
註冊時間: 週六 1月 04, 2003 10:41 pm
來自: Taipei, ROC

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章swallowman » 週六 5月 24, 2003 7:02 pm

haoto 寫:FYI: 看樣子 xcin 即將支援 UTF-8輸出囉!8-) 詳見 xcin 的 list archive

哀呦~!怎麼是UTF-8,glibc不是定義為utf8或utf-8嗎?><,還是有新的命名呢?
真是......,要不要統一一下正確的命名呢?不要又歷史重演了.
control yourself,make it easy~!make it happy~!
debian<->gentoo<->freebsd
頭像
swallowman
懵懂的國中生
懵懂的國中生
 
文章: 230
註冊時間: 週一 3月 10, 2003 5:50 am
來自: taichung(puli)

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章訪客 » 週六 5月 24, 2003 9:09 pm

swallowman 寫:
haoto 寫:FYI: 看樣子 xcin 即將支援 UTF-8輸出囉!8-) 詳見 xcin 的 list archive

哀呦~!怎麼是UTF-8,glibc不是定義為utf8或utf-8嗎?><,還是有新的命名呢?
真是......,要不要統一一下正確的命名呢?不要又歷史重演了.

請問 glibc 的定義是由何得知的? 因為我找不到耶…@@
事實上這也是我一直有疑問的地方,就是有關 locale 的大小寫,命名法等…

上次曾經提到:OpenI18N locale name guideline:
http://www.li18nux.org/docs/text/LocNameGuide-V11.txt

首先,我不知道 OpenI18N 代表了什麼地位,這個命名法看來也不是大家遵守的…
如果由這個規範的話,的確是 UTF-8 ,而且是 BIG-5 , GB-2312, GB-18030,
ISO-8859-1 等等…。不過我相信這種事實作上一定也會弄成有很大的容錯度的…
看看 iconv 轉碼就知道各式各樣的名稱都有…
訪客
 

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章wctang » 週六 5月 24, 2003 10:09 pm

上篇忘了 login .. @@
xcin 可以 UTF-8 輸出,算是UTF-8 為 locale 的重要的一步,不過我覺得問題可能還很多,但這一定是值得的…
為什麼我覺得 UTF-8 的確是個好方法,首先,和 ASCII 相容。
這個重要性我覺得凌駕一切,就因這點所以原本的 unicode 2bytes 就變成只能在程式內部使用了。
而且,對我們來說,utf-8 絕對是好處,因為 big5 這個爛東西,什麼時候消失了都不可惜的,unicode 的 charset 比較大,各國文字都有,程式處理沒問題(相對上,至少沒啥許蓋功的問題…),唯一會有不好的地方是歐美的的ISO-8859-1,這個是目前的最主流的 code,8bit 就解決了資訊世界大多數的問題了,如果用了 utf-8 的話,歐洲的文字有些會被編成二個 byte 了。
至於unicode的中文數不夠,和unihan 不尊重中文語系的問題,這個我覺得都比不上幹掉 big5 這個爛東西來得重要。
當然,中文的問題絕不會在 unicode 就能解決,我覺得也不會在 CNS11643 這個爛國家標準解決,本來可以用 CCCII 來做,現在大概也是被劣幣驅逐良幣了吧。還有一個,就是 GB18030,大概是唯一可能的解法(雖然我對這個並不了解),可是台灣是不可能用的 ....@@

不過現在也不用太急啦,反正 GB2312 和 BIG5 是一定不死的啦。目前可做的應該能夠把用戶端的 I18N 做好,這樣不管收到什麼文件,至少都可以轉,不管什麼文字都可以看。然後產生的文件都有清楚,標準,正確的 charset 和 coding 標示,大家就能生活的比較愉快了。

說到這點,Linux 到底有沒有什麼 editor 可以方便的處理 utf-8 的文件啊?
居然連 emacs 都不行,光這點就讓 windows 給打假的。
頭像
wctang
榮譽學長
榮譽學長
 
文章: 49
註冊時間: 週六 4月 19, 2003 11:07 am

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章chihchun » 週日 5月 25, 2003 3:46 pm

以前 xcin-dev 就有人 submit utf8 patch,RedHat 的開發者 Leon Ho <llch@redhat.com> 最近也釋出可以直接使用 UTF8 locale 的 xcin
http://people.redhat.com/llch/xcin/xcin ... f8.src.rpm
http://people.redhat.com/llch/xcin/xcin ... 8.i386.rpm

此外,很多 editor 都可以很方便處理 UTF-8 文件,例如 vim ,這裡有一個 Tip 可以讓你編輯 UTF8 檔案的時候自動轉為終端機正在用的大五碼,當然你也可以直接用類似 mlterm ,透過 xcin 輸入中文變成 UTF8。
http://kalug.linux.org.tw/~chihchun/Lab/index.php/Vim
可以請你告訴我 windows 上的工具嗎?我實在不怎麼用 windows ,經驗薄弱。
-Rex, geek by nature linux by choice
http://people.debian.org.tw/~chihchun
頭像
chihchun
摩托學園!學園長們
摩托學園!學園長們
 
文章: 185
註冊時間: 週三 11月 27, 2002 10:17 am
來自: KaLUG

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章訪客 » 週日 5月 25, 2003 4:53 pm

chihchun 寫:可以請你告訴我 windows 上的工具嗎?我實在不怎麼用 windows ,經驗薄弱。

事實上, win2000 之後的 notepad 就很不錯了,它大致上可以判斷 big5, utf8, utf16,(bg18030 沒試過…)也能正確的顯示和編輯,也能任選編輯格式存檔。但如果是開bg2312 就難免有問題。缺點是不能任選 encoding 開檔,只能讓他判斷,這點 emacs 比較好一點 (看來 vim 蠻像 emacs,應該也可以)。

不過我真正想要的其實是能同時編輯各國文字的 unicode editor,如果是經過轉碼編輯再轉回去,可能就會有問題說…@@,這件事如果要經過terminal 的話可能蠻難做到。以 emacs 的 iso2022 架構是有可能做到的(只是目前不完全支援 utf-8,不過同時顯示各國文字是可以的,當然,不經過 terminal )。
訪客
 

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章swallowman » 週日 5月 25, 2003 5:49 pm

小弟最近忙著修正不正確的字型資訊及轉碼,有空要準備作utf8的xcin,想請問大家正確的locale是utf8或UTF-8呢?感謝wctang所提供的資料,是不是已確定為zh_TW.UTF-8為將來的萬國大五碼呢?thx

有utf8的input im的確是一大進步,以前我就是卡在這就放棄了.希望這次能有所進展.回去後先裝看看先.

還有就是想請之前有試過架設utf8為平台(不一定要debian,其它也行)環境的前輩,分享一下經驗及可能遇到的問題?雖然自己慢慢踹也行,但由於是起步階段,希望能預先得到些相關資訊,也方便儘快進入應用層來測試即將會有的問題.

當然希望能在一個實驗性的utf8平台上互相交流,如有相關的主題或已正在實驗的ppl,讓小弟獲知,多K一點這方面的資訊^^"

win2000方面基本上也沒甚麼好談的,花錢後爽快的用即可.這是小弟對所有商業軟體一慣的看法,不要見怪^^"
如果說要純的utf8 editor,那我也是只知道moto大分享過的yudit(www.yudit.org),但目前還是習慣vim^^".

目前都找不到較多的資料,這路還真難走~! :-x
最後由 swallowman 於 週一 5月 26, 2003 1:47 pm 編輯,總共編輯了 1 次。
control yourself,make it easy~!make it happy~!
debian<->gentoo<->freebsd
頭像
swallowman
懵懂的國中生
懵懂的國中生
 
文章: 230
註冊時間: 週一 3月 10, 2003 5:50 am
來自: taichung(puli)

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章pesder » 週日 5月 25, 2003 10:15 pm

阿信 寫:unicode的事情可能是因為我們台人比較小聲,所以才無法及時制定對中文字的標準。

倒不是台灣比較小聲啦,而是人家要的是一套標準,可是Big5哪來的標準?去年 ICOS 有提到,我們有最原始的Big5(沒日文)、Big5-eten(倚天版,有日文)、CP950(微軟版)、Big5-HKCSS(香港的標準,香港聲音也不會大我們多少吧,不過人家政府肯做)....等等,到底哪一套可以代表Big5去跟unicode對應?結果當然是隨人家來做了。(記得前陣子申請 Big5 為國家標準的行動已經被回絕了,看來台灣可能永遠也不會有“標準”、“官方”的 Big5 碼吧....)

至於未來嘛,政府是要直接進到 unicode 的樣子,但是也不太容易吧。目前 Openi18n 的 Big5 小組也還著重於 Big5 標準的制定,要脫離 Big5 恐怕還要一段不少的時間呢。

抱歉這些可能沒啥建設性....
pesder
可愛的小學生
可愛的小學生
 
文章: 38
註冊時間: 週六 11月 23, 2002 4:26 pm
來自: 雲林

re:[討論]關於zh_CN.utf8,zh_TW.utf8的可行性?

文章wctang » 週一 5月 26, 2003 3:29 am

唉, BIG-5 沒過嗎? 真是令人費解…
不過像這樣的事已經見怪不怪了。
台灣一向都是不守規則的,在位者也不知道這種事的前因後果。
像之前的拼音爭議,我一看到就知道,"又來一個爛東西了"。
我還看了蠻多相關的討論,就是很多人還有漢賊不兩立的原因,就說因為中共用漢語拼音,我們就不能用漢語拼音,以免出國被人家弄錯…@@,說什麼可以轉碼,已經有程式了,可以兩個都學,最蠢的是和母語系統相合,然後鄉土教材用中文拼台語 …@#$%$^& …

"上帝因為害怕人類蓋巴別塔,所以就變亂人類的語言,使他們彼此言語不通"

原本 CCCII 也因為其中有簡體所以被批鬥,現在居然還會有,而且都是大聲說台灣要走出世界的…

台灣就只能有個 CNS 了,不管是不是有人實作它,政府官方的CNS網頁也只會叫別人下載造字檔什麼的,根本沒有解決問題。還說要尊重本土文化,很多本土的字在電腦上都不能出現,大陸弄了 GB18030 把很多少數民族的文字都加入,也包括繁體編碼,應該是目前第二大的中文字集了吧(第一應該是 CCCII )。

抱怨太多了,大家別在意,還是討論技術吧,我們至少要把 linux 弄好。

對了, yudit 的中文輸入是不是一定得這麼難用啊? 他為什麼不支援 XIM 呢? 雖然它真的很強,不過看來他是自己弄自己的…
頭像
wctang
榮譽學長
榮譽學長
 
文章: 49
註冊時間: 週六 4月 19, 2003 11:07 am

下一頁

回到 debian develop

誰在線上

正在瀏覽這個版面的使用者:沒有註冊會員 和 1 位訪客