想要尋找unicode碼位轉換成字元的離線單機工具軟體

歡迎提問 debian desktop 相關問題,何謂 desktop ? 舉凡您日常生活會用到的部份,如上網 ( www 、 bbs ..) 、程式設計、繪圖...等等。 通常以 X Window 環境底下問題為主。

想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章IanHo » 週三 3月 21, 2012 2:42 pm

我手邊有一個純文字檔案,裏頭有十一萬列的unicode編碼,我需要使用圖形介面的離線單機軟體,
將這十一萬列的unicode編碼,盡可能的一次性的轉換成以字元呈現,而這十一萬列的unicode編碼,
包含了CJK Unified Ideographs and Extension A~C,Supplementary Private Use Area-A~B,
等等區塊範圍內的字元,在要對應的字形檔案的部分,我已經準備齊全了,安裝於系統中,
現在的問題就是,在linux gnome平台上,我找不到可以一次性轉換十一萬列的unicode編碼為字元呈現
的單機離線圖形介面軟體,在MsWindows平台上有babelPad.exe這套軟體可以做到,
那麼在linux gnome平台上,有類似 babelPad.exe 這樣轉換功能的離線單機圖形介面軟體嗎?
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
發表過的文字作品;
MsWindows95OSR2.5版,安裝,設定,使用經驗談;
98LITE 使用有感;
片名的遊戲版本2010;
MacOSX10.5.8 安裝、設定、使用,個人經驗分享;
http://www.scribd.com/ianian1979/
Linux PowerPC架構版本搭配PowerbookG4,安裝、設定、使用,個人經驗分享;
IanHo
活潑的高中生
活潑的高中生
 
文章: 403
註冊時間: 週六 2月 12, 2011 10:53 pm

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章訪客 » 週三 3月 21, 2012 3:15 pm

抱歉,完全看不懂你的意思。
訪客
 

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章IanHo » 週三 3月 21, 2012 3:46 pm

訪客 寫:抱歉,完全看不懂你的意思。


我把一些關鍵字換成英文試試看好了~
MsWindows平台上有babelPad.exe這套圖形介面的純文字編輯器軟體可以做到
將 純文字檔案中的 Universal Character Names 轉換成 Unicode characters
用滑鼠選取再點選相關按鈕項目即可~
現在我希望同樣的操作情境能夠出現在 linux+gnome 環境平台~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
發表過的文字作品;
MsWindows95OSR2.5版,安裝,設定,使用經驗談;
98LITE 使用有感;
片名的遊戲版本2010;
MacOSX10.5.8 安裝、設定、使用,個人經驗分享;
http://www.scribd.com/ianian1979/
Linux PowerPC架構版本搭配PowerbookG4,安裝、設定、使用,個人經驗分享;
IanHo
活潑的高中生
活潑的高中生
 
文章: 403
註冊時間: 週六 2月 12, 2011 10:53 pm

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章訪客 » 週三 3月 21, 2012 5:56 pm

可以把轉換前跟轉換後的樣子貼一小段出來嗎?
訪客
 

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章IanHo » 週三 3月 21, 2012 6:34 pm

訪客 寫:可以把轉換前跟轉換後的樣子貼一小段出來嗎?


不曉得這個連結的解釋能否幫助理解我的問題?

http://hyperrate.com/thread.php?tid=26905#26905
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
發表過的文字作品;
MsWindows95OSR2.5版,安裝,設定,使用經驗談;
98LITE 使用有感;
片名的遊戲版本2010;
MacOSX10.5.8 安裝、設定、使用,個人經驗分享;
http://www.scribd.com/ianian1979/
Linux PowerPC架構版本搭配PowerbookG4,安裝、設定、使用,個人經驗分享;
IanHo
活潑的高中生
活潑的高中生
 
文章: 403
註冊時間: 週六 2月 12, 2011 10:53 pm

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章twu2 » 週三 3月 21, 2012 7:53 pm

不就是用有支援你用的那個 unicode 編碼的文字編輯器看就可以?
所以... 你那檔案是用什麼呢? 如果是 UTF-8 或 UTF-16LE 或 UTF-16BE, 可以試看看 SciTE....
只是那麼多行, 可能會 render 很慢吧. (如果字出不來, 表示你的 X 用的字型沒那個字, 不是文字編輯器的問題)
twu2
懵懂的國中生
懵懂的國中生
 
文章: 219
註冊時間: 週二 3月 11, 2003 2:58 pm
來自: Taipei

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章訪客 » 週四 3月 22, 2012 1:00 am

IanHo 寫:
訪客 寫:可以把轉換前跟轉換後的樣子貼一小段出來嗎?


不曉得這個連結的解釋能否幫助理解我的問題?

http://hyperrate.com/thread.php?tid=26905#26905

是有理解啦,
但是你提的型式太多種了,
如果能用其他編輯器先取代成以下型式的話,
三
拿隨便一個瀏覽器就可以直接看了。
訪客
 

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章訪客 » 週四 3月 22, 2012 1:59 am

如果不知道如何取代的話,
可以安裝MadEdit
選 搜尋->取代->使用正規表示式打勾
是4E09型式的話,
搜尋 ^(....)$ 全部取代為 &#x$1;
是\u4E09型式的話,
搜尋 ^\\u(....)$ 全部取代為 &#x$1;
是U+4E09型式的話,
搜尋 ^U\+(....)$ 全部取代為 &#x$1;
訪客
 

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章訪客 » 週四 3月 22, 2012 2:04 am

注意,以上假設每行數值都是4個16進位數字。
訪客
 

關於在全圖形介面下將unicode編碼數值轉換成文字遇到的瓶頸與狀況

文章IanHo » 週四 3月 22, 2012 7:33 pm

我手邊有一個字形檔案,
經過
fontforge (MACOSX,LINUX)
babelmap.exe,babelpad.exe (MsWindows)
UnicodeChecker(MACOSX)
等軟體的交叉查詢,我預先知道了

U+2FA1B 鼖 CJK COMPATIBILITY IDEOGRAPH-2FA1B

這樣的資訊中有一個重點,這是一個五位數的unicode編碼數值,
而該碼位所對應搭配的字形檔案我也已經安裝好了,可以使用,
該字,是只要能支援UNICODE新版的文書軟體原則上都可以叫用的,
現在我手邊有一個一拖拉庫列數(上萬列)的純文字檔案,
每一列就是一組向上面標示的 2FA1B 這樣一組數值(每一組數值都不一樣)(更正~有部分會重複1~4組不不等),
我需要做的就是在全圖形介面"單機離線"模式下,將這上萬列的"五位數",
轉換成其對應的"文字",
第一個想到的就是 babelpad.exe ,這個軟體必須在這五位數前面加個 "\u",
才能辨識,可是筆者發現轉換結果卻會變成
"四位數對應的文字+原始五位數的最後一個16進位數值",
筆者google不出所以然來,就不知道該怎麼辦了!?

再來轉換MACOSX平台,UnicodeChecker軟體中有一項子功能,
也是可以辨識 "\u" 然後將其後的數值轉換成"文字",

結果同樣發生了會轉換成
"四位數對應的文字+原始五位數的最後一個16進位數值"的情況,

想要google,嘗試了一些關鍵字,卻完全沒有頭緒,到底該怎麼辦呢?

有沒有什麼圖形介面的軟體,可以辨識五位數的 \u2FA1B 或著 U+2FA1B
然後可以將其轉換成文字這樣?
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
發表過的文字作品;
MsWindows95OSR2.5版,安裝,設定,使用經驗談;
98LITE 使用有感;
片名的遊戲版本2010;
MacOSX10.5.8 安裝、設定、使用,個人經驗分享;
http://www.scribd.com/ianian1979/
Linux PowerPC架構版本搭配PowerbookG4,安裝、設定、使用,個人經驗分享;
IanHo
活潑的高中生
活潑的高中生
 
文章: 403
註冊時間: 週六 2月 12, 2011 10:53 pm

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章訪客 » 週五 3月 23, 2012 1:21 am

改成以下就沒有幾位數的問題了:
安裝MadEdit
選 搜尋->取代->使用正規表示式打勾
是4E09型式的話,
搜尋 ^([0-9A-F]*)$ 全部取代為 &#x$1;
是\u4E09型式的話,
搜尋 ^\\u([0-9A-F]*)$ 全部取代為 &#x$1;
是U+4E09型式的話,
搜尋 ^U\+([0-9A-F]*)$ 全部取代為 &#x$1;
還是一樣用瀏覽器開來看(最好把檔名改成.html)。
訪客
 

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章IanHo » 週五 3月 23, 2012 10:36 am

訪客 寫:改成以下就沒有幾位數的問題了:
安裝MadEdit
選 搜尋->取代->使用正規表示式打勾
是4E09型式的話,
搜尋 ^([0-9A-F]*)$ 全部取代為 &#x$1;
是\u4E09型式的話,
搜尋 ^\\u([0-9A-F]*)$ 全部取代為 &#x$1;
是U+4E09型式的話,
搜尋 ^U\+([0-9A-F]*)$ 全部取代為 &#x$1;
還是一樣用瀏覽器開來看(最好把檔名改成.html)。


謝謝提供資訊~我框起來再摸索看看~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
發表過的文字作品;
MsWindows95OSR2.5版,安裝,設定,使用經驗談;
98LITE 使用有感;
片名的遊戲版本2010;
MacOSX10.5.8 安裝、設定、使用,個人經驗分享;
http://www.scribd.com/ianian1979/
Linux PowerPC架構版本搭配PowerbookG4,安裝、設定、使用,個人經驗分享;
IanHo
活潑的高中生
活潑的高中生
 
文章: 403
註冊時間: 週六 2月 12, 2011 10:53 pm

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章訪客 » 週日 3月 25, 2012 3:00 am

你實在有點......莫名其妙的固執。
這樣吧,在firefox裏面加入書籤應該還能接受吧?
隨便把某個網頁加入書籤,
修改書籤網址為以下字串:

javascript:zz=document.getElementsByTagName("body");yy=zz[0].innerHTML;yy=yy.replace(/%5C%5Cu([0-9A-F]*)/g,"%5C%5Cu$1%20&#x$1;");zz[0].innerHTML=yy;void(0);

用firefox選單->開新分頁->開啟檔案->所有檔案 選那個文字檔(這次別改成.html了)
然後在此頁面下使用之前加入的書籤即可。
用\u2FA1B複製6萬次來測試沒問題(原始資料要用\u2FA1B型式的)。
訪客
 

Re: 想要尋找unicode碼位轉換成字元的離線單機工具軟體

文章訪客 » 週日 3月 25, 2012 3:13 am

U+2FA1B型式的用:

javascript:zz=document.getElementsByTagName("body");yy=zz[0].innerHTML;yy=yy.replace(/U%5C+([0-9A-F]*)/g,"U%5C+$1%20&#x$1;");zz[0].innerHTML=yy;void(0);

2FA1B型式的用:

javascript:zz=document.getElementsByTagName("body");yy=zz[0].innerHTML;yy=yy.replace(/([0-9A-F]*)%5Cn/g,"$1%20&#x$1;%5Cn");zz[0].innerHTML=yy;void(0);
訪客
 


回到 debian desktop

誰在線上

正在瀏覽這個版面的使用者:沒有註冊會員 和 1 位訪客

cron