
發現一個可閱讀舊報紙的網站,網址是
http://hkclweb.hkpl.gov.hk/hkclr2/intra ... lcome.html
這網站的開放時間為上午九時至午夜十二時。歡迎頁面如下:

按頁面上的「略過」,進入檢索頁面

在空格內輸入報章名稱及日期,這裡以華字日報1902年10月份為例,輸入『華字日報, 1902-10』,進入下一頁面。

這裡以查閱10月1日的報紙為例,點擊"華字日報1902年10月1日"的連結,進入下一頁面。

問題出在這裡,這裡顯示10月1日的報紙共有九個頁面,可是我用flashgot插件用右鍵選用「以flashgot全部下載」,沒有反應。
按頁面左面的連結,它的格式是
javascript:DisplayImage("http://hkclweb.hkpl.gov.hk:8000/microfilm/l/BATCH28a/7BB8B2FDD20C474BC3A62BF35B54939B961A9B927BCF5C95.tif")
用wget http://hkclweb.hkpl.gov.hk:8000/microfi ... CF5C95.tif
圖片是可以下載的。
發現全部的檔案名稱都是數字與英文字母長長的一串組合(有可能會按時變動)。
除了逐一下載外,不知各位高手能否解決整批下載的問題?
