Android – 執笠前用 httrack 下載 Yahoo BLOG

Yahoo! Blog 玩不足八年,年底便壽終正寢,可算是 BLOG 界悲劇。不少精彩的網頁頓時變成文化遺產,想趁月底前把所喜歡的網頁備份,離線下載到 Android 手機。

由網友 @utp 介紹使用 HTTrack 去下載網頁,我決定使用 Android 版本: HTTrack Website Copier,好讓我隨時在手機閱讀。

Httrack 只要做幾個簡單設定便可以開工 download,當中有些心得要記錄下來,也要注意一個 blog 可以花上超過 10 小時去下載的。

 

Yahoo! BLOG

首先要下載的是 Yahoo! BLOG 「 當快活時須快活,得安閑處且安閑」,它跟我的跑遊文章很類似,亦比我的內容精彩,裡頭有超過 400 篇精彩文章,估計作者真真味道是跟康泰行山隊有關,所描寫的香港古蹟文化很詳細,對每一個小環節都解釋得清楚,所以更不捨得它在十二月底消失。

列出幾個我最喜愛的 Yahoo! BLOG,主要是香港本地文化系列

 

131213 07-46-40

Yahoo BLOG! – 當快活時須快活,得安閑處且安閑

 

設定下載

使用 Httrack 只要幾個步驟,不過輸入時要小心,效果會更好。

1. Star a new project

2. Project name

只能用英文描述,否則有機會出現亂碼

3. Project category

依類別輸入,我下載的網頁通常是 “culture

4. Base path

要自行把路徑指去 Ext SD,因為隨時會消耗過 1GB 空間,例如: /storage/extSdCard/www/

5. Web Address

填入網站首頁的網址,例如:http://blog.yahoo.com/_M..BSI/,最好是指去一個 html 網頁,例如: http://blog.yahoo.com/_M…BSI/articles/page/1,否則在 project name 會出現 project name not defined 的情況,不過又不會影響下載。

131213 07-56-06

填入 web address

 

6. Options: Scan Rules

最重要是設定下載條件 scan rules,一般網頁使用預設的已經夠用

如果有些網頁使用了 twitter, facebook 的 “Like” icons,可以加入 +*.facebook.* +*.twitter.* 保持畫面的美觀。

因為今次要下載一個 Yahoo Blog,我想把網頁範圍加緊局限,不要胡亂跑去其他 Yahoo! Blog 下載文章,所以加入了 +*.blog.yahoo.com/_M2J33Q77UAN5PGKSPDSJ64CBSI/* 去控制。

如果是下載 blogspot.hk 網頁,建議加入 +*.blogger.com*

131213 08-36-33

加入條件是必須的

 

7. Options: Build

在 Options build 中,我會選擇 [v] No error page[v] No external Pages

131213 07-58-14

選擇不要 error pages 和 external pages

 

8. Options: Browser ID

我會把 Browser ID 改為手機瀏覽器 browser ID,只想下載簡約手機版面,減省 side bar, ad 等東西。

不清楚的話,進入 id.furud.net 網頁可以檢查到 browser id。

例如 Note3 上的 Chrome 是 “Mozilla/5.0 (Linux; Android 4.1.2; GT-N7105 Build/JZO54K)” 。

131213 07-56-44

去檢查使用中的 browser id

131213 07-57-15

輸入 mobile browser id

 


9. Download

最好在睡覺前進行下載,因為往往會花很多時間,今次下載這個網頁用了超過 10 小時了,下載後便可以離線瀏覽了。

 

131213 08-01-42

httrack 下載中

131213 08-32-31

成功後可以離線瀏覽

You may also like...

14 Responses

  1. sch says:

    Hi! 我試用同一方法,發覺可能比yahoo block左,只download左一個file。有句Message “Too may redirects”。然後連電腦都上唔到yahoo blog

  2. terewong says:

    @sch 不如你講下係那一個 blog 大家試下,如果你能夠打開睇的話,就唔會俾 yahoo block 了吧

  3. sch says:

    係所有blog.yahoo.com 既link都入唔到

  4. sch says:

    http://blog.yahoo.com/_PX3CLIFQFABE33RD2ZDAGHBE5U/articles/1

    I found these in log file

    Warning: Moved Permanently for blog.yahoo.com/_PX3CLIFQFABE33RD2ZDAGHBE5U/articles/1

    Warning: Can not bear crazy server (Moved Permanently) for blog.yahoo.com/_PX3CLIFQFABE33RD2ZDAGHBE5U/articles/1

    Warning: No data seems to have been transferred during this session! : restoring previous one!

  5. sch says:

    有另外一個方法,就係去http://archive.org/web/ 度save個網頁,好處係全世界都睇到,但要逐頁逐個個link save,都幾難成個blog save曬

  6. terewong says:

    @sch 你漏左 page 呢個字 eg “…/page/1” ( http://blog.yahoo.com/_PX3CLIFQFABE33RD2ZDAGHBE5U/articles/page/1 )。我用這條 URL 開始下載無問題,不過 1300 個 posts 加上咁多相,又要十粒鐘。

  7. sch says:

    Thank you!

  8. one family says:

    Tere 大大,

    又俾你快一步, 早一星都是用Httrack 來做,download 人地個yahoo blog. 但發現10個鐘都唔得. 睇番內download index,2/3係yahoo d 垃圾及廣告. 谷鬼氣,逐版save. 兩個鐘攪掂. 這經驗原本在Blog寫了小小,點知click去你度,俾你寫左.

    愛好香港舊建築必看
    1. ecyY (easy why whY) Blog 意料之外 博客
    http://blog.yahoo.com/ecyyiuu/articles/page/1
    2. 建築遊人
    http://blog.yahoo.com/archtraveller/articles

  9. terewong says:

    @onefamily 最後你都係用 httrack? 有無設定上的心得分享?

  10. one family says:

    係用 httrack, Default 最好.

  11. terewong says:

    @onefamily 我直覺上覺得在 rule 中用 +*blog.yahoo.com/_J….QU* (連埋一串網頁ID)去管著 httrack 唔好下載埋其他 Yahoo blog 最好。

  12. sch says:

    我嘗試打開download返來既網頁内容,發現好多内文無左,變成咁:

    Sorry, Unable to process request at this time — error 999.

    Yahoo!
    Unfortunately we are unable to process your request at this time. This error is usually temporary. Please try again later.

    If you continue to experience this error, it may be caused by one of the following:
    • You may want to scan your system for spyware and viruses, as they may interfere with your ability to connect to Yahoo!. For detailed information on spyware and virus protection, please visit the Yahoo! Security Center.
    • This problem may be due to unusual network activity coming from your Internet Service Provider. We recommend that you report this problem to them.

    While this error is usually temporary, if it continues and the above solutions don’t resolve your problem, please let us know.

    Return to Yahoo!

  13. terewong says:

    @sch 你的 error result 未曾見過、相信係視乎你改過了什麼 default setting?

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.