The Will Will Web

記載著 Will 在網路世界的學習心得與技術分享

如何將 Bloglines 的訂閱資料匯出並匯入到 Google Reader

前陣子因為將我所有的 RSS 訂閱從 Bloglines 轉移到 Google Reader 來,過程中並沒有很順利,尤其是中文的部分最討厭,匯入到 Google Reader 中都會呈現亂碼,最主要的問題應該還是出在 Bloglines 那邊,因為 BloglinesOPML 匯出檔都將許多中文給用 HTML Entities 編碼過了。

而以下就是我從 Bloglines 轉移到 Google Reader 的整個過程,各位按步驟做應該可以成功轉移:

1. 登入 Bloglines

http://www.bloglines.com/myblogs

2. 匯出 OPML 檔

    你也可以登入後到頁面最下方點選 Export Subscription 也可以下載。

     Bloglines - Export Subscription

    如果你已經登入過的話,其實直接點選 http://www.bloglines.com/export 連結就可以直接下載。

3. 將 OPML 先經過一次 Entities 解碼

由於從 Bloglines 匯出的 OPML 檔中,有許多中文字都會被編碼過,導致匯入 Google Reader 會看不懂。例如說:我有個訂閱的類別是「軟體工程」,但匯出後竟然變成以下的形式:

軟體工程

所以才必須「人工」先將大部分的這類的文字轉成 Unicode 的文字,我上網找了一個 "Encode/Decode HTML Entities" 工具,可以幫我將 OPML 的內容全部轉譯成沒有 HTML Entities 的樣子。

4. 修正上一步因為 Decode HTML Entities 之後所產生的錯誤

因為 OPML 格式必須是有效的 XML 檔案(well-formed),但因為我們將「整個檔案」的 HTML Entities 都轉成 Unicode 了,導致可能會有些原本不應該出現在 XML 中的字元給出現了,例如說雙引號(")、& 符號等。

我自己的 OPML 檔大約是這樣改的,各位可以用文字編輯器做搜尋取代即可:

先將 & 都換成 &,然後再把副檔名改成 xml ( 例如:export.xml ),再將檔案拖曳到 IE 7 中,IE 7 會幫你驗證 XML 的正確性,如果你的 XML 檔有問題,就可以看到錯誤的地方了,如下圖:

IE7 XML Error

不斷的一個一個修正錯誤,直到全部正確為止。像我的 OPML 匯出檔大約有 320 個 RSS,改個 7 次就改完了,因為這轉換工作只要做一次,所以手動改一下就好了,並不會花太多時間。

5. 匯入 Google Reader

最後就是將這個修正好的 OPML 檔案匯入 Google Reader,就大功告成啦。

Google Reader Import / Export

相關連結