前陣子因為將我所有的 RSS 訂閱從 Bloglines 轉移到 Google Reader 來,過程中並沒有很順利,尤其是中文的部分最討厭,匯入到 Google Reader 中都會呈現亂碼,最主要的問題應該還是出在 Bloglines 那邊,因為 Bloglines 的 OPML 匯出檔都將許多中文給用 HTML Entities 編碼過了。
而以下就是我從 Bloglines 轉移到 Google Reader 的整個過程,各位按步驟做應該可以成功轉移:
1. 登入 Bloglines
http://www.bloglines.com/myblogs
2. 匯出 OPML 檔
你也可以登入後到頁面最下方點選 Export Subscription 也可以下載。
如果你已經登入過的話,其實直接點選 http://www.bloglines.com/export 連結就可以直接下載。
3. 將 OPML 先經過一次 Entities 解碼
由於從 Bloglines 匯出的 OPML 檔中,有許多中文字都會被編碼過,導致匯入 Google Reader 會看不懂。例如說:我有個訂閱的類別是「軟體工程」,但匯出後竟然變成以下的形式:
軟體工程
所以才必須「人工」先將大部分的這類的文字轉成 Unicode 的文字,我上網找了一個 "Encode/Decode HTML Entities" 工具,可以幫我將 OPML 的內容全部轉譯成沒有 HTML Entities 的樣子。
4. 修正上一步因為 Decode HTML Entities 之後所產生的錯誤
因為 OPML 格式必須是有效的 XML 檔案(well-formed),但因為我們將「整個檔案」的 HTML Entities 都轉成 Unicode 了,導致可能會有些原本不應該出現在 XML 中的字元給出現了,例如說雙引號(")、& 符號等。
我自己的 OPML 檔大約是這樣改的,各位可以用文字編輯器做搜尋取代即可:
先將 & 都換成 &,然後再把副檔名改成 xml ( 例如:export.xml ),再將檔案拖曳到 IE 7 中,IE 7 會幫你驗證 XML 的正確性,如果你的 XML 檔有問題,就可以看到錯誤的地方了,如下圖:
不斷的一個一個修正錯誤,直到全部正確為止。像我的 OPML 匯出檔大約有 320 個 RSS,改個 7 次就改完了,因為這轉換工作只要做一次,所以手動改一下就好了,並不會花太多時間。
5. 匯入 Google Reader
最後就是將這個修正好的 OPML 檔案匯入 Google Reader,就大功告成啦。
相關連結