GReader Archive 可以从 Google Reader 下载到订阅数据源的所有历史数据。Python 开发、跨平台,按 GPL 协议开源。@Appinn
感谢 Chemfan 同学的推荐
Google Reader 还有10天关闭,下载要抓紧。根据作者的介绍
(100+ subcription,已读 30w+ 条目)使用者,差不多花了 48 小时的时间。GReader Archive 下载的所有数据都会保存在 data 文件夹下。全部历史数据共产生了 2GB+ 的数据。
把下载的代码放在某个目录下,运行 run.py,提示输入 Google Reader 的账户信息,验证通过后即可开始下载。Linux 下一般已内建了对 Python 的支持。Windows 下可能需要另外安装 Python 组件后运行。Aulddays 在 Windows + Python 2.7 和 Linux + Python 2.6 下测试运行正常。Python 3.x 在语言上和 2.x 不太兼容,无法运行。
使用 GReader Archive 需要 python,建议前往作者页面查看详细教程
听起来好恐怖……
再见GR!
保存成什么格式?XML么?
@墨菲斯托同学
会保存为00X.xml格式,现在正在下载中。。。
@墨菲斯托同学
是的
好复杂的样子……
早就转移了,哈哈
方便以后搜索用么,很少浏览之前看过的条目,有价值的直接转到evernote里了。
@Kevin 订阅的很多网站已经不存在了,只有GR上有备份,如果不趁现在down下来,以后就永久消失了
哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
有人备份CL吗
@wswj
我单开一个马甲来备份吧,反正是通用的,再弄个好点的编辑器。完美了
@wswj 我倒是订阅了的
@篱落
下完了。一个总的加三个分版块rss。共1.3G。看了下最早是09年的的帖子
@wswj
大神啊…ORZ
能下载所有星标内容就够了
给你们发个不用python的
http://userscripts.org/scripts/show/170731
@ttph1oc userscripts.org是不是挂了,我这里直连or挂代理都访问不了
求教,下载得到的json怎么才能方便的浏览呢
@ttph1oc
万分感谢
@ttph1oc 安装了不会用啊
@ttph1oc 好人,原来的主帐号有两步验证,无法使用该py
一片片的error downloading错误啊。。。。
备份以后要怎么阅读呢?
100订阅30w+,要48小时?
我想知道,下载下来之后怎么浏览和 检索
对啊。。。。往哪里导入检索啊。。。
就像ls几位问的,怎么查看这些文件呢?!
文件夹里有xml文件,但是不能直接导入阅读器里面,请问是怎么回事?
我想把xml文件导入到阅读器里,它说:没有找到任何有效的数据,请检查OPML文件格式是否正确或是否有内容
就像ls几位问的,怎么查看这些文件呢?
文件夹里有xml文件,也有json文件,请问怎么用?
文件夹里有xml文件,但是不能直接导入阅读器里面,请问是怎么回事?
我想把xml文件导入到阅读器里,结果显示说:没有找到任何有效的数据,请检查OPML文件格式是否正确或是否有内容
时间太长了…
谁知道feedly 7月后的订阅会和google无缝对接吗?现在感觉只是调用
@nevermind
现在feedly搞了个feedly cloud,用户可以把自己的gr数据统统的搞到它的云里了。。。
用了一天余下载完成,2.3G。压缩下只有430M。
试了好多方法,发现可以通过订阅所存盘的xml文件路径来导入,但必须挨个来。
还有个很大的问题:所有的图片Archive都没有存下来!(Archive已显示所有下载已完成)。楼主何解?
@行者在赶路 楼上能说的详细点不
@行者在赶路
请问你用什么工具导入的?
@kkleo
应该任何rss阅读器都行。我在用傲游自带的看,不怎么方便。
图片肯定不会有,都是直接加载的。两三年前的图基本挂了
@wswj
希望详细说明用傲游阅读的方法w
我用傲游的“导入”会提示错误…直接把xml拖进去也只是用浏览器打开xml文件而已,这样只能看到一堆代码,没法阅读啊ort
@kkleo 要做的操作其实不是“导入”,而是“订阅”。把xml文件的绝对路径带xml本身名称,比如 E:\GReader Archive\xxx.gmail.com\小众软件00.xml 复制,而后就将这地址看作平常的订阅地址,通过“订阅”来实现导入。
@行者在赶路
谢谢!已经可以看了w
拖进opera看就行了
肯定不会Archive图片的,那得多大啊
@mycccc 这opera应该属于个例吧,也难怪opera一直都将RSS当作浏览器的一部分。。。
为啥不抓图片呐?== 离线单机伤不起。。。
。。。。。。。。。。。。。。没用过py的怎么办。。。。。楼上的Chrome插件下载了,好像也没什么效果啊= =
@flyink
根据提示,直接下载安装py就行,就可以运行.py文件了
那个us脚本试了下,看评论,貌似是跟GR本身的规则有关,更新数超过1K,就不全面了
同找一个能方便查看这些文件的软件
下了好几天了。。。。还没下完…..已经6.2G+了。。。。。
前几天还没问题,今天开始出现这个问题了:
2013-06-28 00:42:52,203 [ERROR] Network error: The read operation timed out
Traceback (most recent call last):
File “run.py”, line 404, in
main()
File “run.py”, line 360, in main
status, data = requester.request(url, None, 99999)
File “run.py”, line 86, in request
data = response.read()
File “C:\Python27\lib\httplib.py”, line 541, in read
return self._read_chunked(amt)
File “C:\Python27\lib\httplib.py”, line 586, in _read_chunked
raise IncompleteRead(”.join(value))
httplib.IncompleteRead: IncompleteRead(3055576 bytes read)
以为作者会提供使用自定义代理功能,没想到是蛋疼的手动找IP
我来膜拜牛人的,都按G论的, 我才30M不到
371个订阅才820M……
看来我订的个人站点太多?
紧急求助,下了两天,刚才不小心重启了,这个软件能够接上次的地方续传吗,还是说会重新下载?
备份之后测试了,可以续传。
貌似保存成了html,json,dat文件。用firefox保存只能看到一堆代码,能保存成网页的形式,直接看到图片吗? (貌似图片没有保存)
下午五点到现在就已经1.32g了
确定那个人30w+是2g?两天?
还是2tb?
谁能传我一份“玩聚”几个feed的历史缓存,我没下载成功,不胜感激,那里留存了很多记忆……