SBB(Sina Blog Book) 是一个用于下载指定新浪博客作者全部文章的 Python 脚本,下载后的文章保存为 HTML 文件。@Appinn
来自大鱼老师 @bfishadow 的脚本,更多诞生过程请阅读这篇墙外文章:
SBB(Sina Blog Book) 是一个用于下载指定新浪博客作者全部文章的脚本。基于这些下载来的 HTML 文件,您可以借助 Calibre 来生成电子书,或者当作存档。请在 Python 2.7.8 下使用。
SBB(Sina Blog Book) 只有一个 .py 文件,使用方法:
SBB.py (新浪博客地址) (desc|asc)
例子:
SBB.py http://blog.sina.com.cn/gongmin desc
SBB.py http://blog.sina.com.cn/u/1239657051
排序开关是可选的,默认为按发表时间顺序排列(即 asc)。
下载的 HTML 文件会保存于当前文件夹,请注意事先将 SSB.py 放到单独的文件夹内,以防挤爆了桌面…
相关链接: https://github.com/bfishadow/SBB
这种地方说python会的人不多吧
瑞祥博客下载器就挺不错的
现在小众开始推脚本了么。。
真没看懂怎么用……
好像没用多线程啊,文章多的话会超级慢的吧。
我去…没用re 也没用beautifulsoap 人才啊…
@xsky123
确实,没用bs感觉确实方便了很多。
即使是用pip对普通人来说还是太麻烦了…
能下载文章内图片么
求教小众及大神,python2.7 运行之后,按照例子输入地址,一直显示SyntaxError: invalid syntax
即使是吧例子中的网址直接复制也是出错呢
@jiwinyang Python 2.7.8 么?
2.7.10运行出错,改2.7.8可以运行,但下载一半后又出错:
objResponse = urllib2.urlopen(strTargetBlogPostURL)
File “C:\Python27\lib\urllib2.py”, line 127, in urlopen
return _opener.open(url, data, timeout)
File “C:\Python27\lib\urllib2.py”, line 404, in open
response = self._open(req, data)
File “C:\Python27\lib\urllib2.py”, line 422, in _open
‘_open’, req)
File “C:\Python27\lib\urllib2.py”, line 382, in _call_chain
result = func(*args)
File “C:\Python27\lib\urllib2.py”, line 1214, in http_open
return self.do_open(httplib.HTTPConnection, req)
File “C:\Python27\lib\urllib2.py”, line 1184, in do_open
raise URLError(err)
urllib2.URLError: ;请问该怎么解决?谢谢
@sxsy 去 Github 问问作者