Friday, May 10, 2013

【小技巧】从slideshare下载被禁止保存的slide


slideshare经常会有些比较有用slide被作者设置成禁止保存,通过普通方式就不能直接保存到本地进行查看。如果想保存这类slide,就需要一点小技巧:

1. 打开该slide,查看该页面的源代码。
2. 找到类似 name="og_image" property="og:image" class="fb_og_meta" content="http://image.slidesharecdn.com/*****************-phpapp02/95/slide-1-1024.jpg" />的地方。
3. 复制content中的url,在浏览器中打开,发现就是该slide的第一页。

因此,我们就可以通过这种方式将该slide逐页保存到本地。

下面是一段将所有图片抓下来的代码:
import requests

url = 'http://image.slidesharecdn.com/*****************-phpapp02/95/slide-%d-1024.jpg'
filename = 'jpgs/slide-%d-1024.jpg'

for i in range(1, 13 + 1):     # 从第一页到最后一页加1
    r = requests.get(url % i)

    myfile = open(filename % i, 'wb')
    myfile.write(r.content)
    myfile.close()

一旦保存了所有图片之后,就有各种方式将图片转成pdf了。在mac中,最简单的就是选中所有图片,选择预览,在左侧选中所有图片,然后选择打印,并打印成pdf即可。

No comments:

Post a Comment