我们可以利用这个HTML分析器,项目地址: https://github.com/samacs/simple_html_dom

今天,我们准备抓取豆瓣的《艾伦•图灵传》,网址:http://book.douban.com/subject/11541213/?from=tag

通过HTML[……]

Read more