有人想学一点编程, 但是一直没有找到感兴趣的切入点,可以简单的爬虫入手! 几十行代码, 轻松爬取豆瓣Top250电影数据,即刻体会编程的乐趣…
工具介绍:
Python3(python是很容易上手的编程语言,非常适合编程新手)
Requests(这是Python的一个开发库, 简洁好用)
lxml (可以通过xpath语法, 按需求提取内容)
运行效果
自动生成的文件
关于Requests
获取的电影海报(长图预警):
有详细注释的源码:
1 | import os |
获取的数据
1 | 编号:['1']标题:['肖申克的救赎']评分:['9.6']电影描述:['希望让人自由。'] |