Python新手抓取汽车之家,做自驾游最强攻略!

我在浏览汽车之家的时候,发现一个很好玩的地方,就是里面的“旅行家”板块,为什么说好玩呢,因为这里是各个车主分享的自己的自驾游的游记,特别的精彩,正好我也有做自驾游的想法,那就来爬一波吧╮(╯▽╰)╭

具体过程呢,我也不细说了,大致有几个点要注意:

1、汽车之家网页可以用json模块直接抓取

2、保存本地时,因为存在文本和图片的形式,所以我使用了python-docx模块,没有的小伙伴需要安装下哦,方法如下:

进入cmd命令输入:pip install python-docx

3、图片不在本地不好往word里面写,就先保存本地,然后在读取本地文件写入,这里我觉得可以优化下。

4、同样的,因为保存文件,所有借鉴网友的一小段函数,防止文件名出错而整个程序出错。

5、我抓取的是“精彩游记”板块,但是没有去抓详细内容,只抓了游记和推荐图片以及详细内容的url等等,适合选择好以后再仔细观看。

好了,不啰嗦了,直接上代码和成果哦!

需要源码的小伙伴,可来裙里拿哦。

写的不好,欢迎大家指正!喜欢就关注一波呗!( ̄ε  ̄)

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片