有没有python爬取淘宝单一宝贝图片源码呢？ python爬取网页源码

2021-10-04 19:10:04 932℃ KELLY

有没有python爬取淘宝单一宝贝图片源码呢？python爬取网页源码

爬虫小白求问python如何爬取天猫京东等网页

大的原则上，在网上能公开访问的可见的数据资料都是有办法爬取到的，天猫和京东上是有部分的订单成交数据的，所以这些也是可以爬取的。某宝中的楚江数据，数据采集工作可以代写爬虫，也可以直接让他们爬取数据，视频，图片，文字都可以。

你好！你的错误原因在于html页面获取到的img标签src属性中的链接，可能是因为src中的url格式是这样的：

<img src="//hao123/xxx/xxx/xxx/"></img>这样获取到的链接都没有带上协议：http或者https。而导致程序抛出ValueError的错误异常。

因为正常的url格式应该类似这样的：www.baidu/

即协议://用户名:密码@子域名.域名.顶级域名:端口号/目录/文件名.文件后缀?参数=值#标志

参考网页链接

可将代码中第一个for循环中download_links.append修改为：

for pic_tag in soup.find_all('img'):

pic_link = pic_tag.get('src')

download_links.append('http:' + pic_link)

打开python爬虫代码的源码目录，通常开始文件为，init.py,start.py,app.py寻找有没有类似的python文件,如果没有，请看源码的readme文件，里面会有说明，若以上都没有，你可能需要python方面的知识，自己去看源码，找到入口方法并运行

找到入口文件后，在当前目录打开控制台，输入python

正常情况下会出现下图的提示，若没有，请检查当前pc的python环境是否有被正确安装

最后，运行入口文件,输入python ***.py(入口文件),运行爬虫

淘宝不能爬的你自己看一下淘宝页面源码上面的robot.txt

上写着不允许任何搜索引擎来爬的

TAG：源码淘宝宝贝