当前位置: 首页 > article >正文

01数据准备 抓取图片 通过爬虫方式获取bing的关键词搜索图片

为了获取训练所需的图片,我们最常用的手段就是自己去写一个爬虫去获取相关图片。本文将重点围绕如何采用爬虫的方式获取训练所需的图片素材进行讲解,为了大家能够够直观的掌握相关技术,参考本文的相关过程和代码获取自己的数据图片素材,笔者将详细介绍实现过程。
1、确定图片获取来源
首先,我们要确定从什么地方获取图片。对于本文所述的电动自行车头盔佩戴场景而言,我们很难找到一个网站有大量的素材,最为常用的手段就是在百度等搜索引擎上去搜索,因此我们初步确定的思路是确定关键词,比如“电动车 头盔”,并使用这个关键词在搜索引擎上做图片检索,并将检索得到的图片结果进行爬取。
在确定的基本思路后,我们要做的就是确定从那个搜索引擎进行抓取。而这一点我们可以尝试比较一下百度和Bing这两个主流搜索引擎,确定一下那个自己去尝试构造爬虫脚本请求所需的url更简单便利。
(1)百度图片搜索
我们在百度图片页面尝试搜索“电动车 头盔”,我们可以看到如下结果页面。
在这里插入图片描述

我们虽然得到了很多搜索出来的图片,但这里我们虽然需要评估一下搜索引擎搜索出来的结果是否符合预期,但更重要的是关注他上面的链接地址,因为


http://www.kler.cn/a/553332.html

相关文章:

  • uniapp基于JSSDK 开发微信支付(php后端)
  • 4.从零开始学会Vue--{{组件通信}}
  • LED灯闪烁实验:Simulink应用层开发
  • 【Golang 面试题】每日 3 题(五十九)
  • JVM类加载过程详解:从字节码到内存的蜕变之旅
  • HBase简介
  • 微软的基本类库BCL
  • 【python】tkinter简要教程
  • springmvc(13/158)
  • Pytorch实现之统计全局信息的轻量级EGAN
  • 计算机视觉算法实战——图像合成(主页有源码)
  • PHP培训机构教务管理系统小程序源码
  • CF1801D
  • ffmpeg configure 研究2:分析屏幕输出及文件输出的具体过程
  • 洛谷B2139
  • 解析Uniprot数据库数据|Python
  • PrimeFaces实战:IdleMonitor与Ajax的完美结合
  • Linux之kernel(1)系统基础理论(4)
  • 鸿蒙第三方库MMKV源码学习笔记
  • Redis字符串常见命令(String)