一键抓取下载网页的所有图片
前一阵因为一个项目中的图片下载需求,用python3写了个爬取网页图片的工具,中间碰到了不少问题,例如不同网页的图片地址格式不同,存放位置也不尽相同,就很让人头疼,趟了不少雷还好都解决了,客户是IT小白,所以操作界面必须也得傻瓜式的简单易懂,吐槽一下wxpython开发界面真够原始的。
关于文本框组件的提示信息处理费了一番周折,文本框组件的名称为wx.TextCtrl,为了让客户能知道该文本框需要填写啥信息,需要在文本框中给出提示,鼠标点击进行编辑状态时该提示信息要消失,如果鼠标移走没有填写任何信息,也要恢复该提示信息,如果填写了信息,就不需要显示提示信息了。闲话少提,直捣黄龙,直接上代码。
# self.keywordinput为文本框组件,self.keywordinput_hint为提示信息
self.keywordinput.Bind(wx.EVT_SET_FOCUS, self.OnKeyWordInputGetFocus)
self.keywordinput.Bind(wx.EVT_KILL_FOCUS, self.OnKeyWordInputLostFocus)
# 获取焦点事件
def OnKeyWordInputGetFocus(self, e):
if self.keywordinput.GetValue()==self.keywordinput_hint:
self.keywordinput.SetValue("")
self.keywordinput.SetEditable(True)
e.Skip()
# 失去焦点事件
def OnKeyWordInputLostFocus(self, e):
if self.keywordinput.GetValue().strip()=="":
self.keywordinput.SetValue(self.keywordinput_hint)
self.keywordinput.SetEditable(False)
e.Skip()
【工具功能特点】
1、支持百度图片、360图片、搜狗图片等知名图片网站的图片下载,可自动把图片搜索结果下载到本地计算机。
2、支持用户指定的单个或多个网址页面图片下载,支持页面地址文件或图片地址文件的图片批量下载
3、支持自定义图片存储目录,可按照网址特征自动创建图片目录,支持抓取过程查看已下载图片,支持手工中断抓取
【工具界面截图】
【工具操作说明】
1、下载后解压缩到本地,双击refreshpage_get_page_image.exe即可启动本软件
2、填写要下载网页的地址,从浏览器中直接粘贴过来即可;或者从网址文件直接导入,支持文本文件一个网址一行
3、填写存储图片文件夹名称,例如汽车、装修等等,可设置自动创建图片分类目录
4、点击“开始抓取”按钮即可,抓取过程中会显示日志
5、抓取过程中可以点击“打开图片目录”按钮查看已下载的图片
各位同学可以拿这个 电缆桥架网站来做测试 ,抓取图片程序下载地址如下:
【浏览器下载地址】
http://www.tomsoftcent.com:8180/download/网页图片抓取大师.rar
把这个链接直接复制到浏览器地址栏当中下载,否则会报错。
【百度网盘下载地址】
链接: https://pan.baidu.com/s/1-wWC-wI3rENOxDLbWtOfsA?pwd=uowl
提取码:uowl