Python抓取网页图片相关代码编写方法

利用Python编程语言进行网页内容的抓取是一个比较常用的编程技术。那么,今天我们将会为大家详细介绍一下有关Python抓取网页图片的操作方法,以方便大家在实际应用中获得一些帮助。

创新互联科技有限公司专业互联网基础服务商,为您提供成都移动机房托管高防物理服务器租用,成都IDC机房托管,成都主机托管等互联网服务。

Python抓取网页图片代码示例:

 
 
 
  1. ImgDownloader  
  2. import win32com.client,time,win32inet,win32file,os  
  3. class ImgDownloader:  
  4. def __init__(self,url,dir):  
  5. self.__dir=dir  
  6. self.__ie=win32com.client.Dispatch('InternetExplorer.Application')  
  7. self.__ie.Navigate(url)  
  8. self.__wait__()  
  9. def __wait__(self):  
  10. while self.__ie.Busy:  
  11. time.sleep(0.1)  
  12. def start(self):  
  13. self.__wait__()  
  14. imgs=self.__ie.Document.getElementsByTagName('img')  
  15. for i in range(imgs.length):  
  16. try:  
  17. cachInfo=win32inet.GetUrlCacheEntryInfo(imgs[i].src)  
  18. if cachInfo:  
  19. path=cachInfo['LocalFileName']  
  20. pathpathinfo=path.split('\\')  
  21. pathinfo.reverse()  
  22. filename=('[%d]' % i) + pathinfo[0]  
  23. win32file.CopyFile(path,os.path.join(self.__dir,filename),True)  
  24. except:  
  25. pass  
  26. def close(self):  
  27. self.__ie.Quit()  
  28. if __name__=='__main__':  
  29. d=ImgDownloader('http://image.baidu.com/i?ct=201326592&cl=2&
    lm=-1&tn=baiduimage&pv=&word=boy&z=0','c:\\temp\\')  
  30. d.start()  
  31. d.close() 

原理:在Python使用com 接口运行IE浏览器,然后打开网页,获取网页所有图片的URL,最后利用win32api函数GetUrlCacheEntryInfo找出图片相应的本地缓存文件,复制到指定目录。

以上就是我们为大家介绍的Python抓取网页图片的应用方式。

标题名称:Python抓取网页图片相关代码编写方法
当前路径:http://www.shufengxianlan.com/qtweb/news22/485522.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联