如何用python爬取图片

要用Python爬取图片,我们可以使用requests库和BeautifulSoup库,以下是详细的技术教学:

10年建站经验, 成都网站建设、成都网站设计客户的见证与正确选择。创新互联建站提供完善的营销型网页建站明细报价表。后期开发更加便捷高效,我们致力于追求更美、更快、更规范。

1、确保已经安装了requests和BeautifulSoup库,如果没有安装,可以使用以下命令进行安装:

pip install requests
pip install beautifulsoup4

2、导入所需库:

import requests
from bs4 import BeautifulSoup
import os

3、定义一个函数,用于下载图片:

def download_image(url, save_path):
    response = requests.get(url)
    with open(save_path, 'wb') as f:
        f.write(response.content)

4、定义一个函数,用于获取网页中的所有图片链接:

def get_image_urls(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    img_tags = soup.find_all('img')
    img_urls = [img['src'] for img in img_tags if 'src' in img.attrs]
    return img_urls

5、定义主函数,用于爬取网页中的所有图片:

def main(url, save_dir):
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
    img_urls = get_image_urls(url)
    for img_url in img_urls:
        save_path = os.path.join(save_dir, img_url.split('/')[1])
        download_image(img_url, save_path)
        print(f'下载完成:{img_url} > {save_path}')

6、调用主函数,开始爬取图片:

if __name__ == '__main__':
    url = 'https://www.example.com'  # 替换为目标网站的URL
    save_dir = 'images'  # 图片保存的文件夹名称
    main(url, save_dir)

将以上代码保存为一个Python文件,例如download_images.py,然后在命令行中运行该文件,即可开始爬取图片,注意将url变量替换为目标网站的URL。

分享标题:如何用python爬取图片
本文地址:http://www.shufengxianlan.com/qtweb/news9/217809.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联