用Python爬取了8262条微博评论,终于知道今天的微博评论为什么太好哭了!

本文转载自微信公众号「志斌的python笔记」,作者志斌。转载本文请联系志斌的python笔记公众号。

站在用户的角度思考问题,与客户深入沟通,找到二七网站设计与二七网站推广的解决方案,凭借多年的经验,让设计与互联网技术结合,创造个性化、用户体验好的作品,建站类型包括:做网站、成都做网站、企业官网、英文网站、手机端网站、网站推广、域名注册、网页空间、企业邮箱。业务覆盖二七地区。

大家好,我是志斌~

在此建党一百周年之际,祝愿我们的党生日快乐,祝愿我们的祖国繁荣昌盛!

刚刚志斌打开微博,发现热搜第一条是“今天的微博评论太好哭了“,它有263w+的热度。 于是志斌将这条微博下的评论,给全部爬取了下来,并做成词云图进行展示,看看网友们到底评论了什么,让人非常好哭!

需要源码的读者,加志斌微信获取哈~

01数据采集

志斌在之前的两篇文章中,详细的介绍了如何获取微博评论,有兴趣的读者可以看看这两篇文章批量爬取不同微博下的评论!爬取微博下全部评论数据~。这里志斌直接展示核心代码了,代码如下:

 
 
 
 
  1. for page in range(1,10000):
  2.    if page == 1 :
  3.        params = (
  4.            ('id', '4654152979845247'),
  5.            ('mid', '4654152979845247'),
  6.            ('max_id_type', '0'),
  7.        )
  8.    #s = requests.Session()
  9.    response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params)
  10.    a = response.json()['data']['max_id']
  11.    b = response.json()['data']['max_id_type']
  12.    for i in response.json()['data']['data']:
  13.        pinglunshijian = i['created_at']
  14.        neirong = re.sub(r'<[^>]*>', '', i['text'])
  15.        id = i['user']['id']
  16.        yonghumingcheng = i['user']['screen_name']
  17.        with open(r'71.txt', 'a', encoding='utf-8') as f:
  18.            f.write(f'{neirong}\n')
  19.    params = (
  20.        ('id', '4654152979845247'),
  21.        ('mid', '4654152979845247'),
  22.        ('max_id', str(a)),
  23.        ('max_id_type', str(b)),
  24.         )
  25.    print(f'爬取第{page}页数据......')
  26.    time.sleep(random.randint(1,3))

02词云图展示

我们一共获取了8262条数据,对这些数据进行词云图绘制,我们发现盛世、祖国、华夏、中国、我们、祝福、骄傲等词较多。看来评论里面都是祝福我们的祖国和感谢这盛世的!

志斌也点开这条热搜看了一下,里面的评论确实很让人泪目,尤其是这句:“我们生在国旗下,长在春风里;人民有信仰,国家有力量;目光所致皆为华夏,五星闪耀皆为信仰。”让志斌内心久久不能平静!

代码如下:

 
 
 
 
  1. with open("71.txt",encoding='utf-8') as f:
  2.    job_title_1 = f.read()
  3. contents_cut_job_title = jieba.cut(job_title_1)
  4. contents_list_job_title = " ".join(contents_cut_job_title)
  5. wc = WordCloud(stopwords=STOPWORDS.add("一个"), collocations=False,
  6.               background_color="white",
  7.               font_path=r"K:\苏新诗柳楷简.ttf",
  8.               width=400, height=300, random_state=42,
  9.               mask=imread('xin.jpg', pilmode="RGB")
  10.               )
  11. wc.generate(contents_list_job_title)
  12. wc.to_file("推荐语.png")

03小结

1.  今天上午看建党百年,听习近平总书记的重要讲话,感觉自己何其有幸,生于华夏,生于盛世,不经乱战,作为一名光荣的中共党员,自己以后定当不忘初心,牢记使命,以梦为马,不负韶华!

2. 本文仅作学习参考,不做它用。

网页题目:用Python爬取了8262条微博评论,终于知道今天的微博评论为什么太好哭了!
URL地址:http://www.shufengxianlan.com/qtweb/news47/481197.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联