python编程:爬虫

 admin   2022-09-20 22:17   57 人阅读  0 条评论

思绪剖析:

目的:获取歌手名字
网页位置

剖析网页结构和标签职位

模拟
正则讲明式提取
标签拥有惟一性,是最靠近数据的标签拉。
import re from urllib import request class Spider: url = "数据 res = request.urlopen(ret) 吸收类的url,获取返回结局 htmls = res.read().decode("utf-8") 获取的数据转换成utf-8样式 return htmls def __analysis(self, htmls): name = re.findall('(.*?)/.*?', htmls, flags=re.S) return name def go(self): 入口办法 htmls = self.__fetch_content() name = self.__analysis(htmls) return name spider = Spider() name = spider.go() print(f"豆瓣音乐Top榜单的歌手 : ")


本文地址:http://www.guopangzi.net/post/2439.html
版权声明:本文为原创文章,版权归 admin 所有,欢迎分享本文,转载请保留出处!

 发表评论


表情

还没有留言,还不快点抢沙发?