思绪剖析:
目的:获取歌手名字
网页位置
剖析网页结构和标签职位
模拟
正则讲明式提取
标签拥有惟一性,是最靠近数据的标签拉。
import re from urllib import request class Spider: url = "数据 res = request.urlopen(ret) 吸收类的url,获取返回结局 htmls = res.read().decode("utf-8") 获取的数据转换成utf-8样式 return htmls def __analysis(self, htmls): name = re.findall('(.*?)/.*?', htmls, flags=re.S) return name def go(self): 入口办法 htmls = self.__fetch_content() name = self.__analysis(htmls) return name spider = Spider() name = spider.go() print(f"豆瓣音乐Top榜单的歌手 : ")
发表评论