url = "http://pms3.ah.cmcc/"
pattern1 = '<.?(src=".?").*?'
headers = {'User-Agent',
'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36'}
opener = urllib.request.build_opener()
opener.addheaders = [headers]
data = opener.open(url).read().decode('utf8')
content_href = re.findall(pattern1, data, re.I)
set1 = set(content_href)
file_new = "D:爬虫href.txt"
with open(file_new, 'w') as f:
for i in set1:
f.write(i)
f.write(" ")
print('已经生成文件')
到此这篇二级域名解析到子目录(二级域名解析源码)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/bcyy/48645.html