hd1 hd1 - 锐客网

【hd1】获取汉典字符地址列表

# -*- coding: utf-8 -*- # 入re模块 import re import urllib.request from bs4 import BeautifulSoup # 开保存地址的文件 outfile = open("zdurlfile_jibenjieshi", "w") # 首列表正则表达式 bspattern = re.compile(r"(?:%[^%']{2}){3}") # 获取部首列表页面 req1 = urllib.request.Request('http://www.zdic.net/z/jbs/') response1 = urllib.request.urlopen(req1) index_page1 = response1.read() # 析得到部首列表 # 试试直接正则表达式提取部首列表 index_page1 = index_page1.decode('utf8') bslist = re.findall(bspattern, index_page1) # 换成字列表的地址 # 获取部首列表页面 for bu in bslist: bu = "http://www.zdic.net/z/jbs/bs/?bs=" + bu reqb = urllib.request.Request(bu) reqb.add_header('Referer', 'http://www.zdic.net/z/jbs/') responseb = urllib.request.urlopen(reqb) index_z = responseb.read() # 分析得到字列表 index_z = index_z.decode('utf8') zlist = re.findall(r"/z/[^']*?\.htm", index_z) for uz in zlist: url = "http://www.zdic.net/" + uz # 存入文件 outfile.write(url + '\n') # 数不能为叠加器 print(uz) outfile.close()

hd1

推荐阅读

王者荣耀力度KDA是什么意思？

爱与美食不可辜负

雨中冒险2压力板开管道门成就怎么做压力板开管道门指南

英雄人物事迹简介英雄人物事迹介绍

什么叫手机第三方平台？

含笑叶子发黄掉叶怎么办啊

佝偻的意思佝偻的意思是什么

奶酪过期了但一直冷冻的可以吃吗

rog|腾讯ROG游戏手机 5s Pro评测：六指并用，跑满骁龙888Plus

艾伦方差分析法,spss单因素方差分析法

原神鹰之门怎么爬上去原神鹰之门怎么上去

马蹄一天吃几个适宜

苹果手机怎么清理云盘 iPhone手机如何清理云盘

荣耀平板magicpad13怎么样荣耀平板评测

猫咪邀请码怎么领取

孕妇梦到哪些动物是吉兆

灰色箫音

婚礼上的角色着装

炫富|炫富真的很爽吗？那些喜欢炫富的人都是什么心理？

草图大师制作窗户的图文操作教程视频草图大师制作窗户的图文操作教程