【Jsoup抓取到页面A标签中的href路径】博客地址:博客地址
直接上代码,注释很全乎
public static void main(String[] args)throws Exception{
//抓取的网址
String url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/index.html";
//编码格式的转换
Document document = Jsoup.parse(new URL(url).openStream(), "GBK", url);
//根据class获取到 页面的 元素内容
Elements tables = document.getElementsByClass("provincetr");
//根据td标签来划分
Elements td = tables.select("td");
for(int j=0;
j
org.jsoup
jsoup
1.11.3
需要引入以上jar包
也可以去这个网址下载,
输出的时候会抓到""空字符串,大家自己判断下就好了
推荐阅读
- Java|Java基础——数组
- 人工智能|干货!人体姿态估计与运动预测
- java简介|Java是什么(Java能用来干什么?)
- Java|规范的打印日志
- Linux|109 个实用 shell 脚本
- 程序员|【高级Java架构师系统学习】毕业一年萌新的Java大厂面经,最新整理
- Spring注解驱动第十讲--@Autowired使用
- SqlServer|sql server的UPDLOCK、HOLDLOCK试验
- jvm|【JVM】JVM08(java内存模型解析[JMM])
- 技术|为参加2021年蓝桥杯Java软件开发大学B组细心整理常见基础知识、搜索和常用算法解析例题(持续更新...)