老妖的博客
现实的中没有几个人能够真为对方去死,甚至山盟海誓很快就会在金钱面前变的微不足道,这才是生活。没有永远的爱,除了你的父母对你,当然也就没有永远的恨,更没有永远的痛,时间是最好的治疗大师,它会很快抚平你心灵上累累的伤痕。很多年以后你想起来时,那些在你生命中汹涌来往的人群至多是个模糊的影子或者毫无意义的名字
posts - 105,  comments - 171,  trackbacks - 0
很久以前写过一篇文章利用htmlparser抓取网页内容(一),很多人都提问他的详细使用,其实我也只是入门尝试,如果想深入使用,还是建议看官方文档或者测试用例。不过最近刚好有个朋友想再次解析第三方网页内容,来查看交通违章信息。无意中发现一个比htmlparser更好用的html解析工具jsoup。最人性化的地方是,它支持类jquery语法,对,你没看错,是jquery选择器语法。下载地址:http://jsoup.org/
详细使用文档,这个地址应该说的很清楚了:http://baike.baidu.com/view/4066913.htm
使用非常简单,示例如下(是读取山西交通违章信息):
 1 import java.util.HashMap;
 2 import java.util.Map;
 3 
 4 import org.jsoup.Jsoup;
 5 import org.jsoup.nodes.Document;
 6 import org.jsoup.select.Elements;
 7 /**
 8  * 
 9  * @author Rocky
10  *
11  */
12 public class spider {
13     private static final String POSTURL="http://59.49.18.116:8008/sxwwpt_wai/inquire/illegalAction!carInquire.action";
14     private void spiderData() throws Exception{
15          Map<String,String> req=new HashMap<String,String>();
16          req.put("authCode", "");
17          req.put("csjcKey","110000");
18          req.put("hpzl", "02");
19          req.put("vioViolation.hphm", "xxx");//您的车牌号
20          req.put("type","1");
21          req.put("pagination.currentPage", "1");
22          req.put("pagination.pageSize", "5");
23          
24          Document doc=Jsoup.connect(POSTURL).data(req).get();
25          Elements newsHeadlines=doc.select(".if_tr td");
26          System.out.println(newsHeadlines.text());
27     }
28     /**
29      * @param args
30      * @throws Exception 
31      */
32     public static void main(String[] args) throws Exception {
33         
34         spider spider=new spider();
35         spider.spiderData();
36     }
37 
38 }
posted on 2013-08-07 13:25 老妖 阅读(5511) 评论(4)  编辑  收藏 所属分类: java心得

FeedBack:
# re: HTML Parser 替代品 jsoup
2013-08-07 13:32 | 老妖
修正了一下,发现jsoup可以使用connect直接发起http请求,并且可附加map参数类型,所以废弃了apache httpclient封装  回复  更多评论
  
# re: HTML Parser 替代品 jsoup
2013-08-15 14:59 | jun
@老妖
表单数据怎么设置  回复  更多评论
  
# HTML Parser 替代品 jsoup
2013-08-16 15:21 | 合肥期货开户
jquery选择器语法是什么东东,下下来看看好不好用先。  回复  更多评论
  
# re: HTML Parser 替代品 jsoup[未登录]
2013-08-17 15:27 | 老妖
@ jun
表单的数据就是我代码中写的map数据。你注意看看我的文章中含的外链。看文章不仔细  回复  更多评论
  

只有注册用户登录后才能发表评论。


网站导航:
 

<2020年9月>
303112345
6789101112
13141516171819
20212223242526
27282930123
45678910

常用链接

随笔分类(48)

随笔档案(104)

好友链接

我的豆瓣

积分与排名

  • 积分 - 208601
  • 排名 - 252

最新评论

阅读排行榜