Jsoup解析html实现招聘信息查询功能

  

jsoup是一款Java的HTML解析器,可直接解析某个URL地址,HTML文本内容。它提供了一套非常省力的API,可通过DOM, CSS以及类似于jQuery的操作方法来取出和操作数据。

  

下面是招聘网站的html信息:

        & lt; div类=" newlist_list_content " id=皀ewlist_list_content_table”比;   & lt;表宽度=" 853 " class=" newlist "单元格边距=" 0 "单元格间距=" 0 "比;   & lt; tbody>   & lt; tr>   & lt; th类=" zwmc "祝辞& lt; span>职位名称& lt;/span> & lt;/th>   & lt; th类=" gsmc "祝辞公司名称& lt;/th>   & lt; th类=" zwyx "祝辞职位月薪& lt;/th>   & lt; th类=" gzdd "在工作地点& lt;/th>   & lt; th类=" gxsj "祝辞发布日期& lt;/th>   & lt;/tr>   & lt;/tbody>   & lt;/table>      & lt;表格单元格边距=" 0 "单元格间距=" 0 "宽度==皀ewlist”比“853”类;   & lt; tbody>   & lt; tr>   & lt; td类=皕wmc”比;& lt;输入类型=案囱】颉眓ame=" vacancyid " value=" https://www.yisu.com/zixun/CC415107716J90250224000_635_1_03_201__1_ "/比;   & lt; div比;   & lt; par=" ssidkey=y&音箱;党卫军=201,amp; ff=03 " href=" http://jobs.zhaopin.com/415107716250224.htm " rel==捌降取薄巴獠縩ofollow”目标在Android开发工程师& lt;/a>   & lt;/div>& lt;/td>      & lt; td类=" gsmc "祝辞& lt; a href=" http://special.zhaopin.com/pagepublish/41510771/index.html " rel==捌降取薄巴獠縩ofollow”目标在南京天洑软件有限公司& lt;/a> & lt;/td>   & lt; td类=" zwyx "祝辞面议& lt;/td>   & lt; td类=" gzdd "在南京& lt;/td>   & lt; td类=" gxsj "祝辞& lt; span> 10-24 & lt; class=" newlist_list_xlbtn " href=" javascript:,“rel=巴獠縩ofollow”祝辞& lt;/a> & lt;/td>   & lt;/tr>   & lt; tr类=皀ewlist_tr_detail”比;   & lt; td宽度=" 833 px " colspan=?”比;   & lt; div类=皀ewlist_detail”比;   & lt; div类=癱learfix”比;   & lt; ul>   & lt;李类=" newlist_deatil_two "祝辞& lt; span>地点:南京& lt;/span> & lt; span>公司性质:民营& lt;/span> & lt; span>公司规模:20 - 99人& lt;/span> & lt; span>经验:1 - 3年& lt;/span> & lt; span>学历:大专& lt;/span> & lt;/li>   & lt;李类=皀ewlist_deatil_last”比;岗位职责:1、根据需求,基于Android平台进行程序开发;2,根据产品功能模块设计,编码实现各模块功能,并确保开发质量;3、编写相关的开发文档。任职要求:1,大专以上学历,计算机或相关专业者优先;2、2年以上& lt; b> Android开发& lt;/b>经验;3、熟悉Java编……& lt;/li>   & lt;/ul>   & lt; dl>   & lt; dt>   & lt; a href=" javascript:无效(0)”rel=巴獠縩ofollow”比;& lt; img src=" https://www.yisu.com/assets/images/newlist_sqimg_03.jpg "/比;& lt;/a>   & lt;/dt>   & lt; dd>   & lt; a href=" javascript: zlapply.searchjob.saveOne (CC415107716J90250224000_635)“rel=巴獠縩ofollow”祝辞& lt; img src=" https://www.yisu.com/assets/images/newlist_scimg_06.jpg "/祝辞& lt;/a>   & lt;/dd>   & lt;/dl>   & lt;/div>   & lt;/div>& lt;/td>   & lt;/tr>   & lt;/tbody>   & lt;/table>      之前      

下面使用jsoup解析html获取招聘信息:

        公共静态Listparse (String html) {   文档doc=Jsoup.parse (html);   元素元素=doc.getElementsByClass (newlist) .select (tr);   List列表=new ArrayList ();      (元素避署:元素){   如果(! ele.select (td) .toString () .equals (" ")) {   字符串job_url=ele.getElementsByClass (zwmc) .select .attr (“a”) (“href”);   字符串的工作=ele.getElementsByClass (“zwmc”)。text ();   字符串公司=ele.getElementsByClass (“gsmc”)。text ();   字符串addr=ele.getElementsByClass (“gzdd”)。text ();   字符串的日期=ele.getElementsByClass (“gxsj”)。text ();      HtmlFeed饲料=new HtmlFeed ();   如果(! job_url.toString () .equals (" "),, ! job.toString ()。=(" "),,! addr.toString () .equals (" "),, ! company.toString () .equals (" "),, ! date.toString () .equals (" ")) {   feed.setJob_url (job_url.toString ());   feed.setJob (job.toString ());   feed.setAddr (addr.toString ());   feed.setCompany (company.toString ());   feed.setDate (date.toString ());      list.add(饲料);   }   }      }   返回列表;   }      之前      

效果图如下:

  

效果图如下:
   Jsoup解析html实现招聘信息查询功能“> <h2 class=Jsoup解析html实现招聘信息查询功能