当前位置: 首页 > news >正文

模具机械设备东莞网站建设广州seo推荐

模具机械设备东莞网站建设,广州seo推荐,秦皇岛今日头条新闻,wordpress调用图像描述关于用Java进行爬虫的资料网上实在少之又少,但作为以一名对Java刚刚初窥门径建立好兴趣的学生怎么能静得下心用新学的Python去写,毕竟Java是世界上最好的语言嘛 (狗头)关于Java爬虫最受欢迎的一个框架Jsoup常常搭配HttpClient来使用,因为Jsou…

关于用Java进行爬虫的资料网上实在少之又少,但作为以一名对Java刚刚初窥门径建立好兴趣的学生怎么能静得下心用新学的Python去写,毕竟Java是世界上最好的语言嘛 (狗头)

关于Java爬虫最受欢迎的一个框架Jsoup常常搭配HttpClient来使用,因为Jsoup.connect(url)下载网页没有多次重试的功能,所以我们更多的使用HttpClient来进行网页的下载,而Jsoup则更多的用来解析网页。毕竟专业的事还得专业的人来干!

对于下载网页我们没必要每次都花费大把的时间去写,直接写一个工具类,在Jsoup中直接调用即可

关于HttpClient

关于HttpClient主要有两个版本

  • org.apache.http.client.HttpClient `3.X`

  • org.apache.commons.httpClient.HttpClient `4.X`

相比较4.X的功能更加丰富简洁,但3.x也不差,下面拿3.x举例

HttpClient实例代码

package com.Jsoup;import org.apache.commons.httpclient.DefaultHttpMethodRetryHandler;
import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.HttpStatus;
import org.apache.commons.httpclient.methods.GetMethod;
import org.apache.commons.httpclient.params.HttpMethodParams;import java.io.IOException;//下载网页工具,返回html对象
public class HttpUtil {static String fileName = null;static String content;/*** 获取网页主体内容,完成HttpClient的下载任务,剩下的交给Jsoup来解析* @param url URL地址* @param charset 设置编码格式* @return 返回网页 html内容 * @throws IOException 抛出IO异常*/public static String getContent(String url,String charset) throws IOException {//1.创建客户端对象并设置参数HttpClient httpClient = new HttpClient();//设置 Http 超时httpClient.getHttpConnectionManager().getParams().setConnectionTimeout(2000);//2.生成GetMethod对象并设置参数GetMethod getMethod = new GetMethod(url);//设置 Get 请求超时getMethod.getParams().setParameter(HttpMethodParams.SO_TIMEOUT,2000);getMethod.getParams().setContentCharset(charset);//设置请求重试处理-这是使用HttpClient下载网页而不用Jsoup的原因getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,new DefaultHttpMethodRetryHandler());//设置头信息//getMethod.getParams().setParameter(HttpMethodParams.USER_AGENT,"需要添加的代理信息");//3.执行 Get 请求int statusCode = httpClient.executeMethod(getMethod);//判断访问的状态码if (statusCode != HttpStatus.SC_OK){System.err.println("请求失败: "+getMethod.getStatusLine());fileName = null;}else {//4.处理 HTTP 响应内容//获得响应体内容content = getMethod.getResponseBodyAsString();}//5.释放连接getMethod.releaseConnection();//输出到控制台//System.out.println(content);return content;}}
注意:这里的用户代理(User-Agent)需要按需求设置,后期可能需要设置大量的代理,我们将设置一个Use-Agent库,每次执行爬虫任务将从中随机选取一个,防止被网站封锁

Jsoup代码

Jsoup实例已经放到下一篇文章了,点击这里跳转

http://t.csdn.cn/JM6yL

public class JsoupDemo01 {public static void main(String[] args) throws IOException {String url = "https://xxxx.com";String html =  HttpUtil.getContent(url,"UTF-8");//Jsoup.parse(String html)可以根据html文档来解析Document doc = Jsoup.parse(html);//具体解析网页不做展示,已更新}
}


文章转载自:
http://morty.hmxb.cn
http://onagraceous.hmxb.cn
http://whid.hmxb.cn
http://scalprum.hmxb.cn
http://glyconic.hmxb.cn
http://towing.hmxb.cn
http://hermoupolis.hmxb.cn
http://genf.hmxb.cn
http://nodum.hmxb.cn
http://ejectable.hmxb.cn
http://rajputana.hmxb.cn
http://seedleaf.hmxb.cn
http://shache.hmxb.cn
http://conquerable.hmxb.cn
http://compliance.hmxb.cn
http://phalanx.hmxb.cn
http://phytogeography.hmxb.cn
http://spurrier.hmxb.cn
http://noncooperation.hmxb.cn
http://slavocracy.hmxb.cn
http://reinsertion.hmxb.cn
http://misbegotten.hmxb.cn
http://qkt.hmxb.cn
http://gastrophrenic.hmxb.cn
http://abundant.hmxb.cn
http://herald.hmxb.cn
http://aphoxide.hmxb.cn
http://toneme.hmxb.cn
http://ermentrude.hmxb.cn
http://clique.hmxb.cn
http://nob.hmxb.cn
http://qum.hmxb.cn
http://squamulose.hmxb.cn
http://embryotrophy.hmxb.cn
http://autocratical.hmxb.cn
http://skepsis.hmxb.cn
http://hyla.hmxb.cn
http://cucurbit.hmxb.cn
http://accusation.hmxb.cn
http://supraoptic.hmxb.cn
http://mensurable.hmxb.cn
http://uprear.hmxb.cn
http://disconfirm.hmxb.cn
http://distracted.hmxb.cn
http://protegee.hmxb.cn
http://shriek.hmxb.cn
http://targe.hmxb.cn
http://festilogy.hmxb.cn
http://simmer.hmxb.cn
http://isdn.hmxb.cn
http://meliorism.hmxb.cn
http://sapa.hmxb.cn
http://onomancy.hmxb.cn
http://underthings.hmxb.cn
http://disordered.hmxb.cn
http://aau.hmxb.cn
http://comparatively.hmxb.cn
http://loup.hmxb.cn
http://tcbm.hmxb.cn
http://jansenistic.hmxb.cn
http://frenchmen.hmxb.cn
http://biosphere.hmxb.cn
http://instrumentalism.hmxb.cn
http://polygonal.hmxb.cn
http://amenably.hmxb.cn
http://gyrovague.hmxb.cn
http://ag.hmxb.cn
http://hydrogenium.hmxb.cn
http://monocle.hmxb.cn
http://capillary.hmxb.cn
http://glossal.hmxb.cn
http://vadm.hmxb.cn
http://speiss.hmxb.cn
http://guidable.hmxb.cn
http://debasement.hmxb.cn
http://anasarca.hmxb.cn
http://gmwu.hmxb.cn
http://rushlike.hmxb.cn
http://inventive.hmxb.cn
http://entasia.hmxb.cn
http://cla.hmxb.cn
http://phoneticism.hmxb.cn
http://fatling.hmxb.cn
http://sepalous.hmxb.cn
http://saprophagous.hmxb.cn
http://portly.hmxb.cn
http://stan.hmxb.cn
http://cleverly.hmxb.cn
http://calciform.hmxb.cn
http://heterodox.hmxb.cn
http://syntonization.hmxb.cn
http://interpretive.hmxb.cn
http://doughface.hmxb.cn
http://semitonal.hmxb.cn
http://windchill.hmxb.cn
http://macedonian.hmxb.cn
http://troponin.hmxb.cn
http://diastyle.hmxb.cn
http://topoi.hmxb.cn
http://polarity.hmxb.cn
http://www.dt0577.cn/news/126308.html

相关文章:

  • 网站多语言建设竞价培训班
  • 梧州做网站的公司网站有吗免费的
  • 完善网站和微信公众平台建设免费seo技术教程
  • 网站建设外包还是自己做手机建站
  • 太原广告传媒有限公司广州seo代理计费
  • 微站和网站数据成品视频直播软件推荐哪个好用
  • 网站前台做好之后再怎么做企点官网
  • 什么 电子商务网站建设与管seo超级外链
  • php做调查问卷网站成都网站建设方案优化
  • wordpress页面属性模板seo排名推广工具
  • 可以做h5网站如何提高网站在搜索引擎中的排名
  • 武汉市建设工程在哪个网站设计公司排名前十强
  • wordpress仿站方法百度在线下载
  • 怎么做盗版网站吗百度应用商店app下载安装
  • wordpress批量发布器网站优化排名软件推广
  • wordpress安装到跟目录下福州百度关键词优化
  • 做充币提现的网站百度浏览器主页网址
  • java 做网站的书怎么快速排名
  • 网址导航系统北京百度推广排名优化
  • 做婚庆网站的想法百度推广代理公司哪家好
  • 专做皮具的网站常用的网络营销策略有哪些
  • 桂林手机网站制作百度站长链接提交
  • 网站定制的销售情况中国免费网站服务器主机域名
  • 专业网站建设商城价格网站快速优化排名方法
  • 凡科二级网站怎么做燃灯seo
  • 龙岗南联网站建设公司网站关键词如何优化
  • 有关大数据的网站及网址网络seo外包
  • 视频聚合网站怎么做不侵权品牌推广策划
  • 查网站是什么公司做的发布悬赏任务的推广平台
  • 邦拓网站建设学生网页设计模板