当前位置: 首页 > news >正文

佛山中英文网站制作日本关键词热搜榜

佛山中英文网站制作,日本关键词热搜榜,深圳建设网站服务,网站网站建设培训有一个采集数据的需求,分析了页面数据后发现列表有一个id,但是没有其他数据,打开详情并不是通过id,而是其他一个字段,这就说明通过selenium抓取页面数据还不行,还要接口返回的数据。这个时候就需要用到代理…

有一个采集数据的需求,分析了页面数据后发现列表有一个id,但是没有其他数据,打开详情并不是通过id,而是其他一个字段,这就说明通过selenium抓取页面数据还不行,还要接口返回的数据。这个时候就需要用到代理了,在代理层面把数据拦截下来,把自己想要的接口数据保存起来,然后通过页面找到的id去匹配找到详情需要的字段。大致意思就是接口列表返回的数据有id也有详情的字段,但是html里面只有id,所以要把接口数据也存起来,然后根据id找到列表对应的详情字段。

代码如下:

static async Task Main(string[] args)
{var proxyServer = new ProxyServer();proxyServer.AddEndPoint(new ExplicitProxyEndPoint(System.Net.IPAddress.Any, 8000, true)); // 8000为端口proxyServer.Start();var proxy = new Proxy{HttpProxy = "127.0.0.1:8000",SslProxy = "127.0.0.1:8000"};var chromeOptions = new ChromeOptions();chromeOptions.Proxy = proxy;chromeOptions.AddArgument("--headless"); // 启用无头模式chromeOptions.AddArgument("--no-sandbox"); // 可选,适用于某些环境chromeOptions.AddArgument("--disable-dev-shm-usage"); // 可选,适用于某些环using (var driver = new ChromeDriver( chromeOptions)){//proxyServer.BeforeRequest+=//返送前的请求request也会在这里拦截proxyServer.BeforeResponse += async (sender, e) =>//返回的请求都会在这里拦截{// 检查响应的 Content-Typeif (e.HttpClient.Request.Url.Contains("/xxxx") && e.HttpClient.Request.Method == "POST"){Rootobject rootobject = JsonSerializer.Deserialize<Rootobject>(await e.GetResponseBodyAsString());if (rootobject.data.List != null){ foreach (var item in rootobject.data.List){   Console.WriteLine($"tid:{item.tid}"); }}}};driver.Navigate().GoToUrl("https://domain.com");Thread.Sleep(1000);driver.FindElement(By.XPath("/html/body/div/div/div/section/div[3]/div[2]/div/div[1]/img")).Click();} proxyServer.Stop();Console.ReadKey();
}

其实也可以直接请求接口,但是直接请求接口的话参数要搞清楚怎么传,这里选择了selenium主要是为了方便,不需要去研究请求参数也不用担心参数变动。selenium本身是支持代理请求的,我们只需要启动一个代理服务器,把代理服务器的地址给到selenium就可以了,这篇文章的代码逻辑也是如此。

http://www.dt0577.cn/news/37243.html

相关文章:

  • 建立企业网站方案百度的链接
  • 孔家庄网站建设免费个人自助建站
  • 做3d图的网站有哪些营销的方法手段有哪些
  • 惠州地区网站建设公司杭州seo网站排名优化
  • 网站由哪些部分组成部分seo的中文含义
  • 关于建设教体局网站的申请百度信息流广告平台
  • 萍乡招聘网站建设百度搜索风云榜电视剧
  • 长沙销售公司 网站网站空间费用一年多少
  • 网站推广排名优化多少钱seo优化的主要内容
  • 怎么做网站的代理商谷歌chrome官网
  • 网站已备案下一步怎么做深圳seo推广
  • dw可以做移动端网站广东全网推广
  • 网站建设花多少钱网络推广官网首页
  • 做网站开发要安装哪些软件宁德市教育局官网
  • 镇江手机网站制作百度人工服务24小时热线电话
  • 中文网站的seo怎么做如何优化培训体系
  • 深圳代做网站seo规则
  • 苏州高端网站设计企业搜索引擎的作用
  • 个人备案的网站竞价排名做不了头条权重查询
  • 政府网站建设工作方案seo排名点击软件推荐
  • 搭建品牌电商网站怎么做怎么把自己的产品推广出去
  • 网站建设会提供哪些服务百度一下网页搜索
  • 网站建设宝安网络营销和推广做什么
  • 青岛网站建设eoe小时seo
  • 怎样判断网站的好坏网页制作教程书籍
  • 广州做网站建设网站优化 福州
  • php网站开发的技术框架域名备案查询
  • 马良行网站3d模型预览怎么做的上海seo推广整站
  • wordpress仿制模块北京seo方法
  • 网络推广工作好吗网站seo策划