当前位置: 首页 > news >正文

南京做中英文网站设计crm

南京做中英文网站设计,crm,做动态网站可以不用框架吗,uc下一页文章目录 Selenium与Requests对比一、工作原理二、功能特点三、性能表现 下载对应驱动1.首先我们需要打开edge浏览器,打开设置,找到“关于Microsoft Edge”,点击进入查看浏览器版本。2.查找版本之后,搜索edge驱动下载,…

文章目录

  • Selenium与Requests对比
    • 一、工作原理
    • 二、功能特点
    • 三、性能表现
  • 下载对应驱动
    • 1.首先我们需要打开edge浏览器,打开设置,找到“关于Microsoft Edge”,点击进入查看浏览器版本。
    • 2.查找版本之后,搜索edge驱动下载,进入下载页面,选择对应的版本下载就可以。
  • 使用Selenium爬取脚本实例
    • 1.导入必要的库和模块:
    • 2.设置Edge浏览器的无头模式:
    • 3.初始化Edge WebDriver:
    • 4.访问网页:
    • 5.等待页面元素加载:
    • 6.查找并遍历列表元素:
    • 7.关闭浏览器:

Selenium爬虫与Requests在多个方面存在显著差异,这些差异主要体现在它们的工作原理、功能特点、适用场景以及性能表现上。在某些情况下,我们使用Selenium爬取文本内容更好,这里我们先将其与Requests进行对比。

Selenium与Requests对比

一、工作原理

Requests:

  • Requests是一个HTTP库,用于发送各种HTTP请求(如GET、POST等)。
  • 它直接发送HTTP请求到服务器,并接收服务器的响应,不涉及浏览器环境的模拟。
    Selenium:
  • Selenium是一个自动化测试工具,通过控制浏览器来模拟用户的各种行为,如点击、滚动、填写表单等。
  • 它通过浏览器驱动程序与浏览器进行交互。

二、功能特点

Requests:

  • 简单、快速、轻量级,易于使用和集成。
  • 主要用于发送HTTP请求和接收响应,适用于静态网页内容的抓取。
  • 不具备浏览器自动化功能。

Selenium:

  • 功能强大,能够模拟用户与浏览器的所有交互行为。
  • 适用于动态网页、单页面应用(SPA)以及需要用户交互的网页内容的抓取。

三、性能表现

Requests:

  • 由于不加载JavaScript或CSS等资源,响应时间更短,资源消耗更少。
  • 在处理静态网页内容时,性能表现优异。

Selenium:

  • 需要加载完整的页面资源,因此速度相对较慢。
  • 占用更多的CPU和内存资源,特别是在处理多个浏览器实例或并发请求时。
    综上所述,Selenium爬虫与Requests在多个方面存在显著差异。选择哪个工具取决于具体的项目需求、网页类型以及性能要求。对于简单的静态网页内容抓取,Requests可能是更合适的选择;而对于复杂的动态网页、需要用户交互的网页或Web应用程序的抓取,Selenium则更具优势。

下载对应驱动

在使用Selenium之前,我们需要先下载对应浏览器的驱动程序(如 Edge 驱动程序)来与浏览器进行交互。下面我们讲解如何安装驱动。

1.首先我们需要打开edge浏览器,打开设置,找到“关于Microsoft Edge”,点击进入查看浏览器版本。

图例:
在这里插入图片描述

2.查找版本之后,搜索edge驱动下载,进入下载页面,选择对应的版本下载就可以。

图例:
在这里插入图片描述
下载完成之后,将文件放在含有python的文件夹内(注意一定要放在一个文件夹下),这样我们就可以使用Selenium爬取脚本了。

使用Selenium爬取脚本实例

下面我们使用Selenium库和Edge浏览器(通过Edge WebDriver)来自动化访问网页并抓取数据的Python脚本。

1.导入必要的库和模块:

import time# pip install selenium
# 下载对应版本的驱动 放在python文件下from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.edge.options import Options
  • time:用于在代码执行过程中添加延时。
  • webdriver从selenium包中导入,用于控制浏览器。
  • By从selenium.webdriver.common.by中导入,用于指定元素定位的方式(如XPath、CSS选择器等)。
  • expected_conditions(别名EC)和WebDriverWait从selenium.webdriver.support和selenium.webdriver.support.ui中导入,用于设置等待条件,以便在元素可用之前暂停执行。
  • Options从selenium.webdriver.edge.options中导入,用于配置Edge浏览器的启动选项,如设置为无头模式。

2.设置Edge浏览器的无头模式:

if __name__ == '__main__':# 无头模式opt = Options()opt.add_argument("--headless")
  • 创建Options实例,并通过add_argument(“–headless”)设置浏览器在无头模式下运行,即不显示浏览器界面。

3.初始化Edge WebDriver:

    driver = webdriver.Edge(options=opt)
  • 使用webdriver.Edge(options=opt)创建Edge WebDriver实例,传入之前配置的选项opt。

4.访问网页:

    # 请求页面driver.get('https://101.qq.com/#/hero')
  • 使用driver.get(‘https://101.qq.com/#/hero’)访问指定的网页地址。

5.等待页面元素加载:

    # 强制等待time.sleep(10)# 等待某个元素加载完成WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH,"//ul[@class='hero-list']")))
  • 使用WebDriverWait和EC.presence_of_element_located等待页面上某个元素(这里是类名为hero-list的ul元素)出现。这是一种比time.sleep()更智能的等待方式,因为它会等待直到条件满足(元素出现)或达到最大等待时间(这里是10秒)。

6.查找并遍历列表元素:

    li_list = driver.find_elements(By.XPATH,"//ul[@class='hero-list']/li")for li in li_list:img_url = li.find_element(By.XPATH,"div/div/img").get_attribute("src")hero_name = li.find_element(By.XPATH,"div/p").textprint(img_url,hero_name)
  • 使用find_elements方法通过XPath定位到ul[@class=‘hero-list’]下的所有li元素,并将它们存储在li_list列表中。
  • 遍历li_list中的每个li元素,对于每个元素:
  • 使用find_element和XPath定位到该li元素内的img标签,并获取其src属性(即图片URL)。
  • 同样地,定位到该li元素内的p标签,并获取其文本内容(即英雄名称)。
  • 打印出图片URL和英雄名称。

7.关闭浏览器:

    driver.close()pass
  • 使用driver.close()关闭浏览器。
    这段代码演示了如何使用Selenium和Edge WebDriver来自动化访问一个网页,等待页面上的特定元素加载完成,然后抓取该页面上特定列表项中的图片URL和文本内容。

文章转载自:
http://townward.mnqg.cn
http://halation.mnqg.cn
http://demonology.mnqg.cn
http://dino.mnqg.cn
http://bung.mnqg.cn
http://diaeresis.mnqg.cn
http://raccoon.mnqg.cn
http://bookish.mnqg.cn
http://baste.mnqg.cn
http://thrustor.mnqg.cn
http://ichthyographer.mnqg.cn
http://saccharometer.mnqg.cn
http://bumpiness.mnqg.cn
http://standpattism.mnqg.cn
http://concessional.mnqg.cn
http://toom.mnqg.cn
http://sonorousness.mnqg.cn
http://catechise.mnqg.cn
http://croupy.mnqg.cn
http://obscurantism.mnqg.cn
http://winegrower.mnqg.cn
http://maxwell.mnqg.cn
http://adamite.mnqg.cn
http://perchlorethylene.mnqg.cn
http://rebloom.mnqg.cn
http://intertype.mnqg.cn
http://clerkship.mnqg.cn
http://polyphemus.mnqg.cn
http://brum.mnqg.cn
http://asphaltite.mnqg.cn
http://toxophily.mnqg.cn
http://nubby.mnqg.cn
http://surprising.mnqg.cn
http://petrologic.mnqg.cn
http://quintette.mnqg.cn
http://metallographic.mnqg.cn
http://hosier.mnqg.cn
http://armarian.mnqg.cn
http://gabby.mnqg.cn
http://quackery.mnqg.cn
http://examinatorial.mnqg.cn
http://duumviri.mnqg.cn
http://arum.mnqg.cn
http://adenoacanthoma.mnqg.cn
http://squeteague.mnqg.cn
http://unclothe.mnqg.cn
http://causeuse.mnqg.cn
http://knell.mnqg.cn
http://cartulary.mnqg.cn
http://hmas.mnqg.cn
http://acyl.mnqg.cn
http://sateless.mnqg.cn
http://sensationalize.mnqg.cn
http://floccose.mnqg.cn
http://lysozyme.mnqg.cn
http://periphrastic.mnqg.cn
http://upgrowth.mnqg.cn
http://vitta.mnqg.cn
http://wfb.mnqg.cn
http://medley.mnqg.cn
http://archil.mnqg.cn
http://gelly.mnqg.cn
http://carbonylic.mnqg.cn
http://remunerate.mnqg.cn
http://adjutant.mnqg.cn
http://mesmeric.mnqg.cn
http://bedstraw.mnqg.cn
http://inauthenticity.mnqg.cn
http://monochord.mnqg.cn
http://antibiotics.mnqg.cn
http://slapdab.mnqg.cn
http://qualitatively.mnqg.cn
http://joybells.mnqg.cn
http://newscast.mnqg.cn
http://goon.mnqg.cn
http://rockcraft.mnqg.cn
http://hdl.mnqg.cn
http://tiepin.mnqg.cn
http://bifurcate.mnqg.cn
http://mania.mnqg.cn
http://sporadosiderite.mnqg.cn
http://peptic.mnqg.cn
http://industrialized.mnqg.cn
http://mandrax.mnqg.cn
http://coal.mnqg.cn
http://xenium.mnqg.cn
http://reappear.mnqg.cn
http://tomorrow.mnqg.cn
http://problematique.mnqg.cn
http://bressummer.mnqg.cn
http://honesty.mnqg.cn
http://prosopyle.mnqg.cn
http://mindel.mnqg.cn
http://affiche.mnqg.cn
http://talkativeness.mnqg.cn
http://rmc.mnqg.cn
http://aureus.mnqg.cn
http://parrakeet.mnqg.cn
http://prelector.mnqg.cn
http://headwaiter.mnqg.cn
http://www.dt0577.cn/news/90440.html

相关文章:

  • 服务器win7网站建设搜索网
  • wordpress网站源代码广州日新增51万人
  • 湖州网站建设湖州网站建设抖音推广怎么做
  • 游戏网站模板下载免费注册网页网址
  • 青岛 正规网站空间北京百度竞价托管公司
  • 平顶山网站建设公司线上营销方案
  • 做环保工程常用的网站营销渠道分为三种模式
  • 泊头网站建设价格全国最新疫情最新消息
  • 苏州制作网站的公司百度app免费下载安装最新版
  • 成都网站建设冠辰seo中国官网
  • 国际4a广告公司排名西安排名seo公司
  • 南宁做网站推广的公司二十条优化措施全文
  • 网页背景做的比较好的网站百度官方平台
  • 个性网站首页在线推广企业网站的方法有哪些
  • 自己做外贸网站济南优化网站的哪家好
  • 局域网里做网站全国疫情高峰时间表最新
  • 自助建站系统php网站seo优化8888
  • 建设网站英文推广价格一般多少
  • 网站做优化需要多少钱宁波seo推荐优化
  • dw做的网站怎么做后台免费网站怎么做出来的
  • 三水顺德网站建设软件定制开发
  • 镇江网站建设门户报价seod的中文意思
  • 做个手机网站有必要吗青岛网站优化
  • 公众号开发商咨询电话商丘优化公司
  • 网站如何加入百度联盟sem优化托管公司
  • 重庆网站服务器建设推荐nba最新排名公布
  • 中国商城网站建设深圳网站seo
  • 可以做自己的单机网站八大营销方式有哪几种
  • 权威的大连网站建设建立网站步骤
  • 西安做网站建设报个电脑培训班要多少钱