当前位置: 首页 > news >正文

华为云怎么做网站网站seo是什么

华为云怎么做网站,网站seo是什么,做网站用注册公司吗,官方建网站哪个好requests模块可以用来获取网络数据; 那么对于爬虫来说,要获取下图网页中的内容,就需要网页的URL。 复制链接方法是,打开网页,点击链接框,右键选择复制。 requests.get()函数可用于模拟浏览器请求网页的过…

requests模块可以用来获取网络数据;

那么对于爬虫来说,要获取下图网页中的内容,就需要网页的URL。

复制链接方法是,打开网页,点击链接框,右键选择复制。

requests.get()函数可用于模拟浏览器请求网页的过程,在Python语言中使用该函数,就能够获取网页数据。

get()函数中传入要访问网页的URL,就像浏览器打开URL一样。

(1)获取网页内容的步骤

(2)代码实现

# 使用import导入requests模块
import requests# 将网页链接赋值给url
url = "https://*****************/"# 使用requests.get()方法获取url的内容,将结果赋值给response
response = requests.get(url)# 输出response
print(response)

返回的response对象,就是响应消息;

(3)获取状态码

在浏览器中查看Response Headers中的信息就能够找到status:200,状态码200代表此次请求执行成功。

使用.status_code属性就可以查看状态码,这里输出的状态码数据类型是整型

import requestsurl = "https://nocturne-spider.baicizhan.com/2020/07/29/example-post-3/"response = requests.get(url)statusCode = response.status_codeprint(statusCode)

而只有状态码返回为200时,才能够成功获取到网页内容。

为满足上面的运行逻辑,我们要使用条件判断语句if..else先判断状态码,当状态码等于200时,再进行下一步操作。


if response.status_code == 200:print(response.status_code)else:print("请求数据失败")

(4)提取信息,获取内容

通过请求URL,获取到了Web服务器返回的信息,

要用.text属性,该属性能够将获取到的信息提取出来。

网页内容多,我们可以用切片(遵循左闭右开,将字符串进行分割)方法,输出前1000个字符;

if response.status_code == 200:content = response.text[:1000]print(content)else:print("请求数据失败")

(5)HTML

刚刚输出的内容是HTML语言,它是由许多的标签组成,这些标签构成网页的内容;

这个就是类似输出的HTML语言

<!DOCTYPE html>
<html lang="zh-CN">
<head><meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=2">
<meta name="theme-color" content="#222">
<meta name="generator" content="Hexo 5.1.1"><link rel="apple-touch-icon" sizes="180x180" href="/images/apple-touch-icon-next.png"><link rel="icon" type="image/png" sizes="32x32" href="/images/favicon-32x32-next.png"><link rel="icon" type="image/png" sizes="16x16" href="/images/favicon-16x16-next.png"><link rel="mask-icon" href="/images/logo.svg" color="#222"><link rel="stylesheet" href="/css/main.css"><link rel="stylesheet" href="/lib/font-awesome/css/all.min.css">

(5)总结

HTML是构成网页的标记语言。

URL指定了要访问文档的具体地址。

HTTP协议规定了文档的传递方式。

爬虫就是根据URL,通过HTTP协议去获取HTML内容。

http://www.dt0577.cn/news/39635.html

相关文章:

  • 昆明做网站优化公司百度问答一天能赚100块吗
  • 常用网站如何在桌面做快捷方式舆情通
  • 昆明网站开发谷歌网站优化
  • 云南网络网站推广百度一下百度首页
  • 建行网站登录不了青岛网站建设微动力
  • 重庆当地网站广州营销型网站
  • 学校网站建设栏目有哪些sem营销推广
  • 番禺电子商务网站建设凡科建站登录
  • 专业建网站价格网址域名大全2345网址
  • 做网站如何做视频北京网站优化常识
  • 有哪些可以做兼职的翻译网站吗湖南seo博客seo交流
  • 叫别人做网站要给什么东西网站权重怎么看
  • 重庆市建设工程造价管理总站网站建设技术托管
  • 高端网站开发步骤百度平台交易
  • 北京做网站的好公司有哪些网络广告营销方案策划内容
  • 泉州大型网站建设网店推广有哪些
  • 商丘做网站张杭州网站优化效果
  • 商城网站 模板百度竞价开户多少钱
  • 青岛网站建设seo优化制作设计广东公司搜索seo哪家强
  • 网站开发价格报表模板建网站用什么软件
  • 2017政府网站建设工作总结上海百度公司总部
  • 电子商务网站建设备案须知浏览器打开网站
  • 乌兰察布市建设局网站深圳外贸网络推广渠道
  • 苹果做ppt模板下载网站免费软文推广平台都有哪些
  • 开发网站建设搜索引擎广告优化
  • ubuntu本地网站建设推广代理平台
  • 企业网站是如何做的企业网站seo贵不贵
  • 东莞好的网站建设效果重要新闻今天8条新闻
  • erp网站建设最新推广注册app拿佣金
  • 网站无法下载视频 怎么做百度浏览器网址是多少