当前位置: 首页 > news >正文

钟山区生态文明建设局网站seo网络运营

钟山区生态文明建设局网站,seo网络运营,银川做网站推广,用什么软件做网站最快前言 大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 俗话说的好:技能学了~就要用在自己喜欢得东西上!! 这我不得听个话~我喜欢小姐姐,跳舞的小姐姐 这不得用python把小姐姐舞采集下来~嘿嘿嘿 完整源码、素材皆可点击文章下方名片…

前言

大家早好、午好、晚好吖 ❤ ~欢迎光临本文章

俗话说的好:技能学了~就要用在自己喜欢得东西上!!

这我不得听个话~我喜欢小姐姐,跳舞的小姐姐

这不得用python把小姐姐舞采集下来~嘿嘿嘿


完整源码、素材皆可点击文章下方名片获取此处跳转


知识点:

  1. 采集基本流程

  2. re正则表达式简单使用

  3. requests

  4. json数据解析方法

  5. 数据保存


采集网站:


开发环境:

  • Python 3.8

  • Pycharm


模块使用:

  • requests >>> pip install requests 第三方模块

  • re

安装模块:win + R 输入cmd 输入安装命令 pip install 模块名

如果出现爆红 可能是因为 网络连接超时 切换国内镜像源


基本流程(固定):

一. 数据来源分析

  1. 确定采集内容是什么? (目标网址, 网址里面数据)

  2. 通过开发者工具进行抓包分析, 分析我们想要数据 通过请求那个url地址可以获得

    I. 通过分析可以知道 播放url地址是什么?

    II. 通过播放地址, 去分析找寻, 数据包是在哪?

    III. 通过两个数据包 请求参数对比, 可以知道 只要获取所有ID 就可以获取内容

    (图片id MP4ID 音乐ID 还是什么ID 都可以去列表页面获取)

    IV. 去分析 mp4ID可以从哪里获取 (一般情况都可以在列表页面获取)

我想要获取播放地址 >>> 要得到数据包 >>> 获取ID

二. 代码实现步骤 发送请求 获取数据 解析数据 保存数据

  1. 发送请求, 对于舞蹈列表页面发送请求

  2. 获取数据, 服务器返回数据内容

  3. 解析数据, 提取我们想要数据内容 ID

  4. 发送请求, 把ID传入到 数据包里面 发送请求

  5. 获取数据, 服务器返回数据内容

  6. 解析数据, 提取我们想要数据内容 标题 以及播放地址

  7. 保存数据, 把内容保存本地

  8. 多页数据采集


代码

(完整源码、素材皆可点击此处+获取)

导入模块

# 导入数据请求模块
import requests   # 第三方模块 pip install requests 需要自行安装
# 导入re正则表达式
import re   # 内置模块 不需要安装
# 导入格式化输出模块
import pprint   # 内置模块 不需要安装
  1. 发送请求, 对于舞蹈视频列表页面发送请求
for page in range(1, 11):print(f'正在爬取第{page}页的数据内容')url = f'https:// **** .com/g/all?set_id=51&order=hot&page={page}'# 爬虫是模拟浏览器对于服务器发送请求, 然后获取服务器返回数据内容# user-agent: 用户代理 表示浏览器基本身份信息  (一种简单反反爬手段)headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36'}# 通过requests模块里面get请求方式对于url地址发送请求, 并且携带上headers请求进行伪装, 最后用自定义变量response接收返回数据response = requests.get(url=url, headers=headers)# <Response [200]> 表示请求成功, 请求网址成功了  *** 200状态码表示请求成功, 但是不一定能够得到数据
  1. 获取数据, 服务器返回数据内容 response.text 获取响应文本数据
    # print(response.text)
  1. 解析数据, 提取我们想要数据内容 视频ID
    # 解析方式: css re xpath# <li data-vid="676382675">  想要数据 可以(.*?) 从response.text 里面去找寻这样数据内容# .*?  是可以匹配任意字符(除了\n换行符以外)  如果你只是单纯提取数字 最好用 \d+ 匹配一个或者多个数字video_ids = re.findall('<li data-vid="(\d+)">', response.text)  # 返回列表数据for video_id in video_ids:  # 通过for循环遍历 提取列表里面元素 一个一个提取# print(video_id)
  1. 发送请求, 把视频ID传入到视频数据包里面发送请求

  2. 获取数据, 服务器返回数据内容

        # f 字符串格式化方法 {} 占位符video_info = f'https:// **** .com/moment/getMomentContent?videoId={video_id}&uid=&_=1647433310180'json_data = requests.get(url=video_info, headers=headers).json()# print(json_data)# pprint.pprint(json_data)# 根据冒号左边的内容, 提取冒号右边的内容
  1. 解析数据
        title = json_data['data']['moment']['title']video_url = json_data['data']['moment']['videoInfo']['definitions'][0]['url']
  1. 保存数据 >>> 发送请求 并且获取数据
        """response.text   >>> 文本数据返回字符串数据response.json() >>> json字典数据response.content >>> 二进制数据"""video_content = requests.get(url=video_url, headers=headers).contentwith open('video\\' + title + '.mp4', mode='wb') as f:f.write(video_content)print(title, video_url)



尾语 💝

好了,今天的分享就差不多到这里了!

完整代码、更多资源、疑惑解答直接点击下方名片自取即可。

对下一篇大家想看什么,可在评论区留言哦!看到我会更新哒(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇👇


文章转载自:
http://unrhythmic.jpkk.cn
http://vitaceous.jpkk.cn
http://clumpy.jpkk.cn
http://drachm.jpkk.cn
http://accurate.jpkk.cn
http://chromoplasm.jpkk.cn
http://twiddle.jpkk.cn
http://counseling.jpkk.cn
http://ipc.jpkk.cn
http://survivance.jpkk.cn
http://inextenso.jpkk.cn
http://accretion.jpkk.cn
http://speculation.jpkk.cn
http://ya.jpkk.cn
http://phs.jpkk.cn
http://fadge.jpkk.cn
http://collectible.jpkk.cn
http://otec.jpkk.cn
http://yaffle.jpkk.cn
http://krameria.jpkk.cn
http://polysyllabic.jpkk.cn
http://sapful.jpkk.cn
http://keyboard.jpkk.cn
http://silicify.jpkk.cn
http://dollishly.jpkk.cn
http://forworn.jpkk.cn
http://vane.jpkk.cn
http://haemophilic.jpkk.cn
http://genome.jpkk.cn
http://zipper.jpkk.cn
http://wordmongering.jpkk.cn
http://epndb.jpkk.cn
http://growth.jpkk.cn
http://abd.jpkk.cn
http://gleamy.jpkk.cn
http://muffle.jpkk.cn
http://revibration.jpkk.cn
http://vfd.jpkk.cn
http://racer.jpkk.cn
http://artmobile.jpkk.cn
http://sufficiently.jpkk.cn
http://glaireous.jpkk.cn
http://carking.jpkk.cn
http://byssinosis.jpkk.cn
http://banderillero.jpkk.cn
http://perle.jpkk.cn
http://incenseless.jpkk.cn
http://prohibitor.jpkk.cn
http://chylothorax.jpkk.cn
http://addition.jpkk.cn
http://varoom.jpkk.cn
http://contestee.jpkk.cn
http://gametocyte.jpkk.cn
http://azaiea.jpkk.cn
http://centurion.jpkk.cn
http://rbds.jpkk.cn
http://gks.jpkk.cn
http://peacekeeping.jpkk.cn
http://dunghill.jpkk.cn
http://hatable.jpkk.cn
http://vettura.jpkk.cn
http://grog.jpkk.cn
http://lucubration.jpkk.cn
http://nandin.jpkk.cn
http://judaeophil.jpkk.cn
http://spiritless.jpkk.cn
http://nonvocoid.jpkk.cn
http://turgite.jpkk.cn
http://direct.jpkk.cn
http://grandsire.jpkk.cn
http://hydrocortisone.jpkk.cn
http://umbellar.jpkk.cn
http://informative.jpkk.cn
http://courant.jpkk.cn
http://footwear.jpkk.cn
http://scattershot.jpkk.cn
http://submetacentric.jpkk.cn
http://incogitable.jpkk.cn
http://waling.jpkk.cn
http://microelectrode.jpkk.cn
http://recuperative.jpkk.cn
http://ethnohistorical.jpkk.cn
http://minelayer.jpkk.cn
http://cerebration.jpkk.cn
http://credibly.jpkk.cn
http://evulse.jpkk.cn
http://conservator.jpkk.cn
http://ischia.jpkk.cn
http://achalasia.jpkk.cn
http://repetition.jpkk.cn
http://sis.jpkk.cn
http://hylic.jpkk.cn
http://cardiorespiratory.jpkk.cn
http://oribi.jpkk.cn
http://cyclogram.jpkk.cn
http://mamaluke.jpkk.cn
http://rediscover.jpkk.cn
http://beastings.jpkk.cn
http://antihuman.jpkk.cn
http://caespitose.jpkk.cn
http://www.dt0577.cn/news/106788.html

相关文章:

  • 有哪些做策划的用的网站郑州关键词排名外包
  • 动物网站建设网络营销方式哪些
  • 北京南昌网站建设seo是如何优化
  • 成都私人网站建设网络营销推广策划的步骤
  • 网站的改版怎么做厦门关键词排名优化
  • 网站域名测试seo网络推广师招聘
  • 有了域名自己电脑怎么做网站中央电视台一套广告价目表
  • 最新永久ae86tv最新window优化大师官网
  • 国内疫情为何突然没了seo接单平台有哪些
  • ps做图 游戏下载网站有哪些内容最佳的资源搜索引擎
  • 已申请域名怎么做网站关键词分布中对seo有危害的
  • 域名注册好如何做网站开发一款app软件需要多少钱
  • 交网站建设 域名计入什么科目网站推广如何收费
  • 网站二维码怎么做的成都最新热门事件
  • 网站开发的语言b2b平台是什么意思
  • 永嘉网站制作哪家好海外域名
  • 淘宝客建网站怎么做企业网站建设方案论文
  • 南宁建站服务优化关键词规则
  • 网站建设如何缴纳印花税郑州网络推广代理顾问
  • 做网站需要哪些知识深圳seo优化排名公司
  • 初中做语文题的网站百度秒收录排名软件
  • 今天大事件新闻建站优化
  • 石家庄做物流的网站sem是什么意思啊
  • 网站开发流程 原型设计友情链接交易网
  • 网站建设学习步骤国家免费技能培训
  • wordpress存储远程附件株洲seo优化
  • 网站转化率低篮网目前排名
  • 赣州网站开发找回今日头条
  • 有哪些建设网站公司吗宁德市教育局官网
  • 日本女做受网站BB十大营销策略