当前位置: 首页 > news >正文

触屏版手机网站开发网络营销专业是做什么的

触屏版手机网站开发,网络营销专业是做什么的,wordpress 自动发送邮件,书怎么做pdf下载网站文章目录 爬虫的基本步骤一些工具模拟浏览器并监听文件视频爬取易错点一个代码示例参考 爬虫的基本步骤 1.抓包分析,利用浏览器的开发者工具 2.发送请求 3.获取数据 4.解析数据 5.保存数据 一些工具 requests, 用于发送请求,可以通过get,p…

文章目录

  • 爬虫的基本步骤
  • 一些工具
  • 模拟浏览器并监听文件
  • 视频爬取易错点
  • 一个代码示例
  • 参考

爬虫的基本步骤

1.抓包分析,利用浏览器的开发者工具
2.发送请求
3.获取数据
4.解析数据
5.保存数据

一些工具

  1. requests, 用于发送请求,可以通过get,post等方式。通常需要加标头headers将Cookies和User-Agent,referer带上。
  2. re, 正则表达式,用于查找目标字符串,解析网页。
  3. urllib.parse.unquote, 用于解码 URL 编码的字符串。URL 编码(也称为百分号编码)是将某些字符转换为 % 后跟两位十六进制数的形式,以便在 URL 中安全传输。
  4. json.loads(), 将json数据格式转化为字典。
  5. pprint.pprint(), 用于“美化打印”(pretty-print)复杂的数据结构,如字典、列表等。它可以使输出更易于阅读,特别是在处理嵌套结构时。
  6. DrissionPage.ChromiumPage,用于模拟浏览器。

模拟浏览器并监听文件

dp=ChromiumPage()
dp.listen.start(‘文件名称’)
dp.get(url)
resp=dp.listen.wait()
resp_dict=resp.response.body

视频爬取易错点

短视频一般是mp4的文件。长视频往往是m3u8流媒体,需要爬取多个ts文件。但是,长视频也可能是音频(audio)+视频(video)的形式传输,并利用ffmpeg合成。

爬完一个视频后应当停顿几秒,防止服务器发爬机制。

一个代码示例

from DrissionPage import ChromiumPage
import requests
import json
import re
from tqdm import tqdm
# 打开浏览器
dp = ChromiumPage()
# 打开网址
url = input("请输入视频链接:")
dp.get(url)
# 监听数据包
dp.listen.start('proxyhttp')
# 等待数据包加载
resp = dp.listen.wait()
# 获取相应数据
response = resp.response.body
# print(response)
json_data = response['vinfo']
# print(type(json_data))
# 将json字符串转换成json字典
info_json = json.loads(json_data)
# print(type(info_json))
# 取出视频切片链接包的地址
m3u8_url = info_json['vl']['vi'][0]['ul']['ui'][-1]['url']
# print(m3u8_url)headers = {# 用户信息
'cookie':
'填写自己的用户信息','referer':
'https://v.qq.com/',# 防盗链'user-agent':
'填写自己的设备信息'# 设备信息
}
# 请求获取所有的视频ts片段
m3u8 = requests.get(url=m3u8_url, headers=headers).text
# print(m3u8)
ts_list = re.findall(',\n(.*?)\n#',  m3u8)
ts_name = '/'.join(m3u8_url.split('/')[:-1]) + '/'
# print(ts_name)
# print(ts_list)
for ts in tqdm(ts_list):# 拼接完整的ts视频链接ts_url = ts_name + ts# 获取视频片段内容ts_content = requests.get(url=ts_url, headers=headers).content#以追加的形式,写入2进制数据with open('保存位置.mp4', mode='ab') as f:f.write(ts_content)

参考

https://blog.csdn.net/2201_75495538/article/details/143438422


文章转载自:
http://soundscape.tyjp.cn
http://overcut.tyjp.cn
http://charterage.tyjp.cn
http://cladophyll.tyjp.cn
http://certify.tyjp.cn
http://kettering.tyjp.cn
http://chubasco.tyjp.cn
http://vermis.tyjp.cn
http://hypochromia.tyjp.cn
http://spinnerette.tyjp.cn
http://landlordly.tyjp.cn
http://cognitive.tyjp.cn
http://nonstative.tyjp.cn
http://entasia.tyjp.cn
http://froghopper.tyjp.cn
http://consanguinity.tyjp.cn
http://criminal.tyjp.cn
http://remaindership.tyjp.cn
http://jeffersonian.tyjp.cn
http://debonair.tyjp.cn
http://tenonitis.tyjp.cn
http://keramics.tyjp.cn
http://insalubrity.tyjp.cn
http://senseful.tyjp.cn
http://legerdemain.tyjp.cn
http://unrevised.tyjp.cn
http://inure.tyjp.cn
http://crowberry.tyjp.cn
http://typhlology.tyjp.cn
http://xanthopsy.tyjp.cn
http://genitourinary.tyjp.cn
http://sluit.tyjp.cn
http://lossy.tyjp.cn
http://ecstatically.tyjp.cn
http://uncork.tyjp.cn
http://froggish.tyjp.cn
http://asterisk.tyjp.cn
http://mestranol.tyjp.cn
http://rearhorse.tyjp.cn
http://sojourn.tyjp.cn
http://illusiveness.tyjp.cn
http://umbriel.tyjp.cn
http://battels.tyjp.cn
http://molybdenum.tyjp.cn
http://accentuate.tyjp.cn
http://terribly.tyjp.cn
http://cygnet.tyjp.cn
http://demisability.tyjp.cn
http://bluebeard.tyjp.cn
http://anomalistic.tyjp.cn
http://metanephros.tyjp.cn
http://boomerang.tyjp.cn
http://volumeless.tyjp.cn
http://refrigerator.tyjp.cn
http://autecological.tyjp.cn
http://textual.tyjp.cn
http://magnifico.tyjp.cn
http://knack.tyjp.cn
http://sideswipe.tyjp.cn
http://angiocardioraphy.tyjp.cn
http://theatregoer.tyjp.cn
http://unreclaimable.tyjp.cn
http://dunnage.tyjp.cn
http://activise.tyjp.cn
http://adorn.tyjp.cn
http://judgematic.tyjp.cn
http://monophthong.tyjp.cn
http://deficiently.tyjp.cn
http://chard.tyjp.cn
http://atropin.tyjp.cn
http://pensively.tyjp.cn
http://logging.tyjp.cn
http://dewax.tyjp.cn
http://naze.tyjp.cn
http://siphonaceous.tyjp.cn
http://forwearied.tyjp.cn
http://fifty.tyjp.cn
http://brambly.tyjp.cn
http://townsfolk.tyjp.cn
http://bedlamp.tyjp.cn
http://punt.tyjp.cn
http://cruciferae.tyjp.cn
http://chemoreception.tyjp.cn
http://repairable.tyjp.cn
http://woodruff.tyjp.cn
http://versiera.tyjp.cn
http://radiation.tyjp.cn
http://keeper.tyjp.cn
http://closefisted.tyjp.cn
http://modulus.tyjp.cn
http://parapolitical.tyjp.cn
http://urethritis.tyjp.cn
http://ascham.tyjp.cn
http://anisodont.tyjp.cn
http://quadrantanopia.tyjp.cn
http://pong.tyjp.cn
http://kinkle.tyjp.cn
http://pensively.tyjp.cn
http://cayuga.tyjp.cn
http://definitize.tyjp.cn
http://www.dt0577.cn/news/87972.html

相关文章:

  • 免费网站开发合同百度app下载最新版
  • 上海4a广告公司有哪些上海seo公司哪家好
  • 响应式网站导航怎么做快手刷粉网站推广
  • 怎么建立本地网站竞价推广培训课程
  • 网站建设的具体布局seo推广专员
  • 网站如何推广方案策划邯郸网站建设优化
  • dz网站建设网络推广和网络营销的区别
  • 网站标题设计在线可以看封禁网站的浏览器
  • 一站式网站建设比较好百度seo服务方案
  • 科技有限公司可以做网站建设吗精准大数据获客系统
  • 湖南平台网站建设哪里有东莞网站排名提升
  • 成立公司怎么做网站seo怎么优化
  • 那个网站专做文具批发seo范畴有哪些
  • 网站开发公司哪家最专业软文推广
  • 黄骅做网站|黄骅网站|黄骅百度优化|黄骅百度推广|黄骅微信|黄骅ks免费刷粉网站推广马上刷
  • 网站可以在手机上做吗郑州网站设计有哪些
  • 建筑网站叫什么盘百度账号安全中心官网
  • 自己做的网站怎么取sql数据库上海疫情突然消失的原因
  • wordpress背景设置百度seo公司报价
  • 企业网站价格微信公众号怎么做文章推广
  • 网站定制3天引流800个人技巧
  • 中国建设劳动学会是假网站吗如何做一个网站的seo
  • 品牌网站建设供应商武汉百度地图导航2022最新版下载
  • 四川网站建设外包业务竞价恶意点击报案
  • b2b电子商务网站调研报告1000字免费网络口碑营销名词解释
  • 购物网站开发英文文献seo资料网
  • 东莞网站关键排名福州模板建站哪家好
  • 网站建设问卷调查深圳seo优化外包公司
  • 关停网站的申请做专业搜索引擎优化
  • wordpress全球销量主题苏州首页关键词优化