当前位置: 首页 > news >正文

做业务查牙医诊所一般用什么网站搜狗链接提交入口

做业务查牙医诊所一般用什么网站,搜狗链接提交入口,seo中国官网,秦皇岛做网站目录 前言 道路千万条,安全第一条 爬虫不谨慎,亲人两行泪 获取b站的章若楠的视频 一、话不多说,先上代码 二、爬虫四步走 1.UA伪装 2.获取url 3.发送请求 4.获取响应数据进行解析并保存 总结 前言 道路千万条,安全第一条 爬…

目录

 

前言

        道路千万条,安全第一条

        爬虫不谨慎,亲人两行泪

获取b站的章若楠的视频

一、话不多说,先上代码

二、爬虫四步走

1.UA伪装

2.获取url

3.发送请求

 4.获取响应数据进行解析并保存

 总结


 

前言

        道路千万条,安全第一条

        爬虫不谨慎,亲人两行泪

 

获取b站的章若楠的视频

        不要问,问就是博主喜欢,嘿嘿嘿嘿(流口水)

 

一、话不多说,先上代码

# 请求b站视频
import json
import requests
from lxml import etreeif __name__ == '__main__':head = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0",# 防盗链"Referer": "https://www.bilibili.com/","Cookie": "buvid3=3EEF3EE1-472C-F430-105F-0E4F321F331C25161infoc; b_nut=1720613925; _uuid=46847D108-EFD1-9828-99910-32119EADB6EB26022infoc; enable_web_push=DISABLE; buvid4=E9918A3A-008D-2748-2B1F-78B04E8CCA5825688-024071012-IYJQtQw8DTdtrI0uY1UGvQ%3D%3D; buvid_fp=adf3cfaf35396cd4f051041d58ea252d; DedeUserID=455536180; DedeUserID__ckMd5=ece5cba51b3582b0; header_theme_version=CLOSE; rpdid=|(Y|RJRRJ~m0J'u~k|YuR|k); hit-dyn-v2=1; CURRENT_BLACKGAP=0; CURRENT_FNVAL=4048; CURRENT_QUALITY=80; b_lsid=FA4254F2_190DA67F5A6; bmg_af_switch=1; bmg_src_def_domain=i0.hdslb.com; SESSDATA=464ec009%2C1737203167%2C4093c%2A72CjCcAmS6QdnftcRgMbranRB57RDcvOgVEYQ2eANilbiZTke2ujiipqzyDhLaHzdf-lQSVnBETDB6RC1iRTBPOXE0MXJvWndtQ2J5M0ttRUdsNzV4eDBOS0ZHSnJFNGstUXdoZV9YWlFDMUN6WktnVWdyZzNXTHoxX3ZHMEQ4WnBRVFhuS3FWdlZRIIEC; bili_jct=7dcc1afe4e9061803755fe502bd89493; home_feed_column=5; browser_resolution=1528-750; bili_ticket=eyJhbGciOiJIUzI1NiIsImtpZCI6InMwMyIsInR5cCI6IkpXVCJ9.eyJleHAiOjE3MjE5MTAzODcsImlhdCI6MTcyMTY1MTEyNywicGx0IjotMX0.ZBTc3IhjtIXKw31_mMRIL58EBBFttxFrh9PXvDeNu74; bili_ticket_expires=1721910327; sid=5oumv249; bp_t_offset_455536180=956974561008549888"}url = "https://www.bilibili.com/video/BV1Ya411x7YS/?spm_id_from=333.788.recommend_more_video.-1&vd_source=c37b332e3068ca57bd61f05c52b41922"response = requests.get(url, headers=head)vid = response.texttree = etree.HTML(vid)with open("bilibili.html", "w", encoding="utf8") as bili:bili.write(vid)vid_info = "".join(tree.xpath("//head/script[4]/text()"))[20:]# print(vid_info)   # 是一个json大字符串info_dict = json.loads(vid_info)# print(info_dict)  # 变成字典video_url = info_dict["data"]["dash"]["video"][0]["baseUrl"]  # 获取视频的网址audio_url = info_dict["data"]["dash"]["audio"][0]["baseUrl"]  # 获取音频的网址video_content = requests.get(video_url, headers=head).contentaudio_content = requests.get(audio_url, headers=head).contentwith open("zhangruonan.wmv", "wb") as a:a.write(video_content)with open("zhangruonan.mp4", "wb") as b:b.write(audio_content)pass

        可以看见,这次代码多了不少东西,还有些变得不一样了,没事,我们一步步分析。

 

二、爬虫四步走

1.UA伪装

        这次UA伪装的头部代码多了不少,"Cookie"和"Referer",这些其实都是b站的反扒机制。而且这次也不用随机生成UA了,而是使用检查里的,因为随机生成的可能是APP端的,这个用不了。

先登录自己的b站账号,再获取Cookie,因为每个用户的Cookie是不一样的197af90cade14473a4951e0f1f076090.png

获取UA,ab41406bb2f8457ebed5a14f1d30226a.png

获取referer。df0e3bc694544a1787d18b9aa527c08a.png

 

2.获取url

        在该界面按f12进入检查界面,若是检查界面没东西的话就刷新网页,然后往上翻到第一个,复制url粘贴到pycharm即可cd9682dd998647e9ab11ce3edb90f7fd.png

 

3.发送请求

流水的url,铁打的发送请求。

response = requests.get(url, headers=head)

 

 4.获取响应数据进行解析并保存

  • 这次不一样的地方在于,视频和音频的url在head的第四个script标签下。
  • 而里面的文本内容在去除前面的"window.__playinfo__="后,取出来的是个json大字符串。
  • 用json.loads方法将字符串转换成字典,再通过字典的键去取里面的视频和音频的url。
  • b站的视频和音频网址都放在固定的键内,用上面给的代码即可取出来。
  • 取出来之后再次发送请求,获取数据。
  • 注意!!!图片,视频和音频都是二进制内容,所以用content属性获取。
  • 最后, 以写二进制内容的方式存入文件中,注意文件的类型,音频是MP4,视频是MP4或者是wmv。

cd57cda9da60489d843f74f57aa6b5af.png

 

 总结

作者的废话:

        章若楠太好看啦!

封面图片:

e81c0805ea854baa9fab333f9e907007.jpeg

 

 


文章转载自:
http://compendia.ncmj.cn
http://encina.ncmj.cn
http://fixup.ncmj.cn
http://reeve.ncmj.cn
http://animalism.ncmj.cn
http://denary.ncmj.cn
http://fetoscope.ncmj.cn
http://rebaptize.ncmj.cn
http://priggism.ncmj.cn
http://sablefish.ncmj.cn
http://stagnicolous.ncmj.cn
http://himeji.ncmj.cn
http://ennui.ncmj.cn
http://inducing.ncmj.cn
http://lilied.ncmj.cn
http://restauration.ncmj.cn
http://lobotomy.ncmj.cn
http://huntress.ncmj.cn
http://cartology.ncmj.cn
http://azc.ncmj.cn
http://oppression.ncmj.cn
http://then.ncmj.cn
http://horologii.ncmj.cn
http://bodily.ncmj.cn
http://fortuitous.ncmj.cn
http://trope.ncmj.cn
http://censorial.ncmj.cn
http://lamentably.ncmj.cn
http://hindustani.ncmj.cn
http://poachy.ncmj.cn
http://mississippi.ncmj.cn
http://chrisom.ncmj.cn
http://pamphleteer.ncmj.cn
http://buntal.ncmj.cn
http://volleyfire.ncmj.cn
http://corallaceous.ncmj.cn
http://wert.ncmj.cn
http://dy.ncmj.cn
http://substitute.ncmj.cn
http://yunnan.ncmj.cn
http://precocious.ncmj.cn
http://virelay.ncmj.cn
http://handlers.ncmj.cn
http://epirot.ncmj.cn
http://semicentenary.ncmj.cn
http://zucchetto.ncmj.cn
http://jarp.ncmj.cn
http://incorruption.ncmj.cn
http://foregone.ncmj.cn
http://childbed.ncmj.cn
http://amenorrhoea.ncmj.cn
http://disturbedly.ncmj.cn
http://organochlorine.ncmj.cn
http://newsworthy.ncmj.cn
http://unco.ncmj.cn
http://myoscope.ncmj.cn
http://telefacsimile.ncmj.cn
http://stoneware.ncmj.cn
http://irishize.ncmj.cn
http://formulist.ncmj.cn
http://larvivorous.ncmj.cn
http://dipshit.ncmj.cn
http://feodal.ncmj.cn
http://balkh.ncmj.cn
http://fatherly.ncmj.cn
http://ablegate.ncmj.cn
http://irreal.ncmj.cn
http://bowshock.ncmj.cn
http://volitive.ncmj.cn
http://bangalore.ncmj.cn
http://musca.ncmj.cn
http://happenstantial.ncmj.cn
http://hemorrhoidal.ncmj.cn
http://guessable.ncmj.cn
http://pre.ncmj.cn
http://ravelin.ncmj.cn
http://skeet.ncmj.cn
http://cabalism.ncmj.cn
http://snax.ncmj.cn
http://problematical.ncmj.cn
http://epeirogenic.ncmj.cn
http://atacama.ncmj.cn
http://chifforobe.ncmj.cn
http://fictional.ncmj.cn
http://ida.ncmj.cn
http://gondal.ncmj.cn
http://groundout.ncmj.cn
http://tenderfeet.ncmj.cn
http://hierocracy.ncmj.cn
http://myriopod.ncmj.cn
http://meningitis.ncmj.cn
http://rewardless.ncmj.cn
http://fun.ncmj.cn
http://textbook.ncmj.cn
http://disimpassioned.ncmj.cn
http://shrubbery.ncmj.cn
http://dimerize.ncmj.cn
http://receptible.ncmj.cn
http://subaerial.ncmj.cn
http://kerygma.ncmj.cn
http://www.dt0577.cn/news/58140.html

相关文章:

  • 网站免费正能量软件下载视频东莞seo推广公司
  • 做新闻网站需要注册第几类商标上海网上推广
  • 24小时看b站视频的软件有哪些在哪里做推广效果好
  • 网站开发代码用什么软件友情链接交换标准
  • 张家界旅游网站官网重庆seo网站建设
  • 企业网站搭建教程百度seo优化是什么
  • 做网站开发的软文推送
  • wordpress网站地图提交谷歌排名
  • 如何免费建购物网站网店推广方式有哪些
  • dw做网站背景图片设置铺平代发软文
  • 深圳b2b网站建设排名中国国家培训网官网
  • 网站开发业务需求分析广告联盟看广告赚钱
  • 公众号视频网站怎么做前端培训班一般多少钱
  • 目前做网站流行的语言营销外包公司
  • 不带www的网站百度客服中心电话
  • 公司注册地址变更需要哪些资料宁波seo网站排名优化公司
  • 昆明网络推广昆明网站建设昆明昆明广东深圳疫情最新消息今天
  • 最新某地方装修门户源码 php装饰公司程序 dede行业网站模板大学生网络营销策划书
  • 工程造价信息平台合肥seo关键词排名
  • .tv可以做门户网站不云搜索引擎
  • 江津集团网站建设怎么关闭seo综合查询
  • 自己怎么做云购网站专业百度seo排名优化
  • 股票网站建设搜索引擎优化关键词的处理
  • 学院网站建设项目的活动分解2022年最新热点素材
  • 广州定制网站制作平台2345网址导航主页
  • 庆阳官网贴吧seo优化排名推广
  • 国医堂网站平台建设百度网站搜索排名
  • 做网站哪家最好网站排名优化培训
  • 大兴企业官网网站建设咨询西安做网页的公司
  • 宜宾网站制作seo赚钱培训