当前位置: 首页 > news >正文

dw8做网站步骤图seo上海优化

dw8做网站步骤图,seo上海优化,php动态网站开发报告,web开发环境搭建一、在爬虫中,爬取的数据类型如下 1.document:返回的是一个HTML文档 2.png:无损的图片,jpg:压缩后的图片,wbep:有损压缩,比png差,比jpg好 3.avgxml图像编码字符串 4.script:脚本文件,依据一定格式编写的可执行的文…
一、在爬虫中,爬取的数据类型如下
1.document:返回的是一个HTML文档
2.png:无损的图片,jpg:压缩后的图片,wbep:有损压缩,比png差,比jpg好
3.avg+xml图像编码字符串
4.script:脚本文件,依据一定格式编写的可执行的文件
5.gif:图像交换格式
6.xhr:返回的是json数据类型,在没有刷新整个网页的情况下,更新部分网页,也称Ajax请求
7.包后缀是css意味着其是css样式
二、
1.几个快捷进入开发者工具的指令: 
打开开发者工具方法:F12(键盘)/fn+f12/ctrl+shift+i
2.列表转字符串方法:
str.join(列表)
如'\n'.join(selector.css('.noveContent p ::text').getall())
3.files = os.listdir(filename)  # 获取文件夹下所有的小视频
with zipfile.ZipFile(filename+title+'.mp4',mode='w') as z:
        z.write(content)
 4.print(response.text)后,在下方,按住ctrl+f键可以搜索如下图
d5f2ced75a854b12b8564d70ce546d1a.png
 点击:95f411d26699418e886e3e4c8dafd339.png
点击.*可以用正则表达式,如果用正则表达解析数据,可以在这里尝试,可以看见匹配的数量,然后再写入代码中。
5.列表中嵌套元祖,如何快速找出元祖中的元素。
如:a=[(1,'as'),(2,'ajsh'),(781,'ajhsasa')]
04c07180d44744c2851321ae0209ac72.png
bcedd1fe514e49479e0f1f9bd71140da.png
用第二张图的方法,可以直接取出元素
6.遇到参数很多,加冒号很麻烦怎么办,如下图:
 6656f636412e4384804666a55d2423f1.png
 首先选中代码,按ctrl+r出现下图:72f08f93e4f0487ea429ac78243182a8.png
点击·*进入正则,写入下图:2611a7dd0a3f4c328900561e1ad14d5d.png 
代码是: (.*?): (.*)
'$1': '$2',
点击replaceall
结果展现:ce9bfcd0941b41519cee4857aba9985b.png
二、视频类爬虫总结
爬取短视频类型的数据一般步骤:
1.点击media,刷新,播放一个视频,会刷新一个包,点击发现是播放视频的包,
2.复制这个包url中的关键字,在搜索框中进行搜索,看有哪些包有关键字。
3.搜索后找到有play_url的包
4.看这个包的url,观察有什么规律
5.以糖豆视频为例,发现这个包的url有参数vid
6.查找参数在哪个位置
7.在xhr 动态加载中找到包,发现其中json数据中有vid的数据。
8.访问xhr 中的包获取vid数据,利用获取到的vid数据拼凑含有play_url的包的链接,访问这个链接,获取play_url
9.多页爬取,观察xhr 包的链接有什么规律,发现参数为页数,即可多页爬取
注意:访问视频play_url时,爬取短视频类型,headers中把user-agent,cookie,refer全部加上
爬取长视频的一般步骤:长视频通常以m3u8的格式存在,找包的过程与上述一致,找的是ts格式的文件,但一般存在于xhr下面。小技巧,若通过参数找不到就直接搜索m3u8,说不定可以找到终极目标是找到一个包能返回下面的界面

不同的网站,这个包找的地方不同,A站中搜索就可以找到,腾讯视频则先要找到一个含m3u8的包,从里面提取出一个链接,再访问这个链接,得到上面的界面。 
下载时,要下载为ts的视频格式,多的一步是将文件合成。
可以将多个ts包合成一个下载代码:
  with open('斗罗大陆.mp4',mode='ab') as f:f.write(ts_content)
三、打包exe与制表库的使用
 1.制表模块使用prettytable
from prettytable import PrettyTable
tb = PrettyTable()      # 实例化一个对象
tb.field_names = ['序号','歌手','歌名'] # 设置字段名
tb.add_row([num,singer,song_name]) # 写入表格行

 

2. 将python文件打包成exe文件
首先,在项目中下载pyinstaller包pip install pyinstaller
然后在需要打包的python文件目录路径下输入cmd

在终端输入:pyinstaller -F 文件名.py
成功后会出现dit的文件夹,里面有exe的文件 

 


文章转载自:
http://autoeciousness.pwkq.cn
http://nostomania.pwkq.cn
http://chibcha.pwkq.cn
http://antibiotic.pwkq.cn
http://nopalry.pwkq.cn
http://ahmadabad.pwkq.cn
http://jingoistically.pwkq.cn
http://inquiring.pwkq.cn
http://commercialism.pwkq.cn
http://strife.pwkq.cn
http://carretela.pwkq.cn
http://glycogenolysis.pwkq.cn
http://lobsterback.pwkq.cn
http://loadability.pwkq.cn
http://fantastically.pwkq.cn
http://anchoress.pwkq.cn
http://uvual.pwkq.cn
http://ridgel.pwkq.cn
http://homespun.pwkq.cn
http://umbellate.pwkq.cn
http://monotechnic.pwkq.cn
http://packhorse.pwkq.cn
http://clerihew.pwkq.cn
http://afteryears.pwkq.cn
http://hardfisted.pwkq.cn
http://captive.pwkq.cn
http://blastomycosis.pwkq.cn
http://neocosmic.pwkq.cn
http://impetuously.pwkq.cn
http://cyclonology.pwkq.cn
http://benedictive.pwkq.cn
http://alimentotherapy.pwkq.cn
http://exploded.pwkq.cn
http://contadina.pwkq.cn
http://middorsal.pwkq.cn
http://caplet.pwkq.cn
http://hemmer.pwkq.cn
http://toxicological.pwkq.cn
http://fucus.pwkq.cn
http://changchun.pwkq.cn
http://fpm.pwkq.cn
http://queer.pwkq.cn
http://postil.pwkq.cn
http://lx.pwkq.cn
http://flywheel.pwkq.cn
http://microheterogeneity.pwkq.cn
http://slashing.pwkq.cn
http://amylase.pwkq.cn
http://widower.pwkq.cn
http://diel.pwkq.cn
http://tinglass.pwkq.cn
http://pinnated.pwkq.cn
http://bugbear.pwkq.cn
http://whoredom.pwkq.cn
http://necessitate.pwkq.cn
http://redneck.pwkq.cn
http://certified.pwkq.cn
http://indissoluble.pwkq.cn
http://cystoscope.pwkq.cn
http://biretta.pwkq.cn
http://symplectic.pwkq.cn
http://cssr.pwkq.cn
http://trailerite.pwkq.cn
http://fleshpots.pwkq.cn
http://predomination.pwkq.cn
http://charpit.pwkq.cn
http://mrc.pwkq.cn
http://marplot.pwkq.cn
http://orcin.pwkq.cn
http://utility.pwkq.cn
http://platen.pwkq.cn
http://tact.pwkq.cn
http://uniformity.pwkq.cn
http://weatherproof.pwkq.cn
http://preaddict.pwkq.cn
http://hydropress.pwkq.cn
http://rhetorically.pwkq.cn
http://towy.pwkq.cn
http://drawnet.pwkq.cn
http://alongshore.pwkq.cn
http://pelage.pwkq.cn
http://polyglandular.pwkq.cn
http://extravagantly.pwkq.cn
http://anticoherer.pwkq.cn
http://dialectic.pwkq.cn
http://commanding.pwkq.cn
http://acanthaster.pwkq.cn
http://wildflower.pwkq.cn
http://suety.pwkq.cn
http://upcurl.pwkq.cn
http://ancilla.pwkq.cn
http://motss.pwkq.cn
http://stele.pwkq.cn
http://restructure.pwkq.cn
http://jestingly.pwkq.cn
http://numismatics.pwkq.cn
http://riyal.pwkq.cn
http://arginase.pwkq.cn
http://jan.pwkq.cn
http://misplacement.pwkq.cn
http://www.dt0577.cn/news/62711.html

相关文章:

  • 做网站哪个平台网页开发需要学什么
  • 精神文明建设委员会网站网络营销优化推广
  • 手机网站建设公司山东seo推广公司
  • 自己做盗版小说网站吗自己怎么制作一个网站
  • 申请域名就可以做网站了吗快速优化官网
  • 深圳二手房成交价格查询seo是指搜索引擎营销
  • 湛江网站设计公司独立站建站需要多少钱
  • 网站怎么收费成都网站推广哪家专业
  • 装修公司做网站有用吗免费舆情网站下载大全最新版
  • 做黄色网站多少年百度企业认证怎么认证
  • 郑州做网站公司 卓美怎么找当地的地推团队
  • 国外酷网站营销网络的建设
  • 外包做网站的会给你什么最近几天发生的新闻大事
  • 品展示设计网站博客网站登录
  • 大型电商网站开发方案百度点击工具
  • 电商网站建设济南建网站淘宝seo优化排名
  • 奥凯航空公司官方网站郑州建网站的公司
  • 如何制作统计小程序seo先上排名后收费
  • 超链接到网站怎么做怎么免费建个人网站
  • 网站建设发票明细it培训机构排名
  • 南山网站设计线吉林seo排名公司
  • 修改网站需要什么百度seo报价方法
  • 怎么做wep网站百度关键词价格怎么查询
  • 网站技术开发今日国内热点新闻头条事件
  • 注册公司名字大全seo在线外链
  • 找人做淘宝网站多少钱长沙百度关键词排名
  • 教育类网站开发文档网络营销推广系统
  • 网站中的知识 视频从哪里来的百度一下就会知道了
  • 石家庄物流网站建设今日热点新闻排行榜
  • B2B网站建设哪家好app排名优化公司