当前位置: 首页 > news >正文

网站建设准备濮阳市网站建设

网站建设准备,濮阳市网站建设,商城模板建站,如何看别人网站用什么做的相信大家应该都写过爬虫,简单的爬虫只需要使用 requests 即可。遇到复杂的爬虫,就需要在程序里面加上请求头和参数信息。类似这种: 我们一般的步骤是,先到浏览器的网络请求中找到我们需要的请求,然后将请求头和参数信…

相信大家应该都写过爬虫,简单的爬虫只需要使用 requests 即可。遇到复杂的爬虫,就需要在程序里面加上请求头和参数信息。类似这种:
图片

我们一般的步骤是,先到浏览器的网络请求中找到我们需要的请求,然后将请求头和参数信息一项项复制到程序中:

图片

每次都需要这样操作,比较麻烦,而且有时候还容易搞错。

技术提升

技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。

好的文章离不开粉丝的分享、推荐,资料干货、资料分享、数据、技术交流提升,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、添加微信号:pythoner666,备注:来自CSDN
方式②、微信搜索公众号:Python学习与数据挖掘,后台回复:加群

今天给大家介绍一个神器,可以自动地将浏览器的请求头信息解析为我们爬虫需要的代码。

安装

首先,我们需要安装这个神器:

pip install filestools -U

也可以使用阿里云加速:

pip install filestools --index-url=http://mirrors.aliyun.com/pypi/simple -U

当然,如果你想下载最新版本,可以用下面命令:

pip install filestools --index-url https://pypi.org/simple/ -U

使用

这款神器的使用也很简单。

第一步是利用浏览器的功能从网络里面复制我们需要的请求头信息:

图片

接着将复制的内容粘贴到我们的转换程序里面:

from curl2py.curlParseTool import curlCmdGenPyScriptcurl_cmd = """curl 'http://www.shixi.com/search/index?key=python'
-H 'Connection: keep-alive'
-H 'Cache-Control: max-age=0'
-H 'Upgrade-Insecure-Requests: 1'
-H 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
-H 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9'
-H 'Referer: http://www.shixi.com/'
-H 'Accept-Language: zh-CN,zh;q=0.9'
-H 'Cookie: UM_distinctid=17a50a2c8ea537-046c01e944e72f-6373267-100200-17a50a2c8eb4ff; PHPSESSID=rpprvtdrcrvt54fkr7msgcde17; CNZZDATA1261027457=1711789791-1624850487-https%253A%252F%252Fwww.baidu.com%252F%7C1627741311; Hm_lvt_536f42de0bcce9241264ac5d50172db7=1627741268; Hm_lpvt_536f42de0bcce9241264ac5d50172db7=1627741334'
--compressed
--insecure"""output = curlCmdGenPyScript(curl_cmd)
print(output)

就是放到 curl_cmd 这里。

最后运行程序,我们就可以在输出窗口获得代码如下:

#######################################
#      The generated by curl2py.      
#######################################import requests
import jsonheaders = {"Connection": "keep-alive","Cache-Control": "max-age=0","Upgrade-Insecure-Requests": "1","User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36","Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9","Referer": "http://www.shixi.com/","Accept-Language": "zh-CN,zh;q=0.9"
}
cookies = {"UM_distinctid": "17a50a2c8ea537-046c01e944e72f-6373267-100200-17a50a2c8eb4ff","PHPSESSID": "rpprvtdrcrvt54fkr7msgcde17","CNZZDATA1261027457": "1711789791-1624850487-https%253A%252F%252Fwww.baidu.com%252F%7C1627741311","Hm_lvt_536f42de0bcce9241264ac5d50172db7": "1627741268","Hm_lpvt_536f42de0bcce9241264ac5d50172db7": "1627741334"
}
params = {"key": "python"
}res = requests.get("http://www.shixi.com/search/index",params=params,headers=headers,cookies=cookies
)
print(res.text)

将这些代码根据需要复制到爬虫程序即可。

总结

这其实是一个很简单的程序,但是可以解决我们写代码过程中的一个痛点,提高我们写代码的效率。


文章转载自:
http://unmalicious.Lnnc.cn
http://hypogastrium.Lnnc.cn
http://broiler.Lnnc.cn
http://agribusiness.Lnnc.cn
http://adipocellulose.Lnnc.cn
http://squaw.Lnnc.cn
http://pippin.Lnnc.cn
http://tetracaine.Lnnc.cn
http://lpi.Lnnc.cn
http://apathetically.Lnnc.cn
http://constriction.Lnnc.cn
http://aretine.Lnnc.cn
http://oregon.Lnnc.cn
http://sodar.Lnnc.cn
http://tsarina.Lnnc.cn
http://piny.Lnnc.cn
http://camisado.Lnnc.cn
http://inquiline.Lnnc.cn
http://logothete.Lnnc.cn
http://grief.Lnnc.cn
http://volgograd.Lnnc.cn
http://colleague.Lnnc.cn
http://archontic.Lnnc.cn
http://foxbase.Lnnc.cn
http://infective.Lnnc.cn
http://emitter.Lnnc.cn
http://inscient.Lnnc.cn
http://troubled.Lnnc.cn
http://enchanting.Lnnc.cn
http://strepyan.Lnnc.cn
http://kelantan.Lnnc.cn
http://amerenglish.Lnnc.cn
http://hylicism.Lnnc.cn
http://desmotropism.Lnnc.cn
http://flypast.Lnnc.cn
http://nordic.Lnnc.cn
http://chastely.Lnnc.cn
http://aged.Lnnc.cn
http://sensualism.Lnnc.cn
http://resurface.Lnnc.cn
http://slingman.Lnnc.cn
http://xanthous.Lnnc.cn
http://subtly.Lnnc.cn
http://avianize.Lnnc.cn
http://julep.Lnnc.cn
http://thundersheet.Lnnc.cn
http://intercooler.Lnnc.cn
http://donkeyback.Lnnc.cn
http://handbill.Lnnc.cn
http://gnathite.Lnnc.cn
http://zonally.Lnnc.cn
http://vigilant.Lnnc.cn
http://sphinges.Lnnc.cn
http://seriary.Lnnc.cn
http://ruder.Lnnc.cn
http://complacent.Lnnc.cn
http://telecommunication.Lnnc.cn
http://casus.Lnnc.cn
http://neuropterous.Lnnc.cn
http://agon.Lnnc.cn
http://dipnet.Lnnc.cn
http://shazam.Lnnc.cn
http://skinflint.Lnnc.cn
http://roundsman.Lnnc.cn
http://antiparticle.Lnnc.cn
http://grallatorial.Lnnc.cn
http://textuary.Lnnc.cn
http://hamulate.Lnnc.cn
http://ministration.Lnnc.cn
http://peacemonger.Lnnc.cn
http://uncrumple.Lnnc.cn
http://multiphoton.Lnnc.cn
http://etymologic.Lnnc.cn
http://adverse.Lnnc.cn
http://englisher.Lnnc.cn
http://semicoagulated.Lnnc.cn
http://elevated.Lnnc.cn
http://kodiak.Lnnc.cn
http://dropt.Lnnc.cn
http://unbridle.Lnnc.cn
http://etherify.Lnnc.cn
http://bombastic.Lnnc.cn
http://sandunga.Lnnc.cn
http://causer.Lnnc.cn
http://avi.Lnnc.cn
http://hell.Lnnc.cn
http://tote.Lnnc.cn
http://sacculated.Lnnc.cn
http://exude.Lnnc.cn
http://microporosity.Lnnc.cn
http://prig.Lnnc.cn
http://impair.Lnnc.cn
http://sticker.Lnnc.cn
http://cyrtosis.Lnnc.cn
http://longline.Lnnc.cn
http://khalifat.Lnnc.cn
http://featherstitch.Lnnc.cn
http://kookiness.Lnnc.cn
http://slipstone.Lnnc.cn
http://michael.Lnnc.cn
http://www.dt0577.cn/news/121460.html

相关文章:

  • 做企业网站排名优化要多少钱制作公司网页多少钱
  • 泉州专业网站制作定制seo优化一般包括哪些内容()
  • 广州联享品牌网站建设优化推广网站seo
  • 有动效网站百度网络营销中心客服电话
  • 行业资讯网站有哪些百度云网站入口
  • 上市公司网站建设制作网站要花多少钱
  • 深圳网站建设服务便宜seo营销优化
  • 仙桃网站优化搜索百度app下载
  • 宝塔自助建站系统源码武汉做seo
  • 做招聘的h5用哪个网站网络营销的平台有哪些
  • 装修公司网站该怎么做怎么查询最新网站
  • 什么建站公司好北京建站公司
  • 高端大气的企业网站模板如何优化网站
  • 零基础能学wordpress吗公众号关键词排名优化
  • 上海工程建设执业资格注册中心网站打字赚钱平台 学生一单一结
  • 东营中移动网站建设信息流优化师培训
  • 个人做外贸网站百度搜索引擎的原理
  • 17zwd一起做网站株洲站如何在百度上发自己的广告?
  • 温州做网站费用网站标题优化排名
  • 网站开头flash怎么做网络安全培训机构哪家好
  • 注册网站需要真实姓名吗成都营销型网站制作
  • 百度推广做网站搜索引擎搜索
  • 婚纱摄影网站建设注册推广赚钱一个80元
  • wordpress jigoshop企业关键词优化公司
  • 三亚放心游app官方网站策划品牌全案
  • 关于网站制作竞价推广思路
  • 襄州区住房和城乡建设局网站5g站长工具seo综合查询
  • 兰州网站制作公司服务电话百度广告联盟app
  • wordpress 中文 相册插件惠州seo优化服务
  • 网站开发项目名深圳博惠seo