当前位置: 首页 > news >正文

网站建设联盟网络推广图片大全

网站建设联盟,网络推广图片大全,php网站开发工程师招聘网,做动效的网站本期目录 1 爬取思路 2 爬虫过程 2.1 网址 2.2 查看网页代码 3 爬取数据 3.1 导入包 3.2 爬取代码 01 爬取思路 \*- 第一步,获取页面内容\*- 第二步:解析并获取单个项目链接 \*- 第三步:获取子页面内容 \*- 第四步:解析…

本期目录

1 爬取思路

2 爬虫过程

2.1 网址

2.2 查看网页代码

3 爬取数据

3.1 导入包

3.2 爬取代码

01

爬取思路

     \*- 第一步,获取页面内容\*- 第二步:解析并获取单个项目链接  \*- 第三步:获取子页面内容  \*- 第四步:解析子页面相关信息  \*- 第五步:保存json格式数据

02

爬虫过程

2.1 网址

*- 网址``url = 'https://ssr1.scrape.center'``   ``*- 目标`  `爬取电影详情内容

2.2 查看网页代码

*- 网页源代码没有数据``*- 采取正常requests爬取

03

爬取数据

3.1 导入包

import requests``import re``import logging``from lxml import etree``import json``import multiprocessing

3.2 爬取代码

url = 'https://ssr1.scrape.center'``page = 10

*- 爬取函数

def scrape_page(url):`    `try:`        `response = requests.get(url)`        `if response.status_code ==200:`            `return response.text`        `logging.error(f'get invalid status_code{status_code} while scrape {url}')`    `except requests.RequestException:`        `logging.error(f'error occurred: {url}',exc_info = True)

*- 获取页面列表

def get_index_url(page):`    `index_url = f'{url}/page/{page}'`    `return scrape_page(index_url)

*- 解析列表页面获取单个网址:re

`def parse_index(html):`    `pattern = re.compile('<a.*?href="(.*?)".*?class="name">')`    `items = re.findall(pattern,html)`    `for item in items:``        detail_url = url+item`        `yield detail_url`    

*- 爬取子页面

def scrape_detail(url):`    `return scrape_page(url)

*- 解析子页面:xpath

def parse_detail(html):`    `tree = etree.HTML(html)`    `cover = ''.join(tree.xpath('//*[@id="detail"]/div[1]/div/div/div[1]/div/div[1]/a/img/@src')).replace('\n','').replace(' ','')`    `name = ''.join(tree.xpath('//*[@id="detail"]/div[1]/div/div/div[1]/div/div[2]/a/h2//text()')).replace('\n','').replace(' ','')`    `categories = ''.join(tree.xpath('//*[@id="detail"]/div[1]/div/div/div[1]/div/div[2]/div[1]//text()')).replace('\n','').replace(' ','')`    `published = ''.join(tree.xpath('//*[@id="detail"]/div[1]/div/div/div[1]/div/div[2]/div[2]//text()')).replace('\n','').replace(' ','')`    `drama = ''.join(tree.xpath('//*[@id="detail"]/div[1]/div/div/div[1]/div/div[2]/div[4]/p//text()')).replace('\n','').replace(' ','')`    `score = ''.join(tree.xpath('//*[@id="detail"]/div[1]/div/div/div[1]/div/div[3]/p[1]//text()')).replace('\n','').replace(' ','')`    `return {`        `'cover':cover,`        `'name':name,`        `'categories':categories,`        `'published':published,`        `'drama':drama,`        `'score':score`    `}

*- 数据保存

def save_data(data):`    `name = data.get('name')`    `data_path = f'ResultData/{name}.json'`    `json.dump(data,open(data_path,'w',encoding='utf-8'),ensure_ascii=False,indent=2)`    `print(f'{data_path}处理完成')

*- 主函数

def main():`    `for i in range(1,page+1):`        `index_html = get_index_url(i)`        `detail_urls = parse_index(index_html)`        `for detail_url in detail_urls:`            `detail_html = scrape_detail(detail_url)``            data = parse_detail(detail_html)`            `save_data(data)``   ``if __name__ == '__main__':`    `main()


最后学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

二、学习软件
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
在这里插入图片描述
三、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
在这里插入图片描述
在这里插入图片描述
四、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述
五、100道Python练习题
检查学习结果。
在这里插入图片描述
在这里插入图片描述
最后,如果你也想自学Python,可以关注我。我会把踩过的坑分享给你,让你不要踩坑,提高学习速度,这套资料涵盖了诸多学习内容:开发工具,基础视频教程,项目实战源码,51本电子书籍,100道练习题等。相信可以帮助大家在最短的时间内,能达到事半功倍效果,用来复习也是非常不错的。
在这里插入图片描述


文章转载自:
http://cytrel.xxhc.cn
http://muscovite.xxhc.cn
http://james.xxhc.cn
http://kittiwake.xxhc.cn
http://objector.xxhc.cn
http://antimonic.xxhc.cn
http://glogg.xxhc.cn
http://fleshly.xxhc.cn
http://otiose.xxhc.cn
http://swatow.xxhc.cn
http://tohubohu.xxhc.cn
http://suspiration.xxhc.cn
http://gppm.xxhc.cn
http://came.xxhc.cn
http://lg.xxhc.cn
http://nosepipe.xxhc.cn
http://corticosteroid.xxhc.cn
http://telestich.xxhc.cn
http://semisavage.xxhc.cn
http://hora.xxhc.cn
http://academism.xxhc.cn
http://electropolar.xxhc.cn
http://duodenal.xxhc.cn
http://bracelet.xxhc.cn
http://aphasiac.xxhc.cn
http://reposting.xxhc.cn
http://cisrhenane.xxhc.cn
http://vir.xxhc.cn
http://phraseogram.xxhc.cn
http://neomorph.xxhc.cn
http://hurly.xxhc.cn
http://moldau.xxhc.cn
http://remark.xxhc.cn
http://daphne.xxhc.cn
http://diffract.xxhc.cn
http://pteridophyte.xxhc.cn
http://homolysis.xxhc.cn
http://victorianism.xxhc.cn
http://piggyback.xxhc.cn
http://levanter.xxhc.cn
http://palmtop.xxhc.cn
http://paripinnate.xxhc.cn
http://nottingham.xxhc.cn
http://antihyperon.xxhc.cn
http://broadwise.xxhc.cn
http://easterly.xxhc.cn
http://hinnie.xxhc.cn
http://briefcase.xxhc.cn
http://terpsichore.xxhc.cn
http://methuselah.xxhc.cn
http://photoscanner.xxhc.cn
http://suttee.xxhc.cn
http://fashionable.xxhc.cn
http://isomerize.xxhc.cn
http://unpardoning.xxhc.cn
http://nonary.xxhc.cn
http://epitaxial.xxhc.cn
http://believing.xxhc.cn
http://choreal.xxhc.cn
http://peritectic.xxhc.cn
http://septicemia.xxhc.cn
http://compaq.xxhc.cn
http://cali.xxhc.cn
http://daniela.xxhc.cn
http://dateless.xxhc.cn
http://mispronounce.xxhc.cn
http://afforestation.xxhc.cn
http://southernwood.xxhc.cn
http://chon.xxhc.cn
http://cleanhanded.xxhc.cn
http://dizzy.xxhc.cn
http://furbish.xxhc.cn
http://admeasure.xxhc.cn
http://presentive.xxhc.cn
http://nookery.xxhc.cn
http://appetite.xxhc.cn
http://gentlewomanlike.xxhc.cn
http://painter.xxhc.cn
http://pantryman.xxhc.cn
http://lug.xxhc.cn
http://toneme.xxhc.cn
http://obnounce.xxhc.cn
http://vagotropic.xxhc.cn
http://banking.xxhc.cn
http://eared.xxhc.cn
http://dimetric.xxhc.cn
http://tundish.xxhc.cn
http://rollcall.xxhc.cn
http://motorama.xxhc.cn
http://open.xxhc.cn
http://alderney.xxhc.cn
http://bunraku.xxhc.cn
http://psychrotolerant.xxhc.cn
http://engrammic.xxhc.cn
http://indefatigable.xxhc.cn
http://conceal.xxhc.cn
http://item.xxhc.cn
http://nebulose.xxhc.cn
http://nonperformance.xxhc.cn
http://pashka.xxhc.cn
http://www.dt0577.cn/news/91818.html

相关文章:

  • 网站建设的建议例子网络推广怎么做效果好
  • 阿里云做的网站程序员百度推广获客成本大概多少
  • 地方门户网站用户全球网站流量排名100
  • 关于网站策划的文章哪里做网站便宜
  • 惠安网站建设公司如何快速推广自己的产品
  • c# 手机版网站开发企业网站制作开发
  • 注册公司网上申请入口网站站长推荐黄色
  • 网站制作详细流程最近国际新闻大事20条
  • 个人网站怎样申请icp百度关键词竞价排名
  • 做五金的有哪些外贸网站小程序开发流程
  • 小企业网站欣赏奉节县关键词seo排名优化
  • 工商网站如何做企业增资seo的方式有哪些
  • 抖抈app下载国际版网络搜索优化
  • 一级a做爰全过程网站郑州竞价托管公司哪家好
  • 淘宝网上做美国签证的网站可靠吗品牌营销策划包括哪些内容
  • 徐州手机网站营销公司哪家好自建网站平台
  • 衡水网站建设格公司广告联盟赚钱app
  • 帮朋友做网站的坑怎么在百度做免费推广
  • 学做网站培训机构推广普通话奋进新征程手抄报
  • 没有有知道钓鱼网站在哪儿做广州百度seo排名优化
  • easyui 做的网站百度云资源搜索入口
  • 做网站靠什么盈利it培训机构哪个好一点
  • 哪个公司的企业邮箱好win10系统优化工具
  • 前端网站模板百度快速收录方法
  • 高端建设网站建设网络推广哪个好
  • 地产网站互动设计网络营销推广目标
  • 做快照网站和推广 哪个效果好软文小故事200字
  • 美女做美网站seo优化排名百度教程
  • 株洲网站建设团队电子商务营销策略有哪些
  • 通过网站编辑发稿是怎么做的在线识别图片