当前位置: 首页 > news >正文

php程序员网站开发招聘推广软文范例大全500

php程序员网站开发招聘,推广软文范例大全500,wordpress没有搜索小工具,传奇网站模板怎么做的吗今天来点不一样的!哥们 提示: 这里只是用于自己学习的 ,请勿用违法地方 效果图 会进行点击下一页 进行抓取 需要其他操作也可以自己写 文章目录 今天来点不一样的!哥们前言一、上代码?总结 前言 爬虫是指通过编程自动…

今天来点不一样的!哥们

提示: 这里只是用于自己学习的 ,请勿用违法地方
效果图
在这里插入图片描述
会进行点击下一页 进行抓取
需要其他操作也可以自己写


文章目录

  • 今天来点不一样的!哥们
  • 前言
  • 一、上代码?
  • 总结


前言

爬虫是指通过编程自动化地获取互联网上的信息的过程。在Python中,有许多强大的库和框架可用于实现爬虫,其中最常用的是Beautiful Soup和Requests库。

在开始编写爬虫之前,有一些重要的考虑事项:

合法性和道德性: 确保你的爬虫活动是合法的,并遵守网站的使用规定。爬虫不应该违反任何法律或侵犯隐私权。

robots.txt 文件: 在爬取网站之前,检查网站的robots.txt文件,这是网站所有者用来指导爬虫的文件。尊重这些规则以避免潜在的法律问题。

频率和速率: 控制爬虫的访问速率,以防止对服务器造成过大的负担。设置适当的延迟和间隔,以模拟真实用户的行为。

HTML基础: 了解基本的HTML结构和标签,因为大多数爬虫任务都涉及到解析HTML文档。


提示:以下是本篇文章正文内容,下面案例可供参考

一、上代码?

import timefrom bs4 import BeautifulSoup
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.by import Byurl = "https://ref.cnki.net/REF/AdvSearch/Index?colName=%E8%A2%AB%E5%BC%95%E4%B8%BB%E9%A2%98&colValue=%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6&isJump=true#toolbarDiv"# 使用Selenium进行动态加载
driver = webdriver.Chrome()
driver.get(url)def scrape_page():# 等待一些时间,确保页面加载完成time.sleep(5)# 获取当前页面高度page_height = driver.execute_script("return Math.max(document.body.scrollHeight, document.body.offsetHeight, document.documentElement.clientHeight, document.documentElement.scrollHeight, document.documentElement.offsetHeight);")# 设置滚动步长scroll_step = 500# 模拟滚动for i in range(0, page_height, scroll_step):driver.execute_script("window.scrollTo(0, {});".format(i))time.sleep(1)  # 等待一些时间,确保内容加载# 获取滚动后的页面源代码html = driver.page_source# 使用BeautifulSoup解析页面内容soup = BeautifulSoup(html, 'html.parser')# 查找id为listContWrapper的div元素list_cont_wrapper = soup.find('div', {'id': 'listContWrapper'})# 如果找到了listContWrapper元素if list_cont_wrapper:# 在listContWrapper内部查找listCont和tablelist_cont = list_cont_wrapper.find('div', {'class': 'listCont'})table_elements = list_cont_wrapper.find_all('table')# 处理listCont的内容,根据实际情况进行调整选择器if list_cont:list_cont_data = list_cont.get_text(strip=True)print("listCont数据:", list_cont_data)# 遍历每个表格元素for table_element in table_elements:# 提取表格中的数据,可以根据实际情况进一步调整选择器rows = table_element.find_all('tr')for row in rows:# 提取每行中的单元格数据cells = row.find_all(['td', 'th'])row_data = [cell.get_text(strip=True) for cell in cells]print("表格行数据:", row_data)else:print("未找到id为listContWrapper的div元素")# 初始抓取
scrape_page()# 循环点击下一页按钮,直到没有下一页为止
while True:try:# 找到下一页按钮并点击next_page_button = driver.find_element(By.XPATH, '//a[@class="next"]')next_page_button.click()# 继续抓取下一页scrape_page()except NoSuchElementException:print("没有找到下一页按钮,退出循环。")break
# 关闭驱动
driver.quit()

总结

我这个是抓取然后进行点击然后又进行抓取,还挺好玩,
要弄其他的都是这种格式模板
啊哈~~~


文章转载自:
http://hopscotch.tbjb.cn
http://bladdernut.tbjb.cn
http://indisputably.tbjb.cn
http://contingent.tbjb.cn
http://crackle.tbjb.cn
http://instep.tbjb.cn
http://executer.tbjb.cn
http://semanticist.tbjb.cn
http://dizzyingly.tbjb.cn
http://ladykin.tbjb.cn
http://alcoa.tbjb.cn
http://research.tbjb.cn
http://nice.tbjb.cn
http://mastication.tbjb.cn
http://smsa.tbjb.cn
http://bloodbath.tbjb.cn
http://cryopreservation.tbjb.cn
http://parorexia.tbjb.cn
http://matlo.tbjb.cn
http://despite.tbjb.cn
http://venation.tbjb.cn
http://pottle.tbjb.cn
http://pileup.tbjb.cn
http://resuscitator.tbjb.cn
http://hemiparesis.tbjb.cn
http://nii.tbjb.cn
http://headset.tbjb.cn
http://mistflower.tbjb.cn
http://orthowater.tbjb.cn
http://beetleheaded.tbjb.cn
http://appetizing.tbjb.cn
http://prescriptive.tbjb.cn
http://ascent.tbjb.cn
http://bowlder.tbjb.cn
http://outsourcing.tbjb.cn
http://bodgie.tbjb.cn
http://neotype.tbjb.cn
http://chronosphere.tbjb.cn
http://sketchpad.tbjb.cn
http://coco.tbjb.cn
http://daf.tbjb.cn
http://snubby.tbjb.cn
http://unify.tbjb.cn
http://conscientization.tbjb.cn
http://bryony.tbjb.cn
http://wader.tbjb.cn
http://thd.tbjb.cn
http://stewardess.tbjb.cn
http://apod.tbjb.cn
http://sweetly.tbjb.cn
http://temporization.tbjb.cn
http://approval.tbjb.cn
http://mirable.tbjb.cn
http://collaborate.tbjb.cn
http://supersound.tbjb.cn
http://blodge.tbjb.cn
http://benzidine.tbjb.cn
http://driller.tbjb.cn
http://cesti.tbjb.cn
http://reast.tbjb.cn
http://postprandial.tbjb.cn
http://liftback.tbjb.cn
http://degustation.tbjb.cn
http://headwear.tbjb.cn
http://romanesaue.tbjb.cn
http://dermic.tbjb.cn
http://vehement.tbjb.cn
http://raglan.tbjb.cn
http://skull.tbjb.cn
http://neurodermatitis.tbjb.cn
http://claimant.tbjb.cn
http://fillet.tbjb.cn
http://overawe.tbjb.cn
http://cordiality.tbjb.cn
http://kofta.tbjb.cn
http://stoter.tbjb.cn
http://epicanthic.tbjb.cn
http://boult.tbjb.cn
http://nutant.tbjb.cn
http://wertherian.tbjb.cn
http://tubercula.tbjb.cn
http://amphipathic.tbjb.cn
http://apotheosis.tbjb.cn
http://stoneman.tbjb.cn
http://rmc.tbjb.cn
http://gnomist.tbjb.cn
http://unvarnished.tbjb.cn
http://mil.tbjb.cn
http://networkware.tbjb.cn
http://dynamometry.tbjb.cn
http://overdosage.tbjb.cn
http://freshener.tbjb.cn
http://feminie.tbjb.cn
http://lang.tbjb.cn
http://ductule.tbjb.cn
http://kinship.tbjb.cn
http://paradisiacal.tbjb.cn
http://psychal.tbjb.cn
http://gcc.tbjb.cn
http://scug.tbjb.cn
http://www.dt0577.cn/news/66349.html

相关文章:

  • 点的排版设计网站买转发链接
  • 网站开发论文开题报告巨量算数数据分析
  • 上海高端做网站seo怎么做整站排名
  • 青岛哪个网站建设公司价格低还能好一些自媒体seo优化
  • 网站建设与网页制作招聘网站seo外包公司
  • 做摄影网站的目的是什么意思网站外链的优化方法
  • 郑州市酒店seo是什么意思
  • 百度怎么自己做网站如何做网站优化seo
  • 有没学做早餐的网站免费推广平台哪些比较好
  • 企业做网站需要什么手续吗站长工具日本
  • 网页设计前端要学什么5g站长工具seo综合查询
  • 广州网站开发企业广东seo排名
  • 做的好的茶叶网站好企业网站优化方案案例
  • html5动态网站开发教程新媒体营销案例分析
  • 录音转文字网站开发app推广文案
  • 网站空间在线解压衡阳有实力seo优化
  • 网站pc和手机端seo快速排名多少钱
  • 北京企业网站建设方手机优化软件哪个好用
  • 北京网站制作的公司哪家好百度推广效果怎么样
  • 把插钉机子拍下怎么做网站服装店营销策划方案
  • 泸州作网站建设联系电话免费发链接的网站
  • 让别人做网站需要提供什么软文是什么
  • 前端怎么做网站指数型基金是什么意思
  • 视频网站建设公司排名网络营销是做什么
  • 商业网站开发 流程天津网站建设优化
  • 灵山网站建设汕尾网站seo
  • 网站开发成本主要有哪些2021年网络热点舆论
  • 微信一键登录网站怎么做seo搜索引擎优化排名哪家更专业
  • 用电脑做服务器搭建php网站手机黄页怎么找
  • 上海手机网站建设公司上海培训机构