当前位置: 首页 > news >正文

购物02网站竞价推广托管公司介绍

购物02网站,竞价推广托管公司介绍,健康类网站模板,网站的真实域名霍比特人小说爬取,使用 selenium 模块调用谷歌浏览器,无界面模式爬取小说网站信息,将数据按照每次2000字符在mysql中保存。 # https://www.shukuai9.com/b/324694/ # 导入需要的库 from selenium import webdriver # 导入Keys模块&#xff…

霍比特人小说爬取,使用 selenium 模块调用谷歌浏览器,无界面模式爬取小说网站信息,将数据按照每次2000字符在mysql中保存。
在这里插入图片描述

# https://www.shukuai9.com/b/324694/
# 导入需要的库
from selenium import webdriver
# 导入Keys模块,用于模拟键盘按键操作
from selenium.webdriver.common.keys import Keys
#数据库
import pymysql#获取文本,拆分为4000字每段
def text_sql(title,dimension,text):text = text.replace(chr(9),'').replace(chr(10),'').replace(chr(13),'')print(title,dimension,len(text),len(text)//2000)for i in range((len(text)//2000)+1):str_num = i*2000end_num = (i+1)*2000#print(str_num,end_num)#print(i,text[str_num:end_num])try:start = mysql_in(title,dimension,i,text[str_num:end_num])except Exception as e:print(e)start='异常'print(title,dimension,i,start)#数据库登录
def mysql_execute(in_sql, leixing):# 登录数据库conn = pymysql.connect(host='127.0.0.1', port=3306, user='szc_sql', password='szcNSP850219', database='szc_sql',charset='utf8')# # 登录数据库# dsn = "134.80.200.216/xxx"# try:#     conn = cx_Oracle.connect(user="zbweb", password="zibo_xxx", dsn=dsn, encoding="UTF-8")# except:#     time.sleep(10)#     conn = cx_Oracle.connect(user="zbweb", password="zibo_xxx", dsn=dsn, encoding="UTF-8")# 得到一个可以执行SQL语句的光标对象cursor = conn.cursor()# 数据库执行导入的语句if leixing == '数量':# 反馈数量count = cursor.execute(in_sql)elif leixing == '单条':# 反馈单条cursor.execute(in_sql)count = cursor.fetchone()[0]elif leixing == '多条':# 反馈多条cursor.execute(in_sql)count = cursor.fetchall()elif leixing == '编辑':count = cursor.execute(in_sql)conn.commit()# 关闭光标对象cursor.close()# 关闭数据库连接conn.close()# 反馈return countdef mysql_in(title,dimension,num,text):print(num,type(num))sql="delete from novel_text where title='%s' and dimension='%s' and num='%s' " % (title,dimension,str(num))mysql_execute(sql, '编辑')sql = "insert into novel_text (title,dimension,num,text) values('%s','%s','%s','%s') " % (title,dimension,str(num),text)print('sql',sql)mysql_execute(sql, '编辑')return '完成'# 创建Chrome浏览器对象
chrome_opt = webdriver.ChromeOptions()
# 开启无界面模式
chrome_opt.add_argument('--headless')
# 禁用gpu
chrome_opt.add_argument('--disable-gpu')
# 创建Chrome浏览器实例
driver = webdriver.Chrome(executable_path='./chromedriver.exe',options=chrome_opt)
# 打开网页
driver.get("https://www.shukuai9.com/b/324694/")
# 等待页面加载完成
driver.implicitly_wait(10)
# 获取搜索结果列表元素
search_results = driver.find_elements_by_css_selector("dd")
search_title = driver.find_elements_by_css_selector("h1")
print('search_title',search_title)for text in search_title:print('text',text.text)search_title_text = text.texthbt_key = {}
# 输出搜索结果标题和链接
for result in search_results:title = result.find_element_by_css_selector("a").textlink = result.find_element_by_css_selector("a").get_attribute("href")num = str(title).index('节')title_num = title[1:num]#print(title_num,biaoti, link)hbt_key[title_num]=[title,link]#print('hbt_key',hbt_key)#获取键值对个数
for i in range(len(hbt_key)):print(hbt_key[str(i+1)])title = hbt_key[str(i + 1)][0]link = hbt_key[str(i + 1)][1]# 打开网页driver.get(link)# 等待页面加载完成driver.implicitly_wait(10)# 获取搜索结果列表元素search_results = driver.find_element_by_xpath('//*[@id="content"]').text#print(search_results)# 输出搜索结果标题和链接search_text = ''for t in search_results:search_text += tprint(len(search_text),type(search_text))#文字留存text_sql(search_title_text,title,search_text)#break
http://www.dt0577.cn/news/48269.html

相关文章:

  • 企业网站建立会计培训班一般多少钱
  • 如何把自己的网站推广抖音热门搜索关键词
  • 网站留言板怎么做长沙靠谱seo优化
  • 烟台网站设计公司网络营销推广的要点
  • ps的logo设计制作成都百度提升优化
  • 电影怎么做bt种子下载网站百度seo竞价推广是什么
  • 什么叫高端网站定制seo建站公司
  • 做网站项目前怎么收集需求网站ip查询
  • 海口做网站公司收费球队排名世界
  • 淘宝客单页网站程序找推网
  • 杭州营销网站建设新河seo怎么做整站排名
  • 陕西省和城乡建设厅网站长沙网站推广seo
  • 珠海市网站建设公司百度客服24小时人工服务在线咨询
  • 赣州有店科技有限公司东莞seo顾问
  • 导航网站怎么做网络推广网站推广方法
  • 怎么利用源码做网站百度关键词如何优化
  • 外包公司拖欠工资找谁讨要网站自然排名优化
  • 腾讯网站建设专家百度权重优化软件
  • 一个公司网站备案站长工具app下载
  • opencart做的网站广东seo推广公司
  • 做网站怎么还用身份证百度帐号登录
  • 汕头企业网站推广方法数据网站
  • 怎么用pf做网站提高工作效率
  • 深圳网站开发培训seo软文是什么意思
  • 新站整站优化网络推广运营途径
  • 朝阳区社区建设网站百度热搜榜排名今日
  • vue做门户网站竞价推广开户
  • 惠阳网站优化sem模型
  • 网站建设的步骤目标规划网站有哪些平台
  • 广州专业网站制作哪家专业最近一周新闻热点回顾