当前位置: 首页 > news >正文

营销型网站的建设步骤宁波正规seo推广

营销型网站的建设步骤,宁波正规seo推广,好女人生活常识网站建设,wordpress下载失败总结一下dataframe读取数据库,以及整理数据的过程。分为三个部分:数据读取,数据整理以及数据写入。 1、数据读取 从csv读取读取数据,使用pandas读的read_csv函数,传入两个参数,分别是path文件路径&#x…

总结一下dataframe读取数据库,以及整理数据的过程。分为三个部分:数据读取,数据整理以及数据写入。

1、数据读取

从csv读取读取数据,使用pandas读的read_csv函数,传入两个参数,分别是path文件路径,usecols读取的列表,返回的是dataframe格式。

import pandas as pddef csv_read(path, usecols):return pd.read_csv(path, usecols=usecols, encoding="gbk")

2、数据整理

我需要做清除空值,替换固定值,匹配关键词等操作。

1)清除空值很简单,按列替换空值,效率挺快。

df.fillna(0, inplace=True)

2)替换固定值很简单, 按列替换空值,效率挺快

df["s_serialno"] = df["s_serialno"].str.replace("'", "")

3)匹配关键词,由于多个关键词对多个内容,使用第一点的按列匹配就不行,我使用遍历方法

itertuples,其他的遍历方法可参见:Python - pandas DataFrame数据的合并与拼接(merge、join、concat)_pd.merge合并后顺序-CSDN博客

 一开始我是匹配到不到关键词,就直接删除掉,测试小量数据还行,但面对几十万数据,频繁地让Dataframe删除数据,效率很低。于是作了如下改写,先将需要删作的idx保存下来,再一并删除。

dropindex = []
keyword= 'XXXXX'for obj in df.itertuples():idx = getattr(obj, "Index")if getattr(obj, "cnt") not in keyword.to_string():dropindex.append(idx)df.drop(dropindex, inplace=True)

3、数据写入

使用dataframe.to_sql方法,开始的写法,为保证数据唯一性,避免主键重复出错,使用try except方法 ,一条一条录入,若主键重复直接pass即可。小量数据测试还行,面对几十万数据,单条录入,数据库与程序的I/O效率不高,数据录入缓慢。

from sqlalchemy import create_enginedef mysql_engine():return create_engine("mysql+pymysql://root:10086@192.168.1.1:3306/order")def write_sql(rows):# 使用逐条插入,而不用批量插入,用try-except判断避免重复插入的异常for i in range(len(df)):try:df.iloc[i : i + 1].to_sql(name=table_name, con=mysql_engine(), if_exists="append", index=False)except Exception as e:# print(e)pass

于是我改用另一种方法:

使用原生sql语句,批量导入数据,使用ON DUPLICATE key UPDATE 避免主键重复出错。

import pymysqldef getConn():return pymysql.connect(host="192.168.1.1", user="root", password="123456", database="order")def write_sql(rows):sql = ("insert into order.TABLE(""s_A,""s_B"") values(%s,%s)""ON DUPLICATE key UPDATE s_B=values(s_B)")conn = getConn()cur = conn.cursor()cur.executemany(sql, rows)conn.commit()cur.close()conn.close()

http://www.dt0577.cn/news/15261.html

相关文章:

  • 网站建设和编程的区别app推广怎么做
  • fqapps com网站怎么做在哪里可以发布自己的广告
  • 网站怎么做图片动态图片不显示不出来seo排名赚app最新版本
  • flash网站引导页属于b2b的网站有哪些
  • 网站建设销售客户疑问关键词优化的价格查询
  • 南山网站设计方案搜索引擎提交入口网址
  • 中国做的比较好的电商网站有哪些百度竞价排名什么意思
  • 做论坛网站的元素seo案例分析
  • 凡客建站网宁波seo行者seo09
  • 佛山企业网站制作yande搜索引擎官网入口
  • java网站开发计划表推广引流方法有哪些推广方法
  • 网站移动窗口代码搜索词排行榜
  • 广州网站建设菲利宾百度知道官网
  • 搭建什么网站好玩seo网上培训课程
  • 做易购网站如何推广网站运营
  • 咸阳企业网站设计开发制作优化大师使用方法
  • 室内设计网站都有哪些平台网站功能优化
  • 网站制作工具有哪些山东疫情最新消息
  • 荣耀官网首页官方网站seo方案撰写
  • 网站建设专家证书学开网店哪个培训机构好正规
  • 珠海响应式网站建设衡阳seo优化首选
  • 做网站阿里云记录值怎么填徐州seo代理计费
  • 嘉兴企业网站模板建站西地那非片多少钱一盒
  • 3d网站建设制作网络营销名词解释
  • 深圳市福田建设股份有限公司网站北大青鸟软件开发培训学费多少
  • 网站图标用代码代替软文推广文章
  • 淘宝联盟链接的网站怎么做移动慧生活app下载
  • 深圳网站建设 设计贝尔保定seo推广
  • 便宜做网站的公司怎么优化自己网站的关键词
  • 网站建设的发展历程站长工具网站排名