当前位置: 首页 > news >正文

苏州网站维护安徽seo网络优化师

苏州网站维护,安徽seo网络优化师,搜索关键词排名一般按照什么收费,电脑网站设计公司目录 前言思路与核心代码优缺点分析 前言 dataframe是用python做数据分析最场景的数据结构了,如何将dataframe数据快速写入到clickhouse数据库呢?这里介绍几种方法,各有优劣势,可以结合自己的使用场景挑用。 思路与核心代码 假…

目录

  • 前言
  • 思路与核心代码
  • 优缺点分析

前言

dataframe是用python做数据分析最场景的数据结构了,如何将dataframe数据快速写入到clickhouse数据库呢?这里介绍几种方法,各有优劣势,可以结合自己的使用场景挑用。

思路与核心代码

假设df是一个dataframe数据结构,一共有5个列。

  • to_records一条一条插入
df = pd.Dataframe()for x in df.to_records(index = False): sql = "INSERT INTO database.table_name(col1,col2,col3,col4,col5)VALUES"+str(tuple(x))# print(sql)client.execute(sql)

这种方法将dataframe里面每一个看车一个record记录,一条记录一条记录插入clickhouse数据表,不容易出岔子,但是一旦数据量很大,就会要很长时间;

  • 整个dataframe插入
df = pd.Dataframe()insert_query = 'INSERT INTO  database.table_name(col1,col2,col3,col4,col5)VALUES'  
values_query = ','.join([tuple(df.iloc[i]) for i in range(len(df))])  
insert_query += f' ({",".join([f"({col}, {val})" for col, val in zip(df.columns, values_query)])})'  
cursor = conn.cursor()  
cursor.execute(insert_query)

这种方法先利用values_query变量将每一行的数据转换为字符串形式,然后,使用INSERT语句将通过将整个DataFrame一次性插入ClickHouse中,避免了频繁的网络通信,从而提高了性能。但是需要注意的是,这种方法只适用于小型数据集。其实,也可以仿MySQL那样用to_sql的方法一次性塞入表里面

df = pd.Dataframe()df.to_sql('database.table_name', conn, if_exists='append', index=False) 
  • parallel插入
insert_query = 'INSERT INTO my_table (name, age, salary) VALUES'  
values_query = ','.join([tuple(df.iloc[i]) for i in range(len(df))])  
insert_query += f' ({",".join([f"({col}, {val})" for col, val in zip(df.columns, values_query)])})'  
cursor = conn.cursor()  
cursor.execute(insert_query, parameters=None, execution_profile='parallel')

对于超大型数据集,建议使用ClickHouse的并行插入功能或其他分布式技术。

优缺点分析

1,如果提前构造好了dataframe,且dataframe数据量适中,那么可以考虑一次性塞入,如果dataframe数据量足够大超出了内存容量,那么就要考虑了;
2,对于哪些容易丢失的还是一条一条插入数据库为好;

http://www.dt0577.cn/news/34154.html

相关文章:

  • 网站 设计 趋势做竞价推广大概多少钱
  • 网站rss怎么做网站制作专业
  • 做的网站怎么转成网址链接网络推广公司主要做什么
  • 东莞房地产网站建设搜索引擎优化要考虑哪些方面?
  • 设计漂亮的网站短视频推广平台
  • 手机网站系统下载seo全称英文怎么说
  • 江西seo推广软件seo权重优化软件
  • 南康网站制作百度 营销推广多少钱
  • 深圳网站建设讯美新产品宣传推广策划方案
  • 哪个网站上做自媒体最好域名
  • 北京活动策划网站emlog友情链接代码
  • wordpress小说站成都seo优化公司
  • 有什么网站可以做java算法美容美发培训职业学校
  • 多少钱 网站建设百度指数怎样使用
  • 安卓软件开发公司收入找索引擎seo
  • 彩票源码网站的建设百度最怕哪个部门去投诉
  • 2019做什么类型网站推广营销是什么
  • 惠州建网站服务百度一下你就知道官网百度
  • 同性做视频网站信息流优化师前景
  • 唐山展望网站建设400个成品短视频
  • 数据库网站建设多少钱微信小程序免费制作平台
  • 健身网站开发可行性分析app推广平台接单渠道
  • 木匠手做网站福州百度代理
  • 手机网站例子百度下载免费安装最新版
  • wordpress 汉化 插件seo自动推广工具
  • 中瑞网络网站建设流程优化大师班级优化大师
  • 安徽省住房城乡建设部网站专注网站建设服务机构
  • WordPress使用sentcloud慈溪seo
  • 武汉行业门户网站建设seo顾问多少钱
  • 搜索类的网站优点网络营销环境分析