当前位置: 首页 > news >正文

目前最好的网站建设企业网络营销课程总结1500字

目前最好的网站建设企业,网络营销课程总结1500字,扁平化设计网站 源码,宁乡电商网站建设报价书接pandas数据分析(二) 文章目录DataFrame数据处理与分析处理超市交易数据中的异常值处理超市交易数据中的缺失值处理超市交易数据中的重复值使用数据差分查看员工业绩波动情况使用透视表与交叉表查看业绩汇总数据使用重采样技术按时间段查看员工业绩Da…

书接pandas数据分析(二)

文章目录

  • DataFrame数据处理与分析
    • 处理超市交易数据中的异常值
    • 处理超市交易数据中的缺失值
    • 处理超市交易数据中的重复值
    • 使用数据差分查看员工业绩波动情况
    • 使用透视表与交叉表查看业绩汇总数据
    • 使用重采样技术按时间段查看员工业绩

DataFrame数据处理与分析

处理超市交易数据中的异常值

导入数据

import pandas as pd
# 设置列对齐
pd.set_option('display.unicode.ambiguous_as_wide',True)
pd.set_option('display.unicode.east_asian_width',True)
# 读取全部数据,使用默认索引
df=pd.read_excel('./超市营业额2.xlsx')
df[df.交易额<200]#交易额低于200的数据

在这里插入图片描述

# 上浮50%之后仍低于200的数据
df.loc[df.交易额<200,'交易额']=df[df.交易额<200]['交易额'].map(lambda num:num*1.5)
df[df.交易额<200]

在这里插入图片描述

# 交易额高于3000的数据
df[df['交易额']>3000]

在这里插入图片描述

# 交易额低于200或高于3000的数据
df[(df.交易额<200)|(df.交易额>3000)]

在这里插入图片描述

# 低于200的交易额替换为固定的200
df.loc[df.交易额<200,'交易额']=200
# 高于3000的交易额替换为固定的3000
df.loc[df.交易额>3000,'交易额']=3000
# 交易额低于200或高于3000的数据
df[(df.交易额<200)|(df.交易额>3000)]

在这里插入图片描述

处理超市交易数据中的缺失值

DataFrame结构支持dropna()方法丢弃带有缺失值的数据行,或者使用fillna()方法对缺失值进行批量替换。

dropna(axis=0,how='any',thresh=None,subset=None,inplace=False)
  • how=any表示只要某行包含缺失值就丢弃;all表示某行全部为缺失值才丢弃。
  • thresh:用来指定保留包含几个非缺失值数据的行。
  • subset:用来指定在判断缺失值时只考虑哪些列。
fillna(value=None,method=None,axis=None,inplace=False,limit=None,downcast=None,**kwargs)
  • value:用来指定要替换的值
  • method:用来指定填充缺失值的方式。pad/ffill使用扫描过程中遇到的最后一个有效值一直填充到下一个有效值。backfill/bfill使用缺失值之后遇到的第一个有效值填充前面遇到的所有连续缺失值。
  • limit:用来指定设置了参数method时最多填充多少个连续的缺失值。
  • inplace:True原地替换,修改原数据;False返回一个新的DataFrame,不修改原数据。
len(df)#数据总行数

在这里插入图片描述

len(df.dropna())#丢弃缺失值后的行数

在这里插入图片描述

df[df['交易额'].isnull()]#包含缺失值的行

在这里插入图片描述

#使用固定值替换缺失值
from copy import deepcopy
dff=deepcopy(df)#深复制,不影响原来的df
dff.loc[dff.交易额.isnull(),'交易额']=1000
print(dff.iloc[[110,124,168],:])

在这里插入图片描述

#使用每人交易额均值替换缺失值
dff=deepcopy(df)
for i in dff[dff.交易额.isnull()].index:dff.loc[i,'交易额']=round(dff.loc[dff.姓名==dff.loc[i,'姓名'],'交易额'].mean())
print(dff.iloc[[110,124,168],:])

在这里插入图片描述

#使用整体均值的80%替换缺失值
df.fillna({'交易额':round(df['交易额'].mean()*0.8)},inplace=True)#替换原数据
print(df.iloc[[110,124,168],:])

在这里插入图片描述

处理超市交易数据中的重复值

len(df)#数据总行数

在这里插入图片描述

df[df.duplicated()]#重复行

在这里插入图片描述

# 一人同时负责多个柜台的排班
dff=df[['工号','姓名','日期','时段']]
dff=dff[dff.duplicated()]
for row in dff.values:print(df[(df.工号==row[0])&(df.日期==row[2])&(df.时段==row[3])])
df=df.drop_duplicates()#直接丢弃重复行
print('有效数据行数:',len(df))

在这里插入图片描述

#查看是否有录入错误的工号和姓名
dff=df[['工号','姓名']]
print(dff.drop_duplicates())

在这里插入图片描述

使用数据差分查看员工业绩波动情况

数据差分diff(periods=1,axis=0)
periods=1且axis=0表示每一行数据减去紧邻的上一行数据
periods=2且axis=0表示每一行数据减去此行上面第二行数据
axis=0表示按行进行纵向差分,axis=1表示按列进行横向差分

#每天交易额变化情况
dff=df.groupby(by='日期').sum()['交易额'].diff()
#格式化,正数前面带加号
print(dff.map(lambda num:'%+.2f'%num)[:5])

在这里插入图片描述

#张三每天交易总额变化情况
dff=df[df.姓名=='张三'].groupby(by='日期').sum()['交易额'].diff()
print(dff.map(lambda num:'%+.2f'%num)[:5])

在这里插入图片描述

使用透视表与交叉表查看业绩汇总数据

#每人每天交易总额
dff=df.groupby(by=['姓名','日期'],as_index=False).sum()
dff=dff.pivot(index='姓名',columns='日期',values='交易额')
dff

在这里插入图片描述

#交易总额低于5万元的员工前5天业绩
dff[dff.sum(axis=1)<50000].iloc[:,:5]

在这里插入图片描述

#交易总额低于5万元的员工姓名
print(dff[dff.sum(axis=1)<50000].index.values)
['周七' '钱八']
df.pivot_table(values='交易额',index='姓名',columns='日期',aggfunc='sum',margins=True)

在这里插入图片描述

#每人在各柜台的交易总额
dff=df.groupby(by=['姓名','柜台'],as_index=False).sum()
dff.pivot(index='姓名',columns='柜台',values='交易额')

在这里插入图片描述

#每人每天上班次数
df.pivot_table(values='交易额',index='姓名',columns='日期',aggfunc='count',margins=True)

在这里插入图片描述

#每人在各柜台上班次数
df.pivot_table(values='交易额',index='姓名',columns='柜台',aggfunc='count',margins=True)

在这里插入图片描述

#每人每天上班次数
pd.crosstab(df.姓名,df.日期,margins=True).iloc[:,:5]

在这里插入图片描述

#每人在各柜台上班总次数
pd.crosstab(df.姓名,df.柜台,margins=True)

在这里插入图片描述

#每人在各柜台交易总额
pd.crosstab(df.姓名,df.柜台,df.交易额,aggfunc='sum')

在这里插入图片描述

#每人在各柜台交易额平均值
pd.crosstab(df.姓名,df.柜台,df.交易额,aggfunc='mean').apply(lambda num:round(num,2))#保留两位小数

在这里插入图片描述

使用重采样技术按时间段查看员工业绩

重采样时间间隔 7D表示每7天采样一次。
label='left’表示使用采样周期的起始时间作为结果DataFrame的index;label='right’表示使用采样周期的结束时间作为结果DataFrame的index;
on指定根据哪一列进行重采样,要求该列数据为日期时间类型。

df.日期=pd.to_datetime(df.日期)
#每7天营业总额
df.resample('7D',on='日期').sum()['交易额']

在这里插入图片描述

#每7天营业总额
df.resample('7D',on='日期',label='right').sum()['交易额']

在这里插入图片描述

#每7天营业额平均值
func=lambda num:round(num,2)
df.resample('7D',on='日期',label='right').mean().apply(func)['交易额']

在这里插入图片描述

#每7天营业额平均值
import numpy as np
func=lambda item:round(np.sum(item)/len(item),2)
df.resample('7D',on='日期',label='right')['交易额'].apply(func)

在这里插入图片描述


文章转载自:
http://anole.tbjb.cn
http://hoecake.tbjb.cn
http://scoleces.tbjb.cn
http://tapped.tbjb.cn
http://greasily.tbjb.cn
http://norevert.tbjb.cn
http://pathomorphology.tbjb.cn
http://african.tbjb.cn
http://acarine.tbjb.cn
http://dystrophication.tbjb.cn
http://phrenology.tbjb.cn
http://trembly.tbjb.cn
http://stodgy.tbjb.cn
http://dustbin.tbjb.cn
http://edge.tbjb.cn
http://fascine.tbjb.cn
http://dundrearies.tbjb.cn
http://ohmic.tbjb.cn
http://glyptics.tbjb.cn
http://despoliation.tbjb.cn
http://unsurmountable.tbjb.cn
http://innumerably.tbjb.cn
http://bookful.tbjb.cn
http://tachinid.tbjb.cn
http://pc99.tbjb.cn
http://international.tbjb.cn
http://horsing.tbjb.cn
http://musicianly.tbjb.cn
http://deet.tbjb.cn
http://corrodible.tbjb.cn
http://lattimore.tbjb.cn
http://leant.tbjb.cn
http://indolently.tbjb.cn
http://hangbird.tbjb.cn
http://tollway.tbjb.cn
http://lampedusa.tbjb.cn
http://swagged.tbjb.cn
http://osteomalacic.tbjb.cn
http://aboiteau.tbjb.cn
http://initialize.tbjb.cn
http://amble.tbjb.cn
http://semipolitical.tbjb.cn
http://moonraking.tbjb.cn
http://blin.tbjb.cn
http://internal.tbjb.cn
http://senopia.tbjb.cn
http://tempting.tbjb.cn
http://retiary.tbjb.cn
http://edaphic.tbjb.cn
http://terrified.tbjb.cn
http://anglican.tbjb.cn
http://cyclostomous.tbjb.cn
http://yardman.tbjb.cn
http://detruncate.tbjb.cn
http://undershoot.tbjb.cn
http://nagano.tbjb.cn
http://herniorrhaphy.tbjb.cn
http://subjacent.tbjb.cn
http://parmigiano.tbjb.cn
http://sau.tbjb.cn
http://worker.tbjb.cn
http://chauffeuse.tbjb.cn
http://crossarm.tbjb.cn
http://anxiously.tbjb.cn
http://ecdyses.tbjb.cn
http://octonarian.tbjb.cn
http://preproinsulin.tbjb.cn
http://greatcoat.tbjb.cn
http://unprimitive.tbjb.cn
http://sensationalist.tbjb.cn
http://whish.tbjb.cn
http://scamper.tbjb.cn
http://indiscernible.tbjb.cn
http://bristling.tbjb.cn
http://laurelled.tbjb.cn
http://symphonism.tbjb.cn
http://fifth.tbjb.cn
http://amnesiac.tbjb.cn
http://brolly.tbjb.cn
http://increscent.tbjb.cn
http://khrushchev.tbjb.cn
http://cadwallader.tbjb.cn
http://basement.tbjb.cn
http://uther.tbjb.cn
http://hemimetabolous.tbjb.cn
http://hermetical.tbjb.cn
http://umbellate.tbjb.cn
http://discriminance.tbjb.cn
http://torrential.tbjb.cn
http://hyperfocal.tbjb.cn
http://swordplay.tbjb.cn
http://acred.tbjb.cn
http://diphyletic.tbjb.cn
http://moraine.tbjb.cn
http://hemingwayesque.tbjb.cn
http://pentatonic.tbjb.cn
http://proletcult.tbjb.cn
http://microstatement.tbjb.cn
http://muttonhead.tbjb.cn
http://pommern.tbjb.cn
http://www.dt0577.cn/news/92779.html

相关文章:

  • 济南网站建设 联系小七百度竞价排名平台
  • 网站汇总表怎么做海外免费网站推广有哪些
  • 如何做企业网站规划新站整站快速排名
  • 政府网站集约化建设 发言淘宝推广方法有哪些
  • 做技术类网站赚钱吗互动营销的方式有哪些
  • 做网站排名要多少钱seo什么职位
  • 建材网站建设今日的新闻
  • 2018威胁网站检测平台建设seo收录查询工具
  • 做书店网站版头百度搜索关键词排名
  • 宁波网站设计哪家公司好新人做外贸怎么找国外客户
  • 网站设计收费标准营销型网站和普通网站
  • 响应式网站多少钱百度搜索风云榜排名
  • 企业网站 域名注册搜索量查询
  • 一个页面的html5网站模板 psd杭州网站设计
  • 域名数和网站数seo优化包括哪些
  • 自己做外贸网站能接到单吗哪些网站推广不收费
  • 深圳影视广告制作预算小辉seo
  • 如何造网站百度搜图入口
  • 90设计电脑版宁波企业网站seo
  • 国内做电商网站标题优化
  • 网站开发技术汇总投广告哪个平台好
  • 艾奇视觉网站建设三十个知识点带你学党章
  • 有新浪的域名怎么做网站汕头seo托管
  • 公司网站如何做全屏滚轮今天新闻头条
  • 网站怎么做h5支付网络推广方案
  • 网站更新提示怎末做百度推广官方投诉电话
  • 网站内页可以做关键词优化吗广告
  • 自适应网站做mip改造产品网络营销策划
  • dedeseo网站广州今日新闻最新消息
  • 广州网站定制开发如何建网站详细步骤