概述
本篇文章给大家带来了关于python的相关知识,其中主要介绍了关于数据分析基础的一些问题,包括了读取其他文件、数据透视表等相关内容,下面一起来看一下,希望对大家有帮助。
推荐学习:python视频教程
(一)读取其他文件
1.excel读取其他文件
1.1 导入csv文件
1.2 导入tsv文件
1.3 导入txt文本文件
2.pandas读取其他文件
2.1 读取csv文件
import pandas as pd
# 导入csv文件
test1 = pd.read_csv('./excel/test12.csv',index_col="ID")
df1 = pd.DataFrame(test1)
print(df1)
登录后复制
2.2 读取tsv文件
import pandas as pd
# 导入tsv文件
test3 = pd.read_csv("./excel/test11.tsv",sep='t')
df3 = pd.DataFrame(test3)
print(df3)
登录后复制
2.3 读取txt文件
import pandas as pd
# 导入txt文件
test2 = pd.read_csv("./excel/test13.txt",sep='|')
df2 = pd.DataFrame(test2)
print(df2)
登录后复制
结果:
(二)数据透视表
1.在excel中制作透视表
结果:
这样就在excel中完成了数据透视表的制作。
那么在pandas中要怎么实现这一效果呢?
2.在pandas中绘制透视表
import pandas as pd
import numpy as np
pd.options.display.max_columns =999
test = pd.read_excel('./excel/test14.xlsx')
df = pd.DataFrame(test)
# 将年份取出并新建一个列名为年份的列
df['year'] = pd.DatetimeIndex(df['Date']).year
# 绘制透视表
table = df.pivot_table(index='总类',columns='year',values='销售额',aggfunc=np.sum)
df1 = pd.DataFrame(table)
df1['总计'] = df1[[2011,2012,2013,2014]].sum(axis=1)
print(df1)
登录后复制
结果:
import pandas as pd
import numpy as np
pd.options.display.max_columns =999
test = pd.read_excel('./excel/test14.xlsx')
df = pd.DataFrame(test)
# 将年份取出并新建一个列名为年份的列
df['year'] = pd.DatetimeIndex(df['Date']).year
# groupby方法
group = df.groupby(['总类','year'])
s= group['销售额'].sum()
c = group['ID'].count()
table = pd.DataFrame({'sum':s,'total':c})
print(table)
登录后复制
结果:
推荐学习:python视频教程
以上就是python数据分析之pandas搞定Excel表格的详细内容,更多请关注靠谱客其它相关文章!
最后
以上就是土豪红酒为你收集整理的python数据分析之pandas搞定Excel表格的全部内容,希望文章能够帮你解决python数据分析之pandas搞定Excel表格所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复