python数据分析之pandas搞定Excel表格

177 阅读 0 评论 117 点赞

我是靠谱客的博主土豪红酒，这篇文章主要介绍python数据分析之pandas搞定Excel表格，现在分享给大家，希望可以做个参考。

本篇文章给大家带来了关于python的相关知识，其中主要介绍了关于数据分析基础的一些问题，包括了读取其他文件、数据透视表等相关内容，下面一起来看一下，希望对大家有帮助。

推荐学习：python视频教程

（一）读取其他文件

1.excel读取其他文件

1.1 导入csv文件

在这里插入图片描述

1.2 导入tsv文件

在这里插入图片描述

1.3 导入txt文本文件

在这里插入图片描述

2.pandas读取其他文件

2.1 读取csv文件

复制代码import pandas as pd

# 导入csv文件
test1 = pd.read_csv('./excel/test12.csv',index_col="ID")
df1 = pd.DataFrame(test1)

print(df1)1
2
3
4
5
6
7
import pandas as pd

# 导入csv文件
test1 = pd.read_csv('./excel/test12.csv',index_col="ID")
df1 = pd.DataFrame(test1)

print(df1)
登录后复制

2.2 读取tsv文件

复制代码import pandas as pd

# 导入tsv文件
test3 = pd.read_csv("./excel/test11.tsv",sep='t')
df3 = pd.DataFrame(test3)

print(df3)1
2
3
4
5
6
7
import pandas as pd

# 导入tsv文件
test3 = pd.read_csv("./excel/test11.tsv",sep='t')
df3 = pd.DataFrame(test3)

print(df3)
登录后复制

2.3 读取txt文件

复制代码import pandas as pd

# 导入txt文件
test2 = pd.read_csv("./excel/test13.txt",sep='|')
df2 = pd.DataFrame(test2)

print(df2)1
2
3
4
5
6
7
import pandas as pd

# 导入txt文件
test2 = pd.read_csv("./excel/test13.txt",sep='|')
df2 = pd.DataFrame(test2)

print(df2)
登录后复制

结果：
在这里插入图片描述

（二）数据透视表

1.在excel中制作透视表

结果：
在这里插入图片描述

这样就在excel中完成了数据透视表的制作。

那么在pandas中要怎么实现这一效果呢？

2.在pandas中绘制透视表

复制代码import pandas as pd
import numpy as np

pd.options.display.max_columns =999
test = pd.read_excel('./excel/test14.xlsx')
df = pd.DataFrame(test)
# 将年份取出并新建一个列名为年份的列
df['year'] = pd.DatetimeIndex(df['Date']).year
# 绘制透视表
table = df.pivot_table(index='总类',columns='year',values='销售额',aggfunc=np.sum)
df1 = pd.DataFrame(table)
df1['总计'] = df1[[2011,2012,2013,2014]].sum(axis=1)


print(df1)1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import pandas as pd
import numpy as np

pd.options.display.max_columns =999
test = pd.read_excel('./excel/test14.xlsx')
df = pd.DataFrame(test)
# 将年份取出并新建一个列名为年份的列
df['year'] = pd.DatetimeIndex(df['Date']).year
# 绘制透视表
table = df.pivot_table(index='总类',columns='year',values='销售额',aggfunc=np.sum)
df1 = pd.DataFrame(table)
df1['总计'] = df1[[2011,2012,2013,2014]].sum(axis=1)


print(df1)
登录后复制

结果：
在这里插入图片描述

复制代码import pandas as pd
import numpy as np

pd.options.display.max_columns =999
test = pd.read_excel('./excel/test14.xlsx')
df = pd.DataFrame(test)
# 将年份取出并新建一个列名为年份的列
df['year'] = pd.DatetimeIndex(df['Date']).year

# groupby方法
group = df.groupby(['总类','year'])

s= group['销售额'].sum()
c = group['ID'].count()

table = pd.DataFrame({'sum':s,'total':c})

print(table)1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
import pandas as pd
import numpy as np

pd.options.display.max_columns =999
test = pd.read_excel('./excel/test14.xlsx')
df = pd.DataFrame(test)
# 将年份取出并新建一个列名为年份的列
df['year'] = pd.DatetimeIndex(df['Date']).year

# groupby方法
group = df.groupby(['总类','year'])

s= group['销售额'].sum()
c = group['ID'].count()

table = pd.DataFrame({'sum':s,'total':c})

print(table)
登录后复制