我是靠谱客的博主 故意奇异果,这篇文章主要介绍pandas的数据结构Series、DataFrame、PanelSeries:DataFrame:Panel:,现在分享给大家,希望可以做个参考。

pandas有三种数据结构

Series:

一维数组,与Numpy中的一维array类似。

二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。

Series和一维数组最主要的区别在于Series类型具有索引(index),可以和另一个编程中常见的数据结构哈希(Hash)联系起来。

创建一个Series的基本格式是s = Series(data, index=index, name=name)

复制代码
1
2
3
4
5
s = Series(np.random.randn(5), index=['a', 'b', 'c', 'd', 'e']) ss = Series(np.random.randn(5)) d = {'a': 0, 'b': 1, 'c': 2} #以字典创建 s = Series(d)

Series数据的访问

复制代码
1
2
3
4
s[:2] s[[2,0,4]] s[['e', 'i']]

DataFrame:

二维的表格型数据结构。

DataFrame是将数个Series按列合并而成的二维数据结构,每一列单独取出来是一个Series,这和SQL数据库中取出的数据是很类似的。

所以,按列对一个DataFrame进行处理更为方便,用户在编程时注意培养按列构建数据的思维。

DataFrame的优势在于可以方便地处理不同类型的列,因此,就不要考虑如何对一个全是浮点数的DataFrame求逆之类的问题了,处理这种问题还是把数据存成NumPy的matrix类型比较便利一些。

可以通过series直接创建

复制代码
1
2
3
4
d = {'one': Series([1., 2., 3.], index=['a', 'b', 'c']), 'two': Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])} df = DataFrame(d) df = DataFrame(d, index=['r', 'd', 'a'], columns=['two', 'three'])

Panel:

三维的数组,可以理解为DataFrame的容器。

摘自:https://www.jianshu.com/p/8d8c9d44d21a
https://www.jianshu.com/p/ab45e72e1b68

最后

以上就是故意奇异果最近收集整理的关于pandas的数据结构Series、DataFrame、PanelSeries:DataFrame:Panel:的全部内容,更多相关pandas内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(62)

评论列表共有 0 条评论

立即
投稿
返回
顶部