概述
Pandas含有使数据分析工作变得更快更简单的高级数据结构和操作工具,pandas基于numpy构建。
两个主要数据结构:Series和DataFrame。
Series:一种类似于一位数组的对象,由一组数据和一组与之相关的数据标签组成。
产生Series:
1.仅由一维列表即可产生最简单的Series:
obj = Series([-1, 5, 7, 9])
0
-1
1
5
2
7
3
9
dtype: int64
2.通过字典创建Series
这时,字典中的键就是Series中的索引,字典中的值就是Series中的值
3.创建带有索引的Series:
obj2 = Series([4, 7, -5, 3],index = ['d', 'b', 'a', 'c'])
Series常用函数:
obj.values
(没有括号,常识性用函数在后面加括号)
obj.index
分别是获得了其数组表现形式和索引对象
如:array([-1, 5, 7, 9], dtype=int64)
Index(['d', 'b', 'a', 'c'], dtype='object')
obj['a'],obj2[['c', 'a', 'b']]:可通过索引方式选取,更改Series中的单个或一组值numpy的数组运算都会保留索引和值之间的链接:
obj2[obj2 > 0](返回>0的部分,有索引和值)
obj2 * 2
判断是否存在某个索引:'b' in obj2 (返回布尔值)
Series()传入一个字典,一个索引数组,就会创建一个Series,左边是索引数组,右边是索引数组在字典对应 值,如果没有对应值 返回NAN(not a number)pandas的notnull 和 isnull 用于检测缺失数据:
pd.isnull(obj4) 返回一个Series 左边索引值 右边布尔值
Series一个重要功能:在算术运算中会自动对齐不同索引的数据
obj3+obj4 最终得到的Series 相同的索引值对应的数据相加,不同的任然存在,不进行运算
Series name属性:obj4.name = 'population'obj4.index.name = 'state'
state california NaN ohio 35000.0 oregon 16000.0 texas 71000.0 Name: population, dtype: float64Series的索引可以通过赋值的方式就地修改:obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan']
最后
以上就是高贵巨人为你收集整理的Pandas-Series的全部内容,希望文章能够帮你解决Pandas-Series所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复