概述
现学现卖不可耻~加油~
一.一维数据分析
1.Numpy 一维数组 Array
1.1访问一维数组元素:下标索引;切片索引;for循环遍历
1.2 NumPy 一维数组与列表的区别:平均值mean();标准差std();向量化计算(相加;乘以标量)
2.Pandas 一维数组 Series
2.1创建一维数组,有索引index可以对照对应的值,describe 描述数组的统计信息
2.2iloc 位置索引获得值;loc 根据索引获得值
2.3向量化计算:相加(向量相加,缺少对应index指针会显示错误NaN)
Solutions:
方法1:删除缺失值 .dropna()
方法2:填充缺失值 .add(数据结构fill_value)
二.二维数据分析
1. Numpy 利用Array定义二维数组,传入的为列表
1.1操作:查找某个元素,某行元素,某列元素
1.2 数轴参数
- 按行计算:axis = 1
- 按列计算:axis = 0
Attention: numpy数组中元素类型相同。
2 . Pandas数据框DataFrame
2.1定义有序字典转化为DataFrame,计算每列平均值
2.2查询数据框中元素
2.2.1 iloc依据位置属性查询 ,查询某元素,某行,某列:
2.2.2 Loc依据索引查询 ,查询某元素,某行,某列:
2.2.3切片查询,可以指定范围
2.2.4通过条件判断筛选:构建查询条件&应用查询条件
2.3 数据集描述统计信息
三.数据分析过程
1.数据清洗步骤
1.1选择子集
1.2 列名重命名
1.3 缺失数据处理
1.4 数据类型转换
- 1.4.1 字符串转换为数值(浮点数)
- 1.4.2 字符串分割 split,引号内有空格
- 1.4.3 字符串转换日期
1.5排序
- by 按哪几列排序
- ascending = True 升序排列
- #ascending = False降序排列
重命名行名index & 描述每列统计信息
1.6异常值处理 ,条件查询&应用查询条件:
2. 业务指标计算
2.1月均消费次数
2.2月均消费金额
2.3客单价
Summary:
最后
以上就是高高咖啡豆为你收集整理的python二维与一维相加_Data Science 之 python.part 3 - 基本数据分析的全部内容,希望文章能够帮你解决python二维与一维相加_Data Science 之 python.part 3 - 基本数据分析所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复