概述

现学现卖不可耻~加油~
一.一维数据分析

1.Numpy 一维数组 Array
1.1访问一维数组元素:下标索引;切片索引;for循环遍历

1.2 NumPy 一维数组与列表的区别:平均值mean();标准差std();向量化计算(相加;乘以标量)

2.Pandas 一维数组 Series
2.1创建一维数组,有索引index可以对照对应的值,describe 描述数组的统计信息

2.2iloc 位置索引获得值;loc 根据索引获得值

2.3向量化计算:相加(向量相加,缺少对应index指针会显示错误NaN)

Solutions:
方法1:删除缺失值 .dropna()

方法2:填充缺失值 .add(数据结构fill_value)

二.二维数据分析

1. Numpy 利用Array定义二维数组,传入的为列表

1.1操作:查找某个元素,某行元素,某列元素

1.2 数轴参数
- 按行计算:axis = 1
- 按列计算:axis = 0

Attention: numpy数组中元素类型相同。
2 . Pandas数据框DataFrame
2.1定义有序字典转化为DataFrame,计算每列平均值

2.2查询数据框中元素
2.2.1 iloc依据位置属性查询 ,查询某元素,某行,某列:

2.2.2 Loc依据索引查询 ,查询某元素,某行,某列:

2.2.3切片查询,可以指定范围

2.2.4通过条件判断筛选:构建查询条件&应用查询条件

2.3 数据集描述统计信息


三.数据分析过程

1.数据清洗步骤

1.1选择子集

1.2 列名重命名

1.3 缺失数据处理

1.4 数据类型转换
- 1.4.1 字符串转换为数值(浮点数)

- 1.4.2 字符串分割 split,引号内有空格

- 1.4.3 字符串转换日期

1.5排序
- by 按哪几列排序
- ascending = True 升序排列
- #ascending = False降序排列

重命名行名index & 描述每列统计信息

1.6异常值处理 ,条件查询&应用查询条件:

2. 业务指标计算
2.1月均消费次数

2.2月均消费金额

2.3客单价

Summary:

最后
以上就是高高咖啡豆为你收集整理的python二维与一维相加_Data Science 之 python.part 3 - 基本数据分析的全部内容,希望文章能够帮你解决python二维与一维相加_Data Science 之 python.part 3 - 基本数据分析所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复