我是靠谱客的博主 高高咖啡豆,最近开发中收集的这篇文章主要介绍python二维与一维相加_Data Science 之 python.part 3 - 基本数据分析,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

020a30530b1821c7474b30dd0c0126bf.png

现学现卖不可耻~加油~

一.一维数据分析

f1ece08c8e3601c95e4aabf64c79dd26.png

1.Numpy 一维数组 Array

1.1访问一维数组元素:下标索引;切片索引;for循环遍历

d3166cef9d968d94a3792a81b339649a.png

1.2 NumPy 一维数组与列表的区别:平均值mean();标准差std();向量化计算(相加;乘以标量)

f149384af5ce841450b2245930c8b71d.png

2.Pandas 一维数组 Series

2.1创建一维数组,有索引index可以对照对应的值,describe 描述数组的统计信息

5c1984a403d28043568d4e8cedeaf4ac.png

2.2iloc 位置索引获得值;loc 根据索引获得值

deec45d61074adf7df65d2fa2f012e9f.png

2.3向量化计算:相加(向量相加,缺少对应index指针会显示错误NaN)

da924f0cecf21c896470429200440a10.png

Solutions:

方法1:删除缺失值 .dropna()

6df10df0a7df54beb9f40ff44a6a8cf0.png

方法2:填充缺失值 .add(数据结构fill_value)

ca4139bef56ac62e517897ebc48618dc.png

二.二维数据分析

2b2bdfc94e5adcf86d24464be661c515.png

1. Numpy 利用Array定义二维数组,传入的为列表

ae6df81f3a362177dac2a0affe12224a.png

1.1操作:查找某个元素,某行元素,某列元素

e246f316c7087eb2ec283165dac3440d.png

1.2 数轴参数

  • 按行计算:axis = 1
  • 按列计算:axis = 0

74bd9d0dac36d1da6cbab7914edbfe05.png

Attention: numpy数组中元素类型相同。

2 . Pandas数据框DataFrame

2.1定义有序字典转化为DataFrame,计算每列平均值

9d8b53c92b2794a2c4a0bae5921885bb.png

2.2查询数据框中元素

2.2.1 iloc依据位置属性查询 ,查询某元素,某行,某列:

90863bd300e4fe2bb64c79ccc394debd.png

2.2.2 Loc依据索引查询 ,查询某元素,某行,某列:

a2c8b75df14669fb8b0fc8136e80050d.png

2.2.3切片查询,可以指定范围

8259d81c0e60fd511185dab1b18a086b.png

2.2.4通过条件判断筛选:构建查询条件&应用查询条件

207cb540e2e1dd341226d3046fe9a4d7.png

2.3 数据集描述统计信息

11be50c56ba6b3a57db31d8abbe84a12.png

61a2266b8261329be620562c56a21cea.png

三.数据分析过程

b02806dd70e30384e010c5a2dab835a4.png

1.数据清洗步骤

bc383d235a10a3c4fc68d832322e41f3.png

1.1选择子集

60757d2b5811cdac88ca24e1442b77f3.png

1.2 列名重命名

cbe11fd56348af6c2fe3326f6034953b.png

1.3 缺失数据处理

843b4d37bad91db15c30659f17736950.png

1.4 数据类型转换

  • 1.4.1 字符串转换为数值(浮点数)

2b9aa3b8024aa8360e7fa3ad06778b39.png
  • 1.4.2 字符串分割 split,引号内有空格

79a9716a99de2c22a9db6b3fd3c52b8c.png
  • 1.4.3 字符串转换日期

61652397629bbbfdf692bfb949a2fab3.png

1.5排序

  • by 按哪几列排序
  • ascending = True 升序排列
  • #ascending = False降序排列

120e1e7781812655116fa799624bcf46.png

重命名行名index & 描述每列统计信息

c7f8bc98c93d9b8e5d0c4f72e4b262da.png

1.6异常值处理 ,条件查询&应用查询条件:

2b1cd7686134d36a3bb836c700034ad5.png

2. 业务指标计算

2.1月均消费次数

0b3ea3d7a5a97caba3cdf8354eefeed2.png

2.2月均消费金额

728f68b7e6c26bbcbca42bea3d2243ac.png

2.3客单价

aca6e5c16cfde75d1d4cb4130ff6b5b3.png

Summary:

890938dd5b668c777e7156057052ca41.png

最后

以上就是高高咖啡豆为你收集整理的python二维与一维相加_Data Science 之 python.part 3 - 基本数据分析的全部内容,希望文章能够帮你解决python二维与一维相加_Data Science 之 python.part 3 - 基本数据分析所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(35)

评论列表共有 0 条评论

立即
投稿
返回
顶部