我是靠谱客的博主 缓慢小兔子,最近开发中收集的这篇文章主要介绍python数据分析简介,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

pyhton以最短的代码完成任务,因此运行效率并不高,又称“胶水语言”,因为它允许我们把耗时的核心部分用C/C++等更高效率的语言编写,然后由它来“黏合”,来解决了运行效率的问题。

数据结构

python有四个内建的数据结构——List(列表),Tuple(元组),Dictionary(字典),Set(集合),它们统称为“容器(container)”。
列表和元组都是序列结构,列表用方括号标记[],元组用圆括号()标记,二者的区别是,列表可以被修改,元组不能被修改。
“列表解析”这一功能能够简化我们队列表内元素逐一进行操作的代码:b=[i+2 for i in a]代替
for i in a:b.append(i+2).
字典实际是一个映射,有自己定义的键。
集合中的元素不重复且无序。

函数式编程(泛函编程)

函数式编程主要由几个函数的使用构成:lambda(),map(),reduce(),filter()。
**lambda()**用来自定义“行内函数”深入理解lambda()函数
**map()**函数用于逐一遍历,代替了类似列表解析的功能,map()函数
**reduce()**函数用于递归计算,reduce()函数
**filter()**函数式一个过滤器,用来筛选出列表中符合条件的元素,使用此函数需要一个返回值为bool型的函数filter()函数

python数据挖掘相关扩展库

Numpy

python并没有提供数组支持,Numpy提供数组支持,以及相应的高效的处理函数。后续的scipy,matplotlib,pandas等库都依赖于它。
Numpy库入门
Numpy库常用函数大全

Scipy

提供矩阵支持,以及矩阵相关的数值计算模块,包含的功能有最优化,线性代数,积分,插值,拟合,特殊函数,快速傅里叶变换,信号处理,图像处理,常微分方程求解等。
科学计算库Scipy

Matplotlib

强大的数据可视化工具,作图库,主要用于二维绘图,也可以进行简单的三维绘图。
Matplotlib官方中文文档
绘图库入门

Pandas

强大灵活的数据分析和探索工具,它的基本数据结构是Series和DataFrame,Series就是序列,类似一维数组,而DataFrame相当于二维表格,类似二维数组。
基础详解
Series类型与基本操作详解

StatsModels

统计建模和计量经济学,包括描述统计,统计模型估计和推断。

Scikit-Learn

支持回归,分类,聚类等的强大的机器学习库

Keras

深度学习库,用于建立神经网络及深度学习网络

Gensim

用来做文本主题模型的库,文本挖掘可能用到

最后

以上就是缓慢小兔子为你收集整理的python数据分析简介的全部内容,希望文章能够帮你解决python数据分析简介所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(35)

评论列表共有 0 条评论

立即
投稿
返回
顶部