概述
pyhton以最短的代码完成任务,因此运行效率并不高,又称“胶水语言”,因为它允许我们把耗时的核心部分用C/C++等更高效率的语言编写,然后由它来“黏合”,来解决了运行效率的问题。
数据结构
python有四个内建的数据结构——List(列表),Tuple(元组),Dictionary(字典),Set(集合),它们统称为“容器(container)”。
列表和元组都是序列结构,列表用方括号标记[],元组用圆括号()标记,二者的区别是,列表可以被修改,元组不能被修改。
“列表解析”这一功能能够简化我们队列表内元素逐一进行操作的代码:b=[i+2 for i in a]代替
for i in a:b.append(i+2).
字典实际是一个映射,有自己定义的键。
集合中的元素不重复且无序。
函数式编程(泛函编程)
函数式编程主要由几个函数的使用构成:lambda(),map(),reduce(),filter()。
**lambda()**用来自定义“行内函数”深入理解lambda()函数
**map()**函数用于逐一遍历,代替了类似列表解析的功能,map()函数
**reduce()**函数用于递归计算,reduce()函数
**filter()**函数式一个过滤器,用来筛选出列表中符合条件的元素,使用此函数需要一个返回值为bool型的函数filter()函数
python数据挖掘相关扩展库
Numpy
python并没有提供数组支持,Numpy提供数组支持,以及相应的高效的处理函数。后续的scipy,matplotlib,pandas等库都依赖于它。
Numpy库入门
Numpy库常用函数大全
Scipy
提供矩阵支持,以及矩阵相关的数值计算模块,包含的功能有最优化,线性代数,积分,插值,拟合,特殊函数,快速傅里叶变换,信号处理,图像处理,常微分方程求解等。
科学计算库Scipy
Matplotlib
强大的数据可视化工具,作图库,主要用于二维绘图,也可以进行简单的三维绘图。
Matplotlib官方中文文档
绘图库入门
Pandas
强大灵活的数据分析和探索工具,它的基本数据结构是Series和DataFrame,Series就是序列,类似一维数组,而DataFrame相当于二维表格,类似二维数组。
基础详解
Series类型与基本操作详解
StatsModels
统计建模和计量经济学,包括描述统计,统计模型估计和推断。
Scikit-Learn
支持回归,分类,聚类等的强大的机器学习库
Keras
深度学习库,用于建立神经网络及深度学习网络
Gensim
用来做文本主题模型的库,文本挖掘可能用到
最后
以上就是缓慢小兔子为你收集整理的python数据分析简介的全部内容,希望文章能够帮你解决python数据分析简介所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复