概述
利用python做数据分析,要掌握几个包,先做一名调包侠。
-
numpy:NumPy是用Python进行科学计算的基础软件包.
-
re:python正则表达式匹配包.
-
jieba:“结巴”中文分词:做最好的 Python 中文分词组件 .
-
nltk:python环境下NLP工具包,包含了丰富的文本处理和文本挖掘API.
-
sklearn:
Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.Sklearn 包含了很多种机器学习的方式: Classification 分类 Regression 回归 Clustering 非监督分类 Dimensionality reduction 数据降维 Model Selection 模型选择 Preprocessing 数据预处理
-
wordcloud:wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本
-
scipy:scipy包含致力于科学计算中常见问题的各个工具箱。它的不同子模块相应于不同的应用。像插值,积分,优化,图像处理,统计,特殊函数等等
-
gensim:一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口.
-
matplotlib:Matplotlib 可能是 Python 2D-绘图领域使用最广泛的套件
-
networkx:networkx是一个python包,用于创建、操作和研究复杂网络的结构、动态和功能.
我想做数据分析师
- 四懂:懂业务、懂管理、懂分析、懂技术。
- 为什么:90%市场决策依赖于数据分析。
在学习数据分析的道路上,python只是工具。
最后
以上就是俊逸黑裤为你收集整理的数据分析笔记1利用python做数据分析,要掌握几个包,先做一名调包侠。我想做数据分析师的全部内容,希望文章能够帮你解决数据分析笔记1利用python做数据分析,要掌握几个包,先做一名调包侠。我想做数据分析师所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复