概述
前几天ubuntn16虚拟机又被弄爆了,这几天配置了一个深度deepin的系统,然后安装完anaconda和pycharm配置好环境解决了matplotlib中文现实问题。
进入正题
1.Sklearn简介
Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。当我们面临机器学习问题时,便可选择相应的方法。
2.安装sklearn
安装sklearn的包
pip3 install Scikit-learn
查看是否成功(配置好anaconda的用户直接import就行)
impart sklearn
注意安装sklearn需要numpy,pandas等库
3.利用sklearn对数据特征进行抽取
先看一个例子,看看sklearn做了什么事
#导入包
from sklearn.feature_extraction.text import CountVectorizer
#实例化CountVectorizer
vector=CountVectorizer()
#调用fit_transfrom输入并转换数据
res=vector.fit_transform(["life is short,i like python","life is too long,i dislike python"])
#打印看看结果
print(vector.get_feature_names())
print(res.toarray(
最后
以上就是小巧可乐为你收集整理的python的特征提取实验一_python机器学习之特征提取(scikit-learn)的全部内容,希望文章能够帮你解决python的特征提取实验一_python机器学习之特征提取(scikit-learn)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复