概述
在经过前期的学习后,我们需要一些实例操作来加深我们对pandas的熟悉程度。今天带来的是L在pandas学习之旅中,针对Adult数据集的一些学习笔记。
数据来源:https://archive.ics.uci.edu/ml/datasets/Adultarchive.ics.uci.edu
下载不了的同学可以从这里下载:
链接:https://pan.baidu.com/s/1RfueHHRJRAWPJVvB6KIdDgpan.baidu.com
提取码:5cr0
首先,将文件导入我们的python中。(我用的是jupyter notebook )
import numpy as np
import pandas as pd
由于本次实例的主要目的是为了实践我们的pandas使用技巧,为了让一些刚刚接触数据分析和pandas的小伙伴更容易接受本次学习的内容,在正式实验之前,我将会对这个数据集做一些处理:包括修改特征名(列名)、删除某些特征列,以减少数据集的复杂度等。
df = pd.read_csv(r'C:UsersAdministratorDesktopadult.csv',header=None,encoding='utf-8')
df.drop(columns=[1,2,4,10,11],axis=1,inplace=True)
df.columns=['年龄', '教育程度', '婚姻状况', '职业', '家庭关系','人种','性别','每周工作时间','祖国','工资
最后
以上就是忧伤枫叶为你收集整理的pandas内置数据集_pandas学习实例---Adult数据集(1)的全部内容,希望文章能够帮你解决pandas内置数据集_pandas学习实例---Adult数据集(1)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复