我是靠谱客的博主 忧伤枫叶,最近开发中收集的这篇文章主要介绍pandas内置数据集_pandas学习实例---Adult数据集(1),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

在经过前期的学习后,我们需要一些实例操作来加深我们对pandas的熟悉程度。今天带来的是L在pandas学习之旅中,针对Adult数据集的一些学习笔记。

数据来源:https://archive.ics.uci.edu/ml/datasets/Adult​archive.ics.uci.edu

下载不了的同学可以从这里下载:

链接:https://pan.baidu.com/s/1RfueHHRJRAWPJVvB6KIdDg​pan.baidu.com

提取码:5cr0

首先,将文件导入我们的python中。(我用的是jupyter notebook )

import numpy as np

import pandas as pd

由于本次实例的主要目的是为了实践我们的pandas使用技巧,为了让一些刚刚接触数据分析和pandas的小伙伴更容易接受本次学习的内容,在正式实验之前,我将会对这个数据集做一些处理:包括修改特征名(列名)、删除某些特征列,以减少数据集的复杂度等。

df = pd.read_csv(r'C:UsersAdministratorDesktopadult.csv',header=None,encoding='utf-8')

df.drop(columns=[1,2,4,10,11],axis=1,inplace=True)

df.columns=['年龄', '教育程度', '婚姻状况', '职业', '家庭关系','人种','性别','每周工作时间','祖国','工资

最后

以上就是忧伤枫叶为你收集整理的pandas内置数据集_pandas学习实例---Adult数据集(1)的全部内容,希望文章能够帮你解决pandas内置数据集_pandas学习实例---Adult数据集(1)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(53)

评论列表共有 0 条评论

立即
投稿
返回
顶部