复制代码
1
2
3
4
5
6import pandas as pd food_info=pd.read_csv("food_info.csv") ###将数据传入。指定文件名即可。使用相对路径。 print(type(food_info)) ###将数据通过pandas传入,pandas的数据结构就是dataframe
复制代码
1
2print(food_info)
复制代码
1
2
3
4print(food_info.dtypes) ###查看数据的结构 ###字符值是object的结构
复制代码
1
2
3print(help(pd.read_csv)) ##查看帮助文档。当不知道函数如何使用的时候。
复制代码
1
2
3
4
5food_info.head() ###使用head()把数据前五行显示,在默认情况下。 food_info.head(3) ###把数据的前3条显示一下。
复制代码
1
2
3###打印数据的列名。 print(food_info.columns)
复制代码
1
2
3##打印矩阵的维度 print(food_info.shape)
复制代码
1
2
3###取数据,例子中将第一个数据拿到手。 print(food_info.loc[0])
复制代码
1
2
3###取数据的切片。 food_info.loc[3:6]
复制代码
1
2
3
4
5###一列一列的取数据,肢解通过列名取数据。 ndb_col =food_info["NDB_No"] print(ndb_col) ###这个例子是拿到的NDB_No列的数据。
复制代码
1
2
3
4####也可以将列名赋值给变量通过变量来取出列名 col_name = "NDB_No" print(food_info[col_name])
复制代码
1
2
3
4
5
6###d定位两列。 ###将这两个列组成list结构。然后将这两个列作为变量传入就可以了。 print(food_info.columns) columns = [ 'Water_(g)', 'Energ_Kcal'] print(food_info[columns])
复制代码
1
2
3
4
5
6
7####查找一某些字符结尾 col_names = food_info.columns.tolist() ###将字符型的数据转换成list型的数据。 print(col_names) #print(food_info.columns) ###可以比较出两者的区别。
复制代码
1
2
3
4
5
6
7
8
9
10
11###查找以某些字符串结尾。 gram_columns = [] for c in col_names: if c.endswith("(g)"): gram_columns.append(c) gram_df = food_info[gram_columns] print(gram_df.head()) ###查看前五行数据 print(gram_df.columns) ###查看里面有的列。
复制代码
1
2
3
4
5
6
7####新加一个列,然后将这个列加入到dataframe中 ###也就是新加一个特征。 print(food_info.shape) Iron_g=water_energy/1000 food_info["Iron_(g)"]=Iron_g print(food_info.shape)
复制代码
1
2
3
4###特殊函数的使用,例如max().mean(),min() max_energ_kcal=food_info["Energ_Kcal"].max() print(max_energ_kcal)
复制代码
1
2
3
4###使用函数进行归一化 normal_fat=food_info["Lipid_Tot_(g)"]/food_info["Lipid_Tot_(g)"].max() print(normal_fat)
最后
以上就是喜悦鼠标最近收集整理的关于机器学习之pandas常用函数笔记的全部内容,更多相关机器学习之pandas常用函数笔记内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复