概述
import pandas as pd
food_info=pd.read_csv("food_info.csv")
###将数据传入。指定文件名即可。使用相对路径。
print(type(food_info))
###将数据通过pandas传入,pandas的数据结构就是dataframe
print(food_info)
print(food_info.dtypes)
###查看数据的结构
###字符值是object的结构
print(help(pd.read_csv))
##查看帮助文档。当不知道函数如何使用的时候。
food_info.head()
###使用head()把数据前五行显示,在默认情况下。
food_info.head(3)
###把数据的前3条显示一下。
###打印数据的列名。
print(food_info.columns)
##打印矩阵的维度
print(food_info.shape)
###取数据,例子中将第一个数据拿到手。
print(food_info.loc[0])
###取数据的切片。
food_info.loc[3:6]
###一列一列的取数据,肢解通过列名取数据。
ndb_col =food_info["NDB_No"]
print(ndb_col)
###这个例子是拿到的NDB_No列的数据。
####也可以将列名赋值给变量通过变量来取出列名
col_name = "NDB_No"
print(food_info[col_name])
###d定位两列。
###将这两个列组成list结构。然后将这两个列作为变量传入就可以了。
print(food_info.columns)
columns = [ 'Water_(g)', 'Energ_Kcal']
print(food_info[columns])
####查找一某些字符结尾
col_names = food_info.columns.tolist()
###将字符型的数据转换成list型的数据。
print(col_names)
#print(food_info.columns)
###可以比较出两者的区别。
###查找以某些字符串结尾。
gram_columns = []
for c in col_names:
if c.endswith("(g)"):
gram_columns.append(c)
gram_df = food_info[gram_columns]
print(gram_df.head())
###查看前五行数据
print(gram_df.columns)
###查看里面有的列。
####新加一个列,然后将这个列加入到dataframe中
###也就是新加一个特征。
print(food_info.shape)
Iron_g=water_energy/1000
food_info["Iron_(g)"]=Iron_g
print(food_info.shape)
###特殊函数的使用,例如max().mean(),min()
max_energ_kcal=food_info["Energ_Kcal"].max()
print(max_energ_kcal)
###使用函数进行归一化
normal_fat=food_info["Lipid_Tot_(g)"]/food_info["Lipid_Tot_(g)"].max()
print(normal_fat)
最后
以上就是喜悦鼠标为你收集整理的机器学习之pandas常用函数笔记的全部内容,希望文章能够帮你解决机器学习之pandas常用函数笔记所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复