概述
2.7本章实训
#读取数据
import csv
f=open("D:python testwhite_wine.csv","r")
reader=csv.reader(f)
content=[]
for row in reader:
content.append(row)
f.close()
for i in range(5):
print(content[i])
#查看白葡萄酒总共分为几种品质等级
quality_list=[]
for row in content[1: ]:
quality_list.append(int(row[-1]))
quality_count=set(quality_list)
print("白葡萄酒共有%d种等级,分别是:%r"
%(len(quality_count),quality_count))
#按照白葡萄酒等级将数据集划分为7个子集,并统计每种等级的数量
content_dict={}
for row in content[1:]:
quality=int(row[-1])
if quality not in content_dict.keys():
#用字典保存每个子集
content_dict[quality]=[row]
else:
content_dict[quality].append(row)
for key in content_dict:
print(key,":",len(content_dict[key]))
#计算每个数据集中fixed acidity的均值(列表)
mean_list=[]
for key,value in content_dict.items():
sum=0
for row in value:
sum+=float(row[0])
#fixed acidity是第一列数据
mean_list.append((key,sum/len(value)))
for item in mean_list:
print(item[0],":",item[1])
#计算每个数据集中fixed acidity的均值(字典)
mean_dict={}
for key,value in content_dict.items():
sum=0
for row in value:
sum+=float(row[0])
mean_dict[key]=sum/len(value)
for key,mean in mean_dict.items():
print(key,":",mean)
#求方差
var_list=[]
for key,value in content_dict.items():
sum=0
mean=mean_dict[key]
for row in value:
sum+=(float(row[0])-mean)**2
var_list.append((key,sum/len(value)))
for item in var_list:
print(item[0],":",item[1])
最后
以上就是飞快溪流为你收集整理的python数据分析与可视化(第2版)——2.7本章实训的全部内容,希望文章能够帮你解决python数据分析与可视化(第2版)——2.7本章实训所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复