我是靠谱客的博主 勤劳哈密瓜,最近开发中收集的这篇文章主要介绍Windows 10 - Python - 数据分析 - 年龄分组统计 - 条形图 - matplotlib,觉得挺不错的,现在分享给大家,希望可以做个参考。
概述
最近需要用到条形图,统计年龄,所以查了一下资料,修改为满足自己要求的条形图,下面看代码自行领会。
测试环境:
操作系统: Window 10
工具:Pycharm
Python: 3.7
matplotlib: 3.5.1
pandas: 1.3.5
numpy: 1.21.6
Virtualenv 虚拟环境下安装 matplotlib、pandas
pip installl matplotlib
pip installl pandas
test.xlsx 文件配置链接:
Windows 10 - Ptyhon - 数据分析 - Openpyxl 导入Excel
代码演示:
#!/usr/bin/env python
# -*-coding:utf-8-*-
import matplotlib.pyplot as plt
# 导入库
import os
import pandas as pd
import numpy as np
PATH = os.path.abspath('.')
# . 表示当前所处的文件夹的绝对路径, .. 两个点代表上一级的绝对路径
EXCELPATH = PATH + r"test.xlsx"
# excel 文件路径
def paint():
# plt.rcParams['font.sans-serif'] = 'simhei'
# 用来正常显示中文(黑体)常用字体包括:楷体: Kaiti
#
# 仿宋: FangSong 微软雅黑: Microsoft YaHei 黑体: SimHei
df = pd.read_excel(EXCELPATH,usecols=[2])
print(df)
print(df.info())
# 获取 DataFrame 的摘要
print(df.head())
# 根据位置返回对象的前n行信息(默认值为5) ,用于快速测试数据集
print(df.describe())
# 生成描述性统计数据,总结数据集分布的集中趋势,分散和形状,不包括 NaN值。
# 数据预处理
data = df.dropna(axis=0)
# 删除所有包含空值的行,0 是行,1 是列
print(data.info())
print(data)
x = data["年龄"]
print(data.describe())
# 查看最大值与最小值
bins = np.arange(10, 50, 5)
# 这里是 10 - 45 岁之间,间隔为 5 岁
time_bins = pd.cut(x, bins)
# 对数据进行离散化处理
print(time_bins)
df1 = data.groupby(time_bins)["年龄"].count()
print(df1)
# 绘制图形
df1.plot(kind="bar", rot=0)
plt.rcParams['font.sans-serif'] = ['Kaiti']
# 用来正常显示中文(黑体)常用字体包括:楷体: Kaiti
# 仿宋: FangSong 微软雅黑: Microsoft YaHei 黑体: SimHei
plt.rcParams['axes.unicode_minus'] = False
#运行配置参数总的轴(axes)正常显示正负号(minus)
plt.show()
# 调用年龄统计方法
paint()
参考链接:
统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。
pandas plot参数
【matplotlib】plot()kind参数表
plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘] 和plt.rcParams[‘axes.unicode_minus‘] = False
最后
以上就是勤劳哈密瓜为你收集整理的Windows 10 - Python - 数据分析 - 年龄分组统计 - 条形图 - matplotlib的全部内容,希望文章能够帮你解决Windows 10 - Python - 数据分析 - 年龄分组统计 - 条形图 - matplotlib所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复