概述
数据可视化
1.散点图
import matplotlib;
from pandas import read_csv;
import matplotlib.pyplot as plt;
data = read_csv("D:\PA\5.1\data.csv")
font = {
'family' : 'SimHei'
}
matplotlib.rc('font', **font);
plt.plot(data['广告费用'], data['购买用户数'], '.')
#plt.plot(data['广告费用'], data['购买用户数'], 'o')
#plt.plot(data['广告费用'], data['购买用户数'], 'o', color='yellow')
#plt.plot(data['广告费用'], data['购买用户数'], 'o', color=(1, 1, 0))
#plt.plot(data['广告费用'], data['购买用户数'], 'o', color='#FFFF00')
plt.xlabel('广告费用');
plt.ylabel('购买用户数');
plt.grid(True);
plt.show();
2.折线图
import pandas;
from pandas import read_csv;
from matplotlib import pyplot as plt;
data = read_csv('D:\PA\5.2\data.csv');
#对日期格式进行转换
data['购买日期']=pandas.to_datetime(data['日期']);
#'-' 顺滑的曲线
plt.plot(data['购买日期'], data['购买用户数'], '-');
#plt.title('购买用户数时间序列图');
#plt.show();
#设置颜色
plt.plot(data['购买日期'], data['购买用户数'], '-', color='r');
#设置线条粗细
plt.plot(data['购买日期'], data['购买用户数'], '-', color='r', lineWidth=10);
#'--' 虚线
plt.plot(data['购买日期'], data['购买用户数'], '--');
#'-.' 线加点
plt.plot(data['购买日期'], data['购买用户数'], '-.');
#':' 由点组成的曲线
plt.plot(data['购买日期'], data['购买用户数'], ':');
#'.' 散点图
plt.plot(data['购买日期'], data['购买用户数'], '.');
#',' 像素点的散点图
plt.plot(data['购买日期'], data['购买用户数'], ',');
#'o' 大点的散点图
plt.plot(data['购买日期'], data['购买用户数'], 'o');
#'v' 下三角标记的散点图
plt.plot(data['购买日期'], data['购买用户数'], 'v');
#'^' 上上角标记的散点图
plt.plot(data['购买日期'], data['购买用户数'], '^');
#'<' 左角标记的散点图
plt.plot(data['购买日期'], data['购买用户数'], '<');
#'>' 右角标记的散点图
plt.plot(data['购买日期'], data['购买用户数'], '>');
#'1' 伞形下的标记散点图
#'2' 伞形上的标记散点图
#'3' 伞形左的标记散点图
#'4' 伞形右的标记散点图
plt.plot(data['购买日期'], data['购买用户数'], '4');
#'s' 正方形标记的散点图
plt.plot(data['购买日期'], data['购买用户数'], 's');
#'p' 五角形标记的散点图
plt.plot(data['购买日期'], data['购买用户数'], 'p');
#'*' 五角星标记的散点图
plt.plot(data['购买日期'], data['购买用户数'], '*');
#'h' 多边形标记的散点图
#'H' hexagon2 marker
plt.plot(data['购买日期'], data['购买用户数'], 'h');
#'+' plus marker
#'x' x marker
#'D' diamond marker
#'d' thin_diamond marker
plt.plot(data['购买日期'], data['购买用户数'], 'D');
#'|' vline marker
#'_' hline marker
plt.plot(data['购买日期'], data['购买用户数'], '|');
plt.title('购买用户数时间序列图');
plt.show();
3.饼图
# -*- coding: utf-8 -*-
import numpy;
import matplotlib;
from pandas import read_csv;
import matplotlib.pyplot as plt;
data = read_csv('D:\PA\5.3\data.csv');
gb = data.groupby(
by=['通信品牌'],
as_index=False
)['号码'].agg({
'用户数':numpy.size
});
#pip install matplotlib
font = {
'family' : 'SimHei'
}
matplotlib.rc('font', **font);
plt.pie(gb['用户数'], labels=gb['通信品牌'], autopct='%.2f%%');
plt.show()
4.柱形图
1 # -*- coding: utf-8 -*- 2 import numpy; 3 import matplotlib; 4 from pandas import read_csv; 5 from matplotlib import pyplot as plt; 6 7 font = { 8 'family' : 'SimHei' 9 }; 10 matplotlib.rc('font', **font); 11 12 data = read_csv('D:\PA\5.4\data.csv'); 13 14 gb = data.groupby( 15 by=['手机品牌'] 16 )['月消费(元)'].agg({ 17 '月消费': numpy.sum 18 }); 19 20 index = numpy.arange(gb['月消费'].size); 21 22 #竖向柱形图 23 plt.bar(index, gb['月消费'], 1, color='G'); 24 plt.show(); 25 26 plt.bar(index, gb['月消费'], 1, color='G'); 27 plt.xticks(index + 1/2, gb.index); 28 plt.show(); 29 30 #横向柱形图 31 plt.barh(index, gb['月消费'], 1, color='G'); 32 plt.yticks(index + 1/2, gb.index); 33 plt.show();
1 # -*- coding: utf-8 -*- 2 import numpy; 3 import matplotlib; 4 from pandas import read_csv; 5 from matplotlib import pyplot as plt; 6 7 font = { 8 'family' : 'SimHei' 9 }; 10 matplotlib.rc('font', **font); 11 12 data = read_csv('D:\PA\5.4\data.csv'); 13 14 d1 = '手机品牌'; 15 d2 = '通信品牌'; 16 v = "月消费"; 17 18 gb = data.groupby(by=[d1, d2])['月消费(元)'].agg({v: numpy.sum}); 19 20 d1size = gb.index.levels[0].size; 21 d2size = gb.index.levels[1].size; 22 23 index = numpy.arange(d1size); 24 colors=['r', 'g', 'b']; 25 26 for i in range(0, d2size): 27 print(i); 28 subgb = gb[v][gb.index.labels[1]==i]; 29 bar = plt.bar(index*d2size + i, subgb, color=colors[i]); 30 31 lIndex = numpy.arange(d1size)*d2size; 32 plt.xticks(lIndex + 3/2, gb.index.levels[0]); 33 34 plt.legend(gb.index.levels[1]); 35 plt.show();
1 # -*- coding: utf-8 -*- 2 import numpy; 3 import matplotlib; 4 from pandas import read_csv; 5 from matplotlib import pyplot as plt; 6 7 font = { 8 'family' : 'SimHei' 9 }; 10 matplotlib.rc('font', **font); 11 12 data = read_csv('D:\PA\5.4\data.csv'); 13 14 d1 = '手机品牌'; 15 d2 = '通信品牌'; 16 v = "月消费"; 17 18 gb = data.groupby(by=[d1, d2])['月消费(元)'].agg({v: numpy.sum}); 19 20 d1size = gb.index.levels[0].size; 21 d2size = gb.index.levels[1].size; 22 23 index = numpy.arange(d1size); 24 colors = ['r', 'g', 'b']; 25 bsum = index*0.0; 26 27 for i in range(0, d2size): 28 print(i); 29 subgb = gb[v][gb.index.labels[1]==i]; 30 bar = plt.bar(index, subgb, color=colors[i], bottom=bsum); 31 bsum += subgb; 32 33 plt.xticks(index+1/2, gb.index.levels[0]); 34 35 plt.legend(gb.index.levels[1]); 36 plt.show();
5.直方图
# -*- coding: utf-8 -*-
import matplotlib;
from pandas import read_csv;
from matplotlib import pyplot as plt;
font = {
'family' : 'SimHei'
};
matplotlib.rc('font', **font);
data = read_csv('D:\PA\5.5\data.csv');
plt.hist(data['购买用户数']);
plt.show();
plt.hist(data['购买用户数'], bins=20);
plt.show();
plt.hist(data['购买用户数'], bins=20, cumulative=True);
plt.show();
转载于:https://www.cnblogs.com/garrett0220/p/10876446.html
最后
以上就是幸福大树为你收集整理的python数据分析实战---数据可视化数据可视化的全部内容,希望文章能够帮你解决python数据分析实战---数据可视化数据可视化所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复