我是靠谱客的博主 阳光柜子,最近开发中收集的这篇文章主要介绍python图像主色调(主颜色)提取,在hsv空间k均值迭代实现,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

完整项目代码在:https://github.com/liuhuang31/simple_mainColor

 

本人新手一枚,所编写的代码基本尽量没调用库类,所以感觉代码会很臃肿,连三级代码都称不上哈,这个主色调也是看了一天python后,现学现用的。可以微博关注@劉煌煌爱喝冬瓜茶     一起交流学习!

 

python写的(python2.7 和python3.+)都可以使用,需要安装 PIL matplotlib numpy等环境。

一、识别主色调步骤

非常具有参考价值的论文《一种新的MPEG-7主颜色提取算法》,我前面做的步骤基本是参考这篇文章的。

1、获取图像RGB

2、RGB转化成HSV空间值

3、HSV空间下k均值迭代(初始点是根据图像的像素范围来random选择初始点的数值)

4、显示图片(把聚类的hsv值转化为RGB显示出来)

具体详细的步骤看下上面的论文哈

二、代码实现

1、hsvTRGB.py  参考:http://outofmemory.cn/code-snippet/1002/Python-RGB-HSV-color-together-switch

import math
def Hsv2Rgb(H, S, V):
H /= 60.0
# sector 0 to 5
i = math.floor(H)
f = H - i
# factorial part of h
p = V * (1 - S)
q = V * (1 - S * f)
t = V * (1 - S * (1 - f))
if i == 0:
R = V
G = t
B = p
elif i == 1:
R = q
G = V
B = p
elif i == 2:
R = p
G = V
B = t
elif i == 3:
R = p
G = q
B = V
elif i == 4:
R = t
G = p
B = V
else:
R = V
G = p
B = q
return R*255, G*255, B*255

2、rgb2hsv.py

 

 

def rgb2hsv(r, g, b):
r, g, b = r/255.0, g/255.0, b/255.0
mx = max(r, g, b)
mn = min(r, g, b)
df = mx-mn
if mx == mn:
h = 0
elif mx == r and g >= b:
h = 60 * ((g - b) / df) + 0
elif mx == r and g < b:
h = 60 * ((g-b)/df) + 360
elif mx == g:
h = 60 * ((b-r)/df) + 120
elif mx == b:
h = 60 * ((r-g)/df) + 240
if mx == 0:
s = 0
else:
s = df/mx
v = mx
return h, s, v
def rgb2hsv2(R, G, B):
mx = max(R, G, B)
mn = min(R, G, B)
if R == mx:
H = (G-B) / (mx-mn)
elif G == mx:
H = 2 + (B-R) / (mx-mn)
elif B == mx:
H = 4 + (R-G) / (mx-mn)
H = H * 60
if H < 0:
H = H + 360
V = mx
S = (mx - mn) / mx
return H, S, V

3、PrimaryColor.py

 

 

# coding=utf-8
from PIL import Image
import rgb2hsv
import random as ran
import hsvTRGB
from pylab import *
# 加载图片,返回数据
def loadImage(path):
im = Image.open(path)
# Can be many different formats.
pix = im.load()
# 获得图像的像素
width = im.size[0]
# 获得图像的宽度
height = im.size[1]
# 获得图像的高度
data = width, height, pix, im
# 把这些width,height,pix,im这些值赋给data,后面KMeans方法里要用到这些值
return data
# hsv空间两点间欧氏距离,选出距离最小的类
def distEclud(hsv, centroids, k):
h, s, v = hsv
# 获取当前像素的h,s,v值
min = -1
# 用作判断centroids[i]是否为第一个中心点
# 逐个计算当前hsv与各个类中心点的欧式距离,选出距离最小的类
for i in range(k):
h1, s1, v1 = centroids[i]
minc = math.sqrt(
math.pow(math.fabs(h - h1), 2) + math.pow(math.fabs(s - s1), 2) + math.pow(math.fabs(v - v1), 2))
# minc = math.sqrt(math.pow(s*math.cos(h) - s1*math.cos(h1), 2) + math.pow(s*math.sin(h) - s1*math.sin(h1), 2) + 
#
+ math.pow(v - v1, 2))/math.sqrt(5)
# 欧氏距离计算公式
# 用j表示当前hsv值属于第j个centroids
if (min == -1):
min = minc
j = 0
continue
if (minc < min):
min = minc
j = i
return j
# 随机生成初始的质心(ng的课说的初始方式是随机选K个点),选择图像中最小的值加上随机值来生成
def getCent(dataSet, k):
centroids = zeros((k, 3))
# 种子,k表示生成几个初始中心点,3表示hsv三个分量
width, height, n = dataSet.shape
# 获得数据的长宽
# 循环获得dataSet所有数据里面最小和最大的h,s,v值
for i in range(width):
for j in range(height):
h, s, v = dataSet[i][j]
if i == 0 and j == 0:
maxh, maxs, maxv = minh, mins, minv = h, s, v
elif h > maxh:
maxh = h
elif s > maxs:
maxs = s
elif v > maxv:
maxv = v
elif h < minh:
minh = h
elif s < mins:
mins = s
elif v < minv:
minv = v
rangeh = maxh - minh
# 最大和最小h值之差
ranges = maxs - mins
rangev = maxv - minv
# 生成k个初始点,hsv各个分量的最小值加上range的随机值
for i in range(k):
centroids[i] = minh + rangeh * ran.random(), mins + ranges * ran.random(), + 
minv + rangev * ran.random()
return centroids
# 前一个centroids与当前centroids的根号平方差
def getDist(preC, centroids):
k, n = preC.shape
# k表示centroids的k个中心点(类中心点),n表示例如centroid[0]当中的三个hsv分量
sum = 0.0
# 总距离
for i in range(k):
h, s, v = preC[i]
h1, s1, v1 = centroids[i]
distance = math.pow(math.fabs(h - h1), 2) + math.pow(math.fabs(s - s1), 2) + math.pow(math.fabs(v - v1), 2)
sum += distance
return math.sqrt(sum)
# 中心点k均值迭代
def KMeans(k, data):
width, height, pix, im = data
# 获得要处理图像的各个数据
dataSet = [[0 for col in range(height)] for row in range(width)]
# 图像数据转化为hsv后的数据及其数据格式
for x in range(width):
for y in range(height):
r, g, b = pix[x, y]
# 获取图像rgb值
hsv = h, s, v = rgb2hsv.rgb2hsv(r, g, b)
# 把rgb值转化为hsv值
dataSet[x][y] = hsv
dataSet = np.array(dataSet)
# 把dataSet数据转化为numpy的数组数据,以便待会获得初始点时,更好处理数据
centroids = getCent(dataSet, k)
# 获得k个初始中心点
# 循环迭代直到前一个centroids与当前centroids的根号距离满足一定条件
while 1:
count = [0 for i in range(k)]
# count用来统计各个中心类中的数据的个数
myList = [[] for i in range(width * height)]
# mylist用来存放各个中心类中的数据
preC = centroids
# preC保存前一个centroids的数据
# 判断各个像素属于哪个中心类,然后把hsv值放到所属类
for x in range(width):
for y in range(height):
r, g, b = pix[x, y]
hsv = h, s, v = rgb2hsv.rgb2hsv(r, g, b)
i = distEclud(hsv, centroids, k)
# 计算欧氏距离,获得该像素,也就是hsv所属中心类
myList[i].append((h, s, v))
# 把hsv值加到所属中心类
count[i] += 1
# 相应所属类的个数增加
# 一次所有点类别划分后,重新计算中心点
for i in range(k):
size = len(myList[i])
# 各个类中的个数
sumh = sums = sumv = 0.0
if (size == 0):
continue
else:
for j in range(size):
h, s, v = myList[i][j]
sumh += h
sums += s
sumv += v
centroids[i] = sumh / size, sums / size, sumv / size
# 取该类hsv分量的平均值
print (centroids[0:k])
norm = getDist(preC, centroids)
# 获得前一个centroids与当前centroids的根号距离
if norm < 0.1:
# 距离小于0.1,则跳出循环
break
return count, centroids
# 返回count:各个中心点数据的个数;centroids:最终迭代后的中心点
def show(im, count, centroids, k, imgpath):
# 显示第一个子图:各个中心类的个数
mpl.rcParams['font.family'] = "SimHei"
# 指定默认字体,才能显示中文字体
ax1 = plt.subplot(221)
# 把figure分成2X2的4个子图,ax1为第一个子图
index = np.arange(k)
bar_width = 0.35
opacity = 0.4
plt.bar(index + bar_width / 2, count, bar_width, alpha=opacity, color='g', label='Num')
plt.xlabel('Centroids')
# 设置横坐标
plt.ylabel('Sum_Number')
# 设置纵坐标
plt.title(u'points num of centroids')
# 设置标题
plt.xticks(index + bar_width, ('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'))
# 设置横坐标各个类
plt.legend()
# 设置
plt.tight_layout()
ax2 = plt.subplot(222)
img = Image.open(imgpath)
x = k
# x坐标
通过对txt里的行数进行整数分解
# 冒泡算法从大到小排序
for i in range(k):
max = count[i]
m = i
for j in range(i, k):
if count[j] > max:
max = count[j]
m = j
if i != m:
midcount = count[i]
count[i] = count[m]
count[m] = midcount
mid = centroids[i]
centroids[i] = centroids[m]
centroids[m] = mid
img = Image.new('RGBA', img.size, (255, 255, 255))
print("n============ the image size ===============")
print (img.size)
if x > 8:
# 取前8个中心类个数最大的颜色
x = 8
count_remove = 0
# 用语统计,剔除中心类中,类聚集的数据数小于5%的
sum_count = float(sum(count))
# sum_count为总的数据数个数,也就是各个类聚集的总个数
# 剔除中心类中,类聚集的数据数小于5%的
for i in range(x):
if count[x - i - 1] / sum_count < 0.05:
count_remove += 1
x = x - count_remove
if x == 0:
x = 1
# 确保有一个主颜色
print("n============ the points number of centroids ===============")
print (count)
# 图片显示的x y轴
y = img.size[1]
# y坐标
x*y = 行数
w = int(img.size[0] / x)
# 显示前8个中心类个数最大的颜色
for i in range(0, x):
for j in range(i * w, (i + 1) * w):
for k in range(0, y):
rgb = centroids[i]
img.putpixel((j, k), (int(rgb[0]), int(rgb[1]), int(rgb[2])))
# rgb转化为像素
plt.xlabel(u'color')
plt.title(u'main color sort')
plt.yticks()
plt.imshow(img)
plt.tight_layout()
# 显示原图,也就是要处理的图像
plt.subplot(212)
plt.title(u'origin image')
plt.imshow(im)
# 显示整个figure
plt.show()
def main():
imgpath = '/Users/liuhuang31/Desktop/test2.jpg'
data = loadImage(imgpath)
# Can be many different formats.选择这种方式导入图片
k = 20
# 设置k均值初始点个数
# 通过KMeans方法后返回的centroids,是k均值迭代后最终的中心点, count是这k个中心(类)的所包含的个数
count, centroids = KMeans(k, data)
print("n================== the centroids RGB =================")
for i in range(k):
# 因为有k个中心点
h, s, v = centroids[i]
r, g, b = hsvTRGB.Hsv2Rgb(h, s, v)
centroids[i] = r, g, b
print (i, r, g, b)
im = data[3]
# im = Image.open(path),就是得到图像对象
show(im, count, centroids, k, imgpath)
# 显示图像
if __name__ == '__main__':
main()

 

 

 

 

三、前方高能,我要放图了!!也就是实验结果

由于k个初始中心点是根据图像的像素范围来random选择初始点的数值,所以每次运行的结果会有小差异!

1、对于传说中的粉红色(由于其特殊性,有些识别方法识别不出,可能原因是没根据图像的RGB来生成初始聚类中心,或者自己设定初始点)

2、

(1)初始点k=10

(2)初始点k=20 (可以看到和选择k=10还是有区别的哈)

3、这张图识别的稍微不准,白色RGB(255,255,255)识别出来为RGB(239,226,225),蓝色和黄色倒是识别得准确

四、再次强调哈,由于我python是现学现做,对于数据结构很多都不熟悉,所以转换来转换的,不过能自己写的,我都没调用库类,对自己更有锻炼,也挺适合我这样的新手,还有对一些图片识别稍微有误差,现在还在调试中QAQ。还有图像显示的第二个主颜色排序子图像代码不是很好。。

五、参考资料列表(良好的习惯^-^)
1、Python中的Numpy入门教程:http://www.jb51.net/article/49397.htm

2、颜色空间RGB与HSV(HSL)的转换:http://blog.csdn.net/jiangxinyu/article/details/8000999

3、python使用matplotlib绘解详解:http://www.pythontab.com/html/2013/pythonhexinbiancheng_0123/161.html

4、Matplotlib 画柱状图   (使用里面的方法来画图): http://blog.csdn.net/wishchin/article/details/24906175

5、RGB值转化图片(python PIL)   (使用里面的方法来画图)  http://www.tuicool.com/articles/mYBN7ju


 

最后

以上就是阳光柜子为你收集整理的python图像主色调(主颜色)提取,在hsv空间k均值迭代实现的全部内容,希望文章能够帮你解决python图像主色调(主颜色)提取,在hsv空间k均值迭代实现所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(51)

评论列表共有 0 条评论

立即
投稿
返回
顶部