圖像分割是將圖像分割成多個(gè)不同區(qū)域(或片段)的過(guò)程。目標(biāo)是將圖像的表示變成更容易和更有意義的圖像。
在這篇博客中,我們將看到一種圖像分割方法,即K-Means Clustering。
K-Means 聚類(lèi)是一種無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法,旨在將N 個(gè)觀測(cè)值劃分為K 個(gè)聚類(lèi),其中每個(gè)觀測(cè)值都屬于具有最近均值的聚類(lèi)。集群是指由于某些相似性而聚合在一起的數(shù)據(jù)點(diǎn)的集合。對(duì)于圖像分割,這里的簇是不同的圖像顏色。
我們使用的環(huán)境是pip install opencv-python numpy matplotlib
選擇的圖片是我們學(xué)校畢業(yè)照的圖片,放心這里沒(méi)有我,在學(xué)校公眾號(hào)找的美圖。
導(dǎo)入所需模塊:
import cv2
import numpy as np
import matplotlib.pyplot as plt
# read the image
image = cv2.imread("Graduation.jpg")
在進(jìn)行圖像分割之前,讓我們將圖像轉(zhuǎn)換為RGB格式:
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
我們將使用cv2.kmeans()函數(shù),它將一個(gè)2D數(shù)組作為輸入,并且由于我們的原始圖像是3D(寬度、高度和深度為3 個(gè) RGB值),我們需要將高度和寬度展平為單個(gè)像素向量(3 個(gè) RGB值):
# 將圖像重塑為像素和3個(gè)顏色值(RGB)的2D數(shù)組
print(image.shape) #(853, 1280, 3)
pixel_values = image.reshape((-1, 3))
# 轉(zhuǎn)換為numpy的float32
pixel_values = np.float32(pixel_values)
print(pixel_values.shape) #(1091840, 3)
關(guān)于opencv下的kmean算法,函數(shù)為cv2.kmeans()
函數(shù)的格式為:kmeans(data, K, bestLabels, criteria, attempts, flags)
data: 分類(lèi)數(shù)據(jù),最好是np.float32的數(shù)據(jù),每個(gè)特征放一列。之所以是np.float32原因是這種數(shù)據(jù)類(lèi)型運(yùn)算速度快,如果是uint型數(shù)據(jù)將會(huì)很慢。
K: 分類(lèi)數(shù),opencv2的kmeans分類(lèi)是需要已知分類(lèi)數(shù)的。
bestLabels:預(yù)設(shè)的分類(lèi)標(biāo)簽:沒(méi)有的話(huà) None
criteria:迭代停止的模式選擇,這是一個(gè)含有三個(gè)元素的元組型數(shù)。格式為(type,max_iter,epsilon)
,max_iter
迭代次數(shù),epsilon
結(jié)果的精確性
其中,type又有三種選擇:
- cv2.TERM_CRITERIA_EPS :精確度(誤差)滿(mǎn)足epsilon停止。
- cv2.TERM_CRITERIA_MAX_ITER:迭代次數(shù)超過(guò)max_iter停止
- cv2.TERM_CRITERIA_EPS+cv2.TERM_CRITERIA_MAX_ITER,兩者合體,任意一個(gè)滿(mǎn)足結(jié)束。
- - attempts:重復(fù)試驗(yàn)kmeans算法次數(shù),將會(huì)返回最好的一次結(jié)果
flags:初始類(lèi)中心選擇,兩種方法
cv2.KMEANS_PP_CENTERS
算法kmeans++的center; cv2.KMEANS_RANDOM_CENTERS
隨機(jī)初始化
在這里,我們需要設(shè)置criteria
確定停止標(biāo)準(zhǔn)。我們將在超過(guò)某些迭代次數(shù)(例如500)時(shí)停止,或者如果集群移動(dòng)小于某個(gè) epsilon 值(讓我們?cè)谶@里選擇0.1),下面的代碼在OpenCV 中定義了這個(gè)停止標(biāo)準(zhǔn):
# 確定停止標(biāo)準(zhǔn)
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 500, 0.1)
上面圖像,會(huì)發(fā)現(xiàn)五種主要顏色(分別是天空、草地、樹(shù)、人的上身白,人的下身黑)
因此,我們將為這張圖片使用K=5:
k = 5
_, labels, (centers) = cv2.kmeans(pixel_values, k, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)
cv2.KMEANS_RANDOM_CENTERS只是指示OpenCV最初隨機(jī)分配集群的值。
我們將扁平化的圖像像素值轉(zhuǎn)換為浮點(diǎn)數(shù)32類(lèi)型,是因?yàn)閏v2.kmeans() 浮點(diǎn)數(shù)32類(lèi)型,然后,讓我們將浮點(diǎn)數(shù)轉(zhuǎn)換回8 位像素值np.uint8(centers)
:
# 轉(zhuǎn)換回np.uint8
centers = np.uint8(centers)
# 展平標(biāo)簽陣列
labels = labels.flatten()
segmented_image = centers[labels.flatten()]
轉(zhuǎn)換回原始圖像形狀并顯示:
#重塑回原始圖像尺寸
segmented_image = segmented_image.reshape(image.shape)
plt.imshow(segmented_image)
plt.show()
當(dāng)然,我們還可以禁用圖像中的一些K-Means 聚類(lèi)集群。例如,讓我們禁用集群編號(hào)1并顯示圖像:
# 禁用2號(hào)群集(將像素變?yōu)楹谏?
masked_image = np.copy(segmented_image)
# 轉(zhuǎn)換為像素值向量的形狀
masked_image = masked_image.reshape((-1, 3))
cluster1 = 1
masked_image[labels == cluster1] = [0, 0, 0]
# 轉(zhuǎn)換回原始形狀
masked_image = masked_image.reshape(image.shape)
plt.imshow(masked_image)
plt.show()
原來(lái)K-Means 聚類(lèi)2 號(hào)集群 是樹(shù)。
請(qǐng)注意,還有其他分割技術(shù),例如霍夫變換、輪廓檢測(cè)和當(dāng)前最先進(jìn)的語(yǔ)義分割。
到此這篇關(guān)于Python使用OpenCV和K-Means聚類(lèi)對(duì)畢業(yè)照進(jìn)行圖像分割的文章就介紹到這了,更多相關(guān)OpenCV和K-Means圖像分割內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- 基于OpenCV實(shí)現(xiàn)圖像分割
- C++中實(shí)現(xiàn)OpenCV圖像分割與分水嶺算法
- python+opencv圖像分割實(shí)現(xiàn)分割不規(guī)則ROI區(qū)域方法匯總
- python用opencv完成圖像分割并進(jìn)行目標(biāo)物的提取
- Opencv實(shí)現(xiàn)用于圖像分割分水嶺算法
- OpenCV圖像分割中的分水嶺算法原理與應(yīng)用詳解
- openCV實(shí)現(xiàn)圖像分割