【HiSpark IPC DIY Camera试用连载 】第三篇 分水岭算法测试
【HiSpark IPC DIY Camera试用连载 】第三篇 分水岭算法测试, https://www.pcbbar.com/data/attachment/forum/202009/12/154809tz1xr3m1v91j82x8.jpg本帖最后由 瑟寒凌风 于 2021-1-21 23:39 编辑
本文测试一下分水岭算法,使用python调用opencv和numpy处理数据。
分水岭算法主要用于图像分段,通常是把一副彩色图像灰度化,然后再求梯度图,最后在梯度图的基础上进行分水岭算法,求得分段图像的边缘线。分水岭算法的思想来源于地形学,它将图像看作是地形学上被水覆盖的自然地貌,图像中的每一像素的灰度值表示该点的海拔高度,其每一个局部极小值及其影响区域称为集水盆地,两集水盆地的边界则为分水岭。
通常描述分水岭变换有两种方法:一种是“雨滴法”,另一种方法是模拟“溢流”的过程。
分水岭的计算过程是一个迭代标注过程。分水岭比较经典的计算方法是L. Vincent提出的。在该算法中,分水岭计算分两个步骤,一个是排序过程,一个是淹没过程。首先对每个像素的灰度级进行从低到高排序,然后在从低到高实现淹没过程中,对每一个局部极小值在h阶高度的影响域采用先进先出(FIFO)结构进行判断及标注。
首先我们画几个图形,如下图
2.jpg (22.03 KB, 下载次数: 0)
下载附件保存到相册
24 分钟前 上传
这是我随手画的,使用的win10的画图工具。我们编程实现图形边界的识别。分水岭简单来说,就是识别图像轮廓的一种算法,好在python中已经实现了该算法。分水岭算法是使用很多算法叠加的总和,python的简单之处在此可见一斑。
[*]def getStructuringElement(shape: Any, # 形状
[*] ksize: Any, # kernel尺寸
[*] anchor: Any = None) -> None
[*]
复制代码
该函数用于获取结构化元素,然后可以进行形态学的操作,比如开闭运算,膨胀腐蚀等。其中的两个参数,一个是原始图像,一个是核。核这个东西就不介绍了,原理不复杂,一说一大堆。
[*]def morphologyEx(src: Any,
[*] op: Any,
[*] kernel: Any,
[*] dst: Any = None,
[*] anchor: Any = None,
[*] iterations: Any = None,
[*] borderType: Any = None,
[*] borderValue: Any = None) -> None
[*]
复制代码
该函数用于形态学滤波,其参数在代码中都列出来了的。
[*]def dilate(src: Any,
[*] kernel: Any,
[*] dst: Any = None,
[*] anchor: Any = None,
[*] iterations: Any = None,
[*] borderType: Any = None,
[*] borderValue: Any = None) -> None
[*]
复制代码
该函数用于图像的膨胀操作,通过相邻像素范围内的局部极大运算来膨胀一张图片,从参数src输入,dst输出,其中第二个参数就是前面的核。
[*]def distanceTransform(src: Any,
[*] distanceType: Any,
[*] maskSize: Any,
[*] dst: Any = None,
[*] dstType: Any = None) -> None
[*]
复制代码
上面函数是二值化函数,用于对图像的二值化操作,这是个常用函数。图像二值化是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。
[*]def subtract(src1: Any,
[*] src2: Any,
[*] dst: Any = None,
[*] mask: Any = None,
[*] dtype: Any = None) -> None
[*]
复制代码
该函数为图像相减操作,是将二值化的图像使用相应位置的像素进行相减操作。
[*]def watershed(image: Any,
[*] markers: Any) -> None
[*]
复制代码
该函数是分水岭的基本函数,算法使用效果主要就是该函数完成,其参数在代码的注释中已经标注出来了。
其效果如下图所示,在圆形的边界位置,已经用细小的红线在绘制出识别区域。
1.jpg (70.92 KB, 下载次数: 0)
下载附件保存到相册
19 分钟前 上传
源代码如下
[*]# -*- coding: utf-8 -*-
[*]
[*]import cv2
[*]import numpy as np
[*]
[*]camera = cv2.VideoCapture(0)
[*]
[*]# 判断视频是否打开
[*]if (camera.isOpened()):
[*] print(\“Open\“)
[*]else:
[*] print(\“摄像头未打开\“)
[*]
[*]# 测试用,查看视频size
[*]size = (int(camera.get(cv2.CAP_PROP_FRAME_WIDTH)),
[*] int(camera.get(cv2.CAP_PROP_FRAME_HEIGHT)))
[*]print(\“size:\“ + repr(size))
[*]
[*]
[*]while True:
[*] # 读取视频流
[*] grabbed, frame_lwpCV = camera.read()
[*] gray_lwpCV = cv2.cvtColor(frame_lwpCV, cv2.COLOR_BGR2GRAY)
[*] ret, binary = cv2.threshold(gray_lwpCV, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)# 二值化
[*] cv2.imshow(“binary_image“, binary)
[*] kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))# 产生一个kernel
[*] \“\“\“
[*] def getStructuringElement(shape: Any, # 形状
[*] ksize: Any, # kernel尺寸
[*] anchor: Any = None) -> None
[*] \“\“\“
[*] mb = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel, iterations=2)# 形态学操作
[*] \“\“\“
[*] def morphologyEx(src: Any, # 原图像
[*] op: Any, # 操作类型
[*] # MORPH_ERODE = 0, //腐蚀
[*] # MORPH_DILATE = 1, //膨胀
[*] # MORPH_OPEN = 2, //开操作
[*] # MORPH_CLOSE = 3, //闭操作
[*] # MORPH_GRADIENT = 4, //梯度操作
[*] # MORPH_TOPHAT = 5, //顶帽操作
[*] # MORPH_BLACKHAT = 6, //黑帽操作
[*] # MORPH_HITMISS= 7
[*] kernel: Any, # 用于膨胀操作的结构元素,kernel
[*] dst: Any = None,
[*] anchor: Any = None, # 参考点
[*] iterations: Any = None,
[*] borderType: Any = None,
[*] borderValue: Any = None) -> None
[*] MORPH_OPEN(开),内部就是进行了先腐蚀后膨胀的操作。
[*] MORPH_CLOSE(闭),其实内部就是进行了先膨胀后腐蚀的操作。
[*] MORPH_GRADIENT(梯度),内部是膨胀减去腐蚀。
[*] \“\“\“
[*] sure_bg = cv2.dilate(mb, kernel, iterations=3)# 对输入图像用特定结构元素进行膨胀操作
[*] \“\“\“
[*] def dilate(src: Any,
[*] kernel: Any,
[*] dst: Any = None,
[*] anchor: Any = None,
[*] iterations: Any = None,
[*] borderType: Any = None,
[*] borderValue: Any = None) -> None
[*] \“\“\“
[*] cv2.imshow(“mor_opt“, sure_bg)
[*]
[*] # 距离变换
[*] dist = cv2.distanceTransform(mb, cv2.DIST_L2, 3)# 距离变换
[*] \“\“\“
[*] def distanceTransform(src: Any, # 二值化图像
[*] distanceType: Any, # 计算距离的类型,CV_DIST_L1、CV_DIST_L2 、CV_DIST_C
[*] maskSize: Any, # 距离变换掩码矩阵的大小
[*] dst: Any = None,
[*] dstType: Any = None) -> None
[*] \“\“\“
[*] dist_output = cv2.normalize(dist, 0, 1.0, cv2.NORM_MINMAX)
[*] cv2.imshow(“distance_t“, dist_output * 50)
[*] ret, suRFace = cv2.threshold(dist, dist.max() * 0.6, 255, cv2.THRESH_BINARY)
[*] cv2.imshow(“surface_bin“, surface)
[*] surface_fg = np.uint8(surface)
[*] unknown = cv2.subtract(sure_bg, surface_fg)# 图像的相减操作
[*] \“\“\“
[*] def subtract(src1: Any,
[*] src2: Any,
[*] dst: Any = None,
[*] mask: Any = None,# 可选操作掩码; 这是一个8位单通道数组,用于指定要更改的输出数组的元素。
[*] dtype: Any = None) -> None # 输出阵列的可选深度
[*] \“\“\“
[*] ret, markers = cv2.connectedComponents(surface_fg)# 连通域标识
[*] \“\“\“
[*] def connectedComponents(image: Any, # image是threshold得到的二值图
[*] labels: Any = None,
[*] connectivity: Any = None,
[*] ltype: Any = None) -> None
[*] \“\“\“
[*] print(ret)
[*]
[*] # 分水岭
[*] markers = markers + 1
[*] markers = 0
[*] markers = cv2.watershed(frame_lwpCV, markers=markers)
[*] \“\“\“
[*] def watershed(image: Any,
[*] markers: Any) -> None
[*] 第二个入参markers必须包含了种子点信息。
[*] 在执行分水岭函数watershed之前,必须对第二个参数markers进行处理,它应该包含不同区域的轮廓,
[*] 每个轮廓有一个自己唯一的编号,轮廓的定位可以通过Opencv中findContours方法实现,这个是执行
[*] 分水岭之前的要求。接下来执行分水岭会发生什么呢?算法会根据markers传入的轮廓作为种子(也就是
[*] 所谓的注水点),对图像上其他的像素点根据分水岭算法规则进行判断,并对每个像素点的区域归属进行划
[*] 定,直到处理完图像上所有像素点。而区域与区域之间的分界处的值被置为“-1”,以做区分。
[*] \“\“\“
[*] frame_lwpCV =
[*] cv2.imshow(“result_image“, frame_lwpCV)
[*]
[*] key = cv2.waitKey(1) & 0xFF
[*] # 按\“q\“健退出循环
[*] if key == ord(\“q\“):
[*] break
[*]
[*]# When everything done, release the capture
[*]camera.release()
[*]cv2.destroyAllWindows()
复制代码
页:
[1]