小嵌 发表于 2021-1-21 23:55:48

【HiSpark IPC DIY Camera试用连载 】第三篇 分水岭算法测试

【HiSpark IPC DIY Camera试用连载 】第三篇 分水岭算法测试, https://www.pcbbar.com/data/attachment/forum/202009/12/154809tz1xr3m1v91j82x8.jpg
本帖最后由 瑟寒凌风 于 2021-1-21 23:39 编辑




本文测试一下分水岭算法,使用python调用opencv和numpy处理数据。


分水岭算法主要用于图像分段,通常是把一副彩色图像灰度化,然后再求梯度图,最后在梯度图的基础上进行分水岭算法,求得分段图像的边缘线。分水岭算法的思想来源于地形学,它将图像看作是地形学上被水覆盖的自然地貌,图像中的每一像素的灰度值表示该点的海拔高度,其每一个局部极小值及其影响区域称为集水盆地,两集水盆地的边界则为分水岭。
通常描述分水岭变换有两种方法:一种是“雨滴法”,另一种方法是模拟“溢流”的过程。


分水岭的计算过程是一个迭代标注过程。分水岭比较经典的计算方法是L. Vincent提出的。在该算法中,分水岭计算分两个步骤,一个是排序过程,一个是淹没过程。首先对每个像素的灰度级进行从低到高排序,然后在从低到高实现淹没过程中,对每一个局部极小值在h阶高度的影响域采用先进先出(FIFO)结构进行判断及标注。


首先我们画几个图形,如下图



2.jpg (22.03 KB, 下载次数: 0)

下载附件保存到相册

24 分钟前 上传


这是我随手画的,使用的win10的画图工具。我们编程实现图形边界的识别。分水岭简单来说,就是识别图像轮廓的一种算法,好在python中已经实现了该算法。分水岭算法是使用很多算法叠加的总和,python的简单之处在此可见一斑。

[*]def getStructuringElement(shape: Any,   # 形状

[*]                      ksize: Any,       # kernel尺寸

[*]                      anchor: Any = None) -> None

[*]

复制代码
该函数用于获取结构化元素,然后可以进行形态学的操作,比如开闭运算,膨胀腐蚀等。其中的两个参数,一个是原始图像,一个是核。核这个东西就不介绍了,原理不复杂,一说一大堆。

[*]def morphologyEx(src: Any,

[*]               op: Any,

[*]               kernel: Any,

[*]               dst: Any = None,

[*]               anchor: Any = None,

[*]               iterations: Any = None,

[*]               borderType: Any = None,

[*]               borderValue: Any = None) -> None

[*]

复制代码
该函数用于形态学滤波,其参数在代码中都列出来了的。

[*]def dilate(src: Any,

[*]         kernel: Any,

[*]         dst: Any = None,

[*]         anchor: Any = None,

[*]         iterations: Any = None,

[*]         borderType: Any = None,

[*]         borderValue: Any = None) -> None

[*]

复制代码
该函数用于图像的膨胀操作,通过相邻像素范围内的局部极大运算来膨胀一张图片,从参数src输入,dst输出,其中第二个参数就是前面的核。

[*]def distanceTransform(src: Any,

[*]                      distanceType: Any,

[*]                      maskSize: Any,

[*]                      dst: Any = None,

[*]                      dstType: Any = None) -> None

[*]

复制代码
上面函数是二值化函数,用于对图像的二值化操作,这是个常用函数。图像二值化是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。

[*]def subtract(src1: Any,

[*]             src2: Any,

[*]             dst: Any = None,

[*]             mask: Any = None,

[*]             dtype: Any = None) -> None

[*]

复制代码
该函数为图像相减操作,是将二值化的图像使用相应位置的像素进行相减操作。

[*]def watershed(image: Any,

[*]            markers: Any) -> None

[*]

复制代码
该函数是分水岭的基本函数,算法使用效果主要就是该函数完成,其参数在代码的注释中已经标注出来了。
其效果如下图所示,在圆形的边界位置,已经用细小的红线在绘制出识别区域。

1.jpg (70.92 KB, 下载次数: 0)

下载附件保存到相册

19 分钟前 上传



源代码如下



[*]# -*- coding: utf-8 -*-

[*]

[*]import cv2

[*]import numpy as np

[*]

[*]camera = cv2.VideoCapture(0)

[*]

[*]# 判断视频是否打开

[*]if (camera.isOpened()):

[*]    print(\“Open\“)

[*]else:

[*]    print(\“摄像头未打开\“)

[*]

[*]# 测试用,查看视频size

[*]size = (int(camera.get(cv2.CAP_PROP_FRAME_WIDTH)),

[*]      int(camera.get(cv2.CAP_PROP_FRAME_HEIGHT)))

[*]print(\“size:\“ + repr(size))

[*]

[*]

[*]while True:

[*]    # 读取视频流

[*]    grabbed, frame_lwpCV = camera.read()

[*]    gray_lwpCV = cv2.cvtColor(frame_lwpCV, cv2.COLOR_BGR2GRAY)

[*]    ret, binary = cv2.threshold(gray_lwpCV, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)# 二值化

[*]    cv2.imshow(“binary_image“, binary)

[*]    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))# 产生一个kernel

[*]    \“\“\“

[*]    def getStructuringElement(shape: Any,   # 形状

[*]                        ksize: Any,       # kernel尺寸

[*]                        anchor: Any = None) -> None

[*]    \“\“\“

[*]    mb = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel, iterations=2)# 形态学操作

[*]    \“\“\“

[*]    def morphologyEx(src: Any,          # 原图像

[*]               op: Any,               # 操作类型

[*]                                        # MORPH_ERODE    = 0, //腐蚀

[*]                                        # MORPH_DILATE   = 1, //膨胀

[*]                                        # MORPH_OPEN   = 2, //开操作

[*]                                        # MORPH_CLOSE    = 3, //闭操作

[*]                                        # MORPH_GRADIENT = 4, //梯度操作

[*]                                        # MORPH_TOPHAT   = 5, //顶帽操作

[*]                                        # MORPH_BLACKHAT = 6, //黑帽操作

[*]                                        # MORPH_HITMISS= 7

[*]               kernel: Any,         # 用于膨胀操作的结构元素,kernel

[*]               dst: Any = None,

[*]               anchor: Any = None,    # 参考点

[*]               iterations: Any = None,

[*]               borderType: Any = None,

[*]               borderValue: Any = None) -> None

[*]    MORPH_OPEN(开),内部就是进行了先腐蚀后膨胀的操作。

[*]    MORPH_CLOSE(闭),其实内部就是进行了先膨胀后腐蚀的操作。

[*]    MORPH_GRADIENT(梯度),内部是膨胀减去腐蚀。

[*]    \“\“\“

[*]    sure_bg = cv2.dilate(mb, kernel, iterations=3)# 对输入图像用特定结构元素进行膨胀操作

[*]    \“\“\“

[*]    def dilate(src: Any,

[*]         kernel: Any,

[*]         dst: Any = None,

[*]         anchor: Any = None,

[*]         iterations: Any = None,

[*]         borderType: Any = None,

[*]         borderValue: Any = None) -> None

[*]    \“\“\“

[*]    cv2.imshow(“mor_opt“, sure_bg)

[*]

[*]    # 距离变换

[*]    dist = cv2.distanceTransform(mb, cv2.DIST_L2, 3)# 距离变换

[*]    \“\“\“

[*]    def distanceTransform(src: Any,         # 二值化图像

[*]                      distanceType: Any,    # 计算距离的类型,CV_DIST_L1、CV_DIST_L2 、CV_DIST_C

[*]                      maskSize: Any,      # 距离变换掩码矩阵的大小

[*]                      dst: Any = None,

[*]                      dstType: Any = None) -> None

[*]    \“\“\“

[*]    dist_output = cv2.normalize(dist, 0, 1.0, cv2.NORM_MINMAX)

[*]    cv2.imshow(“distance_t“, dist_output * 50)

[*]    ret, suRFace = cv2.threshold(dist, dist.max() * 0.6, 255, cv2.THRESH_BINARY)

[*]    cv2.imshow(“surface_bin“, surface)

[*]    surface_fg = np.uint8(surface)

[*]    unknown = cv2.subtract(sure_bg, surface_fg)# 图像的相减操作

[*]    \“\“\“

[*]    def subtract(src1: Any,

[*]             src2: Any,

[*]             dst: Any = None,

[*]             mask: Any = None,# 可选操作掩码; 这是一个8位单通道数组,用于指定要更改的输出数组的元素。

[*]             dtype: Any = None) -> None # 输出阵列的可选深度

[*]    \“\“\“

[*]    ret, markers = cv2.connectedComponents(surface_fg)# 连通域标识

[*]    \“\“\“

[*]    def connectedComponents(image: Any,             # image是threshold得到的二值图

[*]                        labels: Any = None,

[*]                        connectivity: Any = None,

[*]                        ltype: Any = None) -> None

[*]    \“\“\“

[*]    print(ret)

[*]

[*]    # 分水岭

[*]    markers = markers + 1

[*]    markers = 0

[*]    markers = cv2.watershed(frame_lwpCV, markers=markers)

[*]    \“\“\“

[*]    def watershed(image: Any,

[*]            markers: Any) -> None

[*]    第二个入参markers必须包含了种子点信息。

[*]    在执行分水岭函数watershed之前,必须对第二个参数markers进行处理,它应该包含不同区域的轮廓,

[*]    每个轮廓有一个自己唯一的编号,轮廓的定位可以通过Opencv中findContours方法实现,这个是执行

[*]    分水岭之前的要求。接下来执行分水岭会发生什么呢?算法会根据markers传入的轮廓作为种子(也就是

[*]    所谓的注水点),对图像上其他的像素点根据分水岭算法规则进行判断,并对每个像素点的区域归属进行划

[*]    定,直到处理完图像上所有像素点。而区域与区域之间的分界处的值被置为“-1”,以做区分。

[*]    \“\“\“

[*]    frame_lwpCV =

[*]    cv2.imshow(“result_image“, frame_lwpCV)

[*]

[*]    key = cv2.waitKey(1) & 0xFF

[*]    # 按\“q\“健退出循环

[*]    if key == ord(\“q\“):

[*]      break

[*]

[*]# When everything done, release the capture

[*]camera.release()

[*]cv2.destroyAllWindows()

复制代码
页: [1]
查看完整版本: 【HiSpark IPC DIY Camera试用连载 】第三篇 分水岭算法测试