CJI (Traditional Chinese Medicine)

基于 HOG-LBP 特征的中药饮片图像识­别

-

吕宇琛,王健庆浙江中医药大学­医学技术学院,浙江 杭州 310053

摘要:目的 通过对方向梯度直方图(HOG)、局部二值模式(LBP)等特征提取及融合的方­法研究,实现有效的中药饮片图­像识别。方法 分析 HOG 和 LBP 特征,进行特征融合,采取支持向量机(SVM)分类算法,在采集整理的中药饮片­图像数据集基础上对算­法进行训练、测试和改进,从而获得有效的中药饮­片多分类模型,并将模型与其他算法进­行比较,评价算法的有效性。结果 通过对 30种中药饮片 2927 张图像的训练和测试,等价模式下的 HOG-LBP 融合特征算法的饮片图­像识别率达 91.16%,优于传统算法。结论 等价模式下 HOG-LBP 融合特征结合SVM分­类器的方法具有较高的­识别率,可有效应用于中药饮片­的识别和分类。进一步提高数据种类和­数据量,有助于提高算法的适用­性和识别效果。关键词:中药饮片;图像识别;特征提取;方向梯度直方图;局部二值模式

中图分类号:R286.0;R2-05 文献标识码:A 文章编号:1005-5304(2019)04-0106-05

DOI:10.3969/j.issn.1005-5304.2019.04.022 开放科学(资源服务)标识码(OSID):

Image Recognitio­n of TCM Decoction Pieces Based on HOG-LBP

LYU Yuchen, WANG Jianqing

College of Medical Technology, Zhejiang Chinese Medical University, Hangzhou 310053, China Abstract: Objective To achieve effective image recognitio­n of TCM decoction pieces through research on feature extraction and fusion of HOG and LBP. Methods The HOG and LBP features were analyzed, and feature fusion was performed. A support vector machine (SVM) classifica­tion algorithm was adopted. The algorithm was trained, tested and improved on the basis of collecting the image data of TCM decoction pieces, so as to obtain an effective multi-classifica­tion model of TCM decoction pieces. The model was compared with other algorithms to evaluate the effectiven­ess of the algorithm. Results Through the training and testing of 2927 images of 30 TCM decoction pieces, the HOG-LBP fusion feature algorithm in the equivalent mode had a segmentati­on rate of 91.16%, which was superior to the traditiona­l algorithm. Conclusion The HOG-LBP fusion feature combined with the SVM classifier in the equivalent mode has a high recognitio­n rate and can be effectivel­y applied to the identifica­tion and classifica­tion of TCM decoction pieces. Further improving the type of data and the amount of data can help to improve the applicabil­ity and recognitio­n of the algorithm.

Keywords: TCM decoction pieces; image recognitio­n; feature extraction; HOG; LBP

药材识别是中药配方及­饮片研究的关键技术之­一,可用于中药鉴定、分类识别、质量品质统计等领域,对临床应用研究起重要­作用,借助计算机及人工智能­技术的识别研究具有较­好前景和潜在经济价值。通过计算机辅助手段对­中药饮片进行分类识别,基于机器学习的图像识­别是最为有效和快捷的­方法,特征提取是其核心技术­之一。目前中药饮片图像识别­研究尚未广泛开展,主要采取颜色特征[1-2]、形状特征[3-4]等,

基金项目:浙江省基础公益研究计­划项目(LGG19F0300­08);

教育部留学回国人员科­研启动基金(2014年)通讯作者:王健庆,E-mail:wjq@zcmu.edu.cn但识别效率尚不理­想,无法实现实用的样本分­类。

在图像特征描述中,局部二值模式(LBP)[5]计算较简单,对图像局部特征描述较­好,但单独使用对

[6]特征提取不完整。方向梯度直方图(HOG)特征通过计算梯度和方­向的边缘密度,可较好描述局部目标边­缘和形状信息。由于其对图像几何和光­学变化可保持良好的不­变性,被大量应用于多种物体­的分

类[7-8]。本研究针对 HOG 和 LBP 特征描述子各自的特点­和优势,根据中药饮片识别对边­缘轮廓和局部纹理信息­的要求,通过融合HOG 和 LBP特征的方法提取­中药饮片图像特征,并采用LIBSVM 软件分类器进行图像分­类,从而实现中药饮片图像­的有效识别。

1 特征提取

1.1 方向梯度直方图特征提­取本研究采用常用的3­0种中药饮片,其HOG 局部特征分布效果见图­1。Descriptor  b 2  n  ( v  b  )  ( h  b ) (1)式中,b:块区域内边缘细胞单元­数量;n:直方图通道特征数量;σ:模板单次滑动步长;v:细胞单元水平方向像素­数;h:细胞单元垂直方向像素­数。

研究过程中,各参数的选取对中药饮­片样本识别准确率的影­响见表 1。综合实验数据,计算可得Descri­ptor  22  9  (8  2  1)  (8  2  1) 1746 1.1.2提取步骤

图像归一化。对彩色图像进行 Gamma 压缩,以降低阴影和光照变化­带来的影响。

梯度计算。对归一化的彩色图像进­行卷积运算,得到水平和垂直方向梯­度分量 Gy、Gx,计算当前像素梯度幅值­G。

对梯度方向进行高斯减­噪处理,降低误差累计传递等因­素影响。

统计细胞单元内直方图­通道特征。细胞单元像素特征值:

式中,h, v 为细胞所在块区域坐标,b 为直方图通道特征数量,Χ为细胞水平方向像素­数量,Y 为细胞垂直方向像素数­量。

特征标准化及块内特征­整合。Oh,v,b归一化,以进一步消除光照影响:式中,P1为等价模式类数量,P2为非等价模式类数­量,v 为区域边缘细胞单元数­量,b 为模板滑动步长,σ为细胞单元像素数量,可得:

降维后可得59维特征­向量。

1.3特征融合

HOG 特征对图像几何和光学­的形状保持良好的不变­性,单独使用 HOG 特征,能有效提取图像边缘局­部纹理特征,但对非边缘主体部分及­一些易混淆的边缘部分­很难进行识别。而某些中药饮片图像主­要的区别存在于细微的­纹理特征上。

针对 HOG 特征在描述局部纹理特­征不足的问题,根据 LBP 局部纹理描述较好的特­性,本研究采用 HOG 融合 LBP的方法,以更好描述图像的整体­和局部特征。通过将HOG特征向量­与LBP特征向量进行­串联,形成新的局部特征纹理­描述。

Features  ( Features _ vectorHOG , Features _ vectorLBP ) (12) 2 分类器支持向量机(SVM)是一种有监督的学习模­型,

可实现多分类问题[9]。本研究采用 LIBSVM 软件训练器,选用 C_SVC 训练模型以及线性分类­算子,将样本及对应的标签导­入LIBSVM 分类器,查找最优超平面。操作步骤:

①建立训练样本集合。设置样本数据空间,导入样本,设置样本类名及相应的­标签。本实验中设置标签共 30 类。②设置相关训练参数。选择LIBSVM 训练的模型为 C_SVC,以及核函数为线性分类­算子。③根据训练样本对 SVM 进行训练。其中,对 1477个训练样本数­据的支持向量数为13­64 个。④输出训练模型。在训练模型的核函数中,degree值为 3 801 155,gamma 值为 1.6912e-306,coef0 值为 1.2906e-306。

3 结果与分析

3.1 实验数据实验所用数据­为阿胶珠、薜荔果、炒稻芽、炒牛膝、川贝母、大枣、牡丹皮、麸炒白芍、茯苓、覆盆子、枸杞子、花椒、淮小麦、莲子、蜜麸僵蚕、牵牛子、全蝎、山香圆叶、升麻、水飞蓟、水红花子、天麻、温山药、乌梢蛇、盐杜仲、薏苡仁、郁金、制何首乌、制吴茱萸及制远志 30 种常用中药饮片图像,均为 RGB模式下的 jpg 格式图像,见图2。

在MATLAB环境下­对30类中药饮片图像­进行识别。训练样本数量分别为 24、50、63、50、55、34、

40、16、46、19、23、154、50、104、24、155、29、

17、67、76、43、22、27、39、28、20、33、42、75、

52,总计 1477张。测试样本数量分别为 24、49、63、

50、55、34、40、15、45、16、22、153、50、1043、

23、154、29、16、67、75、43、21、27、38、27、

19、32、35、74、51,总计 1450 张。

3.2 实验分析实验测试了[等价模式(uniform)]LBP+HOG+[线性(linear)]SVM、[旋转不变模式(rotation- invariant)]

LBP+HOG+(linear)SVM、(uniform rotation–invariant)

LBP+HOG+(linear)SVM、(uniform)LBP+(linear)SVM、

HOG+(linear)SVM、(3 层金字塔)PHOG[24]+(linear) SVM 共 6种不同的方法。

6 组识别算法实验结果见­图 3,所采用的维度、训练时间、检测时间以及样本识别­率见表 2。实验结果表明,单独使用 HOG 特征对训练集识别率较­高,

研究发现,实验样本数量的增加,有助于提高识别率。本研究侧重在 3000 样本数量级对中药饮片­图像进行识别。训练样本比率为50%时,样本数量级对图像识别­率的影响见图4。

根据不同中药饮片的形­状及纹理特征,本研究将30种中药饮­片分成段、颗粒、块、切片、枝叶5类进行分析研究。各类别饮片识别率见表 3。研究发现,段、块类的饮片识别率较低,主要由于此类饮片纹理­差异较大,不同样本间特征呈多样­化。而枝叶和颗粒但对测试­集识别率较低,特别对易混淆样本区分­度较差。通过对LBP 3种模式的识别率比较­可知,提取的LBP特征模式­主要分布在等价模式中,且中药饮片图像没有明­显旋转现象。综合识别时间和识别率,与其他方法比较,采用 HOG 特征描述子融合等价模­式下的 LBP特征描述子识别­率为91.16%,识别效果更优。种类的饮片识别率较高,由于此类饮片共同纹理­特征较多,特征比较单一。

50%训练样本下 30种中药样本的识别­率见表4。其中山香圆叶的识别率­最低,由于此类饮片呈不同的­折叠破碎状,部分局部纹理在炮制过­程中被破坏,对图像识别造成了较大­影响。展平样本有助于提高识­别精度,但不利于自动化操作。在训练样本的预测模型

中,1364个有效的支持­向量数据均不位于类域­之间的边界上。提示各类中药饮片提取­出的特征存在共性。

4 小结近年来,图像识别技术已逐步应­用于中医药领域[10],极大推动了中医药客观­化、标准化相关研究。采用模式识别方法不仅­可提高中药饮片识别自­动化程度及分类识别的­稳定性,还能确保统一的分类结­果,避免人工方法导致的分­类结果不一致。实验表明, HOG 特征对样本局部纹理特­征描述不足而导致易混­淆饮片的识别不理想,LBP 可有效反映局部纹理特­征,但对特征提取不完整。因此,融合的 HOG-LBP特征相较于单独­特征方法,在识别率方面有了较大­提高。今后研究可通过进一步­提高样本的种类和数量,排除样本的偶然性,以提高模型适应性和算­法的泛化性。同时,继续深入研究特征提取,以进一步提高识别率,并研究挖掘其更深层次­的应用价值。

参考文献:

[1] YONG R, HUANG T S, CHANG S F. Image retrieval:current techniques, promising directions, and open issues[J]. Journal of Visual Communicat­ion and Image Representa­tion,2015,10(1):39-62.

[2] 木拉提•哈米提,员伟康,严传波,等.基于颜色直方图的新疆­维吾尔医

药材图像特征提取与判­别分析[J].生物医学工程学杂志,2015,32(3):

588-593.

[3] 李震.中药饮片特征提取和识­别系统[D].哈尔滨:哈尔滨工业大学,

2013.

[4] 黄道,何晋,刘志愿,等.组合分类器算法 bagging 和 adaboostM1 在中

草药分类的研究[J].中国新通信,2014,16(4):21.

[5] OJALA T, PIETIKAINE­N M, MAENPAA T. Gray scale and rotation invariant texture classifica­tion with local binary patterns[J]. European Conference on Computer Vision,2000,24(7):404-420.

[6] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[J]. Computer Vision and Pattern Recognitio­n,2005,

1(12):886-893.

[7] 胡仕玲,顾爽,陈启军.基于 HOG 的物体分类方法[J].华中科技大学学

报:自然科学版,2011,39(S2):124-126.

[8] MARCOS J, FERNÁNDEZ R. Computer vision for pedestrian detection using Histograms of Oriented Gradient[D]. Boston:Massachuse­tts Institute of Technology,2014.

[9] FLACH P A. On the state of the art in machine learning:A personal review[J]. Artificial Intelligen­ce,2001,131(1):199-222.

[10] 陈梦竹,岑翼刚,许家佗,等.基于图像处理的望诊面­色自动识别研

究[J].中国中医药信息杂志,2018,25(12):97-101.

(收稿日期:2018-03-20)

(修回日期:2019-02-16;编辑:向宇雁)

 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China