基于 HOG-LBP 特征的中药饮片图像识别

2019-04-15 -

吕宇琛，王健庆浙江中医药大学医学技术学院，浙江杭州 310053

摘要：目的通过对方向梯度直方图（HOG）、局部二值模式（LBP）等特征提取及融合的方法研究，实现有效的中药饮片图像识别。方法分析 HOG 和 LBP 特征，进行特征融合，采取支持向量机（SVM）分类算法，在采集整理的中药饮片图像数据集基础上对算法进行训练、测试和改进，从而获得有效的中药饮片多分类模型，并将模型与其他算法进行比较，评价算法的有效性。结果通过对 30种中药饮片 2927 张图像的训练和测试，等价模式下的 HOG-LBP 融合特征算法的饮片图像识别率达 91.16%，优于传统算法。结论等价模式下 HOG-LBP 融合特征结合SVM分类器的方法具有较高的识别率，可有效应用于中药饮片的识别和分类。进一步提高数据种类和数据量，有助于提高算法的适用性和识别效果。关键词：中药饮片；图像识别；特征提取；方向梯度直方图；局部二值模式

中图分类号：R286.0；R2-05 文献标识码：A 文章编号：1005-5304(2019)04-0106-05

DOI：10.3969/j.issn.1005-5304.2019.04.022 开放科学（资源服务）标识码（OSID）：

Image Recognition of TCM Decoction Pieces Based on HOG-LBP

LYU Yuchen, WANG Jianqing

College of Medical Technology, Zhejiang Chinese Medical University, Hangzhou 310053, China Abstract: Objective To achieve effective image recognition of TCM decoction pieces through research on feature extraction and fusion of HOG and LBP. Methods The HOG and LBP features were analyzed, and feature fusion was performed. A support vector machine (SVM) classification algorithm was adopted. The algorithm was trained, tested and improved on the basis of collecting the image data of TCM decoction pieces, so as to obtain an effective multi-classification model of TCM decoction pieces. The model was compared with other algorithms to evaluate the effectiveness of the algorithm. Results Through the training and testing of 2927 images of 30 TCM decoction pieces, the HOG-LBP fusion feature algorithm in the equivalent mode had a segmentation rate of 91.16%, which was superior to the traditional algorithm. Conclusion The HOG-LBP fusion feature combined with the SVM classifier in the equivalent mode has a high recognition rate and can be effectively applied to the identification and classification of TCM decoction pieces. Further improving the type of data and the amount of data can help to improve the applicability and recognition of the algorithm.

Keywords: TCM decoction pieces; image recognition; feature extraction; HOG; LBP

药材识别是中药配方及饮片研究的关键技术之一，可用于中药鉴定、分类识别、质量品质统计等领域，对临床应用研究起重要作用，借助计算机及人工智能技术的识别研究具有较好前景和潜在经济价值。通过计算机辅助手段对中药饮片进行分类识别，基于机器学习的图像识别是最为有效和快捷的方法，特征提取是其核心技术之一。目前中药饮片图像识别研究尚未广泛开展，主要采取颜色特征[1-2]、形状特征[3-4]等，

基金项目：浙江省基础公益研究计划项目（LGG19F030008）；

教育部留学回国人员科研启动基金（2014年）通讯作者：王健庆，E-mail：wjq@zcmu.edu.cn但识别效率尚不理想，无法实现实用的样本分类。

在图像特征描述中，局部二值模式（LBP）[5]计算较简单，对图像局部特征描述较好，但单独使用对

[6]特征提取不完整。方向梯度直方图（HOG）特征通过计算梯度和方向的边缘密度，可较好描述局部目标边缘和形状信息。由于其对图像几何和光学变化可保持良好的不变性，被大量应用于多种物体的分

类[7-8]。本研究针对 HOG 和 LBP 特征描述子各自的特点和优势，根据中药饮片识别对边缘轮廓和局部纹理信息的要求，通过融合HOG 和 LBP特征的方法提取中药饮片图像特征，并采用LIBSVM 软件分类器进行图像分类，从而实现中药饮片图像的有效识别。

1 特征提取

1.1 方向梯度直方图特征提取本研究采用常用的30种中药饮片，其HOG 局部特征分布效果见图1。Descriptor  b 2  n  ( v  b  )  ( h  b ) （1）式中，b：块区域内边缘细胞单元数量；n：直方图通道特征数量；σ：模板单次滑动步长；v：细胞单元水平方向像素数；h：细胞单元垂直方向像素数。

研究过程中，各参数的选取对中药饮片样本识别准确率的影响见表 1。综合实验数据，计算可得Descriptor  22  9  (8  2  1)  (8  2  1) 1746 1.1.2提取步骤

图像归一化。对彩色图像进行 Gamma 压缩，以降低阴影和光照变化带来的影响。

梯度计算。对归一化的彩色图像进行卷积运算，得到水平和垂直方向梯度分量 Gy、Gx，计算当前像素梯度幅值G。

对梯度方向进行高斯减噪处理，降低误差累计传递等因素影响。

统计细胞单元内直方图通道特征。细胞单元像素特征值：

式中，h, v 为细胞所在块区域坐标，b 为直方图通道特征数量，Χ为细胞水平方向像素数量，Y 为细胞垂直方向像素数量。

特征标准化及块内特征整合。Oh,v,b归一化，以进一步消除光照影响：式中，P1为等价模式类数量，P2为非等价模式类数量，v 为区域边缘细胞单元数量，b 为模板滑动步长，σ为细胞单元像素数量，可得：

降维后可得59维特征向量。

1.3特征融合

HOG 特征对图像几何和光学的形状保持良好的不变性，单独使用 HOG 特征，能有效提取图像边缘局部纹理特征，但对非边缘主体部分及一些易混淆的边缘部分很难进行识别。而某些中药饮片图像主要的区别存在于细微的纹理特征上。

针对 HOG 特征在描述局部纹理特征不足的问题，根据 LBP 局部纹理描述较好的特性，本研究采用 HOG 融合 LBP的方法，以更好描述图像的整体和局部特征。通过将HOG特征向量与LBP特征向量进行串联，形成新的局部特征纹理描述。

Features  ( Features _ vectorHOG , Features _ vectorLBP ) （12） 2 分类器支持向量机（SVM）是一种有监督的学习模型，

可实现多分类问题[9]。本研究采用 LIBSVM 软件训练器，选用 C_SVC 训练模型以及线性分类算子，将样本及对应的标签导入LIBSVM 分类器，查找最优超平面。操作步骤：

①建立训练样本集合。设置样本数据空间，导入样本，设置样本类名及相应的标签。本实验中设置标签共 30 类。②设置相关训练参数。选择LIBSVM 训练的模型为 C_SVC，以及核函数为线性分类算子。③根据训练样本对 SVM 进行训练。其中，对 1477个训练样本数据的支持向量数为1364 个。④输出训练模型。在训练模型的核函数中，degree值为 3 801 155，gamma 值为 1.6912e-306，coef0 值为 1.2906e-306。

3 结果与分析

3.1 实验数据实验所用数据为阿胶珠、薜荔果、炒稻芽、炒牛膝、川贝母、大枣、牡丹皮、麸炒白芍、茯苓、覆盆子、枸杞子、花椒、淮小麦、莲子、蜜麸僵蚕、牵牛子、全蝎、山香圆叶、升麻、水飞蓟、水红花子、天麻、温山药、乌梢蛇、盐杜仲、薏苡仁、郁金、制何首乌、制吴茱萸及制远志 30 种常用中药饮片图像，均为 RGB模式下的 jpg 格式图像，见图2。

在MATLAB环境下对30类中药饮片图像进行识别。训练样本数量分别为 24、50、63、50、55、34、

40、16、46、19、23、154、50、104、24、155、29、

17、67、76、43、22、27、39、28、20、33、42、75、

52，总计 1477张。测试样本数量分别为 24、49、63、

50、55、34、40、15、45、16、22、153、50、1043、

23、154、29、16、67、75、43、21、27、38、27、

19、32、35、74、51，总计 1450 张。

3.2 实验分析实验测试了[等价模式(uniform)]LBP+HOG+[线性(linear)]SVM、[旋转不变模式(rotation- invariant)]

LBP+HOG+(linear)SVM、(uniform rotation–invariant)

LBP+HOG+(linear)SVM、(uniform)LBP+(linear)SVM、

HOG+(linear)SVM、(3 层金字塔)PHOG[24]+(linear) SVM 共 6种不同的方法。

6 组识别算法实验结果见图 3，所采用的维度、训练时间、检测时间以及样本识别率见表 2。实验结果表明，单独使用 HOG 特征对训练集识别率较高，

研究发现，实验样本数量的增加，有助于提高识别率。本研究侧重在 3000 样本数量级对中药饮片图像进行识别。训练样本比率为50%时，样本数量级对图像识别率的影响见图4。

根据不同中药饮片的形状及纹理特征，本研究将30种中药饮片分成段、颗粒、块、切片、枝叶5类进行分析研究。各类别饮片识别率见表 3。研究发现，段、块类的饮片识别率较低，主要由于此类饮片纹理差异较大，不同样本间特征呈多样化。而枝叶和颗粒但对测试集识别率较低，特别对易混淆样本区分度较差。通过对LBP 3种模式的识别率比较可知，提取的LBP特征模式主要分布在等价模式中，且中药饮片图像没有明显旋转现象。综合识别时间和识别率，与其他方法比较，采用 HOG 特征描述子融合等价模式下的 LBP特征描述子识别率为91.16%，识别效果更优。种类的饮片识别率较高，由于此类饮片共同纹理特征较多，特征比较单一。

50%训练样本下 30种中药样本的识别率见表4。其中山香圆叶的识别率最低，由于此类饮片呈不同的折叠破碎状，部分局部纹理在炮制过程中被破坏，对图像识别造成了较大影响。展平样本有助于提高识别精度，但不利于自动化操作。在训练样本的预测模型

中，1364个有效的支持向量数据均不位于类域之间的边界上。提示各类中药饮片提取出的特征存在共性。

4 小结近年来，图像识别技术已逐步应用于中医药领域[10]，极大推动了中医药客观化、标准化相关研究。采用模式识别方法不仅可提高中药饮片识别自动化程度及分类识别的稳定性，还能确保统一的分类结果，避免人工方法导致的分类结果不一致。实验表明， HOG 特征对样本局部纹理特征描述不足而导致易混淆饮片的识别不理想，LBP 可有效反映局部纹理特征，但对特征提取不完整。因此，融合的 HOG-LBP特征相较于单独特征方法，在识别率方面有了较大提高。今后研究可通过进一步提高样本的种类和数量，排除样本的偶然性，以提高模型适应性和算法的泛化性。同时，继续深入研究特征提取，以进一步提高识别率，并研究挖掘其更深层次的应用价值。

参考文献：

[1] YONG R, HUANG T S, CHANG S F. Image retrieval：current techniques, promising directions, and open issues[J]. Journal of Visual Communication and Image Representation,2015,10(1)：39-62.

[2] 木拉提•哈米提,员伟康,严传波,等.基于颜色直方图的新疆维吾尔医

药材图像特征提取与判别分析[J].生物医学工程学杂志,2015,32(3)：

588-593.

[3] 李震.中药饮片特征提取和识别系统[D].哈尔滨：哈尔滨工业大学,

2013.

[4] 黄道,何晋,刘志愿,等.组合分类器算法 bagging 和 adaboostM1 在中

草药分类的研究[J].中国新通信,2014,16(4)：21.

[5] OJALA T, PIETIKAINEN M, MAENPAA T. Gray scale and rotation invariant texture classification with local binary patterns[J]. European Conference on Computer Vision,2000,24(7)：404-420.

[6] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[J]. Computer Vision and Pattern Recognition,2005,

1(12)：886-893.

[7] 胡仕玲,顾爽,陈启军.基于 HOG 的物体分类方法[J].华中科技大学学

报：自然科学版,2011,39(S2)：124-126.

[8] MARCOS J, FERNÁNDEZ R. Computer vision for pedestrian detection using Histograms of Oriented Gradient[D]. Boston：Massachusetts Institute of Technology,2014.

[9] FLACH P A. On the state of the art in machine learning：A personal review[J]. Artificial Intelligence,2001,131(1)：199-222.

[10] 陈梦竹,岑翼刚,许家佗,等.基于图像处理的望诊面色自动识别研

究[J].中国中医药信息杂志,2018,25(12)：97-101.

（收稿日期：2018-03-20）

（修回日期：2019-02-16；编辑：向宇雁）