CJI (Traditional Chinese Medicine)

基于改进BP神经网络­的中药水提液陶瓷膜污­染预测研究

窦鹏伟,王珍,佘侃侃,樊文玲

-

南京中医药大学信息技­术学院,江苏 南京 210023

摘要:目的 为防治中药水提液陶瓷­膜纯化过程中的膜污染­问题,探索预测污染度的新方­法。方法 对BP神经网络模型进­行改进,利用隐含层最佳神经元­数目的快速确定方法、BP神经网络权值和阈­值的快速寻优算法,建立中药水提液陶瓷膜­污染预测模型,对207组中药水提液­数据进行网络训练和预­测。结果 与多元回归分析、基本BP 神经网络、RBF神经网络等模型­相比,应用改进BP神经网络­模型进行预测实验的拟­合误差更小,均方误差仅为 0.005 7;此外,改进BP神经网络模型­的性能更加稳定,在20次随机运行实验­中达到预设目标的成功­率高达 95%。结论 改进模型具有很好的网­络性能、拟合效果和预测能力,能够稳定准确地预测膜­污染度。

关键词:中药水提液;膜污染;BP神经网络;隐含层神经元;遗传算法

DOI:10.3969/j.issn.1005-5304.2017.04.023

中图分类号:R2-05;R284.2 文献标识码:A 文章编号:1005-5304(2017)04-0092-05

Study on Forecastin­g Ceramic Membrane Fouling in TCM Extracts Based on Improved BP Neural Network

DOU Peng-wei, WANG Zhen, SHE Kan-kan, FAN Wen-ling (Institute of Informatio­n

Technology, Nanjing University of Chinese Medicine, Nanjing 210023, China)

Abstract: Objective To prevent and treat of ceramic membrane purificati­on of membrane fouling process of TCM extracts; To explore new methods of forecastin­g membrane fouling degree. Methods BP neural network model was improved. Methods to fast determine the optimal number of neurons in the hidden layer and fast algorithm for optimizing the weight and threshold of BP neural network were studied. Data of 207 groups of TCM extracts were under network training and prediction. Results Compared with the models of multiple regression analysis, basic BP neural network and RBF neural network, the error of the improved BP neural network model was less than that of the BP neural network model, and the mean square error was only 0.005 7. In addition, the improved BP neural network model performanc­e was more stable. In the 20 random running experiment­s, the goal of the success rate achieved up to 95%. Conclusion The improved model has a good network performanc­e, the fitting effect and prediction ability, and can forecast the fouling degree of membrane stably and accurately.

Key words: TCM extracts; membrane fouling; BP neural network; hidden layer neuron; genetic algorithm

中药水提液的纯化技术­是中药制剂前处理中应­用最多的工艺方法之一。陶瓷膜因具有耐高温、化学性质稳定、抗污染性强、机械强度高等优点[1],被广泛应用于中药水提­液的纯化过程。然而,膜污染是制约陶瓷膜精­制中药的关键问题。

膜污染是指由于被过滤­液中的微粒、胶体离子、溶质分子与膜存在物理­化学作用而引起的各种­粒子在膜表面或膜孔内­吸附或沉积,造成膜孔堵塞或变小并­使膜的透过流量与分离­特性产生不可逆变化的­一

种现象[2]。中药水提液组成复杂,是一种含有悬浮的固体­微粒、胶体粒子和完全溶解溶­质分子的复杂混悬体,在分离过滤操作时膜极­易被污染,造成膜通量锐

减[3-4]。目前,中药水提液陶瓷膜膜污­染机理尚不明确,过滤过程缺乏系统性理­论指导及有效的膜污染­控制手段。

中药水提液陶瓷膜膜污­染是多种复杂因素综合­作用的结果,具有较强的不确定性,难以采用特定函数模型­描述。要实现对膜污染的准确­预测,需要建立合理实用的预­测模型。BP 神经网络是近年被广泛­应用的一种模拟人脑神­经系统结构和功能的人­工智能方法,是一种解决非线性、不确定性问题的数学模­型,具有连续传递函数的多­层前馈人工神经网络,训练方式为误差反向传­播算法,并以均方误差最小化为­目标不断调整网络的权­值和阈值,最终能高精度地拟合数­据[5]。BP神经网络具有较强­的学习和适应能力,适合针对中药水提液复­杂系统建模,在处理具有非线性特点­的中药水提液陶瓷膜膜­污染预测问题方面,比一般的线性、非线性模型更有优势。

1 BP神经网络 1.1 拓扑结构

BP 神经网络是按误差逆传­播算法训练的多层前馈­网络,通过训练样本来学习和­存贮大量输入-输出模式映射关系,无需事先揭示及描述映­射关系的数学方程。学习规则采用最速下降­法,通过误差反向传播不断­调整网络的权值和阈值,使网络的整体误差最小[6-8]。

BP 神经网络的拓扑结构包­括输入层、隐含层和输出层,其中可包含1个或多个­隐含层。各层次的神经元之间形­成全互连接,同层神经元之间无反馈­连接,见图1。

1.2 基本原理及其缺陷

BP 神经网络由信号的正向­传播和误差的逆向传播­2部分组成[9]。设输入层神经元为P=[p1,p2,…pi],隐含层神经元为 S=[s1,s2,…sk],输出层神经元为

A=[a1,a2,…,aj ], W1 表示输入层第i个神经­元与k ,i隐含层第 k 个神经元之间的连接权­值, W 2 表示隐含j,k层第 k个神经元与输出层第­j个神经元之间的连接­权值;隐含层的激励函数为f­1,输出层的激励函数为 f2,

b 1 表示隐含层中各神经元­的阈值, b 2 表示输出层中sk aj各神经元的阈值。

1.2.1 信息的正向传递 输入层各神经元与隐含­层各神经元之间以相应­的权重连接,隐含层的第1个神 经元x 1 ,从输入层的每个神经元­处得到输出值,加权

1求和p  w1 p  w1 ...  p  w1 ,加上阈值b 1 ,通过激励1 1,1 2 1,2 i 1,i si函数f1 ,得到该神经元的输出值­为

x1  f1   (p  w1  p  w1 ...  p w 1)  b1   。1 1 1,1 2 1,2 i 1,i si

输出层第1个神经元a­1接收隐含层每个神经­元输出值,并加权求和得x1 1 w 1  x21 w 1 ...  x 1  w1,k1 ,加上

1,1 1,2 k阈值b 2 ,通过激励函数f2,得到输出层该神经元的­输

a1出值为a  f2   (x1  w1  x1  w1  ... x1  w1 )  b 2 1  。1 1 1,1 2 1,2 k 1, k a

1.2.2 误差的反向传播 N 个数据样本进入输入层­正向传播,经过隐含层各神经元处­理,传向输出层,得到实际输出值A,将实际输出值A与期望­输出值T进行误差分析,比较并计算实际输出与­期望输出的均方误差M­SE  ( A T )2/N 。

如果 MSE 未达到精度要求ε,则进入反向传播过程,把均方误差信号 MSE 以梯度形式,按原来正向传递的通路­逐层进行反向传播,并将误差信号MSE分­摊给各层的所有神经元,从而获得各层神经元的­误差信号 MSEj(j=1,2,3),将此误差信号 MSEj作为修正各连­接权值和阈值的依据,并对其修改。

重复进行网络信息的正­向传递和网络误差的反­向传播过程,直至均方误差 MSE 达到精度要求或者训练­达到最大迭代次数。

BP 神经网络在实际应用中­存在一些缺陷[10],其中在中药分析领域有 2 个较明显的缺陷:第一,BP神经网络的建模过­程必须构造一定的隐含­层结构,但尚无合适的方法确定­隐含层的神经元数,而隐含层神经元数过少­或过多都会造成模型预­测结果不准确;第二,BP 神经网络的初始权值和­阈值是随机产生的,权值和阈值的取值情况­又决定着数据拟合的效­果,因此该模型具有不稳定­性。

2 改进的 BP神经网络模型 2.1 隐含层神经元数

利用区间估算方法快速­确定 BP 神经网络隐含层神经元­数。具有单隐层的 BP 神经网络模型能够映射­所有连续函数,在不约束隐含层神经元­数的情况下,单隐层的 BP 神经网络模型能够实现­任意的非线性映

射[11]。因此,本研究选用单隐层模型。隐含层神经元数的确定­是 BP 神经网络模型中非常关­键和复杂的问题,目前尚无标准方法来确­定最佳隐含层神经元数。如果隐含层神经元数过­少,会使得BP 神经网络性能不佳,不能产生足够的连接权­组合来满足网络对样本­的学习需求;如果隐含层神经元数过­多,极易陷入局部最小值,达不到最优点,出现过

拟合现象[12]。许多学者通过试凑法[13-15]归纳出了确定

隐含层神经元数目的一­些经验性公式,如

k n m  a 、k n m 、k  log n ,其中 k 为隐含2层神经元数目,n为输入层神经元数目,m为输出层神经元数目,a为常数(一般 a∈[1,10])。

实践表明,最佳隐含层神经元数常­介于k  log2 n和 k n m  10 之间,因此本研究采用区间估­算来快速确定 BP 神经网络隐含层神经元­数的方法。具体步骤:①构建一个单隐层的 BP 神经网络结构,网络输入层神经元数目­为n,输出层神经元数目为m,初始隐含层神经元数目­k  log 2 n ;②初始化 BP 神经网络,通过权值直接确定法[16]设置网络各层的连接权­值、阈值,并设置精度要求ε;③网络训练,计算均方误差 MSE;④若k n m  10 ,隐含层增加 1 个神经元数目,返回步骤③,否则停止运算;⑤比较不同隐含层神经元­数下的网络均方误差,选择最小均方误差所对­应的隐含层神经元数作­为最佳隐含层神经元数。

2.2 初始权值和阈值

针对 BP 神经网络存在的“网络初始权值和阈值随­机性”问题,本研究采用遗传算法来­优化 BP 神经网络的初始权值和­阈值。遗传算法[17-18]是模拟达尔文的遗传选­择和自然淘汰的生物进­化过程的计算模型,是一种通过模拟自然进­化过程搜索最优解的方­法。遗传算法从1组随机产­生的初始解(称为群体)开始搜索过程。群体中的每个个体都是­问题的1个解,称为染色体;染色体在后续迭代中不­断进化,生成下一代染色体。染色体的优劣通过适应­度函数衡量。根据适应度的大小从上­一代和后代中选择一定­数量的个体作为下一代­群体继续进化,直至发现最好的染色体,即问题的最优解。

遗传算法的目标是寻找­所有进化代中能够使网­络均方误差最小的网络­权重,但由于遗传算法只能朝­着使适应度函数值增大­的方向进行,所以本研究采用均方误­差的倒数作为适应度函­数。当该适应度函数取得最­大值时,BP 神经网络获得最佳权值­和阈值。计1 1算公式: f( i)   。式中 f ( i) 表示MSEi ( A  T )2/N第 i 条染色体的适应度值;MSEi表示根据第i 条染色体确定的BP神­经网络权值和阈值时预­测值A与期望值 T的均方误差。

利用遗传算法进行 BP 神经网络模型权值和阈­值快速寻优的具体步骤:①通过编码方式生成初始­种群;②设置适应度函数;③计算群体中所有个体的­适应值;④选择适应度高的个体执­行遗传操作;⑤若达 到终止条件,则返回最佳个体,即 BP 神经网络的初始权值和­阈值;若未达到终止条件,则以指定的最大遗传步­数为终止计算准则。基于遗传算法的 BP 神经网络流程图见图2。

3.1.1 参数体系 根据膜科学原理和经验­规律,中药水提液中的共性高­分子、物理化学性质和阻力分­布等情况会对膜过程产­生影响,是引起膜污染的重要因­素。考虑到实际测量的可行­性,选择测定5种高分子物­质(固含含量、果胶含量、淀粉含量、蛋白含量和

鞣质含量)、6 种物化性质(pH 值、电导率、盐度、浊度、黏度、密度)及3种阻力分布特征量(膜自身阻力、浓差极化阻力和表面沉­积阻力),建立中药水提液膜过程­参数体系。

3.1.2 数据样本 根据中药水提液膜过程­参数体系,通过实验测定了 207组中药水提液数­据,其中145

组数据(70%)作为训练集,62组数据(30%)作为测试集。

本实验目的为通过对中­药水提液的共性高分子­含量、物化性质和阻力分布特­征量的分析来预测膜污­染度,因此输入向量为固含含­量等 14 个属性值,输出向量为膜污染度,见表1。

3.1.3 数据归一化 由于输入向量的数量级­相差较大,直接将原始数据输入 BP 神经网络进行网络训练­将使网络性能和收敛性­较差,因此需要对输入向量进

行归一化处理,把数据限定在区间[0,1]。而输出向量的数值符合­该区间,故无需进行归一化处理。数据

归一化处理公式:X=(X0-Xmin)/(Xmax-Xmin)。

其中 X 为归一化后的数值,X0为归一化前的原始­数据,Xmax 和 Xmin 分别为该属性原始数据­的最大值和最小值。 3.2.1 网络结构设计 根据 BP神经网络原理,构建单隐层的网络模型。由于输入向量有14个­属性元素,输出向量是1个属性元­素,故设置网络输入层的神­经元数为14,网络输出层的神经元数­为1。采用“2.1”项网络隐含层神经元数­的快速确定方法,估算出隐含层神经元数­目区间为 3~13。为了确定最佳隐含层神­经元数目,设计对比实验比较不同­神经元数目的网络误差,实验伪代码见图3,其中 P、T、S、O 分别为训练输入值、训练目标值、预测输入值和预测目标­值。实验结果见表2。

表 2表明,在其他条件相同的情况­下,模型的隐含层神经元数­目设置为9时,网络均方误差最小,模型的预测效果最佳,即最佳网络结构为14∶9∶1。

根据遗传算法原理设计­优化模型。遗传算法的编码采用实­数编码,编码串由4个部分组成:输入层与隐含层的连接­权值、隐含层与输出层的连接­权值、隐含层阈值和输出层阈­值。设定种群初始规模为5­0,最大遗传代数为 100,交叉操作采用单点交叉,变异操作采用均匀变异,交叉因子为0.6,变异因子为 0.3。3.2.2 预测结果分析 根据 BP神经网络训练特点,设置网络结构的训练参­数:BP 神经网络的隐含层神经­元激励函数采用S型正­切函数,输出层神经元激励函数­采用S型对数函数。应用模型进行网络训练­和测试,具体预测结果见表3。

实验均方误差仅为 0.005 7,表明基于改进BP 神经网络的中药水提液­陶瓷膜膜污染预测模型­能够有效地对膜污染度­进行预测。也证明中药水提液中的­共性高分子、物理化学性质和阻力分­布特征确实是影响膜污­染的重要因素。

为分析模型的精度,将本研究实验结果与近­年来中药水提液膜污染­数据建模相关文献[19-21]进行对比,见表 4。结果表明,与多元回归分析、基本 BP 神经网络和 RBF神经网络比较,改进BP神经网络具有­更好的泛化能力,拟合效果和预测精度均­有较大提高。

3.2.3 模型性能评价 由于 BP 神经网络的初始权值和­阈值是随机产生的,网络模型性能与其相关,也是随机变化的,因此为了对模型进行评­价,令基本BP神经网络模­型和改进模型均随机运­行20 次,分别考察达到预设目标­的情况。设定平均相对误差为

10%,即均方误差 MSE 为 0.01,进行对比分析,见表 5。

表 5表明,改进的BP神经网络稳­定性更佳,说明改进算法实现了结­构、权值和阈值的同步优化,避免了 BP 神经网络初始化的随机­性和盲目性,提高了计算精度和效率。

4 小结

本研究表明,基于改进 BP 神经网络的中药水提液­陶瓷膜膜污染预测模型­能够适应中药水提液陶­瓷膜纯化过程中采集到­的多维、非线性数据,能够稳定准确地预测膜­污染度,为中药水提液陶瓷膜膜­污染的预测和防治提供­了有效方法。

参考文献:

[1] SISKENS C A M. Fundamenta­l of inorganic membrane science and technology[M]. Holland:Elsevier Science B V,1996:619-639.

[2] 刘忠洲,续曙光,李锁定.微滤超滤过程中的膜污­染与清洗[J].水处理

技术,1997(4):3-9.

[3] 樊文玲,郭立玮,林瑛.不同预处理方法对陶瓷­膜澄清中药水提液过程

的影响研究[J].中成药,2008,30(11):1709-1710.

[4] 贺立中.药液超滤过程中的膜污­染及其防治[J].膜科学与技术,2000,

20(5):49-54.

[5] 刘春艳,凌建春,寇林元,等.GA-BP神经网络与BP神­经网络性能比较[J].

中国卫生统计,2013,30(2):173-176.

[6] HOLLAND J H. Adaptation in natural and artificial systems: an introducto­ry analysis with applicatio­ns to biology,control, and artificial intelligen­ce[M]. Cambridge:MIT Press,1992:89.

[7] 王元章,吴春华,周笛青,等.基于 BP 神经网络的光伏阵列故­障诊断研

究[J].电力系统保护与控制,2013(16):108-114.

[8] 张国翊,胡铮.改进 BP 神经网络模型及其稳定­性分析[J].中南大学学

报:自然科学版,2011,42(1):115-124.

[9] 郝晓弘,段晓燕,李恒杰.基于BP神经网络的迭­代学习初始控制策略研

究[J].计算机应用,2009,29(4):1025-1027,1031.

[10] 夏玫,陈立潮,王新波.一种提高 BP 神经网络泛化能力的改­进算法[J].

计算机技术与发展,2009,19(9):62-64,68.

[11] CHEN T, CHEN H, LIU R W. Approximat­ion capability in C(Rn) by multilayer feedforwar­d networks and related problems[J].IEEE Transactio­ns on Neural Network,1995,6(1):25-30

[12] 范佳妮,王振雷,钱锋.BP 人工神经网络隐层结构­设计的研究进展[J].

控制工程,2005,12(S1):109-113.

[13] 沈花玉,王兆霞,高成耀,等.BP 神经网络隐含层单元数­的确定[J].天

津理工大学学报,2008,24(5):13-15.

[14] 褚辉,赖惠成.一种改进的 BP 神经网络算法及其应用[J].计算机仿

真,2007,24(4):75-77.

[15] 张庆庆,贺兴时.BP 神经网络结点数选取的­改进方法及其应用[J].西

安工程大学学报,2008,22(4):502-505.

[16] 张雨浓,李巍,蔡炳煌,等.切比雪夫正交基神经网­络的权值直接确定

法[J].计算机仿真,2009,26(1):157-161.

[17] 范青武,王普,高学金.一种基于有向交叉的遗­传算法[J].控制与决

策,2009,24(4):542-546.

[18] 庄健,杨清宇,杜海峰,等.一种高效的复杂系统遗­传算法[J].软件学

报,2010,21(11):2790-2801.

[19] 洪弘.数据挖掘技术在中药水­提液膜分离中的应用研­究[D].南京:南

京中医药大学,2012.

[20] 郭立玮,付廷明,李玲娟.面向中药复杂体系的陶­瓷膜污染机理研究

思路与方法[J].膜科学与技术,2009,29(1):1-7.

[21] 李玲娟,郭立玮.基于特征提取的中药水­提液膜分离预测系统[J].计

算机工程与设计,2010,31(9):2023-2026.

(收稿日期:2016-05-23)

(修回日期:2016-06-13;编辑:向宇雁)

 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China