摘要:利用混合蛙跳算法(SFLA)对最小二乘支持向量机(LSSVM)的参数进行优化,建立了一种基于混合蛙跳算法和最小二乘支持向量机的芹菜总黄酮提取预测模型。仿真结果表明,该预测模型提高了预测精度,性能更加稳定,为芹菜总黄酮提取的在线预估和优化控制提供了可靠的技术参考。
关键词:芹菜;混合蛙跳算法;最小二乘支持向量机;总黄酮;预测
Abstract: Shuffled frog leaping algorithm (SFLA) was used to parameters of optimize least square support vector machine (LSSVM). The prediction model of extracting total flavonoids from celery based on shuffled frog leaping algorithm and least squares support vector machine was established. Simulation results showed that this prediction method had high accuracy and stable performance. It was conducive to achieve online estimation and optimal control.
Key words: celery;artificial bee colony algorithm; least squares support vector machines; total flavonoids; prediction
黄酮类化合物是一类存在于植物中的天然产物,属于植物的次级代谢产物。现代医学研究发现,芹菜的茎叶中含有丰富的黄酮类物质,其具有清除自由基、抗氧化、抑菌、抗病毒、抗癌和抗肿瘤等作用[1,2]。从芹菜中提取黄酮类物质,以开发新型天然黄酮类药物为目标,促进芹菜的深加工,已成为资源高效利用的研究热点[3,4]。
目前,对芹菜总黄酮的提取主要采用碱液法、微波法、超声波法等,而对芹菜中总黄酮含量的测定,大多采用分光光度法、光谱法等方法。这些传统的提取和测定方法容易受到人为操作及环境变化等不可预见性因素的影响,造成数据准确性降低。采用软件方法实现芹菜总黄酮提取量的预测是解决此类生物量参数难以准确实时测量和控制的有效方法[5]。近年来,神经网络、支持向量机等预测方法成为当前研究的热点[6-8]。其中,神经网络对训练样本数据要求高,对于小样本数据应用受到一定限制;支持向量机适用于非线性小样本数据,但泛化能力有限,对于异常样本预测偏差较大。
本研究采用改进的混合蛙跳算法对最小二乘支持向量机的参数进行优化建模[9,10],避免了算法过早收敛陷入局部最优,提高了模型的预测精度,实现了芹菜总黄酮提取量的快速准确预测,为芹菜资源的高值化利用提供了技术支撑。
1 算法基础
1.1 最小二乘支持向量机
最小二乘支持向量机(LSSVM)对支持向量机(SVM)进行了改进[11],很好地解决了小样本、非线性和高维数的问题,提高了求解速度和泛化能力。将非线性问题转化为高维特征空间的线性估计问题,构建了如下回归函数:
其中,?滓为核宽度,对于最小二乘支持向量机,核宽度?滓和正规化参数?酌是其重要的两个参数,它们的选取直接影响着算法的学习能力和泛化性能。
1.2 SFLA算法的改进
1.2.1 SFLA算法的种群初始化改进策略 由于标准SFLA算法采用随机方式产生初始种群,导致个体分布缺乏均匀性,影响了种群的多样性,算法的求解效率也受到限制。因此,在种群初始化阶段,引入反向学习策略,确保初始种群具有多样性,主要步骤如下所示:
1)随机生成初始解,用集合形式表示解集为:
x=xij|xij∈[minj,maxj],其中j=1,minj,maxj分别为第j维的下界和上界。
2)计算每个初始解对应的反向解,公式如下所示:
其中,?孜为变异因子,N(0,1)为均值为0、方差为1的随机量。
2 芹菜总黄酮含量的测定和预测建模
2.1 芹菜总黄酮含量的测定
将芹菜原料进行低温烘干粉碎后,称取芹菜干粉1.00 g于50 mL锥形瓶中,加入一定量的乙醇浸泡,然后将浸泡好的溶液进行超声波提取,提取完成后抽滤、定容,作为待测液备用。取上述样品液2.0 mL并以30%乙醇定容至5 mL,加入0.3 mL 15%NaNO2摇匀静置6 min,再加入0.3 mL 10% Al(NO3)3,摇匀静置6 min后加入4 mL 1 mol/L NaOH,再用蒸馏水定容,摇匀静置15 min后测定吸光度。根据吸光度由下式计算样品液中的总黄酮含量:
式中,m为总黄酮含量(mg/g);C为溶液中总黄酮的测定浓度(mg/mL);V1为芹菜总黄酮提取液总体积(mL);W为芹菜干粉质量(g);V为所取待测液体积(mL)。
2.2 预测模型的构建
采用紫外分光光度法测定芹菜总黄酮含量,测定过程复杂、时间长,制约了芹菜总黄酮的生产应用。因此,构建芹菜总黄酮含量的预测模型,减少测定次数,对实现在线实时预测尤为必要。基于SFLA和LSSVM的芹菜总黄酮含量预测步骤如下:
1)对芹菜总黄酮提取试验中的数据进行归一化处理;
2)参数初始化,设置蛙群个体总数、迭代总次数、子群数、每个子群内的蛙数、子群内的更新次数、变异因子及最大、最小变异概率;
3)按式(5)反向学习策略构建初始种群;
4)计算每只青蛙适应度值后按降序排序,并分成k个子群;
5)确定每个子群的最优解和最差解及群体全局最优解,反复更新每个子群的最差青蛙,直至达到设定的子群迭代总次数后,将更新后的子群进行混合,取代原来的群体;
6)按式(6)和式(7)计算群体的适应度方差,再按式(8)计算变异概率,并按式(9)对全局最优解进行变异操作,更新当前群体最优解;
7)当迭代次数达到设定的最大次数,则停止计算,输出最优解,否则转到第4步;
8)根据最优解优化LSSVM的参数,构建预测模型,并对测试数据集进行仿真和测试。 |
核心期刊网(www.hexinqk.com)秉承“诚以为基,信以为本”的宗旨,为广大学者老师提供投稿辅导、写作指导、核心期刊推荐等服务。 核心期刊网专业期刊发表机构,为学术研究工作者解决北大核心、CSSCI核心、统计源核心、EI核心等投稿辅导咨询与写作指导的问题。 投稿辅导咨询电话:18915033935 投稿辅导客服QQ: 投稿辅导投稿邮箱:1003158336@qq.com |