浅谈多元统计相关论文
多元统计是统计学中的一个重要内容,对于各种分析对象的研究有很大的帮助。下面是小编为大家整理的多元统计相关论文,供大家参考。
多元统计相关论文范文一:多元统计分析在中药成分分析中的应用
摘要:我国中药发展已有悠久历史,中药大多采用复方制剂,以其复方疗效显著而越来越受到重视,在其成分分析中,多元统计分析方法的运用,本质上是一种多变量协同考量的思路。本文通过对以往多元统计分析方法在中药成分分析数据中的应用作整理总结,对今后相关研究提供理论依据。
关键词:多元统计分析 中药成分分析
中药物质基础的阐明和科学质量控制方法的建立是中药现代化和国际化的关键,在化学计量学中,多元统计分析方法得到了很好的应用,通过优化了化学量测过程,提高分析效果,应用统计分析方法及其他数学方法和计算机软件的应用对其数据进行整理,已较好的阐明了中药物质成分,结构与其性能之间的复杂关系。
一、应用现状
1.1方法
在中药成分分析中,多元统计分析方法如多元回归,多元相关分析,逐步回归分析,最大似然法,判别分析,聚类分析和主成分分析,利用电子计算机能迅速而大量地处理实验数据,还广泛采用了蒙特卡洛(Monte Carlo)统计模拟法,都能在某一特定方面很好的说明其成分,但尚未有统一理论支撑整个体系,也是国内着力于建立中成药数据库的缘由之一。要进一步定性定量的确定中药成分,并很好的分析中药成分还需不断努力。
在应用中,应用最多的为多元线性回归和Logistic回归方法,其次是通径分析,因子分析和聚类分析的运用较少,比如风险模型,典型相关,MCA分析和Probit分析。
1.1.1成分提取
在对中药复方有效成分的整体提取方法,指纹图谱条件优化及定量评价指标,以及基于药理活性的组方条件优化的基础上,化学模式识别方法引入中药分析体系,模式识别,指通过相关软件等用数学方法来实现模式的自动处理和判别,模式识别可大致分为用监督模式识别(判别分析方法),是实现规定分类的标准和种类的数模,并且通过大批已知样本的信息处理找出规律,再预报未知样本的类型,如贝叶斯法(Bayes)逐步判别分析方法,人工神经网络判别法等,无监督模式识别(聚类分析方法),是对一组尚无明确分类的样本,根据它们所变现的变量特征,按相似程度的大小加以归类,最终通过信息处理找出合适的分类方法并实现样本的分类,如系统聚类分析,模糊聚类分析等以及基于特征投影的降维显示方法,另外还有一类基于特征投影的降维显示方法,如主成分分析方法,基于偏最小二乘法的降维方法等,中药的化学模式识别方法可以从复杂的化学测量数据出发,进一步揭示复杂化合物之间的隐藏规律,为中药整体研究提供十分有用的信息。
1.1.2质量控制
在中药复方质量控制方面,近年来,有监督的模式识别和无监督的模式识别往往联合起来使用,即当某中药方剂的总体质量分类不清楚时,可先用聚类分析对原来的样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。
1.1.3药效检验
在化学计量中运用多变量统计过程控制(multivariate statistical process control,MSPC) 方法来处理中药成分组成,在中药分析中,结合对无知复杂多组分进行同时定性定量分析的方法,连用色谱仪器等,包括HPLC-DAD.CE-DAD(毛细管电泳二极管阵列联用仪),HPLC-MS,HPLC-IR,GC-MS.GC-IR等因其将分离与分析技术集于一体,已有很大突破,目前国内在中药成分分析中,运用了在中药化学成分研究的手段方面,如薄层色谱,气相色谱,高效液相色谱,紫外光谱,红外光谱等已得到普遍使用,还包括超临界色谱,高效逆流色谱,色谱质谱连用技术(GC/MS、HPLC/MS),核磁共振(NMR)指纹图谱,x-射线衍射指纹图谱等。其中产生大量的数据,有关研究人员运用数学中多元统计分析方法对其分析,得到相关结论,进而对药效进行更有效的分析。
1.1.4组分分析
借助各类分析仪器以及光谱色谱联用手段,可以再较短的时间内得到大量的多元性化合物信息,该过程所用到的具体方法有聚类分析,主成分分析以及偏最小二乘法,判别式分析法等,中药药效,由定量构效关系到定量组效关系研究
1.2数据处理的应用实例
在对药材产地区分和鉴别研究方面,徐永群等在黄苓的红外光谱的指纹图谱基础上,采用主成分分析法,对多个产地进行了聚类分析。
王继国等分析中药血竭样品的高效液相色谱中,把指纹图谱信息进行数据处理时,用重叠率与相关系数两个参数,从两个方面定量地对图谱进行了相似性评价,在此基础上用系统聚类分析法定性地对样品进行了分类和鉴别,建立了一种相对完善的中药血竭的化学模式识别技术。
杨红娟等对金银花的种类进行了模式识别研究,利用高效液相色谱分析获得金银花的化学信息,并进行了系统聚类分析,同时用微生物法进行抑菌活性测定,用多重线性回归揭示化学信息与药理指标之间的关系。
孙丽新等用典型相关分析对获得反映样品整体化学特征的数据做了处理,并运用聚类的方法将样品分类,得到效果良好的质量控制方法。
周立东等提出在天然药物演技中建立定量组效关系,用以解决中药复杂成分的化学组成与生物活性之间的关系问题,在中药的多变量的化学祖坟空间和中药的多变量空间之间建立起定量的关系,在多元统计分析中,如回归分析,聚类分析以及因子分析西欧提供了操作方法,
二、存在的主要问题
统计方法的选择在一定程度上取决于变量的测度水平,多元统计分析,自变量中包括名义变量的最多,自变量全部为间距测度的很少,多元统计分析方法中序次测度变量和名义测度变量的处理方法一样,所以一般并不加以区分,序次测度变量作为名义测度变量来用,把二者合成为分类变量,本次研究的论文数据中应用多元统计方法时大多数的分析中是分类变量。
2.1方法使用错误
在多元统计分析方法的应用中,如通经分析等存在一些错误,通径分析是建立一组线性回归方程,因此对变量的要求和多元线性回归一样,多元线性回归要求因变量必须为间距测度或以上的变量,自变量可以使分类变量,但当自变量中有分类变量时,必须做虚拟变量回归,而不是普通的线性回归。
2.2数据的评价和检验
对实验数据处理的最终评价是要反映该药效的最好方式,即数据在多大程度上能很好解释了因变量的间的关系,每一种统计分析方法都有自己的数据评价指标和方法。
三、总结
化学计量学提供了一整套区别于传统复方研究的思路,在中药化学,质量控制,药效检验,组方分析,代谢组学以及建立中药数据等各个领域都已有了初步的应用和发展。多元统计分析方法作为数学数据分析中的主要分析方法,虽在中药分析方法中应用存在少数问题,但其应用前景及意义极其乐观。(作者单位:沈阳师范大学)
参考文献:
[1]梁逸曾.化学计量学用于中医药研究.长沙:化学计量学与传感技术研究所,1998.
[2]罗国安.中药中成药现代化进程[M].北京:中成药出版社,2000.
[3]甘师俊,李振吉.中药现代化发展战略[M].北京:科学技术文献出版社,1998.
[4]张敏,吕华瑛.中药成分分离新技术及应用[M].山东:山东中医杂志,2005.
[5]邓书鸿,聂磊.中药谱效关系的分析方法及数据处理技术研究进展.山东:中药材 Joumal of Chinese Medicinal Materials,1819.
[6]王海南.中药有效成分研究与中药新药研发.北京:原中国医药学报,2007.
[7]陈述云,张崇甫.多指标综合评价方法及其优化选择研究.贵州:数理统计与管理,1994.
多元统计相关论文范文二:多元统计法的阅读倾向研究
小学阶段是人生的起步阶段,作为一名少儿教育工作者不禁要思考,小学生究竟是出于什么动机去阅读?如何根据小学生读者群的划分实施个性化教育?一直以来,关于少儿阅读教育的讨论,往往着眼于读者阅读的数量、种类、时间长短等方面,对学生的阅读倾向的实证研究相对较为缺乏,这是本文的研究意义所在。
数据采集过程
笔者借鉴美国Wigfield教授1996年编制的MRQ问卷[1],并自行设计了调查问卷。借助问卷主要调查被测者的背景信息,比如年级、阅读载体、家庭阅读氛围、成绩等。选定的样本对象为:3—5年级的小学生。样本的抽取采用随机方法,在全市范围内选择了300名小学生,最终获得272名有效样本。调查中采用四点评分制,4表示“非常符合”,1代表“非常不符合”。
数据分析方法
对于调查数据,笔者采用数理统计方法进行处理,主要思路为:1.根据数据情况,将测试语句分为几大类,找出每一类中的共同因子并作出合理解释。2.利用因子分析的结果,对数据重新评估打分,然后再进行聚类分析,确定最终采用的分类个数。3.根据分类结果对每一样本判别其所属类别,然后对各类型读者的背景进行交叉分析。4.所有数据采用SPSS统计软件进行数理分析。
数据结果分析
由于测试的语句之间存在一定的相关性,通过因子分析可以将相关因素综合为一个因子,因此,笔者首先采用因子分析进行数据分析。1.因子分析由相关系数矩阵R计算得到特征值、方差贡献率和累计贡献率后,有六个因子特征根大于1,这六个因子的方差累计贡献率接近70%,因此,提取这六个公因子可以描述小学生阅读倾向的基本状况。由输出表可以看出,第一公因子在变量V8、V9、V10、V49、V51上有较大载荷,因此定义为挑战;第二公因子在变量V25、V26、V9、V10上有较大载荷,因此定义为顺从;第三公因子在变量V22、V35、V9、V49上有较大载荷,因此定义为社会;第四公因子在变量V38、V40上有较大载荷,因此定义为成绩;第五公因子在变量V13、V29上有较大载荷,因此定义为逃避;第六公因子在变量V34、V51上有较大载荷,因此定义为投注[2]。这六个因子的性质较好地体现了其所代表的因素对小学生阅读倾向的影响,也比较符合小学生的认知规律。2.聚类分析在模型通过统计检验的情况下,本文采用了快速聚类K均值分析的方法,选择了有7个中心的聚类分析,迭代次数为5次,收敛数据为0,这7个聚类中心(类别)如下:3.各类型小学生的背景特征在得到小学生阅读倾向的分类以后,笔者对各类型的小学生的背景进行分析,以判断这些分类是否符合我们通常的认识类别。以下是实际统计结果:分享型:这类小学生约占样本量的10%。家庭教育的主要监管人基本上都是母亲,而母亲很少阅读,33.3%的母亲平均每天花在看书或报刊的时间在半小时以下,66.7%的学生语文成绩为良。上进型:这类小学生占样本量的41.5%,他们的学习态度比较积极。父母关系较为和睦,而且父母亲都比较关心孩子的教育问题,有25.7%的家庭是父亲担当了主要监管人的责任,49.6%的学生语文成绩为优。任务型:这类小学生占样本量的12.1%。父母关系和睦,并且能以身作则,母亲是学生学习情况的主要监督者,也有12.1%的学生是由祖父母或外祖父母担当主要监管者责任。这类学生成绩不错,有63.6%的学生语文成绩为优,30.3%的学生语文成绩为良。放松型:这类小学生占样本量的4.5%。这一类型学生的父母关系较为和睦,学业情况基本上由母亲监督,但是其母亲文化程度不高,平时很少看书读报,家庭月收入偏低。这部分学生43.3%的语文成绩为良,26.7%的学生语文成绩为中。自我型:这类小学生占样本量的11.8%,其中女生占了68.8%。母亲是主要的学业情况监督者,69%的母亲拥有大学本科学历而且注重自身的学习,平均每天花在阅读上的时间超过半小时的达到了87.6%。这类学生喜欢阅读,语文成绩以优良为主。迷茫型:这类小学生占样本量的20.5%,这一类别学生的成绩与阅读动机之间无明显联系,44.4%的学生语文成绩为优,51.9%的学生语文成绩为良。
浅谈多元统计相关论文相关文章:
1.浅谈统计学调查相关论文
2.浅谈统计学教育分析论文
3.浅谈卫生统计教学论文
4.浅谈审计相关论文