永发信息网

判别分析是什么

答案:2  悬赏:10  手机版
解决时间 2021-01-02 17:42
  • 提问者网友:世勋超人
  • 2021-01-02 01:02
判别分析是什么
最佳答案
  • 五星知识达人网友:猎心人
  • 2021-01-02 01:52
问题一:判别分析的判别方法 判别方法是确定待判样品归属于哪一组的方法,可分为参数法和非参数法,也可以根据资料的性质分为定性资料的判别分析和定量资料的判别分析。此处给出的分类主要是根据采用的判别准则分出几种常用方法。除最大似然法外,其余几种均适用于连续性资料。1)最大似然法:用于自变量均为分类变量的情况,该方法建立在独立事件概率乘法定理的基础上,根据训练样品信息求得自变量各种组合情况下样品被封为任何一类的概率。当新样品进入是,则计算它被分到每一类中去的条件概率(似然值),概率最大的那一类就是最终评定的归类。2)距离判别:其基本思想是有训练样品得出每个分类的重心坐标,然后对新样品求出它们离各个类别重心的距离远近,从而归入离得最近的类。也就是根据个案离母体远近进行判别。最常用的距离是马氏距离,偶尔也采用欧式距离。距离判别的特点是直观、简单,适合于对自变量均为连续变量的情况下进行分类,且它对变量的分布类型无严格要求,特别是并不严格要求总体协方差阵相等。3)Fisher判别:亦称典则判别,是根据线性Fisher函数值进行判别,通常用于梁祝判别问题,使用此准则要求各组变量的均值有显著性差异。该方法的基本思想是投影,即将原来在R维空间的自变量组合投影到维度较低的D维空间去,然后在D维空间中再进行分类。投影的原则是使得每一类的差异尽可能小,而不同类间投影的离差尽可能大。Fisher判别的优势在于对分布、方差等都没有任何限制,应用范围比较广。另外,用该判别方法建立的判别方差可以直接用手工计算的方法进行新样品的判别,这在许多时候是非常方便的。4)Bayes判别:许多时候用户对各类别的比例分布情况有一定的先验信息,也就是用样本所属分类的先验概率进行分析。比如客户对投递广告的反应绝大多数都是无回音,如果进行判别,自然也应当是无回音的居多。此时,Bayes判别恰好适用。Bayes判别就是根据总体的先验概率,使误判的平均损失达到最小而进行的判别。其最大优势是可以用于多组判别问题。但是适用此方法必须满足三个假设条件,即各种变量必须服从多元正态分布、各组协方差矩阵必须相等、各组变量均值均有显著性差异。问题二:判别分析的判别函数 判别分析通常都要设法建立一个判别函数,然后利用此函数来进行批判,判别函数主要有两种,即线性判别函数(Linear Discriminant Function)和典则判别函数(Canonical Discriminate Function)。线性判别函数是指对于个总体,如果各组样品互相对立,且服从多元正态分布,就可建立线性判别函数,形式如下:其中,是判别组数;是判别指标(又称判别分数或判别值),根据所用的方法不同,可能是概率,也可能是坐标值或分值;是自变量或预测变量,即反映研究对象特征的变量;是各变量系数,也称判别系数。建立函数必须使用一个训练样品。所谓训练样品就是已知实际分类且各指标的观察值也已测得的样品,它对判别函数的建立非常重要。典则判别函数是原始自变量的线性组合,通过建立少量的典则变量可以比较方便地描述各类之间的关系,例如可以用话散点图和平面区域图直观地表示各类之间的相对关系等。问题三:判别分析的应用 在气候分类、农业区划、土地类型划分中有着广泛的应用。在市场调研中,一般根据事先确定的因变量(例如产品的主要用户、普通用户和非用户、自有房屋或租赁、电视观众和非电视观众)找出相应处理的区别特性。在判别分析中,因变量为类别数据,有多少类别就有多少类别处理组;自变量通常为可度量数据。通过判别分析,可以建立能够最大限度的区分因变量类别的函数,考查自变量的组间差异是否显著,判断那些自变量对组间差异贡献最大,评估分类的程度,根据自变量的值将样本归类。应用范围1)信息丢失2)直接的信息得不到3)预报4)破坏性实验假设条件1)分组类型在两种以上,且组间样本在判别值上差别明显。2)组内样本数不得少于两个,并且样本数量比变量起码多两个。3)所确定的判别变量不能是其他判别变量的线性组合。4)各组样本的协方差矩阵相等。5)各判别变量之间具有多元正态分布。6)样品量应在所使用的自变量个数的10~20倍以上时,建立的判别函数才比较稳定;而自变量个数在8~10之间时,函数的判别效果才能比较理想。当然,在实际工作中判别函数的自变量个数往往会超过10个,但应该注意的是,自变量的个数多并不代表效果好spss操作:“分析”~“分类”~“判别”~进入判别分析主对话框。这里有容易引起歧义的二个变量,最上面的为分组变量。对分组变量的了解需要联系判别分析的原理以及适用范围。因为判别分析是已知分类数目的情况下,进行分析,这个已知的分类数目就是这个分组变量。其实,一般分析步骤中,都是先进行聚类分析,聚类之后得到的分类结果就是这个分组变量,然后再选择这个分组变量,进行分析。也就是,聚类分析是母亲,母亲的孩子就是判别分析。得到的判别函数就是预测想要知道的个案究竟属于哪一类。另一个变量就是选择变量,它位于主对话框的最下面。这个选择变量在回归分析相应的对话框中也有,意思就是选择你需要的变量,这个变量可以为数据窗口的一个整个变量,也可以利用子设置“值”进行选择,所以,它的名字叫做选择变量。“统计量”子对话框:“描述性”栏,包括“均值”“单变量ANOVA”“BoxsM”需要特别说明,以后只要见到ANOVA这个单词,它的意思就是方差分析,也就是进一步输出方差分析表,其中最重要的就是P值也就是Sig值。BoxsM复选框:指的是输出对组协方差矩阵的等同性检验的检验结果。也就是对各类协方差矩阵相等的假设进行检验。“函数系数”栏:其实就是将判别函数系数进行设置。包括“费雪”和“未标准化”。费雪指的是对每一类给出一组系数,并且给出该组中判别分数最大的观测量。“矩阵”栏:都是复选框,对应相应的矩阵也就是在结果表中的四种数阵。“组内相关”“组内协方差”“分组协方差”“总体协方差”这个都是计算机自动计算,人工计算是不可能完成的任务。“分类”子对话框:本文也提到过先验概率,先验概率就是已知一部分信息,来了解未知信息也就是后验概率。“所有组相等”也就是如果分为几类,这所有的类中的先验概率都相等。“根据组大小计算”各类先验概率按照和各类样本量呈正比。“使用协方差矩阵”栏:是二个单选框。“在组内”指使用合并组内协方差矩阵进行分析“分组”指使用各组协方差矩阵进行分析。“输出”栏~“个案结果”:对每一个观测量输出判别分数,也就是选定变量的个案的分进哪个组的资格得分。实际类,预测类,也就是根据判别得分计算的古今对比。实际类就是目前实际上分为几类,预测类就是过去对未来预测,它们一对比,就可以知道过去和现在差别在哪里。附属选项“将个案限制在”在后面的小矩形框中输入观测量数,含义为仅输出设置的观测量结果,当个案也就是观测量太多,可以用此法。“摘......余下全文>>问题四:什么是判别分析模型? 线性判别式模型(Linear Discriminant Model) 线性判别式模型是由阿特曼(A1tman)发展起来的一种 风险 测 定模型。它通过使用借款者的各种 财务比率 和这些比率的 权重 来对 违 约风险进行 总体 的计算,其中各种财务比率的权重是基于 违约 和非违 约借款者过去的情况得到的经验数据。
采纳哦问题五:判别分析的基本思想 根据判别中的组数,可以分为两组判别分析和多组判别分析;根据判别函数的形式,可以分为线性判别和非线性判别;根据判别式处理变量的方法不同,可以分为逐步判别、序贯判别等;根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法等。问题六:进行判别分析时要求分组变量必须是什么变量 如果程序提示必须要求分组变量,应该是程序代码中没有指定相应的变量。
这个变量就是根据程序要求赋值的内容。问题七:聚类分析与判别分析的区别 聚类分析是无监督分类,不知道数据点的类别标签,需要自己自动分出来来,简单说就是一堆东西混到一起了,你要把它们区分开来谁和谁是一类的;判别分析是有监督的,本身已经知道每个数据点属于哪个类,它的任务是找到最佳的分类方法,也就是在你这种分类方法下分类的分类效果是最佳的(通常是指错分最少)。
全部回答
  • 1楼网友:迷人又混蛋
  • 2021-01-02 02:19
好好学习下
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯