数据分析之因子分析

2024-05-10

1. 数据分析之因子分析

系统聚类分析可以对变量进行分类，但是难以判断变量分类结果的合理性。另外，如果要衡量每个变量对类别的贡献，也难以通过聚类分析来实现。这个时候就要采用因子分析来实现了。因子分析就是找出隐藏在变量背后具有共性的因子。
                                          
 因子分析是通过研究变量间的相关系数矩阵，把这些变量间错综复杂的关系归结成少数几个综合因子，并据此对变量进行分类的一种统计分析方法。由于归结出的因子个数少于原始变量的个数，但是它们又包含原始变量的信息，所以，这一分析过程也称为降维。
  
 因子分析的主要目的有以下三个：
  
 （1）探索结构：在变量之间存在高度相关性的时候我们希望用较少的因子来概括其信息；
  
 （2）简化数据：把原始变量转化为因子得分后，使用因子得分进行其他分析，比如聚类分析、回归分析等；
  
 （3）综合评价：通过每个因子得分计算出综合得分，对分析对象进行综合评价。
  
 因子分析就是将原始变量转变为新的因子，这些因子之间的相关性较低，而因子内部的变量相关程度较高。
  
 为了更好的了解因子分析，需要了解以下：
  
 （1）因子载荷
  
 因子载荷就是每个原始变量和每个因子之间的相关系数，它反映了变量对因子的重要性。通过因子载荷值的高低，我们能知道变量在对应因子中的重要性大小，这样能够帮助我们发现因子的实际含义，有利于因子的命名。当有多个因子的时候，因子载荷将构成一个矩阵，称为因子载荷矩阵。
  
 （2）变量共同度
  
 变量共同度就是每个变量所包含的信息能够被因子所解释的程度，其取值范围介于0和1之间，取值越大，说明该变量能被因子解释的程度越高。
  
 （3）因子旋转
  
 因子分析的结果需要每个因子都要有实际意义，有时，原始变量和因子之间的相关系数可能无法明显地表达出因子的含义，为了使这些相关系数更加显著，可以对因子载荷矩阵进行旋转，使原始变量和因子之间的关系更为突出，从而对因子的解释更加容易。
  
 旋转方法一般采用最大方差法，该方法能够使每个变量尽可能在一个因子上有较高载荷，在其余的因子上载荷较小，从而方便对因子进行解释。
  
 （4）因子得分
  
 因子得分可以用来评价每个个案在每个因子上的分值，该分值包含了原始变量的信息，可以用于代替原始变量进行其他统计分析，比如回归分析，可以考虑将因子得分作为自变量，与对应的因变量进行回归。
  
 原始变量的数值是可以直接观测到的，而因子得分只能通过原始变量和因子之间的关系计算得到，并且因子得分是经过标准化之后的数值，各个因子得分之间不受量纲的影响。
  
 （1）判断数据是否适合因子分析；
  
          因子分析的变量要求是连续变量，分类变量不适合直接进行因子分析；建议个案个数是变量个数的5倍以上，这只是一个参考依据，并不是绝对的标准；KMO检验统计量在0.5以下，不适合因子分析，在0.7以上时，数据较适合因子分析，在0.8以上时，说明数据极其适合因子分析。
  
 （2）构造因子变量；
  
 （3）利用因子旋转方法使得因子更具有实际意义；
  
 （4）计算每个个案因子得分；
  
 （1）初始特征值大于1的因子个数；
  
 （2）累积方差贡献率达到一定水平（60%）的因子个数；
  
 （3）碎石图中处于较陡峭曲线上所对应的因子个数；
  
 （4）依据对研究事物的理解而指定因子个数；

数据分析之因子分析

2. 因子分析是什么？

　　因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性，一科成绩好的学生，往往其他各科成绩也比较好，从而推想是否存在某些潜在的共性因子，或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子，可减少变量的数目，还可检验变量间关系的假设。

　　共同度是指一个测验条目在所有因子上的因子载荷平方和，它代表了所有因子合起来对该条目的变异解释量，我们知道因子是用来代替繁多的条目的简化测量指标，那么共同度高即代表某个条目与其他条目相关性高，而共同度低则表明该条目与其他条目共通性很低，也就是说这个条目的独特性很强。

3. 什么是因子分析？

因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子，可减少变量的数目，还可检验变量间关系的假设。
共同度是指一个测验条目在所有因子上的因子载荷平方和，它代表了所有因子合起来对该条目的变异解释量，因子是用来代替繁多的条目的简化测量指标，那么共同度高即代表某个条目与其他条目相关性高，而共同度低则表明该条目与其他条目共通性很低，也就是说这个条目的独特性很强。

扩展资料：
主因子的权重就是其方差贡献率占这7个主因子的累计贡献率
各原始变量的权重是，先根据SPSS算出的L载荷矩阵，除以对应的特征根值，算出A矩阵。再用A矩阵中的x系数除以对应x的标准差，算出的是各个原始变量的系数。各个系数占所有系数之和的比例就是权重。
因子分析法确定指标权重
权重体系构建常见于企业财务竞争力体系，绩效权重体系或者管理者领导力权重体系模型等。
常用的权重研究分析方法中，AHP层次分析法，熵值法，组合赋值法均无法直接使用SPSS软件进行计算，因此在SPSS上利用因子分析法进行计算权重是一种常规做法。
参考资料来源：百度百科——因子分析

什么是因子分析？

4. 什么叫“因子分析”

因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子，可减少变量的数目，还可检验变量间关系的假设。
共同度是指一个测验条目在所有因子上的因子载荷平方和，它代表了所有因子合起来对该条目的变异解释量，因子是用来代替繁多的条目的简化测量指标，那么共同度高即代表某个条目与其他条目相关性高，而共同度低则表明该条目与其他条目共通性很低，也就是说这个条目的独特性很强。

扩展资料：
主因子的权重就是其方差贡献率占这7个主因子的累计贡献率
各原始变量的权重是，先根据SPSS算出的L载荷矩阵，除以对应的特征根值，算出A矩阵。再用A矩阵中的x系数除以对应x的标准差，算出的是各个原始变量的系数。各个系数占所有系数之和的比例就是权重。
因子分析法确定指标权重
权重体系构建常见于企业财务竞争力体系，绩效权重体系或者管理者领导力权重体系模型等。
常用的权重研究分析方法中，AHP层次分析法，熵值法，组合赋值法均无法直接使用SPSS软件进行计算，因此在SPSS上利用因子分析法进行计算权重是一种常规做法。
参考资料来源：百度百科——因子分析

5. 因子分析到底有什么用处？

因子分析的用处是：因子分析是将多个被测变量转化为几个综合指标（或潜变量），体现了一种降维的思想。 通过降维，将相关性高的变量聚集在一起，从而减少需要分析的变量数量，降低问题分析的复杂度。 它用于确定维数。 对标系统的维度是主观判断的。拓展资料：一、因子分析的内容：1.因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。2.他发现学生的各科成绩之间存在着一定的相关性，一科成绩好的学生，往往其他各科成绩也比较好，从而推想是否存在某些潜在的共性因子，或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。3.将相同本质的变量归入一个因子，可减少变量的数目，还可检验变量间关系的假设。二、分析现状是我们数据分析的基本目的，我们需要明确当前市场环境下，我们的产品市场占有率是多少，注册用户的来源有哪些，注册转化率是多少，购买转化率是多少，竞品是什么，竞品的发展现状如何，我们和竞争对手相对，优势有哪些，不足又有哪些等等，都是属于对于现状的分析。这里包括两方面的内容，分析自己的现状和分析竞争对手的现状。三、数据分析的第三个目的就是预测未来，所谓未雨绸缪，用数据分析的方法预测未来产品的变化趋势，对于产品的运营者来说至关重要。作为运营者，可根据最近一段时间产品的数据变化，根据趋势线和运营策略的力度，去预测未来的趋势，并用接下来的一段时间去验证这个趋势是否可行，而且实现数据驱动业务增长。

因子分析到底有什么用处？

6. 因子分析到底有什么用处？

问题：大家觉得因子分析到底有什幺用处呢？把原来很多个影响因素归纳成几个影响因子，如果不继续做回归或者聚类的话，光做因子分析有价值吗？答复：因子分析是将多个实测变量转换为少数几个综合指标（或称潜变量），它反映一种降维的思想。通过降维将相关性高的变量聚在一起，从而减少需要分析的变量的数量，而减少问题分析的复杂性。
在你对问题系统结构不了解时候，因子分析可以根据数据内在逻辑性，把它归并成几个公因子，每个公因子分别代表空间的一个维度，如果经过正交或斜 交旋转的话，各个维度之间可以认为是不相关的，这些公因子能够相对完整地刻画对象的体系维度，最起码累计方差贡献率大于85%的话，就基本能够保证重要信 息不丢失了。一句话，你如果对研究对象到底应该分为几个维度不清楚的话，用因子分析可以通过数据内在逻辑告诉你。
但如果你对研究对象体系比较清楚的话，那你直接确定维度，通过AHP计算出权重，就能够把系统表述清楚了。但这里面有巨大问题，单纯通过数据内 在逻辑来判断维度，常常是错误的，而主观判断其实更加科学，并非象统计学宣称的，数据说话才有发言权。真正有发言权的，是你对问题的经验认识程度。人们为 了避免被人嘲笑主观判断的失误，而越来越选择了统计分析，实际上，他们并不清楚，单纯用统计分析来做判断，才是最愚蠢的。只有主客观结合起来，才是相对科 学的，两者矛盾的时候，应该深入研究矛盾的根源，搞不清楚的话，我认为指标体系评价法要远比统计分析准确的多。而变量之所以能分布在不同的因子内，则是由 于其方差波动性大小和变量之间的相关性决定的，波动性越大，越排在前面的公因子中，各个公因子之间的变量是不相关的，而每个公因子之间的变量是相关的。因 子分析认为那些数据波动大的变量对对象影响作用更大，它们排在公因子的前列，这样单纯从数据逻辑来判断的准则你认为对吗？我想，如果管理和社会科学都这幺 认为的话，那错误将大大增加了。上面想法是我这两年做课题的体会，没有在任何一本书上看过相关说法，也许说的不对，这是我个人看法。如果让我选择的话，我 宁愿用指标体系评价法，体系几个维度事先就清楚，最多先用因子分析算算，看看数据波动性如何，到底能确定几个维度，只起辅助作用。研究者就是专家，指标体 系的维度由主观来做判断，这主要来自经验判断，而不是由数据判断，我认为其实更科学。当然，如果你对问题一无所知，那指标体系评价法用AHP来做的话，错 误很可能更多。我以前就强烈批判过AHP。说到底，没有一种评价方法是好的，说明问题就好。问题：那能对LISREL进行类似于因子分析的探索性因素分析了解吗？能给点评价么？3x答复：下面是探索性分析的原理：
传统上所谈的因素分析）factor analysis)指的是探索性因素分析）exploratory factor analysis)，它的目的是在承认有测量误差的情形下，尝试用少数的因素）factors)以解释许多变项间的相关关系。
随着统计理论及电脑计算上的进展，目前因素分析的方法可分成探索性因素分析）exploratory factor analysis，EFA)及验证性因素分析）confirmatory factor analysis，CFA)，这两类分析之间的差别在于研究者对研究变项间因素结构的了解程度不同。如果研究者对资料内所含的因素性质，结构及个数不是很 清楚，则可使用探索性因素分析试图找出能解释资料变项间相关关系的少数几个重要因素。若研究者从过去文献中的理论及自己的研究经验，而对资料间因素之数 目，结构有一定程度的了解及假设，则可使用验证性因素分析来验证该假设是否能解释资料变项间的共变关系。探索性因素分析需考虑的步骤包括:估计共通值） communalities)，决定因素的数目，估计因素负荷量，对因素做转轴）rotation)以得最好的结果，最后则为对结果作解释。验证性因素分 析则需考虑对因素结构关系之确立）model specification)，是否能对参数找出单一组解）identification)，参数的估计法）estimation)，检验资料与假设模式 之间的适合度）evaluation)。比较二者，EFA算是探索可能的因素结构之一种方法，而CFA则是验证假设因素结构存在的方法，因此CFA较 EFA对模式使用了较多的假设，也多了模式检验的过程。除了以上这两类的分析外，读者可能还听过结构方程模式）structural equation modeling，SEM)，其所常使用的分析软体包括:LISREL，EQS，AMOS，Mplus等。结构方程模式是用在对因素间之关系更明确时，其 模式中可含有许多潜在变项及观察变项，研究者对各变项间之关系有一定程度之了解及假设，并可经由检验此假设模式并经过模式之修正及再检验后，确立最后可解 释资料的模式，以了解资料变项间之关系。

7. 因子分析适合哪些问题的分析

因子分析适合问题的分析如下：

因子分析可以做经济效益的评价，指标有百元固定资产原值实现产值、利税、总产值实现利税、销售收入实现利税。
把很多指标综合成较少因子，既有利于对问题进行分析和解释，又能便于抓住主要矛盾做出科学评价。
因子分析的形成和发展有相当长的历史，早期由于计算量大，又缺少高速计算机的设备，使因子分析的使用和发展受到了很大限制。后来由于计算机的高速发展，使得因子分析的理论研究和计算问题得到了很大的发展，目前广泛应用于经济学、社会学、考古学、生物学、医学、地质学以及体育科学等各个领域。
因子分析法是一种多元统计的方法，其基本思想是通过各变量之间的相关系数矩阵的内部结构的研究，给出少数几个能表示所有显在变量的隐性因素，并描述给变量之间的关系，而这几个少数的变量是不能直接观察到的，通常被称为因子。

进而依据各变量相关性大小把变量进行分组，使得在同一个组内的变量的相关性较高，而不同组之间的变量的相关性较低。因子分析可以消除指标间的高相关性，也就是指标的重复现象，通过现象抽出事物的本质属性。

因子分析适合哪些问题的分析

8. 什么是因子分析因子分析的应用

　　因子分析是指研究从变量群中提取共性因子的统计技术。那么你对因子分析了解多少呢?以下是由我整理关于什么是因子分析的内容，希望大家喜欢!
   
      
       　　因子分析的简介   
    　　因子分析的  方法  约有10多种，如重心法、影像分析法，最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法，是以相关系数矩阵为基础的，所不同的是相关系数矩阵对角线上的值，采用不同的共同性□2估值。在社会学研究中，因子分析常采用以主成分分析为基础的反覆法。
   
    　　主成分分析为基础的反覆法　主成分分析的目的与因子分析不同，它不是抽取变量群中的共性因子，而是将变量□1，□2，…,□□进行线性组合，成为互为正交的新变量□1，□2，…,□□，以确保新变量具有最大的方差：
   
    　　在求解中，正如因子分析一样,要用到相关系数矩阵或协方差矩阵。其特征值□1，□2，…，□□,正是□1，□2,…，□□的方差，对应的标准化特征向量，正是方程中的系数□，□，…，□。如果□1>□2,…，□□，则对应的□1，□2，…，□□分别称作第一主成分,第二主成分，……,直至第□主成分。如果信息无需保留100%，则可依次保留一部分主成分□1，□2，…，□□(□<□)。
   
    　　当根据主成分分析，决定保留□个主成分之后，接着求□个特征向量的行平方和，作为共同性□：
   
    　　□并将此值代替相关数矩阵对角线之值，形成约相关矩阵。根据约相关系数矩阵，可进一步通过反复求特征值和特征向量方法确定因子数目和因子的系数。
   
    　　因子旋转为了确定因子的实际内容,还须进一步旋转因子，使每一个变量尽量只负荷于一个因子之上。这就是简单的结构准则。常用的旋转有直角旋转法和斜角旋转法。作直角旋转时，各因素仍保持相对独立。在作斜角旋转时，允许因素间存在一定关系。
   
    　　Q型因子分析 上述从变量群中提取共性因子的方法，又称R型因子分析和R型主要成分分析。但如果研究个案群的共性因子，则称Q型因子分析和Q型主成分分析。这时只须把调查的□个方案，当作□个变量，其分析方法与R型因子分析完全相同。
   
    　　因子分析是社会研究的一种有力工具，但不能肯定地说一项研究中含有几个因子，当研究中选择的变量变化时，因子的数量也要变化。此外对每个因子实际含意的解释也不是绝对的。
       　　因子分析的应用   
    　　在市场调研中，研究人员关心的是一些研究指标的集成或者组合，这些概念通常是通过等级评分问题来测量的，如利用李克特量表取得的变量。每一个指标的集合(或一组相关联的指标)就是一个因子，指标概念等级得分就是因子得分。
   
    　　因子分析在市场调研中有着广泛的应用，主要包括：
   
    　　(1)消费者习惯和态度研究(U&A)
   
    　　(2) 品牌形象和特性研究
   
    　　(3)服务质量调查
   
    　　(4) 个性测试
   
    　　(5)形象调查
   
    　　(6) 市场划分识别
   
    　　(7)顾客、产品和行为分类
   
    　　在实际应用中，通过因子得分可以得出不同因子的重要性指标，而管理者则可根据这些指标的重要性来决定首先要解决的市场问题或产品问题。
       　　因子分析的描述   
    　　验证性因子分析的强项正是在于它允许研究者明确描述一个理论模型中的细节。那么一个研究者想描述什么呢?我们曾经提到因为测量误差的存在，研究者需要使用多个测度项。当使用多个测度项之后，我们就有测度项的“质量”问题，即有效性检验。而有效性检验就是要看一个测度项是否与其所设计的因子有显著的载荷，并与其不相干的因子没有显著的载荷。当然，我们可能进一步检验一个测度项工具中是否存在单一方法偏差，一些测度项之间是否存在“子因子”。这些测试都要求研究者明确描述测度项、因子、残差之间的关系。对这种关系的描述又叫测度模型 (measurement model)。对测度模型的质量检验是假设检验之前的必要步骤。