对应分析方法与对应图解读方法——七种分析角度

对应分析是一种多元统计分析技术，主要分析定性数据Category Data方法，也是强有力的数据图示化技术，当然也是强有力的市场研究分析技术。

这里主要介绍大家了解对应分析的基本方法，如何帮助探索数据，分析列联表和卡方的独立性检验，如何解释对应图，当然大家也可以看到如何用SPSS操作对应分析和对数据格式的要求！

对应分析是一种数据分析技术，它能够帮助我们研究由定性变量构成的交互汇总表来揭示变量间的联系。交互表的信息以图形的方式展示。主要适用于有多个类别的定类变量，可以揭示同一个变量的各个类别之间的差异，以及不同变量各个类别之间的对应关系。适用于两个或多个定类变量。

主要应用领域：

概念发展（Concept Development)
新产品开发 (New Product Development)
市场细分 (Market Segmentation)
竞争分析 (Competitive Analysis)
广告研究 (Advertisement Research)

主要回答以下问题：

谁是我的用户？
还有谁是我的用户？
谁是我竞争对手的用户？
相对于我的竞争对手的产品，我的产品的定位如何？
与竞争对手有何差异？
我还应该开发哪些新产品？
对于我的新产品，我应该将目标指向哪些消费者？

数据的格式要求

对应分析数据的典型格式是列联表或交叉频数表。常表示不同背景的消费者对若干产品或产品的属性的选择频率。背景变量或属性变量可以并列使用或单独使用。
两个变量间——简单对应分析。
多个变量间——多元对应分析。

案例分析：自杀数据分析
上面的交互分析表，主要收集了48961人的自杀方式以及自杀者的性别和年龄数据！POISON（毒药）GAS（煤气）HANG（上吊）DROWN（溺水）GUN（开枪）JUMP（跳楼）（我们就不翻译成中文了，读者可以把六个方式想象成品牌或别的什么）
当然，我们拿到的最初原始数据可能是SPSS数据格式记录表，
其中，性别取值1-male 2-female，年龄取值1-5，分别表示不同年龄段。
要回答的问题是：
1-不同性别的人在选择自杀方式上有什么差别？
2-不同年龄的人在选择自杀方式上有什么差别？
3-不同性别年龄的人在选择自杀方式上有什么差别？
我们首先，把性别字段乘上10加上年龄字段生成新字段sexage，取值是11-15，21-25，然后分别用M/F和年龄组中值代表Sexage字段的变量值标，这样我们就可以进行简单对应分析了！

现在问大家，如果你看到上面的6×10的矩阵-列联表，你能看出什么差异？
现在我们采用SPSS软件进行对应分析！
（我现在用的是SPSS17.0多语言版本，前两天听博易智讯的人说，现在SPSS已经有18.0版本了，不过从对应分析方法角度我还是希望用11.5版本，因为可以自己拆分重新组合修改图形，现在的版本是图片了，不能随心所欲的修改，不爽！）

分别定义好行列变量以及它们的取值范围！
对应分析中，6×10的列联表（交互表）可以得到行列维度最小值减1的维度，我们看到第一维度Dim1解释了列联表的60.4%，第二维度Dim2解释了列联表的33.0%，说明在两个维度上已经能够说明数据的93.4%，这是比较理想的，当然我们也可以看卡方检验等！
下面我们主要解释如何解读对应图（小蚊子的博客中也有非常相似的解释，我非常欣赏他的博客）
首先对SPSS分析得到的对应图进行修饰和编辑，在零点增加两条中线！
解读方法：
1-总体观察：
我们从图上左右可以看出，左边全部是M*，男性，右边F*全部是女性，说明男女有显著差异；同时看横轴中线上方都是年龄大的，下面都是年龄小的，说明年龄有差异；这样就一目了然看出和回答了前两个问题；

2-观察邻近区域
我们从图上可以看出，老的男性比较喜欢HANG，GAS和GUN是年轻男性的偏好；老的女性比较喜欢DAWN，年轻的女性比较偏好POISON；

3-向量分析——偏好排序
我们可以从中心向任意点连线-向量，例如从中心向GUN做向量，然后让所有的人往这条向量及延长线上作垂线，垂点越靠近向量正向的表示越偏好这种方法。
记住：是垂点到GUN正向排名，从图中我们可以看出，希望GUN方法的人依次是M15、M30、M45、M60、M80、F15等等；依次类推，我们还可以从中心向任意一种方法作垂线，都可以排出每种方法选择人群的偏好次序；当然，你也可以从中心往所有的人作向量，得到每一类人在选择六种方法上的偏好排名！
你是否可以看出，F15年轻的女性对六个“品牌”的偏好吗？

4-向量的夹角——余弦定理
接着，我们可以从向量夹角的角度看不同方法或不同人之间的相似情况，从余弦定理的角度看相似性！
从图上我们可以看出，当我们从中心向任意两个点（相同类别）做向量的时候，夹角是锐角的话表示两个方法具有相似性，锐角越小越相似；也就是说，GUN和GAS是相似品牌，当如也是竞争品牌，也具有替代性，如果这次开枪没有自杀成功，下次他一定选择毒气啦；我们也看出F15和F30的人比较相似，但F15与M80就有非常大的差异了，因为如果作向量他们是钝角，几乎是平角了！

5-从距离中的位置看：越靠近中心，越没有特征，越远离中心，说明特征越明显
从这张对应图中我们看到，有些点远离中心，有些点靠近中心，这说明什么呢？从几何空间的角度，如果我对每一人都一样的好，在规范图上我就应该站在大家的重心，也就是中心；这说明越靠近中心的点，越没有差异，（记住：没有差异并不代表不重要，只是没有差异，因为统计的技术是研究差异的技术，差异越大往往重要性就大！），越远离中心特征越明显，也就是说，如果听到一个M80的人自杀了，估计你就会想到是不是HANG啦！

从品牌角度思考，说明越远离中的的品牌，消费者很容易识别，说明品牌特征（特色、特点）明显，越靠近中心的品牌，消费者不易识别，也说明你的品牌定位没有显著可识别的特征，没有差异认知！

6-坐标轴定义和象限分析
我们还没有定义坐标轴呢？从第一点的分析，其实我们很快就可以定义坐标轴的含义了！（当然有时候对应图的座位是非常难定义的）
因此，落在第四象限的是年轻的女性所喜欢的品牌！

7-产品定位：理想点与反理想点模型
我们可以在图上以POISON为定位点，以POISON为圆心，以它的利益为半径画圆，那么我们可以得出这样的结论：越先圈进来的人就是最喜欢这个品牌的消费群，越先圈进来的品牌越可能是竞争品牌；当然，你也可以以某类人作为圆心，同意解读；如果POISON是市场不存在的，在调查中可以设定为理想点，这样我们就可以得到理想点模型，同理也可以得到反理想点模型分析！

8-市场细分和定位
最后，研究人员可以根据前面的分析和自身市场状况，进行市场细分，找到目标消费群，然后定位进行分析！最终选择不同的目标市场制定有针对性的营销策略和市场投放！
我们也可以尝试采用多元对应分析，但不如简单对应分析有意义！
简单对应分析的优点：
定性变量划分的类别越多，这种方法的优势越明显，揭示行变量类别间与列变量类别间的联系，将类别联系直观地表现在二维图形中（对应图），可以将名义变量或次序变量转变为间距变量。
简单对应分析的缺点：不能用于相关关系的假设检验，维度要由研究者决定，有时候对应图解释比较困难，对极端值比较敏感。

一	二	三	四	五	六	日
« 6月
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Data Is Art

Tableau，Alteryx，Knime，R，D3，Data Mining，Network，GeoSpatial，Visualization

对应分析方法与对应图解读方法——七种分析角度