多变量分析

GenStat 多变量分析
Simon Harding 和Roger Payne编写
多变量分析对一组中n个研究对象的几种不同测试是非常有用的。 GenStat中测量值通常会被存储成独立变量,每个研究对象的变量都会有一个单元。 这些研究对象通常被视为是在p维(p为变量的数目)的n个点。
许多技术,例如主成分分析(第2章)和典型变量分析(第3章)是用来减少维度的。 也就是说,它们的目标是找到一组数目更小的却能够最大化的展现数据中呈现的变量的维度(通常为2或3)。 这可以帮助您确定数据的规律或结构,以及识别单个变量的相对重要性。 GenStat的几个菜单都可以产生图形,例如主坐标分析(第4章)和多维尺度分析(第5章)。 它还具有模拟多元数据的功能,包括多元方差分析(第8章)和偏最小二乘法。
另一个重要的功能是将一组单元基于它们的观测特性分成组。 分层聚类分析(第6章)就是由包含单元的一系列组开始的。 这些初始组先后根据相似性合并成较大的组,直到最后的包含所有的观测值的组。GenStat还提供不分层分类的菜单(第7章),其目的是形成一个单一观测组,优化某些标准如类内离散,或组间马氏平方距离,或组间平方和。
第9章介绍构建分类树的功能,可以使用多元观测预测不明对象的分类。 回归树,可以预测多变量观测值的响应变量,具体见10章。
最后,第11章介绍了广义普鲁克 分析如何用来获得例如品酒这样的活动中评估者的共识。 本书通过一系列简单的示例,并经常附有可以让用户尝试使用自己的方法的实例。 这些实例可以通过在Windows版本的GenStat菜单中获得,所以不需要事先具有GenStat命令语言的知识。