方法:增加样本量或选择另一种回归如主成分回归和岭回归 。
3.逻辑回归分析
线性回归模型要求因变量是连续的正态分布变量,自变量和因变量具有线性关系,而Logistic回归模型不要求因变量的分布,一般在因变量离散时使用 。
分类:
Logistic回归模型可分为条件模型和非条件模型 。条件Logistic回归模型和无条件Logistic回归模型的区别在于参数估计中是否使用了条件概率 。
4.其他回归方法:非线性回归、有序回归、Probit回归、加权回归等 。
八 。聚类分析
将样本或指标变量按其特征进行分类 , 从而找到合理的统计量来衡量事物的相似性 。
1.财产分类:
q-聚类分析:对样本进行分类,也称为样本聚类 。距离系数作为一种度量相似性的统计量,如欧氏距离、极端距离、绝对距离等 。
r型聚类分析:对指标进行分类,也称指标聚类分析,以相似系数为统计量,衡量相似性、相关系数、列联系数等 。
2.方法分类:
1)系统聚类法:适用于小样本的样本聚类或指数聚类 。一般采用系统聚类的方法对指标进行聚类,也称为层次聚类 。
2)逐步聚类法:适用于大样本聚类 。
3)其他聚类方法:两步聚类、K-means聚类等 。
九 。判别分析
1.判别分析:根据一批分类良好的样本,建立判别函数,以尽量减少误判的情况,进而判断给定的新样本来自哪个总体 。
2.与聚类分析的区别
1)聚类分析可以对样本和指标进行分类;判别分析只能应用于样本
2)聚类分析事先不知道事物的类别,也不知道如何把事物分成几类;判别分析一定要事先知道事物的类别,也要知道如何把事物分成几类 。
3)聚类分析不需要分类的历史数据,直接对样本进行分类;判别分析需要对历史数据进行分类,建立判别函数,然后才能对样本进行分类 。
3.分类:
1)Fisher判别分析:
分类是以距离为准则,即把样本归入与哪个类的距离最短的哪个类,适用于两种判别;
分类是基于概率的,即样本被归入哪个类别的概率最高 , 适用于
适用于多类判别 。
2)贝叶斯判别分析:
BAYES判别分析比FISHER判别分析更加完善和先进 。既能解决多种判别分析,又能考虑数据的分布 , 所以一般用的比较多 。
X.主成分分析
将一组相互关联的指标改编成一组新的独立指标 , 并用少数几个新指标综合反映原指标所包含的主要信息 。
XI 。要素分析
多元统计分析方法旨在发现隐藏在多元数据中的潜在因素,这些因素不能直接观察到,但影响或支配可测量变量 , 并估计潜在因素对可测量变量的影响程度以及潜在因素之间的相关性 。
与主成分分析相比:
相同:都可以起到调节多个原始变量内部结构关系的作用 。
区别:主成分分析侧重于综合原始的适应信息,而因子分析侧重于解释原始变量之间的关系 , 是比主成分分析更深入的多元统计方法 。
用途:
1)减少分析变量的数量
2)通过检测变量之间的相关性,对原始变量进行分类
十二 。时间序列分析
动态数据处理的统计方法,研究随机数据序列的统计规律,解决实际问题;时间序列通常由四个要素组成:趋势、季节变化、周期波动和不规则波动 。
方法:移动平均滤波和指数平滑、ARIMA水平型、定量ARIMA水平型、ARIMAX模型、自回归水平型和ARCH族模型 。
十三 。生存分析
一种用于研究存活时间分布规律以及存活时间与相关因素关系的统计分析方法 。
1.内容:
1)描述生存过程,即研究生存时间的分布规律 。
2)生存过程比较,即研究两组或多组生存时间的分布规律并进行比较 。
3)分析危险因素,即研究危险因素对生存过程的影响 。
4)建立数学模型,即用一个数学公式表示生存时间与相关危险因素的依赖关系 。
2.方法:
1)统计描述:包括生存时间的分位数、中位生存时间、平均值、生存函数的估计、判断生存时间的图解法,不对分析后的数据做出任何统计推断结论 。
2)非参数检验:检验每一级分组变量对应的生存曲线是否一致,对生存时间的分布没有要求,检验危险因素对生存时间的影响 。
一种产品极限法(PL法)
b生命表法(LT法)
3)半参数水平回归分析:在一定假设下 , 建立生存时间随多个危险因素变化的回归方程,用Cox比例风险回归分析表示 。
推荐阅读
- 三星的固态是不是最好的 三星固态硬盘怎么样
- 恋爱冷暴力的危害 恋爱冷暴力怎么解决
- 吃石榴的季节是几月份
- 鲜族辣椒酱的做法 鲜族辣椒酱怎么做
- 中秋节吃螃蟹吗
- 胡萝卜和土豆能一起吃吗
- 黑枸杞与什么不能同吃
- 螃蟹可以用微波炉加热吃吗
- 李子酸放几天会甜吗