下一章 上一章 目录 设置
8、第 8 章 ...
-
数量关系两种类型:1.确定性关系,函数关系;2.非确定的关系,相关关系
函数关系:现象间存在的一一对应的确定关系,各观测点落在一条线上
相关关系:统计相关,现象之间存在非确定性的数量依存关系,但这种数量关系并不是严格一一对应的
相关关系的类型:单相关复相关,线性相关非线性相关,正相关负相关,完全相关不完全相关
基本步骤:1.判断正确现象之间有无关系以及相关关系的具体表现形式;2.计算相关系数,确定相关关系的密切程度;3.检测相关关系的显著性
不论定量定距
皮尔逊直线相关系数
r=Sxy方/Sx*Sy
r= 分子(n*zigema xy-zigema x * zigema y)分母(根号(n*zigema x方-(zigema x)方)根号(n*zigema y方-(zigema y)方)
取值范围-1到+1,带负号表示负相关,带正好表示正相关
0-0.3 微弱相关
0.3-0.5 低相关(弱相关)
0.5-0.8 中度相关
>=0.8 高度相关
=1 完全线性相关,函数关系
皮尔逊直线相关是一种线性(直线)相关程度的度量,只能表示它们直接线性相关程度很低,不表示它们之间其他形式的相关密切程度很低
相关关系的显著性检验
总体相关系数记为希腊字母那个很像p的,打不出来就用“肉”字表示了
1.提出假设 H0:肉=0;H1:肉不等于0
2.构造计算检验统计量 t=r*根号(n-2)/根号(1-r方),t检验 a/2 (n-2),小于则接受H0(相关性不显著),大于则拒绝H0(相关性显著)
3.根据给定的显著性水平alpha,确定临界值t alpha/2
回归分析
概念:对具有相关关系的现象之间的数量变化规律所做的分析,通过回归方程式来建立相关现象之间的数量联系,然后据以从数量上对某一或某一些现象的变化可能引起某特定现象的变化情况做出估计
相关与回归的联系:1.理论方法一致;2.无相关-->无回归,相关程度高-->回归效果好;3.相关系数同号,可互算
相关与回归的区别:相关分析1.变量对等关系,都是随机变量;2.两个变量只能计算一个相关系数;3.测定相关的方向和程度。回归分析1.变量不对等,分自变量和因变量,因变量是随机变量,自变量是确定性变量;2.两个变量一般建立一个回归方程,若互为因果则可以建两个;3.回归系数具有实际意义,利用回归模型进行预测和控制
一元回归
理论模型 y=a+bx+c
(a,b为模型参数,c为误差项随机变量)
b=分子(n*zigema xy -zigema x * zigema y) 分母(n*zigema x方-(zigema x)方
a=y一把-b*x一把
b是回归直线的斜率,含义:自变量x每增加(或减少)一个单位,因变量y将平均增加(或减少)b个单位。(“平均”圈起来!!!重点!!!)
r=Sxy方/Sx*Sy
b=r*Sy/Sx
线性回归模型检验
拟合优度r方(可决系数):指回归方程与各观测数据的接近程度
实际观察值y的大小事围绕其平均值y一把上下波动大,波动现象称为变差
总变差SST=随机变差SSE+回归变差SSR
SST=zigema(y-y一把)方
SSE=zigema(y-yc)方,随机变差,由随机因素造成的变差
SSR=zigema(yc-y一把)方,回归变差,由x变动造成的变差
yc就是x对应在回归方程里y的值
r方=SSR/SST=1-SSE/SST
回归估计标准误
估计误差的大小能反映估计值的准确性
Syx方=zigema(y-yc)方/(n-2)
Syx方=SSE/(n-2)
Syx=根号((zigema y方 -a*zigema y -b*zigema xy)/(n-2))
回归模型的统计检验
F检验
1.提出假设:H0:a=b=0;H1:a≠0 或 b≠0
2.构造检验统计量 F=SSR*(n-2)/SSE,F检验,1,n-2
3.根据给定的显著性水平alpha,确定临界值Falpha,大于则拒绝原假设,认为回归方程整体是显著的(想象正态图右侧)
4.确定原假设的拒绝规则,决策
T检验(显著性检验,验单个系数),自变量对于回归模型是否必要
1.提出假设:H0:a=0 ;H1:a不等于0
2.构造检验统计量:t=b/Syx*根号(1/zigema(x-x一把)方)
3.根据给定的显著性水平alpha,确定临界值t,alpha/2,n-2
4.确定原假设的拒绝规则,决策