kl800.com省心范文网

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 回归模型的残差分析拓展资料素材 北师大版选修1-2


回归模型的残差分析
判断回归模型的拟合效果是回归分析的重要内容, 在回归分析中, 通常用残差分析来判 断回归模型的拟合效果。下面具体分析残差分析的途径及具体例子。 一、 残差分析的两种方法

1、差分析的基本方法是由回归方程作出残差图,通过观测残差图,以分析和发现观测 数据中可能出现的错误以及所选用的回归模型是否恰当; 在残差图中, 残差点比较均匀地落 在水平区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型的拟合精 度越高,回归方程的预报精度越高。

2、 可以进一步通过相关指数 R ? 1 ?
2

?(y
i ?1 n i ?1

n

i

? yi ) 2
来衡量回归模型的拟合效果, 一般

^

?(y

i

? y)

2

规律是 R 越大,残差平方和就越小,从而回归模型的拟合效果越好。 二、 典例分析:

2

例 1、某运动员训练次数与运动成绩之间的数据关系如下: 次数/x 成绩/y 30 30 33 34 35 37 37 39 39 42 44 46 46 48 50 51

试预测该运动员训练 47 次以及 55 次的成绩。 解答: (1)作出该运动员训练次数 x 与成绩 y 之间的散点图,如图 1 所示,由散点图可 知,它们之间具有线性相关关系。

(2)列表计算: 次数 x i 30 成绩 yi 30

xi2
900

yi2
900

x i yi
900

1

33 35 37 39 44 46 50

34 37 39 42 46 48 51
8

1089 1225 1369 1521 1936 2116 2500

1156 1369 1521 1764 2116 2304 2601
8

1122 1295 1443 1638 2024 2208 2550

由上表可求得 x ? 39.25, y ? 40.875,
8

? xi2 ? 12656, ? yi2 ? 13731,
i ?1 i ?1

?x y
i ?1 i

8

i

? 13180,所以 ? ?

? (x
i ?1 8

i

? x)( y i ? y )
i

? (x
i ?1

?

?x y
i ?1 8 i

8

i

? 8x y ?x
2

? x)

2

?x
i ?1

? 1.0415 .

2 i

. ? ? y ? ? x ? ?0.00302,所以回归直线方程为 y ? 1.0415x ? 0.00302
(3)计算相关系数

^

将上述数据代入 r ?

?x y
i ?1 i

8

i

? 8x y
8

? (x
i ?1

8

得 r ? 0.992704 ,查表可知
2

2 i

? 8 x )(? yi2 ? 8 y )
2 i ?1

r0.05 ? 0.707,而 r ? r0.05 ,故 y 与 x 之间存在显著的相关关系。
(4)残差分析: 作残差图如图 2,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比 较合适。

2

计算残差的方差得 ?

2

? 0.884113 ,说明预报的精度较高。
2

(5)计算相关指数 R
2

计算相关指数 R =0.9855.说明该运动员的成绩的差异有 98.55%是由训练次数引起的。 (6)做出预报

x ? 0.00302 . 作为该运动员成绩的预报值。 由上述分析可知,我们可用回归方程 y ? 1.0415
将 x=47 和 x=55 分别代入该方程可得 y=49 和 y=57, 故预测运动员训练 47 次和 55 次的成绩分别为 49 和 57. 点评:一般地,建立回归模型的基本步骤为: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在 线性关系等) ; (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方 程 y=bx+a) ; (4)按一定规则估计回归方程中的参数(如最小二乘法) ; (5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机 的规律性等等) ,若存在异常,则检查数据是否有误,或模型是否合适等。 例 2、某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽 取 10 户进行调查,其结果如下: 月人均收入 x/元 300 390 420 520 570 700 760 800 850 月人均生活费 y/元 255 324 335 360 450 520 580 600 630
3

^

1080

750

试预测人均月收入为 1100 元和人均月收入为 1200 元的两个家庭的月人均生活费。 解答:作出散点分布图如图,由图可知,月人均生活费与人均收入之间具有线性相关 关系。

通过计算可知 x ? 639 , y ? 480.4 ,
10

? xi2 ? 4610300, ? yi2 ? 2540526,
i ?1 i ?1
i i

10

10

?x y
i ?1

10

i i

,所以 ? ? ? 3417560

?x y
i ?1 10

? 10x y ? 10x
2

?x
i ?1

? 0.6599 .

2 i

? ? y ? ? x ? 58.751,所以回归直线方程为 y ? 0.6599x ? 58.751.
计算相关系数得 r ? 0.993136 ,而查表知 r0.05 ? 0.632,故月人均收入与月人均生活 费之间具有显著相关关系。 作残差图如图,由图可知,残差点比较均匀地落在水平的带状区域中,说明选用的模 型比较合适。

^

4

计算相关指数得 R =0.9863,说明城镇居民的月人均生活费的差异有 98.63%是由月 人均收入引起的。 由以上分析可知,我们可以利用回归方程 y ? 0.6599x ? 58.751. 来作为月生活费的预 报值。 将 x=1100 代入回归方程得 y=784.59 元;将 x=1200 代入回归方程得 y=850.58 元。 故预测月人均收入分别为 1100 元和 1200 元的两家庭的月人均生活费分别为 784.59 元 和 850.58 元。
^

2

5


陕西省吴堡县吴堡中学高中数学 第一章 统计案例 例谈回...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 例谈回归分析的应用素材 北师大版选修1-2_数学_高中教育_教育专区。例谈回归分析的应用在解许多实际应用问题时, ...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 数理统...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 数理统计学的产生和发展拓展资料素材 北师大版选修1-2_数学_高中教育_教育专区。数理统计学的产生和发展统计学起...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 回归分...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 回归分析注意问题两例素材 北师大版选修1-2_数学_高中教育_教育专区。回归分析注意问题两例一、相关性判断问题 例...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 例析回...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 例析回归分析思想素材 北师大版选修1-2_数学_高中教育_教育专区。例析回归分析思想 1、相关性检验 相关性检验是...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性检验的步骤及应用素材 北...分析:本题考查回归的基本思想、方法及初步应用,会用残差分析判断回归模型的拟合...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性检验素材 北师大版选修1-2_数学_高中教育_教育专区。独立性检验统计学的一种检验方式。与适合性检验同属于...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 生活中...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 生活中的独立性检验素材 北师大版选修1-2_数学_高中教育_教育专区。生活中的独立性检验独立性检验在实际生活中有...

陕西省吴堡县吴堡中学高中数学 第一章 斐波那契数列拓...

陕西省吴堡县吴堡中学高中数学 第一章 斐波那契数列拓展资料素材 北师大版必修5_数学_高中教育_教育专区。斐波那契数列每一对兔子过了出生第一个月之后,每个月生一...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性检验的基本思想及初步应用素材 北师大版选修1-2_数学_高中教育_教育专区。独立性检验的基本思想及初步应用一...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性...

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性检验的基本思想及初步应用素材 北师大版选修1-2_数学_高中教育_教育专区。独立性检验的基本思想及初步应用一...