在线学习
重点科目
初中数学
高中数学
高等数学
线性代数
概率统计
高中物理
数学公式
主要科目
复变函数
离散数学
数学分析
实变函数
群论
数论
未整理科目
近世代数
数值分析
常微分方程
偏微分方程
大学物理
射影几何
微分几何
泛函分析
拓扑学
数学物理
趣味数学
科数网
题库
教材
高考区
考研区
VIP
科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
高中物理
复变函数
离散数学
实变函数
数论
群论
你好
游客,
登录
注册
在线学习
高中数学
第十二章:排列组合与概率统计
一元线性回归模型的应用
最后
更新:
2025-02-22 09:12
查看:
70
次
反馈
刷题
一元线性回归模型的应用
## 一元线性回归模型的应用 一元线性回归方程 $\hat{y}=\hat{a}+\hat{b} x$ 在一定程度上描述了变量 $x$ 与 $y$ 之间的数量关系,根据这一方程,可依据自变量 $x$ 来估计或预测因变量 $y$ 的取值,这就是回归分析的主要目的。 `例`一个车间为了估计加工某种新型零件所花费的时间,进行了 10 次试验,测得的数据如下:  (1)$y$ 与 $x$ 之间是否具有相关关系? (2)如果 $y$ 与 $x$ 之间具有相关关系,求回归直线方程. (3)据此估计加工 110 个零件所用的时间. 解 (1) $$ \begin{aligned} & \text { } \begin{aligned} \bar{x} & =\frac{10+20+30+40+50+60+70+80+90+100}{10} \\ & =55, \\ \bar{y} & =\frac{62+68+75+81+89+95+102+108+115+122}{10} \\ & =91.7 . \\ \text { 于是 } r= & \frac{\sum_{i=1}^{10} x_i^2=38500, \sum_{i=1}^{10} y_i^2=87777, \sum_{i=1}^{10} x_i y_i=55950 .}{\sqrt{\left(\sum_{i=1}^{10} x_i^2-10 \bar{x}^2\right)\left(\sum_{i=1}^{10} y_i^2-10 \bar{y}^2\right)}} \\ = & \frac{55950-10 \times 55 \times 91.7}{\sqrt{\left(38500-10 \times 55^2\right)\left(87777-10 \times 91.7^2\right)}} \\ \approx & 0.9998, \end{aligned} \end{aligned} $$ 因此 $y$ 与 $x$ 之间具有显著的正相关关系. $$ \begin{aligned} &\text {(2)设所求的回归直线方程为 } \hat{y}=\hat{b} x+\hat{a} \text { ,则 }\\ &\begin{aligned} & \hat{b}=\frac{\sum_{i=1}^{10} x_i y_i-10 \bar{x} \bar{y}}{\sum_{i=1}^{10} x_i^2-10 \bar{x}^2}=\frac{55950-10 \times 55 \times 91.7}{38500-10 \times 55^2} \approx 0.668, \\ & \hat{a}=\bar{y}-\hat{b} \bar{x}=91.7-0.668 \times 55=54.96, \end{aligned} \end{aligned} $$ 即所求的回归直线方程为 $\hat{y}=0.668 x+54.96$ . (3)当 $x=110$ 时,$y$ 的估计值 $\hat{y}=0.668 \times 110+54.96=128.44$ . 因此,估计加工 110 个零件所用的时间为 128.44 min . 一般地,运用一元线性回归模型思想解决实际问题的基本步骤为: (1)确定研究对象,明确哪个变量是因变量,哪个变量是自变量; (2)运用相关系数的计算公式,分析自变量与因变量之间的关系; (3)运用最小二乘原理估计一元线性回归方程的系数,建立一元线性回归方程; (4)根据一元线性回归方程进行预测. `例`实验中获得了某化学品的化学反应时间和转化率的数据,见表 4-1,试建立转化率 $y$ 关于反应时间 $x$ 的回归方程(回归系数保留三位小数).  解:做出散点图  观察散点图可知,样本点并没有分布在某条直线附近,因而变量 $y$ 与 $x$ 之间没有明显的线性相关关系,所以不能直接利用线性回归模型来刻画这两个变量之间的关系。根据已有的数学知识,可以认为样本点分布在指数型曲线 $y=c_1 e ^{c_2 x}$ 的附近,其中 $c_1$ 和 $c_2$ 是待定参数。 为估计参数 $c_1$ 和 $c_2$ ,在 $y=c_1 e _2{ }^{c_2}$ 的两端取对数,得到 $$ \ln y=\ln c_1+c_2 x $$ 再令 $z=\ln y, a=\ln c_1, b=c_2$ ,则得到直线方程 $$ z=b x+a $$ 将表 中的数据进行代换得到的数据见表  做出散点图  从图 4.2-5 中可以看出,变换后的样本点分布在一条直线的附近,说明 $z$ 和 $x$之间具有线性相关关系,因此可以用线性回归方程来拟合。 对表 4-2 中的数据,用最小二乘法可得线性回归方程为 $$ \hat{z}=0.019 x+0.686 $$ 再利用 $y= e ^z$ 可得到转化率 $y$ 关于反应时间 $x$ 的非线性回 归方程 为 $$ \hat{y}=e^{0.686} \cdot e^{0.019 x} \approx 1.986 e^{0.019 x} $$ 在实际问题中,如果从数据的散点图可以看出两个变量之间有明显的非线性关系,就需要选择一个合适的曲线方程,按照这个曲线方程对原始数据进行代换。目的是把变量间的非线性关系转化为近似的线性关系,然后用建立线性回归方程的方法确定未知参数. 当数据量较大时,可采用计算器或者数学软件来求回归方程。
其他版本
【概率论与数理统计】一元线性回归
刷题
做题,是检验是否掌握数学的唯一真理
上一篇:
一元线性回归直线方程与最小二乘法
下一篇:
独立检验
本文对您是否有用?
有用
(
0
)
无用
(
0
)
纠错
高考
考研
关于
赞助
公式
科数网是专业专业的数学网站。