回归模型最常用的评估指标是什么
什么是判定系数r2和估计标准误差syx?
什么是判定系数r2和估计标准误差syx?
R2系数是一个重要的判定指标,公式为。从公式中可以看出,判定系数等于回归平方和在总平方和总所占的比率,即回归方程所能解释的因变量变异性的百分比。
如果R20.775,说明变量y的变异性中有77.5%是由自变量x引起的;如果R21,表示所有的观测点全部落在回归直线上;如果R20,则表示自变量与因变量无线性关系。
估计标准误差实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系。
因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。统计上定义剩余误差除以自由度n–2所得之商的平方根为估计标准误。:其公式为(5.10)式中:为估计标准误差,n-2是自由度。
在回归分析中,估计标准误差越小,表明实际值越紧靠估计值,回归模型拟合优度越好;反之,估计标准误差越大,则说明实际值对估计值越分散,回归模型拟合越差。
实际工作中也可用下列简捷公式(5.11)以例题2计算:(万元)或作为回归模型拟合优度的判断和评价指标,估计标准误显然不如判定系数r2.r2是无量纲系数,有确定的取值范围(0—1),便于对不同资料回归模型拟合优度进行比较;而估计标准误差是有计量单位的,又没有确定的取值范围,不便于对不同资料回归模型拟合优度进行比较。
但是,估计标准误差在回归分析中仍然是一个重要的指标,因为它还是用自变量估计因变量时确定置信区间的尺度,用X对Y进行估计的置信区间为:(5.12)
因此,可以推断有68.27%的Y落在Y±1SXY以内,有95.45%的Y落在Y±2SXY以内,有99.73%的Y落在Y±3SXY以内。
这是在大样本条件下的区间估计。
如果样本n30,就要用t分布来确定置信区间,在给定置信度1-a时,Y的某一数值的置信区间为:(5.13)其中ta/2(n-2)可查t分布表得到,X0为给定的自变量的某一数值。
如例2中:X08万件Y0150.51万元SXY9.77X5.04;当a0.05时,即以95%的置信度估计,查t表得t0。025(5-2)3.1824。则Y的置信区间为:也即当产量为8万件时,有95%的把握估计生产成本在107.23——193.79万元之间。
回归方程的决定系数?
关于回归方程决定系数的说法
A.决定系数测度回归模型对样本数据的拟合程度
C.决定系数等于1,说明回归模型可以解释因变量的所有变化
D.决定系数取值在[0,1]之间
E.如果决定系数等于1,所有观测点都会落在回归线上