【计量地理学】实验二 经典统计分析方法
阅前提示:
计量地理学实验课的实验报告为当堂提交,相较以往实验报告缺少打磨与整理的时间,因此内容中不可避免出现相关错误!!!
1.某地区粮食产量与受灾面积的历年数据见(实验1数据中的“题目1”sheet),试计算二者之间的相关系数,并对相关系数进行显著性检验(α=0.05)
首先根据相关系数计算的公式,我们编写一个函数如下所示,该函数分别计算了相关系数公式下的分子与分母,最后相除得到结果,随后在代码中给出我们的具体数据,并调用我们构建的calculate_ correlation函数:
最后即可得到结果如下,相关系数为0.803002517876116,p值为0.005155650042626951小于0.05,因此我们可以认为粮食产量与受灾面积存在显著的相关关系:
2.根据4个要素的48个样本数据,计算得到的简单相关系数如下,试计算各级偏相关系数和复相关系数,并对其显著性进行检验:
这一部分仅展示思路,具体过程各位同学自己算吧,加油!
(1)一阶偏相关系数:
r12.3 | 0.81 | r14.2 | 0.94 | r24.1 | -0.45 |
r12.4 | r14.3 | r24.3 | |||
r13.2 | r23.1 | r34.1 | |||
r13.4 | 0.88 | r23.4 | 0.31 | r34.2 | 0.85 |
一阶偏相关系数检验:
t12.3 | 9.08 | t14.2 | 18.42 | t24.1 | -3.31 |
t12.4 | t14.3 | t24.3 | |||
t13.2 | t23.1 | t34.1 | |||
t13.4 | 12.30 | t23.4 | 2.14 | t34.2 | 10.58 |
自由度f=n-m-1=48-3-1=44,在α=0.001下,查表得:t0.001小于3.551,t12.3,t12.4,t13.2,t13.4,t14.2,t14.3,t34.2的值大于t0.001;t23.1,t23.4,t24.1,t24.3,t34.1的值小于t0.001。
这表明在置信度0.001水平上,偏相关系数r12.3,r12.4,r13.2,r13.4,r14.2,r14.3,r34.2是显著的;r23.1,r23.4,r24.1,r24.3,r34.1是不显著的。
(2)二阶偏相关系数:
r12.34 | 0.9984 | r14.23 | r24.13 | ||
r13.24 | r23.14 | r34.12 | -0.9953 |
二阶偏相关系数检验:
t12.34 | t14.23 | t24.13 | -70.5893 | ||
t13.24 | 169.9031 | t23.14 | t34.12 |
自由度f=n-m-1=48-3-1=44,在α=0.001下,查表得:t0.001小于3.551,t12.34,t13.24,t14.23的值大于t0.001;t23.14,t24.13,t34.12的值小于t0.001。
这表明在置信度0.001水平上,偏相关系数r12.34,r13.24,r14.23是显著的;r23.14,r24.13,r34.12是不显著的。
(3)复相关系数:
R1.234 | R3.124 | 0.999665 | |
R2.134 | 0.999978 | R4.123 |
复相关系数检验:
F1.234 | 9147250.61 | F3.124 | |
F2.134 | F4.123 | 882800.41 |
第一自由度f1=m=3,第二自由度f2=n-m-1=48-3-1=44,在α=0.005下,查F表得:F0.005在4.73和4.98之间,远小于上表中求出的四个F值。
因此,在0.005水平下,复相关达到了的显著水平。
3.某地区各地理单元的土壤侵蚀模数(x)与土壤含氮量(y)的数据见(实验1数据中的“题目3”sheet)。
1)画出二者之间的散点图并确定是什么样的相关形式;
利用Excel中的绘制散点图的工具,我们可以得到结果如下图所示:
2)试用一个非线性函数模型拟合该地区土壤侵蚀模数(x)与土壤含氮量(y)的关系:
利用Excel中提供的趋势线拟合工具,我们为土壤侵蚀模数(x)与土壤含氮量(y)构建拟合指数趋势线,得到结果如下图所示:
注意:这一部分思路错误,正确解法应该是:
令X=lnx,Y=lny,将原始数据进行转换,得到X,Y呈线性相关关系,设Y=a+bX,利用公式求出a,b的值,得到拟合函数。
3)检验该模型的显著性,并预测当土壤侵蚀模数x=8000t/(km2*a)时的土壤含氮量y:
根据上述结果我们可以得到R²为0.9615,R²值越接近1,表示模型与数据拟合得越好,因此我们可以认为拟合的该指数函数模型与数据之间的相关性较强,当土壤侵蚀模数x=8000t/(km2*a)时(注意单位!),我们编写Python代码如下所示用以得到土壤含氮量为1.825205706248608:
注意:这一部分思路错误同上,但博主懒得改了...
4.某地区连续13年的农业总产值(亿元,见实验1数据中的“题目4”sheet),计算其自相关系数,并拟合一级自回归模型,并预测2005年的农业总产值:
根据要求,我们编写代码如下所示:
得到结果如下所示:
5.实验1数据中的“题目5”sheet给出了某地区2002-2004年各季度用电量,试用季节性预测法预测该地区2005年各季度的用电量:
这一部分同样仅展示思路,具体过程各位同学自己算吧,这个题期末考试好像经常考
(1)求三点滑动平均
年度 | 季度 | 用电量/104kW | 三点滑动平均 |
2002 | 1 | 435 | |
2 | 2217 | 2136.00 | |
3 | 3756 | 2122.33 | |
4 | 394 | ||
2003 | 1 | 488 | |
2 | 2687 | ||
3 | 4396 | ||
4 | 406 | ||
2004 | 1 | 667 | |
2 | 3076 | 2910.33 | |
3 | 4988 | 2851.33 | |
4 | 490 |
(2)求季节性指标和校正季节性指标
2002 | 2003 | 2004 | 季节性指标 | 校正系数 | 校正季节性指标 | |
第一季度 | 0.4102 | 0.4800 | 0.4462 | 1.1434 | 0.5103 | |
第二季度 | ||||||
第三季度 | ||||||
第四季度 | 0.2549 | 0.2227 | 0.2388 | 0.2730 |
(3)二次指数平滑法:取平滑指数0.2,分别计算一次指数平滑值、二次指数平滑值、a、b的值
年度 | 季度 | 用电量/104kW | 一次指 数平滑 | 二次指 数平滑 | a | b |
2002 | 1 | 435 | 435.00 | 435.00 | 435.00 | 0.00 |
2 | 2217 | |||||
3 | 3756 | |||||
4 | 394 | |||||
2003 | 1 | 488 | ||||
2 | 2687 | |||||
3 | 4396 | |||||
4 | 406 | |||||
2004 | 1 | 667 | ||||
2 | 3076 | |||||
3 | 4988 | |||||
4 | 490 | 2039.83 | 1688.42 | 2391.24 | 87.85 |
(4)预测方程:y12+k=(2391.24+87.85*k)*θk
2005年各季度的用电量如下:
第一季度y=1.26496199*107kw;第二季度y=3.0912773*107kw;第三季度y=5.342781*107kw;第四季度y=7.488314*106kw