一、分析区的背景概况
湖南省位于中国中南部,长江中游以南的地区,因为大部分位于洞庭湖以南而得名湖南,又因湘江贯穿于全境而简称“湘”,东南西三面环山,中部、北部低平,形成向北开口的马蹄形盆地。
境内山地约占总面积的一半,平原、盆地、丘陵、水面约占一半,主要山脉有雪峰山,武陵山,幕阜山—罗霄山,南岭。水系有洞庭湖及湘江、资水、沅江、澧水,四水由西南向北汇聚洞庭湖,经岳阳城陵矶注入长江。湖南为大陆型中亚热带季风湿润气候,受东亚季风环流的影响密切相关,光、热、水资源丰富,且同期。如此优越的地理特征,为湖南省发展农林牧渔提供了良好的基础条件。
湖南省东临江西省,南靠广东省、广西壮族自治区,西达贵州省、重庆市,北接湖北省。这对发展农林牧渔产业提供了广阔的市场条件。
二、分析的数学方法
农林牧渔产业的发展在很大程度上影响着地区经济的发展。地区的农林牧渔业总产值提高了有利于整个经济指标的提升,但经济指标的提升不一定意味着农林牧渔业产值的提高。下面就结合本学期所学的有关数学分析法,分析湖南1949年至1977年以来农林牧渔业的总产值情况。笔者采用的是聚内分析法的原理进行分析。
三、分析的数据来源
本文数据是从2009年《湖南省统计年鉴》数据库中获取,内容包括1949、1950、1951、1952、1953、1954、1955、1956、1957、1958、1959、1960、1961、1962、1963、1964、1965、1966、1967、1968、1969、1970、1971、1972、1973、1974、1975、1976、1977个年分份湖南省每年的农业、林业、牧业、渔业的总产业值。
1
年份 农业 农林牧渔总产值(亿元) 林业 牧业 渔业 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 12.05 14.09 15.66 18.72 18.70 16.59 19.99 18.78 21.14 23.38 21.96 18.98 16.63 20.10 18.09 20.22 21.07 24.29 25.41 27.05 26.48 27.94 43.42 44.88 50.48 51.64 54.41 55.12 55.40 0.24 0.30 0.36 0.47 0.37 0.37 0.57 0.84 1.20 2.58 2.62 2.34 1.00 0.96 1.03 1.23 1.31 1.39 1.55 1.80 1.85 1.63 2.72 2.82 2.77 3.21 2.86 2.45 2.98 1.42 1.70 2.37 3.11 2.97 2.76 2.36 2.83 5.39 4.30 3.14 1.85 1.56 2.39 3.25 4.24 4.42 4.55 4.89 5.52 5.36 5.85 9.18 11.54 10.93 11.22 11.64 11.77 11.95 0.03 0.04 0.04 0.07 0.10 0.10 0.12 0.11 0.28 0.60 0.70 0.48 0.26 0.28 0.31 0.35 0.40 0.45 0.46 0.45 0.34 0.39 0.53 0.45 0.57 0.62 0.64 0.65 0.68
四、分析方法的原理
聚类分析,亦称群分析或点群分析,它是研究多要素事物分类问题的数量方法。其基本原理是,根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,这种亲疏关系程度对样本进行聚类。聚类分析方法,是定量地研究地理事物分类问题和地理分区问题的重要方法,聚类分析法是理想的多变量统计技术。常见的聚类分析方法有系统聚类法,模糊聚
2
类法,动态聚类法等,本实验主要采用系统聚类法。聚类分析的主要步骤包括三步:
1、聚类要素的数据处理。
假设有m个聚类的对象,每一个聚类的对象都有x1,x2,…xn个要素构成。
常用的方法有:
⑴、总和标准化,即分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即:
x'ijxijxi1mi1,2,,m;j1,2,,n
ij⑵、标准差标准化,把数值减去均值后再除以其标准差,标准化到 0 到1 之间;
x'ijxijxjsjxiji1,2,,m;j1,2,,n
i1,2,,m;j1,2,,n
⑶、极大值标准化,标准化到最大值为1;
x'ijmaxxiji⑷、极差的标准化,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。
'xijxijminxijiiimaxxijminxiji1,2,,m;j1,2,,n
2、对聚类对象之间的距离计算。
距离是事物之间差异性的度量,差异性越大则相似性越小,所以距离是系统聚类分析的依据和基础。当聚类要素的数据处理工作完以后,就要计算分类对象之间的距离,并依据距离矩阵的结构进行聚类。
3
如果把每一个分类对象的n个聚类要素看成n维空间的n个坐标轴,则每一个分类对象的n个要素所构成的n维数据向量就是n维空间中的一点。这样,各分类对象之间的差异性就可以由它们所对应的n维空火箭重点之间的距离度量。常用的计算距离的方法主要有:
⑴、绝对值距离:每个变量值之差的绝对值总和。
dijxk1nnikxjki,j1,2,,m
⑵、欧氏距离:两样品之间的距离是每个变量值之差的平方和之平方根。
dijxk1ikxjk2i,j1,2,,m
⑶、明科夫斯基距离:是欧氏距离的扩展,每个变量值之差的 q次方值的绝对值之和的 q 次方根。
pdijxikxjki,j1,2,,m
k1⑷、切比雪夫距离 :任意一个变量值之差的最大绝对值。
n1pdijmaxxikxjki,j1,2,,m
k
3、是计算类之间的距离。
⑴、组间连接法:合并两类的结果使所有的两两样品之间的平均距离最小。样品对的两个单位分别属于不同的类。
⑵、组内连接法:合并后的类中所有样品之间平均距离最小。两类间的距离即是合并的类中所有可能的样品对之间的距离平方。
⑶、最短距离法:首先合并最近的或最相似的两类,用两类间最近点间的距离代表两类间的距离。
⑷、最远距离法:用两类之间最远点的距离代表两类之间的距离。 ⑸、重心法 :先求出各类重心点,以重心点的距离作为类间相似性的测度。要求样品间距离为欧氏距离平方。
4
⑹、中位数法 :用两类的中位数之间的距离作为测度。要求样品间距离为欧氏距离平方。
⑺、离差平方和法: 其思想来源于方差分析。如果类分得正确,同类样品的离差平方和应当较小,类与类之间的离差平方和应当较大,要求样品间距离为欧氏距离。
五、分析方法的步骤
本实验借助于SPSS软件系统进行计算的。
1、打开SPSS,输入上表中所获得的数据。 2、选择【分析-分类-系统聚类】,跳出对话框。
3、在对话框中将总产值、农业、林业、牧业、渔业选入变量选项中,将年份选入标注个案中。默认为【观测量聚类】。
4、点击右侧的【绘制】按钮,选择【竖状图】,设置绘图类型,冰柱选择方向为【水平】,【继续】。
5、点击右侧的【方向】,聚类方法选择【为组内联接】,区间距离为【Euclidean距离(欧式距离)】,转换值中标准化选为【标准差为1】,【继续】。
6、点击【确定】,即可得到聚类分析的结果。
近似值[数据集0]
案例处理摘要 案例 缺失 N 百分比 0 .0% N 29
有效 百分比 100.0% N 29 合计 百分比 100.0% 5
聚类[数据集0] 平均联结(组内部)
阶 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
群集组合 群集 1 群集 2 5 6 1 2 4 5 18 19 27 29 16 17 4 7 1 3 14 15 4 8 20 22 26 27 13 14 20 21 16 18 1 4 25 26 25 28 9 16 10 11 9 20 24 25 1 13 9 12 23 24 9 10 1 9 1 23 聚类表 系数 .162 .183 .197 .212 .249 .258 .263 .268 .320 .334 .347 .396 .403 .410 .438 .473 .485 .540 .556 .575 .635 .720 .776 .811 .817 1.088 1.560 2.408 首次出现阶群集 群集 1 群集 2 0 0 0 0 0 1 0 0 0 0 0 0 3 0 2 0 0 0 7 0 0 0 0 5 0 9 11 0 6 4 8 10 0 12 17 0 0 15 0 0 19 14 0 18 16 13 21 0 0 22 24 20 23 26 27 25 下一阶 3 8 7 15 12 15 10 16 13 16 14 17 23 21 19 23 18 22 21 26 24 25 27 26 28 27 28 0 6
六、结论分析
从聚类分析谱系图(上图)可以看出:当距离为0时,每个区域为单独的一类,即29个区域单元各自为一类;当距离标准逐渐放大时,29个聚类单位被依次聚类。年份之间距离最小的1953、1954、1952、1949、1950、1966、1967、1975、1977首先分为一类,接着1954、1952、1955、1956、1949、1950、1951、1962、1963、1964、1965也被分为一类。如果选取聚类标准(距离)为5,则29个区域单位被分为7类。如果选取聚类标准(距离)为10,则29个区域单元被聚为3类。如果选取聚类标准(距离)为15 ,则29个区域单元被聚类为2
7
类。如果聚类标准(距离)扩大到20,则29个区域单元被聚类为1类。当聚类标准(距离)扩大到25时,最终也只剩一类了。
总的来说,从1949 年到1977年之间,湖南省的各个农业总产值在成阶梯式的向上增长,这与新中国成立以来,农民生活环境逐渐得到安宁,生活水平渐渐得到提高,使得农民有更多的心思去注意农业的发展,研究农业、林业、牧业、渔业的发展方法、及要发展的方向。这也为改革开放中国的农业、林业、牧业、渔业的更快发展奠定了基础,也使得改革开放来农业发展快步如飞。
七、参考文献
1、湖南统计年鉴2009
2、徐建华.计量地理学.高等教育出版社 3、
8
因篇幅问题不能全部显示,请点此查看更多更全内容