Weibin QU| 瞿伟斌

A Blog of WeiBin Qu.

归去何处

瞿伟斌 / 2017-10-14


Zipf法则学习笔记与思考

  作为一名地道的洛阳人,因为求学,在南京居住了好几年,每次在南京街头闲逛时,总少不了将眼前的这座城市和家乡相比。同作为四大古都,南京和洛阳如今的环境与实力却是天差地别,而即使是历史遭遇与洛阳极为相近的古都西安,如今的发展也早已将洛阳抛至身后。当然我这里想说的并不是说家乡的没落或者探讨这种现象的成因,这些自然有更专业的人士去研究。我只是忽然想起一个很多人有过的梦想:随着我们不断地努力和发展,终有一天,所有的城市的发展都不会有太大的差距。简单地说就像先人们曾想的大同世界一样。

  学过统计的都知道,当我们不确定我们所要研究的对象的分布时,我们常常会选择高斯分布也就是我们常说的正态分布(其之所以叫这个名字也正是因为其在自然界中过于普及)。甚至有许多的统计方法都必须要在样本服从高斯分布的假设下才能成立。其实这也符合我们通常的认知(例如人的身高就大致服从该分布,即对于总体而言,过好和过坏总是少数的,绝大多数的事情或物体都维持着一个平均水平,同时过低与过高之间的差距也不会过于巨大(否则概率为0)。这样的想法无疑拯救了统计学,它使人们在不知如何是好时,总可以找到一个还不算太坏的方式去估计总体的模样,而结果往往也不坏。既然如此,套用这样的思路,多少年后,各地人们的生活自然不会有太大的差距,绝对不存在一方是充满朝气,散发无限活力的庞然大都市,而另一方却人迹寥寥,仿佛在发展中被人抛弃以往的城镇。到那时,人们不会再羡慕什么首都,省会,因为所有的城市都是大都市。而诸如北漂、上漂这些时下时髦的词也会成为历史,在多少年后被人忘却。每每想到这些事情,我就总有一种干劲,仿佛这样的一天终会在我有生之年看到。只是让人难过的是,很多时候,那些美好的梦想最后真的成为了梦想,只能在梦里想一想。不仅仅是因为这样的情况会导致城市间许多重要功能缺失,更是因为有一个多次被验证的定律将这个梦彻底打碎。

  在距今大约八十多年前,有一个名叫Zipf的美国人提出了著名的Zipf定律,从而为城市发展奠定了一个基本法则。在介绍这个法则前,我们先来聊一聊一个多次由真实数据得到的结论:在一个区域内(一个国家或者一个省),一个城市的人口规模与该城市在该地区的排位的乘积应该近似为一个常数。

  什么意思呢?就是这个地区最大的城市的城市人口应该是第二大城市人口的两倍,是第三大城市人口的三倍,以此类推。将这个结论用数学的方法表示出来就是:城市的排名*城市的人口=一个固定常数($RiPi=C, (i = 1,2,\ldots,n)$. 其中$Ri$为城市的排名,$PI$为城市的人口数,而$C$为常数)。这就是著名的Zipf法则

  为了更好的理解,我们先来看一张图:

population of USA_1

  在2010年美国的人口普查中[^数据来自美国人口普查网],纽约又一次摘得桂冠,以817万人排在最靠前的位置。通过对比数据发现有九个城市人口规模超过一百万,有271个城市的规模在十万以上,而与此同时,有大量的城市人口低于一万。当然这不能说明什么,因为这只是表明美国城市众多而且除了那些大城市外还有众多小城市,这些城市的名字或许连美国人自己都不清楚。但是,当我们将数据稍作变换时,有趣的事情发生了:

The population of USA2

  当我们将城市的人口规模取对数,同时将对应城市的排名取对数进行比较,我们就会发现一个很有趣的现象,那就是人口规模的对数与相对排名的对数有着极强的线性关系。将我们前面的那个数学表达式取对数变形,就可以得到一个线性等式: $$lnRi=-\alpha lnPi+C,$$ 其中$C$为常数。这就与我们上图中拟合的那条曲线相近,通过计算我们可以得到$\alpha\approx1$。这样我们就得到这样的一个关系即:$$Pi=\frac{P1}{R_i},$$ 而这就是Zipf法则。当然有的人或许会说了,这只是美国一个国家的情况,说明不了什么。其实Zipf法则提出的时间是20世纪30年代,在这几十年间,不断有实例来验证Zipf法则的正确性。同时这也符合经济学和逻辑。即人们总是愿意住在大城市,所以大城市的人口总是上升的,但是大城市不能无限的大,当最大的城市已经不适宜某些人时,这些人就会选择迁离这里。由此达到了一种动态的平衡。于是在一个地区,排名第二的城市的人口数总是第一的一半,第三的城市只有三分之一,第四只有四分之一……以此类推。

  如此一来,大同世界的梦想就此破灭,不会有所有城市都规模相等的那一天。既然最美好的梦想无法实现,那么次一点的总可以吧,那就是数量众多的中等城市,拥有着相当大的发展潜力,在随着国家发展进步的同时,其城市规模也会蒸蒸日上。然而现实是很残酷的,根据各个研究以及数据分析发现,中国城市的$\alpha$ 值要远远大于1,也就是说中国的大城市人似乎还不够多。也就是中国的大城市还不够大!或许有人表示这不可能,每次在北京上海等一线城市上下班到处都是人人人,怎么可能城市还不够大呢。然而对比一下真正的国际大都市东京,纽约,伦敦等城市,显然就要小巫见大巫了。所以可以预想,在未来的日子里,北上广深这些大都市的人口会继续上升(如果政策允许),而大多数的中型城市则将作为人口输出的主要来源。

  讲到这里,似乎已不需再多说什么,无论是国家政策亦或地区发展,这些似乎都不是我们这些普通百姓该考虑的事情。但是对于那么多的年轻人来说,归去何处却渐渐变为一个困扰自身许久的问题。自身发展与故乡情怀,无论哪一个都难以放下。或许只有几十年后,才会慢慢明白哪一个才是自己最想要的。或许唯一值得庆幸的是,对于当下,选择权在自己手里,选择去往哪里可以由自己决定。

  来自何地,归去何处;休问前程,莫询来路。

2017年10月14日

本文参考文献如下:

1、我国人口预计 15 年内是会逐渐分散在大中小城市,还是继续向大城市集中?我们应留在大城市发展吗?

2、Zipf法则,中国一线城市会更大吗?

3、 MEJ Newman.Power laws, Pareto distributions and Zipf’s law.Contemporary Physics, Vol. 46, No. 5, September–October 2005

4、张玎.基于Zipf法则的浙江省城市规模分析.《对外经贸》2011年第12期