谈谈中国人口数据的可靠性

秋 实


[新观察]·文库版·大饥荒档案 www.chinafamine.net 转载时请注明作(译)者及出处

  在大饥荒之争中,经常有网友对我国人口数据的可靠性提出疑问。大
多数人是出于对实际情况的不了解。也有些人,出于对基本概念的误解。
比如,有人说,我国人口统计的误差是10%,三千万人误差一下就出来
了,跟零没有差别。于是,所谓非正常死亡两三千万的说法,统计上没什
么意义。他们显然没整明白整体(比如若干个随机变量之和)的误差,与
其构成部分(比如其中单个变量)的误差之间关系。举个简单反例:五六
十年代之交,我国少数民族的总人数也不过三千多万,难道也是误差一下
出来的,跟零没什么区别吗?建议提出这种说法的朋友,自修一下概率统
计入门知识。

  其实,我国三项主要的人口数据--人口普查、人口抽查和户籍登记
--中,除户籍登记数据之外,其它数据的误差都没有上面网友猜测的那
么大。俺这里简单地介绍一下三大类人口数据的误差范围,同时着重谈一
谈户籍死亡和出生数据的漏报情形,这是人口专家在估算大饥荒非正常死
亡人数时,都特别给予注意的一大问题。


一 人口普查数据

  人口普查点算整个群体,不是抽样,无所谓抽样误差。但在点算时会
出现多报或漏报的问题。这就需要抽取一定比例人口进行复查,以确定其
误差范围。下面是我国前三次人口普查的复查结果:

1953年普查:复查覆盖地区占直接调查人口9%, 结果发现,全国总
人口数重复登记1.39‰,漏报2.55‰,净漏报1.16‰,毛误差3.94‰。误
差低于千分之四。[1]

1964年普查:全部大陆人口系直接调查。复查覆盖地区占人口5.3%。
总人口数重复登记0.38‰,漏报0.39‰,净漏报0.01‰,毛误差0.77‰。
误差低于千分之一。

1982年普查:这次普查采用国际通用方法,进行了严格质量控制。复
查结果如下:
--总人数重复登记0.71‰,漏报0.56‰,净重报0.15‰,毛误差1.27‰。
误差约为千分之一点二。
--出生人数重登率0.78‰,漏报2.61‰,净漏报1.83‰,毛误差3.39‰。
误差低于千分之四。注意此处的误差是以出生人口为基数计算的。
--死亡人数重登率2.64‰,漏报7.04‰,净漏报4.40‰,毛误差9.68‰。
误差约为千分之十。注意此处的误差是以死亡人口为基数计算的。

  由此可见,人口普查数据的精度是相当高的。这就是为什么大家总是
尽可能地以人口普查数据作为基础,去校验其他人口数据。


二 抽样调查数据

  人口抽样调查的误差范围,在设计调查方案时予以控制。以下谈到的
误差范围,置信概率均为95%。

1、一年一度的千分之零点五抽样的人口变动情况调查,人口出生率的允
许误差范围正负5‰。

  国家统计局公布的一九八二年后每年的出生率和死亡率,便来自于此
项调查。

2、生育率调查,包括1982年的千分之一抽样的妇女婚姻生育史调查,
以及1985年的千分之二抽样的妇女生育节育调查等。后者的出生率允
许误差在正负0.3‰以内。

  蒋正华BANISTERASHTON等人口专家用于校正中国
户籍人口登记数据的生育率历史资料,便来自于1982年的调查。

3、1987年的百分之一人口抽样调查,这是一次微型人口普查,半年
出生率允许误差正负0.11‰,半年死亡率允许误差正负0.06‰。

  此外还有其它一些抽样调查,此处不一一列出。从以上例子看,抽样
调查的允许误差都控制在极低水平。当然,这些都是设计误差,要求调查
者按规定进行抽样与询问,才能达到。至于调查者是否人为引入了系统误
差,在发现可靠的证明材料之前,俺不想妄加猜测。从现有资料看,抽样
调查数据与人口普查数据吻合度相当高,不象是有可观系统误差的样子。


三 户籍登记数据

  户籍登记的人口总数、死亡人数、出生人数等数据,不是由专门的统
计调查来的,而是行政部门负责管理的。其好处是解放以来年年都有,坏
处就是户籍登记与人们的权利义务联系过于密切,登记数字的可靠性,直
接为人们的切身利益所左右,可靠性远远不及前两类数据。下面根据现有
的资料,谈一谈户籍登记的人口总数、出生数以及死亡人数的可能误差。


1、总人口

  1964年整顿户口和人口普查本身,共查出多报人口1172万,漏报
人口357万人。按1964年普查人口计算,多报率16‰,漏报率5‰,净
多报11‰,毛误差21‰。

  1982年整顿户口与人口普查,共查出多报人口622万,漏报人口
899万人。多报率6‰,漏报率9‰,净漏报3‰,毛误差15‰。


2、死亡率:

  1982年人口普查得到的1981年死亡率为6.60‰,而这年户籍
登记的死亡率却为6.11‰,登记完备率约为4%。

  不过,1982年因有人口普查,情况较为特殊。比较一下其它年份
户籍登记的死亡率与人口变动抽样调查得到的死亡率,就可以发现,除1
982年外,八十年代前期的死亡漏报相当严重,户籍登记的完备率只有
85-90%左右,如下表所示:

 表一、1982-85年死亡率漏报情况
 --------------------------------------------------
  年份 户口登记‰  抽样调查‰ 死亡漏报率(%)
 --------------------------------------------------
  1982   6.11     6.36     3.93
  1983   6.09     6.60     8.42
  1984   5.93     6.86     13.56
  1985   5.93     6.69     12.86
 --------------------------------------------------
 资料来源:《中国统计年鉴1988》
 转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991)
 第620页

  五、六十年代,我国的户籍登记中漏报死亡的情况,同样十分严重。
1964年人口普查时,对该年上半年人口出生、死亡、迁入、迁出四个
项目进行了核对性检查。 普查得到的1964年上半年死亡率为7‰。假
如上下两个半年死亡人数相当,推算全年死亡率应为14‰左右。而户籍登
记的死亡率,仅有11.5‰,比普查推算数低18%!由此可见当时漏报死亡
的严重性。

  至于1964年以前的情况,我们可以从两次人口普查的数据以及当
时所作的死亡情况调查,大致看出漏报死亡的严重情形。

   根据资料,1964年普查人口69458万人中,年满11周岁以上的
人口占69%,约为48105万,此即1953年的58260万人口中尚存的人数。
因此,不计算五三年到六四年之间出生后又死亡的人数,此期间也至少死
亡10155万人。而同期户籍登记的死亡人口仅仅只有9500万人! 假如这个
期间有大量死亡是出生后没活几岁的儿童,我们就可以肯定,户籍登记的
死亡人数,是大大低估了的。

  那么,儿童死亡情形究竟如何呢?我国分别在1957年和1963
年,也即这个期间死亡率最低的两个年份,进行了两次大规模的死亡情况
调查。根据这些调查,死亡人口中很多是少年儿童(表三)。1957年
和1963年,0-4岁死亡人数占死亡人口的比重分别为42.3%和46.2%。
1957年,死亡人口的一半,没有活到18岁,1963年更惨,一半人
没有活到10岁!

  用以上数据,不难对户籍死亡登记的漏报情形,作出粗略的估算。根
据人口普查资料,1953年4岁以上,到1964年已经死亡的人口,大约7900万
人,这是该期间死亡的4岁以上人口的下限。按0-4岁死亡人口占死亡人口
40%算,此期间0-4岁死亡人口至少有7900 * 40% / 60% = 5366万人,约
相当于登记死亡人数的55%。 两项合计,死亡人数13000万人,户籍登记
的死亡漏报率为28%左右。

  注意以上估计未使用任何出生资料,却与蒋正华教授等根据生育调查
资料估算的死亡漏报率相当一致。根据蒋的估算,1954-64年间大
部分年份,漏报率都在23%到40%之间。事实上,中国五六十年代漏报死
亡极其严重,早已是绝大多数人口专家的共识。

 表二、中国死亡人口比重(%)
 -----------------------------------------------------------
 年份  0-4岁(%)  50岁+(%)   死亡人口年龄中位数(岁)
 -----------------------------------------------------------
 1957   42.3     35.9        17.6
 1963   46.1     34.8         9.6
 1975   14.3     67.3        63.2
 1981   15.9     64.7        62.0
 1987   14.4     69.1        64.5
 -----------------------------------------------------------
 资料来源:《中国人口年鉴1985》,《中国1%人口抽样调查资料》
 转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991)
 第164页

  从表二还可以看出,七十年代以后,儿童死亡情形有了翻天覆地的改
变。 0-4岁死亡的比重,从40%以上,下降到16%以下;死亡年龄中位数
则从十岁十几岁,上升到六十多岁。一些生长在七、八十年代的网友,不
了解五、六十年代之事,看到人口专家估算的死亡人口中包括了大量儿童
死亡,觉得无法理解,又不肯去了解历史,动辄就把这些估算斥之为“疯
狂”“荒谬”。其实,真正“疯狂”而“荒谬”的,正是这些人不懂装懂
而又不肯虚心了解事实的偏执态度。


3、出生率

  1982年人口普查得到的1981年出生率为20.91‰, 按误差率
计算,其范围20.89-20.96‰之间。但这年户籍登记的出生率却为18.53‰,
登记完备率只有88.6%。

  出生率的情形与死亡率相似,户籍数据也有可观的漏报。而且在八十
年代,出生率漏报情形,远比死亡率的漏报来得严重。除1982年以外,
登记完备率仅有80%左右(表三)。

 表三、1982-85出生漏报情况
 --------------------------------------------------
  年份 户口登记‰  抽样调查‰ 出生漏报率(%)
 --------------------------------------------------
  1982   18.53     21.09     12.14
  1983   15.11     18.22     17.08
  1984   13.85     17.50     20.85
  1985   13.63     17.80     23.48
 --------------------------------------------------
 资料来源:《中国统计年鉴1988》
 转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991)
 第620页

  由此表可见,户籍出生率统计的可靠性同样十分可疑。国家统计局自
1982年起便不再使用户籍出生率和死亡率,正式公布的数字一律以抽
样调查数字为准。

  五十年代,我国的户籍登记制度刚刚建立不久,很多新出生人口,都
未及时申报登记。再加上婴儿死亡率较高,很多出生后不久就死亡的孩子,
根本就没有登记出生,也没有登记死亡。蒋正华根据人口普查数据和生育
率回顾调查数据,用估计参数模型的方法计算出生率,发现五十年代到六
十年代初,出生率漏报程度同样达到10%左右,1962年更达到17%。
此後漏报程度便大幅降低。其原因,一是户籍登记制度更为健全;二是越
来越多的基本消费品按人头分配,漏报出生人口带来的利益损失扩大了;
三是婴儿死亡率大幅降低。低水平的漏报率一直维持到七十年代。随着计
划生育政策的推行日趋严厉,出生漏报率再次于七十年代后期升到10%以
上。这里有瞒报出生因素。更有不少地区,将出生人口假报为迁入人口,
这样既降低了出生率,又不损害按人头分配票证的利益。
  
  ASHTON等人估计的1953-1964年户口登记出生的完备
率,以及其他人口专家的估算数,与蒋正华的估算相差不大,都在80-90%
之间。这些估算,与现有的人口资料以及我国有关政策变化的时间序列,
都是相当吻合的。


四、小结

  我国人口普查数据和抽查数据,可靠性都是相当高的。这一点,打从
我国于1983年首次完整公布前三次人口普查数据开始,就得到国内外
主要人口专家的多方检验确认,基本上已经成为人口学界的共识。问题比
较大的是户籍出生和死亡数据,都存在比较大的漏报,其中又以死亡人数
的漏报,尤为严重。这就是为什么根据户籍上报的死亡人数算出的1500万
左右非正常死亡,通常只被被绝大多数人口专家视为下限的缘故。

注释

[1] 在1953年人口普查中,除直接调查的人口外,另有占总人口1.44%的人口为
间接估算,主要是西藏昌都等极少数边远少数民族地区。因其占比重小,其误差对全
国总人口误差影响很小。

(2000年5月6日贴于[新观察/xgc2000.com],2000年6月5日修改)

回页首  


[新观察]·文库版·大饥荒档案 www.chinafamine.net 转载时请注明作(译)者及出处