学院官网

【SEMINAR回顾】北京大学吕萍:中国家庭追踪调查抽样设计和加权方法介绍及其问题探讨

发布时间:2022-04-01 作者: 来源:社会调查中心

330日,暨南大学社会调查中心新学期主办的第一场讲座顺利开讲。此次,中心邀请了北京大学吕萍副研究员担任“社会调查与应用”系列讲座第三十期的主讲人,向参会师生介绍了中国家庭追踪调查(CFPS)的抽样设计和加权调整方法,并对如何在分析中使用权数等问题进行探讨。

主讲人吕萍,北京大学中国社会科学调查中心副研究员,主要负责该中心抽样调查项目的抽样设计、抽样执行、加权调整以及部分数据清理和分析工作。

 

讲座内容

讲座开始,吕萍首先简要介绍了中国家庭追踪调查的基本调查设计情况。中国家庭追踪调查于2010年开展基线调查,调查对象为家户以及被抽取家庭中的所有家庭成员。调查采用三阶段不等概率的系统PPS整群抽样设计,基线调查覆盖全国25个省和直辖市,其中5个为具有省级自代表性的“大省”。

CFPS以基线调查所界定出来的基因成员为样本范围进行追踪。基于对基因成员“永久追踪”的特点,经过五轮追踪以后,到2020年全国第六轮调查时,调查地点从原来的25个省份、649个村居扩大到31个省份3000多个村居。随着调查对象的进入、退出、迁移等,这一样本变动也反映着中国人口与家庭的自然更替和变化,具有可持续自我更新的特性,对追踪期目标总体具有一定的代表性。

 

CFPS项目特色

但随着长期追踪过程中样本的流失,样本代表性会逐渐下降。对此,吕萍指出,CFPS项目组采用了多种手段来提高追访率、保证数据质量,包括利用辅助信息对样本加权调整。数据使用可结合官方信息、大数据来进行,长远看,项目还有可能需要进行样本补充。

吕萍强调,基于CFPS复杂的抽样设计和追踪规则带来的样本流失和变动,权数调整具有必要性。对此,她详细介绍了权数调整的算法和思路,并结合实例展示如何使用数据中的截面权数和追踪权数进行数据分析。

 

CFPS基线权数调整

讲座的最后,吕萍与线上听众积极互动,并回答了参会师生们关于小域估计、如何在统计分析软件中使用权数等问题,讲座学术交流气氛活跃。