【SEMINAR回顾】浙江大学 张婵:非概率网络调查的挑战与争议
发布时间:2026-06-23 作者: 来源:社会调查中心
5月22日,暨南大学社会调查中心“社会调查与应用”系列讲座迎来第60期,本期特别邀请浙江大学张婵副教授作为主讲嘉宾。张婵老师围绕“非概率网络调查的挑战与争议”这一主题展开深入探讨,为在场师生带来了一场内容充实、观点鲜明的学术分享。

主讲人张婵
张婵,现任浙江大学传媒与国际文化学院长聘副教授,长期从事调查方法领域的研究,包括网络调查的数据质量、多来源数据的融合、密集追踪调查方法的数据质量等。

讲座现场
讲座开篇,张婵引用Couper(2000)介绍网络调查的类别,引出概率抽样与非概率抽样的区别:前者每个元素被抽中的概率已知且非零,可基于统计理论对总体进行无偏估计;后者概率未知,无法保证代表性。随后,她重点介绍了最常见的非概率样本——非概率网络样本库,其构建流程包括线上招募、用户画像收集、按需抽样和样本库维护。然而,各公司网络样本库的具体操作被视为商业机密,公开信息有限,样本来源如同“黑箱”。
非概率网络样本调查数据是否可靠?美国民意研究协会(AAPOR)2010年报告指出:非概率网络样本库调查与概率调查存在系统性差异,误差更大,且不同样本库之间结果差异明显。因此AAPOR建议,如果研究目标是对总体做准确估计,应避免使用非概率样本库。当然,在探索性研究、心理测量等场景下,非概率样本仍有其价值。
接下来,张婵介绍了各国在非概率样本与概率样本比较方面的实证研究。2021年美国皮尤研究中心通过比较多个非概率样本和美国社区调查发现,非概率样本对一般人群估计的平均绝对误差是概率样本的两倍;澳大利亚2018年的一项研究表明,仅靠人口特征加权无法消除实质性偏差。中国目前缺少网络概率样本库和足够的基准调查,评估非概率样本的准确性较为困难。
讲座最后,张婵指出,基于大语言模型的“合成受访者”将成为网络调查中的新挑战。这类AI生成的受访者能通过注意力测试、保持人设、答对陷阱题,甚至模仿开放式回答,越来越难与真人区分。这要求调查行业重新评估质量控制方法,推动更透明的样本库机制和更严格的受访者身份确认。提问环节,张婵与现场师生就合成受访者识别、国内概率样本库建设等话题展开讨论,气氛热烈。
