【SEMINAR回顾】浙江大学张婵：非概率网络调查的挑战与争议

发布时间:2026-06-23 作者: 来源:社会调查中心

5月22日，暨南大学社会调查中心“社会调查与应用”系列讲座迎来第60期，本期特别邀请浙江大学张婵副教授作为主讲嘉宾。张婵老师围绕“非概率网络调查的挑战与争议”这一主题展开深入探讨，为在场师生带来了一场内容充实、观点鲜明的学术分享。

主讲人张婵

张婵，现任浙江大学传媒与国际文化学院长聘副教授，长期从事调查方法领域的研究，包括网络调查的数据质量、多来源数据的融合、密集追踪调查方法的数据质量等。

讲座现场

讲座开篇，张婵引用Couper(2000)介绍网络调查的类别，引出概率抽样与非概率抽样的区别：前者每个元素被抽中的概率已知且非零，可基于统计理论对总体进行无偏估计；后者概率未知，无法保证代表性。随后，她重点介绍了最常见的非概率样本——非概率网络样本库，其构建流程包括线上招募、用户画像收集、按需抽样和样本库维护。然而，各公司网络样本库的具体操作被视为商业机密，公开信息有限，样本来源如同“黑箱”。

非概率网络样本调查数据是否可靠？美国民意研究协会(AAPOR)2010年报告指出：非概率网络样本库调查与概率调查存在系统性差异，误差更大，且不同样本库之间结果差异明显。因此AAPOR建议，如果研究目标是对总体做准确估计，应避免使用非概率样本库。当然，在探索性研究、心理测量等场景下，非概率样本仍有其价值。

接下来，张婵介绍了各国在非概率样本与概率样本比较方面的实证研究。2021年美国皮尤研究中心通过比较多个非概率样本和美国社区调查发现，非概率样本对一般人群估计的平均绝对误差是概率样本的两倍；澳大利亚2018年的一项研究表明，仅靠人口特征加权无法消除实质性偏差。中国目前缺少网络概率样本库和足够的基准调查，评估非概率样本的准确性较为困难。

讲座最后，张婵指出，基于大语言模型的“合成受访者”将成为网络调查中的新挑战。这类AI生成的受访者能通过注意力测试、保持人设、答对陷阱题，甚至模仿开放式回答，越来越难与真人区分。这要求调查行业重新评估质量控制方法，推动更透明的样本库机制和更严格的受访者身份确认。提问环节，张婵与现场师生就合成受访者识别、国内概率样本库建设等话题展开讨论，气氛热烈。

【SEMINAR回顾】浙江大学 张婵：非概率网络调查的挑战与争议

【SEMINAR回顾】浙江大学张婵：非概率网络调查的挑战与争议