【SEMINAR回顾】瀚一数据科技胡婧炜:网络调查的方法与实践
发布时间:2021-06-02 作者: 来源:社会调查中心
5月25日,调查中心邀请了瀚一数据科技(深圳)有限公司联合创始人胡婧炜担任“社会调查与应用”系列讲座第二十三期的主讲人,为线上会议室的师生们介绍商业网络调查应用过程中误差产生的原因及改进方法,并结合过往调查案例,概述开展网络调查的具体实践要点。
胡婧炜有超过10年调查研究与实践经验,曾先后在北京大学中国社会科学调查中心“中国家庭追踪调查(CFPS)”项目组等任职。主要研究领域是问卷设计和网络调查方法,曾在Journal of Statistics and Survey Methodology、《社会》等期刊发表多篇调查方法相关文章。
讲座伊始,胡婧炜概述网络调查是一种依托网络和上网设备、由受访者自主填答完成问卷的调查模式,有着信息收集速度快、节省资源和成本、不受时空限制、在敏感数据收集上客观性较高、可实现针对性交互设计等优势。目前,网络调查主要应用在自主投放于社交渠道的调查、在线样本库内调查和混合访问模式的调查等场景。
网络调查的误差主要归类为覆盖误差、抽样误差、测量误差和无应答误差。胡婧炜逐一分析了网络调查中这四类误差的产生原因,并分享相应的处理经验和方法。
胡婧炜指出互联网普及率和数字鸿沟是网络调查覆盖误差产生的主要原因,网民年龄、性别、受教育水平、地域等现实因素的差异会影响样本范围代表性。这一弊端将会随着时间和网络普及而逐渐减小,而在这个过程中,开展网络调查可以通过缩小目标范围、采用混合访问模式和调整统计权重等方式来处理覆盖误差。
因为网络的匿名性特点,参与调查的网民难以确定身份和特征,因此对于网络调查而言,获取有代表性的样本框是较难实现的。随后胡婧炜介绍和对比分析了网络调查中比较常用的抽样方法,并重点讲解了非概率样本库的运营形式和招募形式。为减少抽样误差,开展网络调查需要根据研究目标改进抽样设计、适当地与概率样本结合和调整权重,并严格评估和清晰描述抽样选择可能产生的影响。
谈到网络调查中的测量时,胡婧炜认为网络调查的问卷依托计算机技术可以实现更丰富灵活的题型、更多样化的视觉呈现、更有针对性的交互设计等设计需求,可以让受访者有更好的调查体验;而交互设计中逻辑跳转、实时校验、随机实验、并行数据收集等设置则可以有效提高问卷数据质量。而不可避免的是,完全自我驱动的答题模式会对答题质量产生一定不良影响。
在分析网络调查的无应答误差时,胡婧炜指出网络调查中可能存在诸多无应答节点,并列举以下几种常用应对方式,包括:寻找有信誉的委托方背书、阐释调查主题、优化问卷设计和流程等。而商业调查中,调查执行者还会通过定期发送答题提醒、寻找最佳问卷推送时间、控制问卷长度、优化酬金发放方式等方法来提高应答率和维护样本关系。
讲座的最后,胡婧炜通过过往实际案例讲解了网络调查中如何触达、调查、激励和留存样本,对参会师生开展网络调查和设计执行方案有着积极启示和参考意义。