10月21日,学院在数智楼106召开“大数据背景下的抽样”为主题的数智学术大讲堂,由中国人民大学金勇进教授主讲。

金勇进围绕“数字化时代非概率抽样范式”“传统抽样调查所面临的复杂挑战”、以及“传统抽样技术与大数据深度融合的重大现实意义与应用前景”等前沿议题,分享其独到见解与最新思考。将主题分为六部分,大数据时代的抽样、大数据流抽样、非概率抽样的应用场景、非概率样本的统计推断、多源数据融合和小域估计的拓展部分。

针对非概率抽样,结合多个应用场景,分析了其在大数据背景下的广泛使用及其在统计推断中面临的挑战。在多源数据融合方面,金教授提出将概率样本与非概率样本相结合,既能发挥前者在推断上的严谨性,又能利用后者在规模与效率上的优势,代表了未来抽样研究的重要方向。此外,报告还探讨了小域估计在大数据环境下的拓展应用,展示了抽样技术在细分群体研究中的潜力与创新空间。






最后,金教授指出,尽管大数据已近乎覆盖总体,但大数据源于业务活动而非研究设计,其本身存在代表性偏差、质量不一等问题,抽样调查在大数据时代依然具有不可替代的价值。整场报告内既有理论高度,又贴近实际应用,为在场师生提供了宝贵的学术启发。

本次报告不仅深化了我校师生对抽样方法在大数据时代作用的理解,也进一步推动了我校在统计学与数据科学领域的学术交流与合作。
