小组作业
分组
每组3人,由组长填写在线问卷,提交分组信息:https://www.wjx.top/vm/m1mykgE.aspx#
每组 2–3 人,自由组合,每组需确定一名组长,负责统筹、协调、整合报告。
小组作业目标
掌握多元统计方法在现实中的综合应用
提升数据收集、清理、分析和解释能力
培养团队合作、PPT制作、口头汇报能力
选题要求
基于兴趣选题,来源于现实生活,选择身边真实可获得的数据
数据要求
截面数据
样本容量建议 ≥ 60, 最好超过100
至少8个以上定量变量
至少3个以上定性变量
不可使用虚拟数据
方法运用
至少使用 4 种不同的多元统计方法,可选:聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析
讨论课安排
讨论小组作业中遇到的问题、答疑、改进
选题和数据 (第4周)
聚类分析、判别分析 (第7周)
主成分分析、因子分析 (第10周)
对应分析、典型相关分析 (第11周)
第1次讨论课:选题和数据
选题: 简要介绍选题,并解释为什么选择这个主题?它如何源于现实生活或个人兴趣?
数据来源渠道:从哪里获取数据?(如问卷调查,Kaggle, 知网统计数据, 中国家庭追踪调查CFPS, 中国家庭金融调查CHFS, 中国教育追踪调查CEPS, 爬虫等)
变量类型:列出准备收集的变量(至少8个定量变量,3个定性变量)
样本容量规划:如何确保样本容量≥60(最好>100)
遇到的困难, 需要老师提供什么帮助?
第2次讨论课: 聚类/判别/主成分分析
聚类分析
判别分析
主成分分析
遇到的困难, 需要老师提供什么帮助?
小组作业汇报
课堂汇报时间:第12周周四2025-11-20, 汇报时长7分钟
PPT页数:20-25 页
重点展示:研究问题、数据概况、分析方法和核心结论
Q&A
Q:如何选题?
A:从兴趣出发,考虑数据的可获得性。
乐高玩具——微信小程序:积木箱
APP:JUMP,航旅纵横、携程,大众点评,贝壳等
网站:boss直聘,易车
必应/google搜索 关键词 + 数据/dataset
参考选题
Q:问卷调查如何收集定量变量?
A:填空题。需要考虑被访者能否容易回答,数据质量是否可靠。
每月消费,生活费,每周学习时长,运动时长等,数据波动较大,精确度较差
手机:购置价格、型号、内存、何时购买、内存使用、下一部手机购买的预期等
APP使用情况
