小组作业

分组

每组3人,由组长填写在线问卷,提交分组信息:https://www.wjx.top/vm/m1mykgE.aspx#

每组 2–3 人,自由组合,每组需确定一名组长,负责统筹、协调、整合报告。

小组作业目标

  • 掌握多元统计方法在现实中的综合应用

  • 提升数据收集、清理、分析和解释能力

  • 培养团队合作、PPT制作、口头汇报能力

选题要求

基于兴趣选题,来源于现实生活,选择身边真实可获得的数据

数据要求

  • 截面数据

  • 样本容量建议 ≥ 60, 最好超过100

  • 至少8个以上定量变量

  • 至少3个以上定性变量

  • 不可使用虚拟数据

方法运用

至少使用 4 种不同的多元统计方法,可选:聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析

讨论课安排

  • 讨论小组作业中遇到的问题、答疑、改进

    • 选题和数据 (第4周)

    • 聚类分析、判别分析 (第7周)

    • 主成分分析、因子分析 (第10周)

    • 对应分析、典型相关分析 (第11周)

第1次讨论课:选题和数据

  • 选题: 简要介绍选题,并解释为什么选择这个主题?它如何源于现实生活或个人兴趣?

  • 数据来源渠道:从哪里获取数据?(如问卷调查,Kaggle, 知网统计数据, 中国家庭追踪调查CFPS, 中国家庭金融调查CHFS, 中国教育追踪调查CEPS, 爬虫等)

  • 变量类型:列出准备收集的变量(至少8个定量变量,3个定性变量)

  • 样本容量规划:如何确保样本容量≥60(最好>100)

  • 遇到的困难, 需要老师提供什么帮助?

第2次讨论课: 聚类/判别/主成分分析

  • 聚类分析

  • 判别分析

  • 主成分分析

  • 遇到的困难, 需要老师提供什么帮助?

小组作业汇报

  • 课堂汇报时间:第12周周四2025-11-20, 汇报时长7分钟

  • PPT页数:20-25 页

  • 重点展示:研究问题、数据概况、分析方法和核心结论

Q&A

Q:如何选题?

A:从兴趣出发,考虑数据的可获得性。

Q:问卷调查如何收集定量变量?

A:填空题。需要考虑被访者能否容易回答,数据质量是否可靠。

  • 每月消费,生活费,每周学习时长,运动时长等,数据波动较大,精确度较差

  • 手机:购置价格、型号、内存、何时购买、内存使用、下一部手机购买的预期等

  • APP使用情况