1 课程介绍

1.1 课程介绍

欢迎来到高级统计研究方法课程，我喜欢简称它为“高级课程”。本课程是我之前开设的基础课程“统计研究方法”的延续，相信你们很多人都已经修读过基础课程。

1.1.1 课程概述

在这个视频中，我将简要介绍这门课程的内容，以及我们在课程中会涉及哪些主题等等。本系列入门视频中的其他视频会讲解一些具体事项，比如你将如何完成课程学习、我们会使用哪些工具、你的成绩如何评定以及你能获得什么样的学分等等。

1.1.2 基础课程回顾

言归正传。这门课程是关于什么的呢？你能学到什么呢？在基础课程中，我的目标是教给你们研究设计的基础知识，以及如何使用回归分析、因子分析和其他一些非常基础的工具，并帮助你们从更根本的层面理解它们，这样你们就能在充分了解的基础上应用这些知识，而不是仅仅遵循“烹饪书”式的步骤。

1.1.3 高级课程内容

在这门课程中，我们将在此基础上大幅拓展。我们会学习一些更高级的分析方法。例如，我们将使用结构方程模型、多层次模型、缺失数据处理技术等等。我们将努力从更根本的层面理解这些技术，不仅仅局限于步骤、清单和最佳实践，而是真正理解这些技术的本质、它们基于的假设、遵循的原则，以及如何在充分了解的情况下使用它们，而不是简单地模仿他人的做法。

1.1.4 使用的软件工具

修完这门课程后，你应该能够使用R语言或Stata软件高效、有效地进行这些分析，并且确保分析具有可重复性。我不推荐使用SPSS，原因有两点：虽然用SPSS可以完成部分分析，但我们在这门课程中要做的大部分内容，用SPSS根本无法实现。另外，比如说，我都不知道如何用SPSS进行多层次建模。所以请注意，本课程是关于使用R语言或Stata进行高级分析的，这也是你应该使用的软件。你也可以用Mplus完成部分工作，如果有同学想用，我可以提供相关指导。

1.1.5 分析的可重复性

除了高效和有效之外，另一个重要方面是分析的可重复性。我们应该能够重现一篇文章中所展示的分析过程，这极其重要，并且在最近的众多文章中都有强调。在一篇文章中，你应该记录从原始数据到最终表格的每一个步骤。实现这一点的理想方式是自动化。我们将学习如何构建你的Stata do文件或R文件，使其从加载数据集开始，然后导出所有表格。然后我们就可以直接将表格复制/粘贴或链接到我们的文档中，避免任何手动操作。这种自动化确保了你的结果具有可重复性，让你能够始终展示从原始数据到最终输出所采取的精确步骤。这一点非常重要，我们会在课程后续讨论其原因。

1.1.6 结果报告与数据可视化

然后我们会学习结果报告。与基础课程不同，在基础课程中你们做一到三次数据分析作业并撰写报告，而在本课程中，我们将专注于对分析技术的不同解读，以及如何以图形方式展示结果。目的是让不了解我们所应用方法的人也能理解我们的结果。因为现实情况是，如果我们使用，比如说，阿雷利亚诺 - 邦德估计量来分析动态面板模型，没有多少研究人员知道这是怎么回事。

1.1.7 方法学证据的生成与评估

最后，你应该能够运用基础和应用技术对文章进行评审，并且能够阅读和生成方法学证据。这最后一点至关重要，因为你作为专业研究人员的职业生涯并不会随着这门课程的结束而终止，你可能还得学习一些本课程未涵盖的技术。例如，可能存在适用于特定领域的专门技术，而我在课程中没有涉及，或者在你修完这门课程后可能会出现新的技术。

你需要理解这些技术背后的证据，并能够读懂这些证据，因为并非所有技术，尤其是并非所有类似指南的文章都是基于证据的。它们可能仅仅基于对研究人员做法的观察，然后将其作为最佳实践呈现出来。但正如我们将在本课程中发现的，以及你可能在基础课程中已经看到的那样，研究人员的所作所为并非都有合理依据。人们会犯错，有时一个错误会被固化为最佳实践。我们需要理解证据以避免这类问题。

1.1.8 生成证据的模拟方法

理解证据的最佳方式是你自己能够生成证据。基于这个原因，我们将在课程中进行模拟。我们会从简单的模拟开始：仅模拟一个样本，进行回归分析，然后检查在大样本量的情况下我们是否能得到正确结果。我们还会进行蒙特卡罗模拟，它通过模拟多个样本扩展了简单情况。例如，我们会看到，平均而言，回归分析在小样本情况下也能得出正确结果，它是无偏的。我们会学习诸如此类的内容，这就是我们在课程中进行模拟的原因。

1.1.9 我的模拟经验

就我个人而言，我一直在进行模拟，不仅在方法学研究中，而且当我想了解一种技术如何运作时也会这么做。我模拟一个样本，然后在该样本上尝试一种技术。如果我得到了正确结果，那么我就能更有信心自己正确使用了该技术。

1.1.10 课程安排与内容

现在让我们来看看课程安排和内容。本课程为期一整个学年，从9月开始到次年5月结束。我们共有10个单元。第一个单元和基础课程一样，是引言部分。引言的目的是让大家相互认识，熟悉本课程的内容以及我们将如何开展课程学习。你还会进行一次预考，内容涉及一些书籍。我会在另一个视频中对此进行讲解。

1.1.11 常规单元内容

然后，从第二单元到第九单元，我们有8个常规单元，涵盖不同的分析技术。我们会从更多与研究设计相关的内容入手，一些更基础的内容，比如因果关系和结构方程建模，结构方程建模是我们在课程中会涉及的许多技术的一种概括。接着我们会深入到更高级的主题，逐步学习多层次模型，它是纵向数据分析的基础等等。

1.1.12 学生展示与课程总结

然后，在课程结束时，我们会有学生展示环节，当然还有课程总结。本课程的每位学生都要进行两次展示。你将展示自己独立完成的一次蒙特卡罗模拟的结果，当然，过程中会得到其他同学和我的帮助，然后你还要挑选一篇我们在课程中未涉及的方法学文章，并向其他人展示。这里的目的还是教你如何评估证据，而最好的方法就是生成并展示证据。这样你才能真正开始理解证据的内涵以及应该如何解读它。

1.1.13 期末考试

最后，我们会有一场期末考试，检验你所学的技能。我可以保证，这场考试颇具挑战性。你不必全部答对才能得5分，但如果你全部答对，那你很可能至少跻身全球前1%的定量研究人员之列。

1.1.14 课程总结

那么，欢迎来到这门课程。在接下来的课程视频中，我会更详细地讲解具体事项。

高级统计研究方法课程

2025 - 01 - 03

1 课程介绍

1.1 课程介绍

1.1.1 课程概述

1.1.2 基础课程回顾

1.1.3 高级课程内容

1.1.4 使用的软件工具

1.1.5 分析的可重复性

1.1.6 结果报告与数据可视化

1.1.7 方法学证据的生成与评估

1.1.8 生成证据的模拟方法

1.1.9 我的模拟经验

1.1.10 课程安排与内容

1.1.11 常规单元内容

1.1.12 学生展示与课程总结

1.1.13 期末考试

1.1.14 课程总结

1.2 学习单元结构

1.3 互动视频的使用

1.4 讨论论坛

1.5 书面作业与抄袭政策

1.6 计算机作业

1.7 学分与评分

1.8 课程资料

2. 因果关系、内生性、实验与自然实验

2.1 基本描述性统计

2.2 总体、样本、估计值与标准误差

2.3 抽样与样本选择

2.4 统计推断

2.5 零假设显著性检验（NHST）

2.6 置信区间

2.7 NHST的问题与争议

2.8 因果推断

2.9 随机实验

2.10 统计控制

2.11 回归分析的基本思想

2.12 估计回归模型

2.13 普通最小二乘法（OLS）假设概述

2.14 回归诊断与分析流程

2.15 附加变量图或偏回归图

2.16 回归结果的解释

2.17 使用R进行回归示例

2.18 自由度

2.19 基本统计检验

2.20 回归后的线性假设检验

2.21 模型比较

2.22 因果关系与反事实

2.23 实验中的常见问题

2.24 准实验或自然实验

2.25 内生性与内生自变量

2.26 内生性的工具变量解决方案

2.27 双重差分法

2.28 断点回归设计