入门可在线运行更新于 2026-05-05

护理研究中的样本量计算

1. 一句话告诉你这是什么

样本量计算回答”需要多少患者才能可靠地检验我的假设”。太少则检验力不足，太多则浪费资源——在护理研究中，它决定了你的研究设计是否可行。

2. 什么时候用，什么时候别用

适合用

研究设计阶段，在伦理申请和注册之前
主要研究假设明确，效应量有文献依据或临床最小差值
横断面、队列、RCT 三种常见设计

不适合用

探索性研究或二次分析（无需样本量估算）
效应量完全未知（先做小规模预研究获取信息）
已收完数据（样本量应该是设计阶段的决策，不是事后辩护）

3. 数据准备清单

明确研究设计类型
预设效应量（来自文献或临床最小重要差异）
设定 $\alpha$ 水平（通常 0.05）和检验力（通常 0.80）
预计失访率（横断面 10-20%，纵向 20-30%）
单侧还是双侧检验已确定

4. 方法直觉

样本量由四个要素决定：

$n = f(\alpha, \beta, \text{效应量}, \sigma)$

$\alpha$ （I 类错误）：通常 0.05，越小需要样本越大
$\beta$ （II 类错误）：通常 0.20，检验力 $1 - \beta = 0.80$ ，越大力越需要样本
效应量：你预期的最小有意义差异越大，需要的样本越小
变异度 $\sigma$ ：结局越离散，需要的样本越大

点击展开：常见设计的样本量公式简写

两独立样本 t 检验（每组样本）： $n = 2 \times \left( \frac{Z_{\alpha/2} + Z_{\beta}}{d} \right)^2$

其中 $d = (\mu_1 - \mu_2) / \sigma$ 为标准化的效应量（Cohen’s d）。

横断面调查（基于率的估计）： $n = \frac{Z_{\alpha/2}^2 \times p \times (1-p)}{d^2}$

其中 $p$ 为预期的率（如患病率 20%）， $d$ 为容许误差。

队列研究 / logistic 回归（基于 EPV 经验法则）： $n \ge 10 \times k / p_{\min}$

$k$ 为自变量个数， $p_{\min}$ 为较小组事件比例（如暴露组比例 20%）。

5. R 代码（复制即可跑）

# 案例 1：两独立样本 t 检验
# 已知：Cohen's d = 0.5（中等效应）, α = 0.05, power = 0.80
power.t.test(delta = 0.5, sd = 1, sig.level = 0.05,
             power = 0.80, type = "two.sample", alternative = "two.sided")       # ⬅ 每组 64 人

# 案例 2：横断面调查——估计患病率
# 预期患病率 30%，容许误差 5%
p    <- 0.3
d    <- 0.05
Z    <- qnorm(1 - 0.05/2)
n_cross <- ceiling(Z^2 * p * (1 - p) / d^2)                                      # ⬅ 323 人

# 考虑 15% 失访
n_cross_adj <- ceiling(n_cross / 0.85)                                            # ⬅ 380 人

# 案例 3：重复测量方差分析
# 需安装 pwr 包
# library(pwr)
# pwr.f2.test(u = 2, f2 = 0.15, sig.level = 0.05, power = 0.80)                  # ⬅ f2: 0.02(小) 0.15(中) 0.35(大)

cat(sprintf("t 检验每组需要: %d 人\n", ceiling(power.t.test(delta = 0.5, sd = 1, power = 0.80)$n)))
cat(sprintf("横断面调查需要: %d 人（含 15%% 失访）\n", n_cross_adj))

6. 结果怎么读

设计类型	输入参数	结果（示例）	备注
两样本 t 检验	$d = 0.5, \alpha = 0.05, \text{power} = 0.80$	$n = 64/\text{组}$	共 128 人
配对 t 检验	$d = 0.5, \alpha = 0.05, \text{power} = 0.80$	$n = 34$	前后测设计
横断面率估计	$p = 0.30, d = 0.05$	$n = 323$	含 15% 失访 = 380
相关性	$r = 0.30, \alpha = 0.05, \text{power} = 0.80$	$n = 85$	初步探索常用

7. 论文里怎么写

中文： 样本量基于 G*Power 3.1 计算。采用两独立样本 t 检验（双侧 $\alpha = 0.05$ ，检验力 $0.80$ ，Cohen’s $d = 0.50$ ），每组需要 64 例。考虑 15% 的预期失访率，最终每组招募 76 例，共 152 例。

English: Sample size was calculated using G*Power 3.1. For a two-sided independent-samples t-test ( $\alpha = 0.05$ , power $= 0.80$ , Cohen’s $d = 0.50$ ), 64 participants per group were required. Accounting for an anticipated 15% attrition rate, 76 participants per group (152 total) were targeted.

8. 三个最常见的坑

效应量闭眼填”中等”。 Cohen 的 0.2/0.5/0.8 只是社会科学的通用参考值，不适用于所有领域。用护理领域同类研究的 meta 分析汇总效应量，或从临床最小重要差异反推。
忘记校正多重比较。 如果有 3 个主要结局和 5 个次要结局，不校正检验水准 $\alpha$ 会导致 I 类错误膨胀。用 Bonferroni 或 Benjamini-Hochberg 校正。
事后检验力分析。 研究结束后计算”已有多少检验力”，这在方法论上已经被广泛批评——如果结果不显著，事后 power 高也不会让结果变得显著，反之亦然。

在线运行

点击"运行"按钮，在浏览器中执行 R 分析。首次使用需等待 WebR 初始化。