入门 可在线运行 更新于 2026-05-05

护理研究中的样本量计算

1. 一句话告诉你这是什么

样本量计算回答”需要多少患者才能可靠地检验我的假设”。太少则检验力不足,太多则浪费资源——在护理研究中,它决定了你的研究设计是否可行。

2. 什么时候用,什么时候别用

适合用

  • 研究设计阶段,在伦理申请和注册之前
  • 主要研究假设明确,效应量有文献依据或临床最小差值
  • 横断面、队列、RCT 三种常见设计

不适合用

  • 探索性研究或二次分析(无需样本量估算)
  • 效应量完全未知(先做小规模预研究获取信息)
  • 已收完数据(样本量应该是设计阶段的决策,不是事后辩护)

3. 数据准备清单

  • 明确研究设计类型
  • 预设效应量(来自文献或临床最小重要差异)
  • 设定 α\alpha 水平(通常 0.05)和检验力(通常 0.80)
  • 预计失访率(横断面 10-20%,纵向 20-30%)
  • 单侧还是双侧检验已确定

4. 方法直觉

样本量由四个要素决定:

n=f(α,β,效应量,σ)n = f(\alpha, \beta, \text{效应量}, \sigma)

  • α\alpha(I 类错误):通常 0.05,越小需要样本越大
  • β\beta(II 类错误):通常 0.20,检验力 1β=0.801 - \beta = 0.80,越大力越需要样本
  • 效应量:你预期的最小有意义差异越大,需要的样本越小
  • 变异度 σ\sigma:结局越离散,需要的样本越大
点击展开:常见设计的样本量公式简写

两独立样本 t 检验(每组样本): n=2×(Zα/2+Zβd)2n = 2 \times \left( \frac{Z_{\alpha/2} + Z_{\beta}}{d} \right)^2

其中 d=(μ1μ2)/σd = (\mu_1 - \mu_2) / \sigma 为标准化的效应量(Cohen’s d)。

横断面调查(基于率的估计): n=Zα/22×p×(1p)d2n = \frac{Z_{\alpha/2}^2 \times p \times (1-p)}{d^2}

其中 pp 为预期的率(如患病率 20%),dd 为容许误差。

队列研究 / logistic 回归(基于 EPV 经验法则): n10×k/pminn \ge 10 \times k / p_{\min}

kk 为自变量个数,pminp_{\min} 为较小组事件比例(如暴露组比例 20%)。

5. R 代码(复制即可跑)

# 案例 1:两独立样本 t 检验
# 已知:Cohen's d = 0.5(中等效应), α = 0.05, power = 0.80
power.t.test(delta = 0.5, sd = 1, sig.level = 0.05,
             power = 0.80, type = "two.sample", alternative = "two.sided")       # ⬅ 每组 64 人

# 案例 2:横断面调查——估计患病率
# 预期患病率 30%,容许误差 5%
p    <- 0.3
d    <- 0.05
Z    <- qnorm(1 - 0.05/2)
n_cross <- ceiling(Z^2 * p * (1 - p) / d^2)                                      # ⬅ 323 人

# 考虑 15% 失访
n_cross_adj <- ceiling(n_cross / 0.85)                                            # ⬅ 380 人

# 案例 3:重复测量方差分析
# 需安装 pwr 包
# library(pwr)
# pwr.f2.test(u = 2, f2 = 0.15, sig.level = 0.05, power = 0.80)                  # ⬅ f2: 0.02(小) 0.15(中) 0.35(大)

cat(sprintf("t 检验每组需要: %d 人\n", ceiling(power.t.test(delta = 0.5, sd = 1, power = 0.80)$n)))
cat(sprintf("横断面调查需要: %d 人(含 15%% 失访)\n", n_cross_adj))

6. 结果怎么读

设计类型输入参数结果(示例)备注
两样本 t 检验d=0.5,α=0.05,power=0.80d = 0.5, \alpha = 0.05, \text{power} = 0.80n=64/n = 64/\text{组}共 128 人
配对 t 检验d=0.5,α=0.05,power=0.80d = 0.5, \alpha = 0.05, \text{power} = 0.80n=34n = 34前后测设计
横断面率估计p=0.30,d=0.05p = 0.30, d = 0.05n=323n = 323含 15% 失访 = 380
相关性r=0.30,α=0.05,power=0.80r = 0.30, \alpha = 0.05, \text{power} = 0.80n=85n = 85初步探索常用

7. 论文里怎么写

中文: 样本量基于 G*Power 3.1 计算。采用两独立样本 t 检验(双侧 α=0.05\alpha = 0.05,检验力 0.800.80,Cohen’s d=0.50d = 0.50),每组需要 64 例。考虑 15% 的预期失访率,最终每组招募 76 例,共 152 例。

English: Sample size was calculated using G*Power 3.1. For a two-sided independent-samples t-test (α=0.05\alpha = 0.05, power =0.80= 0.80, Cohen’s d=0.50d = 0.50), 64 participants per group were required. Accounting for an anticipated 15% attrition rate, 76 participants per group (152 total) were targeted.

8. 三个最常见的坑

  1. 效应量闭眼填”中等”。 Cohen 的 0.2/0.5/0.8 只是社会科学的通用参考值,不适用于所有领域。用护理领域同类研究的 meta 分析汇总效应量,或从临床最小重要差异反推。
  2. 忘记校正多重比较。 如果有 3 个主要结局和 5 个次要结局,不校正检验水准 α\alpha 会导致 I 类错误膨胀。用 Bonferroni 或 Benjamini-Hochberg 校正。
  3. 事后检验力分析。 研究结束后计算”已有多少检验力”,这在方法论上已经被广泛批评——如果结果不显著,事后 power 高也不会让结果变得显著,反之亦然。

在线运行

在线运行

点击"运行"按钮,在浏览器中执行 R 分析。首次使用需等待 WebR 初始化。