FDR的FDR

如题所述

第1个回答  2016-05-28

1995年Benjamini和Hochberg首次提出了FDR的概念,并给出了在多重检验中对它的控制方法(简称BH方法)。然而,当时组学海量数据尚未大量出现,开始并未受到重视,甚至因为考虑了64个假设检验而受到质疑。数年之后,伴随着微阵列检测技术的发展、海量数据的大量出现使得FDR有了应用。目前为止,Benjamini和Hochberg的文章引用次数已经达到上万次,FDR的理论和应用研究也在不断走向成熟。
FDR( false discovery rate) 的定义如下:

其中 E( ·) 为数学期望 。同理, 我们可以得到假阴性发现率 ( false negative discovery rate , FNDR) 的定义:

FDR 的 含 义 是 错误拒绝(拒绝真的(原)假设)的个数占所有被拒绝的原假设个数的比例的期望值。FDR 具有以下优点 : 1可以灵活调整其取值 ,作为假设检验错误率的控制指标, 其控制值可以根据需要灵活选取 , 而传统的假设检验( FWER) 的取值则较为固定 ,
通常定为 0. 05; 2 FDR 的意义明确, 可以作为筛选出的差异变量的评价指标, 而 FWER 则主要是用来控
制I类错误的。FDR 与 FWER 两者的关系: 当所有无效假设为真时, 控制 FDR 和控制 FWER 等价; 当 m0 <
m 时( m0 为真实无差异变量的数目 ) , 控制 FDR 相当于弱控制 FWER。 控制 是 指 决 定 一 个 显 著 性 水 平 的 界 值 , 从 而 使FDR 被限制在某一固定水平, 类似于 FWER 的控制,对此可以采用线性向上的控制方法, 分两步进行: 首先将所有检验的 p 值进行排序, 即 p ( 1) ≤ p ( 2) ≤ p ( 3) ≤ ...i≤ p ( m) ; 然后逐步后退比较 p ( i) ≤ q( i = m, m - 1, m -m2, ..., 1) , 取第一个满足条件的 p ( k) ( k ≥1) , 理论上可以证明在此情况下可以将 FDR 控制在 q( 0 ≤ q ≤ 1) 水平下。上述方法需要满足各变量假设检验间是独立的条件 。在此基础上, 1999 年 Yekutieli 和 Benjamini 给出了一种改进的方法, 但其估计的 FDR 值略为保守,其思想是利用重复抽样的方法来计算 p 值, 可以在变量相关条件下控制 FDR 值 。同年 Benjamini 和 Liu 则提出了一种逐步向下 ( step- dow n) 的控制方法, 过程与BH 基 础 方 法 相 近, 只 是 对 p ( k) 的 控 制 方 法 不 同 。2000 年 Benjamini 和 Hochberg 提出了两阶段的 FDR控制, 以改进原有方法的保守性 ; 2001 年 Benjamini和 Yekutieli 对算法进行了进一步的改进 , 可用于不同变量检验间独立和相关不同条件下的 FDR 的控制,不足之处是其检验效能较低 。Benjamini 和 Hochberg在 2005 年提出了一种自适应线性向上的控制方法( a-daptive linear step- up, ALSU) , 这种方法的特点是在不同的显著水准下两次使用上述介绍的基础过程, 特别是在变量相关条件下得到的 FDR 估计较为稳健 .