什么是循环验证?
循环验证是指任何形式的回顾性选择数据特征作为要分析的因变量,从而使统计测试结果失真。循环验证有多种形式,但是它们本质上都使用数据来表征需要测试的变量,然后分析并以统计方式推断出这批数据,因此通常称为“两次浸渍”。修订大学设立标准免费查重。
循环验证的最常见做法是找到与统计结果非常相关的选择标准,然后追溯使用此标准来分析完整数据(例如分组和划分为不同的子集)或删除数据(例如,在神经影像学中定义研究中感兴趣的区域,或排除极值)。 (HCP注意:此处以感兴趣区域的定义为例,在本文中并没有特别明确。)如果研究人员首先寻找与全脑性格焦虑相关的大脑区域,例如小脑;用此标准选择小脑出来,然后计算小脑与特质焦虑之间的相关性,推断小脑与特质焦虑高度相关。这是一个典型的循环论证。 )
例如,一项研究的重点是经过一定的实验操作后神经元簇的放电速率。当使用该神经元簇的整体数据时,发现操作前后没有显着差异。但是,研究人员发现,这种操纵后,簇中某些神经元的放电速率增加,而另一些则降低。因此,他们根据操纵之前神经元的放电率将整个神经元簇分组。分组后进行统计分析。
以此方式,获得了显着的相互作用,即在操纵后操纵前放电水平较低的神经元在操纵后增加,而在操纵前具有放电前水平较高的神经元在操纵后响应降低。但是,这种重要的相互作用完全是由于人为选择标准加上数据中的噪音(例如,神经元活动可能仅随时间而变化,并且在操作之前和之后都返回到平均水平)。可以在纯随机噪声中观察到这种效果。
循环验证的另一种常见形式是在自变量和因变量之间创建依赖关系。继续上面的神经元簇的示例,研究人员可以报告操纵后的神经元反应水平差异与操纵之前和之后的神经元反应水平之间的相关性。但是这两个变量高度依赖于操作后测得的神经元反应水平。因此,由于偶然因素,操纵后具有较高活动水平的神经元在操纵前后也可能表现出更大的差异,因此研究人员报道的相关性可能被夸大了。我们可到论文狗免费查重网站进行论文查重 https://www.lunwengo.net ,它类似于知网查重系统,但是价格低得多,但是如果您有钱,那就多查几次知网论文检测系统,论文狗查重网站也有知网查重,本科188一篇,硕士270元一篇。 如果论文重复率很高,就用论文狗机器降重进行降重修改。
在零假设的前提下,如果统计分析的结果与数据选择标准无关,则选择性分析是完全合理的。但是,循环验证还将噪声(任何数据中都存在)纳入结果中,夸大了统计结果,并导致失真的统计推断和无效的推断。
如何发现错误
循环验证可以多种形式表示。原则上,当筛选统计指标的选择标准偏向于确认目标假设时,它属于循环验证。在某些情况下,这是非常明显的,例如,统计分析数据基于标准以显示所需的效果,或者统计分析数据本身与所关注的效果固有相关。
在其他情况下,(发现)循环验证可能会很复杂,并且需要更详细地了解数据选择和数据分析步骤中的相互依赖性。
审阅者应警惕理论上不可能实现的目标,和/或基于相对不可靠的测量而产生的过高效果(如果两个测量工具的内部一致性很差,则此内部一致性将与上限有意义地相关)。在这些情况下,审稿人应要求作者解释选择标准与预期效果之间的独立性。
解决错误的方案
预先确定分析标准并且与数据无关可以避免循环验证。 另外,由于循环验证将噪声纳入分析中,从而人为地提高了预期效果,因此最直接的解决方案是使用不同的数据集(或数据集的不同部分)来确定分析参数(例如,选择 子组)并测试您的预测(例如,测试不同子组之间的差异)。
这种分组方法可以在测试级别(使用不同的组来确定减少数据的标准)或在测试级别(使用来自所有参与者的不同测试)进行。 可以使用自举方法,而不会降低统计检查的能力。 审稿人可以要求作者进行仿真,以证明所需的效果与噪声分布和选择标准无关。