-
Notifications
You must be signed in to change notification settings - Fork 0
Description
<P_1>
【原文】:
将信心置于置信区间的谬误
【简单prompt】:
将信心置于置信区间的误区
【结构化prompt】:
对置信区间误解的探讨
</P_1>
<P_2>
【原文】:
摘要:
【简单prompt】:
摘要:
【结构化prompt】:
摘要:
</P_2>
<P_3>
【原文】:
区间估计——对包含抽样不确定性的参数进行估计的一种方法——长期以来被吹捧为统计分析的关键组成部分。有几种类型的区间估计,但最受欢迎的是置信区间(CIs):在重复抽样中,平均包含真实参数值的区间。置信区间的宽度被认为是估计的精度的指标;置信区间被认为是指导哪些参数值是合理或合理的指南;区间的置信系数(例如,95%)被认为是指示真实参数是否包含在区间内的合理性的指标。我们在许多实例中展示,置信区间不一定具有这些属性,并且可能导致不合理或任意的推断。因此,我们警告不要仅仅依赖于置信区间理论来证明区间估计,并建议使用其他区间估计理论。
【简单prompt】:
区间估计,一种涵盖抽样不确定性的参数估计方法,长期被誉为统计分析的核心。存在多种区间估计类型,其中最为流行的是置信区间(CI):在重复抽样的情况下,平均而言能够包含真实参数值的区间。通常认为,置信区间的宽度反映了估计的精确度;置信区间被视为判断某参数值合理性的指导;而区间的置信水平(例如95%)被视作包含真实参数的可能性的指示。然而,我们通过多个实例展示,置信区间并不一定具备这些特性,且可能导致不合理或随意的推断。因此,我们建议不应仅依赖置信区间理论进行区间估计,而应考虑其他区间估计方法。
【结构化prompt】:
区间估计,一种涉及抽样不确定性的参数估计方法,长期被视为统计分析的核心。置信区间(CIs),作为区间估计的一种流行形式,指的是在重复抽样中平均能涵盖真实参数值的区间。置信区间的宽度常被看作估计精度的标志,而其置信水平(如95%)被认为能反映真实参数是否包含于区间内的可能性。本文通过多个实例说明,置信区间并非总具备这些特性,有时甚至会导致不合理或随意的推断。因此,我们提醒读者不应过度依赖置信区间理论来验证区间估计的有效性,并建议探索其他区间估计方法。
</P_3>
<P_4>
【原文】:
关键词: 贝叶斯推理与参数估计,贝叶斯统计学,统计推断,统计
【简单prompt】:
关键词: 贝叶斯推理与参数估计,贝叶斯统计学,统计推断
【结构化prompt】:
关键词: 贝叶斯推理与参数估计,贝叶斯统计学,统计推断
</P_4>
<P_5>
【原文】:
"你一直在使用那个词。我不认为它意味着你认为它意味着的那样。"
【简单prompt】:
"你一直在使用那个词。我不认为它意味着你以为它意味着的那样。"
【结构化prompt】:
“你一直在使用这个词。但我觉得它并不是你以为的那个意思。”
</P_5>
<P_6>
【原文】:
Inigo Montoya,《公主新娘》(1987年)
【简单prompt】:
- Inigo Montoya,《公主新娘》(1987)
【结构化prompt】:
Inigo Montoya,《公主新娘》(1987年)
</P_6>
<P_7>
【原文】:
过去一个世纪中,统计学的发展见证了旨在允许从数据中进行推断的方法的蓬勃发展。这些方法在其哲学基础、它们应该解决的问题以及它们在实践中的使用频率方面存在广泛的差异。一个受欢迎且广泛推广的方法类别是区间估计。对区间估计存在各种不同的方法,其哲学基础和计算方式各异,但总体上都被认为是对参数的估计,通过给出参数的一系列值而不是单一值来考虑测量或抽样不确定性。
【简单prompt】:
在过去的一个世纪中,统计学的发展目睹了旨在从数据中做出推断的方法的迅猛发展。这些方法在哲学基础、解决问题的方式以及实际应用频率等方面差异巨大。区间估计是一类广受欢迎和推崇的方法。这类方法有多种不同的实现方式,其哲学基础和计算方法各异,但总体上都旨在通过提供一系列可能值而非单一值来反映参数的估计,从而考虑到测量或抽样的不确定性。
【结构化prompt】:
在过去的一个世纪里,统计学的发展见证了各种旨在从数据中进行推断的方法的兴起。这些方法在哲学基础、解决问题的类型以及实际应用频率方面存在巨大差异。其中一个受欢迎且广泛使用的方法类别是区间估计,它采用不同的哲学基础和计算方式,通常旨在通过提供一系列可能的参数值,而不是单一值,来反映测量或抽样的不确定性。
</P_7>
<P_8>
【原文】:
在许多种区间估计方法中,最受欢迎的是置信区间(CI)。几乎所有初级统计教材都介绍了置信区间;它们受到许多知名期刊的方法论指南的推荐或要求(例如,Psychonomics Society,2012年;Wilkinson和Statistical Inference工作组,1999年);并且它们构成了方法改革提出的方案的基础(Cumming,2014年;Loftus,1996年)。在当前方法改革的氛围中,对置信区间理论允许的推断类型以及不允许的推断类型有着明确的理解,对于决定未来如何进行科学是至关重要的。
【简单prompt】:
在众多的区间估计方法中,最受欢迎的是置信区间(CI)。几乎所有初级统计教材都会介绍置信区间;它们被许多著名期刊的方法论指南推荐或要求使用(例如,Psychonomics Society,2012年;Wilkinson和Statistical Inference工作组,1999年);同时,它们也是方法论改革提议的基础(Cumming,2014年;Loftus,1996年)。在当前的方法改革氛围中,对置信区间理论允许的推断类型及其限制有着清晰的理解,这对决定未来科学研究的方向至关重要。
【结构化prompt】:
在众多区间估计方法中,置信区间(CI)尤为受到青睐。几乎所有基础统计教程都会介绍置信区间;它们也是许多著名期刊的方法论指南推荐或要求的内容(例如,Psychonomics Society,2012年;Wilkinson和Statistical Inference工作组,1999年);同时,它们还是许多方法改革方案的基础(例如,Cumming,2014年;Loftus,1996年)。在当前的方法改革浪潮中,正确理解置信区间理论允许的和不允许的推断类型对决定未来科学研究的方向至关重要。
</P_8>
<P_9>
【原文】:
在这篇论文中,我们认为对置信区间(CIs)的提倡是基于对CI理论的一种民间理解,而非一种有原则的理解。我们概述了支持民间CI理论的三种谬论,并将其置于CI理论的哲学和历史背景中。通过一个从统计文献中改编的易懂的例子,我们展示了CI理论与民间CI理论的差异。最后,我们在ANOVA和回归分析中提倡并广泛使用的一个CI的上下文中展示了对置信的谬误,并讨论了CI理论与民间CI理论不匹配的含义。
【简单prompt】:
本文认为,对置信区间(CI)的推崇基于对CI理论的一种民间理解,而非基于原则的理解。我们总结了支持民间CI理论的三种误解,并将其放置于CI理论的哲学和历史背景中。通过一个改编自统计文献的易于理解的示例,我们展示了CI理论与民间CI理论之间的区别。最后,我们在ANOVA和回归分析中广泛使用的CI的上下文中展示了置信的误区,并讨论了CI理论与民间CI理论不匹配的含义。
【结构化prompt】:
本文认为,对置信区间(CIs)的支持基于对CI理论的一种通俗理解,而非基于原则的理解。我们概述了支持这种通俗CI理论的三种谬误,并将其放置于CI理论的哲学和历史背景中。通过一个改编自统计文献的易于理解的例子,我们展示了CI理论和通俗CI理论之间的区别。最后,我们在ANOVA和回归分析中广泛使用的一个CI的上下文中,揭示了对置信的误解,并讨论了CI理论与通俗CI理论不匹配的含义。
</P_9>
<P_10>
【原文】:
我们的主要观点是:不应该像现代支持者建议的那样使用置信区间,因为这种用法在置信区间理论中并没有得到证明。现代支持者认为置信区间具有的好处是在置信区间理论之外的考虑因素;因此,如果按照CI支持者建议的方式使用,CI可能会提供严重误导的推断。对于许多CI,支持者实际上并没有探讨CI是否支持合理的推断。因此,我们认为在最好的情况下,对CI理论的引用是多余的,因为可以在CI理论之外证明推断的合理性,在最坏的情况下是不明智的,因为这样的引用是站不住脚的。
【简单prompt】:
我们的主要观点是,不应如现代支持者所建议的那样使用置信区间,因为这种用法在置信区间理论中并未得到证实。现代支持者所声称的置信区间的优点,实际上是置信区间理论之外的考虑因素;因此,如果按照CI支持者的建议使用,CI可能导致严重误导的推断。对于许多CI,支持者实际上并未探究它们是否支持合理的推断。因此,我们认为在最好的情况下,引用CI理论是多余的,因为可以在CI理论之外证明推断的合理性;在最坏的情况下,这种引用是不明智的,因为它站不住脚。
【结构化prompt】:
我们的主张是,不应按照现代支持者所建议的那样使用置信区间,因为这种使用方式并未在置信区间理论中得到验证。现代支持者宣称的置信区间的优点实际上超出了置信区间理论的范畴;因此,如果按照CI支持者的建议来使用,CI可能会导致严重误导的推断。对于许多CI,支持者实际上并未探讨这些CI是否支持合理的推断。因此,我们认为在最佳情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外证明;在最糟糕的情况下,这种引用是站不住脚的。
</P_10>
<P_11>
【原文】:
置信区间的民间理论
【简单prompt】:
置信区间的民间理论
【结构化prompt】:
置信区间的通俗理论
</P_11>
<P_12>
【原文】:
在科学实践中,经常有必要估计一些感兴趣的数量,并表达对这一估计的不确定性。如果我们的目标是估计正态总体的真实均值,我们可能会选择样本均值 x¯ 作为估计值。非正式地说,我们期望 x¯ 接近,但接近程度取决于样本大小和样本中观察到的变异性。为了表达估计的不确定性,通常使用置信区间。
【简单prompt】:
在科学实践中,经常需要估计某些感兴趣的数量,并表达对这一估计的不确定性。假设我们的目标是估计正态总体的真实均值μ,我们可能会选择样本均值 x̄ 作为估计值。非正式地说,我们期望 x̄ 接近μ,但这种接近程度取决于样本大小和样本中观察到的变异性。为了表达对估计的不确定性,通常会使用置信区间。
【结构化prompt】:
在科学实践中,经常需要估计一些感兴趣的数量,并对这些估计的不确定性进行表达。例如,如果我们的目标是估计正态总体的真实均值μ,我们可能会选择样本均值 �ˉxˉ 作为估计值。非正式地说,我们期望 �ˉxˉ 接近μ,但这种接近程度取决于样本大小和样本中观察到的变异性。为了表达这种估计的不确定性,通常会使用置信区间。
</P_12>
<P_13>
【原文】:
关于置信区间的所有人都同意的一点是基本定义:对于一个参数(我们通用地称为,可能表示总体均值、中位数、方差、概率或任何其他未知数量),置信区间是由一个过程生成的区间,在重复抽样中,这个过程有固定的概率包含参数。如果该过程生成包含的区间的概率为0.5,则是一个50%的置信区间;同样,对于95%的置信区间,概率为0.95。
【简单prompt】:
所有人都同意置信区间的基本定义:对于一个参数(我们通常称之为θ,可能代表总体均值、中位数、方差、概率或任何其他未知量),置信区间是由一个过程生成的区间,在重复抽样中,这个过程以固定的概率包含该参数。如果该过程生成包含θ的区间的概率为0.5,则是一个50%的置信区间;同样,对于95%的置信区间,概率为0.95。
【结构化prompt】:
对于置信区间,所有专家都同意的一点是其基本定义:对于一个参数(我们通常称之为θ,它可能代表总体均值、中位数、方差、概率或任何其他未知量),置信区间是由特定过程生成的区间,在重复抽样中,这个过程有固定概率包含该参数。例如,一个50%的置信区间意味着该过程生成包含θ的区间的概率为0.5;对于95%的置信区间,这一概率则为0.95。
</P_13>
<P_14>
【原文】:
定义** 1 **(置信区间) _参数 θ 的 X% 置信区间是由一个过程生成的区间( L , U ),在重复抽样中,该过程有 X% 的概率包含 θ 的真值,对于 θ 的所有可能值都成立( Neyman , 1937 )。
【简单prompt】:
定义 1(置信区间):参数 θ 的 X% 置信区间是由一个过程生成的区间(L,U),在重复抽样中,该过程有 X% 的概率包含 θ 的真值,对于 θ 的所有可能值都成立(Neyman,1937)。
【结构化prompt】:
定义 1(置信区间):参数 θ 的 X% 置信区间是由某过程生成的区间(L,U),在重复抽样中,该过程有 X% 的概率包含 θ 的真值,这一点对于 θ 的所有可能值都成立(Neyman,1937)。
</P_14>
<P_15>
【原文】:
1_
【简单prompt】:
1
【结构化prompt】:
1
</P_15>
<P_16>
【原文】:
置信区间的置信系数来源于生成它的过程。因此,区分过程(CP)和置信区间是有帮助的:X%置信过程是在重复样本中生成覆盖θ的过程,而置信区间是由这样的过程生成的特定区间。置信过程是一个随机过程;而置信区间是被观察并固定的。
【简单prompt】:
置信区间的置信水平源自于生成它的过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是在重复样本中生成包含θ的区间的过程,而置信区间是由这样的过程生成的具体区间。置信过程是随机的;而置信区间是观测到的并固定的。
【结构化prompt】:
置信区间的置信系数源自于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是在重复样本中生成覆盖θ的过程,而置信区间则是由这种过程生成的具体区间。置信过程是一个随机过程;而置信区间则是被观察到并固定的。
</P_16>
<P_17>
【原文】:
如何解释置信过程似乎很清晰:它是生成区间,这些区间将在样本的固定比例中包含真值的任何过程。然而,当我们从数据中计算出一个具体的区间并必须对其进行解释时,我们面临困难。如何从我们对置信过程属性的了解转移到对某个观察到的置信区间的解释,这并不明显。
【简单prompt】:
对置信过程的解释似乎很直观:它是生成区间的任何过程,这些区间将在样本的固定比例中包含真值。然而,当我们从数据中计算出一个具体的区间并需要对其进行解释时,就面临了困难。如何从我们对置信过程属性的了解转移到对某个具体置信区间的解释,并不是一个明显的过程。
【结构化prompt】:
对置信过程的解释看似清晰:它是生成区间的过程,这些区间将在样本的固定比例中包含参数的真值。然而,当我们从数据中计算出一个具体的区间并需要对其进行解释时,就会遇到难题。如何将我们对置信过程属性的了解转化为对某个具体观察到的置信区间的理解,并不是那么直观。
</P_17>