蓝狮平台_蓝狮注册登录云技术中心

蓝狮注册非参数统计检验中的假设检验是指什么?

image.png

1980年代末,汉斯拉伊大学(Hansraj College)经济学荣誉毕业生的平均薪酬约为每年100万印度卢比。这一数字大大高于80年代初或90年代初毕业的人们。


他们平均水平如此之高的原因是什么呢?沙鲁克·汗是印度收入最高的名人之一,1988年毕业于汉萨拉吉学院,当时他在那里攻读经济学荣誉学位。


这一点,以及还有很多的例子都会告诉我们,平均值并不是很好的可以指示出数据的中心在哪里。它可能会受到异常值的影响。在这种情况下,查看中位数是更好的选择。 它是一个很好的数据中心的指示器,因为一半数据位于中间值以下,另一半位于中间值上方。


到目前为止,一切都很好——我相信你已经看到人们早些时候提出了这一点。蓝狮登录破石应用问题是没有人告诉你如何进行像假设检验这样的分析。


统计检验用于制定决策。为了使用中位数进行分析,我们需要使用非参数检验。非参数测试是分布独立的检验,而参数检验假设数据是正态分布的。说参数检验比非参数检验更加的臭名昭著是没有错的,但是前者没有考虑中位数,而后者则使用中位数来进行分析。


接下来我们就进入非参数检验的内容。


**注意:**本文假定你具有假设检验,参数检验,单尾检验和双尾检验的先决知识。


1.非参数测试与参数测试有何不同?


当总体参数的信息完全已知时使用参数检验,而当总体参数的信息没有或很少使用非参数检验,简单的说,参数检验假设数据是正态分布的。然而,非参数检验对数据没有任何分布。


但是参数是什么?参数不过是无法更改的总体特征。让我们看一个例子来更好地理解这一点。


一位老师使用以下公式计算了班级学生的平均成绩:



看上面给出的公式,老师在计算总分时已经考虑了所有学生的分数。假设学生的分数是准确的,并且没有遗漏的分数,你是否可以更改学生的总分数?并不可以。因此,平均分被称为总体的一个参数,因为它不能被改变。


2.什么时候可以应用非参数检验?


让我们看一些例子。


1.比赛的获胜者由名词决定,而名次是根据越过终点线来进行排名的。蓝狮怎么注册?现在,第一个越过终点线的人排名第一,第二个越过终点线的人排名第二,依此类推。我们不知道获胜者是以多远的距离击败了另一个人,因此区别是未知的。


2.有20人接受了一个疗程的治疗,并且通过调查记录他们的症状。遵循治疗过程后,要求患者在5个类别中进行选择。调查看起来像这样:



现在,如果你仔细查看上述调查中的值可以发现,值是不可以扩展的,它是基于病人的经验来判断的。而且,评分是被分配的而不是被计算的。在这种情况下,参数检验无效。


对于名义数据,不存在任何参数检验。


3.检测极限是值通过给定的分析方法可以检测到的物质的最低数量,但是不一定要将其定量为精确值。例如,病毒载量就是你血液中的HIV含量。病毒载量可以超出检测极限,也可以更高的数量。


4.在上面的平均薪酬方案的例子中,沙鲁克的收入是一个离群值。什么是离群值?沙鲁克的收入与其他经济学专业毕业生的收入相距异常。因此,沙鲁克的收入在这里变得异常,因为它与数据中的其他值之间存在异常距离。


总而言之,非参数检验可以应用于以下情况:


数据不遵循任何概率分布

数据由顺序值或等级构成

数据中有异常值

数据具有检测极限

这里要注意的一点是,如果存在一个针对问题的参数检验,则使用非参数检验将产生非常不准确的答案。


3.使用非参数检验的优缺点


在上面的讨论中,你可能已经注意到,我提到了使用非参数测试可能有利或不利的几点,因此现在让我们共同来看一下这些点。


优点


使用非参数检验而不是参数检验的优点是


1.即使样本量很小,非参数测试也可以提供准确的结果。


2.当正态性假设被违背时,非参数检验比参数检验更加有效。


3.它们适用于所有数据类型,例如标称,序数,间隔或具有离群值的数据。


缺点


1.如果数据进行任何参数检验,那么使用非参数检验可能是一个可怕的错误。


2.非参数检验的临界值表未包含在许多计算机软件包中,因此这些测试需要更多的手工计算。


4.非参数检验的假设检验


现在你知道非参数检验对总体参数无所谓,因此它不对父级总体的均值、标准差等做出任何假设。这里的零假设是一般的,因为两个给定的总体是相等的。


进行非参数检验时应遵循的步骤:


第一步是建立假设并选择一个显著性水平


现在,让我们看看这两个是什么


假设:我的预测是Rahul会赢得比赛,另一个可能的结果是Rahul不会赢得比赛。这些都是我的假设。我的备择假设是Rahul将赢得比赛,因为我们将让备择假设等于我们想要证明的。零假设是相反的假设,通常零假设是没有差异的陈述。例如,


零假设:H0:样本均值与总体均值之间没有显著性差异


备择假设:H1:样本均值与总体均值之间存在显著性差异


显著性水平: 它是做出错误决定的可能性。在上述假设陈述中,零假设表示样本和总体均值之间没有差异。假设样本均值和总体均值之间没有差异时,拒绝零假设的风险为5%。这种拒绝零假设成立的风险或可能性称为显著性水平。


显著性水平用α表示


在非参数检验中,根据研究的兴趣,假设检验可以是单侧或双侧。


2.设置测试统计信息


要了解什么是统计量,让我们看一个例子。一位老师计算了A部分学生的平均成绩,例如36分,她使用A部分学生的平均成绩来表示B,C和D部分学生的平均成绩。这里要注意的是,老师没有使用学生在所有部分中获得的总成绩,而是使用了A部分的平均成绩。在这里,平均成绩被称为统计信息,因为老师没有使用整个数据。


在非参数检验中,将观察到的样本转换为等级,然后将等级视为检验统计量。


3.设定决策规则


决策规则只是告诉我们何时拒绝原假设的一个语句。


4.计算检验统计量


在非参数检验中,我们使用等级来计算检验统计量。


5.将检验统计量与决策规则进行比较


在这里,你将接受或拒绝基于比较的零假设。


在讨论非参数检验的类型时,我们将更深入地研究这一部分。


5.非参数测试


1.曼·惠特尼U检验(Mann Whitney U test)


也称为曼惠特尼威尔科克森(Mann Whitney Wilcoxon)和威尔科克森秩和检验(Wilcoxon rank sum test),是独立样本t检验的一种替代方法。让我们通过一个例子来理解这一点。


一个制药组织创造了一种新的药物来治疗梦游,一个月后对5名患者进行了观察。另一组5人已经服用了旧药物一个月。然后,该组织要求个人记录上个月的梦游病例数。结果是: