Dep.

Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS

Testes Não Paramétricos
Nos testes abordados até agora, ditos testes paramétricos, as hipóteses envolvem apenas parâmetros populacionais, como a média, a variância, uma proporção, etc. Além disso, em geral, estes testes comportam uma diversidade de suposições fortes a que o seu emprego deve subordinar-se de que são exemplo: as observações devem ser extraídas de populações com distribuição especificada; as variáveis em estudo devem ser medidas em escala intervalar ou de rácios, de modo a que seja possível utilizar operações aritméticas sobre os valores obtidos das amostras (adição, multiplicação, ...), etc.
Carla Henriques e Manuel Reis
1

Tratamento Estatístico de Dados

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS

Vamos agora abordar um conjunto de testes que nos permitem testar outro tipo de hipóteses que não apenas sobre parâmetros populacionais (e.g., se a distribuição populacional em estudo pode ser considerada Normal). Estes são chamados testes não paramétricos. Estes testes são, em geral, fáceis de aplicar, pois podem ser usados quando as hipóteses exigidas por outras técnicas não são satisfeitas. Apesar de haver certas suposições básicas associadas à maioria das provas não paramétricas, essas suposições são em menor número e mais fracas do que as associadas às provas paramétricas. A maior parte das provas não paramétricas servem para pequenas amostras e, além disso, aplicam-se a dados medidos em escala ordinal, e alguns mesmo a dados em escala nominal.

Carla Henriques e Manuel Reis
2

Tratamento Estatístico de Dados

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento

Testes de Ajustamento (testes da bondade do ajustamento)
Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição especificada.

Hipóteses a testar: H0: a amostra provém de uma população com distribuição especificada H1: a população de onde provém a amostra não segue a distrib. especificada

Carla Henriques e Manuel Reis
3

Tratamento Estatístico de Dados

4 -6 -5. Será mesmo de admitir que tais dados foram extraídos de uma pop.6 os resultados que se apresentam na tabela -1.4 -7.2 4 Diferença entre a data de chegada e a data planeada para 30 navios. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Exemplo: Pretende-se construir um modelo de simulação das operações de um determinado terminal de um porto situado na Europa.8 1.4 2.Dep.8 8.6 2.6 15.8 4. -6.2)? Carla Henriques e Manuel Reis 4 Tratamento Estatístico de Dados . 7.3 15 -7.4 12.6 -2 5 2.8 -0.6 -0.2.7 -2. N(0.6 -3.8 -1.4 -8.2 2.2 -2.1 e desvio padrão 7.2 7. Há razões para supor que tal diferença é uma variável aleatória com distribuição Normal de média 0. Uma amostra de 30 navios revelou seguinte.9 -5. Uma das variáveis a considerar no modelo é a diferença entre a data de chegada dos navios provenientes dos EUA e a respectiva data planeada.2 -9 13.1.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Neste exemplo.Dep. que apresentamos a seguir. Carla Henriques e Manuel Reis 5 Tratamento Estatístico de Dados . Existem vários testes de ajustamento que nos permitem fazer uma análise de problemas deste tipo. o teste de Kolmogorov ou Kolmogorov-Smirnov e o teste de normalidade de Lilliefors. entre os quais: o Teste de Ajustamento do Qui-quadrado sugerido por Karl Pearson. estamos perante um problema de ajustamento de dados a uma determinada distribuição.

Dep. Os valores possíveis da característica em estudo são. . repartidas por m classes mutuamente exclusivas. A1.. num primeiro passo. Am (serão intervalos da recta real se a característica é quantitativa e contínua). sobre os quais se observa uma característica (qualitativa ou quantitativa). . Carla Henriques e Manuel Reis 6 Tratamento Estatístico de Dados .. A2. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Teste do Qui-quadrado Considere-se uma amostra aleatória de n elementos. extraída de uma população com distribuição desconhecida.

. Hipóteses a testar: H0: pi=p0i ..Dep.. .p0i a probabilidade de obter uma observação na classe Ai ..m H1: pi≠p0i para algum i Carla Henriques e Manuel Reis 7 Tratamento Estatístico de Dados . .pi a probabilidade desconhecida de obter uma observação na classe Ai. i=1.Oi o nº de observações ou frequência absoluta observada da classe Ai. assumindo que a observação foi extraída de uma população com a distribuição especificada em H0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Denote-se por: .

do teste de ajustamento do Qui-quadrado. onde k é o número de parâmetros desconhecidos da distribuição proposta em H0. sendo verdadeira a hipótese nula. quando H0 é verdadeira. é dada por Q=∑ m (Oi − ei )2 ei i=1 que. tem distribuição assimptótica do Quiquadrado com m-k-1 graus de liberdade (χ2m-k-1). Carla Henriques e Manuel Reis 8 Tratamento Estatístico de Dados . estimados a partir da amostra. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Assim. a frequência esperada da classe Ai. é dada por ei = n×p0i. A estatística de teste.Dep.

Dep. não deve ser muito grande e. a estatística de teste terá um valor observado. Oi–ei. De modo intuitivo. quanto maior for o valor observado de Q. levando à rejeição desta. Qobs. Trata-se portanto de um teste unilateral à direita. mais nos encaminhamos de concluir que as frequências observadas não foram provenientes da população em que se baseou a hipótese nula. menos plausível é a hipótese nula. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Se a hipótese nula for verdadeira. consequentemente. também não muito grande. Carla Henriques e Manuel Reis 9 Tratamento Estatístico de Dados . isto é. a diferença entre cada valor observado e o respectivo valor esperado.

ei’s.mais de 20% das classes com ei inferior a 5 ou. Se tivermos: . e iniciar novamente o teste. São referidas na literatura várias regras práticas de aplicação do teste. agora com menos classes. das quais avançamos a seguinte. pois se estas forem muito pequenas a aproximação ao Qui-quadrado não é a mais apropriada. .alguma classe com ei inferior a 1 devemos proceder à agregação de algumas classes contíguas.Dep. Carla Henriques e Manuel Reis 10 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Na aplicação deste teste deve-se ter particular atenção às frequências esperadas.

as classes Ai.m. a1[. as hipóteses a testar são H0: X ~ N(0.Dep. Exemplo: Denotando por X a diferença entre a data de chegada dos navios e a data planeada. a3[ .. Carla Henriques e Manuel Reis 11 Tratamento Estatístico de Dados .1. +∞[.1. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Retomemos o exemplo exposto atrás. são intervalos da forma A1=]-∞.22) H1: X ~ N(0. 7.. 7. deste modo... i=1. Am=[ am-1. A2=[ a1.. a2[ A3=[ a2.22) / Neste caso a distribuição proposta em H0 é contínua e.

as frequências esperadas são todas iguais a n/m>5.3. donde p0i = P(Ai\H0) = 1/4.4. Os limites dos intervalos são tais que as probabilidades decorrentes da hipótese nula sejam iguais a 1/m para todas as classes. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Para a determinação das classes é sugerida a regra de Mann e Wald: Número de classes = m.Dep. Assim. com m tal que n/m>5.5>5). Carla Henriques e Manuel Reis 12 Tratamento Estatístico de Dados . Para o exemplo escolheu-se m=4 classes (ei=30/4=7.2. para i=1.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Cálculo dos limites dos intervalos de classe: a3: p03 = 0.2)).1.0.Dep.1 e a1=0.25 ⇔ a3=4.1)= -4.2)) Carla Henriques e Manuel Reis 13 Tratamento Estatístico de Dados .724 (EXCEL: INV.7.75.1-(4.924-0.0.25.7.1.NORM(0. 1/4 1/4 1/4 1/4 a1 a2 =0.1 a3 Da simetria da distribuição normal: a2=0.NORM(0.96 (EXCEL: INV.

5 7.5 7.13 7 .5 O valor observado da estatística de teste é ( 8 − 7 .3 -2.2 7.6 -2.6 -3.2 -2 12.8 -0.9 1.0.8 -5.5 7 . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento -6.25 0.4 -1.7 2.2 4 Classes A1=]-∞.5 ) 2 ( 7 − 7 .8 15. -4.4 -9 5 -6 13.5 Carla Henriques e Manuel Reis 14 Tratamento Estatístico de Dados .4 8.96.5 ) 2 ( 7 − 7 .4 -1.96[ A4=[4.76[ A2=[-4. +∞ [ Frequências observadas 8 8 7 7 Frequências esperadas 7.2 2.5 ) 2 ( 8 − 7 .5 7 .6 2.2 2.1[ A3=[0.8 15 -8. 4.5 7 .4 -0.76.8 p0i 0.1.6 4.Dep.25 0.25 -7.6 -7.5 7.25 0.5 ) 2 Qobs= + + + = 0.6 -5.

81.05: R. Carla Henriques e Manuel Reis 15 Tratamento Estatístico de Dados . 7.22).C. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento A estatística teste. tem aproximadamente distribuição Qui-quadrado com m-1=4-1=3 graus de liberdade.CHI(0. Para α=0..Dep. sob o pressuposto de H0 ser verdadeira. +∞[ .81=INV.3)) Como Qobs ∉R. (EXCEL: 7.05.C.=[7. somos levados a não rejeitar a hipótese de que a diferença entre os tempos de chegada e os tempos planeados tem distribuição N(0.1.

temos de proceder à agregação dos dados em classes. no ajustamento de uma distribuição contínua a uma amostra usando o teste do Qui-quadrado. Carla Henriques e Manuel Reis 16 Tratamento Estatístico de Dados . que além de serem sempre algo arbitrárias envolvem perdas de informação. não se aplica a dados qualitativos nem a variáveis discretas. De facto. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Teste de Kolmogorov-Smirnov (K-S) O teste de Kolmogorov-Smirnov (K-S) ao contrário do teste do Qui-quadrado. tem a vantagem de não estar dependente de classificações dos dados. sendo por isso mais adequado utilizar o teste K-S.Dep. pois a tabela disponível para este teste só é exacta caso a distribuição em teste seja contínua. No entanto.

neste caso o teste desenvolvido por Lilliefors (teste de normalidade de Lilliefors) que será abordado mais tarde. sem especificar µ e σ. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Por outro lado. o teste K-S só pode ser aplicado quando a distribuição indicada na hipótese nula está completamente especificada (o que não sucede com o teste do Qui-quadrado).Dep. Além disso. enquanto que o teste K-S é aplicável a pequenas amostras. Carla Henriques e Manuel Reis 17 Tratamento Estatístico de Dados . podemos recorrer a outro teste. efectuar um ajustamento de uma distribuição normal. No caso de pretendermos. por exemplo. o teste do Qui-Quadrado está orientado essencialmente para grandes amostras.

Hipóteses a testar: H0: F(x)=F0(x). para qualquer x H1: F(x)≠F0(x).Dep. Carla Henriques e Manuel Reis 18 Tratamento Estatístico de Dados . para algum x No teste de Kolmogorov-Smirnov comparam-se as frequências relativas acumuladas registadas na amostra com as que se esperariam se a distribuição populacional fosse a especificada na hipótese nula. contínua e completamente especificada. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Seja F a função de distribuição da população em estudo e F0 a função de distribuição proposta.

Dep. entre a proporção de observações inferiores ou iguais a x. e a probabilidade de se observar um valor inferior ou igual a x se a distribuição populacional for a especificada em H0. F0(x): Dn = − ∞ < x < +∞ sup S ( x) − F0 ( x) F0(x) S (x) Carla Henriques e Manuel Reis 19 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento A Estatística do teste de K-S considera a maior das diferenças. S(x). em valor absoluto.

rejeita-se H0. para um nível de significância α. F0 ( xi ) − S ( xi −1 ) }. se H0 for verdadeira. Carla Henriques e Manuel Reis 20 Tratamento Estatístico de Dados .α podem ser consultados numa tabela). se o valor observado for superior ou igual ao ponto crítico Dn.obs tome um valor pequeno.Dep... e logo espera-se que Dn. a distância vertical máxima entre as imagens das duas distribuições não deve de ser muito grande. n Assim. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Uma vez que F0 é uma função (contínua) não decrescente e S é uma função em escada. Então.. o supremo ocorre num ponto onde se verifica um salto de S : Dn.obs = max { F0 ( xi ) − S ( xi ) . i =1..α (os valores críticos Dn.

tendo-se registado o seguinte: 198 254 262 272 275 278 285 287 287 292 Ao nível de significância de 5%. há evidência para rejeitar a hipótese de normalidade da referida variável? Carla Henriques e Manuel Reis 21 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Exemplo: Acredita-se que o tempo despendido na execução de uma determinada tarefa é uma variável aleatória com distribuição normal de média 290 minutos e desvio padrão 56 minutos. Foram registados os tempos despendidos em 10 tarefas seleccionadas ao acaso.Dep.

562). As hipóteses a testar são. neste caso. Carla Henriques e Manuel Reis 22 Tratamento Estatístico de Dados .05.Dep. H0: X∼N(290. / O ponto crítico da estatística de teste D10 é. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Denote-se por X o tempo despendido na execução de uma tarefa. Para calcular o valor observado da estatística de teste. para α=0. começa-se por ordenar os valores da amostra por ordem crescente. 562) H1: X ~ N(290.409 (consulte a tabela). Os cálculos estão efectuados na tabela seguinte.05= 0.0. D10.

290.7 0.4 0.0502 0.3944 0.236 0.6 0.3085 0. ao nível de significância de 5%.VERDADEIRO) 198 254 262 272 275 278 285 287 292 xi S(xi) 0.3 0.6 0.0739 0.486 |F0(xi).1 0.4644 0.5 0.1356 0.2 0.9 0.4 0.1 0.2214 0.5142 F0(xi) |F0(xi).3858 Como D10.1085 0.026 0. 562).5 0.4786 0.486>0.05 0.9 1 S(xi-1) 0 0. Carla Henriques e Manuel Reis 23 Tratamento Estatístico de Dados .409.009 0.obs =0.1602 0.S(xi-1)| 0.Dep.2 0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento EXCEL: DIST.185 0.421 0.S(xi) | 0.56.0056 0.4152 0.3739 0.0502 0.NORM(198.0848 0.3 0.2602 0. rejeitamos a hipótese de o tempo despendido na execução de uma tarefa seguir distribuição N(290.06 0.7 0.106 0.

σ2) H1: X ~ N(µ. para algum µ e algum σ. x e s. Hipóteses a testar H0: X ~ N(µ. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Teste de Normalidade Lilliefors Pretende-se testar se uma dada variável aleatória X tem distribuição N(µ. Carla Henriques e Manuel Reis 24 Tratamento Estatístico de Dados . usando estimativas de µ e σ. σ2) / Este teste processa-se como o teste de K-S. isto é. σ2) sem especificar µ e σ. Os pontos críticos são consultados na tabela elaborada por Lilliefors. respectivamente.Dep.

O senhor quer estimar o tempo médio pretendido através de um intervalo de confiança. T ~ tn-1 Tratamento Estatístico de Dados 25 . mas nada sabe acerca da distribuição do tempo de entrega X.Dep. n onde t: P(-t<T<t) =λ. Poderá fazê-lo? Sabemos que caso a distribuição subjacente aos dados seja normal. e além disso. 36 e 36. Foi recolhida uma amostra aleatória de cinco tempos: 29. o intervalo pode ser calculado usando a fórmula: X mt Carla Henriques e Manuel Reis S . 35. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Exemplo: Um distribuidor pretende estimar o tempo médio de entrega dos seus produtos a um cliente bastante importante. 33. a dimensão da amostra é muito pequena (n=5).

O valor crítico da estatística teste. em primeiro lugar.05 =0.337 (consulte a tabela).95 . 0. podemos utilizar o teste de Lilliefors. σ2) / Uma vez que nada sabemos acerca de µ e σ. Carla Henriques e Manuel Reis 26 Tratamento Estatístico de Dados .05 é * D5. interessa testar. σ2) H1: X ~ N(µ. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Assim. as hipóteses H0: X ~ N(µ.Dep. recorrendo às estimativas x =33. ao nível de significância de 0.8 s=2.

2579 0.1931 0.772 |F0(xi).8.4 0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento EXCEL: DIST.Dep.0519 0.6 1 S(xi-1) 0 0.VERDADEIRO) Cálculo do valor observado da estatística de Teste: xi 29 33 35 36 S(xi) 0. Carla Henriques e Manuel Reis 27 Tratamento Estatístico de Dados .95. não rejeitamos a hipótese de a população em estudo ter distribuição normal.337.2 0. ao nível se significância de 5%.2.S(xi-1)| 0.2 0.1481 0. obs =0.6579 0.0069 0.6 F0(xi) 0.33.4 0. então.NORM(29.1721 * Como D5.3931 0.0579 0.0519 0.S(xi) | 0.2579<0.2279 |F0(xi).

.. Carla Henriques e Manuel Reis 28 Tratamento Estatístico de Dados . A2. respectivamente A1.. Bs.Dep. B2... Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Tabelas de Contingência Teste do Qui-quadrado de Independência Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas). uma com r e outra com s modalidades ou categorias.. Ar e B1...

Bs O11 O12 ...Dep. O2s M M O M A1 A2 M Ar Oij (i=1.. designada por tabela de contingência r×s. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Cada indivíduo da amostra é classificado numa e numa só categoria (ou classe) de A e numa e numa só categoria (ou classe) de B.. com o seguinte aspecto: B1 B2 . O1s O21 O22 .s) Or1 Or2 .. numa amostra de tamanho n. Ors número de elementos classificados simultaneamente nas categorias Ai de A e Bj de B...... Carla Henriques e Manuel Reis 29 Tratamento Estatístico de Dados ... A classificação dos elementos da amostra dá origem a uma tabela de dupla entrada..r e j=1....

. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Sejam: • Oi⋅ = ∑ Oij (i=1.s) i=1 r nº de elementos na amostra com modalidade Bj..Dep. Tem-se.r) j=1 s nº de elementos na amostra com modalidade Ai..... n = ∑ ∑ Oij =∑ Oi• = ∑ O • j i=1 j=1 i=1 j=1 r s r s onde n é a dimensão da amostra. Carla Henriques e Manuel Reis 30 Tratamento Estatístico de Dados ... • O⋅j = ∑ Oij (j=1.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência O objectivo a que nos propomos é o de tentar inferir sobre a existência ou não de qualquer relação ou associação entre os atributos (variáveis) A e B. Hipóteses a testar: H0: A e B são independentes H1: A e B não são independentes Carla Henriques e Manuel Reis 31 Tratamento Estatístico de Dados . inferir se A e B são ou não independentes.Dep. mais concretamente.

....s) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria Bj de B..Dep.. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Denote-se por: • pij=P(Ai∩Bj) (i=1.r) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria Ai de A.... • pi⋅=P(Ai) (i=1.s) a probabilidade (desconhecida) de um indivíduo da população ser classificado simultaneamente nas categorias Ai de A e Bj de B.r e j=1... i=1 j=1 i=1 j=1 r s r s Carla Henriques e Manuel Reis 32 Tratamento Estatístico de Dados .. 1 = ∑ ∑ pij =∑ pi• = ∑ p • j ... • p⋅j=P(Bj) (j=1..

verifica-se a conhecida relação. pij= pi⋅× p⋅j Assim. P(Ai∩Bj) = P(Ai) P(Bj). Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Ora.Dep. isto é. Carla Henriques e Manuel Reis 33 Tratamento Estatístico de Dados . se os atributos são independentes. as hipóteses anteriores podem ser formuladas do seguinte modo: H0: pij= pi⋅× p⋅j (para todo i e j) H1: pij≠ pi⋅× p⋅j (para algum i≠j).

número esperado de indivíduos na classe Ai de A e Bj de B. pij= pi⋅× p⋅j .e. a partir dos dados amostrais. por O ˆ pi• = i• n Notação: eij=n pij e ˆ p• j = O• j n . temos eij=n pij =n pi⋅× p⋅j ⎯⎯ ⎯ ⎯ → ⎯ estimado por ˆ ˆ ˆ e ij = n p i• p • j = O i• × O • j n Carla Henriques e Manuel Reis 34 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Os verdadeiros valores das probabilidades pi⋅ e p⋅j são estimadas. Quando H0 é verdadeira.Dep. i.

a diferença entre Oij (frequência observada) e e ij (estimativa da frequência esperada supondo a independência) não deve ser grande. que. ˆ Logo. a estatística teste. Assim. ˆ ˆ ˆ Vimos que quando H0 é verdadeira eij pode ser estimado por eij = n pi• p • j .Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência A estatística do teste de independência é então: χ2 = ∑ ∑ r s ˆ (Oij − eij )2 ˆ eij i=1 j=1 . Trata-se então de um teste unilateral à direita. tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1) graus de liberdade. mede o afastamento dos dados em relação à hipótese de independência. Carla Henriques e Manuel Reis 35 Tratamento Estatístico de Dados . sob o pressuposto de H0 ser verdadeira.

Existem três modos de efectuar os pagamentos: por cheque. A seguinte tabela de contingência 3×3 apresenta os resultados obtidos numa amostra de 4000 clientes: MODO DE PAGAMENTO Cheque Dinheiro Cartão de débito/Crédito PERÍODO DO DIA Manhã Tarde Noite 750 1500 750 125 300 75 125 200 175 Carla Henriques e Manuel Reis 36 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Exemplo: Um supermercado quer testar ao nível de significância de 5% a hipótese de que o modo de pagamento dos clientes nesse estabelecimento é independente do período do dia em que fazem as compras. dinheiro e cartão de débito/crédito.Dep.

as hipóteses as testar são H0: A e B são independentes H1: A e B não são independentes Uma vez que A e B assumem cada uma 3 modalidades.05.4)).CHI(0. Carla Henriques e Manuel Reis 37 Tratamento Estatístico de Dados .05. Ao nível de significância de 0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Denotando por A o atributo Modo de pagamento e por B o atributo Período do dia em que faz as compras.49. sob H0. a região crítica é então [9. a estatística teste tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1)=(3-1)(3-1)= 4 graus de liberdade.Dep. +∞[ (consulte tabela ou faça no EXCEL: INV.

M Carla Henriques e Manuel Reis 38 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência MODO DE PAGAMENTO Cheque Dinheiro Cartão de Crédito Totais PERÍODO DO DIA Manhã Tarde Noite 750 1500 750 125 300 75 125 200 175 1000 2000 1000 Totais 3000 500 500 4000 Oi• O • j Oi•O• j ˆ ˆ ˆ Cálculo das frequências esperadas: e ij = n p i• p • j =n = n n n ˆ e11 =(3000×1000)/4000=750 ˆ e12 =(3000×2000)/4000=1500 ˆ e13 =(3000×1000)/4000=750.Dep.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Frequências esperadas PERÍODO DO DIA Manhã Tarde Noite 750 1500 750 125 250 125 125 250 125 1000 2000 1000 MODO DE PAGAMENTO Cheque Dinheiro Cartão de Crédito Totais Valor observado da estatística teste: 2 Totais 3000 500 500 4000 (750 − 750 )2 (1500 − 1500 )2 (200 − 250 )2 (175 − 125 )2 + +.Dep. ao nível de significância de 0. Carla Henriques e Manuel Reis 39 Tratamento Estatístico de Dados .. rejeitamos a hipótese de que o modo de pagamento é independente do período do dia em que as compras são feitas. χ obs = 750 1500 250 125 Uma vez que 60 excede o valor crítico 9.+ + =60.49.05..

se for rejeitada a hipótese de independência entre os atributos. pode interessar medir a intensidade da associação entre os mesmos. Uma vez que a estatística do teste mede o afastamento em relação à hipótese de independência. através de uma medida adequada. Carla Henriques e Manuel Reis 40 Tratamento Estatístico de Dados . o seu valor observado poderá ser usado para avaliar o grau de associação entre os atributos.Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Medidas de Associação No teste do Qui-Quadrado apresentado.

Para obviar este problema. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Coeficiente de Contingência de Pearson: C = χ2 χ2 + n Este coeficiente varia entre 0 e assume o valor 1.s} e portanto nunca Valores pequenos de C indicam fraca associação entre os atributos. enquanto que valores grandes de C indicam forte associação. O facto deste coeficiente não assumir o valor 1 no caso de associação completa é uma sua limitação. Carla Henriques e Manuel Reis 41 Tratamento Estatístico de Dados . (q − 1) q onde q=min{r.Dep. Tshuprow propôs o seguinte coeficiente.

χ2 .s} Coeficiente V de Cramer: V = n(q − 1) 0≤V≤1.Dep. tomando o valor 0 no caso de existir independência e o valor 1 quando r=s e houver associação completa. Carla Henriques e Manuel Reis 42 Tratamento Estatístico de Dados . com q=min{r. Por último. referimos o coeficiente proposto por Cramer que atinge o valor 1 quando há associação completa. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência χ2 Coeficiente de Tshuprow: T = n (r − 1) × (s − 1) Este coeficiente varia entre 0 e 1.

Carla Henriques e Manuel Reis 43 Tratamento Estatístico de Dados .816. calculam-se os coeficientes que acabámos de descrever.s}=3. Coeficiente de Contingência de Pearson: C = χ2 χ2 + n = 60 = 0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Para o exemplo anterior.122 60 + 4000 0≤C≤ (q − 1) q . rejeitámos a hipótese de independência entre o modo de pagamento e o período do dia em que as compras eram efectuadas.Dep.e. onde q=min{r. Para ter uma ideia da intensidade de associação entre estes dois atributos. i. 0 ≤C≤ 0.

esta pode considerar-se fraca. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Coeficiente de Tshuprow: T= χ2 n (r − 1) × (s − 1) = 60 =0.087 4000 × 2 Verificamos. Carla Henriques e Manuel Reis 44 Tratamento Estatístico de Dados .Dep.087 4000 2 × 2 χ2 Coeficiente V de Cramer: V = = n(q − 1) 60 =0. então. que apesar de haver associação entre os atributos.

..s) Or1 Or2 ...... Carla Henriques e Manuel Reis 45 Tratamento Estatístico de Dados .. Bs . Bs O11 O12 . nas quais se observa um atributo A com r categorias A1. Ors número de elementos da amostra da população Bj classificados na categoria Ai de A. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Teste de Homogeneidade Suponha que são recolhidas amostras aleatórias de s populações (sub-populações ou estratos) B1. Ar. A2. O2s M M O M Ar Oij (i=1. O1s O21 O22 ..... B2.... Neste contexto.........Dep. surge também uma tabela de contingência r×s: A1 A2 M B1 B2 .r e j=1..

. Neste caso. isto é..s) i=1 r tamanho da amostra recolhida na população Bj.. • O⋅j = ∑ Oij (j=1...Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Sejam: • Oi⋅ = ∑ Oij (i=1.. se não há diferença entre as populações no modo como os seus elementos se distribuem pelas modalidades do atributo A.. e o que se pretende saber é se existe homogeneidade.r) j=1 s nº de elementos na categoria Ai de A em todas as amostras. cada Bj rotula uma sub-população cujos elementos se distribuem pelas r modalidades do atributo A.. Carla Henriques e Manuel Reis 46 Tratamento Estatístico de Dados .

Dep. conduzindo à rejeição desta. Assim. que. a estatística do teste é χ2 = ∑ ∑ r s ˆ (Oij − eij )2 ˆ eij i=1 j=1 . Carla Henriques e Manuel Reis 47 Tratamento Estatístico de Dados . tem distribuição assimptótica do Qui-Quadrado com (r-1)(s-1) graus de liberdade. Valores muito grandes da estatística de teste traduzem um grande afastamento dos dados em relação à hipótese nula. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência À semelhança do teste de independência. a estatística de teste mede o afastamento dos dados em relação à hipótese de homogeneidade. sob o pressuposto de H0 ser verdadeira.

isto é. . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Para aplicar os testes de independência e de homogeneidade devem ser seguidas as mesmas regras que vimos para o teste de ajustamento do Quiquadrado. Carla Henriques e Manuel Reis 48 Tratamento Estatístico de Dados .mais de 20% das frequências esperadas. se tivermos: . inferiores a 5 ou.Dep.alguma frequência esperada inferior a 1 devemos proceder à agregação de algumas classes contíguas. ei’s.

Carla Henriques e Manuel Reis 49 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Teste exacto de Fisher O teste do Qui-quadrado é. a distribuição da estatística é exacta (os pontos críticos e valores-p são calculados de forma exacta).e. o que portanto limita a sua aplicação ao caso de grandes amostras (recorde as limitações sobre as frequências esperadas). baseado numa distribuição assimptótica. como já se disse. existe uma alternativa ao teste do Qui-quadrado.. i. o teste de Fisher.Dep. que é um teste exacto. Em tabelas de contingência 2x2.

pretende-se testar a hipótese H0 de que as duas distribuições populacionais são idênticas. as duas amostras podem ser consideradas como provenientes de populações com a mesma distribuição. Hipóteses a testar: H0: As duas amostras são retiradas de populações com a mesma distribuição H1: As duas amostras são retiradas de populações com distribuições diferentes Carla Henriques e Manuel Reis 1 Tratamento Estatístico de Dados .Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes AJUSTE ENTRE DUAS AMOSTRAS INDEPENDENTES Objectivo: Dadas duas amostras aleatórias e independentes provenientes de duas populações. isto é.

Por outras palavras.. não há diferença entre as duas populações no modo como os seus elementos se distribuem pelas diversas classes. isto é. Carla Henriques e Manuel Reis 2 Tratamento Estatístico de Dados .. as duas populações são homogéneas.Dep.Am. Trata-se então do teste do Qui-quadrado de homogeneidade para duas populações (s=2). A hipótese H0 que se pretende testar é a de que as duas populações em estudo têm a mesma distribuição. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes Teste do Qui-quadrado Os valores possíveis da característica em estudo são repartidos por m classes mutuamente exclusivas A1. A2...

Carla Henriques e Manuel Reis 3 Tratamento Estatístico de Dados . Estatística de teste: D ' = sup S A ( x) − S B ( x) − ∞ < x < +∞ Para um nível de significância α. Se não se registarem diferenças significativas. a hipótese H0 é rejeitada se o valor observado da estatística de teste for superior ao ponto crítico D'α (a ser consultado numa tabela). entre as proporções de valores inferiores ou iguais a x observadas em cada amostra. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes Teste de Kolmogorov-Smirnov Este teste aplica-se a distribuições contínuas. SA(x)–SB(x). não é rejeitada a hipótese nula de que as duas amostras provêm de populações com a mesma distribuição. Comparam-se as frequências relativas acumuladas registadas nas duas amostras (digamos A e B). em valor absoluto.Dep. A estatística de teste considera a maior das diferenças.

VALORES N. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes Exemplo: Registaram-se os valores de uma análise feita a 80 indivíduos com a variante A de uma dada doença.º indivíduos 20 2 22 3 23 9 26 12 29 27 30 16 31 7 33 2 34 2 Seleccionaram-se aleatoriamente 70 indivíduos com a variante B da mesma doença.01) Carla Henriques e Manuel Reis 4 Tratamento Estatístico de Dados . Os valores da análise para estes 70 indivíduos estão registados seguidamente.º indivíduos 23 1 24 2 26 3 28 6 30 15 31 20 32 13 33 4 34 3 36 2 38 1 Pode-se admitir que a distribuição dos valores da análise é a mesma para as duas variantes da doença? Servirá esta análise como meio de diagnostico da variante A ou B desta doença? (Use α=0.Dep. obtendo-se os seguintes resultados VALORES N.

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes

Variante A:
VALORES N.º indivíduos Freq. acumuladas SA(x) 20 2 2 2/80 22 23 26 29 30 31 33 3 9 12 27 16 7 2 5 14 26 53 69 76 78 5/80 14/80 26/80 53/80 69/80 76/80 78/80 34 2 80 1

Variante B:
VALORES N.º indivíduos Freq. acumuladas SB(x) 23 1 1 1/70 24 2 3 3/70 26 3 28 6 30 15 31 20 32 13 33 4 34 3 36 2 38 1 70 1

6 12 27 47 60 64 67 69 6/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70

Carla Henriques e Manuel Reis
5

Tratamento Estatístico de Dados

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes

Cálculo do valor observado da estatística de teste:

Valores

20

22

23

24

26

28

29

30

31

32

33

34

36

38
1 1 0

2/80 5/80 14/80 14/80 26/80 26/80 53/80 69/80 76/80 76/80 78/80 1 1 SA(x) 0 0 1/70 3/70 6/70 12/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 SB(x) |SA(x)- SB(x)| 0,025 0,063 0,161 0,132 0,239 0,154 0,491 0,477 0,279 0,093 0,061 0,043 0,014

O valor observado da estatística de teste é então D’obs=0.491. 80 + 70 = 0.267 . 80 × 70

Para α=0.01, o ponto crítico é (consulte tabela): 1.63

Carla Henriques e Manuel Reis
6

Tratamento Estatístico de Dados

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes

Dado que o valor observado da estatística de teste é 0.491>0.267, então rejeita-se a hipótese nula de as duas variantes da doença não se distinguirem quanto à distribuição dos valores da análise. Há portanto evidência estatística, ao nível de significância de 0.01, de que os valores da análise de distribuem de forma diferente na variante A e B da doença.

Carla Henriques e Manuel Reis
7

Tratamento Estatístico de Dados

pretende-se testar a hipótese H0 de que as distribuições populacionais são idênticas. Carla Henriques e Manuel Reis 1 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis TESTE DE KRUSKAL-WALLIS Objectivo: Dadas k populações nas quais se estuda uma característica comum e de onde foram extraídas k amostras aleatórias e independentes.Dep. quando os pressupostos desta não podem ser verificados. isto é. as k amostras podem ser consideradas como provenientes de populações com a mesma distribuição. a ser abordada mais tarde. Nota: O teste de Krukal-Wallis constitui uma alternativa à análise de variância com um factor.

Dep. Carla Henriques e Manuel Reis 2 Tratamento Estatístico de Dados . isto é. Por esta razão as hipóteses são geralmente formuladas em termos das médias ou das medianas populacionais. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Hipóteses a testar: H0: As k amostras são retiradas de populações com a mesma distribuição H1: As k amostras não são retiradas de populações com a mesma distribuição. há pelo menos duas populações com distribuições diferentes O teste de Kruskal-Wallis é particularmente sensível a diferenças nas medidas de localização.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Notação: µi média da i-ésima população mediana da i-ésima população (as médias populacionais são iguais para as k populações) (há pelo menos duas populações com médias diferentes) Mi H0: µ1=µ2=…=µk H1: µi≠µj . i≠j (há pelo menos duas populações com medianas diferentes) Carla Henriques e Manuel Reis 3 Tratamento Estatístico de Dados . i≠j H0: M1=M2=…=Mk (as k medianas populacionais são iguais) H1: Mi=Mj .Dep.

k). Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Notação: ni ..a j-ésima observação da amostra da população i..o tamanho da amostra retirada da população i (i=1. ou posto. 1 e a observação maior com o posto N)..nº total de observações. Rij. ou posto. Xij . para cada população i determina-se o valor Ri da soma dos postos das observações correspondentes a esse grupo populacional: Ri = ∑ Rij j =1 ni Carla Henriques e Manuel Reis 4 Tratamento Estatístico de Dados . Procedimento: i =1 k ordenam-se todas as observações por ordem crescente dos seus valores. a cada observação Xij (a observação mais pequena fica com o nº de ordem. atribui-se um nº de ordem.Dep. N = ∑ ni .

3. Neste caso. que deve ser atribuído a cada valor empatado deve ser a média dos números de ordem que seriam atribuídos a estes valores se não estivessem empatados.5. suponhamos que ordenando os valores observados obtínhamos 100.5. 6. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Quando há empates nos valores observados. 102. Carla Henriques e Manuel Reis 5 Tratamento Estatístico de Dados .Dep. 102.5. 104. 3. o número de ordem. 1. 103. ou posto. Por exemplo. 5. 6. os números de ordem seriam respectivamente. 8. 3. 103. 102. 102.

exacta da estatística H..k.. H tem aproximadamente 2 distribuição χ k −1 ... Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Quando não há empates nos valores observados das amostras. consultar tabela desta distribuição.. Pontos críticos: o Se k=3 e ni≤5 para todo i=1..Dep. a estatística de teste é: k R2 12 H= ∑ i − 3(N + 1) N(N + 1) i=1 ni A hipótese nula deve ser rejeitada se o valor observado da estatística H for muito grande.e... ou o nº de empates é muito pequeno. Carla Henriques e Manuel Reis 6 Tratamento Estatístico de Dados . i. sob H0. consultar tabela da distribuição o Se ni≥5 para todo i=1..k. superior ao ponto crítico (teste unilateral à direita). sob H0.

Carla Henriques e Manuel Reis 7 Tratamento Estatístico de Dados .k.Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Quando há muitos empates nos valores observados das amostras a estatística de teste a usar deve ser: 1 ⎡ k Ri2 N(N + 1)2 ⎤ H'= 2 ⎢ ∑ − ⎥ 4 S ⎣i=1 ni ⎦ onde... sob H0... H’ tem aproximadamente 2 distribuição χ k −1 . 1 ⎡ k ni 2 N(N + 1)2 ⎤ S = ⎢ ∑ ∑ Rij − ⎥ N − 1 ⎣i=1 j=1 4 ⎦ 2 Pontos críticos: o Se ni≥5 para todo i=1. consultar tabela desta distribuição.

Após algumas aulas.05) Carla Henriques e Manuel Reis 8 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Exemplo: Para avaliar o mérito de três métodos de ensino diferentes. Método 1 15 12 18 20 10 Método 2 21 16 13 9 Método 3 11 19 17 22 24 Será possível afirmar que os métodos de ensino produzem resultados diferentes no que diz respeito à rapidez de um aluno para resolver um problema? (Use α=0. Em cada turma utilizou-se um método de ensino diferente. pediu-se a cada estudante que resolvesse o mesmo problema. Os tempos respectivos (em minutos) constam do quadro seguinte.Dep. cada um de 14 estudantes foi aleatoriamente matriculado em uma de três turmas.

ensino) a que pertencem. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Ordenam-se as observações.Dep.Rij Grupo (mét. registando o grupo (mét. e determina-se o posto de cada uma: 9 1 2 10 11 12 13 15 16 17 18 19 20 21 22 24 2 1 3 3 4 1 5 2 6 1 7 2 8 3 9 1 10 11 12 13 14 3 1 2 3 3 Observação Posto .) R1=2+4+6+9+11=32 R2=1+5+7+12=25 R3=3+8+10+13+14=48 Carla Henriques e Manuel Reis 9 Tratamento Estatístico de Dados .

05: 5. não há evidência estatística de que o tipo de método de ensino influencie o desempenho dos estudantes na resolução de problemas. + + valor observado é: Hobs= 14(14 + 1) ⎜ 5 4 5 ⎟ ⎝ ⎠ Consultando a tabela da distribuição exacta de H. Carla Henriques e Manuel Reis 10 Tratamento Estatístico de Dados .963. não se rejeita a hipótese nula dos três métodos de ensino produzirem efeitos idênticos.963<5. sob H0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis k R2 12 Não havendo empates. retira-se o ponto crítico para α=0.6429.Dep.6429. a estatística de teste é H= ∑ i − 3(N + 1) cujo N(N + 1) i=1 ni ⎛ 32 2 25 2 48 2 ⎞ 12 ⎜ ⎟ − 3(14 + 1) = 1. Por outras palavras. Dado que Hobs=1.

i.. calcula-se o posto médio R i .….e.Dep. dividindo a soma dos postos Ri pelo tamanho da amostra ni. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Testes de Comparações múltiplas Quando rejeitamos a hipótese H0. surge a questão de identificar onde se encontram as diferenças. quais são as amostras onde se encontram diferenças significativas. Determinam-se as diferenças absolutas entre cada par de postos médios Ri − R j . Para isso temos de comparar cada par de amostras da seguinte maneira: para cada amostra.j=1.k Carla Henriques e Manuel Reis 11 Tratamento Estatístico de Dados . i.

então.k −1 ⎜ ⎟⎜ ⎜ ⎝ 12 1 1⎞ + ⎟ ⎠⎝ n i n j ⎟ ⎠ 2 onde. considera-se significativa a diferença entre as amostras i e j. evidência de existirem diferenças entre as populações de onde se extraíram estas amostras. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Cada diferença absoluta R i − R j é comparada com o valor crítico c ij = ⎛ N( N + 1) ⎞⎛ 2 χ α .k −1 é o ponto crítico usado para o teste de Kruskal-Wallis. Se R i − R j > c ij . havendo. χ α. portanto. Carla Henriques e Manuel Reis 12 Tratamento Estatístico de Dados .Dep.

Sign up to vote on this title
UsefulNot useful