Dep.

Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS

Testes Não Paramétricos
Nos testes abordados até agora, ditos testes paramétricos, as hipóteses envolvem apenas parâmetros populacionais, como a média, a variância, uma proporção, etc. Além disso, em geral, estes testes comportam uma diversidade de suposições fortes a que o seu emprego deve subordinar-se de que são exemplo: as observações devem ser extraídas de populações com distribuição especificada; as variáveis em estudo devem ser medidas em escala intervalar ou de rácios, de modo a que seja possível utilizar operações aritméticas sobre os valores obtidos das amostras (adição, multiplicação, ...), etc.
Carla Henriques e Manuel Reis
1

Tratamento Estatístico de Dados

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS

Vamos agora abordar um conjunto de testes que nos permitem testar outro tipo de hipóteses que não apenas sobre parâmetros populacionais (e.g., se a distribuição populacional em estudo pode ser considerada Normal). Estes são chamados testes não paramétricos. Estes testes são, em geral, fáceis de aplicar, pois podem ser usados quando as hipóteses exigidas por outras técnicas não são satisfeitas. Apesar de haver certas suposições básicas associadas à maioria das provas não paramétricas, essas suposições são em menor número e mais fracas do que as associadas às provas paramétricas. A maior parte das provas não paramétricas servem para pequenas amostras e, além disso, aplicam-se a dados medidos em escala ordinal, e alguns mesmo a dados em escala nominal.

Carla Henriques e Manuel Reis
2

Tratamento Estatístico de Dados

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento

Testes de Ajustamento (testes da bondade do ajustamento)
Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição especificada.

Hipóteses a testar: H0: a amostra provém de uma população com distribuição especificada H1: a população de onde provém a amostra não segue a distrib. especificada

Carla Henriques e Manuel Reis
3

Tratamento Estatístico de Dados

8 -0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Exemplo: Pretende-se construir um modelo de simulação das operações de um determinado terminal de um porto situado na Europa.1. 7.Dep.2 2.2 -2.4 -8.9 -5.4 -7.6 15. Uma amostra de 30 navios revelou seguinte.2 -9 13.6 -3. Será mesmo de admitir que tais dados foram extraídos de uma pop.3 15 -7.6 2.8 4.2 7.4 2. -6.7 -2. N(0.6 -0.8 -1.2.8 8. Há razões para supor que tal diferença é uma variável aleatória com distribuição Normal de média 0.8 1.1 e desvio padrão 7. Uma das variáveis a considerar no modelo é a diferença entre a data de chegada dos navios provenientes dos EUA e a respectiva data planeada.4 12.4 -6 -5.6 -2 5 2.2)? Carla Henriques e Manuel Reis 4 Tratamento Estatístico de Dados .6 os resultados que se apresentam na tabela -1.2 4 Diferença entre a data de chegada e a data planeada para 30 navios.

Dep. entre os quais: o Teste de Ajustamento do Qui-quadrado sugerido por Karl Pearson. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Neste exemplo. o teste de Kolmogorov ou Kolmogorov-Smirnov e o teste de normalidade de Lilliefors. Carla Henriques e Manuel Reis 5 Tratamento Estatístico de Dados . Existem vários testes de ajustamento que nos permitem fazer uma análise de problemas deste tipo. estamos perante um problema de ajustamento de dados a uma determinada distribuição. que apresentamos a seguir.

Dep. Os valores possíveis da característica em estudo são.. . . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Teste do Qui-quadrado Considere-se uma amostra aleatória de n elementos. Am (serão intervalos da recta real se a característica é quantitativa e contínua). A1. sobre os quais se observa uma característica (qualitativa ou quantitativa).. num primeiro passo. repartidas por m classes mutuamente exclusivas. extraída de uma população com distribuição desconhecida. A2. Carla Henriques e Manuel Reis 6 Tratamento Estatístico de Dados .

m H1: pi≠p0i para algum i Carla Henriques e Manuel Reis 7 Tratamento Estatístico de Dados . . i=1.pi a probabilidade desconhecida de obter uma observação na classe Ai. assumindo que a observação foi extraída de uma população com a distribuição especificada em H0.. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Denote-se por: ..Oi o nº de observações ou frequência absoluta observada da classe Ai. . Hipóteses a testar: H0: pi=p0i .Dep..p0i a probabilidade de obter uma observação na classe Ai ..

Carla Henriques e Manuel Reis 8 Tratamento Estatístico de Dados . é dada por ei = n×p0i. estimados a partir da amostra. A estatística de teste. tem distribuição assimptótica do Quiquadrado com m-k-1 graus de liberdade (χ2m-k-1). Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Assim. é dada por Q=∑ m (Oi − ei )2 ei i=1 que. do teste de ajustamento do Qui-quadrado. a frequência esperada da classe Ai. sendo verdadeira a hipótese nula.Dep. quando H0 é verdadeira. onde k é o número de parâmetros desconhecidos da distribuição proposta em H0.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Se a hipótese nula for verdadeira. Carla Henriques e Manuel Reis 9 Tratamento Estatístico de Dados .Dep. quanto maior for o valor observado de Q. a estatística de teste terá um valor observado. também não muito grande. mais nos encaminhamos de concluir que as frequências observadas não foram provenientes da população em que se baseou a hipótese nula. não deve ser muito grande e. isto é. a diferença entre cada valor observado e o respectivo valor esperado. Oi–ei. Trata-se portanto de um teste unilateral à direita. levando à rejeição desta. Qobs. De modo intuitivo. menos plausível é a hipótese nula. consequentemente.

São referidas na literatura várias regras práticas de aplicação do teste.alguma classe com ei inferior a 1 devemos proceder à agregação de algumas classes contíguas. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Na aplicação deste teste deve-se ter particular atenção às frequências esperadas. das quais avançamos a seguinte. e iniciar novamente o teste. . Carla Henriques e Manuel Reis 10 Tratamento Estatístico de Dados .Dep. ei’s.mais de 20% das classes com ei inferior a 5 ou. agora com menos classes. pois se estas forem muito pequenas a aproximação ao Qui-quadrado não é a mais apropriada. Se tivermos: .

i=1. deste modo. a2[ A3=[ a2. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Retomemos o exemplo exposto atrás.. +∞[. A2=[ a1. 7. Carla Henriques e Manuel Reis 11 Tratamento Estatístico de Dados .22) H1: X ~ N(0.. Am=[ am-1. Exemplo: Denotando por X a diferença entre a data de chegada dos navios e a data planeada. as classes Ai. as hipóteses a testar são H0: X ~ N(0. são intervalos da forma A1=]-∞.m..Dep.22) / Neste caso a distribuição proposta em H0 é contínua e.. a1[.1. a3[ .. 7.1.

Dep.2.4. para i=1.5>5). Carla Henriques e Manuel Reis 12 Tratamento Estatístico de Dados . Assim. Os limites dos intervalos são tais que as probabilidades decorrentes da hipótese nula sejam iguais a 1/m para todas as classes. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Para a determinação das classes é sugerida a regra de Mann e Wald: Número de classes = m. Para o exemplo escolheu-se m=4 classes (ei=30/4=7.3. donde p0i = P(Ai\H0) = 1/4. com m tal que n/m>5. as frequências esperadas são todas iguais a n/m>5.

1.25.25 ⇔ a3=4.75.NORM(0.1)= -4.1.724 (EXCEL: INV.1 e a1=0. 1/4 1/4 1/4 1/4 a1 a2 =0.1 a3 Da simetria da distribuição normal: a2=0.0.7.1-(4. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Cálculo dos limites dos intervalos de classe: a3: p03 = 0.0.NORM(0.924-0.2)).7.Dep.96 (EXCEL: INV.2)) Carla Henriques e Manuel Reis 13 Tratamento Estatístico de Dados .

2 7.96.1[ A3=[0.4 -1.6 -3.4 -1.5 ) 2 ( 7 − 7 . 4.5 ) 2 ( 7 − 7 .8 15.13 7 .1.4 -9 5 -6 13.25 0.7 2.9 1.2 -2 12.5 Carla Henriques e Manuel Reis 14 Tratamento Estatístico de Dados .5 7. -4.Dep.5 7.5 ) 2 ( 8 − 7 .5 7 . +∞ [ Frequências observadas 8 8 7 7 Frequências esperadas 7.5 7.4 8.8 p0i 0.6 -2. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento -6.25 0.6 -7.5 ) 2 Qobs= + + + = 0.25 -7.2 4 Classes A1=]-∞.8 -5.2 2.5 7 .6 2.0.76.25 0.96[ A4=[4.3 -2.76[ A2=[-4.6 -5.8 15 -8.5 O valor observado da estatística de teste é ( 8 − 7 .8 -0.5 7 .4 -0.2 2.6 4.

tem aproximadamente distribuição Qui-quadrado com m-1=4-1=3 graus de liberdade.CHI(0. 7. Para α=0..1. somos levados a não rejeitar a hipótese de que a diferença entre os tempos de chegada e os tempos planeados tem distribuição N(0.3)) Como Qobs ∉R.05.C.=[7. sob o pressuposto de H0 ser verdadeira. Carla Henriques e Manuel Reis 15 Tratamento Estatístico de Dados .81. +∞[ .Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento A estatística teste.81=INV.C.22). (EXCEL: 7.05: R.

De facto. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Teste de Kolmogorov-Smirnov (K-S) O teste de Kolmogorov-Smirnov (K-S) ao contrário do teste do Qui-quadrado. tem a vantagem de não estar dependente de classificações dos dados. pois a tabela disponível para este teste só é exacta caso a distribuição em teste seja contínua. no ajustamento de uma distribuição contínua a uma amostra usando o teste do Qui-quadrado. Carla Henriques e Manuel Reis 16 Tratamento Estatístico de Dados . temos de proceder à agregação dos dados em classes. sendo por isso mais adequado utilizar o teste K-S. não se aplica a dados qualitativos nem a variáveis discretas.Dep. que além de serem sempre algo arbitrárias envolvem perdas de informação. No entanto.

enquanto que o teste K-S é aplicável a pequenas amostras. podemos recorrer a outro teste. o teste K-S só pode ser aplicado quando a distribuição indicada na hipótese nula está completamente especificada (o que não sucede com o teste do Qui-quadrado). sem especificar µ e σ. Além disso. Carla Henriques e Manuel Reis 17 Tratamento Estatístico de Dados . o teste do Qui-Quadrado está orientado essencialmente para grandes amostras. por exemplo. neste caso o teste desenvolvido por Lilliefors (teste de normalidade de Lilliefors) que será abordado mais tarde.Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Por outro lado. efectuar um ajustamento de uma distribuição normal. No caso de pretendermos.

Dep. contínua e completamente especificada. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Seja F a função de distribuição da população em estudo e F0 a função de distribuição proposta. Carla Henriques e Manuel Reis 18 Tratamento Estatístico de Dados . para qualquer x H1: F(x)≠F0(x). para algum x No teste de Kolmogorov-Smirnov comparam-se as frequências relativas acumuladas registadas na amostra com as que se esperariam se a distribuição populacional fosse a especificada na hipótese nula. Hipóteses a testar: H0: F(x)=F0(x).

S(x). e a probabilidade de se observar um valor inferior ou igual a x se a distribuição populacional for a especificada em H0. F0(x): Dn = − ∞ < x < +∞ sup S ( x) − F0 ( x) F0(x) S (x) Carla Henriques e Manuel Reis 19 Tratamento Estatístico de Dados . em valor absoluto. entre a proporção de observações inferiores ou iguais a x.Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento A Estatística do teste de K-S considera a maior das diferenças.

Carla Henriques e Manuel Reis 20 Tratamento Estatístico de Dados . e logo espera-se que Dn. rejeita-se H0. i =1. a distância vertical máxima entre as imagens das duas distribuições não deve de ser muito grande..α (os valores críticos Dn. se H0 for verdadeira..obs tome um valor pequeno. para um nível de significância α.. o supremo ocorre num ponto onde se verifica um salto de S : Dn. n Assim.Dep. Então. F0 ( xi ) − S ( xi −1 ) }.. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Uma vez que F0 é uma função (contínua) não decrescente e S é uma função em escada.obs = max { F0 ( xi ) − S ( xi ) . se o valor observado for superior ou igual ao ponto crítico Dn.α podem ser consultados numa tabela).

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Exemplo: Acredita-se que o tempo despendido na execução de uma determinada tarefa é uma variável aleatória com distribuição normal de média 290 minutos e desvio padrão 56 minutos.Dep. Foram registados os tempos despendidos em 10 tarefas seleccionadas ao acaso. tendo-se registado o seguinte: 198 254 262 272 275 278 285 287 287 292 Ao nível de significância de 5%. há evidência para rejeitar a hipótese de normalidade da referida variável? Carla Henriques e Manuel Reis 21 Tratamento Estatístico de Dados .

neste caso. As hipóteses a testar são.05= 0. Para calcular o valor observado da estatística de teste.05. H0: X∼N(290. D10.0. 562) H1: X ~ N(290. para α=0. / O ponto crítico da estatística de teste D10 é. começa-se por ordenar os valores da amostra por ordem crescente. Carla Henriques e Manuel Reis 22 Tratamento Estatístico de Dados . 562).409 (consulte a tabela). Os cálculos estão efectuados na tabela seguinte. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Denote-se por X o tempo despendido na execução de uma tarefa.Dep.

06 0.106 0.7 0.2602 0.VERDADEIRO) 198 254 262 272 275 278 285 287 292 xi S(xi) 0.185 0.0739 0.3944 0.NORM(198.9 0.3858 Como D10.4644 0.4786 0.3085 0.9 1 S(xi-1) 0 0.2 0.56.3739 0.290.obs =0.6 0.4 0.1602 0.1 0. Carla Henriques e Manuel Reis 23 Tratamento Estatístico de Dados .009 0.1356 0.6 0.3 0.2 0.3 0.409. rejeitamos a hipótese de o tempo despendido na execução de uma tarefa seguir distribuição N(290.486 |F0(xi).0848 0.1085 0.486>0.026 0. ao nível de significância de 5%.7 0.236 0.5 0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento EXCEL: DIST.0502 0.2214 0.5142 F0(xi) |F0(xi).4 0.0056 0.05 0.4152 0.S(xi-1)| 0.0502 0.5 0.Dep.S(xi) | 0. 562).1 0.421 0.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Teste de Normalidade Lilliefors Pretende-se testar se uma dada variável aleatória X tem distribuição N(µ. Hipóteses a testar H0: X ~ N(µ. isto é. para algum µ e algum σ. σ2) / Este teste processa-se como o teste de K-S. Carla Henriques e Manuel Reis 24 Tratamento Estatístico de Dados .Dep. x e s. usando estimativas de µ e σ. Os pontos críticos são consultados na tabela elaborada por Lilliefors. σ2) sem especificar µ e σ. σ2) H1: X ~ N(µ. respectivamente.

e além disso. a dimensão da amostra é muito pequena (n=5). 33. Foi recolhida uma amostra aleatória de cinco tempos: 29. 35. 36 e 36.Dep. n onde t: P(-t<T<t) =λ. O senhor quer estimar o tempo médio pretendido através de um intervalo de confiança. mas nada sabe acerca da distribuição do tempo de entrega X. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Exemplo: Um distribuidor pretende estimar o tempo médio de entrega dos seus produtos a um cliente bastante importante. o intervalo pode ser calculado usando a fórmula: X mt Carla Henriques e Manuel Reis S . Poderá fazê-lo? Sabemos que caso a distribuição subjacente aos dados seja normal. T ~ tn-1 Tratamento Estatístico de Dados 25 .

σ2) / Uma vez que nada sabemos acerca de µ e σ. podemos utilizar o teste de Lilliefors.337 (consulte a tabela). em primeiro lugar.Dep. as hipóteses H0: X ~ N(µ.8 s=2. Carla Henriques e Manuel Reis 26 Tratamento Estatístico de Dados . 0. O valor crítico da estatística teste.95 .05 é * D5. interessa testar. recorrendo às estimativas x =33.05 =0. ao nível de significância de 0. σ2) H1: X ~ N(µ. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento Assim.

2 0.4 0.0519 0.2.4 0.S(xi) | 0.1481 0.S(xi-1)| 0.6 F0(xi) 0. obs =0. ao nível se significância de 5%. Carla Henriques e Manuel Reis 27 Tratamento Estatístico de Dados .VERDADEIRO) Cálculo do valor observado da estatística de Teste: xi 29 33 35 36 S(xi) 0.2579 0.0579 0. então.1721 * Como D5.3931 0.95.772 |F0(xi).337.1931 0.2 0.8.0519 0.0069 0.2279 |F0(xi).2579<0.NORM(29.Dep.6579 0.33.6 1 S(xi-1) 0 0. não rejeitamos a hipótese de a população em estudo ter distribuição normal. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento EXCEL: DIST.

. Bs... Ar e B1. Carla Henriques e Manuel Reis 28 Tratamento Estatístico de Dados .Dep.... Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Tabelas de Contingência Teste do Qui-quadrado de Independência Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas). B2. A2. uma com r e outra com s modalidades ou categorias... respectivamente A1.

.. O2s M M O M A1 A2 M Ar Oij (i=1.. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Cada indivíduo da amostra é classificado numa e numa só categoria (ou classe) de A e numa e numa só categoria (ou classe) de B.. com o seguinte aspecto: B1 B2 .s) Or1 Or2 . A classificação dos elementos da amostra dá origem a uma tabela de dupla entrada. designada por tabela de contingência r×s... Bs O11 O12 .....r e j=1...Dep. numa amostra de tamanho n... Carla Henriques e Manuel Reis 29 Tratamento Estatístico de Dados . Ors número de elementos classificados simultaneamente nas categorias Ai de A e Bj de B.. O1s O21 O22 ..

. • O⋅j = ∑ Oij (j=1...Dep. Carla Henriques e Manuel Reis 30 Tratamento Estatístico de Dados .s) i=1 r nº de elementos na amostra com modalidade Bj... Tem-se... n = ∑ ∑ Oij =∑ Oi• = ∑ O • j i=1 j=1 i=1 j=1 r s r s onde n é a dimensão da amostra.r) j=1 s nº de elementos na amostra com modalidade Ai. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Sejam: • Oi⋅ = ∑ Oij (i=1..

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência O objectivo a que nos propomos é o de tentar inferir sobre a existência ou não de qualquer relação ou associação entre os atributos (variáveis) A e B.Dep. inferir se A e B são ou não independentes. Hipóteses a testar: H0: A e B são independentes H1: A e B não são independentes Carla Henriques e Manuel Reis 31 Tratamento Estatístico de Dados . mais concretamente.

.. 1 = ∑ ∑ pij =∑ pi• = ∑ p • j .... Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Denote-se por: • pij=P(Ai∩Bj) (i=1.r e j=1.... • pi⋅=P(Ai) (i=1..s) a probabilidade (desconhecida) de um indivíduo da população ser classificado simultaneamente nas categorias Ai de A e Bj de B. • p⋅j=P(Bj) (j=1.r) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria Ai de A.Dep. i=1 j=1 i=1 j=1 r s r s Carla Henriques e Manuel Reis 32 Tratamento Estatístico de Dados .s) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria Bj de B.......

Carla Henriques e Manuel Reis 33 Tratamento Estatístico de Dados . pij= pi⋅× p⋅j Assim. isto é. se os atributos são independentes.Dep. P(Ai∩Bj) = P(Ai) P(Bj). Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Ora. verifica-se a conhecida relação. as hipóteses anteriores podem ser formuladas do seguinte modo: H0: pij= pi⋅× p⋅j (para todo i e j) H1: pij≠ pi⋅× p⋅j (para algum i≠j).

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Os verdadeiros valores das probabilidades pi⋅ e p⋅j são estimadas. a partir dos dados amostrais. número esperado de indivíduos na classe Ai de A e Bj de B. por O ˆ pi• = i• n Notação: eij=n pij e ˆ p• j = O• j n . i. pij= pi⋅× p⋅j .e. Quando H0 é verdadeira.Dep. temos eij=n pij =n pi⋅× p⋅j ⎯⎯ ⎯ ⎯ → ⎯ estimado por ˆ ˆ ˆ e ij = n p i• p • j = O i• × O • j n Carla Henriques e Manuel Reis 34 Tratamento Estatístico de Dados .

sob o pressuposto de H0 ser verdadeira. Assim. mede o afastamento dos dados em relação à hipótese de independência. ˆ Logo. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência A estatística do teste de independência é então: χ2 = ∑ ∑ r s ˆ (Oij − eij )2 ˆ eij i=1 j=1 . a estatística teste. a diferença entre Oij (frequência observada) e e ij (estimativa da frequência esperada supondo a independência) não deve ser grande. Trata-se então de um teste unilateral à direita.Dep. Carla Henriques e Manuel Reis 35 Tratamento Estatístico de Dados . ˆ ˆ ˆ Vimos que quando H0 é verdadeira eij pode ser estimado por eij = n pi• p • j . que. tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1) graus de liberdade.

Dep. A seguinte tabela de contingência 3×3 apresenta os resultados obtidos numa amostra de 4000 clientes: MODO DE PAGAMENTO Cheque Dinheiro Cartão de débito/Crédito PERÍODO DO DIA Manhã Tarde Noite 750 1500 750 125 300 75 125 200 175 Carla Henriques e Manuel Reis 36 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Exemplo: Um supermercado quer testar ao nível de significância de 5% a hipótese de que o modo de pagamento dos clientes nesse estabelecimento é independente do período do dia em que fazem as compras. dinheiro e cartão de débito/crédito. Existem três modos de efectuar os pagamentos: por cheque.

+∞[ (consulte tabela ou faça no EXCEL: INV. Carla Henriques e Manuel Reis 37 Tratamento Estatístico de Dados . a estatística teste tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1)=(3-1)(3-1)= 4 graus de liberdade.4)).05. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Denotando por A o atributo Modo de pagamento e por B o atributo Período do dia em que faz as compras.05. Ao nível de significância de 0.CHI(0. a região crítica é então [9. sob H0.49.Dep. as hipóteses as testar são H0: A e B são independentes H1: A e B não são independentes Uma vez que A e B assumem cada uma 3 modalidades.

Dep. M Carla Henriques e Manuel Reis 38 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência MODO DE PAGAMENTO Cheque Dinheiro Cartão de Crédito Totais PERÍODO DO DIA Manhã Tarde Noite 750 1500 750 125 300 75 125 200 175 1000 2000 1000 Totais 3000 500 500 4000 Oi• O • j Oi•O• j ˆ ˆ ˆ Cálculo das frequências esperadas: e ij = n p i• p • j =n = n n n ˆ e11 =(3000×1000)/4000=750 ˆ e12 =(3000×2000)/4000=1500 ˆ e13 =(3000×1000)/4000=750.

ao nível de significância de 0. χ obs = 750 1500 250 125 Uma vez que 60 excede o valor crítico 9. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Frequências esperadas PERÍODO DO DIA Manhã Tarde Noite 750 1500 750 125 250 125 125 250 125 1000 2000 1000 MODO DE PAGAMENTO Cheque Dinheiro Cartão de Crédito Totais Valor observado da estatística teste: 2 Totais 3000 500 500 4000 (750 − 750 )2 (1500 − 1500 )2 (200 − 250 )2 (175 − 125 )2 + +. rejeitamos a hipótese de que o modo de pagamento é independente do período do dia em que as compras são feitas..+ + =60. Carla Henriques e Manuel Reis 39 Tratamento Estatístico de Dados ..Dep.49.05.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Medidas de Associação No teste do Qui-Quadrado apresentado. Uma vez que a estatística do teste mede o afastamento em relação à hipótese de independência. se for rejeitada a hipótese de independência entre os atributos. Carla Henriques e Manuel Reis 40 Tratamento Estatístico de Dados . o seu valor observado poderá ser usado para avaliar o grau de associação entre os atributos.Dep. pode interessar medir a intensidade da associação entre os mesmos. através de uma medida adequada.

Tshuprow propôs o seguinte coeficiente. Carla Henriques e Manuel Reis 41 Tratamento Estatístico de Dados .s} e portanto nunca Valores pequenos de C indicam fraca associação entre os atributos. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Coeficiente de Contingência de Pearson: C = χ2 χ2 + n Este coeficiente varia entre 0 e assume o valor 1. (q − 1) q onde q=min{r. Para obviar este problema.Dep. O facto deste coeficiente não assumir o valor 1 no caso de associação completa é uma sua limitação. enquanto que valores grandes de C indicam forte associação.

referimos o coeficiente proposto por Cramer que atinge o valor 1 quando há associação completa. com q=min{r. Por último. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência χ2 Coeficiente de Tshuprow: T = n (r − 1) × (s − 1) Este coeficiente varia entre 0 e 1. χ2 . tomando o valor 0 no caso de existir independência e o valor 1 quando r=s e houver associação completa.Dep. Carla Henriques e Manuel Reis 42 Tratamento Estatístico de Dados .s} Coeficiente V de Cramer: V = n(q − 1) 0≤V≤1.

816.122 60 + 4000 0≤C≤ (q − 1) q .s}=3. Para ter uma ideia da intensidade de associação entre estes dois atributos. 0 ≤C≤ 0. rejeitámos a hipótese de independência entre o modo de pagamento e o período do dia em que as compras eram efectuadas. calculam-se os coeficientes que acabámos de descrever. Coeficiente de Contingência de Pearson: C = χ2 χ2 + n = 60 = 0. i. onde q=min{r. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Para o exemplo anterior.e. Carla Henriques e Manuel Reis 43 Tratamento Estatístico de Dados .Dep.

esta pode considerar-se fraca. que apesar de haver associação entre os atributos. Carla Henriques e Manuel Reis 44 Tratamento Estatístico de Dados . então.087 4000 × 2 Verificamos. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Coeficiente de Tshuprow: T= χ2 n (r − 1) × (s − 1) = 60 =0.Dep.087 4000 2 × 2 χ2 Coeficiente V de Cramer: V = = n(q − 1) 60 =0.

... A2. Bs O11 O12 .... Neste contexto... Carla Henriques e Manuel Reis 45 Tratamento Estatístico de Dados ..r e j=1.. Bs . B2...Dep...... surge também uma tabela de contingência r×s: A1 A2 M B1 B2 ...s) Or1 Or2 . O1s O21 O22 . nas quais se observa um atributo A com r categorias A1.. Ors número de elementos da amostra da população Bj classificados na categoria Ai de A. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Teste de Homogeneidade Suponha que são recolhidas amostras aleatórias de s populações (sub-populações ou estratos) B1.... O2s M M O M Ar Oij (i=1. Ar..

e o que se pretende saber é se existe homogeneidade... Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Sejam: • Oi⋅ = ∑ Oij (i=1..s) i=1 r tamanho da amostra recolhida na população Bj. • O⋅j = ∑ Oij (j=1.. Neste caso. se não há diferença entre as populações no modo como os seus elementos se distribuem pelas modalidades do atributo A...Dep. isto é. Carla Henriques e Manuel Reis 46 Tratamento Estatístico de Dados . cada Bj rotula uma sub-população cujos elementos se distribuem pelas r modalidades do atributo A..r) j=1 s nº de elementos na categoria Ai de A em todas as amostras..

que. tem distribuição assimptótica do Qui-Quadrado com (r-1)(s-1) graus de liberdade. a estatística do teste é χ2 = ∑ ∑ r s ˆ (Oij − eij )2 ˆ eij i=1 j=1 . a estatística de teste mede o afastamento dos dados em relação à hipótese de homogeneidade. Assim. sob o pressuposto de H0 ser verdadeira. Valores muito grandes da estatística de teste traduzem um grande afastamento dos dados em relação à hipótese nula. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência À semelhança do teste de independência.Dep. conduzindo à rejeição desta. Carla Henriques e Manuel Reis 47 Tratamento Estatístico de Dados .

alguma frequência esperada inferior a 1 devemos proceder à agregação de algumas classes contíguas. isto é. inferiores a 5 ou. ei’s.mais de 20% das frequências esperadas. se tivermos: . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Para aplicar os testes de independência e de homogeneidade devem ser seguidas as mesmas regras que vimos para o teste de ajustamento do Quiquadrado. Carla Henriques e Manuel Reis 48 Tratamento Estatístico de Dados .Dep. .

i. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência Teste exacto de Fisher O teste do Qui-quadrado é. o teste de Fisher.Dep. o que portanto limita a sua aplicação ao caso de grandes amostras (recorde as limitações sobre as frequências esperadas). a distribuição da estatística é exacta (os pontos críticos e valores-p são calculados de forma exacta). que é um teste exacto. Carla Henriques e Manuel Reis 49 Tratamento Estatístico de Dados . Em tabelas de contingência 2x2.. como já se disse. baseado numa distribuição assimptótica. existe uma alternativa ao teste do Qui-quadrado.e.

Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes AJUSTE ENTRE DUAS AMOSTRAS INDEPENDENTES Objectivo: Dadas duas amostras aleatórias e independentes provenientes de duas populações. as duas amostras podem ser consideradas como provenientes de populações com a mesma distribuição. Hipóteses a testar: H0: As duas amostras são retiradas de populações com a mesma distribuição H1: As duas amostras são retiradas de populações com distribuições diferentes Carla Henriques e Manuel Reis 1 Tratamento Estatístico de Dados . pretende-se testar a hipótese H0 de que as duas distribuições populacionais são idênticas.Dep. isto é.

Dep.Am.. A hipótese H0 que se pretende testar é a de que as duas populações em estudo têm a mesma distribuição. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes Teste do Qui-quadrado Os valores possíveis da característica em estudo são repartidos por m classes mutuamente exclusivas A1. Por outras palavras... Trata-se então do teste do Qui-quadrado de homogeneidade para duas populações (s=2).. não há diferença entre as duas populações no modo como os seus elementos se distribuem pelas diversas classes. isto é. Carla Henriques e Manuel Reis 2 Tratamento Estatístico de Dados . as duas populações são homogéneas. A2.

a hipótese H0 é rejeitada se o valor observado da estatística de teste for superior ao ponto crítico D'α (a ser consultado numa tabela). Estatística de teste: D ' = sup S A ( x) − S B ( x) − ∞ < x < +∞ Para um nível de significância α. A estatística de teste considera a maior das diferenças. Carla Henriques e Manuel Reis 3 Tratamento Estatístico de Dados . em valor absoluto. não é rejeitada a hipótese nula de que as duas amostras provêm de populações com a mesma distribuição. Se não se registarem diferenças significativas. SA(x)–SB(x). Comparam-se as frequências relativas acumuladas registadas nas duas amostras (digamos A e B). Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes Teste de Kolmogorov-Smirnov Este teste aplica-se a distribuições contínuas.Dep. entre as proporções de valores inferiores ou iguais a x observadas em cada amostra.

obtendo-se os seguintes resultados VALORES N. Os valores da análise para estes 70 indivíduos estão registados seguidamente. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes Exemplo: Registaram-se os valores de uma análise feita a 80 indivíduos com a variante A de uma dada doença. VALORES N.01) Carla Henriques e Manuel Reis 4 Tratamento Estatístico de Dados .Dep.º indivíduos 23 1 24 2 26 3 28 6 30 15 31 20 32 13 33 4 34 3 36 2 38 1 Pode-se admitir que a distribuição dos valores da análise é a mesma para as duas variantes da doença? Servirá esta análise como meio de diagnostico da variante A ou B desta doença? (Use α=0.º indivíduos 20 2 22 3 23 9 26 12 29 27 30 16 31 7 33 2 34 2 Seleccionaram-se aleatoriamente 70 indivíduos com a variante B da mesma doença.

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes

Variante A:
VALORES N.º indivíduos Freq. acumuladas SA(x) 20 2 2 2/80 22 23 26 29 30 31 33 3 9 12 27 16 7 2 5 14 26 53 69 76 78 5/80 14/80 26/80 53/80 69/80 76/80 78/80 34 2 80 1

Variante B:
VALORES N.º indivíduos Freq. acumuladas SB(x) 23 1 1 1/70 24 2 3 3/70 26 3 28 6 30 15 31 20 32 13 33 4 34 3 36 2 38 1 70 1

6 12 27 47 60 64 67 69 6/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70

Carla Henriques e Manuel Reis
5

Tratamento Estatístico de Dados

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes

Cálculo do valor observado da estatística de teste:

Valores

20

22

23

24

26

28

29

30

31

32

33

34

36

38
1 1 0

2/80 5/80 14/80 14/80 26/80 26/80 53/80 69/80 76/80 76/80 78/80 1 1 SA(x) 0 0 1/70 3/70 6/70 12/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 SB(x) |SA(x)- SB(x)| 0,025 0,063 0,161 0,132 0,239 0,154 0,491 0,477 0,279 0,093 0,061 0,043 0,014

O valor observado da estatística de teste é então D’obs=0.491. 80 + 70 = 0.267 . 80 × 70

Para α=0.01, o ponto crítico é (consulte tabela): 1.63

Carla Henriques e Manuel Reis
6

Tratamento Estatístico de Dados

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes

Dado que o valor observado da estatística de teste é 0.491>0.267, então rejeita-se a hipótese nula de as duas variantes da doença não se distinguirem quanto à distribuição dos valores da análise. Há portanto evidência estatística, ao nível de significância de 0.01, de que os valores da análise de distribuem de forma diferente na variante A e B da doença.

Carla Henriques e Manuel Reis
7

Tratamento Estatístico de Dados

as k amostras podem ser consideradas como provenientes de populações com a mesma distribuição.Dep. isto é. pretende-se testar a hipótese H0 de que as distribuições populacionais são idênticas. Nota: O teste de Krukal-Wallis constitui uma alternativa à análise de variância com um factor. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis TESTE DE KRUSKAL-WALLIS Objectivo: Dadas k populações nas quais se estuda uma característica comum e de onde foram extraídas k amostras aleatórias e independentes. Carla Henriques e Manuel Reis 1 Tratamento Estatístico de Dados . a ser abordada mais tarde. quando os pressupostos desta não podem ser verificados.

Dep. Carla Henriques e Manuel Reis 2 Tratamento Estatístico de Dados . Por esta razão as hipóteses são geralmente formuladas em termos das médias ou das medianas populacionais. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Hipóteses a testar: H0: As k amostras são retiradas de populações com a mesma distribuição H1: As k amostras não são retiradas de populações com a mesma distribuição. isto é. há pelo menos duas populações com distribuições diferentes O teste de Kruskal-Wallis é particularmente sensível a diferenças nas medidas de localização.

Dep. i≠j H0: M1=M2=…=Mk (as k medianas populacionais são iguais) H1: Mi=Mj . i≠j (há pelo menos duas populações com medianas diferentes) Carla Henriques e Manuel Reis 3 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Notação: µi média da i-ésima população mediana da i-ésima população (as médias populacionais são iguais para as k populações) (há pelo menos duas populações com médias diferentes) Mi H0: µ1=µ2=…=µk H1: µi≠µj .

..Dep. Procedimento: i =1 k ordenam-se todas as observações por ordem crescente dos seus valores.k). Rij. ou posto.a j-ésima observação da amostra da população i. Xij .nº total de observações. ou posto. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Notação: ni . atribui-se um nº de ordem. a cada observação Xij (a observação mais pequena fica com o nº de ordem. N = ∑ ni . para cada população i determina-se o valor Ri da soma dos postos das observações correspondentes a esse grupo populacional: Ri = ∑ Rij j =1 ni Carla Henriques e Manuel Reis 4 Tratamento Estatístico de Dados ..o tamanho da amostra retirada da população i (i=1. 1 e a observação maior com o posto N).

5. 102. 3. o número de ordem. 6. 3. Neste caso.5. 1. Carla Henriques e Manuel Reis 5 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Quando há empates nos valores observados. 6. 104. 102. ou posto. que deve ser atribuído a cada valor empatado deve ser a média dos números de ordem que seriam atribuídos a estes valores se não estivessem empatados. 8.5. 3. suponhamos que ordenando os valores observados obtínhamos 100. 5. 102. 102.Dep. 103. 103. Por exemplo. os números de ordem seriam respectivamente.

... sob H0.k... H tem aproximadamente 2 distribuição χ k −1 .Dep.. consultar tabela desta distribuição..e. sob H0. ou o nº de empates é muito pequeno. a estatística de teste é: k R2 12 H= ∑ i − 3(N + 1) N(N + 1) i=1 ni A hipótese nula deve ser rejeitada se o valor observado da estatística H for muito grande. Carla Henriques e Manuel Reis 6 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Quando não há empates nos valores observados das amostras.k. i. consultar tabela da distribuição o Se ni≥5 para todo i=1. Pontos críticos: o Se k=3 e ni≤5 para todo i=1. exacta da estatística H. superior ao ponto crítico (teste unilateral à direita)...

sob H0... H’ tem aproximadamente 2 distribuição χ k −1 .. Carla Henriques e Manuel Reis 7 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Quando há muitos empates nos valores observados das amostras a estatística de teste a usar deve ser: 1 ⎡ k Ri2 N(N + 1)2 ⎤ H'= 2 ⎢ ∑ − ⎥ 4 S ⎣i=1 ni ⎦ onde.k. 1 ⎡ k ni 2 N(N + 1)2 ⎤ S = ⎢ ∑ ∑ Rij − ⎥ N − 1 ⎣i=1 j=1 4 ⎦ 2 Pontos críticos: o Se ni≥5 para todo i=1.. consultar tabela desta distribuição.Dep.

Os tempos respectivos (em minutos) constam do quadro seguinte. Após algumas aulas. pediu-se a cada estudante que resolvesse o mesmo problema.05) Carla Henriques e Manuel Reis 8 Tratamento Estatístico de Dados . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Exemplo: Para avaliar o mérito de três métodos de ensino diferentes. cada um de 14 estudantes foi aleatoriamente matriculado em uma de três turmas.Dep. Método 1 15 12 18 20 10 Método 2 21 16 13 9 Método 3 11 19 17 22 24 Será possível afirmar que os métodos de ensino produzem resultados diferentes no que diz respeito à rapidez de um aluno para resolver um problema? (Use α=0. Em cada turma utilizou-se um método de ensino diferente.

ensino) a que pertencem. registando o grupo (mét. e determina-se o posto de cada uma: 9 1 2 10 11 12 13 15 16 17 18 19 20 21 22 24 2 1 3 3 4 1 5 2 6 1 7 2 8 3 9 1 10 11 12 13 14 3 1 2 3 3 Observação Posto .Dep. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Ordenam-se as observações.Rij Grupo (mét.) R1=2+4+6+9+11=32 R2=1+5+7+12=25 R3=3+8+10+13+14=48 Carla Henriques e Manuel Reis 9 Tratamento Estatístico de Dados .

sob H0. + + valor observado é: Hobs= 14(14 + 1) ⎜ 5 4 5 ⎟ ⎝ ⎠ Consultando a tabela da distribuição exacta de H.05: 5. a estatística de teste é H= ∑ i − 3(N + 1) cujo N(N + 1) i=1 ni ⎛ 32 2 25 2 48 2 ⎞ 12 ⎜ ⎟ − 3(14 + 1) = 1. não há evidência estatística de que o tipo de método de ensino influencie o desempenho dos estudantes na resolução de problemas.963<5.6429.6429.Dep.963. Carla Henriques e Manuel Reis 10 Tratamento Estatístico de Dados . Dado que Hobs=1. retira-se o ponto crítico para α=0. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis k R2 12 Não havendo empates. Por outras palavras. não se rejeita a hipótese nula dos três métodos de ensino produzirem efeitos idênticos.

e. Para isso temos de comparar cada par de amostras da seguinte maneira: para cada amostra. surge a questão de identificar onde se encontram as diferenças. quais são as amostras onde se encontram diferenças significativas. Determinam-se as diferenças absolutas entre cada par de postos médios Ri − R j . Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Testes de Comparações múltiplas Quando rejeitamos a hipótese H0. calcula-se o posto médio R i . i.….j=1. dividindo a soma dos postos Ri pelo tamanho da amostra ni. i.k Carla Henriques e Manuel Reis 11 Tratamento Estatístico de Dados .Dep..

evidência de existirem diferenças entre as populações de onde se extraíram estas amostras.k −1 é o ponto crítico usado para o teste de Kruskal-Wallis. considera-se significativa a diferença entre as amostras i e j. χ α. havendo. Matemática Escola Superior de Tecnologia de Viseu TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis Cada diferença absoluta R i − R j é comparada com o valor crítico c ij = ⎛ N( N + 1) ⎞⎛ 2 χ α . portanto.k −1 ⎜ ⎟⎜ ⎜ ⎝ 12 1 1⎞ + ⎟ ⎠⎝ n i n j ⎟ ⎠ 2 onde.Dep. então. Se R i − R j > c ij . Carla Henriques e Manuel Reis 12 Tratamento Estatístico de Dados .