Você está na página 1de 21

SERVIÇO PÚBLICO FEDERAL

UNIVERSIDADE FEDERAL DO PARÁ


INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
FACULDADE DE ESTATÍSTICA

Disciplina: Estatística Não Paramétrica

Esta apostila contém uma


compilação de textos de diversos
autores, sendo elaborada com o
objetivo exclusivo de ser um apoio
didático para o aluno.

Organização e elaboração:
Profa. Marinalva Cardoso Maciel
Profa. Marina Y. Toma
FAEST/ICEN/UFPA

Belém - PA
2022
I - INTRODUÇÃO

A inferência estatística é um dos principais ramos da estatística moderna e


divide-se em dois grandes tópicos: a estimação de parâmetros de uma população e os
testes de hipóteses. Os testes estatísticos fornecem a base para pesquisas que tem
como objetivo comparar condições experimentais. Tais testes fornecem um respaldo
científico para validar pesquisas de modo a viabilizar sua aceitabilidade no meio
científico. Os testes podem ser divididos em paramétricos e não-paramétricos.
As primeiras técnicas de inferência sobre testes de hipótese faziam diversas
suposições sobre a natureza da população da qual se extraíam os dados (Distribuição
normal, por ex.). Como os valores relacionados com a população são denominados
“parâmetros”, tais técnicas estatísticas foram denominadas paramétricas.
No entanto, em diversas análises as suposições sobre a população sob estudo
não se verificam ou são atendidas parcialmente. Desse modo foram desenvolvidas
algumas técnicas que não são rigorosas na especificação de condições acerca dos
parâmetros da população da qual a amostra foi obtida. Essas técnicas são chamadas
de “distribuição livre” ou “não-paramétricas”.
A Estatística Não-Paramétrica pode ser definida como uma coleção de métodos
estatísticos, aplicada a conjuntos de dados onde as suposições distribucionais
necessárias para aplicação de uma técnica clássica (Intervalo de Confiança, Teste de
Hipótese) não são satisfatoriamente atendidas. É também bastante útil no tratamento
de dados onde as variáveis são qualitativas ou quando a amostra é pequena.
Vantagens:
 Não exigem a normalidade dos dados.
 Em geral, as probabilidades das afirmativas obtidas na maioria dos testes não-
paramétricos, são exatas, salvo quando se usam aproximações para grandes
amostras.
 Independem da forma da população da qual a amostra foi obtida.
 São, em geral, de mais fácil aplicação e exigem, quase sempre, menor volume
de cálculos.
 Alguns testes não-paramétricos permitem trabalhar com dados de diferentes
populações, o que não é possível com os paramétricos.
 São úteis no caso de variáveis ordinais, em que é difícil estabelecer uma escala
de valores quantitativos para os dados, sendo possível apenas dizer que um
dado tem mais ou menos da característica que está sendo analisada, sem poder
precisar ou quantificar as diferenças.
 São mais eficientes do que os testes paramétricos, quando os dados da
população não têm distribuição normal.
 Quando a população é normalmente distribuída, sua eficiência, em alguns
casos, é levemente inferior à dos concorrentes.
Desvantagens
 Em muitos casos ocorre um desperdício de informações, ao desconsiderar, por
exemplo, a magnitude dos dados, transformando-os em sinais ou ordem.
 Para se obter a mesma eficiência com um teste não-paramétrico quando as
suposições do modelo estatístico paramétrico são satisfeitas é necessária uma
amostra maior.
 Sua aplicação está restrita a modelos simples, pois a estatística não-paramétrica
não permite testar interações, exceto a aditividade em casos especiais.

CONCEITOS BÁSICOS
Amostra Aleatória
𝑋1 , 𝑋2 , … , 𝑋𝑛 constituem uma amostra aleatória se cada Xi apresenta a mesma
distribuição e independência entre si.
Parâmetro: É um valor desconhecido, associado à uma população, que se deseja
estimar.
Estimador: É uma função da amostra aleatória que estima o valor do parâmetro.
Nível de Confiança: É a probabilidade de abrangência do intervalo de confiança para
certo parâmetro.

A ESCOLHA DO TESTE ESTATÍSTICO


Devido a diversidade de testes estatísticos tanto paramétricos quanto não
paramétricos, alguns itens devem ser levados em conta na escolha da prova estatística
para determinada situação. A maneira como a amostra foi obtida, a natureza da
população da qual se extraiu a amostra e o tipo de mensuração ou escala empregado
nas definições operacionais das variáveis envolvidas, isto é, o conjunto de valores
numéricos, além do tamanho da amostra disponível.
Após a determinação da natureza da população e do método de amostragem
ficará estabelecido o modelo estatístico. Associado a cada teste estatístico tem-se um
modelo estatístico e condições de mensuração, o teste é válido sob as condições
especificadas no modelo e pelo nível da escala de mensuração. Nem sempre é
possível verificar se todas as condições do modelo foram satisfeitas e neste caso tem-
se que admitir que isso é verdade. Estas condições do modelo estatístico são
denominadas suposições ou hipóteses do teste. Qualquer decisão tomada através de
um teste estatístico somente terá validade se as condições do modelo forem válidas.
Testes paramétricos: Os testes paramétricos são utilizados em variáveis com
mensuração intervalar ou por razão nas quais se é razoável supor uma distribuição de
probabilidades conhecida.
Testes não paramétricos: Tradicionalmente os testes não-paramétricos são
utilizados em variáveis com mensuração nominal ou ordinal. Nos casos de variáveis
contínuas, é usual categorizá-las para se utilizar os testes não paramétricos.

NÍVEL DE MEDIDAS DAS VARIÁVEIS


Discreta
Quantitativa
Contínua
Variável
Nominal
Qualitativa
Ordinal

Uma forma utilizada nas áreas comportamentais para classificar variáveis é a


subdivisão em quatro níveis de mensuração: nominal, ordinal, intervalar e razão.
1º NÍVEL - O Nível Nominal de Mensuração é caracterizado por dados que consistem
em nomes, rótulos ou categorias apenas. Os dados não podem ser ordenados (tal
como do menor para o maior). É o nível de mensuração mais baixo, mais rudimentar
possível. Sua escala de medida chama-se NOMINAL. A base, o fundamento para a
atribuição dos números é de natureza QUALITATIVA, DISTINTIVA.
Estatísticas admissíveis: moda, contagem de frequência, percentuais. Teste não-
paramétrico de qui-quadrado ou binomial (1 amostra). Medida de associação:
coeficiente de contingência C.
Ex.: sexo, número do CPF, raça, ...
2º NÍVEL - Os dados estão no Nível Ordinal de Mensuração se podem ser organizados
em alguma ordem, mas diferenças entre os valores dos dados ou não podem ser
determinadas ou não são significativas. Este nível já é um pouco mais elaborado que o
anterior e corresponde ao que popularmente se designa por ORDENAÇÃO; a escala
de medida chama-se ORDINAL.
Estatísticas admissíveis: moda, mediana. Teste não-paramétrico de Kolmogorov-
Smirnov, teste de iterações (1 amostra). Medida de associação: Coeficiente de
correlação baseados em postos: coeficiente rs de Spearman ou coeficiente τ de
Kendall.
Ex.: Preferência por um produto, escolaridade (medida em nível de formação), ...
As grandezas de 2º nível podem ser avaliadas em termos de mais que ou menos que,
embora a quantificação precisa seja impossível.
3º NÍVEL - O Nível Intervalar de Mensuração é como o nível ordinal, com a propriedade
adicional de que a diferença entre quaisquer dois valores de dados é significativa. No
entanto, os dados nesse nível não têm um ponto inicial zero natural (quando o nada da
quantidade está presente). É no 3º nível que surge, pela 1ª vez, uma escala de medida
propriamente dita. É a escala INTERVALAR, caracterizada pela existência de:
- Uma unidade de medida (arbitrária, porém fixa);
- Um zero relativo, isto é, convencional.
Estatísticas admissíveis: todas as estatísticas paramétricas comuns, assim como os
testes paramétricos comuns, que devem ser usados se as suposições do modelo são
satisfeitas.
Ex.: temperatura.
4º NÍVEL - O Nível de Mensuração de Razão é o nível intervalar com a propriedade
adicional de que há também um ponto inicial zero natural (onde zero indica que nada
da quantidade está presente). Para valores nesse nível, diferenças e razões são,
ambas, significativas. O 4º nível define a chamada escala de razão ou RACIONAL.
Essa escala é muito parecida com a de 3º nível, exceto quanto à origem: o zero é
absoluto, isto é, é zero mesmo. Em função disso, todas as operações aritméticas
passam a ter sentido e, portanto, NÃO HÁ CÁLCULO QUE NÃO POSSA SER FEITO.
Ex. peso, altura,...
Os testes paramétricos só podem ser utilizados se as variáveis forem
mensuradas pelo menos ao nível intervalar. Portanto, no caso de estudos que utilizam
variáveis mensuradas ao nível nominal ou ordinal, devem ser utilizados testes de
hipóteses não-paramétricos. Os testes não-paramétricos também têm sua utilidade
quando se suspeita que as suposições necessárias para a realização de um teste
paramétrico não são satisfeitas.
Tipos de testes não-paramétricos
Os testes não-paramétricos podem ser divididos em testes para:
• Uma amostra
• Duas amostras emparelhadas (dependentes)
• Duas amostras independentes
• Várias amostras emparelhadas (dependentes)
• Várias amostras independentes

II - O CASO DE UMA AMOSTRA

No caso de uma amostra, o problema típico é verificar se a amostra foi extraída


de uma população com distribuição especificada. Desse modo os testes servem para
responder a questões como: Há diferença significativa na média entre a amostra e a
população? Há diferença significativa entre as proporções observadas e esperadas? É
razoável supor que a amostra seja proveniente de uma população conhecida? Os
testes paramétricos para tais casos comumente consistem em aplicar o teste t
comparando a média observada (amostra) com a média esperada (população). Para
aplicar o teste paramétrico é necessário que as observações tenham sido mensuradas
no mínimo em uma escala de intervalos e que a amostra tenha sido extraída de uma
população com distribuição Normal.
Há estudos em que não se pode (ou não se quer) aplicar o teste paramétrico,
por motivos tais como:
 As suposições do teste paramétrico são irreais para os dados sob estudo;
 É preferível fugir às suposições do teste t para ganhar em generalidade nas
conclusões;
 Os dados são classificativos, enumerativos ou em postos e, portanto não
suscetíveis de análise com o teste t;
 O estudo deseja evidenciar qualquer tipo de diferença e não somente a
diferença de locação.
Nesse caso pode ser utilizado um dos testes paramétricos a seguir.

2.1. Teste Binomial


Função. O teste binomial é particularmente útil em experimentos que apenas admitem
duas alternativas como resposta, tais como certo ou errado, sim ou não, verdadeiro ou
falso, masculino ou feminino, positivo ou negativo, etc. Tais tipos de dados seguem a
distribuição binomial.
A distribuição Binomial representa a probabilidade de ocorrência de X eventos
(sucessos) em uma categoria e (N-X) na outra.
𝑁!
Sua expressão geral é dada por: 𝑃 (𝑋 ) = 𝐶𝑁𝑋 𝑝 𝑋 (1 − 𝑝)𝑁−𝑋 ; 𝐶𝑁𝑋 = (𝑁−𝑋)!𝑋!

onde p é a proporção de casos esperados em uma categoria e q = (1 - p) é a proporção


de casos na outra categoria.
Como de modo geral o interesse é saber “qual a probabilidade de obter valores
iguais ou mais extremos que os observados?”, utiliza-se a distribuição acumulada da
binomial: 𝑃(𝑋) = ∑𝑋𝐼=0 𝐶𝑁𝑖 𝑝𝑖 (1 − 𝑝)𝑁−𝑖
Método:
1. Determinar o número de casos esperados N (tamanho amostral);
2. Determinar a frequência de cada uma das classes;
3. Conforme o tamanho, as amostras são classificadas em pequenas amostras (N ≤ 25)
e grandes amostras (N > 25)
3.1. Para pequenas amostras e p = q = 1/2, existe valores tabelados da distribuição
binomial que fornecem as probabilidades, sob H0, de valores tão pequenos quanto um
x observado. Ou, de outro modo, pode-se calcular a probabilidade de ocorrência de x e
de valores mais extremos, utilizando a fórmula acima.
3.2. Para grandes amostras, aplica-se o Teorema Central do Limite e utiliza-se a
𝑥−𝑁𝑝
aproximação Binomial-Normal, definindo a variável 𝑍 = ≈ Normal (0, 1)
√𝑁.𝑝.(1−𝑝)

Exercício 1: Vamos testar a hipótese de uma moeda ser ou não honesta. Para tal,
vamos considerar que esta moeda foi lançada 8 vezes. Foram encontradas 7 caras e
apenas uma coroa. Qual deve ser a nossa opinião sobre a moeda, com um nível de
confiança de 5%?
Temos N = 8 e o número de sucessos, X = 7. Para que a moeda seja considerada
honesta, é necessário que o número de caras obtidas não difira estatisticamente do
número de coroas. As hipóteses de teste podem ser definidas como:
H0: p = 0,5 (probabilidade de cair cara é igual à probabilidade de cair coroa)
H1: p > 0,5
𝑃(𝑋 ≥ 7) = ∑8𝑖=7 𝐶8𝑖 𝑝𝑖 𝑞8−𝑖 = 𝐶87 × 0,57 × 0,58−7 + 𝐶88 × 0,58 × 0,58−8 = 0,035156
Como a hipótese é unilateral, e α = 0,05, o p calculado é menor que o nível de
significância, logo, rejeita-se a hipótese nula.
Observe que, como é uma probabilidade exata, o p calculado já é o p-valor.
No Bioestat:
No Excel: 𝑃(𝑋 ≥ 7) = 1 − 𝑃(𝑋 < 7) = 1 − 𝑃(𝑋 ≤ 6):

No R:

>binom.test(7,8,p=0.5,alternative = "greater")

Exercício 2: Um fabricante de cigarros deseja conhecer o perfil dos consumidores


deste produto em uma pequena localidade para a avaliação da propaganda de uma
determinada marca. Assim, deseja-se testar a hipótese de que mais do que 20% dos
fumantes desta localidade possuem atitude esportiva. Foi feita uma pesquisa com 18
fumantes dos quais 9 possuem tal atitude.
Possuem atitude esportiva Não possuem atitude esportiva Total
Frequência 9 9 18
2.2. O teste Qui-Quadrado

Função. A prova ² de uma amostra é aplicada quando o pesquisador está interessado


no número de indivíduos, objetos ou respostas que se enquadram em várias categorias
que podem ser duas ou mais. Usa-se a técnica do tipo de prova de aderência, ou seja,
deve comprovar se existe diferença significativa entre o número observado de
indivíduos, ou de respostas, em determinada categoria, e o respectivo número
esperado, baseado na hipótese de nulidade. Ou seja, ao contrário do que ocorre com
os testes paramétricos, o teste de qui-quadrado estabelece comparações entre
frequências e não entre escores médios.
Método. O método usado é o da comparação, ou seja, comparar um grupo observado
com um grupo esperado de frequências. Mas antes se deve determinar as frequências
esperadas. Para isso, usa-se a hipótese de nulidade, que dará a proporção de
indivíduos, ou objetos, que se enquadram em cada uma das diferentes categorias em
que a população está presumidamente classificada. A hipótese de nulidade pode ser
testada por:
𝑘
2
(𝑂𝑖 − 𝐸𝑖 )2
𝜒 =∑
𝐸𝑖
𝑖=1

onde:
Oi = número de casos observados classificados na categoria i.
Ei = número de casos esperados na categoria i sob H0, onde k é o número de
categorias.
Se há concordância entre os valores observados e os esperados, as diferenças (Oi -
Ei) serão pequenas e, consequentemente, ² será também pequeno. Se as
divergências, entretanto, forem grandes, o valor de ², será também grande. Pode-se
mostrar que a distribuição amostral de ², sob Ho, calculada pela fórmula acima, segue
a distribuição qui-quadrado com um número de graus de liberdade igual a “k-1” onde
“k” é igual ao número de categorias em que a variável foi classificada.
Existem muitas distribuições qui-quadrado diferentes, uma para cada grau de
liberdade. O grau de liberdade, anotado por gl reflete o número de observações livres
(que podem variar) após feitas certas restrições sobre os dados. Por exemplo, se forem
classificados em duas categorias dados relativos a 50 casos, tão logo se saiba que,
digamos, 35 casos se enquadram em uma das categorias, automaticamente fica-se
sabendo que 15 casos se enquadrarão na outra. Tem-se, então que gl = 1, porque com
duas categorias e qualquer n fixo, tão logo se conheça o número de casos em uma
categoria a outra estará automaticamente determinada. Em geral, no caso de uma
amostra, quando Ho especifica plenamente os valores esperados o número de graus
de liberdade será gl=(k-1), onde k representa o número de categorias usadas na
classificação dos dados.
Para empregar a prova ² na comprovação de uma hipótese, deve-se enquadrar
cada observação em uma das k células. O número total dessas observações deve ser
n (número de elementos da amostra considerada). Isto é, cada observação deve ser
independente de qualquer outra. Não se pode, portanto, fazer várias observações
sobre o mesmo indivíduo e considerá-las como sendo independentes. Deve-se também
determinar a frequência esperada para cada uma das k células. Se H0 especificar que
a proporção de elementos em cada categoria seja a mesma, então 𝐸𝑖 = 𝑛/𝑘.

Exemplo: (Siegel, p. 49)


Em corridas de cavalos é ponto de vista comum entre os apostadores que, em uma
pista circular, as chances são mais favoráveis a cavalos em determinadas posições
(raias). A raia 1 é a mais próxima do lado interno da pista, e a 8 a mais afastada (numa
corrida com 8 cavalos). Podem-se comprovar os efeitos das raias, analisando-se os
resultados das corridas, dados em função das raias. No exemplo, coletaram-se os
resultados do primeiro mês da temporada de 1955 (conforme o New York Post, Ago.
30, 1955, pág. 42) em uma pista circular.
Número de vitórias de cavalos e seus respectivos postos.
Posto 1 2 3 4 5 6 7 8 Total
Nº de vitórias 29 19 18 25 17 10 15 11 144

1. Hipóteses: H0: Não há diferença entre o número esperado de ganhadores em


relação a cada posto.
H1: Existe diferença entre o número de ganhadores de cada posto.
2. Prova Estatística. Como se está comparando os dados de uma população
presumida, usa-se uma prova unilateral. Emprega-se a prova ² porque a hipótese em
estudo se refere à comparação de frequências observadas e esperadas em categorias
discretas. (As categorias são os oito postos).
3. Distribuição amostral. A distribuição amostral de ² tal como calculada, pela
expressão dada acima, segue a distribuição qui-quadrado com gl = k - 1.
4. Região de Rejeição. Ho será rejeitada se o valor observado de ², calculado pela
expressão acima, for maior que o valor tabelado, a um nível de significância dado α. Ou
o nível descritivo (p-valor) for inferior ao nível de significância α.
5. Decisão. A amostra de 144 ganhadores forneceu os dados exibidos na tabela acima.
Posto 1 2 3 4 5 6 7 8 Total
Observado 29 19 18 25 17 10 15 11 144
Esperado 18 18 18 18 18 18 18 18 144
O cálculo do valor observado do qui-quadrado é dado por:
𝑘
2
(𝑂𝑖 − 𝐸𝑖 )2 (29 − 18)2 (19 − 18)2 (11 − 18)2 121 1 49
𝜒 =∑ = + +⋯+ = + +⋯+ = 16,33
𝐸𝑖 18 18 18 18 18 18
𝑖=1

O valor tabelado de 𝜒 2 (7; 5%) = 14,067. Como o valor calculado é maior que o
tabelado, rejeita-se a hipótese nula. Pela tabela da ² com 7 gl tem probabilidade de
ocorrência entre 0,02 < 𝑝 < 0,05. Logo, se 𝛼 = 0,01 não podemos rejeitar 𝐻0 . Se 𝛼 =
0,05 podemos rejeitar 𝐻0 ? (Tabela C, Siegel, pg. 280): 1%=18,48; 2% =16,62; 5%=14,07)
No Bioestat:

Como o resultado do Bioestat é o p-valor, ele deve ser comparado com o nível de significância.
Nesse caso, como α = 0,05, o p-valor é menor do que o nível de significância e deve-se rejeitar a
hipótese nula.
No excel:
Pode-se calcular o 𝜒 2 usando a fórmula e depois usar a função:
=DIST.QUIQUA.CD(valor calculado;graus de liberdade) = DIST.QUIQUA.CD(16.333;7)
Que fornece o p-valor = 0,0222
No R:
Pequenas Frequências Esperadas. Quando gl = 1, isto é, quando k = 2, cada
frequência esperada não deve ser inferior a 5. Quando o grau de liberdade for maior do
que um, isto é, quando k > 2, a prova ² não deve ser usada se mais de 20% das
frequências esperadas forem inferiores a 5 ou se qualquer frequência esperada é
inferior a 1. As frequências esperadas podem eventualmente ser aumentadas
combinando-se categorias adjacentes. Isto naturalmente só deve ser feito se as
combinações forem significativas.
Por exemplo, pode-se classificar um grupo de pessoas quanto à sua atitude em relação
a determinada opinião em: "apoia fortemente", "apoia", “indiferente", “é contra” e “é
fortemente contra”. Como forma de aumentar as frequências esperadas as categorias
poderiam ser reclassificadas em: “apoia”, “indiferente” e “é contra”.
Se o pesquisador tem apenas duas categorias e tem frequência esperada
inferior a 5, ou se, após combinar categorias obtém apenas duas com frequência
esperada inferior a 5, então deve ser utilizado o teste binomial ao invés do ².

2.3. O teste Kolmogorov-Smirnov (K-S)


Função e fundamentos lógicos.
O teste de Kolmogorov-Smirnov (K-S) é uma prova de aderência. Isto é, avalia o grau
de concordância entre a distribuição de um conjunto de valores amostrais (valores
observados) e determinada distribuição teórica específica. A prova testa se os valores
amostrais podem provavelmente serem considerados como oriundos de uma
população com uma suposta distribuição teórica. Ao contrário do teste do Qui-
quadrado, este teste não se aplica a dados qualitativos nem a variáveis discretas, pois
a tabela disponível para este teste só é exata caso a distribuição em teste seja
contínua. No entanto, tem a vantagem de não estar dependente de classificações dos
dados, que além de serem quase sempre arbitrárias envolvem perdas de informação.
O teste utiliza as distribuições acumuladas, isto é, ela compara a distribuição de
frequências acumuladas que deveria ocorrer sob a suposta distribuição (sob H 0) com a
distribuição de frequências acumuladas dos valores observados (amostrais). A
estatística teste é o ponto de maior diferença (em valor absoluto) entre as duas
distribuições.
Método. A distribuição teórica acumulada (sob H0) é representada por F0(X) e a
distribuição de frequências dos valores amostrais por Sn(x). Como H0 supõe que a
amostra tenha sido obtida da distribuição F0(X) é razoável esperar que, para cada valor
de X, Sn(X) esteja próximo de F0(X), isto é, sob H0, espera-se que as diferenças entre
Sn(X) e F0(X) sejam pequenas. O teste K-S toma a maior destas diferenças em módulo
que é denominada de desvio máximo e é anotada por D.
Assim: 𝐷 = 𝑀𝑎𝑥|𝐹0 (𝑋) − 𝑆𝑛 (𝑋)|
A distribuição amostral de D, sob H0, é conhecida e os valores de probabilidade de D,
foram tabulados por Massey (1951) em função de “n”. (tabela E, Siegel, pg. 282).

Exemplo: Certo Politécnico do país efetuou um contrato com uma determinada


empresa que ficou responsável pelo abastecimento da carne que compunha as
refeições na cantina dessa Escola. O contrato refere uma média de 290 gramas de
carne por refeição, por estudante. No entanto, alguns alunos queixaram-se da comida,
em particular acerca da quantidade de carne servida por refeição. Os alunos falaram
com o cozinheiro chefe, que lhes disse que a quantidade de carne servida por refeição
a cada estudante tinha aproximadamente distribuição normal de média 290 g com um
desvio padrão de 56 g. Após esta conversa com o cozinheiro, alguns alunos
concordaram em recolher as suas refeições ao longo de vários dias, resultando assim
uma amostra de 10 refeições, que foram levadas para um laboratório a fim de serem
pesados os pedaços de carne nelas contidos. Os dados obtidos são os seguintes:
198 254 262 272 275 278 285 287 287 292
Ao nível de significância de 5%, há evidência para rejeitar a hipótese de que o
cozinheiro seguia as regras que afirmou em relação à quantidade de carne servida?
Denote-se por X a quantidade, em gramas, de carne servida por refeição a cada
estudante.
Hipóteses: H0: X~N(290, 562).
H1: X ~ N(290, 562).
Prova Estatística. Emprega-se a prova K-S porque o pesquisador deseja comparar
uma distribuição observada com uma distribuição teórica contínua.
Nível de significância. Seja  = 0,05.
Distribuição amostral. A tabela E (Siegel, pg. 282) apresenta vários valores críticos
de D (valores da distribuição amostral) com as respectivas probabilidades de
ocorrência sob H0.
Região de Rejeição. Consiste de todos os valores de D tão grandes que a
probabilidade associada à sua ocorrência, sob H0, seja menor ou igual a 0,05.
No Excel:
Dados Frequência Frequência
Dados Frequência
sem Frequência relativa teórica Diferença
originais relativa
repetição acumulada acumulada
198 198 1 0.1 0.1 0.050206 0.049794
254 254 1 0.1 0.2 0.260158 0.060158
262 262 1 0.1 0.3 0.308538 0.008538
272 272 1 0.1 0.4 0.373943 0.026057
275 275 1 0.1 0.5 0.394405 0.105595
278 278 1 0.1 0.6 0.415162 0.184838
285 285 1 0.1 0.7 0.464427 0.235573
287 287 2 0.2 0.9 0.478638 0.421362
287 292 1 0.1 1 0.514245 0.485755
292 10 1

A frequência teórica relativa acumulada pode ser obtida no excel utilizando a fórmula:
=DIST.NORM.N(X;290;56;VERDADEIRO). Onde X é o valor da coluna “Dados sem
repetição”. A coluna Diferença é o cálculo da Frequência teórica acumulada –
Frequência relativa acumulada. A estatística D é a maior das diferenças:
Dmax = 0.485755
Para pequenas amostras, como é o caso, a tabela E de Siegel dá os valores para
comparação:

Como o valor calculado é maior do que o tabelado, rejeita-se a hipótese nula e


concluímos que a distribuição de pesos das carnes não segue a distribuição normal.

No Bioestat:
Verifica-se que a decisão será tomada com base no p-valor, para o caso bilateral.
Como o p-valor é menor que 5%, rejeitamos a hipótese nula, de que os dados seguem
a distribuição normal.

No R:

O Resultado é similar ao do Bioestat, mas no R aparece o p-valor calculado (=


0,01785). Como o p-valor é inferior a 5%, rejeitamos a hipótese de normalidade dos
dados.
Exercício 3: Suponha que um dado é jogado 150 vezes e que o número obtido de cada
face seja anotado e forneçam os resultados apresentados na tabela abaixo. Testar ao
nível de 1% de significância a hipótese de que o dado é equilibrado.

Faces 1 2 3 4 5 6
Nº de vezes que apareceu 29 19 19 27 26 30

2.4. O teste de Lilliefors

Função. O teste de Lilliefors é uma adaptação do teste de Kolmogorov-Smirnov, usado


para verificação de aderência (grau de concordância) entre a distribuição acumulada de
um conjunto de valores de uma amostra com a distribuição normal. A diferença básica
entre os testes é que o teste de K-S testa a aderência a partir de média e desvio
conhecidos, no entanto, quando a média e o desvio padrão da distribuição normal
hipotética não são conhecidos (e são, portanto, estimados a partir dos dados
amostrais), os valores de probabilidade de D, tabulados por Massey (1951) não são
válidos. Nestes casos, devem-se considerar as probabilidades de Lilliefors (Lilliefors,
1967) para determinar se a diferença D é significativa.

Método: Para o teste de normalidade da amostra, esta prova processa-se como o teste
de Kolmogorov-Smirnov, mas os dados originais são padronizados, usando estimativas
de μ e σ:

𝑋𝑖 −𝑋̅
𝑧𝑖 = 𝑆 (i = 1, ..., n)

Assim, as hipóteses a testar são: H0: Z ~ N(0, 1) vs H1: Z ≁ N(0, 1).


Sendo F0(x) a função de distribuição N(0,1) e Sn(x) a distribuição dos valores amostrais
depois de padronizada (i.e., definida para as variáveis aleatórias 𝑧1 , 𝑧2 , … , 𝑧𝑛 ), a
estatística teste de Lilliefors é dada por:
𝐷 = 𝑀𝑎𝑥|𝐹0 (𝑥) − 𝑆𝑛 (𝑥)|

A hipótese H0 é rejeitada, para um nível de significância α, se o valor observado D for


superior ou igual ao ponto crítico tabelado (tabela de Lilliefors), ou comparando com o
nível descritivo fornecido pelo programa computacional (α > p-valor).
Exemplo: Para o exemplo anterior (peso de carnes na cantina da escola), vamos
considerar que o fornecedor informou apenas que a distribuição do peso era normal.
Para testar a hipótese de normalidade, podemos usar o teste de Lilliefors (também
chamado teste de Kolmogorov-Smirnov com correção de Lilliefors). O procedimento é
similar no excel, mas as frequências teóricas serão calculadas usando a média e o
desvio padrão da própria amostra. O resultado obtido para a máxima diferença será
comparada com o valor fornecido em uma tabela de Lilliefors. O valor crítico com α =
5% é de 0,258.

No Bioestat, tem o teste direto no menu de testes para uma amostra e produz o
seguinte resultado:

Como o p-valor é não significativo, não podemos rejeitar a hipótese nula de


normalidade.
No R:

Exemplo: Um distribuidor pretende estimar o tempo médio de entrega dos seus


produtos a um cliente através de um intervalo de confiança. Foi recolhida uma amostra
aleatória de cinco tempos: 29, 33, 35, 36 e 36. No entanto, ele nada sabe sobre a
distribuição do tempo de entrega X, e, além disso, a dimensão da amostra é muito
pequena (n=5). Poderá fazê-lo?
2.5. O Teste G
Função. O teste G pode ser usado em qualquer problema onde o teste Qui-quadrado
seja recomendado, ou seja, quando se deseja comprovar se existe diferença
significativa entre o número observado de indivíduos, ou de respostas, em determinada
categoria, e o respectivo número esperado, baseado na hipótese de nulidade. Na
verdade os testes de qui-quadrado são aproximações da razão do log de
verossimilhança nas quais o Teste G está baseado.

Método. O método usado é o da comparação, ou seja, comparar um grupo observado


com um grupo esperado de frequências. Para determinar as frequências esperadas,
usa-se a hipótese de nulidade, que dará a proporção de indivíduos, ou objetos, que se
enquadra em cada uma das diferentes categorias em que a população está
presumidamente classificada. A hipótese de nulidade pode ser testada por:

𝐺 = 2 ∑ 𝑂𝑖 . ln(𝑂𝑖 /𝐸𝑖 )
𝑖

Exemplo. Vamos refazer o exemplo da corrida de cavalos em uma pista circular, que foi
usado com o teste qui-quadrado:
Posto 1 2 3 4 5 6 7 8 Total
Nº de vitórias 29 19 18 25 17 10 15 11 144

A resolução pode ser feita no excel utilizando a fórmula da estatística de teste G:


8

𝐺 = 2 × ∑ 𝑂𝑖 × 𝑙𝑛(𝑂𝑖 /𝐸𝑖 ) = 2 × (29 × 𝑙𝑛(29/18) + ⋯ + 11 × 𝑙𝑛(11/18)) = 16,138


𝑖=1

Que vai levar à mesma conclusão do teste qui-quadrado nesses caso.


No Bioestat:
No R:

Que leva à rejeição da hipótese de igualdade entre as frequências na pista circular de


corrida de cavalos.

Exemplo. Realizaram-se 300 lançamentos de um dado cujos escores estão abaixo.


Considerando-se que o dados apresenta 6 categorias (faces) e todas são
equiprováveis, então, do ponto de vista teórico deve-se esperar que, em trezentos
lançamentos, cada face deve apresentar 50 sucessos. Vamos testar a hipótese de
equiprobabilidade das faces.

2.6. O Teste de Iterações (Teste de Sequências)


Função. Este teste é utilizado para averiguar a aleatoriedade de uma amostra. Neste
âmbito, considera-se a seguinte definição de iteração ou sequência de símbolos: uma
iteração ou sequência é um conjunto de símbolos idênticos seguidos ou precedidos por
símbolos diferentes. Por exemplo, no conjunto de símbolos CC FFF CCCC F existem 4
sequências ou 4 iterações, de acordo com a definição anterior. A ideia básica do teste
consiste em considerar que, quando há aleatoriedade, não pode haver nem muitas
sequências, nem muito poucas - se há muitas sequências, isso significa que em
seguida de um símbolo há tendência para aparecer outro de natureza diferente, o que
sugere influência de flutuações cíclicas de períodos curtos; se há poucas sequências,
significa que há tendência para um símbolo ser seguido de outro da mesma natureza o
que indica certa tendência temporal ou acumulação de valores devido à falta de
independência. Sob a hipótese de aleatoriedade, nenhuma dessas situações deverá
ocorrer.
Método. O teste foi pensado para observações mensuráveis e contínuas, comparando-
as com a mediana. Ao fazer-se a comparação, atribuem-se sinais, “-“ para valores
inferiores à mediana e “+” para valores superiores à mediana. Assim se forma a
correspondente sucessão de sinais com valores dicotômicos, para se poder fazer a
contagem das sequências. Em termos amostrais, surgem muitas vezes observações
repetidas, de forma que se torna evidente a contagem das sequências, mesmo sem
recorrer ao cálculo da mediana e ao uso dos sinais.
Hipóteses. A hipótese não paramétrica a testar é, neste caso, da forma “H0: há
aleatoriedade de sequências” contra “H1: não há aleatoriedade de sequências”
Seja n1 o número de elementos de uma categoria, n 2 o número de elementos da
outra categoria e r o número de iterações ou sequências observadas na amostra.

Pequenas Amostras. Se tanto n1 quanto n2 não forem superiores a 20, a Tabela F


(Siegel, p. 283 e 284) dá os valores críticos de r sob H0 para  = 0,05. Estes são os
valores limites da distribuição amostral de r sob H0. Se o valor observado de r está
entre os valores críticos, não se rejeita H0. Se o valor observado de r é igual ou mais
extremo que um dos valores críticos, rejeita-se H0.
A Tabela F subdivide-se em duas outras: FI e FII. A Tabela FI dá os valores de r
que são tão “pequenos” que a probabilidade associada a sua ocorrência, sob H 0, é
igual a 0,025. A Tabela FII dá os valores de r que são tão “grandes” que a probabilidade
associada a sua ocorrência, sob H0, é igual a 0,025. A região de rejeição ao nível de
5% de significância constitui-se de valores de r menores ou iguais ao valor constante
na Tabela FI ou maiores ou iguais ao valor constante na Tabela FII.

Exemplo: No lançamento de uma moeda 20 vezes observou-se as seguintes interações


de caras (C) e coroas (K): C C C C C C C C C C K K K K K K K K K K
Nesse caso temos n1=10, n2=10 e r = 2. A Tabela F indica que para n1=10 = n2 o valor
de r deve ser superior a 6 e inferior a 16, se  = 0,05. Qualquer valor observado de r,
inferior a 6 ou superior a 16 estará na região de rejeição para  = 0,05. Como r = 2,
devemos rejeitar a H0 de que as 20 jogadas tenham produzida uma sequência aleatória
de caras e coroas.

Grandes Amostras. Se n1 ou n2 for superior a 20 pode ser feita uma aproximação à


distribuição normal através da seguinte fórmula:
2𝑛1 𝑛2
𝑟 − 𝜇𝑟 𝑟−( + 1)
𝑛1 + 𝑛2
𝑧= =
𝜎𝑟
2𝑛1 𝑛2 (2𝑛1 𝑛2 − 𝑛1 − 𝑛2 )

(𝑛1 + 𝑛2 )2 (𝑛1 + 𝑛2 − 1)

Exemplo: (Siegel, p. 62-64)


Para determinar se a disposição de homens e mulheres na fila de uma bilheteria de
cinema constitui um arranjo aleatório, obteve-se os dados anotando o sexo de uma
sucessão de 50 pessoas na medida em que iam chegando à bilheteria.
I. Hipótese de nulidade. H0: A ordem dos sexos (M e F) na fila é aleatória versus H1: A
ordem não é aleatória.
II. Prova Estatística. Escolhe-se a prova de iterações de uma amostra porque a
hipótese diz respeito à aleatoriedade de um único grupo.
III. Nível de significância. Seja α = 0,05. N = 50 (nº de pessoas).
IV. Distribuição amostral. Para grandes amostras, os valores de Z ~ Normal.
V. Região de rejeição. Como H1 não prediz o sentido do desvio em relação à
aleatoriedade, utiliza-se uma região de rejeição bilateral, que inclui todos os valores de
z iguais a, ou mais extremos do que, ∓ 1,96.
Os dados foram coletados foram 30 homens (M) e 20 mulheres (F):
M F M F M M M F F M F M F
M F M M M M F M F M F M M
F F F M F M F M F M M F
M M F M M M M F M F M M
Neste caso, r =35 iterações; n1 = 30, e n2 = 20. Então:

2𝑛1 𝑛2 2(30)(20)
𝑟−( + 1) 35 − ( + 1)
𝑛1 + 𝑛2 30 + 20
𝑧= = = 2,98
2𝑛1 𝑛2 (2𝑛1 𝑛2 − 𝑛1 − 𝑛2 ) 2(30)(20)[2(30)(20) − 30 − 20]
√ √
(𝑛1 + 𝑛2 )2 (𝑛1 + 𝑛2 − 1) (30 + 20)2 (30 + 20 − 1)

A Tabela A mostra que a probabilidade de ocorrência, sob H0, de 𝑧 ≥ 2,98 é:


𝑝 = 2(0,0014) = 0,0028 < 0,05.
Decisão: rejeitar a H0, isto é, naquela fila a ordem de homens e mulheres não foi
aleatória.

Você também pode gostar