Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introdução
envolvidas possuem a mesma variância, ou que existe uma relação conhecida entre elas.
No caso Normal, o teste estatístico que se obtém é geralmente uma função da média
Poisson. Continuaríamos ainda assim num procedimento baseado nos parâmetros que
proporção…)
operações aritméticas.
1
Os problemas surgem quando estes pressupostos não podem ser feitos, porque
geração dos dados. Podemos neste contexto recorrer a utilização de teste não
paramétrico, ou seja, testes cujo modelo não especifica condições sobre os parâmetros
Uma vantagem dos testes não paramétricos consiste no facto de não exigirem
mensurações tão fortes quanto as provas paramétricas; a maior parte dos testes não
nominal. Efectivamente, em muitos dos testes a que recorremos nem sequer dão uma
situações, temos apenas acesso às ordens e não às observações que as originaram, pelo
que será melhor optar por um método que não faça especificações sobre os parâmetros
populacionais.
Apesar de tudo, caso sejam cumpridas as condições para que possam ser
2
menos intervalar), estas deverão ser utilizadas preferencialmente pois são mais poderosa
do que qualquer outra para rejeitar a hipótese nula quando ela é falsa.
Neste curso apenas dedicaremos a nossa atenção aos testes 1-4, mesmo nestas
Os testes podem também ser divididos em categorias com base nos pressupostos
Observe-se que quando nos referimos a testes não paramétricos, não significa
3
2. Testes de localização
distribuição populacional.
Para muitos destes testes, os dados devem ser medidos numericamente pelo
menos numa escala ordinal de modo que um par de observações possa ser comparada e
para o maior. Os ranks obtidos contêm toda a informação dos dados originais, e deste
Para uma amostra ou o caso emparelhado, a estatística de teste pode ser obtida a
partir do número de observações (ou diferenças) menores que zero (ou outro valor fixo),
assim como pelo sinal obtido. Sob a hipótese que a mediana de uma única população é
valores positivos e negativos deverá ser similar. O teste de Wilcoxon vai mais além do
mediana.
medianas, a distribuição dos ranks de cada amostra na amostra global deverá ser similar.
cada amostra e sumaria as diferenças em soma de ranks para cada amostra, deverá ser
computada. Estas hipóteses podem também ser testadas utilizando o teste da mediana.
Este teste estatístico é baseado no número de valores em cada amostra que é maior (ou
menor) que a mediana da amostra global, em vez dos ranks de cada amostra.
4
2.1 Localização de uma população
que pode em muitos casos proporcionar melhores resultados. Neste contexto, os testes
O teste do Sinal
hipótese do género:
H 0 :η = η0
H 1 : η ≠ η 0 ou (η < η 0 ou η > η 0 )
observações com valor inferior a η 0 (ou superior) é uma variável aleatória com
parâmetro p = 0.5 . Deste modo, o nosso teste de hipóteses pode ser representado
alternativamente por
H 0 : p = 0.5
ET = Y
5
Para amostras de grandes dimensões, a distribuição normal constitui uma boa
pˆ − 0.5
ET = que segue uma distribuição normal padrão.
0.25
N
Para efectuar o teste do sinal para uma amostra no SPSS, deve proceder-se do
seguinte modo:
Analyse→Nonparametric tests→binomial…
facilmente podemos construir uma função nesta linguagem que nos permite ajustar este
teste:
sign.test<-function(x,y=NULL,n,population="two"){
if(population=="two"){
if(length(x)!=length(y)) stop("As duas variáveis devem ter a mesma dimensão")
}
else {y<-rep(n,length(x))}
d<-x-y
binom.test(sum(d>0),length(d)-sum(d==0)) }
O teste de Wilcoxon
No teste do sinal não temos em conta a magnitude das diferenças de valor entre
simétrica.
6
Para populações contínuas e simétricas, se a amostra é aleatória e H 0
simétrica.
valores d i negativos.
W − n(n + 1) / 4
ET = que segue uma distribuição normal padrão.
n(n + 1)(2n + 1) / 24
7
5. Em caso de empates, deve-se atribuir o valor médio do número de ordem
ocupado pelas observações. No que diz respeito aos zeros, recomenda-se que se
Exercícios:
contos/mês. Admita-se ainda que uma amostra aleatória constituída por 12 famílias que
44.0 46.6 48.2 51.8 60.3 61.7 63.6 72.7 77.4 82.4 96.1 105.6
Será que, perante estes dados, se poderia concluir que o rendimento mensal mediano na
veículo que percorre 15000 km/ano é de 59 contos. Numa amostra constituída por 130
pertencentes a outra marca, verificaram-se 53 situações nas quais o custo foi superior a
custo de manutenção (no terceiro ano de vida e para uma quilometragem anual de 15000
8
3. Um médico pediatra pretende avaliar se o peso mediano dos bebés recém-nascidos do
sexo feminino numa pequena vila de província é inferior ao da mediana nacional, que se
admite ser de 3.3 kg. Tal avaliação será baseada nos pesos das nove meninas nascidas
4. Num relatório recentemente publicado num determinado país, afirma-se que 50% das
PME’s que consomem propano, pagam as suas contas de gás no prazo de 14 dias úteis
Uma das empresas que distribui propano para fins industriais recolheu uma amostra
aleatória constituída pelos números de dias que 10 dos seus clientes demoraram a pagar
34 3 4 44 29 17 32 14 28 16
R> x1s<-c(44,46.6,48.2,51.8,60.3,61.7,63.6,72.7,77.4,82.4,96.1,105.6)
R> sign.test(x1s,n=60,population="one")
mantenha a hipótese nula que o rendimento mediano é igual a 60 contos (valor de prova
= 0.3877).
9
No SPSS, escolhendo na barra de menus escolher
Analyse→Nonparametric tests→binomial…
Binomial Test
R> wilcox.test(x1s,mu=60)
data: x1s
V = 54, p-value = 0.2661
alternative hypothesis: true location is not equal to 60
10
2.2 Localização relativa de duas populações: amostras emparelhadas
condições, a variável aleatória diferença entre pares de observações pode servir de base
Teste do sinal
Para o teste do sinal não existem requisitos quanto à forma da distribuição dos
hipótese nula há igual probabilidade de termos y i > xi como de termos xi > y i . Para
11
Observações:
1. Quando o teste do sinal é aplicado sobre variáveis dicotómicas, toma o nome de teste
Teste de Wilcoxon
apresenta-se como uma melhoria em relação ao teste do sinal, porque ao contrário deste
seus resultados nas duas situações. Deste modo, o teste de Wilcoxon ordena e classifica
hipótese nula, espera-se que as médias das diferenças sejam aproximadamente iguais
12
2. Calculam-se os valores absolutos das diferenças das observações originais, isto é,
d i = xi − y i para i = 1,..., n .
5. Calcular o valor da estatística que resulta da soma dos números de ordem positivos
W − n(n + 1) / 4
ET =
n(n + 1)(2n + 1) / 24
corrigido, vindo:
n(n + 1)(2n + 1)
∑u − ∑u
3
i i
σW = − i i
24 48
13
Observação: Para verificarmos de uma forma rude que as diferenças sejam uma amostra
a gravidade das lesões provocadas por excesso de exposição solar dos ombros de 10
indivíduos serem em geral de idêntica gravidade. Um dos ombros é tratado com o novo
Vejamos então o que nos indicam os testes dos sinais bem como o de Wilcoxon
H 0 : p = 0.5
14
Utilizando o software SPSS, o resultado do teste é o seguinte:
Frequencies
N
Y-X Negative
2
Differences(a)
Positive
6
Differences(b)
Ties(c) 1
Total 9
a Y<X
b Y>X
c Y=X
Decorre da análise desta tabela que a cicatrização é mais rápida com o novo
cicatrização é mais rápida com o novo medicamento é claramente superior aos casos
onde a cicatrização é mais rápida com o medicamento usual. Terão essas diferenças
significado estatístico?
Test Statistics(b)
Y-X
Exact Sig. (2-tailed) ,289(a)
a Binomial distribution used.
b Sign Test
casos, esperaríamos ver uma diferença destas quando a hipótese nula fosse verdadeira.
Deve por isso, aceitar-se a hipótese nula que afirma não haver diferença significativa
Caso tivéssemos optado pelo teste unilateral à esquerda, o teste do sinal conduz
15
b Y>X
c Y=X
Esta tabela mostra que a média das classificações para quando os tempos de
cicatrização são menores com o novo medicamento é 32; enquanto que para os caso em
Test Statistics(b)
Y-X
Z -1,960(a)
Asymp. Sig. (2-tailed) ,050
a Based on negative ranks.
b Wilcoxon Signed Ranks Test
comandos:
R> x<-c(15.4,19.3,4.2,19.3,45.2,18.6,11.2,18.1,33)
R> y<-c(14.7,28.9,7.4,19.3,54.2,27.4,12.8,15.4,36.4)
R> sign.test(x,y)
data: x and y
V = 4, p-value = 0.05871
alternative hypothesis: true location shift is not equal to 0
16
Este comando utilize por defeito uma correcção de continuidade para obter o
valor de prova. Se não queremos esta correcção e assim obter os mesmos resultados que
Exercícios:
Antes: 182 232 191 200 148 249 276 213 241 480 262
Depois: 198 210 194 210 138 220 219 161 210 313 226
17
2: Realizou-se um estudo para investigar o efeito de uma dieta vegetariana no nível de
Antes Depois
195 146
145 155
205 178 Com base nos resultados apresentados, poder-se-á concluir, ao
159 146
244 208 nível de significância de 5%, que uma dieta vegetariana reduz o
166 147
250 202 nível de colesterol no sangue? E para um nível de significância de
236 215
192 184 1%?
224 208
238 206
197 169
169 182
158 127
151 149
197 178
180 161
222 187
168 176
168 145
167 154
161 153
178 137
137 125
18
2.3 Localização relativa de duas ou mais populações: amostras independentes
O teste de Mann-Whitney (M-W)
Para utilizarmos este teste necessitamos que a forma das distribuições seja a
mesma para os dois grupos, ou seja, que as variâncias das populações sejam iguais para
os dois grupos.
H 1 : η A ≠ η B ou (η A < η B ou η A > η B )
a cada observação.
4. Para valores pequenos podemos recorrer ao uso de tabelas. Quando a hipótese nula é
W − n B (n + 1) / 2
ET =
n A n B (n + 1) / 12
19
5. Quando surgem observações empatadas devemos seguir o procedimento descrito no
⎛ ⎞
n A nB ⎜ ∑ ui − ∑ ui ⎟
3
n A n B ( N + 1) ⎝ i ⎠
σW = − i
12 12n(n − 1)
eléctrica por habitante em duas regiões relativamente pobres têm a mesma mediana. Os
Região A: 0.237 0.235 0.423 0.398 0.241 0.237 0.344 0.449 0.741 0.405
Região B: 0.341 0.482 0.464 0.256 0.908 0.286 0.518 0.326
20
Ranks
Deste modo podemos observar que a região A tem consumos anuais por
Test Statistics(b)
A
Mann-Whitney U 27,000
Wilcoxon W 82,000
Z -1,156
Asymp. Sig. (2-tailed) ,248
Exact Sig. [2*(1-tailed
Sig.)] ,274(a)
não é suficientemente elevada para rejeitar a hipótese nula (para o nível de significância
de 5%).
No software estatístico R:
R> RegA<-c(0.237,0.235,0.423,0.398,0.241,0.237,0.344,0.449,0.741,0.405)
R> RegB<-c(0.341,0.482,0.464,0.256,0.908,0.286,0.518,0.326)
R> wilcox.test(RegA,RegB,correct=FALSE)
21
Exercícios:
Periferia: 126.6 133.7 136.6 142.0 146.4 147.1 147.5 148.3 148.8 152.7
155.1 155.2 159.0 164.5 167.3 173.6 175.4 175.8 179.5 185.4
Capital: 138.0 147.9 155.7 158.0 170.0 172.0 173.1 173.3 176.8 177.9
178.1 178.4 179.3 179.4 183.7 189.8 191.0 195.7 195.9 221.5
2. Uma empresa de construção civil e imobiliária colocou à venda uma série de andares
de luxo. O seu gerente deseja confirmar se o facto de os seus potenciais clientes verem
A 15 clientes potenciais que apenas tiveram acesso a um folheto que descreve o andar,
63 33 44 47 55 39 60 45 24 31 53 30 36 69 54
A mesma pergunta foi feita a outros 12 potenciais clientes que, para além de terem visto
foram as seguintes:
65 45 43 71 52 51 64 35 59 75 67 48
22
O teste de Kruskal-Wallis (K-W)
2
12 k R
H= ∑ − 3(n + 1)
j
n(n + 1) j =1 n j
Sob validade de H 0 e desde que o tamanho das k amostras não sejam muito
k − 1 graus de liberdade.
23
Exemplo: Experimentaram-se 4 tipos de tratamento em vinte doentes com cancro do
concluir não haver diferenças significativas entre os quatro tratamentos, no que respeita
ao tempo de sobrevivência?
Ranks
Test Statistics(a,b)
numero de
anos de
sobrevivência
Chi-Square 1,949
df 3
Asymp. Sig. ,583
a Kruskal Wallis Test
b Grouping Variable: tipo de tratamento
Verifica-se que as médias das classificações são muito semelhantes para todos os
grupos. Além disso, o nível de significância é muito elevado, pelo que se deve aceitar a
hipótese nula que afirma que a distribuição é igual para todos os grupos.
24
No software estatístico R:
R> data<-c(14.2,10.6,9.4,5.6,2.4,12.8,12.3,6.4,6.1,1.6,11.5,10.1,5.1,5,4.8,14.9,13.7,8.5,7.7,5.9)
R> G<-c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4)
R> kruskal.test(data,G)
3. Testes de ajuste
observações segue ou não uma determinada distribuição. Para o caso de duas amostras,
Para o caso de uma amostra a hipótese nula pode especificar apenas a forma
duas amostras, a estatística proporciona uma medida para a diferença obtida para cada
25
3.1 Ajuste de uma amostra a uma distribuição teórica
Teste do Qui-quadrado
amostral constituída por observações expressas numa qualquer escala e uma distribuição
teórica. Este teste compara as frequências dos valores observados com as frequências
(a) não exitirem mais de 20% de categorias com valores esperados inferiores a 5.
Podemos contudo agregar algumas categorias contíguas, caso alguma das regras
seja violada.
hipótese nula. Denotamos essas frequências por ek , sendo dadas por ek = np k , onde p k
5. A estatística de teste é construída com base numa medida global de ajuste entre as
26
k
(nk − ek )2
ET = Q = ∑
k =1 ek
dimensão da amostra é grande, a estatística Q segue uma distribuição χ (2k −1) − r onde r
6. A rejeição ou não da hipótese nula será feita com base na comparação do valor da
modo:
Analyse→Nonparametric tests→Chi-square…
definem uma categoria, seleccionar Get from data. Caso contrário, seleccionar Use
27
Exemplo: No posto de inspecção final de uma fabrica de fogões, os aparelhos são
pôde concluir-se que o número de defeitos (Y) por aparelho submetido à inspecção final
No software estatístico R:
R> Freq<-c(16,32,20,13,8,11)
R> p<-c(0.135336,0.270671,0.27067,0.180447,0.090224,0.052652)
R> chisq.test(Freq,p=p)
data: Freq
X-squared = 10.9661, df = 5, p-value = 0.05206
28
Teste de Kolgomorov-Smirnov (K-S)
definida rigorosamente. Esta vantagem é mais clara para amostras pequenas. Por outro
lado, este é um teste mais potente do que o teste Qui-quadrado. Em contrapartida, exige
Este teste tem por base a análise da proximidade ou ajuste entre a função
1. Constituir as hipóteses:
H 1 : F ( x ) ≠ F0 ( x )
3. Comparar o valor D com o valor crítico (recorrendo ao uso de tabelas), para o nível
29
Para efectuar o teste K-S no R, deve utilizar-se a função ks.test.
Exemplo:
provável (em graus) das uvas anualmente entregues para vinificação pelo conjunto dos
seus sócios, segue uma distribuição Normal com valor esperado 10º e desvio padrão 1º.
Pretende-se testar a validade desta conjectura a partir dos dados obtidos nos últimos 20
11.9 10.6 13.3 11.6 12.9 10.4 11.3 13.5 9.1 8.2 11.6 10.0 11.3 10.3 8.4
9.9 11.0 10.3 13.2 9.9
Testar se o valor médio do álcool provável segue uma distribuição normal, mas agora
com valor esperado e desvio padrão iguais às estimativas obtidas pela amostra.
são provenientes de uma distribuição normal com média (amostral) de 10,935 e desvio
padrão (amostral) igual a 1,5346. Para esta situação devemos aceitar a hipótese nula de
alcool em
graus
N 20
Normal Parameters(a,b) Mean 10,935
Std. Deviation 1,5346
Most Extreme Absolute ,100
Differences Positive ,086
Negative -,100
Kolmogorov-Smirnov Z ,447
Asymp. Sig. (2-tailed) ,988
a Test distribution is Normal.
b Calculated from data.
30
No software estatístico R:
R> Alcool<-c(11.9,10.6,13.3,11.6,12.9,10.4,11.3,13.5,9.1,8.2,11.6,10,11.3,10.3,8.4,9.9,
11,10.3,13.2,9.9)
R> ks.test(Alcool,"pnorm",10,1)
Observação: cuidado que o que o SPSS testou foi se os dados eram provenientes de
uma distribuição normal cujos parâmetros foram estimados a partir dos dados. Os
média 10 e desvio padrão 1. Aproveitamos para referir que caso se deseje testar a
R> shapiro.test(Alcool)
data: Alcool
W = 0.9607, p-value = 0.557
seguinte modo:
R> ks.test(Alcool,"pnorm",mean(Alcool),sd(Alcool))
data: Alcool
D = 0.1, p-value = 0.9882
alternative hypothesis: two-sided
31
Exercícios:
modelo corresponde à diferença entre a data de chegada dos navios provenientes dos
EUA e a respectiva data planeada. Dado que tal diferença é influenciada por muitos
1.8 -6.6 -7.4 4.4 -9.0 -2.0 2.4 -2.8 -6.0 15.2
-11.6 -5.8 2.2 4.0 5.0 20.6 -1.8 12.4 -8.9 -2.4
8.2 2.2 -5.6 13.2 -0.3 -1.8 -0.6 2.6 -7.6 -3.4
7.6 -4.2 -6.0 5.0 18.8 0.0 1.4 -10.0 3.6 -8.4
1.0 1.4 -3.8 0.4 -1.8 -4.0 -9.2 3.2 0.2 -1.8
passageiros que, tendo efectuado reserva, acabaram por não fazer o check in. Para cem
Nº ausências Nº voos
0 21
1 36
2 23
3 13
4 4
5 2
6 1
Teste, ao nível de significância de 5%, se a distribuição do número de ausências por voo
Desvios: {50 53 102 -39 112 64 -122 104 37 32 165 47 22 -46 91 140 -38
109 41 -33}
32
4. Num estudo sobre o desenvolvimento de colónias de bactérias numa solução de soro
resultados:
Teste do Qui-quadrado
ajuste de uma amostra a uma distribuição teórica. A diferença é que agora se pretende
comparar duas populações a partir das quais se obtêm amostras independentes. Como
no caso anterior, apenas se requer que as amostras sejam aleatórias e que possuam
atrás.
1. Constituir as hipóteses:
k
(nkA − ekA )2 k
(nkB − ekB )2
2. Calcular a estatística de teste: ET = Q = ∑ +∑ que segue,
i =1 ekA i =1 ekB
supondo a hipótese nula verdadeira, uma distribuição Qui-quadrado com k-1 graus de
33
frequências observadas nkA e nkB . Sob o pressuposto que H 0 é verdadeira, podemos
as vendas da sua marca ao longo da gama é idêntico nos países A e B. A tabela seguinte
apresenta a composição das vendas nestes mercados ao longo do último ano. Utilize um
No software estatístico R:
R> Table[,1]<-c(1034,892,734,280,80,26)
R> Table[,2]<-c(2225,2103,1754,685,202,32)
R> chisq.test(Table)
data: Table
X-squared = 11.3176, df = 5, p-value = 0.04543
34
35
Os resultados estão apresentados na forma de tabelas em baixo:
gama * pais Crosstabulation
Count
pais
País A País B Total
gama Baixa 1034 2225 3259
Média-Baixa 892 2103 2995
Média 734 1754 2488
Média-Alta 280 685 965
Alta 80 202 282
Luxo 26 32 58
Total 3046 7001 10047
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 11,318a 5 ,045
Likelihood Ratio 10,923 5 ,053
Linear-by-Linear
2,072 1 ,150
Association
N of Valid Cases 10047
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 17,58.
36
Teste de Kolgomorov-Smirnov (K-S)
1. Constituir as hipóteses:
Exemplo: Uma grande repartição de finanças foi escolhida para uma experiência piloto
Antes: 4.1 4.4 4.7 4.8 4.9 5.7 7.4 7.6 9.7 10.3 12.4 15.5
Depois: 3.8 5.0 6.3 6.6 6.7 6.9 8.5 8.6 8.9 9.5 9.8 10.2
37
4. Testes de associação e correlação
ordinal de Spearman. Essencialmente são baseados nos ranks em lugar dos valores
associação entre as duas variáveis será de esperar uma de duas situações: a diferença d i
para cada observação dos números de ordem do par tomará valores baixos ou valores
n(n − 1)
2
Este coeficiente toma valor 1 quando existe entre o conjunto de observações uma
38
Para dimensões de amostras superiores a 30, a estatística de teste pode ser
RS
substituída por: ET = que sob H 0 segue uma distribuição t-student
(1 − R )/(n − 2)
2
S
seguinte modo:
Analyse→Correlate→Bivariate…
100 metros 12.1 12.4 13.0 11.9 14.2 13.6 12.7 14.2 13.7 13.3 12.8 13.4
salto 6.93 6.76 5.94 7.70 5.61 6.32 7.08 5.30 5.86 6.04 7.13 6.76
Correlations
CORRIDA SALTO
Spearman's rho CORRIDA Correlation
1,000 -,856(**)
Coefficient
Sig. (2-tailed) . ,000
N 12 12
SALTO Correlation
-,856(**) 1,000
Coefficient
Sig. (2-tailed) ,000 .
N 12 12
** Correlation is significant at the 0.01 level (2-tailed).
39
Deste modo, devemos rejeitar a hipótese nula de que não existe associação entre
comprimento. Mais, podemos concluir que existe uma associação inversa, ou seja,
existe uma tendência para que atletas com melhores resultados na corrida obtenham
No software estatístico R:
R> Corrida<-c(12.1,12.4,13.0,11.9,14.2,13.6,12.7,14.2,13.7,13.3,12.8,13.4)
R> Salto<-c(6.93,6.76,5.94,7.70,5.61,6.32,7.08,5.30,5.86,6.04,7.13,6.76)
m(m − 1)
pares de amostras, calcular a correlação ordinal de Spearman para cada par,
2
m(m − 1)
implica ter de calcular coeficientes, o que pode ser uma tarefa maçadora e
2
longa.
m(m − 1)
atribuídas ao i-ésimo item é Ri , i = 1,2,..., I então a correlação ordinal entre os
2
40
12∑ Ri2 1 ⎡ 4I + 2 ⎤
rs medio = − + 3(I + 1)⎥
(
m(m − 1)I I − 1
2
) ⎢
I −1 ⎣ m −1 ⎦
Uma outra possibilidade que nos permite obter um nível de concordância entre
os dados é proporcionado pelo teste de Kendall, que é uma medida de acordo entre
completo).
Teste do Qui-quadrado
verificar-se aqui.
1. Constituir as hipóteses:
41
I J (n − eij )
2
J I
ni• = ∑ nij e n• j = ∑ nij .
j =1 i =1
Analyse→Descriptive Statistics→Crosstabs…
(b) Seleccionar as variáveis a comparar e colocá-las, uma na lista das linhas outra na
Exemplo: Admita-se que foi conduzida uma experiência no âmbito da qual se procurou
testar se existe alguma relação entre a qualidade de secagem de máquinas de lavar roupa
Velocidade
de rotação
900 rpm 9 10 7 4
1200 rpm 2 9 8 11
velocidade de centrifugação.
Exercícios:
1. Para testar a atitude de donas de casa relativamente ao novo detergente BMB, foi
distribuído um pacote deste detergente a cada uma de 350 donas de casa. As donas de
seguinte.
Cidade
F P L
Favorável 12 8 7
Indiferente 9 10 7
Atitude
Desfavorável 2 9 8
43
Presença nas aulas práticas (%) Sucessos (%)
95.2 60.5
94.7 72.8
84.6 71.3
83.1 64.7
79.7 66.2
72.6 56.5
70.8 56.0
70.8 60.8
64.1 52.4
62.9 45.7
49.2 33.2
41.8 33.2
5. Testes de aleatoriedade
identificar desvios da aleatoriedade. Existem muitas formas das quais uma sequencia se
investiga se as sequencias estão a ocorrer com maior ou menor frequência do que seria
prévia.
Podemos contudo, efectuar sempre a conversão de uma variável não dicotómica numa
variável dicotómica.
44
Suponhamos que se está a monitorizar os itens de uma linha de produção, para
NNNNDNNNNDDDDNNDDDDDN
NNNN) que é precedido ou seguido por uma observação do outro tipo (por exemplo,
D). A definição comporta sequências constituídas por uma única observação. Deste
sequências.
H 0 : A amostra é aleatória
ou
ou
R − μR
2. Calcular a estatística de teste: ET = Z = que sob H 0 , segue uma
σR
45
2n A n B
μR = +1
n
2n A n B (2n A n B − n )
σR =
n 2 (n − 1)
modo:
Analyse→Nonparametric tests→Runs…
Para o exemplo atrás referido recorremos ao SPSS. Para tal codificamos com 1
os “defeituosos” e com 0 os “não-defeituosos”. Obtivemos a seguinte tabela de
resultados:
Runs Test
SEQUENCI
Test Value(a) 1,48
Cases < Test Value 11
Cases >= Test Value 10
Total Cases 21
Number of Runs 7
Z -1,785
Asymp. Sig. (2-tailed) ,074
a Mean
46
Teste das sequências ascendentes e descendentes
Este teste aplica-se a observações expressas numa escala pelo menos ordinal.
{27, 68, 45, 53, 61, 61, 32, 19, 64, 65, 67, 69, 71, 37, 35}.
Se substituirmos pelo símbolo “+” cada observação precedida por uma outra de
valor inferior, e pelo símbolo “-“ cada observação precedida por uma outra de valor
Para esta nova representação, cada conjunto de sinais “+” representa uma
Repare-se que ocorreu uma situação com observações adjacentes iguais, e para o qual
tais zeros são ignorados para o cálculo da estatística, e a dimensão da amostra reduzida
H 0 : A amostra é aleatória
ou
47
H 1 : A amostra não é aleatória, pois existem tendências nas observações
ou
V − μV
2. Calcular a estatística de teste: ET = Z = que sob H 0 , segue uma distribuição
σV
normal padrão (para n maior que 26 aproximação é muito precisa). Para a variável V
tem-se que:
2n − 1
μV =
3
16n − 29
σV =
90
12
χ (2r ) =
mI (i + 1)
∑ Ri2 − 3m(I + 1)
chama a atenção para o facto de estarmos a trabalhar com correlação ordinal, e nada tem
48
No caso de as ordenações serem aleatórias, então a estatística χ (2r ) de Friedman,
m(I + 1) m(I 2 − 1)
com valor médio e variância . Assim, a variável aleatória
2 2
I +1
Ri − m
2
I −1
2
m
12
com I graus de liberdade, se não fosse a existência de uma ligação funcional entre os
mI (I + 1)
Ri ' s , ∑ Ri = , que reduz o número de graus de liberdade a I-1.
2
acordo entre ordenações, tendo como resultados valores que variam entre 0 (nenhum
mas só é aplicável quando todas as respostas são binárias. É uma extensão do teste de
Exemplo: Na tabela seguinte estão registadas as ordenações (de pior para melhor)
região
a b c d e f g h i j
Preço 4 1 5 6 9 8 10 7 3 2
Fiabilidade 4 1 5 8 10 7 9 6 3 2
Manutenção 3 2 5 9 8 6 10 7 4 1
Adaptação 4 1 2 7 5 9 8 10 6 3
Upgrades 4 2 7 6 10 9 8 5 3 1
Formação 2 3 7 6 5 9 8 4 10 1
Ranks
Mean Rank
A 3,50
B 1,67
C 5,17
D 7,00
E 7,83
F 8,00
G 8,83
H 6,50
I 4,83
J 1,67
50
Test Statistics
N 6
Kendall's
,727
W(a)
Chi-Square 39,273
Df 9
Asymp. Sig. ,000
a Kendall's Coefficient of Concordance
de teste obtivemos um valor de 39.27, que com 9 graus de liberdade, nos leva a rejeitar
classificações.
Exercícios:
{E, E, C, C, E, C, E, E, C, E, C, C, E, E, E, C, E, E, C, E, E, C, C, E, C}
2. Na tabela seguinte representa-se o peso (em toneladas) de uvas num hectare de vinha
Ano: 77 78 79 80 81 82 83 84 85 86
Peso: 3.56 4.40 5.42 6.51 8.30 5.78 5.22 4.67 7.68 8.34
Ano : 87 88 89 90 91 92 93 94 95 96
Peso: 9.89 7.35 5.15 3.80 5.62 7.73 7.93 6.35 8.92 9.77
51
EXERCÍCIOS
1. Numa investigação sobre as verbas envolvidas em “parapsicologia” obtiveram-se os
seguintes preços de consultas em Évora e em Lisboa (em euros)
Évora: 25 12 17 30 40 37 50
Lisboa: 40 30 10 20 25 30 75 25 25
Com base nestes dados teste a hipótese de homogeneidade dos preços de consultas nas
referidas cidades.
Antes : 123 145 143 134 112 143 148 145 138 124 133
Depois: 132 158 143 142 126 143 142 152 143 145 144
Comentários?
Individuo 1 2 3 4 5 6 7 8
Média diária 35.3 65.9 73.4 70.6 56.3 73.4 39.3 36.9
Média nocturna 39.0 58.8 70.6 58.7 53.1 72.6 42.2 63.1
Intervalos de 8 horas 1 2 3 4 5 6 7 8 9 10 11 12 13
Nº tremores de terra 33 32 30 41 23 17 27 20 15 12 27 17 25
52
6. Num estudo, pretende-se saber se as pessoas com alto grau de autoritarismo têm
maior tendência para possuir estereótipos sobre membros de diversos grupos nacionais e
étnicos, do que as pessoas com baixo grau de autoritarismo. Deste modo, recolheu-se
um grupo de estudantes universitárias seleccionadas aleatoriamente. Cada uma recebeu
20 fotografias e foi solicitada a “identificar” aquelas cuja nacionalidade reconhecia,
“casando” a fotografia apropriada com o nome do grupo nacional. Acontece que (sem
que as estudantes soubessem) todas as fotografias eram de indivíduos de nacionalidade
mexicana, e como na lista de 20 nacionalidades não incluía a mexicana, o número de
fotografias que cada uma “identificasse” constituiria um índice de sua tendência à
estereotipia. O grau de autoritarismo foi considerado como alto ou baixo, e os resultados
obtidos apresentam-se a seguir:
7. Estão a ser testados 3 aerossóis químicos para matar moscas. Na tabela abaixo
regista-se o número de moscas mortas em 18 ensaios.
A 72 65 67 75 62 73
Marca
B 55 59 68 70 53 50
C 64 74 61 58 51 69
Que conclui?
53
BIBLIOGRAFIA
2. Mosteller F. and Rourke R.E.K. (1993), Estatísticas Firmes, Edições Salamandra Lda.
Hill.
54