Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatstica Bsica
Verso Preliminar
Pelotas, 2009.
Sumrio
Unidade I. Introduo
1.1. Consideraes gerais................................................................................................
10
1.6. Bibliografia.................................................................................................................
12
14
18
2.1.3. Grficos.............................................................................................................. 21
2.2. Distribuies de freqncias e grficos.................................................................. 24
2.2.1. Tabelas de classificao simples....................................................................... 24
2.2.2. Tabelas de classificao cruzada......................................................................
33
37
45
49
52
64
68
69
77
79
92
92
130
137
166
171
196
197
Apndice
1. Notao somatrio..................................................................................................... 205
2. Noes sobre conjuntos...........................................................................................
206
3. Notao fatorial..........................................................................................................
209
213
219
Unidade I
Introduo
10
1.6. Bibliografia.................................................................................................................
12
Introduo
Introduo
Jonh Graunt
(1620 - 1674)
William
(1623 - 1687)
Petty
Introduo
Introduo
Escala nominal
Uma varivel de escala nominal classifica as unidades em classes ou categorias
quanto caracterstica que representa, no estabelecendo qualquer relao de grandeza ou de
ordem. denominada nominal porque duas categorias quaisquer se diferenciam apenas pelo
nome.
A escala nominal a menos restritiva. A igualdade ou equivalncia de classes
caracterizada pelas seguintes trs propriedades:
reflexividade: cada unidade em uma classe igual a ela prpria;
simetria: para cada duas unidades em uma mesma classe, sejam A e B, A=B implica
B=A;
transitividade: para quaisquer trs unidades em uma classe, sejam A, B e C, A=B e
B=C implica A=C.
Os rtulos das categorias eventualmente podem ser numricos, mas operaes
aritmticas sobre esses nmeros no tm qualquer significado com respeito aos objetos do
mundo real que eles identificam. A escala nominal permite apenas algumas operaes
aritmticas mais elementares. Pode-se contar o nmero de elementos de cada classe e
determinar a classe mais numerosa ou efetuar testes de hipteses estatsticas referentes
distribuio das unidades da populao nas classes. Como uma escala nominal apenas
classifica unidades, mas no infere grau ou quantidade, as vrias classes no podem ser
manipuladas matematicamente (por exemplo, por adio ou subtrao de equivalentes
numricos daquelas classes). Consequentemente, a maioria das estatsticas usuais, como
mdia e desvio padro no tm sentido, pois as operaes para sua determinao no so
permitidas. Se tudo o que pode ser dito sobre um objeto que ele diferente de outros, ento
a escala de medida nominal.
Escala ordinal
Uma varivel de escala ordinal classifica as unidades em classes ou categorias quanto
caracterstica que representa, estabelecendo uma relao de ordem entre as unidades
pertencentes a categorias distintas. A escala ordinal uma escala de ordenao, designando
uma posio relativa das classes segundo uma direo. Qualquer conjunto de valores que
preservem a ordem so vlidos para essa varivel tornando, dessa forma, a escala ordinal
invariante sob transformaes que preservem a ordem. Ou seja, uma escala ordinal pode ser
transformada em outra escala ordinal. Isto implica que, se eventualmente forem empregados
nmeros para representar as classes, apenas a propriedade de ordem deve ser respeitada.
Assim como na escala nominal, operaes aritmticas (somas, diferenas, etc.) entre
esses valores no tm sentido. A escala ordinal mantm a propriedade da equivalncia de
classes da escala nominal, no sentido de que unidades equivalentes recebem a mesma ordem.
Alm da propriedade de simetria da escala nominal, a escala ordinal tem a propriedade de
assimetria. Isso significa que classes podem ser designadas no apenas como equivalentes a
outras classes, mas tambm como no equivalentes. Assim, por exemplo, uma escala ordinal
pode designar que a classe A maior do que a classe B e, portanto, que a classe B menor
que a classe A. A propriedade de transitividade preservada na escala ordinal: se a classe A
maior ou mais elevada que a classe B, qualquer unidade particular da classe A maior ou mais
elevada que qualquer unidade especfica da classe B.
Essas propriedades adicionais caracterizam a superioridade da escala ordinal em
relao escala nominal. Entretanto, as descries estatsticas ainda so limitadas. As
medidas descritivas restringem-se ao grupo das medidas de ordem (separatrizes) porque as
operaes aritmticas usuais no podem ser efetuadas com smbolos que caracterizam apenas
ordem e designam quantidade vagamente. Alguns procedimentos estatsticos so
especificamente apropriados para dados de ordem. Se o que pode ser dito sobre um objeto
que ele maior, melhor, mais colorido, etc. que outro, ento a escala ordinal.
Introduo
Escala intervalar
Uma varivel de escala intervalar, alm de ordenar as unidades quanto
caracterstica mensurada, possui uma unidade de medida constante. A escala intervalar, ou
escala de intervalo, aproxima-se da concepo comum de medida, mas no possui uma origem
(ou ponto zero) nica. O ponto zero dessa escala arbitrrio e no expressa ausncia de
quantidade.
Os exemplos mais comuns de escala de intervalo so as escalas Celsius e Fahrenheit,
usadas para medir a temperatura. Cada uma dessas escalas assinala um zero arbitrrio e
diferenas de temperatura iguais so determinadas atravs da identificao de volumes iguais
de expanso no lquido usado no termmetro. Dessa forma, a escala de intervalo permite
inferncias referentes a diferenas entre unidades a serem medidas, mas no se pode dizer
que um valor em um intervalo especfico da escala seja um mltiplo de outro. Por exemplo, a
mensurao da temperatura de unidades permite determinar quanto uma mais quente do que
outra, mas no correto dizer que um objeto com 30oC est duas vezes mais quente que um
com temperatura de 15oC.
Segundo a frmula de converso de graus Celsius para graus Fahrenheit,
F = 9 5 C + 32 , essas temperaturas, 30oC e 15oC, expressas em graus Fahrenheit so,
respectivamente 86oF e 59oF, que no esto na razo 2:1. Pode-se dizer, entretanto, que uma
diferena entre dois valores em uma escala um mltiplo de uma diferena entre dois outros
valores. Por exemplo, a diferena 30 C 0 C o dobro da diferena 15 C 0 C . As
correspondentes diferenas na escala Fahrenheit so 86 F 32 C e 59 F 32 C , que esto
na mesma razo 2:1.
A escala intervalar invariante sob transformaes lineares positivas (ou seja,
transformaes da forma y = a + bx, b > 0 ). Isso significa que uma escala de intervalo pode ser
transformada em outra por meio de uma transformao linear positiva. A transformao de
graus Celsius em Fahrenheit um exemplo de transformao linear.
A maioria das medidas descritivas, tais como mdia, desvio padro, coeficiente de
correlao, requer apenas escala de intervalo. Entretanto, algumas medidas, como o
coeficiente de variao, podem ser enganosas quando aplicadas a dados de varivel de escala
intervalar. Se o que pode ser dito sobre um objeto que ele tantas unidades maior que outro,
ento a escala de medida intervalar.
Escala de razo
Uma varivel de escala de razo ou racional ordena as unidades quanto
caracterstica mensurada, possui uma unidade de medida constante e sua origem (ou ponto
zero) nica. Nessa escala o valor zero expressa ausncia de quantidade. A escala de razo,
ou escala racional, a mais elaborada das escalas de medida, no sentido de que permite todas
as operaes aritmticas. a escala de medida mais comum nas cincias fsicas, tais como as
escalas para a medida de comprimento, peso, etc.
Conforme a designao sugere, razes iguais entre valores da escala racional
correspondem a razes iguais entre as unidades mensuradas. Dessa forma, escalas de razo
so invariantes sob transformaes de proporo positivas, ou seja, transformaes da forma
y = cx, x > 0 . Por exemplo, se uma unidade tem 3m e a outra 1m, pode-se dizer que a primeira
unidade tem altura 3 vezes superior a da segunda. Isso porque, se as alturas das duas
unidades forem transformadas em centmetros, suas medidas sero, respectivamente, 300cm e
100cm, que esto na mesma razo 3:1. Pode-se efetuar a transformao das medidas de uma
escala racional para outra escala racional meramente pela multiplicao por uma constante
apropriada. Se puder ser dito que um objeto tantas vezes maior, mais pesado, etc. que outro,
ento a escala de medida de razo.
A escala racional contm toda a informao das escalas de nvel mais baixo, ou seja,
igualdade de classe, ordem e igualdade de diferenas, e mais ainda. Todas as medidas
descritivas podem ser determinadas para dados de uma varivel expressa em escala racional.
Introduo
Introduo
observao em uma determinada pesquisa. Os valores obtidos para a varivel medida nas
unidades de observao (nas plantas) so os dados.
Observao o conjunto de valores referentes a todas as variveis medidas em uma
unidade de observao. Por exemplo, os valores referentes ao peso de matria seca,
estatura e ao nmero de perfilhos de uma planta constituem uma observao. O conjunto de
todas as observaes, ou seja, todos os valores referentes a todas as unidades de observao,
constituem o conjunto de dados.
As variveis so representadas por letras maisculas (X, Y, Z, etc) e os seus valores
(dados) por letras minsculas (x, y, z, etc.). Assim, se uma varivel representada por X (xis
maisculo), todos os seus valores sero representados por x (xis minsculo).
Para diferenciar ou individualizar os valores de uma varivel, acrescenta-se um ndice
i = 1, 2, ..., n, que representa a unidade ou a observao. Assim, um conjunto de n valores de
uma varivel X ser representado por x1, x2, x3, ..., xn.
Como exemplo, tomemos o conjunto de dados apresentado na tabela abaixo. Esse
conjunto constitudo por 19 unidades ou observaes (i), uma varivel identificadora (nome),
uma varivel do tipo fator (sexo) e trs variveis numricas contnuas (idade, estatura e peso).
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Nome
Alfredo
Carol
Jane
Joo
Lusa
Roberto
William
Brbara
Juca
Joca
Judite
Felipe
Tomas
Alice
Henrique
Janete
Joice
Maria
Ronaldo
Sexo
M
F
F
M
F
M
M
F
M
M
F
M
M
F
M
F
F
F
M
Idade
14
14
12
12
12
12
15
13
12
13
14
16
11
13
14
15
11
15
15
Estatura
1,75
1,60
1,52
1,50
1,43
1,65
1,69
1,66
1,46
1,59
1,63
1,83
1,46
1,44
1,61
1,59
1,30
1,69
1,70
Peso
51,03
46,49
38,33
45,13
34,93
58,06
50,80
44,45
37,65
38,10
40,82
68,04
38,56
38,10
46,49
51,03
22,91
50,80
60,33
A
a1
a2
a3
...
a19
B
b1
b2
b3
...
b19
X
x1
x2
x3
...
x19
Y
y1
y2
y3
...
y19
Z
z1
z2
z3
...
z19
11
Introduo
1.6. Bibliografia
COSTA, S.F. Introduo Ilustrada Estatstica (com muito humor!). 2.ed., So Paulo:
Harbra, 1992. 303p.
FARIA, E.S. de. Estatstica. Edio 97/1. (Apostila)
FERREIRA, D.F. Estatstica Bsica. Lavras: Editora UFLA, 2005, 664p.
FREUND, J.E., SIMON, G.A. Estatstica Aplicada.
Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p.
Economia,
Administrao
12
Unidade II
Estatstica Descritiva
14
18
2.1.3. Grficos............................................................................................................. 21
2.2. Distribuies de frequncias e grficos.................................................................. 24
2.2.1. Tabelas de classificao simples...................................................................... 24
2.2.2. Tabelas de classificao cruzada..................................................................... 33
2.3. Medidas descritivas................................................................................................... 36
2.3.1. Medidas de localizao ou tendncia central...................................................
37
45
49
52
64
Estatstica Descritiva
2. Estatstica Descritiva
O mtodo cientfico, quando aplicado para soluo de um problema cientfico,
frequentemente gera dados em grande quantidade e de grande complexidade. Desse modo, a
anlise da massa de dados individuais, na maioria das vezes, no revela a informao
subjacente, gerando a necessidade de algum tipo de condensao ou resumo dos dados.
A Estatstica Descritiva a parte da Estatstica que desenvolve e disponibiliza
mtodos para resumo e apresentao de dados estatsticos com o objetivo de facilitar a
compreenso e a utilizao da informao ali contida.
Em resumo, a Estatstica Descritiva tem por finalidade a utilizao de tabelas, grficos,
diagramas, distribuies de frequncia e medidas descritivas para:
examinar o formato geral da distribuio dos dados;
verificar a ocorrncia de valores atpicos;
identificar valores tpicos que informem sobre o centro da distribuio;
verificar o grau de variao presente nos dados.
Evidentemente, a validade do resumo dos dados est intimamente ligada quantidade
de informao disponvel e qualidade da obteno dos dados. Pode-se pensar que todo
mtodo descritivo possui uma entrada, os dados, e uma sada, que pode ser uma medida
descritiva ou um grfico. Se a entrada deficiente a sada tambm ser de m qualidade.
2.1. Apresentao de dados
2.1.1. Sries Estatsticas
A reunio ou agrupamento de dados estatsticos, quando apresentados em tabelas ou
em grficos, para apreciao ou investigao, determina o surgimento das sries estatsticas.
As sries estatsticas resumem um conjunto ordenado de observaes atravs de trs
fatores fundamentais:
a) tempo: refere-se a data ou a poca em que o fenmeno foi investigado;
b) espao: refere-se ao local ou regio onde o fato ocorreu;
c) espcie: refere-se ao fato ou fenmeno que est sendo investigado e cujos
valores numricos esto sendo apresentados.
As sries estatsticas so classificadas de acordo com o fator que estiver variando,
podendo ser simples ou mistas.
Sries simples: so aquelas em que apenas um fator varia. Podem ser de trs tipos:
Srie histrica (temporal ou cronolgica ou evolutiva): onde varia o tempo
permanecendo fixos o espao e a espcie do fenmeno estudado.
Exemplo:
Tabela 2.1. Casos de sarampo notificados no Brasil de 1987 a 1992.
Ano
Nmero de casos
1987
1988
1989
1990
1991
1992
65.459
26.173
55.556
61.435
45.532
7.934
14
Estatstica Descritiva
kcal/per capita/dia
Brasil
Estados Unidos
Etipia
Japo
Mxico
2.174
2.397
2.120
1.125
2.114
Nmero de cabeas
Aves
Bovinos
Sunos
Ovinos
Caprinos
Equinos
1.232.978.796
14.951.359
13.305.932
926.818
803.188
165.691
Sries mistas: so aquelas em que mais de um fator varia ou um fator varia mais de
uma vez.
Exemplos:
Srie histrica geogrfica (ou geogrfica histrica)
Tabela 2.4. Taxa de atividade feminina urbana (em percentual) em trs
regies do Brasil, 1981/90.
Regio
Norte
Nordeste
Sudeste
Ano
1981
1984
1986
1990
28,9
30,2
34,9
30,3
32,6
37,2
34,0
34,3
40,1
37,1
37,8
40,7
15
Estatstica Descritiva
Hortalias
Carnes
Pescado
44,5
54,3
46,7
36,2
48,9
21,6
24,7
26,1
24,1
34,2
1,3
4,9
2,9
1,7
1,5
1984
1985
1986
1987
20,6
17,3
17,9
16,8
Pneumonia
12,1
11,7
12,0
10,8
Perinatal
42,4
45,8
45,3
48,0
Vtimas fatais
Vtimas no fatais
1991
1992
1991
1992
1.188
3.857
11.555
4.402
2.220
23.222
1.165
3.843
10.217
4.213
1.949
21.387
10.229
23.774
130.938
61.797
22.147
248.885
9.739
23.942
159.669
58.832
22.086
274.268
16
Estatstica Descritiva
Srie distribuio de frequncias: ocorre quando nenhum dos fatores varia. Nesta
srie os dados so agrupados em classes (intervalos com limites predeterminados) segundo
suas respectivas frequncias. Segundo a natureza dos dados, as distribuies de frequncias,
podem ser de dois tipos.
Para dados de enumerao
Tabela 2.8. Nmero de alarmes falsos, acionados acidentalmente ou por
mau funcionamento do equipamento, recebidos diariamente por uma
empresa de segurana, na cidade de Pelotas, no ms de abril de 2003.
Classes
(Nmero de alarmes falsos)
Frequncia
(Nmero de dias)
2
3
4
5
6
7
8
Total
2
6
8
4
5
3
2
30
Frequncia
(Peso, em kg)
(Nmero de estudantes)
40 | 50
50 | 60
60 | 70
70 | 80
80 | 90
Total
12
28
25
10
5
80
A srie distribuio de frequncias ser abordada com maiores detalhes na Seo 2.2
desta unidade.
17
Estatstica Descritiva
2.1.2. Tabelas
A tabela a forma no discursiva de apresentar informaes, das quais o dado
numrico se destaca como informao central. Sua finalidade apresentar os dados de modo
ordenado, simples e de fcil interpretao, fornecendo o mximo de informao num mnimo de
espao.
A construo de uma tabela, entretanto, deve obedecer a uma srie de normas
tcnicas. Estas normas podem ser encontradas na publicao do IBGE intitulada "Normas de
Apresentao Tabular" que tem como objetivo orientar a apresentao racional e uniforme de
dados estatsticos na forma tabular.
Seguem abaixo algumas das principais normas e recomendaes.
Elementos da tabela
Uma tabela estatstica composta de elementos essenciais e elementos
complementares. Os elementos essenciais so:
Ttulo: a indicao que precede a tabela contendo a designao do fato observado,
o local e a poca em que foi estudado.
Corpo: o conjunto de linhas e colunas onde esto inseridos os dados.
Cabealho: a parte superior da tabela que indica o contedo das colunas.
Coluna indicadora: a parte da tabela que indica o contedo das linhas.
Os elementos complementares so:
Fonte: entidade que fornece os dados ou elabora a tabela.
Notas: informaes de natureza geral, destinadas a esclarecer o contedo das
tabelas.
Chamadas: informaes especficas destinadas a esclarecer ou conceituar dados
numa parte da tabela. Devero estar indicadas no corpo da tabela, em nmeros arbicos entre
parnteses, esquerda nas casas e direita na coluna indicadora.
Os elementos complementares devem situar-se no rodap da tabela, na mesma
ordem em que foram descritos.
Nmero da tabela
Uma tabela deve ter nmero para identific-la sempre que o documento apresentar
uma ou mais tabelas, permitindo, assim, a sua localizao. A identificao da tabela deve ser
feita em nmeros arbicos, de modo crescente, precedidos da palavra Tabela, podendo ou no
ser subordinada a captulos ou sees de um documento. Exemplos: Tabela 5, Tabela 10.4.
Apresentao de dados numricos
Toda tabela deve ter dado numrico para informar a quantificao de um fato
especfico observado, o qual deve ser apresentado em nmeros arbicos.
A parte inteira dos dados numricos deve ser separada por pontos ou espaos de trs
em trs algarismos, da direita para a esquerda, por exemplo: 12.243.527 ou 12 243 527. A
separao da parte inteira da decimal deve ser feita por vrgula, por exemplo: 25,67.
No sistema ingls, a separao da parte inteira feita por vrgula, e a separao da
parte inteira da decimal feita por ponto, ou seja, o inverso do sistema brasileiro.
Sinais convencionais
Sempre que um dado numrico no puder ser apresentado, o mesmo deve ser
substitudo por um sinal convencional. A substituio de um dado numrico deve ser feita por
um dos sinais abaixo, conforme o caso.
18
Estatstica Descritiva
ou
[EI; ES)
Apresentao de tempo
Toda a srie histrica consecutiva deve ser apresentada por seus pontos inicial e final,
ligados por hfen (). Exemplos:
1892-912: quando varia o sculo;
1960-65: quando variam os anos dentro do sculo;
out 1991 - mar 1992: quando variam os meses dentro de anos.
Toda a srie histrica no consecutiva deve ser apresentada por seus pontos inicial e
final, ligados por barra (/). Exemplos:
1981/85: indica dados no apresentados para pelo menos um ano do intervalo;
out 1991 / mar 1992: indica dados no apresentados para pelo menos um ms do
intervalo.
19
Estatstica Descritiva
Apresentao da tabela
O corpo da tabela deve ser delimitado, no mnimo, por trs traos horizontais.
Recomenda-se no delimitar as tabelas direita e esquerda por traos verticais.
facultativo o uso de traos verticais para a separao de colunas no corpo da tabela.
Quando, por excessiva altura, a tabela tiver que ocupar mais de uma pgina, no
deve ser delimitada inferiormente, repetindo-se o cabealho na pgina seguinte. Deve-se usar
no alto do cabealho a palavra continuao ou concluso, conforme o caso.
Se possuir muitas linhas e poucas colunas, poder ser apresentada em duas ou
mais partes dispostas lado a lado e separadas por trao duplo.
A disposio da tabela deve estar na posio normal de leitura. Caso isso no seja
possvel, a apresentao ser feita de forma que a rotao da pgina seja no sentido horrio.
Exemplo:
Tabela 2.10. Total de estabelecimentos, pessoal ocupado, valor da produo e valor da
transformao industrial das indstrias metalrgicas, por Unidade da Federao do Brasil,
1982.
Valor da produo
(1.000 Cr$)
(2)
Unidade da Federao
Total de
estabelecimentos
Pessoal
(1)
ocupado
Valor da transformao
industrial (1.000 Cr$)
Rondnia
Acre
Amazonas
Roraima
Par
Amap
Maranho
Piau
Cear
Rio Grande do Norte
Paraba
Pernambuco
Alagoas
Sergipe
Bahia
Minas Gerais
Esprito Santo
Rio de Janeiro
So Paulo
Paran
Santa Catarina
Rio Grande do Sul
Mato Grosso do Sul
Mato Grosso
Gois
Distrito Federal
1
2
31
2
43
14
12
74
11
30
105
20
20
116
736
42
847
4.699
449
305
706
29
13
106
28
x
x
1.710
x
1.675
328
193
5.336
343
794
5.171
439
423
5.527
54.264
2.281
40.768
272.983
11.118
10.816
30.103
485
528
2.686
843
x
x
21.585
x
6.492
498
454
21.732
1.267
2.089
44.673
4.101
1.447
89.072
954.258
22.923
635.731
2.531.363
43.797
84.294
156.680
1.643
884
9.860
2.577
x
x
10.103
x
3.287
251
159
10.878
383
1.265
14.506
1.768
534
27.679
306.856
6.297
177.358
939.032
22.014
41.894
74.316
623
686
4.800
1.301
Brasil
8.452
448.932
4.637.512
1.646.043
Fonte: Pesquisa Industrial - 1982-1984. Dados gerais, Brasil. Rio de Janeiro: IBGE, v.9, 410p.
Nota: Sinais convencionais utilizados:
x Dado numrico omitido a fim de evitar a individualizao da informao.
Dado numrico igual a zero no resultante de arredondamento.
(1)
Em 31.12.1982.
(2)
Inclui o valor dos servios prestados a terceiros e a estabelecimentos da mesma empresa.
20
Estatstica Descritiva
2.1.3. Grficos
Outro modo de apresentar dados estatsticos sob uma forma ilustrada, comumente
chamada de grfico. Os grficos constituem-se numa das mais eficientes formas de
apresentao de dados.
Um grfico , essencialmente, uma figura construda a partir de uma tabela; mas,
enquanto a tabela fornece uma ideia mais precisa e possibilita uma inspeo mais rigorosa aos
dados, o grfico mais indicado para situaes que visem proporcionar uma impresso mais
rpida e maior facilidade de compreenso do comportamento do fenmeno em estudo.
Os grficos e as tabelas se prestam, portanto, a objetivos distintos, de modo que a
utilizao de uma forma de apresentao no exclui a outra.
Para a confeco de um grfico, algumas regras gerais devem ser observadas:
Normas para representao grfica
Os grficos, geralmente, so construdos num sistema de eixos chamado sistema
cartesiano ortogonal. A varivel independente localizada no eixo horizontal (abscissas),
enquanto a varivel dependente colocada no eixo vertical (ordenadas). No eixo vertical, o
incio da escala dever ser sempre zero, ponto de encontro dos eixos.
Iguais intervalos para as medidas devero corresponder a iguais intervalos para as
escalas. Exemplo: Se ao intervalo 10-15 kg corresponde 2 cm na escala, ao intervalo 40-45 kg
tambm dever corresponder 2 cm, enquanto ao intervalo 40-50 kg corresponder 4 cm.
O grfico dever possuir ttulo, fonte, notas e legenda, ou seja, toda a informao
necessria sua compreenso, sem auxlio do texto.
O grfico dever possuir formato aproximadamente quadrado para evitar que
problemas de escala interfiram na sua correta interpretao.
Tipos de grficos
Podemos considerar quatro tipos principais de representao grfica:
Estereogramas: so grficos onde as grandezas so representadas por volumes.
Geralmente so construdos num sistema de eixos bidimensional, mas podem ser construdos
num sistema tridimensional para ilustrar a relao entre trs variveis. Exemplo:
Hortalias
Carnes
Pescado
60
50
40
30
20
10
0
Belo
Horizonte
Rio de
Janeiro
So Paulo
Curitiba
Porto
Alegre
Estatstica Descritiva
22
Estatstica Descritiva
1000
2000
3000
4000
5000
6000
23
Estatstica Descritiva
24
Estatstica Descritiva
Classe
Ruim
Mdio
Bom
timo
Classe
Fj
Fj
fj
fj
Ruim
12
12
0,2
0,2
Mdio
27
39
0,45
0,65
Bom
15
54
0,25
0,9
timo
60
0,1
60
25
Estatstica Descritiva
Exemplo 2:
Muito frequentemente, as tabelas de distribuio de frequncia de variveis numricas
discretas so construdas da mesma forma que as das variveis categricas. Consideremos
agora que a varivel em estudo seja o nmero de animais portadores de brucelose em 350
propriedades rurais. Os valores observados para esta varivel foram:
2, 5, 6, 0, 4, 4, 3, 4, 2, 2, 3, 3, 5, 3, 5, 1, 2, 4, 2, 3, 5, 4, 3, 3, 2, 3, 0, 4, 4, 3, 4, 0, 3, 1, 2, 4, 2, ...
Como cada valor da varivel deve constituir uma classe e foram observados apenas
sete valores diferentes para esta varivel, a tabela de distribuio de frequncias ter sete
classes.
Nmero da
classe (j)
1
2
3
4
5
6
7
Classe
0
1
2
3
4
5
6
Classe
Fj
Fj
1
2
3
4
5
6
7
0
1
2
3
4
5
6
55
60
112
82
31
8
2
350
55
115
227
309
340
348
350
-
fj
0,1571
0,1714
0,32
0,2343
0,0886
0,0229
0,0057
1,0000
fj
0,1571
0,3286
0,6486
0,8829
0,9714
0,9943
1,0000
-
Devemos observar, ainda, que to importante quanto saber construir uma tabela
saber interpretar os seus valores. Vejamos, como exemplo, o significado de alguns valores da
tabela:
F4 = 82 significa que, das 350 propriedades rurais consultadas, 82 possuem trs
animais portadores de brucelose.
F3 = 227 significa que, das 350 propriedades rurais consultadas, 227 possuem
menos de trs animais portadores de brucelose.
f2 = 0,1714 significa que a proporo de propriedades rurais que possuem apenas
um animal portador de brucelose de 0,1714 (em percentual: 17,14).
f5 = 0,9714 significa que a proporo de propriedades rurais que possuem menos
de quatro animais portadores de brucelose de 0,9714 (em percentual: 97,14).
26
Estatstica Descritiva
Classe
x(1) | x(1) + i
x(1) + i | x(1) + 2i
...
x(1) + (k -1)i | x(1) + ki
27
Estatstica Descritiva
Como o nmero de classes tem que ser um nmero inteiro, teremos que arredondar o
valor 6,9. Usaremos como regra o arredondamento para cima. Deste modo, o nmero de
classes ser k = 7.
Uma vez determinado o valor de k, temos que obter a amplitude dos intervalos. Sendo
k = 7 e a amplitude total do conjunto de dados
a t = ES EI
a t = 39 16 = 23,
temos
i=
at
k
23
7
= 3,2857.
Classes
16,0 | 19,3
19,3 | 22,6
22,6 | 25,9
25,9 | 29,2
29,2 | 32,5
32,5 | 35,8
35,8 || 39,1
28
Estatstica Descritiva
Para a obteno das frequncias absolutas das classes, contamos quantos valores
(observaes) do conjunto de dados pertencem a cada intervalo. As demais frequncias, como
j vimos anteriormente, derivam da frequncia absoluta.
Em distribuies de frequncias de variveis contnuas, geralmente existe interesse
em uma outra quantidade conhecida como ponto mdio ou centro de classe, denotada por cj.
Os centros de classe so calculados da seguinte forma:
cj =
EIj + ES j
2
onde:
EIj = extremo inferior da classe j
ES j = extremo superior da classe j
No exemplo, temos:
c1 =
16 +19,3
35,3
= 17,65
2
2
19,3 + 22,6 41,9
c2 =
=
= 20,95
2
2
c7 =
35,8 + 39,1
2
74,9
2
= 37, 45.
Classes
Fj
Fj
fj
cj
16 | 19,3
0,1167
0,1167
17,65
19,3 | 22,6
16
0,15
0,2667
20,95
22,6 | 25,9
15
31
0,25
0,5167
24,25
25,9 | 29,2
12
43
0,2
0,7167
27,55
29,2 | 32,5
52
0,15
0,8667
30,85
32,5 | 35,8
58
0,1
0,9667
34,15
35,8 || 39,1
60
0,0333
1,0000
37,45
60
1,0000
fj
29
Estatstica Descritiva
Exerccios propostos:
2.1. Os dados a seguir se referem aos nmeros de pes no vendidos em uma certa padaria
at a hora do encerramento do expediente:
0
2.2. Os dados em rol (ordenao horizontal) abaixo se referem aos valores gastos (em reais)
pelas primeiras 50 pessoas que entraram em um determinado supermercado, no dia
01/01/2000.
3,11
8,88
9,26
10,81
12,69
13,78
15,23
15,62
17,00
17,39
18,36
18,43
19,27
19,50
19,54
20,16
20,59
22,22
23,04
24,47
24,58
25,13
26,24
26,26
27,65
28,06
28,08
28,38
32,03
36,37
38,98
50,39
38,64
52,75
39,16
54,80
41,02
59,07
42,97
61,22
44,08
70,32
44,67
82,70
45,40
85,76
46,69
86,37
48,65
93,34
30
Estatstica Descritiva
Estatstica Descritiva
Polgono de frequncia
O polgono de frequncias constitudo por segmentos de retas que unem os pontos
cujas coordenadas so o ponto mdio e a frequncia de cada classe. O polgono de
frequncias fechado tomando-se uma classe anterior a primeira e uma posterior a ltima,
uma vez que ambas possuem frequncia zero.
Na Figura 2.8 podemos observar o polgono de frequncias da distribuio da Tabela
2.13.
Exerccio proposto:
2.3. Faa a representao grfica (histograma e polgono de frequncias, quando for o caso)
das distribuies de frequncias construdas nos Exerccios 2.1 e 2.2 da pgina 30.
32
Estatstica Descritiva
Hbito de fumar
Sim
No
5
8
10
16
5
10
2
4
22
38
Totais
13
26
15
6
60
Estatstica Descritiva
Figura 2.9. Distribuio dos alunos da escola Figura 2.10. Distribuio dos alunos da
E, segundo o hbito de fumar e conceito em escola E, segundo o hbito de fumar e
Estatstica.
conceito em Estatstica.
A observao atenta destes grficos j pode fornecer uma ideia da possvel
associao existente entre os fatores. Por exemplo, se o um fator apresenta o mesmo
comportamento dentro de todos os nveis do outro, podemos supor que eles no esto
associados, ou seja, comportam-se independentemente um do outro. Devemos observar,
entretanto, que os grficos fornecem apenas indicaes, para verificar tais hipteses
(suposies) devemos utilizar os testes apropriados que sero vistos posteriormente.
34
Estatstica Descritiva
Estatstica
Totais
0 | 4
4 | 7
7 | 10
0 | 4
32
25
62
4 | 7
20
183
82
285
7 | 10
27
19
53
Totais
59
235
106
400
10
78
65
86
68
83
68
75
80
82
66
60
52
68
53
65
57
58
62
65
53
Estatstica Descritiva
36
Estatstica Descritiva
x=
xi
i=1
Exemplo:
Se X = tempo (h)
Para xi = 9, 7, 5, 10, 4, temos
x=
xi
n
9 + 7 + 5 + 10 + 4
5
35
5
=7h
xp =
xipi
i=1
n
pi
i=1
Exemplo:
Para xi = 7, 8, 6, 10, e
pi = 10, 10, 8, 2, temos
xp =
xipi
pi
7 10 + 8 10 + 6 8 + 10 2
10 + 10 + 8 + 2
218
30
= 7,02
Estatstica Descritiva
(xi + c) = x1 + c + x 2 + c + + xn + c
n
xi + c
n
xi + nc
n
xi + nc =
=
n
n
xi + c = x + c
n
Verificao numrica:
Ao somarmos a constante 2 a todos os valores do conjunto xi = 9, 7, 5, 10, 4, cuja
mdia x = 7, teremos um novo conjunto de valores xi + 2 = 11, 9, 7, 12, 6, com uma nova
mdia
x x+2 =
xi
n
11 + 9 + 7 + 12 + 6
5
45
5
=9 =7+2,
cxi
cx1 + cx 2 + + cx n
n
n
c ( x1 + x 2 + + x n )
n
c xi
n
=c
xi
n
= cx
Verificao numrica:
Ao multiplicarmos a constante 2 por todos os valores do conjunto de dados xi = 9, 7, 5,
10, 4, cuja mdia x = 7, teremos um novo conjunto de valores 2xi = 18, 14, 10, 20, 8, com
uma nova mdia
x2x =
xi
n
18 + 14 + 10 + 20 + 8
5
70
5
= 14 = 2 7 ,
Estatstica Descritiva
( x i x ) = xi x
= x i nx , sendo x =
= xi n
xi
xi , temos
n
n
= xi xi = 0
temos
n ( x c) = 0 .
xi
9
7
5
10
4
35
(x i x)
(x i x)2
(x i 6)2
(x i 9)2
2
0
-2
3
-3
0
4
0
4
9
9
26
9
1
1
16
4
31
0
4
16
1
25
46
39
Estatstica Descritiva
Mediana
A mediana, representada por Md, a medida que divide um conjunto de dados
ordenado em duas partes iguais: 50% dos valores ficam abaixo e 50% ficam acima da
mediana.
Existem dois casos diferentes para o clculo da mediana, mas em ambos o primeiro
passo a ser tomado a ordenao dos dados.
1o caso: quando n mpar
Determinamos, primeiramente, a posio mais central (p) do conjunto de dados
ordenado
n +1
p=
.
2
A mediana ser o valor do conjunto de dados que ocupa a posio p, ou seja,
Md = xp.
Exemplo:
Se X = tempo (h)
Para xi = 4, 5, 7, 9, 10, temos
p=
n +1
2
5 +1
2
=3,
logo,
Md = x p = x 3 = 7 h
n +1
2
6 +1
2
p1 = 3
= 3, 5
p2 = 4
logo,
Md =
xp1 + x p2
2
x3 + x4
2
7+9
2
= 8h .
40
Estatstica Descritiva
Moda
A moda, representada por Mo, o valor de maior ocorrncia num conjunto de dados.
a nica medida que pode no existir e, existindo, pode no ser nica.
Exemplos:
X = peso (kg)
1. Para xi = 2, 3, 7, 5, 7, 5, 8, 7, 9,
2. Para xi = 1, 3, 4, 5, 4, 8, 6, 8,
3. Para xi = 5, 7, 8, 3, 9, 1, 4,
4. Para xi = 1, 3, 4, 4, 5, 1, 3, 5,
temos Mo = 7 kg
temos Mo = 4 kg e 8 kg (conjunto bimodal)
41
Vantagens
Mediana
Vantagens
Moda
Desvantagem
Desvantagens
- uma medida altamente influenciada por - uma medida que no se presta a clculos - uma medida que no se presta a clculos
valores discrepantes (no resistente).
matemticos.
matemticos.
Desvantagem
Vantagens
Mdia aritmtica
O quadro abaixo apresenta as principais caractersticas da mdia, da mediana e da moda, destacando as vantagens e desvantagens de
cada uma em relao s demais.
Estatstica Descritiva
43
Estatstica Descritiva
n +1
;
4
2 ( n + 1)
4
3 ( n + 1)
4
;
.
n+2
;
4
2n + 2
4
3n + 2
4
;
.
O quartil Qi ser o valor do conjunto de dados que ocupa a posio p, ou seja, Qi = xp.
No caso de p no ser um nmero inteiro, o quartil ser a mdia aritmtica dos dois valores que
ocupam as posies correspondentes ao menor e ao maior inteiros mais prximos de p. Por
exemplo, se p=7,5, o quartil ser a mdia aritmtica dos valores que ocupam as posies 7 e 8.
Exemplos:
1o caso: quando n mpar
Seja X = peso (kg) e xi = 3, 3, 4, 6, 7, 9, 9, 11 e 12
Para Q1, temos
p=
n +1
4
9 +1
4
= 2,5
Como p no um nmero inteiro, Q1 ser a mdia aritmtica dos valores que ocupam as
posies 2 e 3, ou seja,
Q1 =
Para Q2, temos
p=
x2 + x3
2
2 ( n + 1)
4
3+4
2
2 ( 9 + 1)
4
= 3,5 kg
=5
3 ( n + 1)
3 ( 9 + 1)
= 7,5
4
4
Como p no inteiro, Q3 ser a mdia aritmtica dos valores que ocupam as posies 7 e 8,
ou seja,
44
Estatstica Descritiva
Q3 =
x7 + x8
9 + 11
2
= 10kg
n+2
4
10 + 2
4
=3
2n + 2
4
2 10 + 2
4
= 5,5
Como p no inteiro, Q2 ser a mdia aritmtica dos valores que ocupam as posies 5 e 6,
ou seja,
x + x6 7 + 9
Q2 = 5
=
= 8kg
2
2
Para Q3, temos
p=
3n + 2
4
3 10 + 2
4
=8
Estatstica Descritiva
influenciada por valores discrepantes. utilizada quando apenas uma ideia rudimentar da
variabilidade dos dados suficiente.
Exemplo:
Se X = tempo (h)
Para xi = 9, 7, 5, 10, 4, temos
a t = ES EI = 10 4 = 6h .
Significado: todos os valores do conjunto de dados diferem, no mximo, em 6h.
Amplitude interquartlica
A amplitude interquartlica, denotada por a q , a diferena entre o terceiro quartil (Q3)
e o primeiro quartil (Q1). Assim, temos
aq = Q3 Q1 .
Apesar de ser uma medida pouco utilizada, a amplitude interquartlica apresenta uma
caracterstica interessante que a resistncia, ou seja, esta medida, ao contrrio da amplitude
total, no sofre nenhuma influncia de valores discrepantes.
Exemplo:
Seja X = peso (kg) e xi = 3, 3, 4, 6, 7, 9, 9, 11, 12,
onde: Q3 = 10 kg e Q1 = 3,5 kg., temos
aq = Q3 Q1 = 10 3,5 = 6,5kg
Significado: 50% dos valores (mais centrais) esto dentro deste intervalo, portanto,
diferem, no mximo, em 6,5 kg.
Varincia
A varincia, denotada por s2 , a medida de disperso mais utilizada, seja pela sua
facilidade de compreenso e clculo, seja pela possibilidade de emprego na inferncia
estatstica. A varincia definida como sendo a mdia dos quadrados dos desvios em relao
mdia aritmtica. Assim, temos
(xi x)2
2
s =
,
n 1
onde:
n 1: o nmero de graus de liberdade ou desvios independentes.
A utilizao do denominador n 1, em vez de n, tem duas razes fundamentais:
1. Como a soma dos desvios nula, ou seja, ( x i x ) = 0 , existe n 1 desvios
independentes, isto , conhecidos n 1 desvios o ltimo est automaticamente determinado,
pois a soma zero.
2. O divisor n 1 faz com que a varincia possua melhores propriedades estatsticas.
46
Estatstica Descritiva
Nos casos em que a varincia for utilizada apenas para descrever a variao de um
conjunto de dados, ento, ela poder ser calculada utilizando o nmero de observaes (n)
como denominador e ser denotada por sn2 , ou seja,
(xi x)2 .
sn2 =
Mas se o objetivo for descrever a variao dos dados de uma amostra que ser
utilizada para inferir sobre a populao, ento a medida que deve ser utilizada a varincia
com denominador n 1.
Exemplo:
Se X = tempo (h)
Para xi = 9, 7, 5, 10, 4, onde x = 7h , temos
s
(xi x)2
=
=
=
n 1
(9 7)2 + (7 7)2 + (5 7)2 + (10 7)2 + (4 7)2
5 1
4+0+4+9+9
4
26
= 6,5 h2 .
(c c)2
sc2
n 1
=0.
[(xi + c) (x + c)]
=
s2x +c
n 1
=
=
n 1
n 1
= s2 .
2
scx
n 1
n 1
c 2 (xi x)2
n 1
= c2
(xi x)2
n 1
= c 2 s2 .
Desvantagens da varincia:
Como a varincia calculada a partir da mdia, uma medida pouco resistente, ou
seja, muito influenciada por valores discrepantes.
Como a unidade de medida fica elevada ao quadrado, a interpretao da varincia
se torna mais difcil.
47
Estatstica Descritiva
Desvio Padro
O desvio padro, denotado por s, surge para solucionar o problema de interpretao
da varincia e definido como a raiz quadrada positiva da varincia. Assim, temos
s = s2 .
Exemplo:
Se X = tempo (h)
Para xi = 9, 7, 5, 10, 4, onde s2 = 6,5h2 , temos
s = s2 = 6,5h2 = 2,55h
Podemos observar que o desvio padro expresso na mesma unidade de medida que
os dados, o que facilita a sua interpretao. Geralmente, o desvio padro apresentado junto
com a mdia do conjunto de dados da seguinte forma: x s . Deste modo, temos a indicao
da variao mdia dos dados em torno da mdia aritmtica.
Coeficiente de Variao
O coeficiente de variao, denotado por CV, a medida mais utilizada quando existe
interesse em comparar variabilidades de diferentes conjuntos de dados. Embora esta
comparao possa ser feita atravs de outras medidas de variao, nas situaes em que as
mdias dos conjuntos comparados so muito desiguais ou as unidades de medida so
diferentes, devemos utilizar o CV.
O coeficiente de variao definido como a proporo da mdia representada pelo
desvio padro e dado por
s
CV = 100 .
x
Exemplo:
Se X = tempo (h)
Para xi = 9, 7, 5, 10, 4, onde x = 7h e s = 2,55h , temos
CV =
s
x
100 =
2,55h
7h
100 = 36,4%
Estatstica Descritiva
Jersey:
y = 58 kg ,
s Y = 9kg ,
CVY = 15,5%
mr =
xri
n
49
Estatstica Descritiva
Exemplos:
Para r = 1, temos: m1 =
Para r = 2, temos: m2 =
Para r = 3, temos: m3 =
Para r = 4, temos: m4 =
xi
n
xi2
n
xi3
n
xi4
n
(x i x)r
=
.
n
Exemplos:
Para r = 1, temos: m1 =
Para r = 2, temos: m2 =
Para r = 3, temos: m3 =
Para r = 4, temos: m4 =
(xi x)
n
(xi x)2
n
(xi x)3
n
(xi x)4
n
Coeficiente de assimetria
Entre as vrias medidas de assimetria que devem informar se a maioria dos valores se
localiza esquerda, ou direita, ou se esto uniformemente distribudos em torno da mdia
aritmtica, temos o coeficiente de assimetria, denotado por a3 . Esta medida indica o grau e o
sentido do afastamento da simetria e obtida utilizando o segundo e o terceiro momentos
centrados na mdia, atravs da seguinte expresso
a3 =
m3
m2 m2
Assimtrica negativa
Estatstica Descritiva
Simtrica
Assimtrica positiva
Coeficiente de curtose
As medidas de curtose indicam o grau de achatamento de uma distribuio. O
coeficiente de curtose, denotado por a 4 , calculado a partir do segundo e do quarto momentos
centrados na mdia, atravs da seguinte expresso
a4 =
m4
m22
Platicrtica
Mesocrtica
Leptocrtica
Estatstica Descritiva
c jFj c jFj
xp =
j=1
k
j=1
Fj
j=1
n +1
2
Estatstica Descritiva
s =
Fj ( c j xp )
n 1
s = s2
CV =
s
xp
100 .
Medidas de formato
As expresses que definem o coeficiente de assimetria e o coeficiente de curtose,
tambm permanecem as mesmas que para os dados no agrupados, respectivamente,
a3 =
m3
m2 m2
a4 =
m4
m22
Fj (c j xp )2
=
,
m3
Fj (c j xp )3
=
n
m4
Fj (c j xp )4
=
.
n
Classes
1
16 | 19,3
2 19,3 | 22,6
3 22,6 | 25,9
4 25,9 | 29,3
5 29,2 | 32,5
6 32,5 | 35,8
7 35,8 || 39,1
cj
17,65
20,95
24,25
27,55
30,85
34,15
37,45
Fj
7
9
15
12
9
6
2
60
Fj
c jFj
7
16
31
43
52
58
60
123,55
188,55
363,75
330,60
277,65
204,90
74,90
1.563,9
Fj (c j xp )2
Fj (c j xp )3
Fj (c j xp )4
496,27
235,93
49,69
26,28
205,64
391,72
259,01
1.664,54
-4.178,63
-1.207,96
-90,43
38,90
982,94
3.165,08
2.947,52
1.657,42
35.184,10
6.184,75
164,58
57,57
4.698,44
25.573,88
33.542,78
105.406,11
A partir dos totais da ltima linha da tabela, podemos facilmente calcular as medidas.
Assim temos:
k
c jFj
Mdia aritmtica: xp =
j=1
1563,9
60
= 26,07kg
53
Estatstica Descritiva
n +1
2
60 +1
2
= 30,5 ,
Varincia: s =
Fj ( c j xp )
n 1
1664,54kg2
60 1
= 28,21kg2
Coeficiente de variao: CV =
s
xp
100 =
5,331kg
26,07kg
100 = 20,37%
m2
Fj (c j xp )2
m3
Fj (c j xp )3
m4
Fj (c j xp )4
n
n
1664,54kg2
60
1657,42kg3
60
= 27,74kg2
= 27,62kg3
105406,11kg4
= 1756,77kg4
60
a4 =
m3
m2 m2
m4
m22
27,62kg3
27,74kg2 27,74kg2
1756,77 kg4
( 27,74 kg )
2 2
= 2,283
Devemos salientar que as medidas para dados agrupados em classe vm sendo cada
vez menos utilizadas. A obteno de medidas descritivas a partir de distribuies de
frequncias tem como principal objetivo facilitar o processo de clculo, pois, quando se trata de
conjuntos de dados muito grandes, essa tarefa bastante trabalhosa. Outra razo que justifica
o uso dessas medidas a falta de acesso aos dados originais (no agrupados). Contudo,
sabe-se que medidas obtidas a partir de dados agrupados em classe, na maioria das vezes,
54
Estatstica Descritiva
x = 25,78 kg
x = 26,07 kg
Md = 25 kg
Mo = 23 kg
2
s = 28,64 kg
s = 5,352 kg
s2 = 28,21 kg2
s = 5,331 kg
CV = 20,76%
CV = 20,37%
2
m2 = 27,74 kg2
m3 = 32,48 kg3
m3 = 27,62 kg3
m4 = 1.875,62 kg4
m4 = 1.756,77 kg4
a3 = 0,218
a3 = 0,189
a4 = 2,365
a4 = 2,283
m2 = 28,16 kg
Medida
Escala mnima
Moda
Escala nominal
Percentis
Escala ordinal
55
Estatstica Descritiva
Exerccios propostos:
2.5. Os valores que seguem so os tempos (em segundos) de reao a um alarme de incndio,
aps a liberao de fumaa de uma fonte fixa:
12 9 11 7 9 14 6 10
Calcule as medidas de localizao (mdia, mediana e moda) e as medidas de variao
(amplitude total, varincia, desvio padro e coeficiente de variao) para o conjunto de dados.
2.6. Foram registrados os tempos de frenagem para 21 motoristas que dirigiam a 30 milhas por
hora. Os valores obtidos foram:
69
58
70
80
46
61
65
74
75
55
56
70
72
61
66
58
68
70
68
58
67
Classes
Fj
20
40
Fj
c jFj
Fj (c j xp )2
Fj (c j xp )3
Fj (c j xp )4
Fj
Classes
3,11 | 16,00
16,00 | 28,89
20
28,89 | 41,78
41,78 | 54,67
54,67 | 67,56
67,56 | 80,45
80,45 || 93,34
50
Fj
c jFj
Fj (c j xp )2 Fj (c j xp )3 Fj (c j xp )4
56
Estatstica Descritiva
Estatstica Descritiva
Os dados abaixo se referem aos pesos ao nascer (em kg) de 61 bovinos machos da
raa Ibag.
16,
20,
23,
27,
30,
34,
17,
21,
23,
27,
30,
34,
17,
21,
23,
27,
30,
35,
18,
22,
25,
27,
30,
36,
18,
22,
25,
28,
30,
39,
18,
23,
25,
28,
30,
45
19,
23,
25,
28,
31,
20,
23,
25,
29,
32,
20,
23,
25,
29,
33,
20,
23,
26,
29,
33,
20,
23,
26,
30,
33,
58
Estatstica Descritiva
CS = Q3 + 1,5aq
Q1 1,5aq ; Q3 + 1,5aq .
Valores menores que a cerca inferior so denominados discrepantes inferiores e os
valores maiores que a cerca superior so os discrepantes superiores.
No exemplo, sero considerados discrepantes os valores que estiverem fora dos
limites da cerca superior e da cerca inferior:
CI = Q1 1,5aq = 22 1,5 8 = 10
CS = Q3 + 1,5aq = 30 + 1,5 8 = 42
Estatstica Descritiva
A posio central dos valores dada pela mediana e a disperso pela amplitude
interquartlica (aq). As posies relativas da mediana e dos quartis e o formato dos bigodes do
uma noo da simetria e do tamanho das caudas da distribuio.
Na figura abaixo podemos observar o grfico em caixa representando diferentes tipos
de distribuies:
a) distribuio assimtrica positiva, com trs valores discrepantes superiores;
b) distribuio simtrica, com um valor discrepante inferior;
c) distribuio assimtrica negativa, sem valores discrepantes.
a) assimtrica positiva
b) simtrica
c) assimtrica negativa
60
Estatstica Descritiva
Vale lembrar que quando encontramos um valor discrepante num conjunto de dados, a
sua origem deve ser investigada. Muitas vezes, os valores discrepantes, de fato, fazem parte
do conjunto de dados, reforando a caracterstica assimtrica da distribuio. Mas,
eventualmente, estes valores podem ser oriundos de erros na aferio ou no registro dos
dados. Em geral, distribuies com caudas longas (indicadas por bigodes longos no grfico),
caracterstica comum de distribuies assimtricas, apresentam uma tendncia maior de
produzir valores discrepantes. Nas figuras acima, os bigodes de diferentes tamanhos indicam
distribuies assimtricas. O valor discrepante parece ser uma anomalia maior na figura b, pois
se trata de uma distribuio simtrica e com caudas curtas. De qualquer modo, uma cuidadosa
inspeo nos dados e nas eventuais causas da ocorrncia desse(s) valor(es) sempre uma
providncia necessria antes que qualquer atitude seja tomada em relao a esses dados.
A seguir temos o grfico em caixa representando o conjunto de dados do exemplo,
que se refere aos pesos ao nascer de bovinos machos da raa Ibag.
59
49
87
76
49
86
96
84
86
86
94
68
45
79
87
43
67
56
78
83
56
65
94
77
94
78
75
87
59
85
84
73
56
76
96
61
49
56
67
78
84
96
45
57
65
75
89
94
56
67
73
87
94
Estatstica Descritiva
56 59
68
76 79 78 77 76
84 87 85 86 86 87 83 85
96
3
9
8
8
6
4
5
6
7
8
4
6
9
7
5
5
9
4
6
7
3
7
4
6 9
8
6 9 8 7 6
4 7 5 6 6 7 3 5
6
Isso o que denominamos diagrama de ramo e folhas. Nesse arranjo, cada linha
denominada ramo, cada nmero no ramo esquerda da linha vertical chamado rtulo do
ramo e cada nmero direita da linha vertical denominado folha. bastante interessante que
as folhas do diagrama sejam ordenadas facilitando ainda mais a interpretao. Dessa forma,
nosso diagrama resulta assim:
4
5
6
7
8
9
3
6
5
3
3
4
5
6
7
5
4
4
9
6
7
6
4
4
7
8
6
5
6
9 9
8
7 8 8 8 9
5 6 6 6 7 7 7 9
6
62
Estatstica Descritiva
Exerccios propostos:
2.9. Os dados abaixo se referem aos valores gastos (em reais) pelas primeiras 50 pessoas que
entraram em um determinado Supermercado, no dia 01/01/2000.
3,11
8,88
9,26
10,81
12,69
13,78
15,23
15,62
17,00
17,39
18,36
18,43
19,27
19,50
19,54
20,16
20,59
22,22
23,04
24,47
24,58
38,98
25,13
38,64
26,24
39,16
26,26
41,02
27,65
42,97
28,06
44,08
28,08
44,67
28,38
45,40
32,03
46,69
36,37
48,65
50,39
52,75
54,80
59,07
61,22
70,32
82,70
85,76
86,37
93,34
63
Estatstica Descritiva
2.5. Bibliografia
ANDRES, A.M., CASTILLO, J. de D.L. del Bioestadistica para las Cincias de la Salud.
Madrid: Ediciones Norma, 1988. 614 p.
BOTELHO, E.M.D., MACIEL, A.J. Estatstica Descritiva (Um Curso Introdutrio) Viosa:
Universidade Federal de Viosa, 1992. 65p.
COSTA, S.F. Introduo Ilustrada Estatstica (com muito humor!). 2.ed., So Paulo:
Harbra, 1992. 303p.
FARIA, E.S. de Estatstica Edio 97/1. (Apostila)
FERREIRA, D.F. Estatstica Bsica. Lavras: Editora UFLA, 2005, 664p.
FREUND, J.E., SIMON, G.A. Estatstica Aplicada.
Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p.
Economia,
Administrao
64
Unidade III
Elementos de Probabilidade
68
69
77
79
92
92
Elementos de Probabilidade
Elementos de Probabilidade
Um pouco de histria...
Blaise Pascal
(1623 -1662)
Pierre Fermat
(1601 -1665)
Na mesma linha seguiram alguns trabalhos subsequentes, com destaque para a obra
de Abraham de Moivre iniciada, em 1718, com Doctrine of Changes. A famosa distribuio
normal foi deduzida pelo francs de Moivre como resultado do limite da expanso do binmio
(a + b)n, embora ainda no tivesse sido colocada como uma distribuio de probabilidade.
Mais tarde, essa relao veio a ter uma importncia muito grande por estabelecer a
aproximao da distribuio binomial em relao normal.
O extraordinrio avano das probabilidades, entretanto, deu-se no incio do sculo
XIX, atravs do matemtico Laplace com seu clssico Therie analytique des probabilits
(1812), onde mostra que a rea sob a curva normal e fornece uma prova formal sobre o
mtodo dos quadrados mnimos.
Abraham de Moivre
(1667 -1754)
Praticamente
no
mesmo
perodo,
o
matemtico e astrnomo alemo Gauss, chegou
aos mesmos resultados sobre a curva normal de
probabilidades, estudando a distribuio dos erros
de medida. Mas somente no sculo XX que se
desenvolveu uma teoria matemtica rigorosa
baseada em axiomas, definies e teoremas.
As distribuies de probabilidades so
consideradas hoje a espinha dorsal da teoria
estatstica, pois todos os processos de inferncia
so aplicaes de distribuies de probabilidades.
Assim, o conhecimento dos conceitos
advindos da teoria das probabilidades de grande
importncia para a correta utilizao da estatstica.
Elementos de Probabilidade
Elementos de Probabilidade
A = {c}
B = {k}, ento A e B so mutuamente exclusivos.
P(A) =
m
n
#A
#S
69
Elementos de Probabilidade
validade,
duas
Exemplo:
Consideremos o seguinte experimento: lanamento de uma moeda honesta duas
vezes e observao do lado superior.
O espao amostral deste experimento S = {cc, ck, kc, kk} e todos os seus pontos
amostrais so equiprovveis:
1
p(cc) = p(kc) = p(ck) = p(kk) =
4
Define-se o evento A = ocorrncia de uma cara, ento
A = {ck, kc}
m #A 2 1
e P(A) = =
= = ,
n #S 4 2
pois S possui quatro pontos amostrais, dos quais dois so favorveis ocorrncia de A.
Consideremos, agora, outra situao onde o espao amostral S refere-se ao nmero
de caras obtido nos dois lanamentos da moeda honesta.
O espao amostral passa a ser S = {0, 1, 2} e o evento A = ocorrncia de uma cara, ou
seja, A = {1}.
Observamos, nesta situao, que os pontos amostrais de S (0, 1 e 2) no so todos
equiprovveis, pois
1
1
1
1
1
p(0) = p(kk) = , p(1) = p(kc) + p(ck) =
+
=
e p(2) = p(cc)= .
4
4
4
2
4
Portanto, embora o evento A seja o mesmo, como uma das pressuposies bsicas
no foi atendida, o conceito clssico no pode ser imediatamente aplicado para calcular a sua
probabilidade.
Podemos observar, a seguir, que a aplicao do conceito clssico, nesta situao, no
conduz ao um resultado incorreto:
m #A 1
P(A) = =
= .
n #S 3
Recomendamos, ento, partir sempre do espao amostral original do experimento
para aplicar o conceito clssico.
f=
m
n
.
70
Elementos de Probabilidade
m
n
6
66
1
11
Andrei N. Kolmogorov
(1903 - 1987)
Axioma 1. 0 P(A) 1.
Axioma 2. P(S) = 1.
Axioma 3. Se A e B so eventos de S mutuamente exclusivos,
ento P(A B) = P(A) + P(B).
71
Elementos de Probabilidade
P(A1 A 2 A 3 A n ) = P(A i )
i=1
P(A) =
rea de A
rea de S
rea de S =
bh
2 1
=1
2
2 1/2 1
rea de A =
=
=
2
2
4
rea de A 1/ 4 1
P(A) =
=
=
rea de S
1
4
2
bh
72
Elementos de Probabilidade
P(A)
P(A B)
= P(A B)
P(A) + P(B)
P(A B)
= P(A B)
73
Elementos de Probabilidade
Experimento: Uma caixa contm cinco bolas equiprovveis, sendo trs azuis e duas
brancas. Duas bolas so retiradas uma a uma e sua cor observada. Definimos, ento, dois
eventos:
A1: a primeira bola retirada azul.
A2: a segunda bola retirada branca.
As probabilidades dos eventos A1 e A2 sero calculadas em duas situaes.
Situao 1. Consideremos que a primeira bola retirada no reposta (retirada sem reposio).
Sendo o espao amostral enumervel, finito e equiprovvel, podemos calcular
probabilidade dos eventos atravs do conceito clssico. Deste modo,
P(A1 ) =
# A1
#S
3
5
# A 2 /A 1
#S
# A2
#S
=
1
4
2
4
# A 2 /A 1
#S
# A2
#S
=
2
5
2
5
Elementos de Probabilidade
P(A B)
P(B)
P(B/A) =
P(A B)
P(A)
Teorema de Bayes
Se S um espao amostral, com n=4 parties, onde est definido o evento A
B1 B 2 B3 B 4 = S
B1 B 2 =
Bi B j =
B1 B 2 =
B1 B 2 =
A = (A B1 ) (A B 2 ) (A B3 ) (A B 4 ) , logo,
P(A) = [P(A B1 ) P(A B2 ) P(A B3 ) P(A B 4 )] .
P(A) = P(B1 )P(A/B1 ) + P(B 2 )P(A/B2 ) + P(B3 )P(A/B3 ) + P(B4 )P(A/B 4 ) = P(Bi )P(A/Bi )
i=1
e
P(B1/A) =
P(A B1 )
P(A)
P(B1 ) P(A/B1 )
4
P(Bi ) P(A/Bi )
i=1
75
Elementos de Probabilidade
Seja S um espao amostral e B1, B2,..., Bn, uma de suas parties possveis, tal que
Bi B j = e
Bi = S . Se A um evento de S, ento:
i=1
n
P(Bi /A) =
P(Bi ) P(A/Bi )
n
P(Bi ) P(A/Bi )
i=1
Exerccios propostos:
3.1. Em 660 lanamentos de uma moeda, foram observadas 310 caras. Qual a probabilidade
de, num lanamento dessa moeda, obter-se coroa?
3.2. Se os registros indicam que 504, dentre 813 lavadoras automticas de pratos vendidas por
uma grande loja de varejo, exigiram reparos dentro da garantia de um ano, qual a
probabilidade de uma lavadora dessa loja no exigir reparo dentro da garantia?
3.3. Um grupo de pessoas constitudo de 60 homens e 40 mulheres. Sabe-se que 45 desses
homens e 30 dessas mulheres votaram numa determinada eleio. Tomando-se,
aleatoriamente, uma dessas pessoas, calcule a probabilidade de:
a) ser homem;
b) ser mulher;
c) ter votado;
d) no ter votado;
e) ser homem, sabendo-se que votou;
f) ser mulher, sabendo-se que no votou;
g) ter votado, sabendo-se que mulher;
h) no ter votado, sabendo-se que homem.
3.4. Em uma fbrica de parafusos, as mquinas A, B e C produzem 25 %, 35 % e 40 % do total
produzido. Da produo de cada mquina, 5 %, 4 % e 2 %, respectivamente, so defeituosos.
Escolhe-se ao acaso um parafuso e verifica-se que ele defeituoso. Qual a probabilidade de
que seja da mquina A, da mquina B e da mquina C?
3.5. Em um estado (dos Estados Unidos) onde os automveis devem ser testados quanto
emisso de poluentes, 25% de todos os carros emitem quantidades excessivas de poluentes.
Ao serem testados, 99% de todos os carros que emitem excesso de poluentes so reprovados,
mas 17% dos que no acusam emisso excessiva de poluentes tambm so reprovados. Qual
a probabilidade de um carro reprovado no teste acusar efetivamente excesso de emisso de
poluentes?
3.6. Em uma certa comunidade, 6 % de todos os adultos com mais de 45 anos tm diabetes.
Um novo teste diagnostica corretamente 84% das pessoas que tm diabetes e 98% das que
no tem a doena.
a) Qual a probabilidade de uma pessoa diagnosticada como diabtica no teste, ter de fato
a doena?
b) Qual a probabilidade de uma pessoa que faa o teste, seja diagnosticada como no
diabtica?
76
Elementos de Probabilidade
1
8
Elementos de Probabilidade
Seja X a varivel que representa o nmero de caras ocorrido nos trs lanamentos,
quais so os possveis valores de X?
X = {0, 1, 2, 3}
X(ccc) = 3
X(cck) = 2
X(ckc) = 2
X(kcc) = 2
X(kkc) = 1
X(kck) = 1
X(ckk) = 1
X(kkk) = 0
S
Espao amostral
X = funo que
transforma
X(s)
SX
Espao amostral da
varivel X
Elementos de Probabilidade
Se definimos outra varivel aleatria Y como o nmero de coroas at que ocorra cara,
ento temos
Y S = {0, 1, 2, 3, 4,...}.
S
Y
p(x) = 1
xSX
79
Elementos de Probabilidade
P(X = 0) = P(B1B2 ) =
C03 C22
C52
1
10
= 0,1 = 0,1
P(X = 1) = P(PB
1 1 ) + P(PB
1 2 ) + P(P2B1 ) + P(P2B 2 ) + P(P3B1 ) + P(P3B2 ) =
P(X = 2) = P(PP
1 2 ) + P(PP
1 3 ) + P(P2P3 ) =
C32 C02
C52
3
10
C13 C12
C52
6
10
= 0,6
= 0,3
0
0,1
1
0,6
2
0,3
P(X = x) =
C3x C22 x
C52
, para SX = {0, 1, 2}
80
Elementos de Probabilidade
F(2) = P(X 2) =
x 2
0
0,1
0,1
1
0,6
0,7
2
0,3
1
1
-
representao grfica
representao analtica
F(x) = P(X x) =
tx
C3t C22 t
C52
, para SX = {0, 1, 2}
81
Elementos de Probabilidade
E(X) = =
x p(x)
xS X
p(x) = 1
x p(x)
xS X
xS X
0
0,1
1
0,6
2
0,3
xS X
Elementos de Probabilidade
(x )2 p(x)
(Frmula de definio)
xS X
ou
V(X) = 2 = E(X2 ) 2 , onde E(X)2 =
x 2p(x)
(Frmula prtica)
xS X
0
0,1
1
0,6
2
0,3
e o valor esperado = 1,2 bolas, a varincia do nmero de bolas pretas retiradas ser:
V(X) = 2 =
xS X
Elementos de Probabilidade
= 2 .
No exemplo: = 2 = 0,36 = 0,6 bolas.
Momentos
J vimos anteriormente que os momentos so quantidades que auxiliam na descrio
de um conjunto de valores. Da mesma forma, aqui, essas medidas so utilizadas para
descrever as distribuies de probabilidade de variveis aleatrias. A expresso geral do
momento de ordem r de uma varivel aleatria a seguinte:
r = E(X a)r
Os tipos mais importantes de momentos so dois:
Quando a = 0, temos os momentos centrados na origem ou momentos ordinrios de
ordem r:
1 = E(X) = xp(x)
xS X
Para r = 2, temos
2 = E(X2 ) = x 2p(x)
xSX
Para r = 3, temos
3 = E(X3 ) = x 3p(x)
xS X
Para r = 4, temos
4 = E(X4 ) = x 4p(x)
xS X
84
Elementos de Probabilidade
r = E(X )r
Para r = 1, temos
1 = E(X )
1 = E(X) E( )
1 = = 0
Para r = 2, temos
2 = E(X )2 =
(x )2 p(x)
(Frmula de definio)
xS X
2 = E(X )2
2 = E(X2 2X + 2 )
2 = E(X2 ) E(2X) + E(2 )
2 = E(X2 ) 2E(X) + 2
2 = E(X2 ) 22 + 2
2 = E(X2 ) 2 (Frmula prtica)
Para r = 3, temos
3 = E(X )3 =
(x )3 p(x)
(Frmula de definio)
xS X
3 = E(X )3
3 = E(X3 3X2 + 2X 2 3 )
3 = E(X3 ) E(3X2 ) + E(3X2 ) E(3 )
3 = E(X3 ) 3E(X2 ) + 32E(X) 3
3 = E(X3 ) 3E(X2 ) + 32 3
3 = E(X3 ) 3E(X2 ) + 33 3
3 = E(X3 ) 3E(X2 ) + 23 (Frmula prtica)
Para r = 4, temos
4 = E(X )4 =
(x )4 p(x)
(Frmula de definio)
xS X
Coeficiente de assimetria
a3 =
3
3
= 3/2
2 2 2
Coeficiente de curtose
a4 =
4
22
85
Elementos de Probabilidade
86
Elementos de Probabilidade
f(x)dx = 1
SX
A integral a ferramenta utilizada para se obter a rea sob a funo f(x) no intervalo
SX, que equivale a P(XSX) e deve ser igual a 1. Entretanto, na funo f(x) = 2x essa rea
adquire a forma de um tringulo, podendo ser mais facilmente calculada atravs da expresso
bh/2. Assim, temos
bh 1 2
=
= 1.
rea =
2
2
Como a rea sob a funo f(x) igual a 1, a segunda condio tambm foi atendida.
Logo, a funo f(x) = 2x no intervalo SX =[0, 1] uma funo densidade de probabilidade.
Exemplo 2. Seja a funo f(x) = 6x 6x2, no intervalo SX =[0,1]. Verifique se f(x) uma
funo densidade de probabilidade.
Primeira condio: f(x) 0, x SX
Como f(x) = 6x 6x2 uma funo quadrtica, so necessrios, pelo menos, trs
pontos para traar a parbola que representa a relao entre x e f(x). Devemos obter, ento, os
valores da funo f(x) nos pontos 0 e 1, que so os limites do intervalo SX, e no valor que
corresponde ao ponto crtico da funo. Para determinar este valor de x derivamos a funo e
igualamos a zero a primeira derivada. Deste modo, para
f(x) = 6x 6x2, temos
f (x) = 6 12x, sendo f (x) = 0, temos
0 = 6 12x
x=
6 1
=
valor de Xquecorrespondeaopontocrticode f (x)
12 2
87
Elementos de Probabilidade
Sabemos que:
se f (x) < 0 , a parbola tem concavidade para baixo, ou seja, tem ponto de mximo.
se f (x) > 0 , a parbola tem concavidade para cima, ou seja, tem ponto de mnimo.
Como a segunda derivada resultou negativa, conclumos que a funo tem ponto de
mximo. Assim, obtemos os valores da funo f(x) = 6x 6x2 nos pontos 0, 1/2 e 1:
para x = 0, temos f(0) = 6 0 6 02 = 0,
para x = 1/2, temos f(1/2) = 6 1/2 6 (1/2)2 = 3/2,
para x = 1, temos f(1) = 6 1 6 12 = 0.
A partir desses trs pontos possvel traar o grfico da funo
Observamos que todos os valores da funo f(x) so maiores que zero no intervalo de
0 a 1; portanto, a primeira condio foi atendida.
Segunda condio:
f(x)dx = 1
SX
Como a representao grfica de f(x) no intervalo [0, 1] uma parbola, a rea sob a
funo pode ser obtida atravs da integrao da diferencial da funo (f(x)dx) neste intervalo.
Da, temos
1
1
1
1
1
1
1
x2
x3
rea = f(x)dx = 6x 6x 2 dx = 6xdx 6x 2 dx = 6 xdx 6 x 2 dx = 6 6
2 0
3 0
0
0
0
0
0
0
) (
= 3 12 02 2 13 03 = 3 2 = 1.
Como a rea sob a funo f(x) no intervalo SX, que equivale a P(XSX), igual a 1, a
segunda condio tambm foi atendida.
Portanto, a funo f(x) = 6x 6x2, no intervalo SX =[0, 1] uma funo densidade de
probabilidade.
3.2.3.2. Funo de distribuio ou probabilidade acumulada
Definio: Seja X uma varivel aleatria contnua e SX o seu espao amostral. A
funo de distribuio, definida por F(x) ou P(X x), a funo que associa a cada valor de x
SX a sua probabilidade acumulada P(X x). Desta forma, temos
x
88
Elementos de Probabilidade
P(A) = rea de A =
1/2
1/2
x2
1
1
2xdx = 2 xdx = 2 = 02 =
4
2
2 0
0
3/4
3/4
3/4
x2
9 1 94 5
3 1
P (B) = rea de B = 2xdx = 2 xdx = 2 = =
=
=
16
16
2 1/2 4 2 16 4
1/2
1/2
Para f(x) = 2x, a funo de distribuio acumulada F(x) ser
x
t2
F(x) = P(X x) = 2tdt = 2 = x 2 02 = x 2 .
2 0
0
As probabilidades dos eventos A e B podem ser obtidas de outra forma atravs da
funo de distribuio acumulada F(x) = P(X x) = x 2 . Assim, temos
2
1
1
F(1/2) = P(X 1/2) = =
4
2
9
3
F(3/4) = P(X 3/4) = =
,
4
16
donde resulta
1
P(A) = F(1/2) =
4
e
9 1 5
P(B) = F(3/4) F(1/2) =
=
16 4 16
Para o Exemplo 2:
Seja f(x) = 6x 6x2 uma funo densidade de probabilidade definida no intervalo
SX=[0,1]. Para f(x) a funo de distribuio acumulada F(x) ser
89
Elementos de Probabilidade
x
x
x
x
t2
t3
F(x) = 6t 6t 2 dt = 6tdt 6t 2 dt = 6 6 = 3x 2 2x 3 .
2 0
3 0
0
0
0
x f(x)dx
E(X) = =
SX
(x )
f(x)dx
(Frmula de definio)
SX
ou
(Frmula prtica)
1
1
1
x3
13 03 2
E(X) = = E(X) = = x 2xdx = 2x 2 dx = 2 x 2 dx = 2 = 2 =
3 0
3 3 3
0
0
0
e
2
4 1
1 2
1 3
1 4 98 1
x 2
2
2
V(X) = = x 2xdx = 2x dx = 2 = =
=
2 9
18
18
4 0 3
0
E(X) = = x 6x 6x 2 dx = 6x 2 6x 3 dx 6x 2 dx 6x 3 dx
0
3 1
x
x
6 86 1
=6 6 = 2 =
=
4
4
2
3 0
4 0
4
e
1
V(X) = 2 = x 2 6x 6x 2 dx 2 = 6x 3 6x 4 dx 2
0
0
1
1
2
1
x 4
1
x 5 1
3 6 1 30 24 5 1
= 6x 3 dx 6x 4 dx 2 = 6 6 = =
=
2 5 4
20
20
0
5 0 2
0
4 0
90
Elementos de Probabilidade
Momentos
Segundo momento:
2 = E(X )2 =
(x )
f(x)dx
(Frmula de definio)
SX
SX
Terceiro momento:
3 = E(X )3 =
(x )
f(x)dx
(Frmula de definio)
SX
SX
SX
Quarto momento:
4 = E(X )4 =
(x )
f(x)dx
(Frmula de definio)
SX
SX
SX
Coeficiente de assimetria
a3 =
3
3
= 3/2
2 2 2
Coeficiente de curtose
a4 =
4
22
91
Elementos de Probabilidade
Exemplos:
Experimento 1. Uma lmpada colocada numa luminria.
S = {acende, no acende}
Vamos considerar um dos resultados como sucesso, por exemplo, sucesso = acender.
Definimos, ento, a varivel X como nmero de sucessos em uma repetio do experimento.
X = nmero de sucessos
92
Elementos de Probabilidade
Se for conhecido o poder germinativo do lote de sementes, por exemplo, 87%, ento,
podemos concluir que a probabilidade de a semente germinar 0,87. Como o evento {no
germinar} complemento do evento {germinar}, a probabilidade de no germinar ser 1 0,87.
Temos, ento
X=x
P(X = x)
0
0,13
1
0,87
0
0,5
1
0,5
Funo de probabilidade
De modo geral, se X uma varivel que tem distribuio de Bernoulli, ento a sua
funo de probabilidade ser:
Representao tabular
X=x
P(X = x)
0
(1)
onde:
= probabilidade de sucesso
(1) = probabilidade de fracasso
93
Elementos de Probabilidade
Representao analtica
P(X = x) = x (1 )1 x , para SX = {0, 1}
Parmetros
A distribuio de Bernoulli tem apenas um parmetro:
= probabilidade de sucesso
Dizemos, ento, que
X ~ Ber ().
Medidas descritivas
Mdia ou valor esperado: E(X) = =
x p(x)
xS X
E(X) = 0 (1 ) + 1 =
Teorema: E(X) = =
x 2p(x) = 02 (1 ) + 12 = ,
xS X
temos
V(X) = E(X2 ) 2 = 2 = (1 ).
Teorema: V(X) = 2 = (1 )
Coeficiente de Assimetria: a3 =
3
2 2
onde:
2 = E(X )2 = E(X2 ) 2
3 = E(X )3 = E(X3 ) 3E(X2 ) + 23
Teorema: a3 =
(1 )
(1 )
94
Elementos de Probabilidade
X = Y1 + Y2 + + Yn ,
onde:
Yi ~ Ber () e
Exemplo: Em uma estncia 60% dos bovinos foram vacinados contra uma
determinada doena. Se um bovino dessa estncia for escolhido ao acaso, ento, teremos um
experimento de Bernoulli com
S = {vacinado, no vacinado},
onde:
P(vacinado) = 0,6 e P(no vacinado) = 0,4.
Se trs bovinos forem escolhidos ao acaso, ento teremos uma sequncia de trs
experimentos de Bernoulli independentes uma vez que, a cada escolha, a probabilidade de
sucesso permanecer inalterada. O espao amostral deste experimento ser
S = {VVV, VVN, VNV, NVV, NNV, NVN, VNN, NNN},
onde:
V = vacinado e N = no vacinado.
Se a varivel X definida como o nmero de sucessos em n experimentos de
Bernoulli independentes, com probabilidade de sucesso igual a , ento, no exemplo, onde n =
3 e = 0,6 (se considerarmos sucesso = vacinado), o espao amostral da varivel X ser SX =
{0, 1, 2, 3} e as probabilidades P(X = x) ser:
P(X = 0) = 1 0 (1 )3 = 1 . 0,60 0,43 = 0,064
P(X = 1) = 3 1 (1 )2 = 3 . 0,61 0,42 = 0,288
P(X = 2) = 3 2 (1 )1 = 3 0,62 0,41 = 0,432
P(X = 3) = 1 3 (1 )0 = 1 0,63 0,40 = 0,216
Sendo assim, a distribuio de probabilidade da varivel X ser
X=x
P(X = x)
0
0,064
1
0,288
2
0,432
3
0,216
Funo de probabilidade
De modo geral, se X uma varivel que tem distribuio binomial, ento a sua funo
de probabilidade ser:
Elementos de Probabilidade
Medidas descritivas
Mdia ou valor esperado: E(X) = =
x p(x)
xS X
Considerando que uma varivel X com distribuio binomial pode ser definida como a
soma de variveis de n variveis Y independentes, podemos utilizar as propriedades da mdia.
Sendo X = Y1 + Y2 + + Yn ,
temos
E(X) = E(Y1 + Y2 + + Yn )
E(X) = E(Y1 ) + E(Y2 ) + + E(Yn )
E(X) = + + + = n
Teorema: E(X) = = n
Varincia: V(X) = 2 = E(X2 ) 2
Sendo X = Y1 + Y2 + + Yn ,
temos
V(X) = V(Y1 + Y2 + + Yn )
V(X) = V(Y1 ) + V(Y2 ) + + V(Yn )
V(X) = (1 ) + (1 ) + + (1 ) = n (1 )
Coeficiente de assimetria: a3 =
Teorema: a3 =
3
2 2
(1 )
n(1 )
4
22
Fazendo a4 = a4 3 , temos:
Teorema: a4 =
1 6(1 )
n(1 )
Elementos de Probabilidade
No exemplo:
E(X) = 3 0,6 = 1,8 bolas
Significado do valor esperado: Se o experimento (escolher trs bovinos) for repetido
um grande nmero de vezes, o valor esperado ser o nmero mdio de sucessos (bovinos
vacinados) obtidos nesses experimentos.
V(X) = 3 0,6 0,4 = 0,72 bolas2
Significado da varincia: Se o experimento (escolher trs bovinos) for repetido um
grande nmero de vezes, a varincia expressar a variao mdia do nmero de sucessos
(bovinos vacinados) obtidos nesses experimentos em relao ao valor esperado.
a3 =
0,4 0,6
= 0,24 distribuio assimtrica negativa
3 0,6 0,4
1 6 0,6 (1 0,6)
= 0,61 distribuio platicrtica
3 0,6 (1 0,6)
sub-populao
de interesse
N1
N2
(N = N1 + N2)
97
Elementos de Probabilidade
N = 10 painis
N1 = 7
Plana
sub-populao
de interesse
N2 = 3
Concentrador
C07 C33
3
C10
C17 C23
P(X = 1) =
3
C10
P(X = 2) =
P(X = 3) =
C72 C13
3
C10
C37 C03
3
C10
1 1
1
=
= 0,008333
120 120
7 3 21
=
= 0,175
120 120
21 3 63
=
= 0,525
120 120
351 35
=
= 0,2917
120 120
0
1/120
1
2
3
21/120 63/120 35/120
Funo de probabilidade
De modo geral, se X uma varivel que tem distribuio hipergeomtrica, ento sua
funo de probabilidade ser:
P(X = x) =
CNx 1 CNn2 x
CNn
Parmetros
A distribuio hipergeomtrica tem trs parmetros:
N = tamanho da populao
N1 = nmero de elementos da sub-populao de interesse
n = nmero de elementos retirados (repeties do experimento de Bernoulli)
Dizemos, ento, que
X ~ Hip (N, N1, n).
98
Elementos de Probabilidade
Medidas descritivas
Mdia ou valor esperado: E(X) = =
x p(x)
xS X
Teorema: E(X) = = n
N1
N
N1 N2 N n
,
N N N 1
onde:
Nn
o fator de correo para populaes finitas.
N 1
E(X) = 3
Elementos de Probabilidade
x!
onde:
X: nmero de sucessos;
e: nmero base dos logaritmos neperianos = 2,718 (constante);
: nmero mdio de sucessos (sempre maior que zero).
Podemos demonstrar que a funo P(X = x) = e
provando que
x!
xSx
x =0
x =0
p(x) = e
x
x!
x =0
x!
= e
2 3
= e 1+ +
+
+
2! 3!
= e (e )
= e + = e0 = 1
Parmetros
A distribuio de Poisson tem apenas um parmetro:
x p(x)
xS X
E(X) = xp(x) =
x =0
x =0
x!
x e
x =0
x!
= e x
= e
x =1
x =0
x 1
(x 1)!
y =0
y!
= e
= e x
x 1
x(x 1)!
= e
x =1
= e x
x =1
x 1
x (x 1)!
x 1
, fazendo y = x 1, temos
(x 1)!
= e e = e + = e0 =
100
Elementos de Probabilidade
Teorema: E(X) = =
p(x)
x =0
x!
x =0
=e
x =1
=e
x!
x =0
x 1
x (x 1)!
=e
x 1
x (x 1)!,
fazendo y = x 1, temos
x =1
y y
E(X ) = e (y +1)
= e y
+
y!
y! y!
y =0
y =0
2
= e ( e + e )
y =0 y! y =0 y!
= e e + e e = e 0 2 + e0 = 2 +
= e
Coeficiente de assimetria: a3 =
Teorema: a3 =
3
2 2
quando cresce.
Coeficiente de curtose: a4 =
4
22
Elementos de Probabilidade
Nn Nn N n
n
= = 1 1
N 1
N
N N
N
sub-populao
de interesse
N1 =128
Com erro
N2 = 5872
Sem erro
n = 120 faturas, sem reposio
Elementos de Probabilidade
N1 128
=
= 0,02133.
N 6000
= E(X) = n = 2,56.
Da temos
P(X = 2) = e
x
x!
= e 2,56
2,562
6,5536
= 0,0773
0,2533.
2!
2
Verificamos, assim, que nas situaes que envolvem grandes valores de n e valores
ainda maiores de N, a distribuio de Poisson torna-se bastante til.
Exerccios propostos:
3.8. A probabilidade de um atirador acertar o alvo de 0,25. Se quatro atiradores atiram, qual
a probabilidade do alvo ser atingido?
3.9. A taxa mdia de chegada de clientes em um posto de servios de 0,5 por minuto.
Calcular a probabilidade de, em um dado minuto, chegarem dois clientes.
3.10. Sendo de 1% o percentual de canhotos numa populao, qual a probabilidade de haver
apenas um canhoto numa classe de 30 alunos?
103
Elementos de Probabilidade
f(x) =
1
,
0,
para x
em caso contrrio
f(x)dx = 1.
Sx
1
x
f(x)dx
=
dx = = = = 1
Sx
Parmetros
A distribuio uniforme tem dois parmetros:
Elementos de Probabilidade
Medidas descritivas
Mdia ou valor esperado: E(X) = =
x f(x)dx
SX
E(X) = =
x f(x)dx
Sx
1
1 x2
= x
dx
=
2
=
1 2 2 ( )( + ) ( + )
=
=
2
2( )
2
Teorema: E(X) = =
( + )
2
f(x)dx
Sx
1
1 x3
=x
dx =
3
1 3 3 3 3
=
3 3( )
Assim, temos
3 3 ( + )2
3( )
4
3
3
3
3 2
4( ) 3( )( + )
=
12( )
43 4 3 + 33 + 3 2 32 33
=
12( )
3
3
3
+ 3 32
( )3
( )2
=
=
=
12( )
12( )
12
V(X) = 2 = E(X2 ) 2 =
Teorema: V(X) = 2 =
( )2
12
x
x
F(x) = P(X x) =
f(x) dx =
,
1,
se x <
se x
se x >
105
Elementos de Probabilidade
a)
b)
8,5 5
3,5
= 1
= 1 0,7 = 0,3
10 5
5
c)
95
85
43 1
=
= = 0,2
10 5 10 5
5
5
9,5 5 5,5 5
+
= 0,1 0,1 = 0,2
10 5 10 5
106
Elementos de Probabilidade
f(x) =
0,
para x >0
em caso contrrio
f(x) dx = 1.
Sx
Sx
f(x) dx = e x dx = e x = e e 0 = 0 ( 1) = 1
0
0
Parmetros
A distribuio exponencial tem apenas um parmetro:
x f(x)dx
SX
E(X) = =
x f(x) dx
Sx
= x e x dx =
0
Teorema: E(X) = =
V(X) = 2 = x2 f(x)dx 2
Sx
1
1
= x2 e x dx 2 = 2
107
Elementos de Probabilidade
Teorema: V(X) = 2 =
se x < 0
0,
x
1 e , se x 0
f(x) dx =
Assim, o lucro do fabricante ser uma varivel aleatria discreta Y com a seguinte distribuio:
Y=y
P(Y = y)
-2
3
0,5934 0,4066
108
Elementos de Probabilidade
1
f(x) =
e
2
(x )2
2 2
-<X<+
Parmetros
A distribuio normal tem dois parmetros:
109
Elementos de Probabilidade
Medidas descritivas
Mdia ou valor esperado: E(X) = =
x f(x)dx
SX
(x )
1
2
E(X) = = x
e 2
S X 2
Varincia: V(X) = 2 =
(x )
dx
f(x)dx
SX
(x )
1
V(X) = = (x )
e 2
2
SX
dx
Elementos de Probabilidade
Vimos que, para cada valor de e de , existe uma distribuio normal diferente. Da
existirem infinitas distribuies (e curvas) normais, pois basta que mude um dos parmetros
para termos outra distribuio. Deste modo, o clculo de reas sob a curva normal,
frequentemente necessrio, dever ser feito sempre em funo dos particulares valores de e
. Para evitar a trabalhosa tarefa de calcular essas reas todas as vezes que desejssemos
obter as probabilidades associadas a uma certa varivel X, foi determinada uma distribuio
normal padro ou reduzida. Atravs da distribuio normal padro possvel estudar qualquer
varivel que tenha distribuio normal, com quaisquer valores para e .
Distribuio normal padro
Definio: a distribuio normal de uma varivel Z que tem mdia igual a zero ( = 0)
e desvio padro igual a um ( = 1). Para a varivel Z, a funo densidade de probabilidade
resulta
f(z) =
1
2
z2
2
- < Z < + .
Elementos de Probabilidade
112
Elementos de Probabilidade
A relao evidente, uma vez que a transformao muda as variveis, mas no altera
a rea sob a curva, como podemos verificar na figura a seguir.
X ~ N (, 2)
Z=
Z ~ N (0, 1)
Aps a transformao, podemos procurar na tabela a rea compreendida entre 0 e z,
que corresponder rea entre e x.
Consideremos o exemplo resolvido a seguir.
Sabendo que as notas de 450 alunos esto normalmente distribudas, com mdia =
3,9 e desvio padro = 0,28, determine:
a) a probabilidade de um aluno ter nota maior que 4,27;
b) o nmero de alunos que tm nota superior a 4,27.
Resoluo:
a) Sabemos que a probabilidade de ocorrer um valor dentro de um determinado intervalo
corresponde rea sob a funo densidade dentro deste intervalo. Sendo assim, para
determinar a probabilidade de ocorrer uma nota maior do que 4,27, devemos encontrar a rea
localizada direita de 4,27 na curva normal.
113
Elementos de Probabilidade
Para encontrar essa rea, vamos utilizar a tabela da distribuio normal padro. Inicialmente,
X
fazemos a transformao da varivel X para a varivel Z, atravs da expresso Z =
.
Assim, temos z =
4,27 3,9
= 1,32
0,28
Sabemos que a tabela fornece a rea entre 0 e z, portanto, o valor 0,4066, encontrado na
tabela para z = 1,32, expressa a rea compreendida entre 0 e 1,32. Como a rea que nos
interessa a rea direita de 1,32 e sabemos que a rea correspondente metade da curva
0,5, podemos encontrar a rea de interesse calculando a diferena entre essas duas reas.
114
Elementos de Probabilidade
Assim, fazemos
P(Z > 1,32) = P(Z > 0) P(0<Z<1,32)
P(Z > 1,32) = 0,5 0,4066
P(Z > 1,32) = 0,0934
Sabendo que a rea direita de z = 1,32 e igual rea direita de x = 4,27, conclumos que a
probabilidade de Z ser maior que 1,32 igual probabilidade de X ser maior que 4,27. Sendo
assim, a probabilidade de um aluno tirar uma nota acima de 4,27 de 0,0934 ou 9,34%, ou
seja, P(X > 4,27) = 0,0934.
b) Para determinar o nmero de indivduos que tm nota superior a 4,27, devemos saber qual
o percentual da populao que tm nota acima de 4,27. No item a, vimos que este percentual
de 9,34%. Sendo assim, atravs de uma regra de trs simples, podemos determinar quantos
estudantes correspondem a 9,34% de uma populao de 450 estudantes. Esse valor pode ser
obtido facilmente multiplicando o tamanho da populao pela probabilidade de ocorrer uma
nota maior que 4,27. Assim, temos:
450 0,0934 = 42,03
Conclumos, ento, que, dos 450 estudantes, 42 tm nota superior a 4,27.
115
Elementos de Probabilidade
Exerccios propostos:
3.11. Uma varivel X uniformemente distribuda no intervalo [10, 20]. Determine:
a) valor esperado e varincia de X;
b) P(12,31 < X < 16,50).
3.12. Os tempos at a falha de um dispositivo eletrnico seguem o modelo exponencial, com
uma taxa de falha = 0,012 falhas/hora. Indique qual a probabilidade de um dispositivo
escolhido ao acaso sobreviver a 50 horas? E a 100 horas?
3.13. Suponha que um mecanismo eletrnico tenha um tempo de vida X (em unidades de 1000
horas) que considerado uma varivel aleatria com funo densidade de probabilidade dada
por:
f(x) = e-x , x > 0
= 0, em caso contrrio.
Suponha ainda que o custo de fabricao de um item seja 2 reais e o preo de venda seja 5
reais. O fabricante garante total devoluo se X 0,8. Qual o lucro esperado por item?
3.14. Seja Z uma varivel aleatria com distribuio normal padro. Determine as seguintes
probabilidades:
a) P(0 < Z < 1,73)
b) P(0,81 < Z < + )
c) P(-1,25 Z -0,63)
3.15. Suponha que a estatura de recm-nascidos do sexo feminino uma varivel com
distribuio normal de mdia = 48 cm e = 3 cm. Determine:
a) a probabilidade de um recm-nascido ter estatura entre 42 e 49 cm;
b) a probabilidade de um recm-nascido ter estatura superior a 52 cm;
c) o nmero que de recm-nascidos que tm estatura inferior +cm, dentre os 532 que
nasceram numa determinada maternidade, no perodo de um ms.
3.16. Suponha que as notas de uma prova sejam normalmente distribudas, com mdia =72 e
desvio padro =1,3. Considerando que 18% dos alunos mais adiantados receberam conceito
A e 10% dos mais atrasados o conceito R, encontre a nota mnima para receber A e a
mxima para receber R.
116
Elementos de Probabilidade
3.3. Bibliografia
COSTA, S.F. Introduo Ilustrada Estatstica (com muito humor!). 2.ed., So Paulo:
Harbra, 1992. 303p.
DEVORE, J. Probability and statistics for engineering and the sciences Brooks/Cole
Publishing Companig. 1982. 640p.
FARIA, E.S. de Estatstica Edio 97/1. (Apostila)
FERREIRA, D.F. Estatstica Bsica. Lavras: Editora UFLA, 2005, 664p.
FREUND, J.E., SIMON, G.A. Estatstica Aplicada.
Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p.
Economia,
Administrao
117
Unidade IV
Inferncia Estatstica
Unidade IV. Inferncia Estatstica
4.1. Introduo e histrico................................................................................................ 119
4.2. Conceitos fundamentais............................................................................................ 121
4.3. Distribuies amostrais............................................................................................. 124
4.3.1. Distribuies amostrais de algumas estatsticas importantes.........................
130
137
166
171
196
197
Inferncia Estatstica
Inferncia Estatstica
Um pouco de histria...
Lambert Qutelet
(1796 - 1855)
Karl Pearson
(1857 - 1936)
Francis Galton
(1822 - 1911)
Egon Pearson
(1895 - 1980)
Ronald Fisher
(1890 - 1962)
120
Inferncia Estatstica
Inferncia Estatstica
Inferncia Estatstica
U150
45,15
140,70
86,10
30,75
108,00
105,30
22,80
75,75
94,95
84,90
[U150] + 1
46
141
87
31
109
106
23
76
95
85
1
.
N
Inferncia Estatstica
40
0,2
45
0,3
50
0,5
Inferncia Estatstica
Resoluo:
a) Mdia e a varincia da populao:
E(X) = =
xS X
V(X) = 2 = E(X2 ) 2 = (402 0,2 + 452 0,3 + 502 0,5) 46,52 = 15,25
b) Distribuio de probabilidade, mdia e varincia de cada elemento da amostra [X1, X2, ..., Xn]
Amostra aleatria de tamanho n [X1, X2, ..., Xn]
Distribuio de probabilidade de X1
X1 = x1
P(X1 = x1)
40
0,2
45
0,3
50
0,5
E(X1) = = 46,5
V(X1) = 2 = 15,25
Distribuio de probabilidade de X2
X2 = x2
P(X2 = x2)
40
0,2
45
0,3
50
0,5
E(X2) = = 46,5
V(X2) = 2 = 15,25
Distribuio de probabilidade de Xn
Xn = xn
P(Xn = xn)
40
0,2
45
0,3
50
0,5
E(Xn) = = 46,5
V(Xn) = 2 = 15,25
Verificamos, assim, que se [X1, X2, ..., Xn] uma amostra aleatria, o valor esperado
de cada elemento da amostra igual mdia da populao e a varincia de cada elemento da
amostra igual varincia da populao, ou seja,
E(Xi) =
V(Xi) = 2
125
Inferncia Estatstica
[X1, X2]
(40, 40)
(40, 45)
(40, 50)
(45, 40)
(45, 45)
(45, 50)
(50, 40)
(50, 45)
(50, 50)
P [X1, X2]
0,2 0,2 = 0,04
0,2 0,3 = 0,06
0,2 0,5 = 0,10
0,3 0,2 = 0,06
0,3 0,3 = 0,09
0,3 0,5 = 0,15
0,5 0,2 = 0,10
0,5 0,3 = 0,15
0,5 0,5 = 0,25
X
40
42,5
45
42,5
45
47,5
45
47,5
50
Assim, temos a distribuio amostral da mdia das amostras de tamanho dois. Essa
distribuio de probabilidade pode ser apresentada na forma tabular abaixo.
40
0,04
X=x
P(X = x)
42,5
0,12
45
0,29
47,5
0,3
50
0,25
xS X
V(X) = 2X = E(X2 ) 2X = (402 0,04 + 42,52 0,12 + + 502 0,25) 46,52 = 7,625
Inferncia Estatstica
P[X1, X2, X3]
0,008
0,012
0,020
0,012
0,018
0,030
0,020
0,030
0,050
0,012
0,018
0,030
0,018
0,027
Amostra
15
16
17
18
19
20
21
22
23
24
25
26
27
X
40
41,7
43,3
41,7
46,7
45
43,3
45
48,3
41,7
43,3
45
43,3
45
X
46,7
45
46,7
48,3
43,3
45
46,7
45
46,7
48,3
46,7
48,3
50
40
0,008
41,7
0,036
43,3
0,114
45
0,207
46,7
0,285
48,3
0,225
50
0,125
xS X
V(X) = 2X = E(X2 ) 2X = (402 0,008 + 41,72 0,036 + + 502 0,125) 46,52 = 5,083
Resultados importantes
Relacionando as medidas da distribuio amostral da mdia ( X ) com as medidas da
distribuio populacional (X), podemos verificar algumas propriedades importantes:
A mdia das mdias de todas as k amostras aleatrias possveis, de mesmo
tamanho n, extradas de uma populao, igual mdia da populao, ou seja,
E(X) = .
2
n
Deste resultado podemos obter tambm o desvio padro da mdia que igual ao
desvio padro da populao dividido pela raiz do tamanho da amostra, ou seja,
X = V(X) =
2
n
2
n
127
Inferncia Estatstica
Populao
Inferncia Estatstica
se X ~ N (, 2),
As mdias so iguais,
mas a varincia de
X n vezes menor.
ento, X ~ N (, 2/n).
= Z ~ N ( 0,1) .
n ( X )
= Z ~ N ( 0,1) .
A demonstrao completa desse teorema no ser dada porque exigiria recursos dos
quais no dispomos, mas o importante sabermos como esse resultado pode ser usado.
A importncia da distribuio normal na estatstica se deve em grande parte a este
teorema. Observemos que se a populao tem distribuio normal, ento X ter distribuio
normal exata. Se a populao no tem distribuio normal, X poder ter distribuio normal
aproximada ou assinttica.
O TCL afirma que X aproxima-se de uma normal quando n tende para o infinito e a
rapidez dessa convergncia depende da distribuio da populao da qual a amostra retirada
(Figura 4.1). Se a populao tem uma distribuio prxima da normal, a convergncia rpida;
mas se esta populao se afasta muito da normal, a convergncia mais lenta, implicando
numa amostra maior para que X tenha uma distribuio aproximadamente normal. Para a
ordem de 30 a 50 elementos a aproximao pode ser considerada satisfatria.
Distribuies importantes como Binomial e Poisson (definidas como a soma de
variveis Bernoulli) se aproximam naturalmente da normal. Se a distribuio Binomial
simtrica (=0,5), a aproximao (ou convergncia) mais rpida.
129
Inferncia Estatstica
E(Y) = c1 + c 2 + + c n = c i
i=1
Varincia
V(Y) = V(c1X1 + c 2 X2 + + c n Xn )
i=1
i=1
Xi
Inferncia Estatstica
Seja Q uma nova varivel definida como a soma dos quadrados de variveis Z
independentes. Ento, dizemos que a varivel Q tem distribuio qui-quadrado, denotada por
2, com parmetro , ou seja,
22
q
2
1
2
q ,
com 0 q < +.
Sendo a varivel Q definida como uma soma de quadrados, seus valores nunca sero
negativos. A curva da distribuio 2, representao grfica da funo densidade de
probabilidade, muda o seu formato medida que varia o nmero de graus de liberdade.
Exemplos:
Inferncia Estatstica
(n 1)S2
~ 2 (), onde = n 1.
Esta varivel surge da seguinte situao: seja a varivel X ~ N (, 2) e [X1, X2, ..., Xn]
uma amostra aleatria dela proveniente. A varincia desta amostra ser
( Xi X )
=
ou (n 1)S2 =
n 1
( X X)
( Xi X )
=
=
=
=
Xi
Fazendo
= Zi
2
Xi X
n
= Z , temos
X
i = Zi2 = Z12 + Z22 + ... + Zn2 = Qn ~ 2 (n)
e
2
X
2
2
= Z = Q1 ~ (1) ,
n
ento,
(n 1)S2
( Xi X )
=
2
= Qn Q1 ,
donde resulta
Qn Q1 = (Z12 + Z22 + + Zn2 ) Z2 = Q(n1) ~ 2 (n 1) .
Ei
i =1
Q =
i=1 j=1
(X
ij
Eij
Eij
~ 2 ( ) , onde = (r1)(s1)
132
Inferncia Estatstica
Distribuio t de Student
Seja uma varivel Z, com distribuio normal padro, e uma varivel Q, com
distribuio 2 independentes, ento, dizemos que uma varivel T definida como:
T=
Z
Q
~ N(0, 1)
e
Q=
(n 1)S2
~ 2 ( ) , onde = n 1 .
(n 1)S2
Ento,
donde resulta T =
Q
=
n 1
Z
=
Q
n 1
X
n
S2
X
S
S2
X
n X
=
=
S
S n
Assim, temos T =
~ t( ) , onde = n 1
De uma maneira geral, uma varivel com distribuio t muito parecida com uma
normal padro, exceto que o desvio padro, que aparece no denominador, o desvio padro
amostral e no o populacional.
A funo densidade de probabilidade da distribuio t de Student com graus de
liberdade dada por
f(t) =
1
1
, com - < t < +.
1
1
+
, t 2 2
2 2 1+
133
Inferncia Estatstica
Exemplos:
A varivel T =
E( )
tem distribuio t, sendo uma
S()
= 1 2 e S( ) = S ( X1 X2 ) ,
resultando que
T=
(X
X2 ( 1 2 )
S X1 X2
~ t( ) .
134
Inferncia Estatstica
Distribuio F de Snedecor
Sejam duas variveis Q1 e Q2 com distribuio 2 independentes, ento, dizemos que
uma varivel F definida como:
Q1
F=
Q2
1 2
f2
g(f) =
, com 0 f < +.
1 + 2
1 , 2 2 1 2
f
2 2
1+
2
1
135
Inferncia Estatstica
( X1i X1 )
=
S22
n1 1
( X2i X2 )
=
n2 1
12
( X1i X1 )
=
12
= Q1 ~ 2 (n1 1)
e
(n2 1)S22
22
( X2i X2 )
=
22
= Q2 ~ 2 (n2 1) .
Se
Q1
F=
Q2
~ F(1, 2 ) ,
onde:
(n1 1)S12
Q1
12
n1 1
S12
S22
12
e
(n2 1)S22
Q2
22
n2 1
22
ento, temos
S12
Q1
F=
Q2
12
S22
~ F(1, 2 ) .
22
Q2
onde:
S12
~ F(1, 2 ) ,
S22
1 = n1 1 ;
2 = n2 1 .
136
Inferncia Estatstica
Sendo o estimador uma varivel que pode assumir diferentes valores, chamamos de
estimativa um valor particular que o estimador assume.
Consideremos como exemplo a seguinte populao constituda por quatro valores
(N = 4):
X=x
P(X=x)
1
0,2
2
0,3
3
0,3
4
0,2
Inferncia Estatstica
= 2,5
Parmetro
X=
Estimador
Amostra 1: (1, 1)
Amostra 2: (1, 2)
Amostra 3: (1, 3)
Estimativas
2 = 1,05
Xi
n
1+ 1
x1 =
=1
2
1+ 2
x2 =
= 1,5
2
x3 = 2
S2 =
(Xi X)2
n 1
(1 1) + (1 1)2
s12 =
=0
2 1
(1 1,5)2 + (2 1,5)2
s22 =
= 0,5
2 1
s32 = 2
2
Amostra 4: (1, 4)
x 4 = 2,5
s24 = 4,5
Amostra 5: (2, 1)
x 5 = 1,5
s25 = 0,5
Amostra 6: (2, 2)
x6 = 2
s26 = 0
Amostra 7: (2, 3)
x 7 = 2,5
s27 = 0,5
Amostra 8: (2, 4)
x8 = 3
s82 = 2
Amostra 9: (3, 1)
x9 = 2
s92 = 2
x10 = 2,5
2
s10
= 0,5
x11 = 3
2
s11
=0
x12 = 3,5
2
s12
= 0,5
x13 = 2,5
2
s13
= 4,5
x14 = 3
2
s14
=2
x15 = 3,5
2
s15
= 0,5
x16 = 4
2
s16
=0
Devemos considerar tambm que podem existir vrios estimadores para um mesmo
parmetro. Por exemplo, a mdia aritmtica simples ( X ) e a mdia aritmtica ponderada ( Xp ),
calculadas na amostra, bem como qualquer elemento em particular de uma amostra aleatria
( Xi ), so todos estimadores da mdia populacional ().
X=
Xi
n
Xp =
Xipi
pi
Xi
estimadores de
(Xi X)2
Sn2 =
n 1
(Xi X)2
n
2
estimadores de
Inferncia Estatstica
Exemplos:
X um estimador imparcial de , pois E( X ) = .
Xp um estimador imparcial de , pois E( Xp ) = .
X1 um estimador imparcial de , pois E( X1 ) = .
n 1 2
[ X1, X2 , X3 ]
Mdia ponderada ( Xp )
X1 + X2 + X3 1
= ( X1 + X2 + X3 )
3
3
1
X = V ( X1 + X2 + X3 )
3
1
X = V ( X1 + X2 + X3 )
9
1
X = V ( X1 ) + V ( X2 ) + V ( X3 )
9
1
X = 2 + 2 + 2
9
3 2
X =
= 0,332
9
X=
Xp = V ( X1 + 2X2 + X3 )
4
1
V ( X1 + 2X2 + X3 )
Xp =
16
1
V ( X1 ) + 4V ( X2 ) + V ( X3 )
Xp =
16
1 2
Xp =
+ 42 + 2
16
62
Xp =
= 0,382
16
Xp =
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
Comparando as varincias dos trs estimadores: V(X) = 0,332 < V(Xp ) = 0,382 < V(X1 ) = 2 ,
verificamos que a mdia aritmtica simples tem a menor variao, portanto, o estimador mais
eficiente.
Consistncia
Um estimador consistente se medida que o tamanho da amostra aumenta o valor
do estimador se aproxima do parmetro.
n N
139
Inferncia Estatstica
Exemplo:
xi = 1 + 3 + 2 = 2
n
s2 =
(xi x)2
n 1
2
n
).
140
Inferncia Estatstica
V(X)
sendo que Z tem distribuio normal com mdia igual a zero e varincia igual a um, ou seja,
X
Z=
~ N (0, 1)
Da, temos
P(-z/2 < Z < z/2) = 1
O valor denominado nvel de significncia ou taxa de erro (usualmente com valor
0,05 ou 0,01), enquanto o valor 1 representa o nvel de confiana do intervalo.
Sabendo que Z =
n
X
P(-z/2 <
< z/2) = 1 .
P(-z/2 <
< z/2) = 1
P(-z/2
P(- X -z/2
P[(- X -z/2
P( X +z/2
) = 1
) = 1
) (-1)] = 1
) = 1
141
Inferncia Estatstica
) = 1
onde:
X : o estimador de ;
z/2: o valor da varivel Z que delimita a rea /2 (Tabela I do Apndice);
n: o tamanho da amostra;
: desvio padro da populao (parmetro).
Inferncia Estatstica
Podemos verificar tambm que todos os intervalos com mesmo nvel de confiana tm
a mesma amplitude: 2z/2
.
n
Na maioria dos casos no conhecemos, de fato, o parmetro , pois no estudamos a
populao inteira. Entretanto, com base na propriedade de consistncia dos estimadores,
quando a amostra tem tamanho grande, a estimativa de um parmetro considerada
suficientemente prxima do parmetro. Assim, quando trabalhamos com grandes amostras a
estimativa de , que s (desvio padro da amostra), pode ser usada no lugar do parmetro.
Consideramos a amostra suficientemente grande para utilizar a varivel Z quando n maior
que 30.
Duas pressuposies devem ser atendidas para a utilizao desta metodologia:
1. A varivel em estudo tem distribuio normal, X ~ N (, 2).
2. A varincia populacional conhecida ou o tamanho da amostra suficientemente
grande para obteno de uma estimativa aproximada da variao populacional ().
Consideremos o seguinte o exemplo resolvido.
Uma amostra de 100 terneiros de dois meses de idade da raa Ibag apresentou peso
mdio de 65,5kg e desvio padro de 4,8kg. Obtenha o intervalo de confiana, ao nvel de 95%,
para o verdadeiro peso mdio de terneiros e redija a concluso.
Varivel em estudo: X = peso de terneiros (kg)
Pressuposies: 1. A varivel em estudo tem distribuio normal.
2. A amostra tem tamanho suficiente para estimar .
Estimativas:
x = 65,5 kg
s = 4,8 kg
n = 100 terneiros
z/2 = z0,025 = 1,96
IC (; 1
): X z/2
4,8
100
Inferncia Estatstica
X
~ t (),
S
n
onde:
X : a mdia da amostra (estimador de );
S: o desvio padro da amostra (estimador de );
n: tamanho da amostra;
= n 1: o nmero de graus de liberdade associado varincia da amostra S2.
Sob o ponto de vista das aplicaes, podemos definir a estatstica T de uma forma
mais genrica:
T=
~ t (),
S( )
onde:
: o parmetro que est sendo estimado;
: o estimador do parmetro;
S( ): o estimador do desvio (ou erro) padro de .
Distribuio t
Em 1908, o pesquisador ingls William Gosset, ao tentar resolver problemas relativos
a pequenas amostras, descobriu a distribuio t.
William Gosset
(1876 - 1937)
144
Inferncia Estatstica
Da, temos
P(-t/2 < T < t/2) = 1.
Sabendo que T =
X
e fazendo a substituio, temos
S
n
X
P(-t/2 <
< t/2) = 1.
S
n
P(-t/2 <
donde resulta
S
,
n
sendo t/2 o valor da estatstica T que delimita a rea /2. Este valor encontrado na tabela da
distribuio t de Student (Tabela II do Apndice), a partir dos valores de e de .
IC (;1): X t/2
145
Inferncia Estatstica
Sendo = , temos
= X = 25,31
= S(X) = S = 1,579 = 0,4076
S()
n
15
= n 1 = 15 1 = 14
t/2() = 2,145
IC ( ; 1): t/2 S( )
IC (; 0,95): 25,31 2,145 0,4076
IC (; 0,95): 25,31 0,874
Limite inferior = 25,31 0,874 = 24,44
Limite superior = 25,31 + 0,874 = 26,18
P(24,44 < < 26,18) = 0,95
Conclumos que a probabilidade de o intervalo de 24,44w a 26,18w conter a
verdadeira potncia mdia de aparelhos eletrnicos de alta sensibilidade de 0,95.
146
Inferncia Estatstica
onde:
~ t (),
S( )
= 1 2
= X X
1
S( ) = S(X1 X2 )
= ( n1 1) + (n2 1) = n1 + n2 2
2
n
S2
. Como consequncia, temos
n
( )
( )
S2 X1 + S2 X2 =
S12 S22
+
.
n1 n2
147
Inferncia Estatstica
S12 ( n1 1) + S22 ( n2 1)
( n1 1) + ( n2 1)
Da resulta que
1 1
S12 S22
S2 S2
+
=
+
= + S2 .
n1 n2
n1 n2
n1 n2
200
180
190
190
180
Rao experimental
220
200
210
220
210
Inferncia Estatstica
Estimativas:
Amostra 1: n1 = 5
x1 = 188
s12 = 70
Amostra 2: n2 = 5
x 2 = 212
s22 = 70
Sendo = 1 2 , temos:
= X1 X2 = 188 212 = 24
S2 =
S12 ( n1 1) + S22 ( n2 1)
(n1 1) + ( n2 1)
70 4 + 70 4
= 70
4+4
1 1
1 1
S( ) = S(X1 X2 ) = + S2 = + 70 = 5,292
5 5
n1 n2
= ( n1 1) + ( n2 1) = 4 + 4 = 8
t/2() = 3,36
IC(; 1 ) : t /2 S( )
IC ( 1 2 ; 0,99): -24 3,36 5,292
IC ( 1 2 ; 0,99): -24 17,78
149
Inferncia Estatstica
Q=
( Xi X )
i=1
(n 1)S2
~ 2 ( ) ,
ou seja, a varincia da amostra (S2) uma varivel aleatria que tem distribuio 2 com
parmetro =n1 graus de liberdade. Assim, a distribuio 2 a base para inferncias a
respeito da varincia 2 .
De acordo com a figura abaixo, vemos que 1 a probabilidade de que a varivel Q
assuma um valor entre q/2 e q/2 e a probabilidade de Q no estar entre q/2 e q/2
Da, temos
P( q/2 < Q < q/2 ) = 1.
Sendo Q =
(n 1)S2
(n 1)S2
< q/2 ) = 1.
onde:
S2 o estimador da varincia populacional 2;
n o tamanho da amostra;
= n1 o nmero de graus de liberdade associado varincia;
q/2 o valor da distribuio qui-quadrado, com graus de liberdade, que delimita a
rea /2 esquerda (Tabela III do Apndice);
q/2 o valor da distribuio qui-quadrado com graus de liberdade que delimita a
rea /2 direita (Tabela III do Apndice).
150
Inferncia Estatstica
.
q/2
q/2
Para determinar um intervalo de confiana para o desvio padro populacional ()
basta tomar a raiz quadrada positiva dos limites do intervalo para a varincia populacional:
(n 1)S2 (n 1)S2
;
q/2
q/2
=
= [ 4,58; 21,27 ] .
q/2
18, 31
3, 94
q/2
(n 1)s2 (n 1)s2
;
q/2
q/2
Conclumos, com uma confiana de 90%, que os intervalos 4,58 a 21,27 e 2,14 a 4,61
cobrem, respectivamente, a verdadeira varincia e o verdadeiro desvio padro da populao.
4.4.3.3. Intervalo de confiana para a proporo de uma populao ()
Se o objetivo estimar a proporo populacional (), atravs de uma amostra
aleatria desta populao, utilizamos como estimador a proporo da amostra (P).
151
Inferncia Estatstica
P =
(1 )
n
Como Z =
P P
P
, substitumos Z na expresso acima e obtemos:
(1 )
n
P(-z/2 <
P
< z/2) = 1
(1 )
n
(1 )
n
(1 )
n
) = 1.
(1 )
um valor
n
desconhecido, uma vez que no conhecemos . Entretanto, com base na propriedade de
consistncia dos estimadores, quando o tamanho da amostra grande, podemos considerar o
valor do estimador (P) suficientemente prximo do parmetro (), o que possibilita a
substituio de por P na expresso do intervalo de confiana. Assim, temos:
P(P - z/2
P(1 P)
< < P + z/2
n
P(1 P)
) = 1.
n
onde:
P o estimador da proporo populacional ;
n o tamanho da amostra e
z/2 o valor da varivel Z que delimita a rea /2 (Tabela I do Apndice).
152
Inferncia Estatstica
P(1 P)
n
0,60(1 0,60)
300
IC( ; 0,99) : 0,60 2,575 0,0283
IC( ; 0,99) : 0,60 2,575
Exerccios propostos:
4.1. Um engenheiro de desenvolvimento de um fabricante de pneus est investigando a vida do
pneu em relao a um novo componente de borracha. Ele fabricou 40 pneus e testou-os at o
fim da vida em um teste na estrada. A mdia e o desvio padro da amostra so 61.492 km e
6.085 km, respectivamente. O engenheiro acredita que a vida mdia desse novo pneu est em
excesso em relao a 60.000 km. Obtenha o intervalo de confiana, ao nvel de 95%, para a
vida mdia do pneu e conclua a respeito da suposio do engenheiro.
4.2. Um agrnomo realizou um levantamento para estudar o desenvolvimento de duas
espcies de rvores, a Bracatinga e a Canafstula. Para esta finalidade foram coletadas duas
amostras de tamanhos igual a 10 rvores. Os resultados para altura, em metros, esto
descritos abaixo para as duas amostras:
Bracatinga 6,5 6,9 6,9 8,6 8,7 8,2 10,0 10,3 13,4 14,4
Canafstula 9,3 10,1 11,4 15,2 17,2 14,8 15,9 20,6 21,9 23,8
Para verificar a hiptese de que as alturas das duas espcies so diferentes, o agrnomo
adotou o seguinte critrio. Construir os intervalos com 95% de confiana, para cada uma das
espcies. Se os intervalos se sobrepem (se interceptam) concluir que no h diferenas
significativas entre as duas alturas medias, caso contrrio, concluir que h diferenas entre as
mesmas. Baseado neste critrio qual a concluso do agrnomo?
153
Inferncia Estatstica
4.3. Na fabricao de semicondutores o ataque qumico por via mida frequentemente usado
para remover silicone da parte posterior das pastilhas antes da metalizao. A taxa de ataque
uma caracterstica importante nesse processo e sabido que ela segue uma distribuio
normal. Duas solues diferentes para ataque qumico so comparadas, usando duas
amostras aleatrias de pastilhas. As taxas observadas de ataque (10-3 polegadas/min) so
dadas a seguir:
Soluo 1
Soluo 2
9,9
10,2
9,4
10,6
9,3
10,7
9,6
10,4
10,2
10,5
10,6
10,0
10,3
10,7
10,0
10,4
10,3
10,3
10,1
-
Os dados justificam a afirmao de que a taxa mdia de ataque seja a mesma para as duas
solues? Considere que ambas as populaes tm varincias iguais, construa o intervalo de
confiana, ao nvel de 95%, para a diferena entre as mdias e conclua.
4.4. Considere os dados do exerccio 4.1. Construa um intervalo de 90% para a varincia da
vida do pneu. Depois converta esse intervalo apresentando-o em termos de desvio padro.
4.5. Uma amostra aleatria de 250 dispositivos eletrnicos apresentou 27 unidades
defeituosas. Estime a frao de no conformes e construa um intervalo de 95% de confiana
para o verdadeiro valor da frao de no conformes.
154
Inferncia Estatstica
HA : 0 ou 0 0 hiptese bilateral
155
Inferncia Estatstica
HA :1 2
156
Inferncia Estatstica
Situao de H0
Verdadeira
Falsa
Acerto
Erro Tipo II
Erro Tipo I
Acerto
Inferncia Estatstica
poder do teste. Podemos dizer, ento, que o poder do teste a probabilidade de declarar
diferenas quando elas, de fato, existem. O poder de um teste est relacionado com os
seguintes fatores: tamanho da amostra, variabilidade da varivel e magnitude da diferena
existente entre as mdias.
importante ressaltar ainda que as duas taxas de erro ( e ) esto relacionadas
negativamente, de modo que a reduo de implica no aumento de e vice-versa. Para que
os testes de hipteses tenham validade, necessrio que sejam delineados de modo a
minimizar os erros de concluso. Entretanto, o nico meio de reduzir ambos os tipos de erro
aumentando o tamanho da amostra, o que nem sempre vivel. Na prtica, devemos definir
qual dos dois erros mais grave e, ento, minimiz-lo. Podemos adiantar, contudo, que, via de
regra, a preocupao est voltada para o erro tipo I, pois na maioria dos casos ele
considerado o mais grave. A probabilidade de ocorrncia do erro tipo I () chamada de nvel
de significncia do teste.
Estatstica do teste
Para testar hipteses a respeito do parmetro , utilizamos a varivel aleatria T,
T=
.
S( )
Vejamos agora como o valor da varivel T obtido nas duas situaes mais comuns
de testes de hipteses a respeito de .
Situao 1. Comparao de uma mdia () com um valor padro (0).
Inicialmente, devemos lembrar que para compararmos uma mdia com um valor
padro utilizando a varivel aleatria T, a seguinte pressuposio deve ser verdadeira:
A varivel em estudo tem distribuio normal, ou seja, X ~ N (, 2).
Neste caso, a hiptese estatstica sob verificao ser:
H0 : = 0 .
tem distribuio t com parmetro ,
S( )
= = 0
= X
S( ) = S(X) =
S
n
=n1
Da resulta que T =
X 0
=
S
S( )
n
Inferncia Estatstica
Da resulta que T =
=
=
~ t ().
S( ) S( ) S( )
X1 X2
S()
1 1
+ S
n1 n2
,
2
onde:
= X1 X2
S2 ( n 1) + S22 ( n2 1)
1 1
S( ) = X1 X2 = + S2 , sendo S2 = 1 1
( n1 1) + ( n2 1)
n1 n2
= ( n1 1) + (n2 1)
Observemos que, tambm nesta situao, a varivel aleatria T passa a ser uma
estatstica.
Critrio de deciso
A regra de deciso a respeito de H0 pode ser estabelecida com base num valor
crtico:
Teste bilateral: se a hiptese alternativa for bilateral, o valor crtico ser:
t/2(): valor da estatstica T, para graus de liberdade, que delimita a rea /2,
encontrado na tabela da distribuio t (limites bilaterais da Tabela II do Apndice).
Teste unilateral: se a hiptese alternativa for unilateral, o valor crtico ser:
t(): valor da estatstica T, para graus de liberdade, que delimita a rea ,
encontrado na tabela da distribuio t (limites unilaterais da Tabela II do Apndice).
Para decidir comparamos o valor da estatstica T =
Inferncia Estatstica
160
Inferncia Estatstica
Outro critrio tem sido frequentemente utilizado para decidir sobre H0 . Essa deciso
tambm pode ser baseada em um valor que expressa a probabilidade de que seja obtido um
valor t mais extremo que o valor observado, dado que H0 verdadeira. Esta probabilidade
conhecida como valor p.
Se o valor p for menor que , rejeitamos a hiptese nula, pois t atpico ou est em
uma regio de baixa probabilidade.
Consideraes finais
Os intervalos de confiana e os testes de hipteses bilaterais so procedimentos
estatsticos equivalentes. Portanto, se forem utilizados para analisar os mesmos dados, ao
mesmo nvel de significncia, devem conduzir aos mesmos resultados.
O intervalo de confiana para uma mdia equivale ao teste de hipteses que compara
uma mdia com um padro. Observe as expresses:
Intervalo de confiana para uma mdia ()
S
.
n
Estatstica T para a comparao de uma mdia () com um valor padro (0)
X 0
T=
.
S
n
IC( ; 1 ) : X t /2
161
Inferncia Estatstica
X1 X2
1 1 2
+ S
n1 n2
Exemplos:
1. Se no teste de hipteses, ao nvel de 1% de significncia, rejeitamos H0 : 0 = 0 ,
significa que a diferena entre a mdia e o valor padro diferente de zero, ou seja, a mdia
diferente do valor padro. Construindo o intervalo de confiana para , ao nvel de 99%,
devemos esperar que o valor padro (0) esteja fora do intervalo. Caso contrrio, os resultados
seriam contraditrios.
2. Se no teste de hipteses, ao nvel de 5% de significncia, no rejeitamos
H0 : 1 2 = 0 significa que a diferena entre as duas mdias deve ser zero, ou seja, as
mdias podem ser consideradas iguais. Construindo o intervalo de confiana, ao nvel de 95%,
para a diferena entre essas mdias (1 2), devemos esperar que o valor zero esteja dentro
do intervalo. Caso contrrio, os resultados seriam contraditrios.
Vejamos a seguir dois exemplos resolvidos:
Exemplo 1. Um botnico recebeu a informao de que o dimetro mdio de flores de uma
determinada planta de 9,6cm. Para testar a veracidade da informao, tomou uma amostra
aleatria de 30 plantas, cujo dimetro mdio de flores observado foi 9,3cm, com desvio padro
de 3,2cm.
a) Verifique, utilizando teste de hipteses ao nvel de 5% de significncia, se a
informao recebida pelo botnico verdadeira.
b) Verifique se a informao verdadeira, utilizando intervalo de confiana ao nvel de
95%.
c) Houve coerncia entre os resultados do teste de hipteses e do intervalo de
confiana?
Resoluo:
a) Teste de hipteses
Varivel em estudo: X = dimetro de flores (cm)
1. Pressuposio: A varivel em estudo tem distribuio normal.
H0 : 0 = 0
2. Hipteses estatsticas:
HA : 0 0
A hiptese de nulidade supe que o dimetro mdio de flores da populao desta
espcie de planta igual ao valor padro 9,6cm.
162
Inferncia Estatstica
3. Estatstica do teste
= 0 = 0
= X
0
S
n
S( ) = S(X) =
=n1
X 0
T=
=
S
S()
n
Assim, temos:
x 0 = 9,3 9,6 = 0,3
s
3,2
=
= 0,5842
n
30
= 30 1 = 29
t/2(29) = 2,045
0,3
t=
= 0,5135
0,5842
4. Deciso e concluso
Como |t = 0,5135| < t/2(29) = 2,045, no temos motivos para rejeitar H0 . Conclumos,
ao nvel de 5% de significncia, que o dimetro mdio de flores desta planta no difere
significativamente do valor padro 0 = 9,6 . Portanto, a informao recebida pelo botnico
verdadeira.
b) Intervalo de confiana
Pressuposio: A varivel em estudo tem distribuio normal.
Estimativas:
x = 9,3
s
3,2
=
= 0,5842
n
30
= 30 1 = 29
t/2(29) = 2,045
Sendo IC(; 1 ) : t /2 S( )
S
IC( ; 1 ) : X t /2
n
temos:
IC (; 0,95): 9,3 2,045 0,5842
Limite inferior = 9,3 1,195 = 8,11
Limite superior = 9,3 + 1,195 = 10,50
P(8,11 < < 10,50) = 0,95
163
Inferncia Estatstica
7
12
9
8
6
9
11
13
13
14
8
9
7
8
13
10
12
7
9
15
H0 :1 2 = 0
2. Hipteses estatsticas:
HA :1 2 0
Inferncia Estatstica
3. Estatstica do teste
= 1 2 = 0
= X X
1
1 1
S( ) = S(X1 X2 ) = + S2
n1 n2
= ( n1 1) + (n2 1)
T=
X1 X2
S()
1 1
+ S
n1 n2
Amostra 1: n1 = 10
x1 = 9,5
Amostra 2: n2 = 10
x 2 = 10,5
s12 = 6,722
s22 = 7,833
x1 x 2 = 9,5 10,5 = 1
s2 =
s12 ( n1 1) + s22 ( n2 1)
( n1 1) + ( n2 1)
6,722 9 + 7,833 9
= 7,278
9+9
1 1 2
1
1
+ 7,278 = 1,206
+ s =
10 10
n1 n2
= 9 + 9 = 18
t/2(18) = 2,101
t=
1
= 0,8292
1,206
4. Deciso e concluso
Como |t = 0,8292| < t/2(18) = 2,101, no temos motivos para rejeitar H0 . Conclumos,
ento, ao nvel de 5% de significncia, que a mdia de erros do grupo que recebeu cido
nuclico de ratos treinados no diferiu significativamente da mdia de erros do grupo que
recebeu cido nuclico de ratos no treinados. Se o treinamento fosse transferido pelo acido
nuclico, a mdia de erros da populao 1 deveria ser menor que a mdia de erros da
populao 2. Portanto, h evidncias de que o treinamento no transferido pelo cido
nuclico.
b) Intervalo de confiana para a diferena entre as mdias
Varivel em estudo: X = nmero de erros ao discriminar luz e escurido
Pressuposies:
A varivel em estudo tem distribuio normal, ou seja, X ~ N (, 2);
2
165
s12 ( n1 1) + s22 ( n2 1)
( n1 1) + ( n2 1)
Inferncia Estatstica
6,722 9 + 7,833 9
= 7,278
9+9
1 1 2
1
1
+ 7,278 = 1,206
+ s =
10 10
n1 n2
= 9 + 9 = 18
t/2(18) = 2,101
1 1
Sendo IC(1 2 ; 1 ) : X1 X2 t /2 + S2 ,
n1 n2
temos:
IC (1 - 2; 0,95): -1 2,101 1,206
IC (1 - 2; 0,95): -1 2,533
Limite inferior = -1 - 2,533 = -3,533
Limite superior = -1 + 2,533 = 1,533
P(-3,533 < 1 - 2 < 1,533) = 0,95
Conclumos que a probabilidade de a verdadeira diferena entre a mdia de erros da
populao que recebeu cido nuclico de ratos treinados e a mdia de erros da populao que
recebeu cido nuclico de ratos no treinados estar entre -3,533 e 1,533 de 0,95.
c) Pelo teste de hipteses, conclumos que a verdadeira diferena entre as mdias
deve ser zero e, pelo intervalo de confiana, conclumos que zero um valor possvel para a
verdadeira diferena entre as mdias, uma vez que se encontra dentro do intervalo. Portanto, o
resultado do teste de hipteses est de acordo com o do intervalo de confiana.
4.5.2. Testes para a varincia populacional
4.5.2.1. Teste para a varincia de uma populao
Para aplicar o teste para a varincia necessrio supor a normalidade da populao
de onde ser extrada a amostra. Se essa suposio violada, o teste deixa de ser exato. Uma
hiptese testada com frequncia que a varincia tenha um valor especificado 20 . Assim, as
hipteses a serem testadas so:
H0 : 2 = 02
HA : 2 20 hiptese bilateral
onde:
Inferncia Estatstica
(bilateral)
Esse teste tem larga aplicao no controle da qualidade, uma vez que o
monitoramento da variabilidade essencial para a garantia de qualidade.
Consideremos o exemplo resolvido.
Uma mquina de empacotar caf est regulada para encher os pacotes com desvio
padro de 10g e mdia de 500g e onde o peso de cada pacote distribui-se normalmente.
Colhida uma amostra de n = 16, observou-se uma varincia de 169g2. possvel afirmar com
este resultado que a mquina est desregulada quanto variabilidade, supondo uma
significncia de 5%?
Resoluo:
167
Inferncia Estatstica
H0 : 2 = 02
Hipteses estatsticas:
2
2
HA : 0
(n 1)s2
2
0
(16 1) 169
= 25,35 .
100
1 e 2.
Hipteses estatsticas
A hiptese que est sob verificao ( H0 ) a hiptese de igualdade entre as varincias
populacionais. O conjunto das hipteses, incluindo todas as possveis hipteses alternativas, :
H0 : 12 = 22 ou 12 /22 = 1
HA : 12 22 ou 12 /22 1 hiptese bilateral
12
S22
~ F(1, 2 ) ,
22
onde:
S12 e S22 : so as varincias das amostras retiradas das populaes 1 e 2,
respectivamente;
12 e 22 : so as varincias das populaes 1 e 2, respectivamente;
168
Inferncia Estatstica
S12
F=
12
S22
22
S12
=
2
S22
S12
.
S22
S12
~ F(1, 2 ) , ou seja,
S22
a estatstica F, obtida atravs da razo de duas varincias amostrais independentes, tem
distribuio F com parmetros 1 e 2, graus de liberdade do numerador e denominador,
respectivamente.
Assim, para que a estatstica F possa ser utilizada na comparao das varincias
populacionais, duas pressuposies devem ser atendidas:
1. A varivel em estudo tem distribuio normal, X ~ N (, 2).
2. As amostras so independentes.
Critrio de deciso
Para efetuar o teste F, convencionamos que a estatstica F obtida fixando a maior
varincia no numerador. Isto garante que o valor da estatstica nunca ser menor que 1 e
possibilita a utilizao das tabelas mais comumente disponveis para consulta. Por conveno,
vamos considerar que S12 S22 .
A regra de deciso a respeito de H0 pode ser estabelecida com base no valor crtico
f/2( 1,2 ) , que, para os graus de liberdade 1 e 2, delimita a rea /2 (Tabela IV do Apndice).
s12
> f/2( 1,2 ) .
s22
s12
< f/2( 1,2 ) .
s22
(unilateral direita)
Para HA : 12 22
(bilateral)
169
Inferncia Estatstica
Neste caso, quando a hiptese alternativa bilateral, dizemos que o teste bilateral
condicionado, porque somente um lado da curva ser considerado. Como a tabela usualmente
utilizada adequada para testes F unilaterais, a rea de rejeio direita do valor crtico ser
representada por /2.
Consideremos dois exemplos resolvidos:
Exemplo 1. Os valores abaixo se referem aos pesos ao nascer (em kg) de bovinos da raa
Ibag, em duas pocas distintas:
Agosto
18 25 16 30 35 23 21 33 32 22
Setembro 27 30 20 30 33 34 17 33 20 23 39 23 28
Efetue o teste de homogeneidade de varincias, ao nvel = 0,05.
Resoluo:
Varivel em estudo: X = peso ao nascer (em kg) de bovinos da raa Ibag
1. Pressuposies
A varivel em estudo tem distribuio normal, X ~ N (, 2).
As amostras retiradas das populaes so independentes.
2
2
H0 : 1 = 2
2. Hipteses estatsticas:
2
2
HA : 1 2
3. Estatstica do teste
F=
S12
S22
1 = n1 1 = 9
Amostra 1 (agosto):
x1 = 25,5
Amostra 2 (setembro): 2 = n2 1 = 12
f=
s12 = 43,83
x 2 = 27,46
s22 = 42,60
s12 43,83
=
= 1,029
s22 42,60
4. Deciso e concluso
Como f = 1,029 < f0,025(9, 12) = 3,44, no temos informaes suficientes para rejeitar
H0 . Assim, conclumos, ao nvel de 5% de significncia, que as varincias de pesos ao nascer
de bovinos da raa Ibag nas diferentes pocas so homogneas.
Exemplo 2. Um experimento foi conduzido para comparar duas cultivares de soja (A e B)
quanto ao rendimento mdio por hectare. Os resultados obtidos foram os seguintes:
Cultivar A: n1 = 8
x1 = 3,8 t.ha-1
s12 = 0,04(t.ha-1 )2
Cultivar B: n2 = 10
x 2 = 4,6 t.ha-1
s22 = 0,36(t.ha-1 )2
Inferncia Estatstica
Resoluo:
Varivel em estudo: X = rendimento de soja (por hectare)
1. Pressuposies
A varivel em estudo tem distribuio normal, X ~ N (, 2).
As amostras retiradas das populaes so independentes.
H0 : 12 = 22
2. Hipteses estatsticas:
2
2
HA : 1 2
3. Estatstica do teste
F=
S12
S22
x1 = 3,8 t.ha-1
s12 = 0,04(t.ha-1 )2
x 2 = 4,6 t.ha-1
s22 = 0,36(t.ha-1 )2
s22 0,36
=
=9.
s12 0,04
4. Deciso e concluso
Como f = 9 > f0,025(9, 7) = 4,82, temos evidncias suficientes para a rejeio de H0 .
Assim, podemos concluir, ao nvel de 5% de significncia, que as varincias de rendimento de
gros (em t/ha) das cultivares A e B no so homogneas.
4.5.3. Testes para a proporo populacional
4.5.3.1. Teste para a proporo de uma populao
O teste para a proporo populacional, em geral, utilizado para verificar se a
proporo de elementos da populao que possuem uma determinada caracterstica igual a
um determinado valor 0. Assim as hipteses estatsticas so:
H0 : = 0 ou 0 = 0
HA : 0 ou 0 0 hiptese bilateral
P
.
(1 )
n
171
Inferncia Estatstica
P 0
0 (1 0 )
n
A deciso sobre H0 baseada nos valores crticos z/2, para o teste bilateral, ou z,
para o teste unilateral, encontrados na tabela da distribuio Z (Tabela I do Apndice).
p 0
0 (1 0 )
n
0,53 0,60
= 4,52 .
0,60(1 0,60)
1000
172
Inferncia Estatstica
(P1 P2 ) (1 2 )
1(1 1 ) 2 (1 2 )
n1
n2
(P1 P2 )
1(1 1 ) 2 (1 2 )
n1
n2
p1 p2
p1(1 p1 ) p2 (1 p2 )
+
n1
n2
A deciso sobre H0 baseada nos valores crticos z/2, para o teste bilateral, ou z,
para o teste unilateral, encontrados na tabela da distribuio normal padro.
Vejamos o exemplo resolvido:
Em uma pesquisa de opinio, 32 entre 80 homens declararam apreciar certa revista,
acontecendo o mesmo com 26 entre 50 mulheres. Ao nvel de 5% de significncia os homens e
as mulheres apreciam igualmente a revista?
Resoluo:
H0 : 1 = 2
Hipteses estatsticas:
HA : 1 2
173
Inferncia Estatstica
p1 p2
p1(1 p1 ) p2 (1 p2 )
+
n1
n2
0,40 0,52
= 1,34
0,40 0,60 0,52 0,48
+
80
50
S( ) = S X1 X2 =
S12 S22
+
n1 n2
(S + S )
=
(S ) + (S )
2
1
2 2
2
2 2
1
2 2
2
n1 1
n2 1
Inferncia Estatstica
Resoluo:
1. Pressuposies:
- A varivel em estudo tem distribuio aproximadamente normal, X ~ N (, 2).
- As amostras retiradas das populaes so independentes.
H0 :1 2 = 0
2. Hipteses estatsticas:
HA :1 2 0
= 1 2 = 0
= X1 X2 = 3,8 4,6 = 0,8
Como verificamos na resoluo do Exemplo 2, a pressuposio de homogeneidade de
varincias no foi atendida, portanto, no podemos combinar as varincias das amostras.
Temos, ento
S2 S2
0,04 0,36
S( ) = S(X1 X2 ) = 1 + 2 =
+
= 0,041 = 0,2025
10
8
n1 n2
T=
0,8
=
= 3,951
S( ) 0,2025
4. Deciso e concluso
Devido heterogeneidade das varincias, o nmero de graus de liberdade deve-se ser
estimado pela frmula de Satterthwaite:
(s + s )
=
(s ) + (s )
2
1
2 2
1
2 2
2
2 2
2
n1 1 n2 1
2
0,04 + 0,36 )
(
=
( 0,04 )2 + ( 0,36 )2
8 1
0,16
= 10,94
0,0002286 + 0,0144
10 1
Inferncia Estatstica
Por exemplo, para testar dois mtodos de ensino A e B, pode-se usar pares de
gmeos, sendo que um recebe o mtodo de ensino A e o outro o mtodo de ensino B. Este
procedimento controla a maioria dos fatores externos que afetam a aprendizagem. Se houver
diferena, ela realmente se deve ao mtodo.
Outra forma fazer as observaes das duas amostras no mesmo indivduo. Por
exemplo, medindo uma caracterstica do indivduo antes e depois dele ser submetido a um
tratamento.
Nesses casos, temos duas amostras, mas as observaes esto emparelhadas, isto ,
a amostra formada pelos pares:
(X1, Y1), (X2, Y2), ..., (Xn, Yn).
Ao usarmos esse procedimento, passamos a ter uma dependncia entre as
observaes de um mesmo par. Por essa razo, no podemos preceder o teste de
comparaes de mdias da mesma forma como realizado no caso de independncia entre as
amostras.
Assim, para verificar se existe diferena entre X e Y , definimos a varivel D= Xi -Yi.
Como resultado, temos a amostra: D1 = X1- Y1, D2 = X2- Y2, ..., Dn = Xn- Yn. Desta forma, reduzse o problema para anlise de uma nica populao.
1
1
Di = (Xi Yi ) = X Y , e
n
n
Di2 nD2
D
1
2
2
assim D ter distribuio N(D , ) . Definindo: SD =
(Di D) = n 1 , tem-se que
n 1
n
a estatstica:
D D
T=
~ t( ) , onde =n-1.
SD
D D
SD
n
D0
SD
n
SD
~ t( ) .
A deciso sobre H0 tomada comparando o valor calculado para t com o valor crtico
da distribuio t (Tabela II do Apndice).
Vejamos um exemplo resolvido:
Cinco operadores de mquinas so treinados em duas mquinas de diferentes
fabricantes, para verificar qual delas apresentava maior facilidade de aprendizagem. Mediu-se
o tempo que cada um dos operadores gastou na realizao de uma mesma tarefa com cada
um dos dois tipos de mquinas. Os resultados esto na tabela a seguir.
176
Inferncia Estatstica
d=5 e s
( di d)
=
n 1
= 28,5 .
Assim, obtemos
t=
sD
n
5
= 2,094 .
5,339
5
Exerccios propostos:
4.6. Cinco medidas do contedo de alcatro em um cigarro X acusaram: 14,5, 14,2, 14,4, 14,8,
e 14,1 miligramas por cigarro. Este conjunto de cinco valores tem mdia 14,4 e desvio padro
0,274. O leitor pretende testar a hiptese nula H0: = 14,1 (conforme declarado no mao) ao
nvel de 0,05 de significncia.
a)
b)
c)
d)
4.7. Suponha que um fabricante sem escrpulos deseje uma prova cientfica de que um
aditivo qumico totalmente incuo melhora o rendimento.
a) Se um grupo de pesquisa analisa esse aditivo com um experimento, qual a
probabilidade de chegar a um resultado significativo com = 0,05 (para promover o
aditivo com afirmaes cientficas) mesmo que o aditivo seja totalmente incuo?
177
Inferncia Estatstica
220
200
210
220
210
Utilize um teste de hiptese, ao nvel =0,01, para verificar se as duas raes diferem entre si.
4.11. Os valores abaixo se referem aos pesos ao nascer (em kg) de bovinos da raa Ibag, em
duas pocas distintas:
Agosto: 18 25 16 30 35 23 21 33 32 22
Setembro: 27 30 20 30 33 34 17 33 20 23 39 23 28
Efetue o teste de homogeneidade de varincias, ao nvel = 0,05.
4.12. Um engenheiro deseja testar a hiptese de que o percentual de peas defeituosas
inferior a 10%. Uma amostra aleatria com 75 peas revelou 6 peas defeituosas. Use = 0,05
e conclua a respeito.
178
Inferncia Estatstica
Por questes histricas o termo utilizado at hoje, mas abriga uma srie de tcnicas
estatsticas.
A expresso regresso linear simples utilizada por duas razes: a regresso linear
porque a relao entre X e Y expressa por uma equao de primeiro grau, representada
graficamente por uma reta, e simples porque envolve apenas duas variveis.
Ajustamento de curvas
Sempre que possvel, procuramos expressar em termos de uma equao matemtica
as relaes entre grandezas conhecidas e grandezas que devem ser determinadas. Isso ocorre
179
Inferncia Estatstica
com frequncia nas cincias naturais, onde, por exemplo, a relao entre o volume (y) e
presso (x) de um gs, a uma temperatura constante, dada pela expresso
k
y= ,
x
sendo k uma constante numrica. Outro exemplo pode ser a relao entre uma cultura de
bactrias (y) e o tempo (x) em que esteve exposta a certas condies ambientais, que dada
por
y = ab x ,
onde a e b so constantes numricas. Mais recentemente, equaes como essas tm sido
usadas para descrever relaes tambm no campo das cincias do comportamento, das
cincias sociais e outros.
Essa representao matemtica dos fenmenos feita ajustando-se uma curva aos
dados observados, de tal forma que, a partir dessa curva ajustada, possamos representar,
grfica ou analiticamente, a relao entre as variveis. Ento, ajustar uma curva determinar
uma funo matemtica que possa representar um conjunto de observaes. Sempre que
utilizamos dados observados para chegar a uma equao matemtica encontramos trs tipos
de problema:
1. Devemos decidir que tipo de curva e, da, que tipo de equao de predio
queremos utilizar.
2. Devemos achar a equao particular que a melhor em determinado sentido.
3. Devemos investigar possveis problemas relativos ao mrito da equao escolhida e
da predio feita a partir dela.
Aqui vamos restringir nosso estudo s equaes lineares com duas incgnitas. Estas
equaes lineares so teis e importantes no s porque muitas relaes tm efetivamente
esta forma, mas tambm porque em geral constituem boas aproximaes de relaes que, de
outro modo, seriam difceis de descrever em termos matemticos.
Modelo estatstico
Sendo x e y duas variveis que se relacionam de forma linear, esta relao expressa
pela seguinte equao:
y = 0 + 1x ,
Na figura a seguir podemos observar a representao grfica desta equao.
180
Inferncia Estatstica
Se Y uma varivel aleatria, ento, est sujeita a um erro de observao. Este erro
(ei) dever ser adicionado ao modelo, desde que se admitam como verdadeiras as seguintes
pressuposies:
1. Os erros so aleatrios, tm mdia zero e varincia constante, ou seja, E(ei) = 0 e
V(ei) = 2.
2. Os erros tm distribuio normal e so independentes entre si.
3. O modelo adequado para todas as observaes, no podendo haver nenhum
valor de X que produza um valor de Y discrepante dos demais.
4. A varivel X fixa (no aleatria).
Assim, o modelo de regresso linear simples ser:
yi = 0 + 1xi + ei
onde:
yi : a varivel resposta (dependente)
xi : a varivel preditora (independente)
0 : o intercepto ou coeficiente linear
A parte fixa do modelo informa como X influencia Y e a parte aleatria mostra que Y
possui uma variabilidade inerente, significando que X no a nica varivel que influencia Y,
embora consideremos que sua influncia seja preponderante. Alis, devemos ressaltar que
este modelo ser adequado quando a parte fixa for preponderante sobre a aleatria.
A ttulo de ilustrao, consideremos o exemplo a seguir.
Exemplo 1. Um experimento foi conduzido para estudar o efeito da dose de Nitrognio
aplicada no solo sobre a produo de uma espcie de forrageira. Para as cinco doses
utilizadas, foram observados os seguintes resultados:
Parcela
1
2
3
4
5
Dose de Nitrognio
(kg/ha)
0
50
100
150
200
Produo de
forragem (kg/ha)
2.160
2.880
3.360
3.720
4.020
Inferncia Estatstica
Podemos observar uma tendncia linear dos dados, o que nos permite supor que a relao
entre dose de Nitrognio e produo de forragem seja linear.
onde:
yi a produo de forragem (varivel resposta), em kg;
xi a dose de Nitrognio (varivel preditora), em kg;
0 a produo de forragem quando a dose de Nitrognio aplicada for nula
(intercepto), em kg;
1 a quantidade que varia na produo de forragem para cada unidade (kg) aplicada
de Nitrognio (coeficiente de regresso), em kg/kg.
ei o erro (variao aleatria no controlvel)
4.7.2. Anlise de regresso
A anlise de regresso tem por objetivo determinar a equao que melhor representa
a relao existente entre duas variveis e, a partir desta equao, fazer predies para a
varivel resposta. Para isso, necessrio que uma sequncia de passos seja seguida:
1. Obteno das estimativas (por ponto) dos coeficientes 0 e 1 para ajustar a
equao da regresso.
2. Aplicao dos testes de significncia para as estimativas obtidas, a fim de verificar
se a equao de regresso adequada.
3. Clculo dos intervalos de confiana para os valores estimados pela equao de
regresso.
4.7.2.1. Estimao dos parmetros do modelo
Quando temos n observaes, temos n pares de valores, (x1, y1); (x2, y2); ... ; (xn, yn),
onde os valores observados para a varivel resposta (yi) so representados pela equao da
regresso:
182
Inferncia Estatstica
y1 = 0 + 1x1 + e1
yi = 0 + 1x i + ei y 2 = 0 + 1x 2 + e2
i = 1,2,,n
y n = 0 + 1x n + en
ei2 = [ yi E(yi )]
= [ yi (0 + 1xi )] .
2
(yi 0 1xi ) = 0
e
183
Inferncia Estatstica
(yi xi 0 xi 1xi2 ) = 0 .
(y i 0 1x i ) = 0
2
(y i x i 0 xi 1x i ) = 0
Aplicando as propriedades da soma, temos
y i n 0 1 x i = 0
2
y i x i 0 x i 1 x i ) = 0
e arrumando a expresso para que os termos fiquem positivos, temos
n 0 + 1 x i = y i
2
0 x i + 1 x i = y i x i
A resoluo do sistema pode ser feita por substituio. Comeamos por isolar o 0 na
primeira equao:
n 0 + 1 xi = yi
n 0 1 xi yi
+
=
n
n
n
n 0 xi yi
+ 1
=
n
n
n
0 + 1x = y
= y x
0
0 xi + 1 xi2 = yi xi
(y 1x) xi + 1 xi2 = yi xi
xi y xi 1x + 1 xi2 = yi xi
xi y 1x xi + 1 xi2 = yi xi
xi y + 1 xi2 1x xi = yi xi
1 ( xi2 x xi ) = yi xi xi y
yi y x xi yi
y
x
i
i
i
i i
yx xy
n =
n
1 = i2 i i =
.
2
x
x
x
x
i
2
i i xi
x
(
)
i
xi xi2
n
n
184
Inferncia Estatstica
e
Os estimadores 0 e 1 so os pontos crticos das razes das equaes i = 0 e
0
2
ei2
= 0 , podendo ser pontos de mnimo ou de mximo. Entretanto, demonstra-se que os
1
pontos crticos de qualquer funo que seja uma soma de quadrados sero sempre pontos de
mnimo. Da podemos concluir que de 0 e 1 so pontos de mnimo, ou seja, a soma de
quadrados dos erros mnima.
i = 0 + 1xi
A partir da podemos obter tambm as estimativas dos erros. Sendo ei = yi E(yi /x i ) ,
as estimativas dos erros so obtidas por
e i = yi i .
i
1
2
3
4
5
Mdia
Dose de
Nitrognio
( xi )
0
50
100
150
200
500
100
Produo de
forragem ( yi )
2.160
2.880
3.360
3.720
4.020
16.140
3.228
xi2
0
2.500
10.000
22.500
40.000
75.000
-
xi y i
0
144.000
336.000
558.000
804.000
1.842.000
-
185
Inferncia Estatstica
yi xi ni
=
1
2
xi )
(
2
xi n
x
yi
500 16140
228000
5
=
= 9,12
2
25000
500
75000
5
1842000
=
186
Inferncia Estatstica
HA : 1 0
187
Inferncia Estatstica
Esses desvios podem ser observados na figura abaixo, onde temos o grfico de
disperso dos pontos e a reta ajustada para os dados do experimento com Nitrognio
(Exemplo 1).
188
Inferncia Estatstica
Reg
QErro
Erro
2
2
HA : Reg >
HA : 1 0
Para testar H0, utilizamos a estatstica F, que definida como a razo entre duas
varincias e tem distribuio F, com parmetros 1 e 2:
F=
VReg
VErro
Se esta razo for significativamente maior do que 1 (um), conclumos que a variao
da regresso significativamente maior que a variao do erro e que, portanto, esta diferena
se deve ao efeito linear de X sobre Y. Vale lembrar que o modelo s adequado para explicar
o relacionamento entre as duas variveis quando a parte fixa do modelo (Regresso)
preponderante sobre a parte aleatria (Erro).
Em geral, a anlise da variao apresentada na forma de tabela, conforme o
esquema abaixo.
Tabela da anlise da variao:
Fonte de variao
Regresso
Erro
Total
( i y)2
p1
np
n1
E(V)
ei2
2 + Reg
= (yi i )
F
VReg
VErro
(yi y)
189
Inferncia Estatstica
yi2
( yi )2
n
(por diferena).
VReg
VErro
> f( 1,2 ) .
VReg
VErro
< f( 1,2 ) .
yi2
( yi )2
n
= 54248400
260499600
= 2148480
5
Regresso
2.079.360
2.079.360
Erro
69.120
23.040
Total
2.148.480
F
90,25
Como o valor calculado f = 90,25 foi maior que o valor crtico f0,01(1,3) = 34,12 ,
conclumos, ao nvel = 0,01, que o efeito linear da dose de Nitrognio sobre a produo desta
forrageira significativo, sendo que essa relao pode ser expressa pela equao
i = 2316 + 9,12xi . Isto significa que para cada kg/ha de Nitrognio aplicado no solo a
produo de forragem aumenta, em mdia, 9,12 kg/ha.
190
Inferncia Estatstica
Teste t
Outro procedimento que pode ser utilizado para testar H0 : 1 = 0 o teste t. Como j
visto em sees anteriores, utilizamos a estatstica T que tem distribuio t de Student quando
H0 verdadeira. Nesse caso, temos = 1 = 0 , resultando:
T=
=
=
~ t( ) ,
S( ) S( ) S( )
onde:
= 1 ;
S( ) = S( 1 ) ;
= n 2;
(x x)2
i
1
V yi (xi x)
2
(x x)
i
1
V( 1 ) =
( x x)2 V(yi )
2 i
(xi x)2
V(yi )
V( 1 ) =
(xi x)2
V( 1 ) =
V( 1 ) =
(xi x)2
(yi i )2 = e i2
n2
n2
S2 ( 1 ) =
S
=
(xi x)2
e i2
n2 .
(x
i x)2
Da resulta que
e i2
S( 1 ) = S2 ( 1 ) =
n2
.
(xi x)2
191
T=
1
=
S( 1 )
Inferncia Estatstica
~ t( )
e i2
n2
(xi x)2
No exemplo, temos
t=
1
9,12
9,12
=
=
= 9,5
23040 0,96
s( 1 )
25000
Como o valor calculado t = 9,5 foi maior que o valor crtico valor t/2(3) = 5,841,
conclumos, ao nvel = 0,01, que o efeito linear da dose de Nitrognio sobre a produo desta
forrageira significativo. Podemos verificar tambm a correspondncia entre os valores das
estatsticas F e T. O valor da estatstica F deve ser igual ao quadrado do valor da estatstica T
(f = t 2 ) . Para esse exemplo temos f = 90,25 = 9,52 = t 2 .
Vimos em sees anteriores que o teste t bilateral e o intervalo de confiana, para um
mesmo nvel , so procedimentos estatsticos equivalentes de modo que conduzem aos
mesmos resultados. Sendo assim, o intervalo de confiana tambm pode ser utilizado para
verificar se 1 difere significativamente de zero ou no. Utilizando as mesmas expresses
acima deduzidas, podemos obter o intervalo de confiana para o 1 . Partindo da expresso
geral para intervalos de confiana
IC(; 1 ) : t /2 S( ) ,
e i2
IC(1 ; 1 ) : 1 t /2
n2
(x
i x)2
No exemplo, temos
e i2
IC(1 ; 1 ) : 1 t /2
n2
(xi x)2
23040
25000
Inferncia Estatstica
~ t( )
S( )
= 0 ;
= ;
0
1
S( ) = S( 0 ) = +
n
1
ei2
x2
2
S = +
;
2
2
n ( xi x ) n 2
( xi x )
x2
= n 2.
onde:
= i
=
S( ) = S( i )
= n 2.
i = 0 + 1xi ,
Sendo 0 = y 1x , temos
i = y 1x + 1xi
i = y + 1(xi x).
Para este modelo temos
V( i ) = V y + 1(xi x)
V( i ) = V(y) + V 1(xi x)
yi (xi x) , V(y) =
Sendo 1 =
2
(xi x)
ei2
, temos
=
n2
193
V( i ) =
V( i ) =
Inferncia Estatstica
yi (xi x)
+ (xi x)2 V
(x x)2
n
i
2
2
n
+ (xi x)2
(xi x)2
1
(xi x)2 2
V( i ) = +
n (x x)2
i
2
2
1
(xi x) ei
V( i ) = +
n (x x)2 n 2
i
.
n (x x)2
n (x x)2 n 2
i
i
Da resulta que
2
1
(xi x)2 e i
S( i ) = S ( i ) = +
.
n (x x)2 n 2
i
2
1
(xi x)2 e i
+
.
n (x x)2 n 2
i
xi
yi
(xi x)2
ei2
s( i )
24.336 117,58
11.664 83,14
17.424 67,88
1.296
83,14
14.400 117,58
69.120
-
t /2 s( i )
Limite
inferior
Limite
superior
374,26
264,63
216,06
264,63
374,26
-
1.941,76
2.507,37
3.011,93
3.419,37
3.765,76
-
2.690,24
3.036,63
3.444,07
3.948,63
4.514,24
-
Inferncia Estatstica
195
Inferncia Estatstica
( Xi Ei )2
i=1
Ei
Q =
~ 2 (),
onde:
Xi: a frequncia observada da classe i;
Ei: a frequncia esperada da classe i;
k: nmero total de classes da varivel;
= k 1 : o nmero de graus de liberdade ou classes independentes.
O teste qui-quadrado est sujeito a algumas restries que devem ser observadas
sempre que ele for utilizado.
1. O teste vlido apenas para frequncias absolutas. Percentagens e propores devem
ser transformadas em frequncias absolutas antes da realizao do teste.
2. A distribuio qui-quadrado uma distribuio derivada da distribuio normal, sendo,
portanto, uma distribuio contnua. Como os dados analisados atravs de procedimentos quiquadrado so provenientes de processos de contagem, algumas consideraes devero ser
feitas para garantir uma boa aproximao.
196
Inferncia Estatstica
Q=
i=1
Xi Ei 0,5 )
Ei
A1
A2
...
Ak
Frequncia observada
X1
X2
...
Xk
Frequncia esperada
E1
E2
...
Ek
onde:
A a varivel categrica;
Ai so as classes (categorias) da varivel;
k o nmero total de classes da varivel;
Xi so as frequncias observadas nas classes da varivel;
Ei so as frequncias esperadas para as classes da varivel segundo uma
determinada teoria.
Neste caso, a hiptese de nulidade a ser testada a hiptese de aderncia ou
concordncia que supe que os dados observados se ajustam a teoria dada pelas frequncias
esperadas. A hiptese alternativa, naturalmente, deve supor o contrrio. Assim temos
H0: as frequncias observadas concordam com as frequncias esperadas
HA: as frequncias observadas no concordam com as frequncias esperadas
4.8.4. Classificao dupla
Em muitos casos, o objetivo no apenas verificar se as frequncias observadas
concordam com as esperadas, mas sim verificar se duas variveis qualitativas (A e B) inerentes
de um mesmo indivduo so ou no independentes entre si.
Neste caso, os indivduos so classificados segundo essas duas variveis e dispostos
em uma tabela de dupla entrada denominada tabela de contingncia. A mais simples dessas
tabelas a 2 2, na qual cada varivel tem apenas duas alternativas (classes). Entretanto,
numa tabela r s (linha por coluna) pode haver mais de duas alternativas para um ou ambas
as variveis.
197
Inferncia Estatstica
B
A
A1
A2
Ar
Totais
B1
X11 (E11)
X21 (E21)
Xr1 (Er1)
X+1
B2
X12 (E12)
X22 (E22)
Xr2 (Er2)
X+2
Bs
X1s (E1s)
X2s (E1s)
Xrs (Ers)
X+s
Totais
X1+
X2+
Xr+
X++
(Xij Eij )2
~ 2 (),
Eij
onde:
Xij: frequncia observada da linha i e coluna j, sendo i = 1, 2,..., r e j = 1, 2,..., s;
Eij: frequncia esperada da linha i e coluna j;
r: nmero total de linhas (classes da varivel A);
s: nmero total de colunas (classes da varivel B);
= (r 1).(s 1) : nmero de graus de liberdade ou classes independentes.
As frequncias esperadas (Eij) so obtidas atravs da seguinte expresso
Eij = Xi+
X+j
X++
Xi+ X+j
X++
onde:
Xi+ : somatrio da linha i
X+j : somatrio da coluna j
X++ : somatrio de todas as linhas e todas as colunas
ou seja,
k
( x i ei ) 2
i=1
ei
> q( ) .
k
( x i ei ) 2
i=1
ei
< q( ) .
Inferncia Estatstica
Ei
9
176
= 99
16
3
176
= 33
16
3
176
= 33
16
1
176
= 11
16
176
Grau de liberdade: = k - 1 = 4 - 1 = 3
199
Inferncia Estatstica
q=
( x i - ei )
ei
i=1
(103 - 99 )
99
( 37 - 33 )
33
( 28 - 33 )
33
( 8 -11)
11
3. Deciso e concluso
Como q = 2,222 < q( ) = 7,81, no temos motivos para rejeitar H0. Assim, conclumos,
ao nvel de 5% de significncia, que as frequncias observadas no diferem significativamente
das frequncias esperadas segundo as leis de Mendel.
Xi
35
46
81
Grau de liberdade: = k 1 = 2 1 = 1
Taxa de erro: = 0,01
q=
i=1
( xi ei
0,5 )
ei
( 35 40,5 0,5 )
=
40,5
( 46 40,5 0,5 )
+
40,5
3. Deciso e concluso
Como q = 1,494 < q( ) = 6,63, no temos motivos para rejeitar H0. Conclumos, ento,
ao nvel de 1% de significncia, que as frequncias observadas no diferem significativamente
das frequncias esperadas. Portanto, as duas opes tm a mesma frequncia.
200
Inferncia Estatstica
Exemplo 3. Trezentos proprietrios de uma certa marca de carro foram entrevistados sobre o
desempenho e o consumo de combustvel de seus carros. Os resultados obtidos na pesquisa
de opinio foram os seguintes:
Desempenho
Consumo
Totais
Regular
Bom
Alto
Baixo
152
88
48
12
200
100
Totais
240
60
300
60
= 40
300
60
= 100
= 20
300
E12 = 200
E22
Desempenho
Consumo
Regular
Alto
Totais
Bom
152 (160)
48 (40)
200
Baixo
88 (80)
12 (20)
100
Totais
240
60
300
Grau de liberdade:
= (r1).(s1) = (2 1) . (2 1) = 1
(x
ij
eij 0,5
ei
160
40
80
20
3. Deciso e concluso
Como q = 5,274 > q( ) = 3,84, temos motivos suficientes para rejeitar H0. Conclumos,
ento, ao nvel de 5% de significncia, que as frequncias observadas diferem
significativamente das frequncias esperadas. Portanto, o consumo de combustvel depende
do desempenho do carro.
201
Inferncia Estatstica
Tratamento
A
B
C
D
Totais
Totais
105
74
49
32
260
208
= 84
260
E12 = 105
E21 = 74
208
= 59,2
260
E31 = 49
52
52
= 21 E22 = 74
= 14,8
260
260
208
= 39,2
260
E41 = 32
208
= 25,6
260
52
= 9,8
260
E42 = 32
52
= 6,4
260
E32 = 49
Evoluo da doena
Regrediu
No regrediu
92 (84)
13 (21)
62 (59,2)
12 (14,8)
35 (39,2)
14 (9,8)
19 (25,6)
13 (6,4)
208
52
Tratamento
A
B
C
D
Totais
Totais
105
74
49
32
260
= (r1).(s1) = (4 1) . (2 1) = 3
Grau de liberdade:
= 0,05
Taxa de erro:
q=
i, j
(x
ij
eij
ei
) = ( 92 84 ) + (13 21)
2
84
21
+ +
(13 6,4 )2
6,4
3. Deciso e concluso
Como q = 15,23 > q( ) = 7,81, temos motivos suficientes para rejeitar H0. Assim,
conclumos, ao nvel de 5% de significncia, que as frequncias observadas diferem
significativamente das frequncias esperadas. Portanto, a evoluo da doena depende do
tratamento utilizado.
202
Inferncia Estatstica
4.9. Bibliografia
COSTA, S.F. Introduo Ilustrada Estatstica (com muito humor!). 2.ed., So Paulo:
Harbra, 1992. 303p.
DEVORE, J. Probability and statistics for engineering and the sciences. Brooks/Cole
Publishing Companig. 1982. 640p.
FARIA, E.S. de Estatstica Edio 97/1. (Apostila)
FERREIRA, D.F. Estatstica Bsica. Lavras: Editora UFLA, 2005, 664p.
FREUND, J.E., SIMON, G.A. Estatstica Aplicada.
Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p.
Economia,
Administrao
203
Apndice
206
3. Notao fatorial..........................................................................................................
209
213
219
Inferncia Estatstica
1. Notao somatrio
Consideremos a seguinte tabela de valores:
i
xi
yi
-2
4
5
-1
4
1
0
onde:
i o nmero da observao, tal que i = 1, 2, ..., n
n o nmero total de observaes
xi o valor da varivel X para a observao i, tal que x1 = 1, x2 = 0,...,x5 = 4
yi o valor da varivel Y para a observao i, tal que y1 = 2, y2 = 1,...,y5 = 0
x(i) o valor da varivel X para a observao i, tal que x(1) x(2) ... x(n)
x(1) o menor valor da varivel X
x(n) o maior valor da varivel X
Somatrio ()
A notao indica a soma seqencial de um conjunto de valores. De modo geral,
temos
Limite superior da soma
n
Somatrio
i=1
Nmero da observao
Limite inferior da soma
A notao
, onde
i=1
=
i=1
Exemplos:
5
1. x1 + x 2 + x 3 + x 4 + x 5 =
i =1
2. y 2 + y 3 + y 4 =
i=2
1. x12 + x 22 + x 23 + x 24 + x 52 =
2
i
(soma de quadrados)
i=1
2.
( x1 + x2 + x3 + x 4 + x5 )
xi
i =1
(quadrado da soma)
5
3. x1y1 + x 2 y 2 + x 3 y 3 + x 4 y 4 + x 5 y 5 =
x y
i i
(soma de produtos)
i =1
4.
( x1 + x2 + x3 + x 4 + x5 ) ( y1 + y 2 + y3 + y 4 + y5 ) =
y
xi
i=1
(produto da soma)
i=1
205
Inferncia Estatstica
Propriedades da soma
1a propriedade: A soma distributiva, ou seja, se cada termo da soma multiplicado
por uma constante c, os termos podem ser somados e a soma multiplicada pela constante.
n
c xi = c x1 + c x 2 + + c xn = c ( x1 + x 2 + + xn ) = c
i=1
i =1
c = c + c + + c = c (1+ 1+ +1) = nc
i=1
i =1
i =1
i =1
( xi + y i ) = x i + y i
( x1 + y1 ) + ( x 2 + y 2 ) + + ( xn + yn ) = ( x1 + x 2 + + xn ) + ( y1 + y 2 + + yn )
As propriedades devem ser usadas no sentido de simplificar as operaes. Sempre
que houver uma operao que precede a soma, devemos desenvolv-la antes de aplicar as
propriedades.
n
i=1
i=1
2
( xi c ) = ( xi2 2cxi + c 2 )
n
xi2
i=1
2cx + c
i =1
i =1
xi2 2c
i=1
xi +
i=1
i=1
2
i
i=1
2c
x + nc
i=1
Mtodo da propriedade: indicando uma propriedade que seja vlida para todos os
elementos do conjunto e s para eles.
Exemplo: A = {x; x uma vogal}
Inferncia Estatstica
207
Inferncia Estatstica
2. Interseco ()
A interseco de dois conjuntos A e B, representada por A B, o conjunto de todos
os elementos que pertencem a e a B.
4. Complemento absoluto
O complemento absoluto ou simplesmente complemento de A, denotado por A , o
conjunto de todos os elementos que no pertencem a A.
Inferncia Estatstica
A=A
AA=A
AB=BA
(A B) C = A (B C)
A (B C) = (A B) (A C)
A=
AA=A
AB=BA
(A B) C = A (B C)
A (B C) = (A B) (A C)
3. Notao fatorial
O produto dos inteiros positivos de 1 a n representado pelo smbolo especial n! (lse n fatorial). Assim, temos
n! = 1 2 3 (n 2) (n 1) n
4. Anlise combinatria
Algumas tcnicas de contagem foram desenvolvidas para determinar, sem
enumerao direta, o nmero de elementos de certo conjunto, ou o nmero de resultados
possveis de um certo experimento. Essas tcnicas so chamadas de anlise combinatria.
Seja um conjunto A com n elementos distintos entre si. Se x elementos so retirados
de A possvel formar grupos de trs tipos:
Permutaes: Grupos que se distinguem apenas pela ordem dos seus elementos. Se
x = n, ento, o nmero de possveis permutaes de n dado por
Pn = n! grupos
Arranjos: Grupos que se distinguem pela ordem e pela natureza dos seus elementos.
Se x < n, ento, o nmero de possveis arranjos de n, tomados x a x, dado por
A nx =
n!
grupos
(n x)!
209
Inferncia Estatstica
Combinaes: Grupos que se distinguem apenas pela natureza dos seus elementos.
Se x < n, ento, o nmero de possveis combinaes de n, tomados x a x, dado por
Cnx =
n!
grupos
x !(n x)!
Exemplo:
Seja A = {a, b, c, d}, onde n = 4.
1. Se so retirados quatro elementos, quantos grupos possvel formar?
Se x = n, ento, os grupos formados sero permutaes:
P4 = 4! = 24 grupos
{(a, b, c, d), (a, b, d, c), (a, c, b, d), (a, c, d, b), (a, d, b, c), (a, d, c, b), (b, a, c, d), (b, a,
d, c), (b, c, a, d), (b, c, d, a), (b, d, a, c) (b, d, c, a), (c, a, b, d), (c, a, d, b), (c, b, a, d), (c, b, d, a),
(c, d, a, b), (c, d, b, a), (d, a, b, c), (d, a, c, b), (d, b, a, c), (d, b, c, a), (d, b, a, c)}
2. Se so retirados dois elementos, quantos grupos que diferem pela ordem e pela
natureza possvel formar?
Se os grupos formados devem diferir pela ordem e pela natureza, ento sero
arranjos:
4!
24
A 24 =
=
= 12 grupos
(4 2)! 2
{(a, b), (b, a), (a, c), (c, a), (a, d), (d, a), (b, c), (c, b), (b, d), (d, b), (c, d), (d, c)}
3. Se so retirados dois elementos, quantos grupos que diferem apenas pela natureza
possvel formar?
Se os grupos formados devem diferir apenas pela natureza, ento sero combinaes:
C24 =
4!
24
=
= 6 grupos
2!(4 - 2)! 4
{(a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}
Permutaes com repetio: Grupos com elementos repetidos que se distinguem
apenas pela ordem dos seus elementos. Neste caso, n passa a ser o nmero de elementos
retirados e x o nmero de repeties de um dado elemento. O nmero de possveis
permutaes de n, com x repeties um dado elemento, dado por
Pnx,n x =
n!
grupos
x !(n x)!
Exemplo:
Seja um conjunto A formado por trs moedas de ouro e quatro de prata.
A = {o, o, o, p, p, p, p}
210
Inferncia Estatstica
4!
24
=
=6
2!(4 2)! 4
{(p, p, o, o), (p, o, p, o), (p, o, o, p), (o, o, p, p), (o, p, o, p), (o, p, p, o)}
2. Se quatro moedas so retiradas, de quantas maneiras diferentes podemos retirar
Trs moedas de prata?
Se n = 4 e x =3, ento,
P43,4-3 =
4!
24
=
=4
3!(4 3)! 6
211
Inferncia Estatstica
5. Tabelas estatsticas
0,0
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0,1
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0754
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,3
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,4
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,5
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2133
0,2157
0,2190
0,2224
0,6
0,2258
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2518
0,2549
0,7
0,2580
0,2612
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,8
0,2881
0,2910
0,2939
0,2967
0,2996
0,3023
0,3051
0,3078
0,3106
0,3133
0,9
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
1,0
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
1,2
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,3
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,4
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,5
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
1,7
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,8
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,9
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
2,0
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
2,2
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,3
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,4
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,5
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
2,7
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,8
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,9
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
3,0
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3,1
0,4990
0,4991
0,4991
0,4991
0,4992
0,4992
0,4992
0,4992
0,4993
0,4993
3,2
0,4993
0,4993
0,4994
0,4994
0,4994
0,4994
0,4994
0,4995
0,4995
0,4995
3,3
0,4995
0,4995
0,4995
0,4996
0,4996
0,4996
0,4996
0,4996
0,4996
0,4997
3,4
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4997
0,4998
3,5
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
0,4998
3,6
0,4998
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,7
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,8
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
3,9
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
0,5000
212
Inferncia Estatstica
Graus de
Liberdade ()
Nvel de Significncia ()
0,50
0,20
0,10
0,05
0,025
0,02
0,01
0,005
1
2
3
4
5
1,000
0,816
0,715
0,741
0,727
3,078
1,886
1,638
1,533
1,476
6,314
2,920
2,353
2,132
2,015
12,706
4,303
3,183
2,776
2,571
25,542
6,205
4,177
3,495
3,163
31,821
6,965
4,541
3,747
3,365
63,657
9,925
5,841
4,604
4,032
127,320
14,089
7,453
5,598
4,773
6
7
8
9
10
0,718
0,711
0,706
0,703
0,700
1,440
1,415
1,397
1,383
1,372
1,943
1,895
1,860
1,833
1,813
2,447
2,365
2,306
2,262
2,228
2,969
2,841
2,752
2,685
2,634
3,143
2,998
2,896
2,821
2,764
3,707
3,500
3,355
3,250
3,169
4,317
4,029
3,833
3,690
3,581
11
12
13
14
15
0,697
0,695
0,694
0,692
0,691
1,363
1,356
1,350
1,345
1,341
1,796
1,782
1,771
1,761
1,753
2,201
2,179
2,160
2,145
2,132
2,503
2,560
2,533
2,510
2,490
2,718
2,681
2,650
2,624
2,602
3,106
3,055
3,012
2,977
2,947
3,497
3,428
3,373
3,326
3,286
16
17
18
19
20
0,690
0,689
0,688
0,688
0,687
1,337
1,333
1,330
1,328
1,325
1,746
1,740
1,734
1,729
1,725
2,120
2,110
2,101
2,093
2,086
2,473
2,458
2,445
2,433
2,423
2,583
2,567
2,552
2,539
2,528
2,921
2,898
2,878
2,861
2,845
3,252
3,223
3,197
3,174
3,153
21
22
23
24
25
0,686
0,686
0,685
0,685
0,684
1,323
1,321
1,319
1,318
1,316
1,721
1,717
1,714
1,711
1,708
2,080
2,074
2,069
2,064
2,060
2,414
2,406
2,398
2,391
2,385
2,518
2,508
2,500
2,492
2,485
2,831
2,819
2,807
2,797
2,787
3,135
3,119
3,104
3,091
3,078
26
27
28
29
30
0,684
0,684
0,683
0,683
0,683
1,315
1,314
1,313
1,311
1,310
1,706
1,703
1,701
1,699
1,697
2,056
2,052
2,048
2,045
2,042
2,379
2,373
2,369
2,364
2,360
2,479
2,473
2,467
2,462
2,457
2,779
2,771
2,763
2,756
2,750
3,067
3,057
3,047
3,038
3,030
40
60
120
...
0,681
0,679
0,677
0,674
1,303
1,296
1,289
1,282
1,684
1,671
1,658
1,645
2,021
2,000
1,980
1,960
2,329
2,299
2,270
2,241
2,423
2,390
2,358
2,326
2,705
2,660
2,617
2,576
2,971
2,915
2,860
2,807
0,25
0,10
0,05
0,025
0,0125
0,01
0,005
0,0025
Graus de
Liberdade ()
Nvel de Significncia ()
Limites unilaterais: P( t > t)
213
Inferncia Estatstica
Graus de
Liberdade
( )
Nvel de significncia ()
Esquerda (q)
0,025
0,05
0,00
0,00
0,05
0,10
0,22
0,35
0,48
0,71
0,83
1,15
0,1
0,02
0,21
0,58
1,06
1,61
0,1
2,71
4,61
6,25
7,78
9,24
0,05
3,84
5,99
7,81
9,49
11,07
Direita (q)
0,025
5,02
7,38
9,35
11,14
12,83
0,01
6,63
9,21
11,34
13,28
15,09
0,005
7,88
10,60
12,84
14,86
16,75
1,64
2,17
2,73
3,33
3,94
2,20
2,83
3,49
4,17
4,87
10,64
12,02
13,36
14,68
15,99
12,59
14,07
15,51
16,92
18,31
14,45
16,01
17,53
19,02
20,48
16,81
18,48
20,09
21,67
23,21
18,55
20,28
21,95
23,59
25,19
3,82
4,40
5,01
5,63
6,26
4,57
5,23
5,89
6,57
7,26
5,58
6,30
7,04
7,79
8,55
17,28
18,55
19,81
21,06
22,31
19,68
21,03
22,36
23,68
25,00
21,92
23,34
24,74
26,12
27,49
24,72
26,22
27,69
29,14
30,58
26,76
28,30
29,82
31,32
32,80
5,81
6,41
7,01
7,63
8,26
6,91
7,56
8,23
8,91
9,59
7,96
8,67
9,39
10,12
10,85
9,31
10,09
10,86
11,65
12,44
23,54
24,77
25,99
27,20
28,41
26,30
27,59
28,87
30,14
31,41
28,85
30,19
31,53
32,85
34,17
32,00
33,41
34,81
36,19
37,57
34,27
35,72
37,16
38,58
40,00
8,03
8,64
9,26
9,89
10,52
8,90
9,54
10,20
10,86
11,52
10,28
10,98
11,69
12,40
13,12
11,59
12,34
13,09
13,85
14,61
13,24
14,04
14,85
15,66
16,47
29,62
30,81
32,01
33,20
34,38
32,67
33,92
35,17
36,42
37,65
35,48
36,78
38,08
39,36
40,65
38,93
40,29
41,64
42,98
44,31
41,40
42,80
44,18
45,56
46,93
26
27
28
29
30
11,16
11,81
12,46
13,12
13,79
12,20
12,88
13,56
14,26
14,95
13,84
14,57
15,31
16,05
16,79
15,38
16,15
16,93
17,71
18,49
17,29
18,11
18,94
19,77
20,60
35,56
36,74
37,92
39,09
40,26
38,89
40,11
41,34
42,56
43,77
41,92
43,19
44,46
45,72
46,98
45,64
46,96
48,28
49,59
50,89
48,29
49,64
50,99
52,34
53,67
40
50
60
70
80
90
100
20,71
27,99
35,53
43,28
51,17
59,20
67,33
22,16
29,71
37,48
45,44
53,54
61,75
70,06
24,43
32,36
40,48
48,76
57,15
65,65
74,22
26,51
34,76
43,19
51,74
60,39
69,13
77,93
29,05
37,69
46,46
55,33
64,28
73,29
82,36
51,81
63,17
74,40
85,53
96,58
107,57
118,50
55,76
67,50
79,08
90,53
101,88
113,15
124,34
59,34
71,42
83,30
95,02
106,63
118,14
129,56
63,69
76,15
88,38
100,43
112,33
124,12
135,81
66,77
79,49
91,95
104,21
116,32
128,30
140,17
1
2
3
4
5
0,005
0,00
0,01
0,07
0,21
0,41
0,01
0,00
0,02
0,11
0,30
0,55
6
7
8
9
10
0,68
0,99
1,34
1,73
2,16
0,87
1,24
1,65
2,09
2,56
1,24
1,69
2,18
2,70
3,25
11
12
13
14
15
2,60
3,07
3,57
4,07
4,60
3,05
3,57
4,11
4,66
5,23
16
17
18
19
20
5,14
5,70
6,26
6,84
7,43
21
22
23
24
25
Nota: Se o teste for bilateral, o valor de deve ser dividido por dois.
214
Inferncia Estatstica
1
2
1
10
11
12
15
20
24
30
40
60
120
Inf.
0,05
0,025
0,01
0,001
161,4
647,8
4052,
4053*
199,5
799,5
5000,
5000*
215,7
864,2
5403,
5404*
224,6
899,6
5625,
5625*
230,2
921,8
5764,
5764*
234,0
937,1
5859,
5859*
236,8
948,2
5928,
5929*
238,9
956,7
5982,
5981*
240,5
963,3
6022,
6023*
241,9
968,6
6056,
6056*
243,0
976,7
6082,
6084*
243,9
984,9
6106,
6107*
245,9
984,9
6157,
6158*
248,0
993,1
6209,
6209*
249,1
997,2
6235,
6235*
250,1
1001,
6261,
6261*
251,1
1006,
6287,
6287*
252,2
1010,
6313,
6313*
253,3
1014,
6339,
6340*
254,3
1018,
6366,
6366*
0,05
0,025
0,01
0,001
18,51
38,51
98,50
998,5
19,00
39,00
99,00
999,0
19,16
39,17
99,17
999,2
19,25
39,25
99,25
999,2
19,30
39,30
99,30
999,3
19,33
39,33
99,33
999,3
19,35
39,36
99,36
999,4
19,37
39,37
99,37
999,4
19,38
39,39
99,39
999,4
19,40
39,40
99,40
999,4
19,40
39,41
99,41
999,4
19,41
39,41
99,42
999,4
19,43
39,43
99,43
999,4
19,45
39,45
99,45
999,4
19,45
39,46
99,46
999,5
19,46
39,46
99,47
999,5
19,47
39,47
99,47
999,5
19,48
39,48
99,48
999,5
19,49
39,49
99,49
999,5
19,50
39,50
99,50
999,5
0,05
0,025
0,01
0,001
10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 39,43 14,17 14,12 14,08 14,04 13,99 13,95 13,90
34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,13 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
167,0 148,5 141,1 137,1 134,6 132,8 131,6 130,6 129,9 129,2 128,8 128,3 127,4 126,4 125,9 125,4 125,0 124,5 124,0 123,5
0,05 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,93 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
0,025 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,66 8,56 8,51 8,46 8,41 8,36 8,31 8,26
0,01 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46
0,001 74,14 61,25 56,18 53,44 51,71 50,53 49,66 49,00 48,47 48,05 47,70 47,41 46,76 46,10 45,77 45,43 45,09 44,75 44,40 44,05
0,05 6,61 5,79 5,41 5,19 5,05 4,95 4,88 8,82 4,77 4,74 4,70 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
0,025 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,46 6,33 6,28 6,23 6,18 6,12 6,07 6,02
0,01 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
0,001 47,18 37,12 33,20 31,09 29,75 28,84 28,16 27,64 27,24 26,92 26,64 26,42 25,91 25,39 25,14 24,87 24,60 24,33 24,06 23,79
0,05 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
0,025 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,27 5,17 5,12 5,07 5,01 4,96 4,90 4,85
0,01 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
0,001 35,51 27,00 23,70 21,92 20,81 20,03 19,46 19,03 18,69 18,41 18,18 17,99 17,56 17,12 16,89 16,67 16,44 16,21 15,99 15,75
0,05 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 6,60 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
0,025 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 3,51 4,47 4,42 4,36 4,31 4,25 4,20 4,14
0,01 12,25 9,55 8,45 7,85 4,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
0,001 29,25 21,69 18,77 17,19 16,21 15,52 15,02 14,63 14,33 14,08 13,88 13,71 13,32 12,93 12,73 12,53 12,33 12,12 11,91 11,70
10
11
12
0,05 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,22 3,15 3,12 3,08
0,025 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,10 4,00 3,95 3,89
0,01 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,74 5,67 5,52 5,36 5,28 5,20
0,001 25,42 18,49 15,83 14,39 13,49 12,86 12,40 12,04 11,77 11,54 11,35 11,19 10,84 10,48 10,30 10,11
3,04
3,84
5,12
9,92
3,01
3,78
5,03
9,73
2,97
3,73
4,95
9,53
2,93
3,67
4,86
9,33
0,05 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18
0,025 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03
0,01 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35
0,001 22,86 16,39 13,90 12,56 11,71 11,13 10,70 10,37 10,11
3,14
3,96
5,26
9,89
3,10
3,87
5,18
9,72
3,07
3,77
5,11
9,57
3,01
3,77
4,96
9,24
2,94
3,67
4,81
8,90
2,90
3,61
4,73
8,72
2,86
3,56
4,65
8,55
2,83
3,51
4,57
8,37
2,79
3,45
4,48
8,19
2,75
3,39
4,40
8,00
2,71
3,33
4,31
7,81
3,22
4,07
5,39
9,92
3,14
3,95
5,20
9,52
3,07
3,85
5,06
9,20
3,02
3,78
4,94
8,96
2,98
3,72
4,85
8,75
2,94
3,62
4,78
8,59
2,91
3,52
4,71
8,45
2,85
3,52
4,56
8,13
2,77
3,42
4,41
7,80
2,74
3,37
4,33
7,64
2,70
3,31
4,25
7,47
2,66
3,26
4,17
7,30
2,62
3,20
4,08
7,12
2,58
3,14
4,00
6,94
2,54
3,08
3,91
6,76
3,20
4,04
5,32
9,58
3,09
3,88
5,07
9,05
3,01
3,76
4,89
8,66
2,95
3,66
4,74
8,35
2,90
3,59
4,63
8,12
2,85
3,53
4,54
7,92
2,82
3,43
4,46
7,76
2,79
3,33
4,40
7,63
2,72
3,33
4,25
7,32
2,65
3,23
4,10
7,01
2,61
3,17
4,02
6,85
2,57
3,12
3,94
6,68
2,53
3,06
3,86
6,52
2,49
3,00
3,78
6,35
2,45
2,94
3,69
6,17
2,40
2,88
3,60
6,00
3,11
3,89
5,06
8,89
3,00
3,73
4,82
9,38
2,91
3,61
4,64
8,00
2,85
3,51
4,50
7,71
2,80
3,44
4,39
7,48
2,75
3,37
4,30
7,29
2,72
3,28
4,22
7,14
2,69
3,18
4,16
7,00
2,62
3,18
4,01
6,71
2,54
3,07
3,86
6,40
2,51
3,02
3,78
6,25
2,47
2,96
3,70
6,09
2,43
2,91
3,62
5,93
2,38
2,85
3,54
5,76
2,34
2,79
3,45
5,59
2,30
2,72
3,36
5,42
3,26
4,12
5,41
9,63
Continua
215
Inferncia Estatstica
Continuao
1
2
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
10
11
12
15
20
24
30
40
60
3,18
4,00
5,21
9,07
3,03
3,77
4,86
8,35
2,92
3,60
4,62
7,86
2,83
3,48
4,44
7,49
2,77
3,39
4,30
7,21
2,71
3,31
4,19
6,98
2,67
3,25
4,10
6,80
2,63
3,15
4,02
6,65
2,60
3,05
3,96
6,52
2,53
3,05
3,82
6,23
2,46
2,95
3,66
5,93
2,42
2,89
3,59
5,78
2,38
2,84
3,51
5,63
2,34
2,78
3,43
5,47
2,30
2,72
3,34
5,30
120
2,25
2,66
3,25
5,14
Inf.
2,21
2,60
3,17
4,97
3,34
4,24
5,56
9,73
3,11
3,89
5,04
8,62
2,96
3,66
4,69
7,92
2,85
3,50
4,46
7,43
2,76
3,38
4,28
7,08
2,70
3,29
4,14
6,80
2,65
3,21
4,03
6,58
2,60
3,15
3,94
6,40
2,56
3,05
3,86
6,26
2,53
2,95
3,80
6,13
2,46
2,95
3,66
5,85
2,39
2,84
3,51
5,56
2,35
2,79
3,43
5,41
2,31
2,73
3,35
5,25
2,27
2,67
3,27
5,10
2,22
2,61
3,18
4,94
2,18
2,55
3,09
4,77
2,13
2,49
3,00
4,60
3,29
4,15
5,42
9,34
3,06
3,80
4,89
8,25
2,90
3,58
4,56
7,57
2,79
3,41
4,32
7,09
2,71
3,29
4,14
6,74
2,64
3,20
4,00
6,47
2,59
3,12
3,89
6,26
2,54
3,06
3,80
6,08
2,51
2,96
3,73
5,94
2,48
2,86
3,67
5,81
2,40
2,86
3,52
5,54
2,33
2,76
3,37
5,25
2,29
2,70
3,29
5,10
2,25
2,64
3,21
4,95
2,20
2,59
3,13
4,80
2,16
2,52
3,05
4,64
2,11
2,46
2,96
4,47
2,07
2,40
2,87
4,31
3,24
4,08
5,29
9,00
3,01
3,73
4,77
7,94
2,85
3,50
4,44
7,27
2,74
3,34
4,20
6,81
2,66
3,22
4,03
6,46
2,59
3,12
3,89
6,19
2,54
3,05
3,78
5,98
2,49
2,99
3,69
5,81
2,45
2,89
3,61
5,67
2,42
2,79
3,55
5,55
2,35
2,79
3,41
5,27
2,28
2,68
3,26
4,99
2,24
2,63
3,18
4,85
2,19
2,57
3,10
4,70
2,15
2,51
3,02
4,54
2,11
2,45
2,93
4,39
2,06
2,38
2,84
4,23
2,01
2,32
2,75
4,06
3,20
4,01
5,18
8,73
2,96
3,66
4,67
7,68
2,81
3,44
4,34
7,02
2,70
3,28
4,10
6,56
2,61
3,16
3,93
6,22
2,55
3,06
3,79
5,96
2,49
2,98
3,68
5,75
2,45
2,92
3,59
5,58
2,41
2,82
3,52
5,44
2,38
2,72
3,46
5,32
2,31
2,72
3,31
5,05
2,23
2,62
3,16
4,78
2,19
2,56
3,08
4,63
2,15
2,50
3,00
4,48
2,10
2,44
2,92
4,33
2,06
2,38
2,83
4,18
2,01
2,32
2,75
4,02
1,96
2,25
2,65
3,85
3,16
3,95
5,09
8,49
2,93
3,61
4,58
7,46
2,77
3,38
4,25
6,81
2,66
3,22
4,01
6,35
2,58
3,10
3,84
6,02
2,51
3,01
3,71
5,76
2,46
2,93
3,60
5,56
2,41
2,87
3,51
5,39
2,37
2,77
3,44
5,25
2,34
2,67
3,37
5,13
2,27
2,67
3,23
4,87
2,19
2,56
3,08
4,59
2,15
2,50
3,00
4,45
2,11
2,44
2,92
4,30
2,06
2,38
2,84
4,15
2,02
2,32
2,75
4,00
1,97
2,26
2,66
3,84
1,92
2,19
2,57
3,67
3,13
3,90
5,01
8,28
2,90
3,36
4,50
7,26
2,74
3,33
4,17
6,62
2,63
3,17
3,94
6,18
2,54
3,05
3,77
5,85
2,48
2,96
3,63
5,59
2,42
2,88
3,52
5,39
2,38
2,82
3,43
5,22
2,34
2,72
3,36
5,08
2,31
2,62
3,30
4,97
2,23
2,62
3,15
4,70
2,16
2,51
3,00
4,43
2,11
2,45
2,92
4,29
2,07
2,39
2,84
4,14
2,03
2,33
2,76
3,99
1,98
2,27
2,67
3,84
1,93
2,20
2,58
3,68
1,88
2,13
2,49
3,51
0,05 4,35
0,025 5,87
0,01 8,10
0,001 14,82
3,49
4,46
5,85
9,95
3,10
3,86
4,94
8,10
2,87
3,51
4,43
7,10
2,71
3,29
4,10
6,46
2,60
3,13
3,87
6,02
2,51
3,01
3,70
5,69
2,45
2,91
3,56
5,44
2,39
2,84
3,46
5,24
2,35
2,77
3,37
5,08
2,31
2,68
3,30
4,94
2,28
2,57
3,23
4,82
2,20
2,57
3,09
4,56
2,12
2,46
2,94
4,29
2,08
2,41
2,86
4,15
2,04
2,35
2,78
4,00
1,99
2,29
2,69
3,86
1,95
2,22
2,61
3,70
1,90
2,16
2,52
3,54
1,84
2,09
2,42
3,38
0,05 4,32
0,025 5,83
0,01 8,02
0,001 14,59
3,47
4,42
5,78
9,77
3,07
3,82
4,87
7,94
2,84
3,48
4,37
6,95
2,68
3,25
4,04
6,32
2,57
3,09
3,81
5,88
2,49
2,97
3,64
5,56
2,42
2,87
3,51
5,31
2,37
2,80
3,40
5,11
2,32
2,73
3,31
4,95
2,28
2,64
3,24
4,81
2,25
2,53
3,17
4,70
2,18
2,53
3,03
4,44
2,10
2,42
2,88
4,17
2,05
2,37
2,80
4,03
2,01
2,31
2,72
3,88
1,96
2,25
2,64
3,74
1,92
2,18
2,55
3,58
1,87
2,11
2,46
3,42
1,81
2,04
2,36
3,26
0,05 4,30
0,025 5,79
0,01 7,95
0,001 14,38
3,44
4,38
5,72
9,61
3,05
3,78
4,82
7,80
2,82
3,44
4,31
6,81
2,66
3,22
3,99
6,19
2,55
3,05
3,76
5,76
2,46
2,93
3,59
5,44
2,40
2,84
3,45
5,19
2,34
2,76
3,35
4,99
2,30
2,70
3,26
4,83
2,26
2,60
3,18
4,70
2,23
2,50
3,12
4,58
2,15
2,50
2,98
4,33
2,07
2,39
2,83
4,06
2,03
2,33
2,75
3,92
1,98
2,27
2,67
3,78
1,94
2,21
2,58
3,63
1,89
2,14
2,50
3,48
1,84
2,08
2,40
3,32
1,78
2,00
2,31
3,15
0,05 4,28
0,025 5,75
0,01 7,88
0,001 14,19
3,42
4,35
5,66
9,47
3,03
3,75
4,76
7,67
2,80
3,41
4,26
6,69
2,64
3,18
3,94
6,08
2,53
3,02
9,71
5,65
2,44
2,90
3,54
5,33
2,37
2,81
3,41
5,09
2,32
2,73
3,30
4,89
2,27
2,67
3,21
4,73
2,24
2,57
3,14
4,60
2,20
2,47
3,07
4,48
2,13
2,47
2,93
4,23
2,05
2,36
2,78
3,96
2,01
2,30
2,70
3,82
1,96
2,24
2,62
3,68
1,91
2,18
2,54
3,53
1,86
2,11
2,45
3,38
1,81
2,04
2,35
3,22
1,76
1,97
2,26
3,05
0,05 4,26
0,025 5,72
0,01 7,82
0,001 14,03
3,40
4,32
5,61
9,34
3,01
3,72
4,72
7,55
2,78
3,38
4,22
6,59
2,62
3,15
3,90
5,98
2,51
2,99
3,67
5,55
2,42
2,87
3,50
5,23
2,36
2,78
3,36
4,99
2,30
2,70
3,26
4,80
2,25
2,64
3,17
4,64
2,22
2,54
3,09
4,51
2,18
2,44
3,03
4,39
2,11
2,44
2,89
4,14
2,03
2,33
2,74
3,87
1,98
2,27
2,66
3,74
1,94
2,21
2,58
3,59
1,89
2,15
2,49
3,45
1,84
2,08
2,40
3,29
1,79
2,01
2,31
3,14
1,73
1,94
2,21
2,97
0,05 4,24
0,025 5,69
0,01 7,77
0,001 13,88
3,39
4,29
5,57
9,22
2,99
3,69
4,68
7,45
2,76
3,35
4,18
6,49
2,60
3,13
3,85
5,88
2,49
2,97
3,63
5,46
2,40
2,85
3,46
5,15
2,34
2,75
3,32
4,91
2,28
2,68
3,22
4,71
2,24
2,61
3,13
4,56
2,20
2,51
3,05
4,42
2,16
2,41
2,99
4,31
2,09
2,41
2,85
4,06
2,01
2,30
2,70
3,79
1,96
2,24
2,62
3,66
1,92
2,18
2,54
3,52
1,87
2,12
2,45
3,37
1,82
2,05
2,36
3,22
1,77
1,98
2,27
3,06
1,71
1,91
2,17
2,89
0,05 4,23
0,025 5,66
0,01 7,72
0,001 13,74
3,37
4,27
5,53
9,12
2,98
3,67
4,64
7,36
2,74
3,33
4,14
6,41
2,59
3,10
3,82
5,80
2,47
2,94
3,59
5,38
2,39
2,82
3,42
5,07
2,32
2,73
3,29
4,83
2,27
2,65
3,18
4,64
2,22
2,59
3,09
4,48
2,18
2,49
3,02
4,35
2,15
2,39
2,96
4,24
2,07
2,39
2,81
3,99
1,99
2,28
2,66
3,72
1,95
2,22
2,58
3,59
1,90
2,16
2,50
3,44
1,85
2,09
2,42
3,30
1,80
2,03
2,33
3,15
1,75
1,95
2,23
2,99
1,69
1,88
2,13
2,82
0,05 4,21
0,025 5,63
0,01 7,68
0,001 13,61
3,35
4,24
5,49
9,02
2,96
3,65
4,60
7,27
2,73
3,31
4,11
6,33
2,57
3,08
3,78
5,73
2,46
2,92
3,56
5,31
2,37
2,80
3,39
5,00
2,31
2,71
3,26
4,76
2,25
2,63
3,15
4,57
2,20
2,57
3,06
4,41
2,16
2,47
2,98
4,28
2,13
2,36
2,93
4,17
2,06
2,36
2,78
3,92
1,97
2,25
2,63
3,66
1,93
2,19
2,55
3,52
1,88
2,13
2,47
3,38
1,84
2,07
2,38
3,23
1,79
2,00
2,29
3,08
1,73
1,93
2,20
2,92
1,67
1,85
2,10
2,75
Continua
216
Inferncia Estatstica
Continuao
1
2
28
29
30
40
60
120
Inf.
10
11
12
15
20
24
30
40
60
120
Inf.
0,05 4,20
0,025 5,61
0,01 7,64
0,001 13,50
3,34
4,22
5,45
8,93
2,95
3,63
4,57
7,19
2,71
3,29
4,07
6,25
2,56
3,06
3,75
5,66
2,45
2,90
3,53
5,24
2,36
2,78
3,36
4,93
2,29
2,69
3,23
4,69
2,24
2,61
3,12
4,50
2,19
2,55
3,03
4,35
2,15
2,45
2,95
4,22
2,12
2,34
2,90
4,11
2,04
2,34
2,75
3,86
1,96
2,23
2,60
3,60
1,91
2,17
2,52
3,46
1,87
2,11
2,44
3,32
1,82
2,05
2,35
3,18
1,77
1,98
2,26
3,02
1,71
1,91
2,17
2,86
1,65
1,83
2,06
2,69
0,05 4,18
0,025 5,59
0,01 7,60
0,001 13,39
3,33
4,20
5,42
8,85
2,93
3,61
4,54
7,12
2,70
3,27
4,04
6,19
2,55
3,04
3,73
5,59
2,43
2,88
3,50
5,18
2,35
2,76
3,33
4,87
2,28
2,67
3,20
4,64
2,22
2,59
3,09
4,45
2,18
2,53
3,00
4,29
2,14
2,43
2,92
4,16
2,10
2,32
2,87
4,05
2,03
2,32
2,73
3,80
1,94
2,21
2,57
3,54
1,90
2,15
2,49
3,41
1,85
2,09
2,41
3,27
1,81
2,03
2,33
3,12
1,75
1,96
2,23
2,97
1,70
1,89
2,14
2,81
1,64
1,81
2,03
2,64
0,05 4,17
0,025 5,57
0,01 7,56
0,001 13,29
3,32
4,18
5,39
8,77
2,92
3,59
4,51
7,05
2,69
3,25
4,02
6,12
2,53
3,03
3,70
5,53
2,42
2,87
3,47
5,12
2,33
2,75
3,30
4,82
2,27
2,65
3,17
4,58
2,21
2,57
3,07
4,39
2,16
2,51
2,98
4,24
2,12
2,41
2,90
4,11
2,09
2,31
2,84
4,00
2,01
2,31
2,70
3,75
1,93
2,20
2,55
3,49
1,89
2,14
2,47
3,36
1,84
2,07
2,39
3,22
1,79
2,01
2,30
3,07
1,74
1,94
2,21
2,92
1,68
1,87
2,11
2,76
1,62
1,79
2,01
2,59
0,05 4,08
0,025 5,42
0,01 7,31
0,001 12,61
3,23
4,05
5,18
8,25
2,84
3,46
4,31
6,60
2,61
3,13
3,83
5,70
2,45
2,90
3,51
5,13
2,34
2,74
3,29
4,73
2,25
2,62
3,12
4,44
2,18
2,53
2,99
4,21
2,12
2,45
2,89
4,02
2,08
2,39
2,80
3,87
2,04
2,29
2,73
3,75
2,00
2,18
2,66
3,64
1,92
2,18
2,52
3,40
1,84
2,07
2,37
3,15
1,79
2,01
2,29
3,01
1,74
1,94
2,20
2,87
1,69
1,88
2,11
2,73
1,64
1,80
2,02
2,57
1,58
1,72
1,92
2,41
1,51
1,64
1,80
2,23
0,05 4,00
0,025 5,29
0,01 7,08
0,001 11,97
3,15
3,93
4,98
7,76
2,76
3,34
4,13
6,17
2,53
3,01
3,65
5,31
2,37
2,79
3,34
4,76
2,25
2,63
3,12
4,37
2,17
2,51
2,95
4,09
2,10
2,41
2,82
3,87
2,04
2,33
2,72
3,69
1,99
2,27
2,63
3,54
1,95
2,17
2,56
3,42
1,92
2,06
2,50
3,31
1,84
2,06
2,35
3,08
1,75
1,94
2,20
2,83
1,70
1,88
2,12
2,69
1,65
1,82
2,03
2,55
1,59
1,74
1,94
2,41
1,53
1,67
1,84
2,25
1,47
1,58
1,73
2,08
1,39
1,48
1,60
1,89
0,05 3,92
0,025 5,15
0,01 6,85
0,001 11,38
3,07
3,80
4,79
7,32
2,68
3,23
3,95
5,79
2,45
2,89
3,48
4,95
2,29
2,67
3,17
4,42
2,17
2,52
2,96
4,04
2,09
2,39
2,79
3,77
2,02
2,30
2,66
3,55
1,96
2,22
2,56
3,38
1,91
2,16
2,47
3,24
1,86
2,05
2,40
3,12
1,83
1,94
2,34
3,02
1,75
1,94
2,19
2,78
1,66
1,82
2,03
2,53
1,61
1,76
1,95
2,40
1,55
1,69
1,86
2,26
1,50
1,61
1,76
2,11
1,43
1,53
1,66
1,95
1,35
1,43
1,53
1,76
1,25
1,31
1,38
1,54
0,05 3,84
0,025 5,02
0,01 6,63
0,001 10,83
3,00
3,69
4,61
6,91
2,60
3,12
3,78
5,42
2,37
2,79
3,32
4,62
2,21
2,57
3,02
4,10
2,10
2,41
2,80
3,74
2,01
2,29
2,64
3,47
1,94
2,19
2,51
3,27
1,88
2,11
2,41
3,10
1,83
2,05
2,32
2,96
1,79
1,94
2,24
2,84
1,75
1,83
2,18
2,74
1,67
1,83
2,04
2,51
1,57
1,71
1,88
2,27
1,52
1,64
1,79
2,13
1,46
1,57
1,70
1,99
1,39
1,48
1,59
1,84
1,32
1,39
1,47
1,66
1,22
1,27
1,32
1,45
1,00
1,00
1,00
1,00
217
Inferncia Estatstica
Classe
0
1
2
3
4
5
6
7
Total
2.2. k = 7
j
1
2
3
4
5
6
7
Fj
Fj
fj
fj
20
7
7
3
2
0
0
1
40
20
27
34
37
39
39
39
40
-
0,50
0,18
0,18
0,08
0,05
0,00
0,00
0,03
1
0,50
0,68
0,85
0,93
0,98
0,98
0,98
1,00
-
i = 12,89
Classe
Fj
Fj
fj
f j
cj
3,11| 16,00
16,00| 28,89
28,89| 41,78
41,78| 54,67
54,67| 67,56
67,56| 80,45
80,45||93,34
8
20
6
8
3
1
4
50
8
28
34
42
45
46
50
-
0,16
0,4
0,12
0,16
0,06
0,02
0,08
1
0,16
0,56
0,68
0,84
0,9
0,92
1
-
9,555
22,445
35,335
48,225
61,115
74,005
86,895
-
2.3. Grfico
2.4. r = -0,7732
2.5. x = 9,75
Mo = 9
Md = 9,5
at = 8
2.6. Q1 = 58
Q2 = 67
Q3 = 70
aq = 12
s2 = 6,79
s = 2,61
2.7. x = 1,075
Mo = 0
Md = 0,5
s2 = 1,87
s = 1,31
m2 = 1,819
m3 = 2,815
m4 = 11,419
a3 = 1,147
Classificao: assimtrica positiva e leptocrtica.
CV = 26,72%
CV = 127,07%
a4 = 3,45
2.8. x = 34,56
Mo = 16,00 |-- 28,89
Md = 16,00 |-- 28,89
s2 = 491,06
CV = 64,12%
m2 =481,24
m3 =11011,7
m4 =755077
a3 =1,043
Classificao: assimtrica positiva e leptocrtica.
s = 22,16
a4 =3,260
2.9.
a) EI = 3,1
Q1 =
19,27
Md = 27,86
Q3 = 45,4
ES = 93,3
b) Os valores 85,76 ; 86,37 e 93,34 so considerados discrepantes
c) Grfico
d) Distribuio assimtrica negativa
2.10. Assimetria negativa
6| 32 55 75
7| 18 60 60 83 84
8| 26 31 34 39 42 54 65 65 66 86 88
9| 01 12 19 39 54 61
218
Inferncia Estatstica
Unidade III - Elementos de probabilidade
3.1. 0,5303
3.2. 0,3801
3.3. a) 0,6
e) 0,6
b) 0,4
f) 0,4
c) 0,75
g) 0,75
d) 0,25
h) 0,25
P(B|D) = 0,4058
P(C|D) = 0,2319
3.5. 0,66
3.6. a) 0,7283
3.7. a) 1,20
g) 0,63
b) 0,2092
b) 0,90
h) -0,36
c) 2,10
i) 0,63
d) 0,30
j) 2,07
e) 0,70
f) 0,72
k) -0,5345
3.8. 0,6836
3.9. 0,0758
3.10. 0,2242
3.11. a) E(X) = 15
b) 0,4190
V(X) = 8,33
3.13. R$ 0,25
3.14. a) 0,4582
b) 0,2090
c) 0,1587
3.15. a) 0,6078
b) 0,0912
c) 447,6
Inferncia Estatstica
220