Você está na página 1de 238

Universidade Federal de Pelotas

ESTATSTICA BSICA


Verso Preliminar



Joo Gilberto Corra da Silva












Universidade Federal de Pelotas















ESTATSTICA BSICA


Verso Preliminar








Joo Gilberto Corra da Silva











Pelotas, 2004



Contedo
Pgina
1.1. O mbito da Estatstica..............................................................................................
1.2. A Estatstica e o Cotidiano.........................................................................................
1.3. A Estatstica na Pesquisa Cientfica...........................................................................
1.3.1. Especificao do objetivo....................................................................................
1.3.2. Coleta de informaes.........................................................................................
1.3.3. Anlise de dados..................................................................................................
1.3.4. Estabelecimento de descobertas..........................................................................
1.4. Situaes Ilustrativas de Coleta e Anlise de Dados..................................................
1.5. Populao e Amostra..................................................................................................
1.6. Conceito da Estatstica...............................................................................................
1.7. A Interao da Estatstica com Outros Campos.........................................................
1.8. Mensurao e Escalas de Medida...............................................................................
1.9. Exerccios...................................................................................................................
1
2
3
3
4
4
5
5
6
9
9
10
13
2.1. Fontes de Dados Estatsticos......................................................................................
2.2. Descrio Sumria de Dados - Introduo.................................................................
2.3. Descrio Sumria de Dados por Tabelas e Grficos................................................
2.3.1. Pequenos conjuntos de dados...............................................................................
2.3.2. Grandes conjuntos de dados.................................................................................
2.3.2.1. Distribuio de freqncias............................................................................
2.3.2.2. Representao grfica de uma distribuio de freqncias............................
2.4. Representao Simblica de Conjuntos de Dados e da Operao de Adio............
2.5. Medidas de Posio e de Disperso...........................................................................
2.5.1. Medidas de centro................................................................................................
Propriedades da mdia aritmtica............................................................................
Mdia de uma distribuio de freqncias...............................................................
2.5.2. Medidas de disperso...........................................................................................
Varincia de uma distribuio de freqncias..........................................................
2.6. Exerccios...................................................................................................................
17
18
19
19
20
20
22
24
25
25
25
26
26
28
29
3.1. Experimento Aleatrio e Eventos..............................................................................
3.2. Conceito Clssico de Probabilidade...........................................................................
3.3. Contagem de Pontos do Espao Bsico.....................................................................
Regra da multiplicao.............................................................................................
Regra das permutaes.............................................................................................
Regra das permutaes com repeties....................................................................
Regra dos arranjos....................................................................................................
35
38
41
41
42
43
44
Estatstica Bsica ii
Regra das combinaes............................................................................................
3.4. Conceito Emprico de Probabilidade..........................................................................
3.5. Conceito de Probabilidade em Espao Bsico Discreto.............................................
3.6. Operaes de Eventos................................................................................................
3.7. Probabilidade Condicional.........................................................................................
3.8. Independncia Estatstica...........................................................................................
3.9. Conceito Geral de Probabilidade................................................................................
3.10. Modelos de Probabilidade........................................................................................
3.11. Exerccios.................................................................................................................
45
47
49
50
53
55
57
58
58
4.1. Introduo...................................................................................................................
4.2. Varivel Aleatria Discreta........................................................................................
4.2.1. Distribuio de probabilidade..............................................................................
4.2.2. Representao grfica de uma distribuio de probabilidade..............................
4.2.3. Mdia de uma distribuio de probabilidade.......................................................
Propriedades do valor esperado................................................................................
4.2.4. Varincia de uma distribuio de probabilidade..................................................
Propriedades da varincia..........................................................................................
4.3. Distribuies Discretas Importantes...........................................................................
4.3*.1. Distribuio uniforme discreta...........................................................................
4.3.2. Distribuio de Bernoulli.....................................................................................
- Mdia e varincia...................................................................................................
4.3.3. Distribuio binomial...........................................................................................
- Mdia e varincia...................................................................................................
4.3.4. Amostragem de uma populao dicotmica........................................................
Amostragem com reposio.....................................................................................
Amostragem sem reposio......................................................................................
4.3.5. Distribuio hipergeomtrica...............................................................................
- Mdia e varincia...................................................................................................
4.3.6. Distribuio geomtrica.......................................................................................
- Mdia e varincia...................................................................................................
4.3.7. Distribuio binomial negativa............................................................................
- Mdia e varincia...................................................................................................
4.3.8. Distribuio de Poisson........................................................................................
4.4. Distribuio Conjunta de Duas Variveis Aleatrias.................................................
Propriedades da funo distribuio de probabilidade conjunta..............................
Representao geomtrica........................................................................................
4.5. Distribuio de uma Funo de Duas Variveis Aleatrias.......................................
4.6. Distribuio Marginal................................................................................................
4.7. Valor Esperado de uma Funo de Duas Variveis Aleatrias..................................
4.8. Covarincia e Correlao de Duas Variveis Aleatrias............................................
66
69
69
71
73
75
75
76
77
77
78
79
79
81
82
82
83
84
84
85
86
86
87
87
88
92
92
93
93
94
95
Contedo
iii
Propriedades do coeficiente de correlao................................................................
4.9. Distribuio Condicional e Independncia Estatstica...............................................
4.10. Distribuio Conjunta de n Variveis Aleatrias.....................................................
Propriedades do valor esperado................................................................................
4.11. Distribuio Multinomial.........................................................................................
4.12. Exerccios.................................................................................................................
97
97
99
101
102
103
5.1. Introduo...................................................................................................................
5.2. Densidade de Probabilidade.......................................................................................
5.3. Distribuio Normal...................................................................................................
5.3.1. Introduo.............................................................................................................
5.3.2. Clculo de probabilidades para varivel aleatria normal...................................
5.4. Aproximao da Distribuio Binomial pela Distribuio Normal...........................
5.5. Distribuio Normal Bivariada..................................................................................
5.6. Combinao Linear de Variveis Aleatrias Normais...............................................
Casos particulares.....................................................................................................
5.7. Distribuio da Mdia de Variveis Aleatrias..........................................................
5.8. Exerccios...................................................................................................................
111
112
116
116
118
122
124
125
126
127
128
6.1. Introduo...................................................................................................................
6.2. Inferncia Indutiva.....................................................................................................
6.3. Populao e Amostra..................................................................................................
6.4. Distribuio Amostral................................................................................................
6.5. Mdia e Varincia Amostrais.....................................................................................
6.6. Teorema Central do Limite........................................................................................
6.7. Amostragem de Distribuies Normais.....................................................................
6.7.1. Introduo.............................................................................................................
6.7.2. Distribuio da mdia da amostra........................................................................
6.7.3. Distribuio da varincia da amostra...................................................................
6.7.4. Distribuio t de Student......................................................................................
6.7.5. Distribuio F.......................................................................................................
6.8. Exerccios...................................................................................................................
133
133
134
136
138
139
142
142
143
144
149
153
157
7.1. Introduo...................................................................................................................
7.2. Estimao por Ponto...................................................................................................
7.2.1. Conceitos..............................................................................................................
7.2.2. Propriedades de um estimador.............................................................................
7.2.3. Distribuio amostral da mdia de uma populao normal.................................
7.2.4. Distribuio amostral da varincia de uma populao normal.............................
7.3. Estimao por Intervalo - Intervalo de Confiana......................................................
7.4. Teste de Hiptese.......................................................................................................
7.4.1. Conceitos..............................................................................................................
163
164
164
165
165
166
166
167
167
Estatstica Bsica iv
7.4.2. Testes de hipteses referentes media de uma populao normal......................
7.4.3. Teste da hiptese de igualdade das mdias de duas populaes normais............
Populaes com mesma varincia............................................................................
7.4.4. Teste unilateral e teste bilateral............................................................................
7.5. Exerccios...................................................................................................................
170
172
172
174
174
8.1. Introduo...................................................................................................................
8.1.1. Origens e importncia da anlise de regresso linear...........................................
8.1.2. Relaes entre variveis.......................................................................................
- Relaes deterministas...........................................................................................
- Relaes semideterministas...................................................................................
- Relaes empricas.................................................................................................
8.1.3. Relaes lineares..................................................................................................
8.2. Relaes de Duas Variveis.......................................................................................
8.3. Grfico dos Dados......................................................................................................
8.4. Anlise de Regresso Linear Simples........................................................................
8.4.1. Introduo.............................................................................................................
8.4.2. Modelo estatstico................................................................................................
8.4.3. Inferncia estatstica.............................................................................................
8.4.4. Estimao (por ponto) dos parmetros.................................................................
Equao da linha reta ajustada.................................................................................
Resduos e estimativa da varincia do erro..............................................................
Propriedades dos estimadores de quadrados mnimos.............................................
8.4.5. Teste de hiptese..................................................................................................
8.4.5.1. Hiptese de relao linear entre Y e X...........................................................
8.4.5.2. Hiptese referente declividade da linha de regresso..................................
8.4.5.3. Anlise da variao........................................................................................
8.4.6. Coeficiente de determinao.............................................................................
8.4.7. Intervalo de confiana.......................................................................................
8.4.7.1. Intervalo de confiana para o coeficiente de regresso b...............................
8.4.7.2. Intervalo de confiana para E(Y|X) ..............................................................
8.5. Correlao Linear Simples......................................................................................
Relao entre coeficiente de regresso e coeficiente de correlao.........................
8.6. Exerccios...................................................................................................................
186
186
187
187
187
188
189
190
191
193
193
194
196
196
197
198
198
201
201
202
202
205
206
205
208
209
210
211
Apndice............................................................................................................................
Tabela A-I Distribuio cumulativa binomial............................................................
Tabela A-II Pontos -percentuais superiores da distribuio normal padro.............
Tabela A-III Pontos -percentuais superiores da distribuio qui-quadrado..............
Tabela A-IV Pontos percentuais da distribuio t (de Student)...................................
Tabela A-V Pontos percentuais superiores da distribuio F......................................
213
215
222
223
224
225

1 INTRODUO
Contedo
1.1 O mbito da Estatstica......................................................................................................1
1.2 A Estatstica e o Cotidiano.................................................................................................2
1.3 A Estatstica na Pesquisa Cientfica...................................................................................3
1.3.1 Especificao do objetivo ...........................................................................................3
1.3.2 Coleta de informaes.................................................................................................4
1.3.3 Anlise de dados .........................................................................................................4
1.3.4 Estabelecimento de descobertas..................................................................................5
1.4 Situaes Ilustrativas de Coleta e Anlise de Dados..........................................................5
1.5 Populao e Amostra..........................................................................................................6
1.6 Conceito da Estatstica .......................................................................................................9
1.7 A Interao da Estatstica com Outros Campos .................................................................9
1.8 Mensurao e Escalas de Medida.....................................................................................10
1.9 Exerccios.........................................................................................................................13

1.1 O mbito da Estatstica
Para a maioria das pessoas, o uso do termo "estatstica" familiar para designar e reportar
fatos numricos e figuras; por exemplo, as taxas de inflao mensais no Brasil no ltimo
quinqunio, os preos dirios de mercadorias em uma regio, quantidades de produtos exportados
por um Pas em um ano, os valores das aes em uma bolsa de valores em um determinado dia, ou
mesmo o nmero de pontos marcados pelas equipes em uma competio. Entretanto, este uso do
termo no caracteriza o mbito principal da estatstica. A estatstica trata, principalmente, de
situaes em que a ocorrncia de algum evento no pode ser predita com certeza.
Freqentemente, concluses so incertas porque so baseadas em dados incompletos. A
avaliao da presente taxa de desemprego em um estado, baseada em uma amostra de poucos
milhares de pessoas, um exemplo. A incerteza tambm decorre do fato de que observaes
repetidas de um fenmeno produzem resultados variveis, embora sejam feitos esforos para
controlar os fatores que governam o evento em observao. Por exemplo, pinheiros de um ano de
idade no so todos da mesma altura, mesmo que eles se tenham originado de um mesmo lote de
sementes e tenham sido cultivados sob semelhantes condies de solo e de clima. O tempo que
tomado para efetuar o corte de uma pastagem, os pesos de frangos de seis semanas criados em um
Estatstica Bsica


2
avirio, e o perodo de alvio de um sintoma de febre aps a ingesto de um certo medicamento so
outros exemplos de situaes em que ocorre variabilidade em repetidas observaes.
A estatstica um corpo de conceitos e mtodos teis para coletar e interpretar dados
relativos a uma rea particular de pesquisa, e extrair concluses em situaes em que incerteza e
variao esto presentes.
Historicamente, a palavra "estatstica" derivada da palavra latina "status", que significa
"estado". Por vrias dcadas, a estatstica foi associada apenas com a apresentao de fatos e
nmeros referentes a situaes econmicas, demogrficas e polticas prevalecentes em um pas.
Mesmo hoje, a grande quantidade de relatrios de governo que contm documentao numrica
abundante, com ttulos tais como "Estatsticas da Produo Agrcola" e "Estatsticas do Trabalho",
lembra a origem da palavra "estatstica".
Um grande segmento do pblico, em geral, ainda tem a concepo errada de que a
estatstica associa-se exclusivamente com grandes conjuntos de nmeros e algumas vezes
complicadas sries de grficos. Compilaes de dados e apresentaes numricas e grficas
tornaram-se um aspecto secundrio da estatstica. O progresso cientfico e tecnolgico tem
demandado um desenvolvimento extraordinrio da teoria e da metodologia estatstica. Como um
corpo de conhecimentos, a estatstica, hoje, inclui conceitos e mtodos de grande importncia,
alcance e aplicaes em todas as reas do conhecimento. Particularmente relevante o papel da
estatstica no mtodo cientfico cujo processo de inferncia para a derivao de conhecimento
eminentemente baseado em fundamentos estatsticos.
1.2 A Estatstica e o Cotidiano
A descoberta de fatos atravs de coleta e interpretao de dados no confinada a
pesquisadores profissionais. Ela faz parte da vida diria de todas as pessoas que se esforam,
consciente ou inconscientemente, para compreender assuntos de interesse referentes sociedade,
condies de vida, ambiente e ao mundo de modo geral. Ao tentar adquirir conhecimentos a
respeito do estado do desemprego, poluio de resduos industriais, eficcia de analgsicos,
comportamento de equipes de futebol em competio, e outras questes de interesse da vida
contempornea, juntam-se fatos e nmeros que devem ser interpretados, ou tenta-se compreender
as interpretaes que outros fazem. Assim, a aprendizagem ocorre diariamente atravs de anlise
de informao fatual freqentemente implcita.
As fontes de informao fatual abrangem da experincia individual s notcias dos meios
de comunicao, relatrios do governo e artigos em revistas profissionais. Previses de tempo,
relatrios do mercado, ndices de custo de vida e resultados de pesquisas de opinies so alguns
exemplos especficos. Os mtodos estatsticos so empregados extensivamente na preparao de
tais relatrios. Relatrios baseados em argumento estatstico apropriado e cuidadosa interpretao
das concluses so verdadeiramente informativos.
Freqentemente, entretanto, o mau uso, deliberado ou inadvertido, da estatstica conduz a
concluses errneas e distores da verdade. Para o pblico geral, o consumidor bsico desses
1. Introduo


3
relatrios, alguma idia do argumento estatstico essencial para a interpretao apropriada de
dados e a avaliao das concluses que so extradas.
O argumento estatstico fornece critrios para determinar as concluses que so realmente
suportadas pelos dados e aquelas que no o so. Em todos os campos de estudo onde inferncias
so extradas de anlises de dados, a credibilidade das concluses tambm depende grandemente
do uso de mtodos estatsticos adequados, especialmente no estgio da coleta de dados.
1.3 A Estatstica na Pesquisa Cientfica
A fundamental importncia da estatstica no mtodo cientfico aparente pela observao
de que a inferncia em cincias fatuais compreende generalizaes baseadas em informaes
incompletas ou imperfeitas em face de incerteza. Nestas condies, a estatstica permeia
extensivamente os domnios de toda a pesquisa cientfica. Uma melhor apreciao feita com a
reviso do mtodo cientfico, a seguir.
O mtodo cientfico um esforo para apreender acerca de regularidades escondidas de
fenmenos do que parece ser s vezes um mundo catico. Embora o mtodo cientfico no seja
rigidamente estruturado, ele compreende, essencialmente, em cada um de seus ciclos, o que segue:
Hipteses ou modelos so tentativamente postulados para explicar um fenmeno; dedues lgicas
so derivadas do modelo postulado e ento contrastadas com descobertas fatuais; o modelo
modificado, e a pesquisa continua para melhores explanaes.
As especificidades do processo de aprendizagem so to diversas quanto as disciplinas de
estudo, mas alguns passos bsicos que formam o mago da maioria das pesquisas cientficas so
listados a seguir.
1.3.1 Especificao do objetivo
O mtodo cientfico pode ser considerado para aumentar a compreenso referente a algum
fenmeno de interesse cujo presente conhecimento julgado inadequado. O emprego do mtodo
cientfico, entretanto, requer objetivos mais especficos, tal como provar uma hiptese ou
investigar uma teoria existente com respeito extenso da validade de dedues lgicas dela
derivadas.
Em algumas situaes, o objetivo pode ser simplesmente a criao de uma base de dados
e a derivao de informaes que reflitam a presente situao. Por exemplo, as quantidades mdias
de tempo que os estudantes despendem semanalmente em atividades de lazer podem ser coletadas
para estudar aquele componente da dedicao dos estudantes. Outras vezes o objetivo pode ser
muito mais extensivo; no apenas ganhar uma compreenso dos fatores que operam em um
ambiente, mas, tambm, determinar as possibilidades de seu uso no controle ou modificao de
algum aspecto de um fenmeno. Compreender a qumica de resduos slidos de uma fbrica e seu
conseqente uso para purificao de gua de rio da vizinhana um objetivo dessa forma.
Estatstica Bsica


4
1.3.2 Coleta de informaes
A procura de informao objetiva referente ao propsito do estudo crucial em toda a
pesquisa. Esse processo pode envolver uma ampla variedade de atividades, abrangendo desde
sofisticados experimentos em ambientes controlados a ensaios de campo, levantamentos scio-
econmicos, ou mesmo registros histricos. Na presente era de instrumentao e mecanizao
progressiva da manuteno de registros, a crescente quantificao de observaes um fato da
vida. Informaes so coligidas na forma de dados que exprimem algumas caractersticas de
indivduos ou elementos sob estudo.
Especificamente, no estgio de coleta de informao, a estatstica guia o pesquisador para
os meios apropriados para coletar dados informativos, incluindo a determinao do tipo e extenso
dos dados, de modo que concluses obtidas da anlise possam ser formuladas com um grau de
preciso desejado. Em reas de estudo em que a experimentao de alto custo, o tipo e a
quantidade de dados requeridos para fornecer o desejado nvel de credibilidade nas concluses
devem ser cuidadosamente determinados a priori. Em outras reas, tais decises tambm so
cruciais para a validade e efetividade das concluses obtidas de uma anlise de dados. Os ramos da
estatstica que tratam do planejamento de experimentos e de coletas de dados informativos so
designados, respectivamente, delineamento de experimento e delineamento de amostra.
1.3.3 Anlise de dados
Dados coletados por um processo apropriado de experimentao ou observao servem
como a fonte bsica para a aquisio de novo conhecimento acerca da rea sob estudo.
necessrio, ento, examinar o conjunto de dados e extrair informao relativa questo levantada
na especificao dos objetivos. Uma cuidadosa anlise dos dados crucial para verificar o novo
conhecimento obtido e avaliar sua validade.
Neste estgio, h uma necessidade ainda maior dos mtodos estatsticos. Alguns desses
mtodos destinam-se a resumir a informao contida nos dados para focar ateno nas
caractersticas salientes e descartar os detalhes no essenciais. Um grupo mais importante de
mtodos para anlise de dados destina-se a derivar generalizaes ou inferncias sobre o fenmeno
em estudo.

A Estatstica Descritiva compreende o conjunto dos mtodos estatsticos para
resumir e descrever as caractersticas proeminentes de conjuntos de dados referentes a
observaes de fenmenos particulares de uma classe de fenmenos. O conjunto de
mtodos estatsticos para avaliao da informao contida em conjuntos de dados e
derivao de inferncia, ou seja, generalizao dessa informao para a classe completa
de fenmenos constitui a Inferncia Estatstica.

Embora historicamente a atividade primria, hoje a Estatstica Descritiva apenas uma
pequena parte do amplo substrato da Estatstica. Uma funo importante da Estatstica ,
1. Introduo


5
correntemente, a Inferncia Estatstica, ou seja, a avaliao da informao presente nos dados e a
determinao do novo conhecimento ganho a partir dessa informao. O uso dos mtodos de
inferncia estatstica fornece uma base de raciocnio para a interpretao lgica de fatos
observados, para julgar a extenso em que esses fatos suportam ou contradizem um modelo
postulado e para sugerir revises particulares da teoria existente ou, talvez, planejar ulteriores
pesquisas.
1.3.4 Estabelecimento de descobertas
A significao da informao fornecida pelos dados deve, ento, ser verificada no
contexto do que era conhecido no estgio inicial da pesquisa, quando os objetivos foram
especificados. A anlise de dados destina-se a responder questes como: "Que generalidades
podem ser derivadas a respeito do fenmeno em estudo a partir da evidncia fornecida pelos
dados?" " uma conjetura formulada contraditada pelos dados?" "Os dados sugerem uma nova
teoria para explicar o fenmeno?" Os resultados da anlise so, ento, empregados para responder
essas questes e, tambm, para pesar as incertezas envolvidas nas respostas obtidas.
Freqentemente, os resultados sugerem a reviso de uma teoria existente, que pode requerer
ulterior pesquisa atravs de coleta e anlise de fatos.
A natureza bsica da aquisio de conhecimento tipicamente uma repetio desse ciclo
em uma forma ou outra. Raramente, se alguma vez, uma verdade desvendada em uma ou mesmo
em poucas operaes do ciclo e, em muitos campos, a alterao de condies demanda uma
continuao indefinida do processo de repetio.
As diferentes reas da estatstica no so entidades disjuntas destinadas para uso separado
em estgios individuais de uma pesquisa. Pelo contrrio, elas so integradas em um sistema
entrelaado de atividades onde os mtodos usados em uma rea podem ter forte conexo com
aqueles usados em outras reas. Para decidir sobre o processo de coleta de dados e sua extenso
deve-se ter uma percepo dos processos de inferncia considerados para uso e da solidez das
inferncias desejadas. Por outro lado, os mtodos de anlise de dados e derivao de concluses
so grandemente dependentes do processo de gerao dos dados.
1.4 Situaes Ilustrativas de Coleta e Anlise de Dados
Para esclarecer as generalidades precedentes, alguns exemplos so apresentados a seguir.
Eles ilustram algumas situaes tpicas em que o processo cognitivo da pesquisa de um fenmeno
envolve a coleta e anlise de dados em que mtodos estatsticos so, Conseqentemente, auxlios
indispensveis na aprendizagem.
- Melhoramento de plantas. Experimentos de fertilizao cruzada de diferentes tipos
genticos de espcies de plantas para produzir hbridos de elevado rendimento so de considervel
interesse para os pesquisadores agrcolas. Como um exemplo simples, suponha que os rendimentos
de duas variedades hbridas devem ser comparados sob condies especficas de clima. O nico
Estatstica Bsica


6
meio de obter informao sobre o comportamento relativo das duas variedades cultiv-las em um
nmero de locais, coletar dados de seus rendimentos e analis-los.
- Diagnose qumica. A deteco precoce de importncia fundamental para o tratamento
cirrgico de muitos tipos de cncer. Tendo em conta que exames peridicos em hospitais so caros
e inconvenientes, os mdicos buscam processos de diagnstico efetivos que os prprios pacientes
possam administrar. Para determinar os mritos de um novo processo em termos de sua taxa de
sucesso na deteco de casos verdadeiros e evitar deteces falsas, o processo deve ser testado em
um grande nmero de pessoas, as quais devem, ento, ser submetidas a exames hospitalares para
comparao.
- Programas de treinamento. Programas de treinamento e ensino, em muitos campos,
destinados a um tipo especfico de clientela (estudantes universitrios, trabalhadores na indstria,
grupos minoritrios, deficientes fsicos, crianas excepcionais, etc.) so continuamente
monitorizados, avaliados e modificados para o aumento de sua utilidade para a sociedade. A coleta
de dados referentes aquisio ou desenvolvimento de habilidade de indivduos ao final de cada
programa essencial para obter informao sobre a eficcia comparativa de diferentes programas.
- Migrao animal. Biologistas estudam os hbitos migratrios de pssaros e animais
identificando-os individualmente em locais geogrficos relevantes e, subseqentemente, seguindo-
os em outros locais. Os dados obtidos por tais mtodos no apenas ajudam compreenso do
mundo animal, mas, tambm, alertam os conservacionistas para situaes que requerem ao para
a proteo de espcies em perigo.
- Levantamentos socio-econmicos. Estudos referentes ao bem-estar econmico de
diferentes grupos tnicos, padres de gastos de consumidores de diferentes nveis de rendimento e
atitudes em relao legislao, so conduzidos nas reas interdisciplinares de sociologia,
economia e cincia poltica. Tais estudos so, muitas vezes, baseados em dados obtidos atravs de
entrevistas ou contato com amostras representativas de pessoas selecionadas, por um processo
estatstico, de uma populao enorme que forma o domnio de estudo. Os dados so ento
analisados para a derivao de interpretaes do assunto em questo.
1.5 Populao e Amostra
Os exemplos anteriores so extrados de campos amplamente diferentes. Embora apenas
descries sumrias da abrangncia e dos objetivos dos estudos sejam fornecidas, algumas
caractersticas comuns so imediatamente aparentes.
Primeiramente, a caracterstica mais saliente em todas essas reas de estudo a
essencialidade da coleta de dados por processos apropriados de experimentao ou observao. Em
segundo lugar, alguma quantidade de variabilidade nos resultados inevitvel, apesar do esforo
para que condies iguais ou similares prevaleam durante repeties de cada experimento ou
observao. Por exemplo, no experimento de melhoramento de plantas, irrealista esperar que
cada planta de uma variedade particular tenha o mesmo rendimento, porque a natureza no segue
tal lei rgida. Semelhantemente, um programa de treinamento para indivduos com experincias
1. Introduo


7
similares produz variabilidade em medidas de desempenho. A presena de alguma variao nos
resultados sob condies experimentais constantes tende a obscurecer o efeito de uma alterao
nessas condies. Um importante ingrediente para a anlise estatstica de dados a formulao de
modelos apropriados que representem a variabilidade inerente encontrada na natureza.
Uma terceira caracterstica notvel dos exemplos anteriores a impossibilidade ou
impraticabilidade fsica de coletar e estudar um conjunto exaustivo de dados referentes a uma rea
especfica de pesquisa. No h limite para a quantidade de experimentos de laboratrio ou ensaios
de campo que possam ser conduzidos, no importa a quantidade de experimentao j efetuada.
Em estudos de opinio pblica e de gastos com consumo, um corpo completo de informao
emergiria apenas se os dados fossem coletados de cada indivduo da nao. Por exemplo, para
coletar um conjunto exaustivo de dados relacionados a danos sofridos por todos os carros de um
modelo e ano particular em colises a uma velocidade especfica, cada um dos carros daquele
modelo que sai das linhas de produo teria de ser sujeito a uma coliso! O conjunto completo de
observaes que poderia ser coletado atravs de repeties ilimitadas de um experimento ou os
registros exaustivos de todos os elementos dentro do estudo seria to vasto que se pode, no
mximo, visualizar em imaginao. Tal vasto conjunto de dados pode ser considerado como uma
fonte de informao completa, mas as limitaes de tempo, recursos e facilidades, e, algumas
vezes, a natureza destrutiva do teste, significa que se deve trabalhar com informao incompleta -
os dados que so realmente coletados no curso de um estudo experimental.
As idias fundamentais emanadas dessa discusso salientam uma distino entre o
conjunto de dados que realmente adquirido atravs do processo de observao e a vasta coleo
de todas as observaes potenciais que podem ser concebidas em um dado contexto. Ou seja, uma
pesquisa trata com um conjunto de dados coletados em um subconjunto ou parte da coleo de
todos os indivduos para os quais desejado derivar inferncias atravs da pesquisa.

A coleo de todas as unidades (elementos, indivduos) de interesse em uma
pesquisa denominada universo, populao, ou, mais especificamente, populao
objetivo. Um subconjunto de unidades da populao atravs da qual se coleta
informaes na pesquisa denominada amostra. O processo de escolha ou seleo de
uma amostra da populao denominado amostragem.

Assim, a unidade da amostra a fonte elementar de informao referente populao
objetivo. A unidade da amostra pode ser uma planta, um animal, um conjunto de plantas, um
conjunto de animais, uma rea (um potreiro, por exemplo), uma fazenda, ou outros elementos,
dependendo da pesquisa em particular e do objetivo desta.
Uma populao pode ser real (ou concreta) ou hipottica (ou conceitual). Uma populao
real se suas unidades podem ser identificadas. A populao dos animais de um rebanho um
exemplo de populao concreta. Entretanto, a populao das plantas de uma cultivar de soja
hipottica, pois no se pode identificar todas as plantas de uma cultivar. Um conjunto finito ou
infinito, se o respectivo nmero de elementos finito ou infinito, respectivamente. O conjunto dos
nmeros inteiros, por exemplo, infinito. Todas as populaes na natureza so finitas. Entretanto,
Estatstica Bsica


8
populaes de nmero muito elevado de indivduos so, por convenincia terica, consideradas
infinitas.
Em uma pesquisa, geralmente, tem-se interesse especfico em algumas propriedades ou
atributos particulares que distinguem as unidades da populao sob considerao. Por exemplo,
raa, sexo, idade, peso, no caso de animais; cultivar, altura, peso da produo de gros, no caso de
uma planta. Cada unidade manifesta uma alternativa particular de uma caracterstica que o
distingue das demais unidades. Por exemplo, sexo uma caracterstica que pode manifestar-se em
uma unidade como macho ou fmea.

Uma propriedade ou atributo das unidades de uma populao objetivo uma
caracterstica dessas unidades ou dessa populao. Cada uma das formas alternativas
de manifestao de uma caracterstica um nvel dessa caracterstica.

Uma caracterstica avaliada atravs de um processo de mensurao. A mensurao de
uma caracterstica demanda o estabelecimento de uma correspondncia entre os nveis da
caracterstica e os valores de um conjunto de nmeros que leve em conta as relaes entre os nveis
da caracterstica e as operaes que podem ser efetuadas sobre eles. A regra de correspondncia
estabelecida para representao de uma caracterstica determina a representao dessa
caracterstica atravs de uma funo numrica (ou seja, uma funo de valores numricos) definida
no conjunto dos nveis da caracterstica.

Uma funo numrica que estabelece uma correspondncia entre os nveis de uma
caracterstica e os valores de um conjunto de nmeros denominada varivel. O valor
da varivel que corresponde a um nvel particular da caracterstica um nvel da
varivel.

Freqentemente, os termos caracterstica e varivel so empregados indistintamente.
comum a referncia s caractersticas ou s variveis que as expressam, em vez das
unidades. Neste contexto, os dados da amostra consistem de medidas correspondentes coleo de
unidades que so includas na pesquisa. Essa coleo forma uma parte de uma coleo de unidades
muito maior sobre a qual se deseja fazer inferncias. O conjunto de medidas que resultaria se todas
as unidades da coleo maior pudessem ser observadas definida como a populao.
Nesse contexto, uma populao, tambm denominada populao estatstica, o
conjunto completo das possveis medidas de caractersticas correspondentes coleo inteira de
unidades para as quais inferncias devem ser feitas. A populao representa a meta de uma
pesquisa, e o objetivo do processo de coleta de dados extrair concluses sobre a populao. Uma
amostra de uma populao estatstica o conjunto de medidas que so realmente coletadas no
curso de uma pesquisa.
A estatstica prov a metodologia para fazer inferncias indutivas sobre a populao a
partir da coleta e anlise de dados da amostra. Esses mtodos permitem derivar generalizaes
plausveis e, ento, avaliar a extenso da incerteza referente a essas generalizaes. Conceitos
1. Introduo


9
estatsticos tambm so essenciais durante o estgio de planejamento de uma pesquisa, quando
decises sobre a forma e a extenso do processo de amostragem devem ser feitas de modo que
dados informativos adequados possam ser gerados dentro das limitaes dos recursos disponveis.
Os objetivos da estatstica so, essencialmente: a) fazer inferncias sobre uma populao a
partir de uma anlise da informao contida em dados da amostra, e b) fazer avaliaes da
extenso da incerteza envolvida nessas inferncias. Um terceiro objetivo, no menos importante,
delinear o processo e a extenso da amostragem de modo que as observaes formem uma base
para a extrao de inferncias vlidas e exatas.
O planejamento do processo de amostragem freqentemente o passo mais importante,
especialmente em experimentos controlados em que vrios fatores que influenciam medidas
podem ser planejados. Um bom plano para o processo de coleta de dados permite uma anlise
imediata e inferncias eficientes, enquanto nem mtodos sofisticados de anlise de dados salvam
muita informao de dados produzidos por um experimento pobremente planejado.
1.6 Conceito da Estatstica
A estatstica compreende, essencialmente, a arte e a cincia da coleta, anlise e
interpretao de dados, e a habilidade de derivar generalizaes lgicas relativas a fenmenos. A
estatstica tem sido conceituada de muitas maneiras. Um conceito apropriado para os presentes
propsitos o seguinte:

A Estatstica a cincia e a arte que trata do desenvolvimento e aplicaes de
mtodos de:
planejamento da coleta de dados,
resumo de dados,
anlise de dados e derivao de generalizaes lgicas (inferncias) a partir de
dados.

Estas quatro funes da estatstica correspondem, respectivamente, a:
Delineamento de experimentos, de levantamentos por amostragem e de estudos
observacionais,
Estatstica descritiva,
Anlise estatstica e inferncia estatstica.
1.7 A Interao da Estatstica com Outros Campos
O uso primitivo da estatstica na compilao estereotpica e apresentao passiva de dados
foi sucedido pelo moderno papel de prover ferramentas analticas para a eficiente coleta,
compreenso e interpretao de dados. Os conceitos e mtodos estatsticos permitem a extrao de
Estatstica Bsica


10
concluses vlidas sobre populaes, a partir de amostras. Em decorrncia de seu extenso objetivo,
a estatstica tem penetrado todos os ramos da investigao humana em que a substantivao de
asseres e a ramificao de informaes devem ser fundadas em evidncia baseada em dados.
Os poucos exemplos anteriores no tm a inteno de demarcar o mbito da aplicao da
estatstica. Eles so apresentados para ilustrar a diversidade de aplicaes da estatstica. O uso dos
mtodos estatsticos em vrias reas da cincia e da tecnologia tem produzido muitas reas
interativas, tais como bioestatstica, biometria, psicometria, estatstica de negcios, econometria e
demografia. Em muitas outras reas em que nomes compostos ainda no emergiram, tais como
cincia poltica, meteorologia, florestas e ecologia, a estatstica j desempenha um papel
proeminente.
Os conceitos bsicos e o mbito da metodologia estatstica so quase idnticos em todas
as diversas reas de suas aplicaes. Diferenas em nfase ocorrem porque certas tcnicas so mais
teis em uma rea do que em outra. Entretanto, em decorrncia de fortes similaridades
metodolgicas, exemplos extrados de uma ampla gama de aplicaes da estatstica so teis para
o desenvolvimento de uma compreenso bsica dos vrios mtodos estatsticos, de seus usos
potenciais e de suas vulnerabilidades para mau uso.
1.8 Mensurao e Escalas de Medida
Uma varivel pode compreender poucos, muitos ou infinitos valores. Em particular, uma
varivel com um nico valor, comum para todas as unidades de uma populao, denominada
constante. Naturalmente, uma constante uma varivel que no distingue as unidades da
populao. Variveis de poucos valores distinguem as unidades qualitativamente, segundo classes
ou categorias; por exemplo, sexo (macho e fmea), raa de um ovino (Corriedale, Romney Marsh e
Ideal) e cor dos olhos (claros e escuros). Por outro lado, variveis de muitos ou infinitos nveis
distinguem os indivduos quantitativamente; peso e altura, por exemplo.

Variveis cujos nveis distinguem ou classificam as unidades em classes ou
categorias so denominadas variveis qualitativas ou variveis categricas.
Variveis que distinguem as unidades quantitativamente so denominadas variveis
quantitativas.

A representao de uma varivel feita atravs de smbolos especficos, um para cada um
de seus nveis. Esses smbolos podem ser um conjunto de letras ou numerais, isto , smbolos que
representam nmeros. A representao numrica , em geral, a mais conveniente, mesmo para a
representao de variveis categricas; neste caso, entretanto, operaes aritmticas no tm
sentido.

1. Introduo


11
O processo de atribuio de smbolos especficos ou numerais aos indivduos de
uma populao segundo regras especficas denomina-se mensurao. A informao
registrada para cada varivel em cada indivduo um dado. O conjunto de dados
registrados para cada indivduo para as variveis consideradas constitui uma
observao.

Como em uma pesquisa pode-se ter interesse em uma ou mais caractersticas,
correspondentemente, devem ser consideradas uma ou mais variveis. Logo, a observao
referente a cada indivduo pode ser univariada ou multivariada, respectivamente.
Os nveis de mensurao que podem ser adotados so variados. Por exemplo, para
qualquer ovelha de um rebanho de ovinos, pode-se medir as seguintes caractersticas: a) sexo, b)
prolificidade, c) temperatura, e d) peso. aparente que as mensuraes dessas caractersticas
envolvem quatro diferentes nveis de mensurao: a) pode-se apenas distinguir os animais quanto
ao sexo; b) pode-se distinguir e ordenar os animais quanto prolificidade e dizer que um animal
mais prolfero do que o outro; c) pode-se distinguir e ordenar os animais quanto temperatura e
dizer que um animal tem uma temperatura que supera a de outro em tantos graus; d) pode-se
distinguir e ordenar os animais quanto ao peso, dizer que o peso de um animal supera em tantas
unidades o peso de outro animal e, ademais, que o peso de um animal tantas vezes o peso de
outro.
Esses quatro exemplos sugerem as quatro escalas de mensurao: escala nominal, escala
ordinal, escala de intervalo e escala de razo. Essas quatro escalas so definidas e discutidas a
seguir.
Escala nominal. Esta escala utilizada para a mensurao de uma caracterstica que
apenas categoriza os indivduos na populao. Para cada categoria atribudo um smbolo
especfico de modo que duas diferentes categorias sejam identificadas por distintos smbolos. Por
exemplo, o sexo classifica os indivduos em duas categorias - machos e fmeas, identificando-os
por smbolos, como as prprias palavras "macho" e "fmea", as iniciais M e F, ou dois nmeros 1 e
2.
A estrutura da escala nominal no distorcida por uma substituio um a um dos
smbolos. Assim, por exemplo, pode-se substituir M pelo nmero 1 e F pelo nmero 2, ou M por
10 e F por 100. Entretanto, operaes aritmticas no fazem sentido para a escala nominal. Dessa
forma, a mdia aritmtica uma medida sem sentido nesta escala.
Escala ordinal. Esta escala adotada para a mensurao de uma caracterstica que
classifica e ordena os indivduos na populao. Para cada categoria atribudo um smbolo distinto
de tal modo que a ordem dos numerais corresponde ordem das categorias. Assim, se so
atribudas letras s categorias, elas esto em ordem alfabtica; se so atribudas palavras s
categorias, a ordem especificada pelo significado das palavras. Por exemplo, as cultivares de uma
espcie vegetal cultivada podem ser classificadas quanto resistncia uma infeco como de
resistncia baixa, mdia e alta. Se se decide ordenar estas categorias de baixa a alta, ento pode-se
assinalar os nmeros 1 = baixa, 2 = mdia e 3 = alta, ou as letras X = baixa, Y = mdia e Z = alta,
Estatstica Bsica


12
ou chamar as categorias de "baixa", "mdia" e "alta". Alternativamente, pode-se ordenar as
categorias de alta a baixa e atribuir os nmeros: 1 = alta, 2 = mdia e 3 = baixa. A representao
das categorias pode ser feita por qualquer conjunto de smbolos que exprima a idia de ordem.
A estrutura da escala ordinal no distorcida por uma substituio de smbolos um a um
que preserve a ordem. Assim, a transformao 1 2, 2 3 e 3 qualquer nmero maior que 3
permitida, enquanto a substituio 1 2, 2 3 e 3 1 no permitida. Operaes aritmticas
tambm no fazem sentido para a escala ordinal.
Escala de intervalo, ou escala intervalar. utilizada para a mensurao de uma
caracterstica que classifica e ordena os indivduos e, tambm, quantifica a comparao entre as
categorias. A escala de intervalo estabelece uma unidade de mensurao e um ponto zero
arbitrrio, o que permite determinar quanto uma categoria mais do outra. Por exemplo, a
temperatura de um indivduo em graus Celsius (C) mensurada em uma escala de intervalo, em
que 0 graus C a origem e 1 grau C a unidade de mensurao. Assim, um indivduo com uma
temperatura de 39,5 graus C tem uma temperatura de 2,4 graus C acima do normal (37,1 graus C).
A estrutura da escala de intervalo no distorcida por transformaes lineares da forma x' = ax+b,
a>0. O efeito desta transformao o deslocamento da origem b unidades e a multiplicao da
unidade de medida por a. Por exemplo, a transformao x' = 1,8x + 32 transforma a escala
Celsius na escala Farenheit.
Para esta escala operaes aritmticas tm sentido. Assim, por exemplo, tem significado
dizer que a temperatura mdia anual em uma localidade 19,5 graus C.
Escala de razo ou escala racional. Esta escala tem as mesmas caractersticas da escala
de razo e, adicionalmente, estabelece um ponto de zero absoluto. Portanto, ela permite determinar
quantas vezes um indivduo supera o outro quanto caracterstica em considerao. Por exemplo,
o peso de um indivduo em quilogramas uma escala de razo em que 0 kg um ponto zero fixo e
1 kg a unidade de medida. Assim, um indivduo de 110 kg tem o dobro do peso de um indivduo
de 55 kg.
A estrutura da escala de razo no distorcida por uma transformao da forma x'=cx,
c>0. Um exemplo dessa transformao x'=1.000x que transforma quilogramas em gramas.
Observe-se que o nmero de alternativas de uma mesma caracterstica pode variar
segundo o nvel de distino dos indivduos que se deseja ou que vivel considerar.
Conseqentemente, muito freqentemente, distintas variveis alternativas podem representar uma
mesma caracterstica. A cada uma dessas variveis corresponde uma distinta escala de mensurao.
Assim, por exemplo, a incidncia de uma doena em uma espcie cultivada pode ser mensurada
em diversas escalas alternativas, dependendo da preciso com que o pesquisador deseja perceber a
infeco e dos instrumentos de mensurao disponveis. Ele pode registrar, simplesmente, a
presena ou ausncia da infeco - uma categorizao rude, envolvendo um baixo nvel de
percepo. Ele pode escolher um nvel mais elevado de percepo, pela utilizao de um nmero
mais elevado de categorias e ordenao das incidncias de infeco segundo o grau de intensidade,
dentro dos extremos correspondentes a ausncia de infeco e o grau mais elevado de infeco. Se
a doena apresenta um sintoma de infeco aparente nas folhas, ele pode expressar a infeco pelo
1. Introduo


13
nmero de folhas infectadas - um nvel de percepo mais elevado que a ordem. Um nvel de
percepo ainda mais elevado obtido exprimindo a intensidade de infeco atravs de um
nmero de um intervalo de nmeros reais; neste caso, a varivel pode assumir qualquer valor real
do intervalo. Um diferente nvel de percepo utilizado em cada uma destas quatro situaes, que
diferem quanto ao grau em que a varivel quantificada em relao s escalas de medida.
As variveis tambm podem ser classificadas em discretas e contnuas.

Uma varivel discreta tem um nmero finito ou infinito contvel de nveis,
enquanto uma varivel contnua compreende um conjunto de nveis correspondente
aos nmeros reais de um intervalo.

As variveis de escalas nominal e ordinal so necessariamente discretas, enquanto
variveis de escalas de intervalo e de razo podem ser discretas ou contnuas. Por exemplo, a
temperatura (em graus Celsius ou em graus Farenheit) uma varivel contnua em uma escala de
intervalo, enquanto que o nmero de frutos em uma planta uma varivel discreta em uma escala
de razo.
Uma varivel de intervalo ou de razo intrinsecamente discreta quando seus valores
constituem um conjunto numrico finito ou infinito contvel; nmero de leites em uma ninhada,
nmero de frutos em uma rvore, por exemplo. O nvel de percepo da caracterstica (preciso da
medida) , ento, implicitamente determinado. Por outro lado, conveniente observar que,
embora, conceitualmente, variveis contnuas (peso, altura e comprimento, por exemplo) possam
assumir qualquer valor de um determinado intervalo de nmeros reais, na prtica seus valores
restringem-se a nmeros com poucas casas decimais (nmeros inteiros, em alguns casos),
limitando-se a um subconjunto discreto de tal intervalo. Esse subconjunto depende da preciso
desejada e da preciso do processo e dos instrumentos de mensurao utilizados.
A escolha da escala de medida implica no nvel de percepo utilizado na mensurao da
caracterstica e, portanto, na quantidade da informao fornecida. Conseqncias no menos
importantes decorrem para a escolha das tcnicas de inferncia estatstica, j que as propriedades
das distribuies de probabilidade so distintas. Assim, para variveis em escala nominal, so
aplicveis apenas mtodos estatsticos para categorias no ordenadas, como os testes qui-quadrado
para distribuio multinomial e para associao, e inferncias referentes distribuio binomial.
Para variveis em escala ordinal so apropriados mtodos baseados em ordem. Estes mtodos
compreendem a rea geral conhecida como estatstica no paramtrica. As tcnicas estatsticas
apropriadas para as escalas de intervalo e de razo so comuns e compreendem a grande maioria
da metodologia estatstica disponvel.
1.9 Exerccios
1. D exemplos de cinco populaes em sua rea.
Estatstica Bsica


14
2. D um exemplo de populao real e um exemplo de populao hipottica, cada uma
com uma varivel discreta e uma varivel contnua de interesse.
3. Para uma populao de sua escolha descreva um parmetro e indique como ele pode
ser estimado.
4. Exemplifique uma situao em que um censo apropriado.
5. Os seguintes dados provm de seis animais de um rebanho de ovinos de uma fazenda:

Animal
Data de
nascimento
Sexo
Idade de
desmame
(dias)
Peso ao
desmame
(kg)
PVS FINC OPP Cor Carter
1 28/08/82 M 128 18,5 2,8 5 60 5 4
2 12/09/82 M 143 17,9 2,5 4 50 4 5
3 25/09/82 F 156 12,1 3,6 3 40 3 5
4 05/09/82 M 136 15,8 2,4 5 50 3 4
5 02/10/82 F 163 12,1 1,8 6 80 2 3
6 22/08/82 F 122 23,3 3,5 3 70 4 4

PVS: Peso de velo sujo.
FINC:
Finura comercial da l: 1-Merina; 2-Amerinada; 3-Prima A; 4-Prima B;
5-Cruza 1; 6-Cruza 2; 7-Cruza 3; 8-Cruza 4.
OPP: Nmero de ondulaes por polegada da fibra da l.
Cor: Cor da l: 1-Amarela;...; 5-Branca uniforme.
Carter
:
Pontuao de um conjunto de caractersticas do velo: 1-Pior carter;...;
5-Melhor carter.

A que tipos de variveis e escalas de medidas correspondem estes dados?
6. Que escala de medida comumente utilizada na mensurao de cada uma das
seguintes caractersticas:
a) Longevidade de um indivduo.
b) Temperatura ambiente.
c) Presso baromtrica.
d) Presena do carter mocho em um animal de um rebanho.
e) Volume preenchido de uma lata de conserva.
f) Ano da data de nascimento de um indivduo.
1. Introduo


15
g) Nmero de sementes que germinam em um lote de 100 sementes postas a
germinar.
h) Colocao de um animal em um concurso de produo de leite.
7. Apresente trs exemplos de cada uma das seguintes variveis: qualitativa, quantitativa,
discreta, contnua, nominal e ordinal.
8. Decida se cada uma das seguintes sentenas verdadeira ou falsa, indicando com as
letras V ou F entre parnteses, respectivamente. Se a sentena for falsa, explique
porque.
( ) No processo de pesquisa de um problema, a primeira cousa que um cientista faz
estabelecer o problema.
( ) Um cientista completa uma pesquisa e, ento, formula uma hiptese com base
nos resultados da pesquisa.
( ) Decises cientficas no podem ser feitas na base de uma nica observao.
( ) Em uma pesquisa, o cientista deve, sempre, coletar uma quantidade de dados to
grande quanto humanamente possvel.
( ) Mesmo um especialista em uma rea de pesquisa pode no ser capaz de obter
uma amostra que seja verdadeiramente representativa; ento, melhor escolher
uma amostra aleatria.
( ) Em geral, um levantamento to bom quanto um experimento.
( ) Uma fraqueza de muitos levantamentos que h pouco controle de variveis
explanatrias.
( ) O objetivo da estatstica fazer inferncias sobre uma populao baseadas na
informao de uma amostra da populao.
( ) A utilizao de uma amostra no necessria quando se usam tcnicas
estatsticas.
( ) Uma amostra uma coleo de indivduos de uma populao selecionados por
um processo especfico.
( ) Toda populao na natureza finita.
( ) Censo uma enumerao parcial de uma populao.
( ) Parmetros so quantidades determinadas a partir de uma amostra.
( ) A estatstica prov estimativas de parmetros.
( ) Parmetros so conhecidos quando se usa uma amostra em lugar da enumerao
completa de uma populao.
( ) Uma tcnica de amostragem um mtodo de extrair uma amostra de uma
populao.
Estatstica Bsica


16
( ) Em uma populao pode haver vrias variveis de interesse para o pesquisador.
( ) Uma populao pode ter vrias caractersticas de interesse para o pesquisador.
( ) Se o pesquisador esfora-se suficientemente, h sempre um meio de encontrar
valores da varivel de interesse para cada membro da populao.
( ) Quando se escolhem as categorias para uma escala nominal, a nica condio
que exista uma categoria para cada observao
( ) Um nmero expresso em uma escala ordinal indica a posio de uma quantidade
em um ordenamento.
( ) Tem sentido a aplicao de operaes aritmticas com nmeros de uma escala
nominal.
( ) Dados de uma escala numrica podem ser facilmente transformados para uma
escala nominal.
( ) A escala ordinal algumas vezes usada, mesmo que informao numrica mais
precisa seja disponvel.
( ) Dados de uma escala ordinal podem ser facilmente transformados para uma
escala numrica.
( ) Presso baromtrica usualmente registrada em escala ordinal.
( ) A escala de razo diferencia e ordena objetos de acordo com uma unidade padro
e com referncia a um ponto zero absoluto.
( ) Operaes aritmticas podem ser efetuadas sobre nmeros de escalas nominal e
de intervalo, mas no podem ser aplicadas a nmeros de escalas de razo e
ordinal.
( ) Medidas de uma varivel contnua no podem ser representadas por fraes
decimais.
( ) Os valores de variveis contnuas so sempre nmeros reais.
( ) Nmeros inteiros podem ser algumas vezes usados para representar variveis
discretas.
( ) Renda anual arredondada para cruzados registrada em uma escala numrica
discreta.
( ) Idade realmente uma varivel contnua, mas registrada usando uma escala
numrica discreta.
( ) Se uma populao de tamanho infinito, a varivel de interesse contnua.
( ) Variveis contnuas podem, teoricamente, ser medidas to precisamente quanto
desejado, mas elas so usualmente arredondadas para uma unidade conveniente.

2 ESTATSTICA DESCRITIVA
Contedo
2.1 Fontes de Dados Estatsticos............................................................................................17
2.2 Descrio Sumria de Dados - Introduo.......................................................................18
2.3 Descrio Sumria de Dados por Tabelas e Grficos ......................................................19
2.3.1 Pequenos conjuntos de dados....................................................................................19
2.3.2 Grandes conjuntos de dados......................................................................................20
2.3.2.1 Distribuio de freqncias ...............................................................................20
2.3.2.2 Representao grfica de uma distribuio de freqncias...............................22
2.4 Representao Simblica de Conjuntos de Dados e da Operao de Adio..................24
2.5 Medidas de Posio e de Disperso .................................................................................25
2.5.1 Medidas de centro.....................................................................................................25
Propriedades da mdia aritmtica:............................................................................25
Mdia de uma distribuio de freqncias ...............................................................26
2.5.2 Medidas de disperso................................................................................................26
Varincia de uma distribuio de freqncias..........................................................28
2.6 Exerccios.........................................................................................................................29

2.1 Fontes de Dados Estatsticos
Os dados provenientes de qualquer fonte so usualmente designados dados estatsticos.
Eles so nmeros que correspondem a valores de variveis resultantes de um processo de
mensurao de caractersticas de indivduos de uma populao ou amostra. Um conjunto de dados
estatsticos pode compreender poucos ou centenas ou mesmo milhares de dados, cada um com um
ou muitos algarismos.
De modo geral, os dados estatsticos tm duas origens: pesquisa e registros histricos.
Dados de pesquisa so gerados para algum propsito especfico, atravs de algum plano
preestabelecido. As diversas fontes de dados estatsticos so caracterizadas a seguir:
Censo. a enumerao de todos os indivduos de uma populao com referncia a uma
ou mais caractersticas.
Levantamento por amostragem. a enumerao parcial de uma populao, isto , a
enumerao de uma parte (amostra) da populao com referncia a uma ou mais caractersticas.
Os indivduos a incluir na amostra so escolhidos por um procedimento especfico que, em geral,
envolve casualizao, e a pesquisa conduzida segundo um plano previamente estabelecido.
Estatstica Bsica 18
Experimento. Pesquisa em que condies alternativas so impostas com o propsito de
avaliar, comparativamente, seus efeitos. A pesquisa conduzida segundo um plano previamente
estabelecido.
Estudo observacional. Estudo em que a escolha dos indivduos da populao para
considerao limitada. Os indivduos so includos no estudo segundo as circunstncias. Este
mtodo de pesquisa usual em algumas reas, tal como em medicina, onde o pesquisador utiliza
os pacientes que lhe recorrem.
Dados histricos. Dados disponveis, coletados e mantidos sem propsito especfico de
uso. So disponveis em agncias coletoras de dados (IBGE, por exemplo), em anurios, etc.
Os dados tambm so usualmente classificados, quanto sua origem, em primrios e
secundrios.

Dados primrios so aqueles cujo presente uso corresponde a uma etapa da
pesquisa que lhes gerou, ou seja, o presente uso foi especificado por um plano de
pesquisa; em particular, os procedimentos de anlise estatstica para as inferncias a
serem derivadas dos dados foram previstos no plano original da pesquisa. Dados
secundrios so dados disponveis de pesquisas anteriores ou em registros histricos,
cujo presente uso no foi previsto no plano da pesquisa que os originou.
2.2 Descrio Sumria de Dados - Introduo
Um conjunto de dados e seu significado so as peas bsicas de informao que a
natureza fornece ao pesquisador. Entretanto, a mente no pode alcanar, prontamente, o contedo
global da informao registrada em dados de elevada ordem de complexidade. Diante de uma lista
de 500 medidas, por exemplo, o pesquisador incapaz de formar uma imagem mental das
informaes mais relevantes fornecidas pelos dados, isto , o valor em torno do qual os dados
tendem a se aglomerar, a forma de aglomerao e a extenso da variabilidade. Um resumo da
informao relevante fornecida pelos dados de grande utilidade para a compreenso de um
conjunto de dados e evitar o efeito catico da apresentao de uma massa grande de dados.
A Estatstica Descritiva trata do resumo e da apresentao dos aspectos importantes de
um conjunto de dados. Ela inclui a condensao de dados em forma de tabelas, sua representao
grfica e a determinao de indicadores numricos de centro e de variabilidade. Esses mtodos
podem ser aplicados em situaes em que o conjunto de dados enumera completamente a
populao (caso de um censo) ou em que o conjunto de dados obtido a partir de uma amostra,
isto , uma frao da populao. Nesta ltima situao, uma descrio sumaria seguida de um
exame mais profundo e ulterior anlise dos dados, de modo que inferncias sobre a populao
possam ser feitas.
O tipo de representao sumria para um conjunto particular de dados depende do volume
e complexidade dos dados e do propsito a que ela se destina. Em linhas gerais, ela pode ser feita
em dois nveis: Um resumo parcial que permite o exame de caractersticas importantes da forma
global da distribuio dos dados, incluindo simetria e desvios da simetria e identificao de
observaes no usuais, que se afastam da massa maior dos dados; e um resumo mais drstico
atravs de poucas medidas, designadas estatsticas para indicao do centro do conjunto de dados e
da quantidade de variao que eles apresentam.
2. Estatstica Descritiva
19
Os procedimentos para descrio sumria de dados servem aos seguintes propsitos
bsicos, luz dos quais cada conjunto de dados deve ser examinado:
a) Resumo e descrio da configurao global dos dados atravs de:
Apresentao de tabelas e grficos;
Exame da forma global dos dados representados graficamente com referncia a
caractersticas importantes, incluindo simetria ou desvios da simetria;
Inspeo dos dados representados graficamente com relao a observaes no
usuais que possam se situar afastadas da massa maior dos dados.
b) Determinao de medidas numricas para:
Um valor tpico ou representativo que indica o centro do conjunto de dados;
A quantidade de disperso ou variao presente nos dados.
Tratar-se-, aqui, apenas da descrio de dados univariados.
2.3 Descrio Sumria de Dados por Tabelas e Grficos
2.3.1 Pequenos conjuntos de dados
Para conjuntos de dados de relativamente poucas observaes (menos que 20 ou 25), uma
descrio sumria parcial no tem sentido. Uma representao grfica do conjunto completo dos
dados pode ser feita atravs de um diagrama de pontos.

O diagrama de pontos a representao do conjunto de dados sobre um eixo, com
uma escala apropriada, de modo que o intervalo das observaes seja abrangido pela
figura.

Exemplo 2.1. Nmero de frutos em cada um de 18 pessegueiros:

117 95 122 88 126 112
111 105 98 106 114 93
99 102 106 101 102 125

A menor e a maior observao desse conjunto de dados so, respectivamente, 88 e 126.
Logo, o intervalo dos dados [88,126]. Desenha-se, ento, o segmento de um eixo que abranja o
intervalo [88,126]; por exemplo, (80,130). Sobre esse segmento, marca-se o ponto correspondente
a cada uma das 18 observaes:



Esse diagrama de pontos revela uma distribuio de pontos razoavelmente uniforme, com centro
entre 100 e 110.
Estatstica Bsica 20
2.3.2 Grandes conjuntos de dados
Para um conjunto de dados numeroso conveniente um resumo parcial que mantenha a
informao relevante referente distribuio do conjunto completo dos dados. Um tal resumo
parcial provido por uma distribuio de freqncias.

Uma distribuio de freqncias um nmero convenientemente pequeno de
valores correspondentes s freqncias relativas das observaes referentes a
subintervalos adequadamente escolhidos do intervalo que compreende o conjunto dos
dados, ou aos prprios valores distintos dos dados.
2.3.2.1 Distribuio de freqncias
No caso de varivel numrica contnua ou varivel numrica discreta com nmero
elevado de nveis, uma distribuio de freqncias pode ser construda como segue:
a) Identifica-se o menor (m) e o maior (M) valor no conjunto de dados. Determina-se a
amplitude total dos dados: A = M - m.
b) Escolhe-se um nmero de subintervalos de igual amplitude que cubram o intervalo dos
dados (m, M) sem superposio. Esses subintervalos so chamados intervalos de
classe e seus extremos so as fronteiras de classe.
O nmero de intervalos de classe deve ser convenientemente escolhido para a obteno
de um resumo adequado do conjunto de dados atravs da distribuio de freqncias. Usualmente,
um nmero entre 5 e 15, dependendo do nmero de observaes. Uma regra prtica determinar
o nmero de intervalos como:
c
n n = ,
onde n o nmero de dados.
c) Determina-se a amplitude de cada classe, dada por:
c
A
a =
n
,
e se constri os intervalos de classe, como segue:
[m, m+a), [m+a, m+2a),...,[m+(n
c
-1)a, M].
d) Conta-se o nmero de observaes no conjunto de dados pertencentes a cada intervalo
de classe, designado n
i
para a i-sima classe. Tal nmero a freqncia absoluta da
classe.
e) Determina-se a freqncia relativa de cada classe, dividindo a freqncia absoluta da
classe pelo nmero total de observaes no conjunto de dados; para a classe i:
i
i
n
f
n
= .

Exemplo 2.2. Dados de medidas de concentrao de espermatozides em smen de uma
coleta de cada um de 45 touros, em unidades de 10 na potncia 8 espermatozides por ml:

2. Estatstica Descritiva
21
13,8 12,3 9,7 8,6 10,2 12,8 14,1 12,6 12,7
9,0 14,2 13,3 14,8 14,2 13,9 11,0 9,7 14,3
9,5 12,3 11,3 13,9 15,1 11,0 9,6 13,2 12,0
11,8 7,5 12,5 12,1 11,7 10,5 12,2 11,0 12,2
14,2 10,4 15,9 12,0 13,8 9,3 12,9 12,4 10,4

Para construir uma distribuio de freqncias para esses dados, procede-se como segue:
a) m = 7,5
M = 15,9
A = M-m
= 15,9-7,5 = 8,4;
b)
c
n n =
45 6, 7 = = 7;
c)
c
A
a =
n


8, 4
1, 2
7
= = .
conveniente determinar as freqncias e apresent-las atravs de uma tabela de
freqncias (Tabela 2.1).

Tabela 2.1. Distribuio de freqncias relativas para os dados do Exemplo 2.2

N da classe
(i)
Intervalo de
classe
Freq.
absoluta
n
i

Freq. relativa
f
i

1 7,5 | 8,7 2 1/45 = 0,044
2 8,7 | 9,9 6 6/45 = 0,133
3 9,9 | 11,1 7 7/45 = 0,155
4 11,1 | 12,3 8 8/45 = 0,179
5 12,3 | 13,5 10 10/45 = 0,222
6 13,5 | 14,7 9 9/45 = 0,200
7 14,7 || 15,9 3 3/45 = 0,067
Soma 45 1

Se os dados correspondem varivel numrica discreta com pequeno nmero de nveis, o
que comum com variveis nominais e ordinais e pode ocorrer mesmo com variveis de intervalo
e de razo discretas (como, por exemplo, nmero de leites em uma ninhada), as classes so os
prprios valores distintos dos dados. Ento, uma distribuio de freqncias construda, mais
simplesmente, pela determinao das freqncias para esses distintos valores dos dados.
Estatstica Bsica 22

Exemplo 2.3. Dados de nmeros de ovos postos por 60 galinhas em um perodo de 2
semanas:

3 7 8 9 7 9 4 8 10 8 10 10
10 7 11 7 9 5 11 9 9 9 8 8
5 12 10 8 6 8 11 9 9 7 8 4
9 10 9 6 6 9 8 11 8 9 9 9
9 8 10 10 7 9 8 12 7 9 9 9

Tabela 2.2. Distribuio de freqncias relativas para os dados do Exemplo 2.3.

Nmero da
classe (i)
Classe
Freqncia
absoluta (n
i
)
Freqncia
relativa (f
i
)
1 3 1 1/60=0,0167
2 4 2 2/60=0,0333
3 5 2 2/60=0,0333
4 6 3 3/60=0,0500
5 7 7 7/60=0,1167
6 8 12 12/60=0,2000
7 9 19 19/60=0,3167
8 10 8 8/60=0,1333
9 11 4 4/60=0,0667
10 12 2 2/60=0,0333
Soma 60 1

2.3.2.2 Representao grfica de uma distribuio de freqncias
Aps o sumrio de um conjunto de dados na forma de uma distribuio de freqncias,
esta pode ser representada graficamente. No caso de varivel numrica contnua ou varivel
numrica discreta com nmero elevado de nveis, a distribuio de freqncias representada,
graficamente, atravs de um histograma, que d uma idia da forma da distribuio.

Um histograma de freqncias a representao de uma distribuio de
freqncias atravs de um grfico de barras com os intervalos de classe no eixo
horizontal e as freqncias (relativas ou absolutas) no eixo vertical.

Para a construo de um histograma de freqncias relativas marca-se os intervalos de
classe no eixo horizontal de um grfico. Em cada intervalo de classe, desenha-se um retngulo
com base no intervalo e altura igual freqncia relativa no intervalo. Para o conjunto de dados do
Exemplo 2.2, o histograma de freqncias relativas apresentado na Figura 2.1.

2. Estatstica Descritiva
23

Figura 2.1. Histograma das freqncias relativas dos dados do
Exemplo 2.2.

mais conveniente construir os retngulos com alturas iguais s freqncias relativas
divididas pela amplitude do intervalo de classe, em vez das freqncias relativas. Com essa
conveno, a altura do retngulo sobre o i-simo intervalo de classe f
i
/a em vez de f
i
. A rea de
cada retngulo representa, ento, a proporo das observaes que ocorrem no intervalo em que o
retngulo tem a sua base, o que torna comparveis histogramas construdos para diversos
conjuntos de dados, com intervalos de classe de diferentes amplitudes. A nica alterao no
grfico a diviso da escala do eixo das ordenadas pela amplitude a.
Se os dados correspondem uma varivel numrica discreta com pequeno nmero de
nveis, uma distribuio de freqncias apresentada, graficamente, por um diagrama de linhas,
construdo como segue.

Um diagrama de linhas de freqncias a representao de uma distribuio de
freqncias atravs de um grfico de linhas com os valores dos dados no eixo
horizontal e as freqncias (relativas ou absolutas) no eixo vertical.

Os valores distintos dos dados so dispostos em um eixo horizontal. Desenham-se linhas
verticais a partir desses pontos, de alturas iguais s correspondentes freqncias relativas. Nesse
caso, linhas substituem retngulos para enfatizar que as freqncias no se espalham sobre
intervalos.
O diagrama de linhas para os dados do Exemplo 2.3 apresentado na Figura 2.2.

Estatstica Bsica 24


Figura 2.2. Diagrama de linhas das freqncias relativas dos dados do
Exemplo 2.3.
2.4 Representao Simblica de Conjuntos de Dados e da Operao de
Adio
Para apresentar as idias e as frmulas correspondentes s medidas de posio e de
disperso conveniente representar um conjunto de dados simbolicamente, para que a discusso
no fique restrita um conjunto especfico de dados.
usual representar uma varivel por uma das ltimas letras do alfabeto, em maisculo;
seja X. Um valor particular da varivel, ou seja, um dado, representado pela correspondente letra
minscula com um ndice para distingu-lo de outros dados de um mesmo conjunto de dados.
Ento, um conjunto de n dados representado, simbolicamente, por x
1
, x
2
,...,x
n
. Por exemplo, um
conjunto de dados constitudo pelas seguintes medidas referentes a pesos de 5 frangos ao abate:
1,51; 1,82; 1,44; 1,65 e 1,78 kg, representado, simbolicamente, por x
1
, x
2
, x
3
, x
4
e x
5
, onde x
1

=1,51; x
2
=1,82; x
3
=1,44; x
4
=1,65 e x
5
=1,78.
Operaes de adio de dados e de expresses que envolvem dados so efetuadas com
freqncia. Para evitar a apresentao detalhada e repetida desta operao, conveniente
represent-la, simbolicamente, atravs de uma notao apropriada. Assim, a soma dos dados x
1
,
x
2
,...,x
n
representada pela notao
n
i
i 1
x
=

, que lida como: "a soma de todos os x


i
com i de 1 a
n", ou seja,
n
i
i 1
x
=

= x
1
+ x
2
+...+ x
n
.
O smbolo denota o operador da soma, denominado somatrio. O smbolo que o segue x
i
denota
os dados (valores da varivel X) que so somados. As notaes abaixo e acima de especificam a
amplitude dos termos que so adicionados. Por exemplo,
n
i
i 1
x
=

= x
1
+ x
2
+ x
3
+ x
4
;
( )
n
i
i 1
x 2
=

= (x
1
-2) + (x
2
-2) + (x
3
-2).
2. Estatstica Descritiva
25
Se o conjunto de dados em considerao claro no contexto, a soma de todos os n dados
do conjunto pode ser indicada, mais simplesmente, pela notao
n
i
i 1
x
=

, com a omisso dos


extremos dos ndices de x abaixo e acima do smbolo do somatrio, por ficarem subentendidos
como 1 e n.
As seguintes trs propriedades da soma so particularmente importantes para as
aplicaes a serem consideradas adiante. Sejam a e b dois nmeros reais. Ento,
a)
n n
i i
i 1 i 1
a x a x
= =
=

;
b) ( )
n n
i i
i 1 i 1
a x nb a x b
= =
= + +

;
c) ( )
2 n n n 2 2
i i i
i 1 i 1 i 1
x 2a x na x a
= = =
= +

.
2.5 Medidas de Posio e de Disperso
Freqentemente, necessita-se de um sumrio mais drstico de um conjunto de dados que
o propiciado por uma distribuio de freqncias. Tal sumrio obtido atravs da determinao de
medidas que indicam o centro e a disperso da distribuio dos dados.
Existem muitas medidas de centro e de disperso. Tratar-se-, aqui, apenas das medidas
mais utilizadas - a mdia aritmtica e a varincia, e de medidas derivadas da varincia.
2.5.1 Medidas de centro
Uma medida utilizada para representar o centro de um conjunto de dados denominada
medida de posio ou medida de tendncia central. A medida de posio mais utilizada a
mdia aritmtica ou, simplesmente, mdia:

A mdia de um conjunto de n dados de uma amostra x
1
, x
2
,..., x
n
, designada por x ,
a soma desses dados dividida por n:
( )
1 2 n
1
x x x ... x
n
= + + +

n
i
i 1
1
x
n
=
=

.

A mdia dos dados da amostra do Exemplo 2.2 determinada como segue:
( )
1
x = 12,042 13,8+12,3+...+10,4
45
= .
Propriedades da mdia aritmtica:
A mdia tem as seguintes propriedades importantes, algumas das quais a distingue de
outras medidas de posio:
1) A mdia tem a mesma unidade de medida dos dados originais.
Estatstica Bsica 26
2) Um conjunto de dados tem apenas uma mdia.
3) O valor da mdia influenciado por valores extremos do conjunto de dados.
4) A mdia no aplicvel para dados correspondentes a valores de uma varivel
qualitativa (nominal ou ordinal).
5) A soma dos desvios das observaes em relao mdia nula:
( )
n
i
i 1
0 x x
=
=

.
6) A soma dos quadrados dos desvios das observaes em relao a um valor de
referncia mnima quando esse valor corresponde mdia:
( )
n
i
i 1
x c
=

mnima para c x = .
7) A mdia o centro de gravidade da figura correspondente aos dados dispostos sobre
um eixo com um peso distribudo uniformemente sobre os correspondentes pontos
sobre o eixo.
Mdia de uma distribuio de freqncias
Seja uma distribuio de freqncias com N intervalos de classe, e com freqncias
absoluta e relativa na i-sima classe respectivamente n
i
e f
i
. A mdia da distribuio de freqncias
dada por:
N
f i i
i 1
1
x n c
n
=
=



N
i i
i 1
f c
=
=

,
onde c
i
o centro (mdia dos extremos) do i-simo intervalo de classe ou a i-sima classe,
respectivamente nos casos de distribuio de freqncias de varivel contnua ou discreta com
nmero elevado de nveis e de distribuio de freqncias de varivel discreta com pequeno
nmero de nveis. No primeiro caso, essa mdia no coincide necessariamente com a mdia da
amostra, ou seja, com a mdia dos dados originais, pois esses dados so substitudos pelos pontos
mdios dos correspondentes intervalos de classe; no segundo caso, essa mdia coincide
exatamente com a mdia da amostra.
Para o Exemplo 2.2, a mdia da distribuio de freqncias (Tabela 2.1) obtida como
segue:
f
x 0,044 8,1 + 0,133 9,3 +...+ 0,067 15,3 = = 12,02,
valor diferente, mas bastante prximo, da mdia do conjunto de dados, x = 12,04. A mdia da
distribuio de freqncias da Tabela 2.2, para o Exemplo 2.3, :
f
x 0,0167 3 + 0,0333 4 +...+ 0,0333 12 = = 8,38,
que, se pode verificar, a mdia do conjunto de dados.
2.5.2 Medidas de disperso
A medida de disperso mais utilizada a varincia da amostra:

2. Estatstica Descritiva
27
A varincia da amostra, tambm denominada quadrado mdio, a mdia dos
quadrados dos desvios das observaes em relao mdia dos dados, designada por
s
2
:
( )
2 n 2
i
i 1
1
s x x
n 1
=
=


.

Simbolicamente, a varincia da amostra pode ser expressa por:
2
SQX
s
GL
= ,
onde GL = n-1 (nmero de observaes subtrado de uma unidade) o nmero de graus de
liberdade da amostra, e
( )
2 n
i
i 1
SQX x x
=
=


a soma de quadrados de X corrigida (para a mdia).
Uma expresso mais conveniente para o clculo desta soma de quadrados :
n 2
i
i 1
SQX x C
=
=


onde
n 2
i
i 1
x
=

a soma de quadrados no corrigida, e


( )
2
2 n
i
i 1
1
C nx
x
n
=
= =


designado termo de correo (para a mdia).
Para o conjunto de dados do Exemplo 2.2:
2
2 2 2
s
(13,8-12,042) +(12,3-12,042) +...+(10,4-12,042)
=



1
161,5298 = 3,6711
44
= .
Ou, utilizando a expresso de clculo:
n
i
i 1
x 541, 9
=
=

;
n 2 2 2 2
i
i 1
x 13,8 +12,3 +...+10,4 = 6.687,21
=
=


donde:
2
541, 9
C 6.525,68
45
= = ;
logo,
( )
2
1
s 3,6711 6.687,21-6.525,68
44
= = .
Note-se que, se todas as observaes so iguais, s
2
=0; e, quando as observaes no so
todas iguais, s
2
>0. Por outro lado, o valor da varincia da amostra cresce quando aumenta a
variabilidade das observaes.
Estatstica Bsica 28
Uma medida de disperso aparentemente natural fornecida pela soma dos desvios das
observaes em relao mdia. Entretanto, essa soma sempre nula, o que foi salientado como
uma das propriedades da mdia.
A varincia da amostra expressa em unidade de medida correspondente ao quadrado da
unidade de medida dos dados originais. Esse fato dificulta a interpretao da varincia como
medida de disperso. Uma medida mais interessante, expressa na mesma unidade de medida dos
dados originais, o desvio padro da amostra:

O desvio padro da amostra a raiz quadrada da varincia da amostra:
( )
2 n
i
i 1
1
s x x
n 1
=
=


.

Para o conjunto de dados do Exemplo 2.2:
s 3, 6711 1, 9160 = = .
O desvio padro depende da unidade de medida em que os dados so registrados. Esse
fato pode ser inconveniente quando desvios padres de diversos conjuntos de dados, com
diferentes unidades de medida, so comparados. Uma medida de disperso mais conveniente, livre
de unidade de medida, o coeficiente de variao (CV), que o desvio padro expresso como
percentagem da mdia:
s
CV 100
x
= .
Para o Exemplo 2.2:
1, 9160
CV 100 15, 91%
12, 042
= = .
Varincia de uma distribuio de freqncias
Seja uma distribuio de freqncias com N intervalos de classe e com freqncias
absoluta e relativa, na i-sima classe, respectivamente n
i
e f
i
. A varincia da distribuio de
freqncias dada por:
( )
2 N 2
f i i f
i 1
1
s n c x
n 1
=
=


,
onde
f
x a mdia, tambm determinada a partir da distribuio de freqncias, n o nmero de
dados originais e c
i
o centro do i-simo intervalo de classe ou a i-sima classe, respectivamente
para os casos de distribuio de freqncias de dados de varivel contnua ou discreta de nmero
elevado de nveis e de distribuio de freqncias de dados de varivel discreta de pequeno
nmero de nveis. No primeiro caso, o valor assim obtido no coincide, necessariamente, com a
varincia da amostra correspondente ao conjunto de dados original.
Para conjuntos de elevado nmero de dados, a varincia pode ser determinada pela
expresso:
2. Estatstica Descritiva
29
( )
2 N 2
f i f
i 1
1
s n c x
n
=
=


( )
2 N
i i f
i 1
f c x
=
=

.
2.6 Exerccios
1. A seguir, dada a tabela de freqncias das produes, em decagramas, de 229
plantas da variedade Richland:

Intervalo de classe c
i
n
i
f
i
0,5 | 10,5 12
10,5 | 20,5 25
20,5 | 30,5 73
30,5 | 40,5 62
40.5 | 50,5 41
50,5 | 60,5 12
60,5 | 70,5 4
Soma 229

c
i
: centro de classe
n
i
: freqncia absoluta
f
i
: freqncia relativa
a) Complete a tabela, preenchendo as colunas em branco.
b) Construa uma figura com o histograma e o polgono de freqncias, ambos para as
freqncias relativas.
2. Construa a tabela de freqncias, o histograma e o polgono de freqncias para cada
um dos conjuntos de observaes dados a seguir:
a) Ganhos de peso, em kg, de 40 bovinos de corte, no perodo de engorde:

49,5 58,7 46,6 62,5 49,5 59,1 56,1 53,4 49,8
46,4 49,7 50,4 55,9 55,5 56,0 47,1 50,6 47,3
57,0 53,2 58,5 54,0 48,9 48,7 53,4 53,7 54,5
55,1 53,3 53,5 50,3 49,7 47,2 49,7 50,9 45,8
64,6 52,7 50,3 57,8

b) Nmeros de laranjas danificadas em 65 caixas recebidas em um supermercado, de
uma mesma procedncia:

Estatstica Bsica 30
5 4 8 8 5 3 3 5 11 5 7 7
9 4 6 13 8 4 14 8 2 5 16 8
14 7 8 3 8 9 10 6 12 5 5 5
6 5 16 2 8 6 10 9 7 6 6 2
11 11 8 9 9 8 11 5 7 15 5 2
5 11 4 8 3

c) Perodo de engorda (em dias) de 25 leites, at atingirem o peso de abate:

105 114 121 117 115
147 119 106 111 142
109 113 163 151 121
114 123 116 109 118
126 115 111 137 106

d) Pesos (em gramas) de 35 ratos ao incio de um experimento:

403 387 416 429 406 421 412
369 394 428 406 389 400 468
424 414 418 399 411 407 391
437 402 426 411 392 407 416
398 416 410 409 419 396 413

3. As cinco observaes em um conjunto de dados so x
1
=4, x
2
=3, x
3
=5, x
4
=2 e x
5
=3.
Determine os valores numricos de:
a)
5
i
i 1
x
=

; b)
5
i 1
4
=

; c)
5
i 1
4x
=

; d) ( )
3
i 1
x 3
=

;
e)
5 2
i
i 1
x
=

; f)
4
i
i 2
x
=

; g) ( )
2 5
i
i 1
x 3
=

;
h)
5
i
i 1
1
x
5
=

; i)
( )
2
5 2 5
i
i i 1
i 1
1 1
x
x
4 5
=
=


.
4. Seja {x
1
, x
2
,...,x
n
} um conjunto de dados. Exprima, simbolicamente, usando o smbolo
de soma , o seguinte:
a) Soma de todos os dados do conjunto.
b) Soma dos k primeiros dados (k<n).
c) Soma dos quadrados dos dados.
d) Soma dos quadrados dos desvios dos dados em relao a 8.
5. Os dados que seguem so as medidas de 5 pinheiros de 6 anos expressas em metros:
1,54; 1,87; 1,44; 1,62 e 1,77. Determine os valores das seguintes estatsticas para
aquele conjunto de dados: mdia, varincia, desvio padro e coeficiente de variao,
indicando as respectivas unidades de medida.
2. Estatstica Descritiva
31
6. Os dados que seguem so as alturas, em cm, de cordeiros de sete meses que
receberam suplemento de sal mineral:
57; 59; 49; 62; 51; 50; 55; 48; 52; 42; 61; 57.
Para esse conjunto de dados, determine as seguintes estatsticas:
a) mdia aritmtica;
b) varincia (quadrado mdio);
c) desvio padro;
d) coeficiente de variao.
7. Para cada um dos conjuntos de dados da questo 2, determine as seguintes estatsticas:
a) mdia;
b) varincia (quadrado mdio);
c) desvio padro;
d) coeficiente de variao.
8. Escreva uma breve sentena (no a definio) referente a cada um dos seguintes
conceitos:
a) medida de posio;
b) varincia;
c) soma dos desvios da mdia;
d) amplitude dos dados.
9. Escreva em forma expandida:
a) ( )
2 6
i
i 1
x a
=

; b) ( )
n
i i
i 1
x y
=

; c) ( )
3 p
i
i 1
x b
=

;
d)
k u
u
u 1
x
=

; e) ( )
5 i
i i
i 1
x y
1
=

.
10. Demonstre que para qualquer conjunto de dados {x
1
,x
2
,..., x
n
}:
a) ( )
n
i
i 1
0 x x
=
=

;
b) ( )
2 n n 2
i i
i 1 i 1
x C x x
= =
=

,
( )
2
2 n
i
i 1
1
C n x
x
n
=
= =

.
11. Suponha que, em vez do metro, as medidas das alturas dos pinheiros do exerccio 5
houvessem sido expressas em centmetro. Quais seriam as alturas dos 5 pinheiros
nessa nova escala.
a) Determine as mesmas estatsticas indicadas naquele exerccio para os dados
expressos nessa nova escala.
b) Para cada uma das estatsticas, verifique a relao entre seus valores para os dados
nas duas escalas.
12. Para os dados do exerccio 5, se a=10, mostre que:
a) A mdia de aX igual a a vezes a mdia de X.
b) A mdia de a+X igual a a mais a mdia de X.
c) A varincia de aX igual a a vezes a varincia de X.
d) A varincia de a+X igual a varincia de X.
Estatstica Bsica 32
e) O desvio padro de aX igual a a vezes o desvio padro de X.
13. Decida se cada uma das seguintes sentenas verdadeira ou falsa, indicando com as
letras V ou F entre parnteses, respectivamente. Se a sentena for falsa, explique
porque.
( ) De uma tabela de freqncias pode-se, sempre, derivar o nmero de dados menor
que o limite superior de uma classe.
( ) Em uma tabela de freqncias, a soma das freqncias absolutas sempre igual a
um.
( ) Para qualquer conjunto de dados, a freqncia relativa em uma classe no pode
ser zero.
( ) Distribuies de freqncia so sempre simtricas.
( ) A soma das reas dos retngulos em um histograma de freqncias sempre
igual a um.
( ) apropriado calcular a mdia de um conjunto de dados registrados em escala
nominal.
( ) .A mdia da amostra sempre um valor da amostra.
( ) Para qualquer amostra, (x - mdia de x) = 0.
( ) Se (x-c)=0 para uma amostra, ento c a mdia da amostra.
( ) Se a varivel X expressa em metros, ento a mdia de X tambm expressa em
metros.
( ) Se uma varivel X expressa em metros, a unidade de medida do desvio padro
metros quadrados.
( ) Se para cada valor de X em uma amostra Y = X+10, ento: mdia de Y+10 =
mdia de X.
( ) Se para cada valor de X em uma amostra Y = aX, ento a mdia de Y igual a a
vezes a mdia de X e a varincia de Y a elevado ao quadrado vezes a varincia
de X.
( ) A mdia dos dados de um conjunto multiplicados por uma constante igual
mdia dos dados originais.
( ) Se todas as observaes de um conjunto de dados so divididas por uma
constante, ento sua mdia dividida pela mesma constante.
( ) Se uma constante subtrada de cada uma das observaes, a mdia dos dados
resultante igual mdia dos dados originais subtrada da constante.
( ) Se todas as observaes de um conjunto de dados so multiplicadas por uma
constante, ento a correspondente varincia multiplicada pela mesma
constante.
( ) O desvio padro de um conjunto de dados divididos por uma constante igual ao
desvio padro dos dados originais dividido pela mesma constante.
( ) Se uma constante subtrada de cada observao, o desvio padro das
observaes transformadas subtrado da mesma constante relativamente ao
desvio padro das observaes originais.
2. Estatstica Descritiva
33
( ) A soma de quadrados corrigida zero quando todas as observaes so iguais.
( ) Se dois conjuntos de dados A e B tm a mesma mdia, o desvio padro de A
20 e o de B 8, pode-se concluir que as observaes no conjunto de dados A
esto aglomeradas mais prximas da mdia do que as observaes de B.

34 Estatstica Bsica

3 PROBABILIDADE
Contedo
3.1 Experimento Aleatrio e Eventos ....................................................................................35
3.2 Conceito Clssico de Probabilidade.................................................................................38
3.3 Contagem de Pontos do Espao Bsico ...........................................................................41
Regra da multiplicao .............................................................................................41
Regra das permutaes .............................................................................................42
Regra das permutaes com repeties ....................................................................43
Regra dos arranjos ....................................................................................................44
Regra das combinaes ............................................................................................45
3.4 Conceito Emprico de Probabilidade ...............................................................................47
3.5 Conceito de Probabilidade em Espao Bsico Discreto...................................................49
3.6 Operaes de Eventos ......................................................................................................50
3.7 Probabilidade Condicional ...............................................................................................53
3.8 Independncia Estatstica .................................................................................................55
3.9 Conceito Geral de Probabilidade......................................................................................57
3.10 Modelos de Probabilidade ..............................................................................................58
3.11 Exerccios........................................................................................................................58

3.1 Experimento Aleatrio e Eventos
O conceito de probabilidade relevante para o estudo de fenmenos cujas realizaes no
podem ser previstas exatamente. Ele se aplica a "experimentos" cujos resultados em diversas
repeties so variveis e, portanto, incertos, apesar dos esforos em manter as condies fixas. O
termo "experimento" aqui no se refere estritamente a "experimento controlado", como o caso de
experimento de laboratrio, mas a qualquer atividade que resulte na coleta de dados referentes a
fenmenos aleatrios. Em tais experimentos, a variao dos resultados em realizaes sucessivas
inevitvel.

Estatstica Bsica 36
Um experimento aleatrio o processo de obter dados relevantes a um
fenmeno que satisfaz s seguintes condies:
i) o resultado de uma realizao de no pode ser predito com certeza;
ii) a coleo dos possveis resultados de conhecida antes de sua realizao;
iii) o experimento pode ser repetido sob, essencialmente, as mesmas condies.

Assim, esse conceito de experimento aleatrio no se restringe a experimentos de
laboratrio ou de campo, mas inclui qualquer atividade que implique na coleta de dados referentes
a fenmenos aleatrios, isto , fenmenos que exibem variao.
Para facilitar a compreenso dos conceitos importantes que seguem, considerar-se- os
seguintes exemplos de experimentos aleatrios:
a) pr uma vaca em cria;
b) efetuar o plantio de cinco sementes de trigo;
c) pr 100 sementes em uma cmara de germinao;
d) administrar um antibitico a sunos que sofrem de uma mesma infeco viral at que
um tenha uma reao adversa;
e) preparar vinho de uva de um vinhedo;
f) administrar um hormnio de crescimento a um bovino de corte para acelerar sua
preparao para o abate.
Cada realizao de um desses experimentos ter um resultado particular que se
diferenciar dos demais resultados possveis por um nmero de diferentes caractersticas. Em
geral, entretanto, tem-se interesse em apenas uma ou poucas caractersticas. Nos experimentos
utilizados para ilustrao, pode-se ter o interesse restrito s seguintes caractersticas:
a) sexo do terneiro;
b) grau de infeco das folhas pela ferrugem;
c) nmero de sementes que germinam;
d) nmero de animais a que se administra o antibitico;
e) concentrao de acar no mosto;
f) peso e ganho de peso doze semanas aps a administrao do hormnio.
A especificao da caracterstica ou das caractersticas de interesse deve fazer parte da
descrio do experimento. Assim, as descries completas dos experimentos que esto sendo
utilizados para ilustrao correspondem ao que segue:
a) pr uma vaca em cria e observar o sexo do terneiro;
b) efetuar o plantio de cinco sementes de trigo e observar o grau de infeco de ferrugem
nas folhas;
c) pr 100 sementes em uma cmara de germinao e observar o nmero de sementes
que germinam;
3. Probabilidade
37
d) administrar um antibitico a sunos que sofrem de uma mesma infeco viral at que
um animal tenha uma reao adversa e registrar o nmero de animais a que se administra o
antibitico;
e) preparar vinho de uva de um vinhedo e determinar a concentrao de acar no
mosto;
f) administrar um hormnio de crescimento a um bovino de corte para acelerar sua
preparao para o abate e registrar o peso e o ganho de peso doze semanas aps a administrao do
hormnio.

Espao bsico a coleo de todos os resultados elementares possveis do
experimento. Cada um dos resultados elementares possveis um evento simples, ou
evento elementar. O espao bsico denotado por S. Um evento simples um
elemento de S, designado por s.

Assim, o espao bsico um conjunto cujos elementos so os eventos simples do
correspondente experimento. Dessa forma, toda a conceituao e propriedades derivadas so
completamente anlogas conceituao e propriedades referentes a conjuntos.
Um evento simples do espao bsico S, correspondente a um experimento aleatrio,
indicado pela notao sS, que se l "s pertence a S". O espao bsico de um experimento
especificado pela listagem de todos os resultados possveis do experimento, com o uso de
smbolos convenientes para identificar os resultados, ou por uma sentena que caracteriza a
coleo de todos os resultados possveis. Assim, por exemplo, os espaos bsicos para os
experimentos que esto sendo utilizados para ilustrao podem ser especificados como segue:
a) S = {M, F}, onde M e F representam sexo masculino e sexo feminino,
respectivamente;
b) S = {SI, IFr, IM, IFo, IG}, onde SI, IFr, IM, IFo e IG representam ausncia de
infeco e os graus de infeco fraca, mdia, forte e grave, respectivamente.
c) S = {0, 1, 2,..., 100};
d) S = {C, SC, SSC, SSSC,...}, onde S designa sem reao adversa e C, com reao
adversa e a seqncia SSC, por exemplo, indica que o terceiro animal que recebe o antibitico o
primeiro com reao adversa;
e) Se a concentrao de acar no mosto medida como a proporo de acar em uma
unidade de volume do mosto, a medida de concentrao um nmero real do intervalo [0; 1].
Ento, o espao bsico para o experimento S = {t: 0 t 1}, isto , "o conjunto dos nmeros reais
t tal que t est compreendido entre 0 e 1, includos 0 e 1".
f) Nesse experimento, so consideradas duas caractersticas: peso e ganho de peso,
ambas expressas em uma escala numrica contnua. Designando peso e ganho de peso por x e y,
respectivamente, o espao bsico pode ser especificado por: S = {(x, y): x um nmero real no
negativo e y um nmero real}.
Esses exemplos salientam que a complexidade do espao bsico depende da natureza do
experimento. Os espaos bsicos dos experimentos a), b) e c) so conjuntos finitos; so exemplos
de espao bsico finito. O espao bsico do experimento d) no finito, mas seus elementos
podem ser enumerados, isto , contados; um exemplo de espao bsico infinito contvel. A
varivel que exprime a caracterstica considerada no experimento e) numrica contnua; o
Estatstica Bsica 38
correspondente espao bsico, que consiste dos nmeros reais do intervalo [0; 1], um exemplo de
espao bsico contnuo. O experimento f) ilustra espao bsico contnuo bidimensional, porque
considera duas caractersticas, ambas expressas por variveis de escalas numricas contnuas.

Um espao bsico cujos elementos constituem um conjunto finito ou infinito
contvel um espao bsico discreto. Se o espao bsico inclui todos os nmeros de
um intervalo da linha reta, ele chamado um espao bsico contnuo.

Cada vez que um experimento aleatrio realizado, pode ocorrer um e apenas um evento
simples ao qual corresponde um e apenas um elemento do espao bsico. Em geral, entretanto, h
interesse na ocorrncia de algum aspecto descritivo comum a vrios eventos simples. A
correspondente coleo de eventos simples constitui um evento composto. Assim, no exemplo b),
pode-se ter interesse nos eventos compostos correspondentes ocorrncia de plantas com
infeco, ou seja, no evento {IFr, IM, IFo, IG}, e ocorrncia de plantas com infeco com grau
abaixo do mdio, ou seja, no evento {SI, IFr}. Por estes exemplos, fica claro que um evento
composto ocorre quando qualquer um dos eventos elementares que o constitui ocorre.
Eventos simples e eventos compostos, designados, genericamente, eventos, so ambos
subconjuntos do espao bsico. As primeiras letras maisculas do alfabeto, A, B, C,..., so
comumente usadas para simbolizar eventos.
Para exemplificar mais amplamente a representao de eventos, recorre-se, a seguir, aos
experimentos que esto sendo utilizados como ilustrao:
a) evento "terneiro macho": {M};
b) evento "infeco acima da mdia": {IFo, IG};
c) evento "pelo menos noventa sementes germinam": {90,91,..., 100};
d) evento "no mximo trs animais recebem o antibitico": {C, SC,SSC};
e) evento "concentrao de acar entre 0,4 e 0,6": {t: 0,4 t 0,6};
f) evento "animal com peso acima de 400 k e com ganho de peso positivo": {(x, y):
x>400; y>0}.
3.2 Conceito Clssico de Probabilidade
Intuitivamente, a probabilidade de um evento uma medida da chance de sua ocorrncia
quando o correspondente experimento realizado. natural pensar que uma medida da chance de
ocorrncia de um evento seja provida pela proporo de vezes em que o evento esperado ocorrer
quando o experimento repetido sob, essencialmente, as mesmas condies. Assim, a
probabilidade depende da natureza do experimento e do espao bsico associado. Em algumas
situaes, a proporo de vezes que se espera cada um dos eventos simples ocorrer determinada
por derivao lgica, sem efetivamente realizar o experimento. Em outras situaes, necessrio
repetir o experimento um nmero elevado de vezes para obter informao sobre a proporo
esperada de ocorrncia dos eventos no espao bsico, atravs das correspondentes freqncias de
ocorrncias observadas. Nesse caso, as verdadeiras propores (probabilidades) so desconhecidas
e apenas aproximaes podem ser obtidas.
Esse fato derivou muita discusso do conceito de probabilidade no passado, que ainda
hoje se mantm polmico entre diversas escolas. O conceito mais primitivo de probabilidade o
3. Probabilidade
39
chamado conceito clssico. Quando uma simetria da estrutura do experimento assegura que todos
os eventos simples tm a mesma chance de ocorrer em uma realizao do experimento, o espao
bsico dito equiprovvel. Seja, por exemplo, o experimento "escolha aleatria de uma de 6
garrafas de uma caixa, identificadas pelos seis nmeros inteiros 1, 2, 3, 4, 5 e 6". "Escolha
aleatria" de um indivduo de um conjunto um processo de seleo que assegura igual chance de
extrao para todos os indivduos. Nessas circunstncias, sem realizar o experimento, pode-se,
logicamente, concluir que esperado que cada garrafa ocorra em 1/6 das vezes. Logo, pode-se
expressar a probabilidade de cada um dos eventos simples desse experimento por: P(s) = 1\6, sS,
que se l: "a probabilidade de s igual a 1\6 para todo elemento s de S".
Se A o evento "garrafa identificada por um nmero par", isto , A = {2,4,6}, como a
proporo de ocorrncias do evento A a soma das propores das ocorrncias de cada uma das
garrafas identificadas pelos nmeros 2, 4 e 6, deve-se ter:
3 1
P(A) = P(2) + P(4) + P(6) = =
6 2
.
Estrutura completamente anloga desse experimento a do experimento: "lanamento
no tendencioso de um dado no viciado e observao do nmero da face que resulta virada para
cima".
Essa derivao lgica de probabilidades para eventos de um espao equiprovvel
correspondente a um experimento particular generalizada como segue:

Conceito clssico de probabilidade: Se um espao bsico consiste de k eventos
simples, S = {s
1
,s
2
,...,s
k
}, equiprovveis, a probabilidade de um evento A que consiste
de m desses k eventos simples
m
P(A) =
k
.

Observe-se que k o nmero de elementos do espao bsico, isto , o nmero de distintos
resultados possveis do experimento, e m o nmero de eventos simples que implicam na
ocorrncia de A, isto , o nmero de resultados favorveis a A. Assim, pode-se dizer que:
Nmero de resultados favorveis a A
P(A) =
Nmero de resultados possveis
.

Diz-se que um espao bsico cujos eventos simples so equiprovveis tem um
modelo de probabilidade uniforme. Uma funo P( ) que atribui igual probabilidade
para todos os eventos simples do espao bsico S designada funo de
probabilidade uniforme.

Apesar de aparentemente bastante restritiva, a condio de equiprobabilidade do espao
bsico de grande importncia prtica, pois corresponde a experimentos em que feita a escolha
de membros de um conjunto de objetos ou indivduos por processo que atribui a cada um deles
igual chance de seleo e, ento, procedida mensurao de alguma caracterstica especfica. O
processo de seleo de indivduos de uma populao que atribui a cada indivduo a mesma
probabilidade de constituir a amostra denominado amostragem aleatria simples.
Estatstica Bsica 40
Conforme o prprio conceito indica, a probabilidade de um evento em um espao bsico
equiprovvel determinada pelas contagens do nmero de resultados possveis do experimento e
do nmero de resultados favorveis ao evento. A aplicao do conceito clssico de probabilidade
ser ilustrada, a seguir, atravs de exemplos simples. Regras gerais para a contagem de eventos
("anlise combinatria") e outros exemplos do clculo de probabilidades em espao bsico
equiprovvel sero dados adiante.

Exemplo 3.1. Experimento: Extrao aleatria de um saco de sementes de uma pilha com
2 sacos de sementes da variedade V
1
e 3 da variedade V
2
. Seja o seguinte evento: A: um saco de
sementes da variedade V
1
.
H 5 resultados possveis na seleo de um saco de uma pilha de 5 sacos. Dois desses 5
resultados so favorveis ao evento A - qualquer dos dois sacos da variedade V
1
que seja extrado
implica na ocorrncia de A. Logo, P(A) = 2/5.

Exemplo 3.2. Experimento: Extrao aleatria sucessiva de dois sacos de sementes da
pilha de 5 sacos considerada no Exemplo 3.1, com reposio do primeiro saco extrado antes da
extrao do segundo saco. Sejam os seguintes eventos: A: dois sacos da variedade V
1
; B: dois
sacos da variedade V
2
; C: um saco de cada variedade.
Na extrao do primeiro saco, qualquer um dos 5 sacos de sementes pode resultar; h,
portanto, 5 resultados possveis na primeira extrao. Como o segundo saco extrado reposto
antes da segunda extrao, h, novamente, 5 resultados possveis na segunda extrao. O nmero
de resultados possveis do experimento , portanto, 5x5=25.
Os resultados favorveis ao evento A so aqueles que correspondem a dois sacos da
variedade V
1
. Na primeira extrao, qualquer dos dois sacos da variedade V
1
favorvel ao evento
A se, novamente, um dos dois sacos da variedade V
1
for obtido na segunda extrao. Logo, o
nmero de resultados favorveis ao evento A 22=4. Portanto,
22 4
P(A) = = .
55 25

Pelo mesmo raciocnio, pode-se determinar a probabilidade do evento B:
33 9
P(B) = =
55 25
.
O evento C ocorre quando resulta um saco da variedade V
1
na primeira extrao e um
saco da variedade V
2
na segunda extrao, ou um saco V
2
na primeira extrao e um saco V
1
na
segunda. Logo,
2 3 3 2 12
P(C) =
5 5 25
+
=

.
Observe-se que
4 9 12
P(A) + P(B) + P(C) = + + = 1
25 25 25
.

Exemplo 3.3. Mesma situao do experimento do Exemplo 3.2, mas sem reposio do
saco que resulta da primeira extrao.
3. Probabilidade
41
Como na situao do Exemplo 3.2, h 5 resultados possveis na extrao do primeiro
saco. Entretanto, como o primeiro saco extrado no reposto, h 4 resultados possveis na
segunda extrao. Portanto, o nmero de resultados possveis do experimento , agora, 54 = 20.
A extrao de qualquer um dos dois sacos V
1
, seguida da extrao do restante saco da
variedade V
1
, favorvel ao evento A. Portanto, o nmero de resultados favorveis ao evento A
21. Logo,
21 2 1
P(A) = = =
54 20 10
.
Por raciocnio anlogo, obtm-se:
32 6 3
P(B) = = =
54 10 10
.
Um saco de cada uma das variedades ocorre quando se sucedem as extraes de 1 saco V
1

e 1 saco V
2
, ou 1 saco V
2
e 1 V
1
. Logo,
23+32 12 3
P(C) = = =
54 20 5
.
Observe-se que P(A)+P(B)+P(C) =
1
10
3
10
3
5
+ + = 1.
3.3 Contagem de Pontos do Espao Bsico
Modelos de probabilidade uniformes em espao bsico finito so teis quando o esquema
de amostragem governado por algum mecanismo que torna todos os eventos elementares
igualmente provveis. Nesse espao bsico, a probabilidade de um evento A dada pela razo:
n(A)
P(A) =
n(S)
,
onde n(A) o nmero de eventos simples no evento A. Assim, nessa situao, a probabilidade de
um evento reduz-se, essencialmente, s contagens do nmero de eventos simples que compe o
evento em considerao e do nmero de eventos simples no espao bsico. O conhecimento dos
eventos e a sua listagem no so, em geral, necessrios.
Nos exemplos simples anteriores, a contagem de eventos simples foi feita sem
dificuldade. Em situaes complicadas, entretanto, o processo de contagem pode se tornar difcil e
trabalhoso. Mtodos sistemticos convenientes de contagem ou enumerao so, portanto,
importantes para o clculo direto de probabilidades em espao bsico finito equiprovvel. As
regras bsicas de contagem so revisadas a seguir.
Regra da multiplicao
Se uma operao consiste de duas etapas a primeira das quais pode ser procedida de
n
1
modos distintos e para cada um desses modos a segunda etapa pode ser procedida
de n
2
modos distintos, ento a operao total pode ser efetuada em n
1
n
2
diferentes
modos.

Estatstica Bsica 42
Exemplo 3.4. Um agricultor tem disponveis duas cultivares de arroz (C
1
e C
2
) que
podem ser semeadas em trs pocas (E
1
, E
2
e E
3
). Quantas decises alternativas o pesquisador
pode tomar para o cultivo do arroz no que se refere cultivar e poca de semeadura?
H n
1
= 2 cultivares cada uma das quais pode ser semeada em n
2
= 3 pocas. O nmero de
diferentes decises , portanto, n
1
n
2
= 23 = 6.

Uma lista completa das decises (ou operaes) possveis pode ser obtida, de modo
sistemtico, por um diagrama de rvore, Figura 3.1. Esse diagrama mostra que h n
1
= 3 ramos
(possibilidades) referentes escolha de poca de semeadura e para cada um desses ramos h n
2
= 2
ramos (possibilidades) referentes escolha de cultivar. As 6 possveis decises so representadas
pelos 6 distintos caminhos ao longo dos ramos da rvore.

Figura 3.1. Diagrama de rvore que representa o processo de deciso
para o cultivo de arroz quando so disponveis duas
cultivares que podem ser semeadas em trs pocas.

A regra da multiplicao pode ser imediatamente estendida situao de operao com
mais de duas partes: Se uma operao consiste de k etapas, a primeira das quais pode ser procedida
de n
1
modos distintos, para cada um dos quais h n
2
modos distintos da segunda etapa, para cada
modo das duas primeiras etapas h n
3
modos da terceira etapa, e assim por diante, ento, a
operao total pode ser conduzida em n
1
n
2
...n
k
modos.
Uma derivao da regra da multiplicao a regra das permutaes, que segue.
Regra das permutaes
O nmero de diferentes permutaes que podem ser formadas com n elementos ou
objetos distintos, denotado por P
n
e designado "permutaes de n elementos", o
nmero de diferentes ordenaes desses elementos, que determinado pela expresso:
P = n(n-1)(n-2)...21,
ou, equivalentemente,
P
n
= 12...n.

Esta expresso tambm denotada por n! e designada fatorial de n.
3. Probabilidade
43
Por exemplo, as permutaes de trs objetos identificados pelas letras a, b e c so: abc,
acb, bac, bca, cab e cba. De modo geral, permutar n objetos equivale a coloc-los dentro de uma
caixa com n compartimentos, em alguma ordenao. O nmero de permutaes dos n objetos o
nmero de diferentes ordens de disposio dos n objetos.

1 2 ... n

Exemplo 3.5. Um experimento conduzido para a comparao de cinco cultivares de
feijo A, B, C, D e E quanto produo de gros. Ao fim do experimento, as mdias observadas
das cultivares so ordenadas. Quantas diferentes ordenaes das cultivares podem resultar?
Qualquer uma das cinco cultivares pode resultar como mais produtiva. Para cada uma
delas que resulte mais produtiva, h quatro cultivares restantes que podem resultar com a segunda
maior produo. Portanto, h 5x4=20 diferentes arranjos das 5 cultivares para os dois primeiros
lugares em produo. Para cada um desses 20 distintos resultados, h 3 cultivares restantes
qualquer uma das quais pode ter a terceira produo mais elevada; portanto, h 5x4x3 = 60
distintos arranjos das 5 cultivares para as 3 primeiras colocaes. Para cada um desses 60 arranjos,
h duas cultivares restantes qualquer uma das quais pode ter a penltima produo; logo, h
5x4x3x2 = 120 distintos arranjos para as 4 cultivares de maiores produes entre as 5. Como h
apenas uma cultivar restante, o nmero total de ordenaes ou permutaes das cultivares quanto
s grandezas de suas mdias 5! = 5x4x3x2x1 = 120.
Regra das permutaes com repeties
O nmero de diferentes ordenaes ou permutaes de n elementos classificados
em k categorias cada uma delas de elementos idnticos, com n
i
elementos na i-sima
categoria (n
1
+ n
2
+...+n
k
= n) :

n!
P =
n !n !... n !
1 2 k
.

Para verificar essa expresso, observe-se que das n! permutaes dos n elementos n
1
!
sero idnticas em decorrncia da identidade dos n
1
elementos da categoria 1. Assim, apenas n!/n
1
!
ordenaes podero diferir quanto aos elementos das demais categorias. Entretanto, n
2
! dessas
ordenaes sero idnticas, dada a identidade dos n
2
elementos da categoria 2, de modo que
apenas n!/n
1
!n
2
! ordenaes podero diferir quanto aos elementos das categorias 3,...,k.
Estendendo-se esse raciocnio, conclui-se que apenas n!/n
1
!n
2
!...n
k
! ordenaes dos n elementos
sero distintas.
Uma generalizao da regra das permutaes a regra dos arranjos.
Estatstica Bsica 44
Regra dos arranjos
O nmero de diferentes arranjos que podem ser formados com r elementos ou
objetos selecionados de um grupo de n elementos distintos (rn), denotado por A
n
r
e
denominado nmero de arranjos de r elementos tomados de n, o nmero de
ordenaes que podem ser formadas com r desses n elementos, que determinado pela
expresso:


Por exemplo, os arranjos de dois objetos tomados de trs objetos identificados pelas letras
a, b e c so: ab, ac, ba, bc, ca e cb. De modo geral, arranjar r de n objetos eqivale a colocar um
subconjunto de r dos n objetos dentro de uma caixa com r compartimentos, em alguma ordenao.
O nmero de arranjos de r dos n objetos o nmero de diferentes ordens de disposio de r dos n
objetos.

Exemplo 3.6. Suponha-se que trs antibiticos X, Y e Z devem ser testados atravs da
aplicao de cada um deles a um animal diferente e que os trs animais devem ser selecionados de
um conjunto de doze animais. Quantas diferentes assinalaes dos 3 antibiticos so possveis.
Considerem-se as assinalaes dos antibiticos X, Y e Z como trs partes de um
experimento. Qualquer um dos 12 animais disponveis pode ser escolhido para a aplicao do
antibitico X. Para qualquer escolha de um animal para X, h 11 animais restantes, qualquer um
dos quais pode ser escolhido para a assinalao do antibitico Y. Assim, quanto assinalao dos
antibiticos X e Y, o nmero de escolhas possveis, de acordo com a regra do produto, 1211 =
132. Por sua vez, aps qualquer uma destas 132 diferentes assinalaes dos antibiticos X e Y, h
10 animais restantes a um dos quais pode ser assinalado o antibitico Z. Logo, o nmero total das
possveis assinalaes dos trs antibiticos 121110 = 1.320.

Da observao das expresses das regras das permutaes e dos arranjos, pode-se derivar
a seguinte relao:
r
n
n!
A = n(n-1)(n-2)...(n-r+1) =
(n-r)!
ou
n
n-r
P
P
.
A regra dos arranjos trata da enumerao de todas as possveis ordenaes de r objetos
tomados de uma coleo de n objetos distintos. Em algumas situaes, h interesse apenas no
nmero de escolhas possveis de grupos de r objetos de um conjunto de n objetos, no importando
as ordenaes dos r objetos escolhidos. O nmero de "combinaes" de r de n objetos, sem
considerao para sua ordem de arranjamento, determinado pela regra que segue.
3. Probabilidade
45
Regra das combinaes
O nmero das colees possveis de r objetos escolhidos de um grupo de n objetos
distintos, denotado por C
n
r
e designado nmero de combinaes de r elementos
tomados de n, :

r
r
n
n
A n(n-1)(n-2)...(n-r+1)
C = =
r! r(r-1)(r-2)... 2.1
.

Essa expresso da regra das combinaes pode ser derivada pela aplicao da regra da
multiplicao a um processo de duas etapas, da seguinte forma: Os arranjos de r objetos tomados
de n podem ser obtidos pela seleo de r objetos de n, seguida das permutaes dos r objetos
selecionados. Segue-se, portanto, que:
A C r
n n
r r
= !; donde:
r
r
n
n
A
C =
r!
.
Propriedades das combinaes:
1) C
n
r
=
r
n
n!
C =
r!(n-r)!
;
2) C
n
1
= n;
3) C
n
n
= 1;
4) C
n
0
= 1.
Observe-se que:
C
n
0
e
n
n
n! 1!
C = =
n!0! 0!
.
Assim, para que a expresso das combinaes permanea vlida para r=0 e r=n, define-se
0! = 1.

Exemplo 3.7. Doze provadores so disponveis dos quais 8 so mais experientes
(designados M
1
, M
2
,..., M
8
) e 4 so menos experientes (designados m
1
, m
2
, m
3
, m
4
). Trs desses 12
provadores sero selecionados para uso em um experimento de degustao. a) Considerando a
ordem de seleo como importante, quantos grupos distintos de 3 provadores podero ser
selecionados? b) Quantos grupos so possveis com os dois primeiros provadores mais experientes
e o ltimo menos experiente? c) Se os 3 provadores so selecionados aleatoriamente (por um
processo que atribui a todos os provadores restantes aps cada seleo a mesma probabilidade de
serem selecionados), qual a probabilidade de que os dois primeiros provadores sejam mais
experientes e o ltimo menos experiente?
a) H 12 provadores distintos dos quais 3 devem ser selecionados, um aps o outro (sem
repetio). Assim, o nmero de grupos que se distinguem pela ordenao dos provadores
selecionados : A
12
3
= 121110 = 1.320.
b) O nmero de modos em que os dois primeiros provadores mais experientes podem ser
selecionados o nmero de arranjos de dois provadores do grupo de 8 provadores mais
Estatstica Bsica 46
experientes: M
1
, M
2
, ...,M
8
, ou seja: A
8
2
= 87=56. O nmero de modos em que o terceiro
provador selecionado pode resultar menos experiente quando os dois primeiros so mais
experientes A
4
1
= 4. Logo, pela regra do produto, o nmero de modos em que podem resultar os
dois primeiros provadores mais experientes e o terceiro menos experiente :
2 1
8 4
A A = 564 =224.
c) A escolha aleatria de 3 dos 12 provadores assegura que todos os A
12
3
distintos grupos
ordenados so igualmente provveis. Assim, o evento A: os dois primeiros provadores mais
experientes e o terceiro menos experiente consiste de
2 1
8 4
A A grupos ordenados. Portanto, a
probabilidade deste evento pode ser obtida pelo modelo de probabilidade uniforme:
2 1
8 4
3
12
A A n(A) 224
P(A) = = =
n(S) 1.320
A

.

Exemplo 3.8. Considere-se a situao do exemplo anterior, mas suponha-se que, agora, a
ordem de seleo dos trs provadores irrelevante (o que corresponde seleo simultnea dos
trs provadores). a) Quantos distintos grupos so possveis? b) Em quantos desses grupos dois
provadores so mais experientes e um menos experiente? c) Se os 3 provadores so selecionados
aleatoriamente (de modo que cada grupo de 3 provadores tenha igual chance de ser selecionado),
qual a probabilidade de que resultem dois provadores mais experientes e um menos experiente?
a) O nmero de grupos no ordenados de 3 dos 12 provadores :
3
12
121110
C = = 220
123
.
b) O nmero de combinaes de 2 provadores tomados dos 8 provadores mais experientes
:
2
8
8 7
C 28
1 2

= =

, e o nmero de 8 combinaes de 1 provador tomado dos 4 provadores menos


experientes : C
4
1
= 4. Pela regra do produto, o nmero de resultados possveis que satisfazem s
condies especificadas :
2 1
8 4
C C 28 4 112 = = .
c) Segundo o processo de seleo, os 220 grupos distintos de 3 provadores dos 12
provadores disponveis so todos igualmente provveis. O nmero de grupos com exatamente dois
provadores mais experientes e 1 menos experiente 112. Logo, pelo conceito de probabilidade em
espao bsico finito equiprovvel, a probabilidade do evento A: dois provadores mais experientes
e um provador menos experiente :
2 1
8 4
3
12
C C 112
P(A) = =
220
C
.

Exemplo 3.9. Em uma regio, h 15 agricultores associados a uma cooperativa dos quais
9 so favorveis, 4 so desfavorveis e 2 so indiferentes adoo de uma nova tecnologia. Trs
desses agricultores devem ser selecionados, aleatoriamente, para entrevista em uma pesquisa de
opinio sobre a adoo da referida tecnologia. a) Qual a probabilidade de que pelo menos dois
dos agricultores selecionados sejam favorveis adoo da nova tecnologia? Qual a
probabilidade de que os dois primeiros selecionados sejam favorveis e o terceiro desfavorvel
adoo da tecnologia?
3. Probabilidade
47
a) O evento de interesse no envolve a ordem das pessoas no processo de amostragem. O
nmero de diferentes grupos de 3 pessoas que podem ser selecionados de um conjunto de 15
pessoas C
15
3
= 455. Em um processo de seleo aleatria esses 455 grupos podem ocorrer com
uma mesma probabilidade. O evento A: pelo menos dois agricultores favorveis, eqivale ao
evento A
1
ou A
2
, onde A
1
: dois agricultores favorveis e A
2
: trs agricultores favorveis. Logo,
P(A) = P(A
1
ou A
2
) = P(A
1
) + P(A
2
).
Para calcular P(A
1
), observe-se que o evento A
1
significa, de fato, dois agricultores
favorveis e um no favorvel (ou seja desfavorvel ou indiferente). Como dos 15 agricultores 9
so favorveis, o nmero de grupos de 2 agricultores favorveis que pode resultar
2
9
9 8
C 36
2 1

= =

. Da mesma forma, 1 agricultor no favorvel ocorre se qualquer um dos 6


agricultores desfavorveis ou indiferentes selecionado. Logo,
n(A
1
) =
2 1
9 6
C C = 366 = 216.
Por semelhante raciocnio, obtm-se:
n(A
2
) =
3 0
9 6
9 8 7
C C 1 84
3 2 1

= =

.
Empregando o conceito de probabilidade uniforme, obtm-se:
P(A
1
) =
2 1
9 6 1
3
15
C C n(A ) 216
n(S) 455
C

= = ,
P(A
2
) =
3 0
9 6 2
3
15
C C n(A ) 84
n(S) 455
C

= = .
Portanto,
P(A) =
216
455 455
300
455
+ =
84
.
b) Esta questo envolve a considerao da ordem das pessoas no processo de seleo.
Portanto, a regra das permutaes deve ser empregada. O nmero de grupos ordenados de 3
pessoas de um conjunto de 15 P
15
3
= 151413 = 2.730. Por outro lado, as duas primeiras
pessoas sero favorveis se provirem das 9 favorveis e a terceira ser desfavorvel se provir das 4
desfavorveis. Logo, o nmero de grupos de 3 agricultores os dois primeiros dos quais so
favorveis e o terceiro desfavorvel :
2 1
9 4
P P = (98)4 = 288. Portanto, P(dois primeiros
favorveis e terceiro desfavorvel) =
288
2.370

3.4 Conceito Emprico de Probabilidade
Na maioria dos experimentos, o espao bsico no equiprovvel. o caso por exemplo,
do experimento de lanamento de um dado viciado. Nessas circunstncias, a probabilidade de um
evento no pode ser obtida por derivao lgica, usando a propriedade de simetria do experimento.
Para a determinao da probabilidade de um evento, deve-se considerar com que freqncia um
Estatstica Bsica 48
evento ocorre quando o experimento repetido sob, essencialmente, as mesmas condies.
Quando um experimento repetido n vezes, define-se a freqncia relativa de um evento A nas n
realizaes do experimento pela razo:
f
n
(A) =
Numero de vezes em que A ocorre
n
,
isto , a proporo de vezes em que o evento A efetivamente ocorreu nas n repeties do
experimento. Esse valor varia com diferentes conjuntos de n repeties do evento A. Para uma
mesma seqncia de realizaes do experimento, ele tambm flutua quando o nmero n de
repeties varia. Entretanto, a experincia comum com um grande nmero de experimentos
aleatrios, em muitos campos, indica que, se as condies experimentais permanecem
razoavelmente constantes, a freqncia relativa f(A) tende a estabilizar-se em torno de um nmero
nico, quando o nmero de repeties do experimento cresce indefinidamente. Esse valor em
torno do qual tende a estabilizar-se a freqncia relativa f
n
(A) tomado como a probabilidade do
evento A, designada por P(A).
Essa propriedade da freqncia relativa pode ser efetivamente verificada para um
experimento particular. Seja, por exemplo, o experimento "lanamento de uma moeda e
observao da face que resulta voltada para cima", com dois resultados possveis: C = {cara} e c =
{coroa}. Suponha-se que se realiza esse experimento, sucessivamente, n vezes e que se registra o
resultado de cada uma de suas realizaes e a correspondente freqncia relativa do evento {cara}.
Pode-se dispor essas informaes na forma da Tabela 3.1.

Tabela 3.1. Registro dos resultados de dezesseis repeties do lanamento de uma
moeda e correspondentes freqncias relativas.

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C x x x x x x x
c x x x x x x x x x
f
C
0 1/2 2/3 3/4 3/5 3/6 3/7 4/8 5/9 6/1 6/1 6/1 6/1 7/1 7/1 7/1

Para melhor apreciao, as freqncias relativas do evento C, at cada lanamento, so
representadas no grfico da Figura 3.2.

3. Probabilidade
49

Figura 3.2. Representao grfica das freqncias relativas do evento "cara" em uma
sucesso de 16 lanamentos de uma moeda.

A observao da variao da freqncia relativa do evento {cara} indica que ela tende a
aproximar-se de um nmero desconhecido, prximo de 1/2. Se a moeda ideal (perfeitamente
homognea e simtrica) e o lanamento no tendencioso, tal nmero 1/2. Essa propriedade, que
se observa para todos os experimentos aleatrios, o fundamento para o conceito emprico de
probabilidade:

A probabilidade de um evento C o nmero real P(C) em torno do qual tende a
estabilizar-se a freqncia relativa f
n
(C) quando o nmero n de realizaes do
experimento cresce indefinidamente:

n
n
f (C) P(C)

.

3.5 Conceito de Probabilidade em Espao Bsico Discreto
A freqncia relativa satisfaz s seguintes propriedades importantes, que constituem a
base para o estabelecimento do conceito de probabilidade para espao bsico discreto:
1) A freqncia relativa o quociente de dois nmeros inteiros no negativos em que o
numerador no pode ser maior que o denominador; portanto, ela um nmero
racional entre 0 e 1; logo 0<f(A) <1 para qualquer evento A.
2) Como algum resultado sempre deve ocorrer em qualquer realizao do experimento, a
freqncia relativa do espao bsico 1: f(S)=1.
3) A freqncia relativa de um evento A igual soma das freqncias relativas de
todos os eventos simples includos em A.
Dessas propriedades da freqncia relativa deriva-se o seguinte conceito de
probabilidade em espao bsico discreto:

Estatstica Bsica 50
A probabilidade uma funo P( ) definida para eventos do espao bsico S que
satisfaz s seguintes condies:
1) Para qualquer evento A, P(A) um nmero real no negativo: P(A)>0.
2) A probabilidade do espao bsico igual a 1: P(S)=1.
3) A probabilidade de qualquer evento A a soma das probabilidades de todos os
eventos simples includos em A: P(A) = p(s )
i
i
, s
i
A.

Qualquer funo que satisfaa a essas trs condies uma funo de distribuio de
probabilidade, tambm designada, mais simplesmente, funo de probabilidade ou distribuio
de probabilidade. Sob o ponto de vista prtico, entretanto, h interesse apenas em funes cujos
valores numricos obtidos para probabilidades de eventos concordam com as freqncias relativas
dos correspondentes eventos em uma longa srie de realizaes de um experimento particular.

Exemplo 3.10. Experimento: Observao dos sexos de gmeos em partos duplos de
ovelhas de um rebanho, cujo espao bsico : S={MM, MF,FM,FF}. Considere-se as duas
seguintes funes P
1
( ) e P
2
( ) definidas para os eventos de S:
a) P
1
(MM) = P
1
(MF) = P
1
(FM) = P
1
(FF) = 1/4; e
b) P
2
(MM) = P
2
(FF) = 3/8 ; P
2
(MF) = P
2
(FM) = 1/8.
Essas duas funes satisfazem s 3 condies de uma funo de probabilidade; portanto,
so funes de probabilidade. Entretanto, para um experimento particular, a atribuio de
probabilidades deve corresponder com bastante aproximao s freqncias relativas quando um
grande nmero de partos duplos de ovelhas do rebanho observado. Em muitas aplicaes
prticas, a funo de probabilidade P
1
( ) apropriada.
3.6 Operaes de Eventos
A terceira condio de uma funo de probabilidade em espao bsico discreto
caracteriza que a probabilidade de qualquer evento em tal espao bsico a soma das
probabilidades dos eventos simples que implicam na ocorrncia do evento. Quando o evento A
de natureza complexa, a determinao de P(A) atravs da adio das probabilidades dos eventos
simples em A pode ser trabalhosa. Nesse caso, pode ser mais conveniente expressar o evento A em
termos de outros eventos mais simples cujas probabilidades possam ser calculadas com menos
trabalho. Assim, importante saber as formas como um evento pode ser expresso em termos de
outros eventos, atravs de operaes de eventos. Para a melhor compreenso das operaes de
eventos, interessante recorrer representao grfica do espao bsico como um conjunto de
pontos em um diagrama onde cada ponto corresponde a um evento simples. Nesse diagrama, cada
evento representado como um conjunto de pontos que satisfazem descrio do evento. Essa
representao grfica designada diagrama de Venn.

Exemplo 3.11. Experimento: Administrao de um antibitico a trs animais e
observao do resultado para cada animal: reage (R) ou no reage (N). Considere-se os seguintes
eventos:
A: Apenas o primeiro animal responde;
3. Probabilidade
51
B: O primeiro animal responde;
C: Os dois primeiros animais no respondem.
H dois resultados possveis para o primeiro animal: R e N, e cada um desses dois
resultados pode ser seguido de um de dois resultados possveis do segundo animal: R e N. Cada
um desses 22=4 resultados possveis para os dois primeiros animais tambm pode ser seguido
dos dois resultados possveis para o terceiro animal. Portanto, para os 3 animais, h 222=8
resultados possveis, isto , 8 eventos simples para o experimento. Esses eventos simples podem
ser identificados como segue: s
1
=RRR, s
2
=RRN, s
3
=RNR, s
4
=NRR, s
5
=RNN, s
6
=NRN, s
7
=NNR, s
8
=NNN. Com essa notao, os eventos A, B e C so:
A = {s
5
};
B = {s
1
,s
2
,s
3
,s
5
};
C = {s
7
,s
8
}.
O diagrama de Venn apresentado na Figura 3.3, onde o retngulo maior representa o
espao bsico.

Figura 3.3. Diagrama de Venn para o espao bsico e os trs eventos
considerados no Exemplo 3.11.

Define-se, a seguir, trs eventos resultantes de trs operaes bsicas de eventos:

O evento unio ou reunio de A e B, denotado por , o conjunto de todos os
eventos simples que esto em A ou em B, ou em ambos A e B. O evento AB ocorre
se pelo menos um dos dois eventos A e B ocorre.

O evento interseo de A e B, denotado por AB, o conjunto de todos os eventos
simples que pertencem simultaneamente a ambos eventos A e B. O evento AB
ocorre se ambos os eventos A e B ocorrem.

O evento complemento de A, denotado por A
c
, o conjunto de todos os eventos
elementares que no esto contidos em A. O evento A ocorre se o evento A no ocorre.

Estatstica Bsica 52
Essas trs operaes bsicas de eventos so ilustradas na Figura 3.4. Observe-se que o
evento AB o conjunto maior, contendo os eventos A e B, e o evento AB o conjunto menor
contido em ambos A e B.


Figura 3.4. Ilustrao das trs operaes bsicas de eventos - reunio, interseo e
complementao, atravs de Diagramas de Venn.

Os seguintes conceitos so importantes:

O espao bsico designado evento certo, visto que sua probabilidade igual a 1.

Os eventos A e B so disjuntos ou mutuamente exclusivos se no tm eventos
simples em comum. Nesse caso, diz-se que o evento AB um evento impossvel,
denotado por .

Exemplo 3.12. Para ilustrao, considere-se os eventos A, B e C do experimento do
Exemplo 3.11, representados na Figura 3.3. De acordo com as definies das 3 operaes bsicas,
obtm-se:
- BC = {s
1
,s
2
,s
3
,s
5
,s
7
,s
8
};
- AB = {s
5
};
- B
c
= {s
4
,s
6
,s
7
,s
8
};
- (BC)
c
= {s
4
,s
6
};
- B
c
C
c
= {s
4
,s
6
}.

As operaes de reunio e de interseo se estendem qualquer nmero de eventos. Por
exemplo, a reunio dos eventos A, B e C o evento constitudo por todos os eventos simples
contidos em pelo menos um dos eventos A, B e C, designado por ABC; a interseo dos
3. Probabilidade
53
eventos A, B e C o evento correspondente ocorrncia simultnea dos trs eventos A, B e C,
designado por ABC.
3.7 Probabilidade Condicional
A probabilidade de um evento A pode alterar-se quando alguma informao provida
referente ocorrncia de um outro evento B.

A probabilidade de um evento A quando sabido que outro evento B ocorreu
denominada probabilidade condicional de A dado Be denotada P(A|B).

Exemplo 3.13. Em um levantamento referente adoo de uma nova tecnologia no
cultivo do morangueiro, foram obtidos os seguintes dados referentes 50 produtores de morango
de um municpio, classificados em duas categorias quanto ao nmero de anos de cultivo do
morangueiro:

Anos de cultivo do
morangueiro
Adoo da
tecnologia
<10 anos >10 anos
Adota 16 4
No adota 10 20

Considere-se o evento A: seleo de um produtor que adota a nova tecnologia. Se um
indivduo selecionado aleatoriamente dessa populao de 50 produtores, a probabilidade de que
ele adote a nova tecnologia :
P(A) =
n(A)
n(S)
20
50
2
5
.
Entretanto, a probabilidade de que um produtor de morango adote a nova tecnologia sob a
condio de que ele cultive o morangueiro h mais de 10 anos :
P(A|B) =
4
24
1
16
,
onde B denota a seleo de um produtor de morangueiro h mais de 10 anos. Observe-se que,
agora, o espao bsico restrito S' = B: produtores que cultivam o morangueiro h mais de 10
anos, de modo que n(S') = 24, enquanto que o nmero destes produtores que adotam a nova
tecnologia 4.
Observe-se que o numerador de P(A|B) n(AB) = 4, ou seja, o nmero de produtores
de morangueiro por mais de 10 anos e que adotam a nova tecnologia, e o denominador n(B), ou
seja, o nmero de produtores de morangueiro h mais de 10 anos. Assim, a probabilidade
condicional pode ser expressa por:
P(A|B) =
n(A B)
n(B)

,
Estatstica Bsica 54
ou, dividindo numerador e denominador por n(S),
P(A|B) =
n(A B) / n(S)
N(B) / n(S)
P(A B)
P(B)

=

.
Dessa forma, a probabilidade condicional P(A|B) pode ser expressa em termos de duas
probabilidades definidas para o espao bsico completo S. Naturalmente, a considerao da
probabilidade condicional faz sentido apenas se o evento condicionante no nulo, ou seja, se
P(B) 0.
Essa expresso vlida para qualquer situao. Assim, se A e B so dois eventos
quaisquer em um espao bsico S e P(B) 0, a probabilidade condicional de A dado B dada por:
P(A|B) =
P(A B)
P(B)

.
Semelhantemente, a probabilidade condicional de B dado A expressa por:
P(B|A) =
P(A B)
P(A)

, se P(A)>0.
Dessas duas expresses obtm-se, respectivamente:
P(AB) = P(B)P(A|B), P(B) 0, e
P(AB) = P(A)P(B|A), P(A) 0,
que exprimem a denominada "lei da multiplicao" da probabilidade. Assim, a lei da
multiplicao estabelece que a probabilidade de que dois eventos A e B ocorram simultaneamente
o produto da probabilidade de A pela probabilidade condicional de B dado A. Alternativamente,
o produto da probabilidade de B pela probabilidade condicional de A dado B.
A lei da multiplicao pode ser imediatamente estendida mais de dois eventos. Para trs
eventos, por exemplo, ela estabelece: se A, B e C so quaisquer trs eventos em um espao bsico
S, tais que P(A) 0 e P(AB) 0, ento: P(ABC) = P(A)P(B|A)P(C|AB).

Exemplo 3.14. Um fazendeiro tem uma caixa com 30 ovos dos quais 5 tm manchas de
sangue. Ele retira 3 ovos da caixa aleatoriamente, um aps o outro. Qual a probabilidade de que
os dois primeiros ovos tenham manchas de sangue e o terceiro seja limpo?
Denote-se por C
1
, C
2
e S
3
, respectivamente, os eventos de escolher ovos manchados na
primeira e segunda extrao e um ovo sem mancha na terceira. Deseja-se determinar a
probabilidade do evento C
1
C
2
S
3
. Segundo a lei da multiplicao,
P(C
1
C
2
S
3
) = P(C
1
)P(C
2
|C
1
)P(S
3
|C
1
C
2
).
Como as extraes so procedidas aleatoriamente, tem-se P(C
1
)= 5/30. Para determinar
P(C
2
|C
1
) note-se que quando C
1
ocorre h 29 ovos restantes na caixa, 4 dos quais so manchados.
Assim, a probabilidade condicional de retirar um ovo manchado na segunda extrao dada por
P(C
1
|C
2
)=4/29. Pelo mesmo raciocnio, encontra-se P(S
3
|C
1
C
2
)=25/28. Logo, pela frmula da
multiplicao:
3 1 2
5 4 25 25
P(S |C C ) = =
30 29 28 1218
.
3. Probabilidade
55
3.8 Independncia Estatstica
Uma situao particularmente importante aquela em que a probabilidade condicional do
evento A dado o evento B, P(A|B) igual probabilidade no condicional de A, ou seja, P(A|B) =
P(A). Nessa situao, a ocorrncia ou no ocorrncia do evento B no afeta a probabilidade de A.
Diz-se, ento, que os eventos A e B so independentes no sentido estatstico:

Dois eventos A e B so independentes (no sentido estatstico) se:
P(A|B) = P(A).

Condies de independncia equivalentes so: P(B|A) = P(B) e P(AB) = P(A).P(B),
onde a ltima igualdade a lei da multiplicao sob a condio de independncia estatstica. Na
derivao desta expresso, pressupe-se que P(A|B) ou P(B|A) existe e que, portanto, P(B) 0 ou
P(A) 0. Entretanto, a lei da multiplicao tambm vlida quando P(A)=0 e P(B)= 0. A ltima
condio mostra que a independncia estatstica simtrica em A e B: Se A independente de B,
ento, B independente de A.
Se dois eventos no so independentes, eles so ditos dependentes.

Exemplo 3.15. Considere-se a situao de amostragem com reposio, ilustrada no
Exemplo 3.2: Extrao aleatria de dois sacos de sementes de uma pilha de 5 sacos, sendo 2 da
variedade V
1
e 3 da variedade V
2
. Considerem-se os dois eventos A: um saco V
1
na primeira
extrao e B: um saco V
2
na segunda extrao. Segundo aquele exemplo, tem-se:
P(AB) =
2 3 6
5 5 25

.
Por outro lado, P(A) =
2
5
e P(B) =
3
5
, donde resulta:
P(A).P(B) =
2 3 6
5 5 25
= .
Logo,
P(AB) = P(A)P(B),
donde se conclui que os eventos A e B so estatisticamente independentes.

Exemplo 3.16. Considere-se, agora, os dois eventos A e B definidos no exemplo anterior
para a situao de amostragem se reposio do Exemplo 3.3. Nesse caso, tem-se:
P(AB) =
2 3 6
5 4 20

,
enquanto que:
P(A) =
2
5
e P(B) =
3
4
, donde: P(A).P(B) =
6
25
,
de modo que: P(AB) P(A).P(B). Logo, os dois eventos so, agora, dependentes.

Estatstica Bsica 56
O conceito de independncia estatstica estendido para mais de dois eventos, como
segue: Os eventos A
1
, A
2
,..., A
k
so (mutuamente) independentes se e apenas se a probabilidade
da interseo de qualquer 2, 3,...,k destes eventos igual ao produto de suas respectivas
probabilidades.
Para trs eventos A, B e C, por exemplo, a independncia implica que P(AB) =
P(A)P(B), P(AC) = P(A)P(C), P(BC) = P(B)P(C) e P(ABC) = P(A)P(B)P(C). Deve
ser observado que trs ou mais eventos podem ser independentes par a par sem serem mutuamente
independentes.

Exemplo 3.17. Suponha que a iluminao de uma sala controlada por trs interruptores
separados, de modo que as luzes estaro acesas quando os trs interruptores estiverem ligados ou
quando um dos interruptores estiver ligado e os outros dois desligados, com as mesmas
probabilidades de iluminao da sala para essas quatro condies dos trs interruptores.
Considerem-se os eventos A: o primeiro interruptor est ligado, B: o segundo interruptor est
ligado e C: o terceiro interruptor est ligado. Estes eventos e as correspondentes probabilidades
associadas com as diversas situaes dos interruptores estarem ligados ou desligados quando as
luzes da sala esto acesas so representados no diagrama de Venn da Figura 3.5.


Figura 3.5. Diagrama de Venn para o Exemplo 3.17.

Pode-se verificar que cada um dos pares de eventos A, B e C so independentes, mas os
trs eventos A, B e C no so independentes. De fato, segundo o diagrama, P(A)=P(B)=P(C) =
1/2, P(AB) = P(AC) = P(BC) = 1/4 e P(ABC) = 1/4. Logo, P(AB)= 1/4 =P(A)P(B),
P(AC) = 1/4= P(A)P(C), P(BC) = 1/4 = P(B)P(C). Entretanto, P(ABC) = 1/4, enquanto
que P(A)P(B)P(C) = 1/8.

Por outro lado, pode ocorrer que P(ABC) = P(A)P(B)P(C) sem que A, B e C sejam
independentes par a par.
Observao. Freqentemente, os termos "mutua exclusividade" e "independncia
estatstica" de eventos so confundidos. Estas duas propriedades de eventos so muito diferentes.
3. Probabilidade
57
De fato, uma implica que a outra no pode ser verdadeira. Considere-se, por exemplo, dois eventos
A e B com probabilidades positivas. Se eles so mutuamente exclusivos, a interseo AB vazia
e, portanto, P(AB)=0. Se esses eventos fossem independentes, eles teriam que satisfazer
condio P(A).P(B) = P(AB), que no pode ser verdadeira porque o produto de dois nmeros
no nulos no pode ser zero. Como um exemplo extremo, os eventos A e A
c
so mutuamente
exclusivos, mas, intuitivamente, eles so muito dependentes, no sentido de que to logo dito que
A ocorreu se est certo de que A
c
no ocorreu. Pode-se verificar isto calculando:
P(A
c
|A)=P(A
c
A)/P(A)=0/P(A)=0.
3.9 Conceito Geral de Probabilidade
A discusso anterior foi confinada situao de espao bsico discreto, em que o nmero
de eventos simples finito ou infinito contvel. Em muitos experimentos, entretanto, a
mensurao efetuada em uma escala contnua, como o caso, por exemplo, com caractersticas
como altura, peso e temperatura. Nessa circunstncia, o espao bsico , usualmente, o conjunto
de todos os nmeros reais de um intervalo. Tal espao bsico designado espao bsico contnuo.
A interpretao da probabilidade de um evento como sua freqncia relativa em uma longa srie
de experimentos e a maior parte das propriedades de probabilidade permanecem vlidas para esses
espaos bsicos. Uma notvel exceo o fato de que a probabilidade de um evento em um espao
bsico contnuo no obtida como a soma das probabilidades dos eventos simples que o compe,
j que a soma de um nmero infinito no contvel de termos no tem sentido, ou seja, a operao
de soma no definida se os termos a serem somados no podem ser arranjados em uma
seqncia. Este o caso, por exemplo, quando o evento um intervalo e os eventos elementares
so os pontos do intervalo. Por essa razo, no se pode determinar a probabilidade de um evento
pela adio das probabilidades de seus eventos simples. A estrutura de probabilidade de um espao
bsico contnuo deve alterar-se para a atribuio de probabilidades a eventos (tipicamente
subintervalos de um intervalo de nmeros reais) de um outro modo.
O conceito de probabilidade para esse espao bsico mais geral estabelecido atravs das
condies que a atribuio de probabilidades deve satisfazer, em coerncia com a experincia
emprica. Essas condies, coerentes com as propriedades da freqncia relativa e coincidentes
com as propriedades da probabilidade em espao bsico discreto, sugerem o seguinte conceito
axiomtico de probabilidade:

Probabilidade uma funo real P( ) definida no espao bsico S que satisfaz s
seguintes condies (postulados):
1) P(A) > 0 para qualquer evento A.
2) P(S) = 1.
3) Se A
1
, A
2
,... uma seqncia de eventos mutuamente exclusivos, ento:
P(A
1
A
2
...) = P(A
1
)+P(A
2
)+...

As propriedades da probabilidade estabelecidas para espao bsico discreto podem, agora,
ser derivadas como casos particulares destas trs condies (axiomas). Assim, por exemplo, para
Estatstica Bsica 58
obter a regra da complementao, note-se que um evento A e seu complemento A so disjuntos e
que AA
c
= S. Logo, pelos postulados 3) e 2), obtm-se:
P(AA
c
) = P(A)+P(A
c
),
donde:
P(S) = P(A)+P(A
c
);
logo,
P(A
c
) = 1-P(A).
De modo semelhante, pode-se derivar as demais regras importantes da probabilidade para
um espao bsico geral. As definies de probabilidade condicional e de independncia estatstica
permanecem as mesmas de espao bsico discreto.
3.10 Modelos de Probabilidade
Para analisar os resultados de um experimento aleatrio, conveniente construir um
modelo, ou seja, uma representao abstrata que descreva a estrutura do experimento e possa ser
usada na anlise. Modelos para experimentos aleatrios so denominados modelos de
probabilidade.

Um modelo de probabilidade estabelecido pela especificao de trs
componentes: o espao bsico S, a classe de todos os eventos em S e uma funo que
permita a determinao de probabilidades de eventos de S.

O segundo componente facilmente caracterizado quando o espao bsico finito. Nesse
caso, a classe de eventos de S a coleo de todos os eventos do espao bsico, includos o evento
certo S e o evento impossvel . Assim, no exemplo a) utilizado para ilustrar experimento
aleatrio, a classe dos eventos de S a coleo de eventos {{M},{F},S,}. Essa definio
generalizada para espao bsico infinito contvel e, portanto, abrange, em geral, espaos bsicos
discretos. Entretanto, a definio da classe de eventos de S no to simples para espao bsico
infinito no contvel, quando os pontos de S constituem um "continuum", como nos exemplos e) e
f). Essa situao somente pode ser tratada com desenvolvimentos tericos mais avanados, fora
dos propsitos deste texto. Entretanto, ela no um problema srio para os mtodos estatsticos.
Nas aplicaes, suficiente reconhecer que os eventos so subconjuntos do espao bsico.
3.11 Exerccios
1. Especifique o espao bsico e o espao de eventos para os seguintes experimentos
aleatrios:
a) Plantio de uma semente e observao do resultado da germinao.
b) Plantio de duas sementes e observao do resultado da germinao.
2. Especifique o espao bsico para cada um dos seguintes experimentos aleatrios:
a) Nmero de animais que revelam resposta positiva um hormnio de crescimento
do total de 100 animais de um rebanho aos quais se administra o hormnio.
b) A temperatura no prximo dia 29 de maro s 9 horas.
3. Probabilidade
59
c) Nmero de animais de um rebanho de 50 bovinos da raa Hereford com peso
superior a 300 kg.
d) Em um levantamento referente ao consumo de vinho no Rio Grande do Sul, 1.000
pessoas sero solicitadas a responder "sim" ou "no" questo: "Voc bebeu vinho
na semana passada?" Apenas o nmero de pessoas que responderem "sim" ser
registrado.
e) Escolha aleatria de uma entre 6 garrafas de vinho tinto das cultivares C
1
, C
2
, C
3
,
C
4
, C
5
e C
6
.
f) Escolha aleatria de uma entre 6 garrafas de vinho tinto das cultivares C
1
, C
2
, C
3
,
C
4
, C
5
e C
6
de cada uma de 2 caixas, uma com rtulos brancos e a outra com rtulos
verdes.
g) Classificao de 4 latas de compota de pssego das cultivares A, B, C e D por um
provador quanto preferncia com respeito a uma propriedade organoltica, com
omisso da identificao das cultivares para o provador.
h) Escolha aleatria de 2 sementes de um pacote contendo 5 sementes de idntica
aparncia, sendo que 2 so de plantas de flores brancas e 3 de plantas de flores
azuis, e observao das cores das flores das plantas resultantes.
i) Extrao aleatria de 2 mas de um saco contendo 2 mas da cultivar A e 3
mas da cultivar B, com reposio da primeira ma extrada, e identificao das
mas resultantes.
j) Um provador afirma ser capaz de distinguir entre os vinhos Cabernet Franc de 3
diferentes cantinas. Um copo de vinho de cada uma das 3 cantinas dado ao
provador para identificao, em uma ordem desconhecida. O nmero de
identificaes corretas ser registrado.
k) O nmero de horas que um aparelho novo de TV trabalhar sem necessidade de
reparo.
l) O nmero de helmintos encontrados no corpo de um bovino da raa Ibag na
necropsia, aps o perodo de 2 meses em uma pastagem infectada.
m) O nmero de mortes em acidentes de trnsito em um estado, no prximo
ano.
3. Especifique o seguinte evento para o experimento aleatrio do exerccio 1.b):
A={Duas sementes germinam}; B={Pelo menos uma semente germina}; e
C={Nenhuma semente germina}.
a) {mais de 30 animais reagem aplicao do hormnio}.
b) {Temperatura superior a 21 graus C}.
c) {Pelo menos 45 animais com peso superior a 300 kg}.
d) {Pelo menos 850 pessoas respondem "sim"}.
e) A={Garrafa de vinho de cultivar identificada com nmero par}; B={Garrafa de
vinho de cultivar identificada com nmero menor que 4}; C = Complemento de B.
f) A={Ambas garrafas com vinho da cultivar C }; B={Garrafas cuja soma das
identificaes das cultivares 5}; C={Garrafa cuja soma das identificaes no
mnimo 10}.
Estatstica Bsica 60
4. Em um experimento aleatrio de plantio de quatro sementes, especifique os seguintes
eventos:
a) A={Duas sementes germinam}.
b) B={Pelo menos uma semente germina}.
c) C={Nenhuma semente germina}.
5. Determine as probabilidades dos eventos especificados na questo 4.e).
6. Determine as probabilidades dos eventos especificados na questo 4.f).
7. Determine as probabilidades dos eventos especificados n a questo 5, sabendo que a
probabilidade de uma semente germinar 0,9.
8. Um mecnico sabe que um carro com seis velas tem duas velas com mau
funcionamento. Se ele retira aleatoriamente duas delas para substituio, qual a
probabilidade de que ele efetue a substituio correta das duas velas defeituosas?
9. A probabilidade de um casal ter um filho homem 0,5. Determine a probabilidade de
que:
a) Tendo dois filhos, ambos sejam mulheres.
b) Em uma prole de 5 filhos, dois sejam homens.
c) Em uma prole de 5 filhos, pelo menos dois sejam homens.
10. Em herana mendeliana simples, um carter fsico de uma planta ou animal
determinado por um par simples de genes. O carter "cor" da ervilha um exemplo.
Ele determinado por um par de genes A e V que representam, respectivamente, as
cores amarela e verde. O gene A dominante, de modo que plantas com o gentipo
(par de genes) VV tero ervilhas verdes e aquelas com os gentipos AA e AV tero
ervilhas amarelas. Os descendentes (prognie) recebem um gene de cada pai com
igual probabilidade para cada gene de cada pai.
a) Efetuado o cruzamento de ervilhas de colorao amarela, determine a probabilidade
de que resulte uma planta com ervilhas: a) amarelas; b) verdes.
b) Em um cruzamento entre ervilhas AV e AV, qual a proporo da prognie que
ter gros amarelos? Qual a proporo de ervilhas amarelas que tero o gentipo
AA?
11. Um outro carter mendeliano simples a rugosidade. As ervilhas podem ser lisas ou
rugosas. Esse carter determinado por um par de genes L e R, respectivamente para
as alternativas lisa e rugosa. O carter liso dominante, de modo que ervilhas LL e
LR so lisas, enquanto que ervilhas RR so rugosas.
a) Se ervilhas AV-LR so cruzadas com ervilhas VV-RR, quais so os possveis
resultados? Quais so suas correspondentes probabilidades?
b) Responda semelhantes questes para cruzamentos entre ervilhas AV-LR e VV-RR.
c) Responda semelhantes questes para cruzamentos entre ervilhas AV-LR e AV-LR.
12. Na questo 2.h), determine as probabilidades dos seguintes eventos: a) A: duas
plantas com flores da mesma cor; b) B: duas plantas com flores de cores diferentes.
13. Na questo 2.i), determine as probabilidades dos seguintes eventos: a) A: duas mas
da cultivar A; b) B: duas mas da mesma cultivar; c) C: uma ma de cada cultivar.
3. Probabilidade
61
14. Em uma operao em uma linha de montagem de uma indstria, 1/5 dos itens
produzidos so defeituosos. Se forem retirados aleatoriamente trs itens para teste,
qual a probabilidade de que:
a) exatamente um item seja defeituoso?
b) pelo menos um item seja defeituoso?
15. Um saco contm 1.500 batatas das quais 1.100 so classificadas como de primeira e
400 como de segunda. Extraindo-se uma amostra de trs batatas, determine a
probabilidade de que: a) as trs batatas sejam de primeira; b) pelo menos uma batata
seja de segunda.
16. Um pesquisador em tecnologia de alimentos tem disponveis 20 voluntrios para
avaliao organoltica em um experimento e deseja extrair uma amostra aleatria de
10 desses voluntrios. Para tal, ele decide escrever todas as combinaes de 10 nomes
em cartes a, ento, extrair um dos cartes ao acaso. Quantas combinaes de nomes
ele deve anotar em cartes?
17. Um geneticista que pesquisa gado leiteiro tem quatro touros e oito vacas que podem
ser usados em um experimento. Quantos diferentes pares constitudos de um macho e
uma fmea ele pode constituir?
18. H evidncia de que entre as formas inferiores de vida animal podem ser transmitidas
caractersticas de um animal para outro junto com a transferncia da substncia
qumica conhecida como RNA. Em um experimento referente a esse comportamento
de transferncia, oito salamandras so divididas em dois grupos de quatro animais.
Um grupo constituir o grupo experimental e ou outro o grupo controle.
a) Mostre que os dois grupos podem se formados com 70 diferentes constituies.
b) Qual a probabilidade de que as quatro salamandras mais geis resultem em um
mesmo grupo?
c) Qual a probabilidade de que trs das quatro salamandras mais geis situem-se no
mesmo grupo?
d) Todas as salamandras em um grupo (o grupo experimental) recebem RNA de uma
salamandra que foi treinada para maior agilidade. O outro grupo (o grupo controle)
recebe RNA de uma salamandra no treinada. Para que se possa acreditar que o
comportamento transferido com o RNA, qual deve ser o nmero de animais mais
rpidos no grupo experimental? Justifique a resposta.
19. Uma pessoa afirma que tem habilidade para distinguir entre caf percolado e caf
instantneo. Em um experimento para testar esta afirmada habilidade, o indivduo
deve provar 10 xcaras de caf, cinco com cada um dos dois tipos de caf. Para
melhoria do experimento, so usados xcaras iguais e o caf das duas origens
preparado simultaneamente. Ento, as dez xcaras de caf so oferecidas ao indivduo,
sem identificao de seu contedo, para prova e indicao das cinco que contm caf
percolado.
a) De quantas formas ele pode selecionar 5 entre as dez xcaras de caf?
b) De quantas formas ele pode selecionar as 5 xcaras de caf percolado?
c) Qual a probabilidade de que selecione corretamente as cinco xcaras com caf
percolado por palpite em vez de por habilidade sensorial?
Estatstica Bsica 62
20. Um lote formado de 10 artigos bons, 4 com defeitos menores e 2 com defeitos
graves. Um artigo escolhido ao acaso. Determine a probabilidade de que: a) o artigo
no tenha defeitos; b) o artigo no tenha defeitos graves; c) o artigo seja perfeito ou
tenha defeitos graves.
21. Considere o mesmo lote de artigos do exerccio anterior. Dois artigos so escolhidos
ao acaso, repondo-se o primeiro artigo extrado antes da extrao do segundo.
Determine a probabilidade de que: a) ambos os artigos sejam perfeitos; b) ambos
tenham defeitos graves; c) pelo menos um seja perfeito; d) no mximo um seja
perfeito; e) exatamente um seja perfeito; f) nenhum deles tenha defeitos graves; g)
nenhum deles seja perfeito.
22. Responda s mesmas perguntas da questo 16 no caso de extrao sem reposio.
23. Em um exame para admisso de laboratoristas, os candidatos so solicitados a efetuar
cinco anlises qumicas e redigir o relatrio de seus resultados. Para diminuir o
trabalho de avaliao, os examinadores decidem avaliar apenas uma amostra aleatria
de dois dos cinco relatrios redigidos por cada candidato. Com base nos resultados da
avaliao, os candidatos so classificados em trs categorias: A, se seus dois relatrios
esto corretos; B, se um relatrio est correto e o outro incorreto; e C, se os dois
relatrios contm incorrees.
a) Qual a probabilidade de um candidato receber o grau A quando ele submeteu
cinco relatrios corretos?
b) Qual a probabilidade de um candidato receber o grau C quando ele submeteu: i)
cinco relatrios corretos? ii) quatro relatrios corretos? iii) dois relatrios corretos?
iv) um relatrio correto? v) nenhum relatrio correto?
24. Quatro provadores (sejam 1, 2, 3 e 4) devero ordenar trs diferentes marcas de vinho
(sejam A, B e C) quanto preferncia, sem conhecimento das marcas que lhes so
dadas para degustar. Cada provador classifica como 1 a marca que mais lhe agrada,
como 2 a segunda e como 3 a que menos lhe agrada, e ento so somados os pontos
atribudos para cada marca de vinho. Suponha que os provadores realmente no
podem discriminar entre as marcas, de modo que cada um est atribuindo sua
ordenao ao acaso. Determine a probabilidade de que: a) a marca A receba o total de
pontos igual a 4; b) alguma marca receba o total de pontos igual a 4; c) alguma marca
receba uma soma de pontos de 5 ou menos.
25. Em um experimento, foram semeados com trigo quatro conjuntos (blocos) de cinco
talhes (parcelas) - um talho com cada uma das cinco cultivares A, B, C, D e E. Em
todos os blocos a cultivar C foi a mais produtiva. Qual a probabilidade de que esse
resultado tenha decorrido exclusivamente por acaso?
26. Em um experimento semelhante ao do exerccio anterior, a cultivar C teve a produo
mais elevada em trs dos quatro blocos e a segunda produo mais elevada no bloco
restante. Qual a probabilidade de ela se ter destacado tanto ou mais do que neste
experimento exclusivamente por acaso?
27. Em um experimento de vinte parcelas, instalam-se quatro repeties de cinco
cultivares (A, B, C, D e E) atribudas s parcelas completamente ao acaso. Na
ordenao dos resultados nas vinte parcelas, as parcelas com o tratamento C ficaram
3. Probabilidade
63
nos quatro primeiros lugares. Qual a probabilidade de que isto tenha decorrido por
mero acaso?
28. Um distribuidor de semente de melo determinou atravs de pesquisa que 4 porcento
de seu estoque de sementes no germinar. Ele vende as sementes em saquinhos de 50
unidades e garante que ao menos 90 porcento de germinao. Qual a probabilidade
de que um saquinho de sementes particular viole a garantia?
29. Em uma pesquisa de laboratrio em um labirinto em formato de T, um animal tem a
escolha de entre ir para a esquerda e obter alimento ou ir para a direita e receber um
choque eltrico leve. Suponha que na primeira tentativa (antes de qualquer
condicionamento) os animais tm igual probabilidade de dirigirem-se para a direita ou
para a esquerda. Aps receber alimento em uma tentativa particular, as probabilidades
de escolha dos caminhos para a direita e para a esquerda so, respectivamente, 0,4 e
0,6. Entretanto, aps o animal receber um choque em uma tentativa particular, as
probabilidades de ir para a direita e para a esquerda tornam-se 0,2 e 0,8,
respectivamente.
a) Qual a probabilidade de que o animal dirija-se para esquerda na segunda
tentativa?
b) Qual a probabilidade de que o animal dirija-se para a esquerda na terceira
tentativa?
30. Decida se cada uma das seguintes sentenas verdadeira ou falsa, indicando com as
letras V ou F entre parnteses, respectivamente. Se a sentena for falsa, explique
porque.
( ) O conceito de probabilidade til para o estudo de fenmenos que podem ser
previstos exatamente.
( ) Um experimento aleatrio um processo de observao e coleta de dados
relevantes referentes a um fenmeno aleatrio.
( ) Um processo de observao e coleta de dados relevantes referentes a um
fenmeno aleatrio um experimento aleatrio.
( ) Um experimento aleatrio pode ser repetido sob condies essencialmente
semelhantes.
( ) A observao e o registro da hora do nascer do sol em um prximo determinado
dia um exemplo de experimento aleatrio.
( ) A observao e o registro do nmero de frutos de um determinado pessegueiro
na prxima safra um exemplo de experimento aleatrio.
( ) O espao bsico de um experimento aleatrio o conjunto dos resultados
possveis desse experimento.
( ) O espao bsico de um experimento aleatrio nico.
( ) Um evento unitrio de um experimento aleatrio um resultado possvel desse
experimento.
( ) O espao bsico de um experimento aleatrio discreto se e somente se o
conjunto dos resultados elementares desse experimento finito.
( ) Um espao bsico contnuo no enumervel.
( ) Um evento de um experimento aleatrio um subconjunto de seu espao bsico.
Estatstica Bsica 64
( ) O conceito clssico de probabilidade aplicvel em amostragem aleatria.
( ) Um espao bsico equiprovvel finito.
( ) Como um dado tem 6 faces, ento a probabilidade de qualquer de duas faces
1/6.
( ) O conceito clssico de probabilidade aplicvel a experimentos cujas
probabilidades dos resultados elementares so desconhecidas.
( ) A regra da multiplicao til para a contagem do nmero de composies de
resultados parciais de experimentos aleatrios que compreendem duas ou mais
etapas.
( ) A regra das permutaes uma aplicao da regra da multiplicao para a
contagem do nmero de diferentes modos de extrao de n elementos de um
conjunto com reposio de cada elemento antes da extrao do seguinte.
( ) A regra dos arranjos permite o clculo das distintas ordenaes de a elementos
de um conjuntos de n elementos.
( ) O nmero de permutaes de n elementos dispostos em linha a n-sima parte
do nmero de permutaes de n elementos dispostos em crculo.
( ) O nmero de combinaes de r elementos tomados de um conjunto de n
elementos menor do que o nmero de correspondentes arranjos, porque
combinaes de mesmos elementos no se distinguem.
( ) abc e cba so duas combinaes distintas de 3 das letras a, b, c, d, e, mas
constituem um mesmo arranjo.
( ) A freqncia relativa de um evento A que ocorre em n
A
das n realizaes de um
experimento aleatrio a razo n
A
/n.
( ) O conceito emprico de probabilidade estabelece que a probabilidade de um
evento A o limite da freqncia relativa f
A
desse evento quando o nmero de
realizaes do experimento tende a infinito.
( ) A probabilidade de um evento A de um espao bsico equiprovvel a soma das
probabilidades dos resultados elementares que implicam na ocorrncia de A.
( ) Se dois eventos A e B no tm resultado elementar em comum, ento o evento
"A e B" um evento impossvel.
( ) A probabilidade da ocorrncia do evento "A ou B" a soma das probabilidades
desses eventos.
( ) A probabilidade de um evento elementar de um espao bsico finito pode ser
nula.
( ) Se A e B so dois eventos tais que todo resultado possvel de A , tambm, um
resultado possvel de B, ento P(A)P(B).
( ) A soma das probabilidades de dois eventos que no podem ocorrer
simultaneamente pode ser maior do que 1.
( ) O nmero de eventos de um espao bsico de n resultados elementares 2
n
.

4 VARIVEL ALEATRIA E DISTRIBUIO DE
PROBABILIDADE DISCRETA
Contedo
4.1 Introduo.........................................................................................................................66
4.2 Varivel Aleatria Discreta..............................................................................................69
4.2.1 Distribuio de probabilidade ...................................................................................69
4.2.2 Representao grfica de uma distribuio de probabilidade...................................71
4.2.3 Mdia de uma distribuio de probabilidade ............................................................73
Propriedades do valor esperado................................................................................75
4.2.4 Varincia de uma distribuio de probabilidade.......................................................75
Propriedades da varincia.........................................................................................76
4.3 Distribuies Discretas Importantes.................................................................................77
4.3.1 Distribuio uniforme discreta..................................................................................77
4.3.2 Distribuio de Bernoulli ..........................................................................................78
- Mdia e varincia: ..................................................................................................79
4.3.3 Distribuio binomial................................................................................................79
- Mdia e varincia: ..................................................................................................81
4.3.4 Amostragem de uma populao dicotmica .............................................................82
Amostragem com reposio .....................................................................................82
Amostragem sem reposio......................................................................................83
4.3.5 Distribuio hipergeomtrica....................................................................................84
- Mdia e varincia ...................................................................................................84
4.3.6 Distribuio geomtrica ............................................................................................85
- Mdia e varincia ...................................................................................................86
4.3.7 Distribuio binomial negativa .................................................................................86
- Mdia e varincia ...................................................................................................87
4.3.8 Distribuio de Poisson.............................................................................................87
4.4 Distribuio Conjunta de Duas Variveis Aleatrias.......................................................88
Propriedades da funo distribuio de probabilidade conjunta ..............................92
Representao geomtrica ........................................................................................92
4.5 Distribuio de uma Funo de Duas Variveis Aleatrias.............................................93
4.6 Distribuio Marginal ......................................................................................................93
Estatstica Bsica

66
4.7 Valor Esperado de uma Funo de Duas Variveis Aleatrias........................................94
4.8 Covarincia e Correlao de Duas Variveis Aleatrias .................................................95
Propriedades do coeficiente de correlao ...............................................................97
4.9 Distribuio Condicional e Independncia Estatstica.....................................................97
4.10 Distribuio Conjunta de n Variveis Aleatrias ...........................................................99
Propriedades do valor esperado..............................................................................101
4.11 Distribuio Multinomial..............................................................................................102
4.12 Exerccios......................................................................................................................103

4.1 Introduo
Os resultados de um experimento aleatrio diferem quanto a um grande nmero de
caractersticas das unidades da populao em considerao. Usualmente, entretanto, h interesse
em apenas uma ou poucas dessas caractersticas. Considerar-se-, inicialmente, a situao de
apenas uma caracterstica.
O modelo de probabilidade para uma caracterstica especificado pela coleo de todos
os resultados elementares registrados para a caracterstica, ou seja, por seu espao bsico, e pelas
probabilidades associadas com esses resultados, isto , os eventos simples. Esses eventos simples
no so necessariamente numricos. Por exemplo, o espao bsico associado com o experimento
de germinao de uma semente S={G, g}, onde G e g descrevem os dois eventos simples que
correspondem s duas alternativas da caracterstica considerada, respectivamente, germina e no
germina. Embora eventos simples possam descrever caractersticas qualitativas, geralmente se tem
interesse em express-los atravs de uma varivel numrica, j que o tratamento analtico de um
modelo de probabilidade somente pode ser estabelecido atravs de sua expresso algbrica. No
exemplo, usual assinalar o nmero 1 ao evento simples G e o nmero 0 ao evento simples g, j
que o evento "germina" o de maior interesse. Por outro lado, muitas vezes no h interesse em
detalhes associados com os eventos simples, mas apenas em alguma descrio numrica de algum
aspecto quantitativo referente aos resultados do experimento. Por exemplo, o espao bsico para o
experimento de germinao de trs sementes S=(GGG, GGg, GgG, gGG, Ggg, gGg, ggG, ggg}.
Entretanto, pode-se ter interesse apenas no nmero de sementes que germinam. Neste caso, os
valores numricos 0, 1, 2 e 3 so assinalados aos pontos do espao bsico.
Dessa forma, usualmente importante a representao de eventos no espao bsico S
atravs de conjuntos de nmeros reais. Essa representao obtida atravs de um "mapeamento"
dos pontos do espao bsico S sobre o conjunto R dos nmeros reais, isto , sobre os pontos de
uma reta.
Os nmeros assinalados aos eventos simples do espao bsico so valores particulares de
uma varivel numrica, denominada varivel aleatria. A designao "aleatria" provm do fato
de que as realizaes ou valores particulares da varivel esto associados com probabilidades que
correspondem s chances de suas ocorrncias. Um conceito formal de varivel aleatria dado a
seguir.

Varivel Aleatria e Distribuio de Probabilidade Discreta

67
Varivel aleatria uma funo X( ) definida no espao bsico S que faz
corresponder a cada ponto sS um e um s nmero real x (isto , um e um s ponto
sobre a linha reta R), de modo que a imagem inversa sobre S de cada evento A de R
x

(conjunto de pontos sobre R gerados pelo mapeamento) seja um evento de S.

O conceito de varivel aleatria ilustrado na Figura 4.1.


Figura 4.1. Ilustrao do mapeamento efetuado por uma varivel
aleatria X, de pontos no espao bsico S em pontos
sobre a linha reta R.

Dessa forma, probabilidades de eventos no espao bsico podem ser determinadas a partir
de probabilidades de eventos sobre a linha reta, e vice-versa:
P
x
[A] = P
x
[C] .
Uma varivel aleatria usualmente denotada por X ou uma outra das ltimas letras do
alfabeto, em maisculo (Y, Z, T, U e V). Embora a notao X(.) seja mais completa, por enfatizar
que a varivel aleatria uma funo, a notao mais abreviada X adotada mais freqentemente.
Um valor especfico correspondente a uma realizao de uma varivel aleatria denotado,
genericamente, pela correspondente letra em minsculo. Essa notao acrescida de um ndice
quando diversos valores distintos so considerados. Assim, x um valor genrico da varivel
aleatria X; x
1
, x
2
e x
3
so trs valores particulares de X.

Exemplo 4.1. Seja o experimento "colocao de uma semente a germinar e observao do
resultado: G (germina) e g (no germina)". Como h interesse na germinao, comum definir a
varivel aleatria X(.) que atribui o nmero 1 ao evento {G} e o nmero 0 ao evento {g}, ou seja:

Estatstica Bsica

68

Exemplo 4.2. Considere-se o experimento constitudo pela seqncia de dois
experimentos especificados no Exemplo 4.1, ou seja, "colocao de duas sementes a germinar e
observao do resultado para cada semente: G ou g". O espao bsico para este experimento :
S = {GG, Gg, gG, gg}.
Uma varivel aleatria de interesse X: nmero de sementes que germinam. Esta varivel
aleatria atribui o nmero 0 ao evento simples {gg}, o nmero 1 a cada um dos eventos simples
{Gg} e {gG}, e o nmero 2 ao evento simples {GG}:


O estabelecimento de um modelo de probabilidade para um experimento aleatrio
consiste em determinar o espao R
x
sobre a linha reta, resultante do mapeamento dos eventos
simples do espao bsico atravs de uma varivel aleatria X de interesse, e uma funo f(x) que
atribua probabilidades a eventos sobre a linha reta que representam os eventos sobre o espao
bsico. Dessa forma, todas as consideraes de interesse referentes a eventos no espao bsico
podem ser feitas atravs de eventos sobre a linha reta. A ulterior interpretao dos resultados
reportada, novamente, a eventos do espao bsico.
O tratamento analtico que se inicia com o estabelecimento do modelo de probabilidade
caracteristicamente distinto para as situaes em que o mapeamento define sobre a linha reta um
nmero contvel ou um nmero no contvel de pontos. Por essa razo, essas duas situaes
devem ser consideradas separadamente.
Neste Captulo, tratar-se- de modelos de probabilidade discretos. A situao de varivel
aleatria contnua ser abordada no Captulo 5.
Varivel Aleatria e Distribuio de Probabilidade Discreta

69
4.2 Varivel Aleatria Discreta
4.2.1 Distribuio de probabilidade
Uma varivel aleatria X uma varivel aleatria discreta se ela assume um
nmero finito ou infinito contvel de valores distintos com probabilidades diferentes
de zero cuja soma das probabilidades igual a 1.

Os dois ltimos exemplos so ilustraes de varivel aleatria discreta.
Neste caso, um modelo de probabilidade para um experimento uma lista dos valores da
varivel aleatria com probabilidades positivas, sejam x
1
, x
2
,..., e das probabilidades que lhes so
associadas, ou seja:
P[X=x
i
] = P
S
[{s | X(s)=x
i
}], i=1,2,...

Uma funo f(x) ou f(x) que atribui probabilidades aos pontos do espao R
x
de uma
varivel aleatria discreta X, tal que f
x
(x) = P[X=x] para xR
x
, denominada funo
distribuio de probabilidade, ou funo de probabilidade, ou distribuio de
probabilidade.

Os valores da varivel aleatria X so denominados pontos de massa, e a funo f(x)
denota a massa associada com o ponto de massa x. Por essa razo, a funo f(x) tambm
denominada funo massa de probabilidade. A notao p(x) algumas vezes usada em lugar de
f(x) para denotar funo de distribuio de probabilidade discreta.
Uma funo de distribuio de probabilidade discreta f(x) efetua um mapeamento dos
pontos do espao R
x
da varivel aleatria X sobre a reta R em pontos do intervalo [0,1]. Assim,
seu domnio situa-se sobre a linha reta R e seu contradomnio, no intervalo [0,1].
Quando a varivel aleatria assume um pequeno nmero de valores distintos com
probabilidades positivas, a distribuio de probabilidade pode ser apresentada na forma da Tabela
4.1.
Tabela 4.1. Tabela de uma distribuio de probabilidade.

Valor de X x
1
x
2
... x
k

Probabilidade f(x
1
) f(x
2
) ... f(x
k
)

Freqentemente, entretanto, mais conveniente representar uma distribuio de
probabilidade por uma frmula para a funo de probabilidade f(x) e a especificao dos valores
possveis de X. Essa representao empregada mais extensivamente, como se ver adiante.
A definio da funo distribuio de probabilidade f(x) pode ser estendida para todo o
conjunto dos nmeros reais, com a condio de que f(x) = 0 para todo xR
x
.

Estatstica Bsica

70
Uma funo f(x) uma funo distribuio de probabilidade de uma varivel
aleatria discreta X se e somente se ela satisfaz s seguintes propriedades, derivadas
dos axiomas do conceito de probabilidade (Seo 3.9):
1) f(x) > 0, para qualquer xR;
2) f x
x
( ) = 1, ou seja, a soma das probabilidades para todos os valores da
varivel aleatria igual a 1.

Qualquer funo que satisfaa a essas duas condies uma funo distribuio de
probabilidade discreta. Entretanto, uma tal funo somente ter sentido prtico se for associada
um experimento aleatrio de interesse.

Exemplo 4.3. Suponha-se que no experimento do Exemplo 4.1 a probabilidade de uma
semente germinar 0,9. Ento, as probabilidades da varivel aleatria X l considerada so:
P[X=1] = P
s
[s=G] = 0,9;
P[X=0] = P
s
[s=g] = 0,1.
Logo, a distribuio de probabilidade de X :
f(x) =
0 9 1
0 1 0
, ,
, ,
x
x



Exemplo 4.4. Considere-se o experimento do Exemplo 4.2. Se a probabilidade de uma
semente germinar 0,9, como a germinao de uma semente independente da germinao da
outra semente, as probabilidades associadas com os valores da varivel aleatria X: nmero de
sementes que germinam, so determinadas como segue, onde os ndices so utilizados para a
identificao das sementes:
P[X=2] = P
S
[{G
1
G
2
}] = P
S
[G
1
]P
S
[G
2
]= 0,90,9 = 0,81;
P[X=1] = P
s
[{G
1
g
2
}{g
1
G
2
}] = P
s
[G
1
g
2
]+P
s
[g
1
G
2
]
= P
s
[G
1
] P
s
[g
2
] + P
s
[g
1
] P
s
[G
2
]
= 0,90,1 + 0,10,9
= 20,90,1 = 0,18;
P[X=0] = P
s
[{g
1
g
2
}] = P
s
[g
1
] x P
s
[g
2
] = 0,1 x 0,1 = 0,01.
Logo, a funo de probabilidade da varivel aleatria X :
f(x) =
0 81 2
0 18 1
0 01 0
, ,
, ,
, ,
x
x
x



A distribuio de probabilidade a contraparte terica da distribuio emprica de
freqncias de que se tratou no Captulo 2. A distribuio de probabilidade um modelo de
probabilidade terico que assinala probabilidades a valores da varivel aleatria. O modelo
derivado de alguma hiptese plausvel referente ao mecanismo de chance concernente ao
Varivel Aleatria e Distribuio de Probabilidade Discreta

71
fenmeno em estudo. Por outro lado, uma distribuio de freqncias construda aps a obteno
de um conjunto de dados atravs de um certo nmero de repeties de um experimento. Essas
repeties constituem uma amostra aleatria de todos os possveis conjuntos de repeties do
experimento. Diferentes conjuntos provero diferentes distribuies de freqncias, enquanto que
uma distribuio de probabilidade determinada pelas hipteses postuladas. Suponha-se, por
exemplo, que se postula a hiptese de que uma moeda perfeita e lanada sem tendenciosidade. A
distribuio de probabilidade da varivel aleatria X: nmero de caras, apresentada na Tabela
4.2. Suponha-se que, aps o lanamento da moeda 100 vezes, foi obtida a distribuio de
freqncias apresentada na Tabela 4.3. Para um nmero grande de lanamentos, as freqncias
relativas aproximam-se das probabilidades tericas (conceito emprico de probabilidade). As
freqncias relativas obtidas podem constituir uma indicao para suspeita da adequabilidade do
modelo que gerou a distribuio de probabilidade terica.

Tabela 4.2. Distribuio de probabilidade do evento "cara" no
experimento de lanamento de uma moeda
perfeita sem tendenciosidade.

x
i
0 1
f(x
i
) 0,5 0,5

Tabela 4.3. Distribuio de freqncias relativas do evento
"cara" em 100 lanamentos de uma moeda.

x
i
0 1
n
i
41 59
f
i
0,41 0,59

4.2.2 Representao grfica de uma distribuio de probabilidade
A distribuio de probabilidade pode ser representada, graficamente, por um diagrama
de linhas. Os valores distintos da varivel aleatria X com probabilidades positivas so marcados
sobre um eixo horizontal. De cada um desses pontos x, traa-se uma linha vertical com altura igual
correspondente probabilidade f(x). A representao da distribuio de probabilidade do
experimento de germinao de duas sementes, considerada no Exemplo 4.4, apresentada na
Figura 4.2.
Estatstica Bsica

72

Figura 4.2. Representao grfica da distribuio de probabilidades
do nmero de sementes que germinam em um
experimento de germinao de duas sementes em que a
probabilidade de uma semente germinar 0,9.

A representao grfica de uma distribuio de probabilidade revela como a
probabilidade total 1 distribuda sobre os distintos valores da varivel aleatria. Essa informao
muito importante, particularmente para propsito de comparao de duas ou mais distribuies
de probabilidades quanto extenso de suas similaridades e diferenas.

Exemplo 4.5. Em uma pesquisa de mercado, os registros da venda diria de compotas de
dois fabricantes por um longo perodo so utilizados para avaliar as distribuies de
probabilidades do nmero de latas de compotas vendidas das duas procedncias. As distribuies
de probabilidades das variveis aleatrias X: nmero de latas de compotas do fabricante A, e Y:
nmero de latas de compotas do fabricante B, so apresentadas na Tabela 4.4. Suas representaes
geomtricas esto na Figura 4.3.

Tabela 4.4. Distribuies de probabilidades das quantidades de latas de
compotas de dois fabricantes, vendidas diariamente nos
supermercados de uma localidade.

Fabricante Distribuio de probabilidades
A x 0 1 2 3 4 5
f(x) 0,1 0,1 0,3 0,2 0,2 0,1
B y 0 1 2 3
f(y) 0,2 0,4 0,3 0,1

Varivel Aleatria e Distribuio de Probabilidade Discreta

73

Fabricante A Fabricante B
Figura 4.3. Distribuies de probabilidades das quantidades de latas de
compota de dois fabricantes vendidas em uma localidade.

Uma comparao de duas distribuies de probabilidades ou de suas representaes
grficas elucidativa, mas subjetiva, pois diferentes pessoas podem extrair diferentes concluses
sobre a extenso das similaridades. Assim, desejvel atribuir medidas numricas concretas a
aspectos especficos das distribuies, de modo que comparaes possam ser efetuadas em
avaliaes objetivas. Medidas numricas que caracterizam o centro e a disperso de uma
distribuio de probabilidade so importantes para tais propsitos. A medida de centro mais
comumente usada a mdia, ou valor esperado, e a de disperso a varincia.
Em Estatstica Descritiva, foi visto como determinar a mdia e a varincia de uma
distribuio de freqncias de um conjunto de dados. As distribuies de probabilidades so
modelos tericos em que as probabilidades so as freqncias relativas para a populao. Assim,
semelhantes medidas de centro e de disperso podem ser definidas para elas como extenses das
correspondentes medidas para amostras.
4.2.3 Mdia de uma distribuio de probabilidade
Recorde-se que a mdia de uma distribuio de freqncias dada por:
f i i
i
x c f

,
onde c
i
o centro da i-sima classe, ou o i-simo nvel da varivel (para varivel com um nmero
pequeno de distintos nveis), e f
i
a correspondente freqncia relativa. A mdia da varivel
aleatria X ou de sua distribuio de probabilidade, ou mdia populacional, definida como uma
extenso desse conceito:

Estatstica Bsica

74
A mdia da varivel aleatria X, ou da distribuio de probabilidade de X, tambm
denominada valor esperado de X, denotada por E(X) ou , definida como:
E(X) = x f ( x )
i i
i

,
ou seja, a soma dos produtos dos valores da varivel aleatria X com probabilidades
positivas pelas correspondentes probabilidades.

Observe-se que o somando x
i
f(x
i
) o i-simo valor possvel da varivel aleatria X
multiplicado pela sua correspondente probabilidade, e E(X) a soma desses produtos. Assim,
E(X) uma "mdia" dos valores que a varivel aleatria X assume com cada um desses valores
ponderado pela sua correspondente probabilidade. Pesos maiores so atribudos a valores mais
provveis de X.

Exemplo 4.6. Considere-se a distribuio de probabilidade para o experimento
germinao de duas sementes do Exemplo 4.4. A determinao do valor esperado da varivel
aleatria X: nmero de sementes que germinam, pode ser feita com o auxlio da Tabela 4.5.

Tabela 4.5. Determinao do E(X) para a varivel aleatria X do Exemplo
4.4.

x 0 1 2 Soma
f(x) 0,01 0,18 0,81 1,00
x f(x) 0 0,18 0,81 1,80 = E(X)

Ou seja,
E(X) = 00,01+10,18+20,81 = 1,80.

O valor esperado no , necessariamente, um valor possvel da varivel aleatria, como
ilustra o Exemplo 4.6. Nesse caso, no se pode "esperar" obter o valor esperado. Isso uma
contradio designao de "valor esperado". Uma designao mais apropriada seria "valor
mdio". Entretanto, neste texto adota-se a designao usual de valor esperado.
A mdia =E(X) o centro de gravidade (centride) da distribuio da massa unitria
que determinada por f(x). De fato, se a massa total 1 distribuda sobre os segmentos do
diagrama de linhas correspondente a uma distribuio de probabilidade, com a massa proporcional
aos segmentos, ento E(X) situa-se sobre o ponto de equilbrio da figura. Assim, E(X) indica o
"centro" dos pontos em que se situam os valores possveis da varivel aleatria X. Essa
propriedade do valor esperado uma justificativa para seu uso como medida de centro de uma
varivel aleatria, ou de sua distribuio de probabilidade. Outras propriedades do valor esperado
como medida de posio de uma distribuio de probabilidade so anlogas s propriedades da
mdia aritmtica como medida de posio de um conjunto de dados de uma amostra, ou de sua
distribuio de freqncias.
Varivel Aleatria e Distribuio de Probabilidade Discreta

75
O conceito de valor esperado pode ser estendido para uma funo de uma varivel
aleatria: Se g(x) uma funo de uma varivel aleatria X, ento:
E[g(X)] = g( x) f ( x)
x

,
onde a soma feita sobre todos os valores de X com probabilidades positivas, com g(x) e f(x)
avaliadas nesses valores.
Propriedades do valor esperado
O smbolo E, que significa a operao de determinao do valor esperado, um operador
com as seguintes propriedades, onde a e b so duas constantes:
1) E(a) = a;
2) E(bX) = b E(X);
3) E(a+bX) = a+bE(X).
Essas propriedades so imediatas da definio de valor esperado de uma funo g(X) de
X. Para derivar a propriedade 3, por exemplo, toma-se g(X)=a+bX na expresso de E[g(X)];
obtm-se:
E(a+bX) = ( ) ( ) a bx f x
x
+
= a f x b x f x
x x
( ) ( ) +
= a + bE(X),
visto que f x
x
( ) = 1.
4.2.4 Varincia de uma distribuio de probabilidade
A varincia de uma distribuio de freqncias :
s (c x ) f
2
i f
2
i
i

.
A varincia da varivel aleatria X ou de sua distribuio de probabilidade, ou varincia
populacional, definida como uma extenso desse conceito:

A varincia da varivel aleatria X ou da distribuio de probabilidade de X,
designada por Var(X) ou
x
2
ou
2
, definida como:
Var(X) =
[ ]
x (X) f(x )
i
2
i
i
E ,
com a soma sobre todos os valores de X com probabilidades positivas.

Logo, a expresso da varincia de X :
Var(X) = E[X-E(X)]
2
=
= E(X
2
)-[E(X)]
2
.
Estatstica Bsica

76
Observe-se que o somando na expresso da Var(X) o quadrado da diferena entre o i-
simo valor possvel da varivel aleatria X e a mdia de X, multiplicado pela probabilidade de
que X assuma seu i-simo valor. E(X) a soma desses produtos. Logo, Var(X) a mdia
ponderada desses quadrados de diferenas que atribui pesos mais elevados s diferenas elevadas
ao quadrado mais provveis. Assim, a varincia de uma varivel aleatria cujos valores tendem a
ser afastados de sua mdia maior do que a de uma varivel aleatria com os mesmos valores mas
que tendem a ser mais prximos de sua mdia. Essa propriedade justifica a varincia como uma
medida de variabilidade ou disperso de uma varivel aleatria, ou de sua distribuio.
Foi observado anteriormente que a mdia E(X) o centro de gravidade da massa unitria
determinada pela funo distribuio de probabilidade f(x). A varincia tambm tem um
significado fsico. Ela representa o momento de inrcia da mesma distribuio com respeito ao
eixo perpendicular ao eixo x pelo centro de gravidade E(X).
A unidade de medida da varincia o quadrado da unidade de medida da varivel
aleatria a que corresponde, o que pode ser inconveniente para a interpretao da varincia como
medida de disperso em aplicaes. Uma medida de disperso alternativa, mais conveniente sob
esse aspecto, o desvio padro, definido como a raiz quadrada da varincia, ou seja:

x
Var(X) .

Exemplo 4.7. A varincia da varivel aleatria considerada no Exemplo 4.4 pode ser
determinada com o auxlio da Tabela 4.6.

Tabela 4.6. Determinao da Var(X) para a varivel aleatria X do Exemplo 4.4.

x 0 1 2 soma
f(x) 0,01 0,18 0,81 1,00
xf(x) 0 0,18 1,62 1,80 = E(X)
x
2
f(x) 0 0,18 3,24 3,42 = E(X
2
)

Logo,
Var(X) = 3,42-1,80
2

= 0,18.
Donde:

x
0 18 , = 0,4243.
Propriedades da varincia
As seguintes propriedades so derivadas da definio de varincia: Se X uma varivel
aleatria e a e b so duas constantes, ento:
1) Var(X) > 0, ou seja, a varincia no negativa.
2) Var(a) = 0, ou seja, a varincia de uma constante nula.
Varivel Aleatria e Distribuio de Probabilidade Discreta

77
3) Var(bX) = b
2
Var(X).
4) Var(a+bX) = b
2
Var(X).
4.3 Distribuies Discretas Importantes
Alguns modelos de probabilidade so comuns a experimentos de diversas reas. Assim,
por exemplo, o mesmo modelo estabelecido para o experimento "colocao de uma semente a
germinar e observao do resultado: G ou g" aplica-se a qualquer outro experimento de duas
alternativas (isto , experimento com a mesma estrutura), tais como "observao do sexo de um
animal", "observao da cor dos olhos de um indivduo (claros e escuros)" e "observao do
carter aspas em um bovino da raa Angus". Dessa forma, importante o estabelecimento dos
modelos de probabilidade mais usuais para famlias de experimentos de estrutura comum.
Nos exemplos recm formulados, a probabilidade do evento "sucesso" , em geral,
desconhecida. Assim, o modelo de probabilidade postulado para um problema particular deve
incluir a probabilidade desconhecida para a populao como um valor desconhecido, ou seja, um
parmetro, e a probabilidade para qualquer valor individual da varivel aleatria especificada em
termos deste parmetro. De fato, nas aplicaes, um modelo de probabilidade especifica uma
famlia paramtrica de distribuies de probabilidade, indexada por um ou mais parmetros.
Os modelos de probabilidade de varivel aleatria discreta mais importantes so
apresentados e estudados a seguir.
4.3.1 Distribuio uniforme discreta
Uma varivel aleatria discreta X tem uma distribuio uniforme se ela atribui a mesma
probabilidade para todos os valores xR. Seja X uma varivel aleatria que atribui probabilidades
positivas iguais aos N primeiros nmeros inteiros positivos. Ento, X tem distribuio uniforme
discreta, expressa pela equao:
f(x) =
1
N
, x = 1,2,...,N,
onde o parmetro N definido para os inteiros positivos, ou seja: N=1,2,...
Essa funo representada, geometricamente, na Figura 4.4.

Estatstica Bsica

78

Figura 4.4. Distribuio de probabilidade de uma varivel aleatria
uniforme discreta.

Esse o modelo de probabilidade para a extrao aleatria de um elemento de uma
coleo. - Mdia e varincia:
E(X) =1.
1
N
2.
1
N
... N
1
N
1
N
(1 2 N)
1
N
.
N(N 1)
2
N 1
2
+ + + + + +
+

+
... .
Var(X) =
N
2
1
12

.
4.3.2 Distribuio de Bernoulli
Diz-se que um experimento um experimento de Bernoulli se seu espao bsico
compreende dois eventos simples. Como usualmente h interesse no registro da ocorrncia de um
dos dois eventos simples, o evento de interesse designado "sucesso" e o outro evento, "falha" ou
"insucesso". A varivel aleatria de Bernoulli assinala o nmero 1 para o evento simples sucesso e
o nmero zero para o evento simples falha:
X(s)
1, s s (sucesso)
0, s s (fracasso)
1
2


O modelo de probabilidade de Bernoulli definido pela atribuio da probabilidade p ao
sucesso e de seu complemento, 1-p, falha. A funo de probabilidade de Bernoulli tem a seguinte
expresso:
f(x)
p, x 1
1 p, x 0


= p
x
(1-p)
x
, x=0,1,2, ... ,
onde o parmetro p um nmero real no intervalo [0,1].
A representao geomtrica da distribuio de Bernoulli dada na Figura 4.5.

Varivel Aleatria e Distribuio de Probabilidade Discreta

79

Figura 4.5. Distribuio de probabilidade de Bernoulli.
- Mdia e varincia:
E(X) = 1p + 0(1-p) = p;
E(X
2
) = 1
2
p + 0
2
(1-p) = p.
Logo,
Var(X) = p-p
2
= p(1-p).

Exemplo 4.8. A distribuio do Exemplo 4.3 ilustra a distribuio de Bernoulli:
f(x)
0,9, x 1
0,1, x 0


= 0,9
x
0,1
1-x
, x= 0,1
Logo,
E(X) = 0,9.
Var(X) = 0,9(1-0,9) = 0,09.
4.3.3 Distribuio binomial
A realizao sucessiva de um nmero fixo n de experimentos de Bernoulli independentes
e com mesma probabilidade p de sucesso constitui um experimento binomial. A varivel
aleatria binomial X a soma dos sucessos em n ensaios de Bernoulli com essas propriedades. Ou
seja, uma varivel binomial X definida como: X = X
1
+X
2
+...+X
n
, onde X
i
(i=1,2,...,n) so
variveis aleatrias com distribuio de Bernoulli, independentes e com mesma distribuio:
( ) f x
p , x 1
1 p x 0
i
i
i

,

Essa varivel aleatria X: nmero de sucessos, tem distribuio binomial.
Para derivar a expresso da distribuio de probabilidade da varivel aleatria binomial
X, observe-se que a probabilidade de x sucessos e n-x falhas, em uma ordem especfica dos n
Estatstica Bsica

80
ensaios de Bernoulli, p
x
(1-p)
n-x
. Nesta expresso, h um fator p para cada um dos x sucessos e
um fator 1-p para cada uma das n-x falhas; os x fatores p e os n-x fatores 1-p so multiplicados,
pela pressuposio de independncia. Como a probabilidade p
x
(1-p)
n-x
aplica-se a qualquer
seqncia dos n ensaios de Bernoulli com x sucessos e n-x falhas e essas seqncias so
mutuamente exclusivas, essa probabilidade deve ser multiplicada pelo nmero dessas seqncias.
O nmero de modos em que se pode selecionar os x ensaios com sucesso do total de n ensaios
C
n
x
. Portanto, a probabilidade de x sucessos em n ensaios C
n
x
p
x
(1-p)
n-x
.
A varivel aleatria X tem distribuio binomial se e apenas se sua distribuio de
probabilidade dada por:
f(x) = C
n
x
p
x
(1-p)
n-x
, x=0,1,2,...,n,
onde p e n so parmetros, 0<p<1 e n inteiro positivo, e C
n
x
o nmero de combinaes de x
elementos tomados de n:
( )( ) ( )
( )
C
n n 1 n 2 ... n x 1
x(x 1) x 2 ...2.1
n
x

+

.
Indica-se que uma varivel aleatria X tem distribuio binomial correspondente soma
dos sucessos de n experimentos de Bernoulli independentes, com probabilidade de sucesso p, pela
notao X ~ b(n;p).
A designao "binomial" provm do fato de que a probabilidade para cada valor de x
igual ao correspondente termo da expanso binomial de [p+(1-p)]
n
= p
0
(1-p)
1
+p (1-p)
n-1
+...+p
i

(1-p)
n-i
+...+ p
n-i
(1-p)
1
+p
n
(1 -p)
0
.
A distribuio binomial depende de dois parmetros, p e n. Quando n=1, ela reduz-se
distribuio de Bernoulli. Para qualquer valor de n, ela simtrica se e somente se p=0,5. A
representao geomtrica da distribuio binomial ilustrada na Figura 4.6, para as variveis
aleatrias X ~ b(4;0,5) e Y ~ b(4;0,3), cujas distribuies de probabilidade so dadas na Tabela
4.7.

Tabela 4.7. Distribuies de probabilidade das variveis aleatrias X ~
b(4;0,5) e Y ~ b(4;0,3).

Var. aleatria 0 1 2 3 4
X ~ b(4;0,5) 0,0625 0,25 0,375 0,25 0,0625
Y ~ b(4;0,3) 0,2401 0,4116 0,2646 0,0756 0,0081

Varivel Aleatria e Distribuio de Probabilidade Discreta

81

Figura 4.6. Distribuies de probabilidades das variveis aleatrias X ~
b(4;0,5) e Y ~ b(4;0,3).
- Mdia e varincia:
E(X) = np.
Var(X) = np(1-p).

Exemplo 4.9. Suponha-se que cinco sementes so selecionadas, aleatoriamente, de um
saco de sementes cuja probabilidade de germinar 0,9. Qual a probabilidade de que 3 das 5
sementes germinem?
Esse experimento binomial, j que para cada semente h duas alternativas: germina e
no germina; p=0,9 a probabilidade de uma semente germinar e n=5 o nmero de sementes que
so colocadas a germinar. Logo, a funo de probabilidade de X: nmero de sementes que
germinam, :
f(x) = C
5
x
. , . , 0 9 0 1
5 x x
;
portanto, a probabilidade de que 3 das 5 sementes germinem :
[ ] P x = 3 = C
5
3
. , . , 0 9 01
3 3 2

=
54 3
3 21
0 9 01 0 0729
3 2
. .
. .
. , . , , .
A mdia e a varincia do nmero de sementes que germinam so:
E(X) = 50,9 = 4,5;
Var(X) = 50,90,1 = 0,45.

Probabilidades da distribuio binomial envolvem potncias de p e 1-p cujo clculo torna-
se trabalhoso quando o parmetro n moderadamente elevado. Por essa razo, tabelas dessas
probabilidades so disponveis em vrios textos. A Tabela I do Apndice apresenta os valores das
probabilidades acumuladas P[Xc] =
c
n x n x
c
x 0
C p (1 p)

para alguns valores de n, p e c.


Estatstica Bsica

82
Probabilidades para outros eventos podem ser obtidas pela expresso desses eventos em termos de
eventos da forma [Xc] e aplicao de propriedades da probabilidade, como ilustram os seguintes
exemplos:
P[X>x] = 1-P[Xx];
P[X=x] = P[Xx] - P[Xx-1];
P[aXb] = P[Xb] - P[Xa-1].

Exemplo 4.10. Suponha-se que a percentagem de germinao de sementes de uma
cultivar de feijo disponveis em um depsito 80%. Se quinze sementes desse lote so plantadas,
qual a probabilidade de que dez ou mais sementes germinem?
Pressupondo que o resultado seja independente para cada semente, a varivel aleatria X:
nmero de sementes que germinam tem distribuio binomial com n=15 e p=0,8. Ento a
probabilidade de que dez ou mais sementes germinem :
P[X10] = C 0,8 0, 2
15
x
x 10
15
x 15 x

.
Entretanto, esta probabilidade pode ser calculada, facilmente, com o auxlio da Tabela I, como
segue:
P[X10] = 1-P[X9] = 1-0,061 = 0,939.
4.3.4 Amostragem de uma populao dicotmica
Uma populao dicotmica aquela em que a caracterstica em considerao tem duas
alternativas. Na amostragem de indivduos de uma tal populao, freqentemente de interesse a
distribuio do nmero de indivduos com uma das alternativas, denominada "sucesso".
Em um processo de amostragem aleatria, cada unidade da populao tem a mesma
probabilidade de ser selecionada. Na extrao de uma amostra de duas ou mais unidades, um de
dois procedimentos alternativos pode ser adotado: as unidades so selecionadas sucessivamente de
modo que cada unidade extrada recolocada na populao antes da extrao da unidade seguinte,
ou as unidades extradas no so recolocadas na populao. Esses dois procedimentos de
amostragem sero tratados a seguir atravs de um exemplo.

Exemplo 4.11. Suponha-se que um lote de um certo equipamento contm 12 unidades
das quais 9 so perfeitas e 3 defeituosas. Qual a probabilidade de que, selecionando-se,
aleatoriamente, trs unidades, duas sejam perfeitas?
Amostragem com reposio
A primeira unidade selecionada, a qualidade do equipamento (perfeito ou defeituoso)
registrada e a unidade recolocada no lote antes da prxima seleo. A reposio da unidade
assegura a manuteno da probabilidade de seleo de um equipamento perfeito na segunda
extrao e a independncia dos dois eventos: equipamento perfeito na primeira seleo e
equipamento perfeito na segunda seleo. Trata-se, portanto, de uma sucesso de dois
experimentos de Bernoulli independentes e com igual probabilidade de sucesso. Nestas condies,
Varivel Aleatria e Distribuio de Probabilidade Discreta

83
a probabilidade do nmero de equipamentos perfeitos na seleo aleatria de trs equipamentos
tem distribuio binomial com probabilidade de sucesso p=9/12=0,75:
P[X=x] = C (0,75) 0,25) , x 0,1,2,3.
3
x x
(
3 x

Logo,
2 2 3 2 2
3
3 2
P[X=2] = C (0,75) (0,25) 0,75 0,25 0,4219
2 1


Amostragem sem reposio
A primeira unidade selecionada e no reposta no lote antes da seleo da segunda
unidade. Semelhantemente, uma segunda unidade selecionada e tambm no recolocada no
lote antes da seleo da terceira unidade, e assim sucessivamente. Com esse procedimento a
condio de independncia dos experimentos de Bernoulli violada. De fato, a probabilidade de
sucesso para a primeira unidade selecionada : P[equipamento perfeito] = 9/12. Se a primeira
unidade selecionada perfeita, restam no lote para a segunda seleo 11 unidades das quais 8 so
perfeitas. Ento, a probabilidade de que a segunda unidade seja perfeita, dado que a primeira
unidade selecionada perfeita,
8
11
9
12
, o que estabelece a falta de independncia.

Desta forma, as condies do experimento binomial no se verificam na amostragem sem
reposio. Portanto, a distribuio do nmero de sucessos para esse procedimento de amostragem
no binomial.
Observe-se, entretanto, que a probabilidade de sucesso na segunda seleo permanece
inalterada, ou seja, a probabilidade (no condicionada) de sucesso 9/12 em cada um dos
experimentos de Bernoulli (isto , em cada uma das selees). Considere-se a probabilidade de
selecionar um equipamento perfeito na segunda seleo. Denote-se por S e F os eventos sucesso e
falha em cada uma das selees e acrescente-se um ndice para indicar a ordem da seleo.
Observe-se que um sucesso na segunda seleo pode resultar quando ocorre sucesso ou insucesso
na primeira seleo. Ento, a probabilidade de sucesso na segunda seleo :
[ ] ( )
[ ]
P S P (S S ) F S
2 1 2 1 1
P[S S ] P[F S ]
1 2 1 1
+ ,
dada a mtua exclusividade dos dois eventos. Mas
[ ] [ ] [ ] P S S P S P S |S
9
12
8
11
1 2 1 2 1

e, semelhantemente,
[ ] [ ] P[F S ] = P F P S | F
3
12
9
11
.
1 1 1 2 1

Logo,
[ ] P S
9
12
8
11
3
12
9
11
0,75
2
+ .
Estatstica Bsica

84
4.3.5 Distribuio hipergeomtrica
O processo de amostragem aleatria de indivduos de uma populao finita, sem
reposio, o que corresponde a uma sucesso de n ensaios de Bernoulli em que no satisfeita a
condio de independncia, um experimento hipergeomtrico. A varivel aleatria X: nmero
de sucessos em um total de n ensaios (ou nmero de indivduos em uma amostra de tamanho n
com uma especfica das duas alternativas da caracterstica em considerao), tem a distribuio
hipergeomtrica.
Seja uma populao de N elementos dos quais M (M<N) manifestam uma alternativa A
de uma certa caracterstica, e, portanto, N-M no a manifestam. Suponha-se que se seleciona desta
populao uma amostra de n elementos, sem reposio. Seja X o nmero de elementos da amostra
que manifestam a alternativa A. Para determinar a distribuio de X, observe-se que o nmero x de
elementos da amostra que manifestam a alternativa A deve proceder do grupo dos M elementos da
populao com esta alternativa, e os n-x elementos que no manifestam a alternativa A devem vir
do outro grupo dos N-M elementos. Ento, a distribuio de X pode ser derivada pela regra das
combinaes, como segue.
O nmero total de amostras de n elementos que podem ser extrados da populao C
N
x
.
O nmero de amostras de n elementos com x elementos com a alternativa A e n-x elementos com a
outra alternativa da caracterstica C C
M
x
N M
n x

. Logo, a distribuio do nmero de sucessos X :


x n x
M N M
n
N
C C
f(x) , x 0, 1, 2,..., n,
C


onde os parmetros n, N e M satisfazem s seguintes condies: N um inteiro positivo e M e n
so inteiros no negativos tais que nM e nN-M.
- Mdia e varincia
A mdia e a varincia da distribuio hipergeomtrica so, respectivamente:
E(X) = np, p =
M
N
(proporo de elementos na populao com a alternativa A da
caracterstica)
e
Var(X) = np(1-p)
N n
N 1

.
Observe-se que a mdia da distribuio hipergeomtrica a mesma da distribuio
binomial, que corresponde amostragem efetuada indivduo por indivduo, com reposio.
Entretanto, a varincia a varincia da distribuio binomial multiplicada pelo fator
N n
N 1

, que
denominado "fator de correo para populao finita". Quando n/N (proporo do tamanho da
amostra em relao ao tamanho da populao) muito pequeno, o fator de correo prximo de
1, de modo que a distribuio binomial aproxima a distribuio hipergeomtrica.

Varivel Aleatria e Distribuio de Probabilidade Discreta

85
Exemplo 4.12. Considere-se o experimento do Exemplo 4.11 para a situao de
amostragem sem reposio. Nestas circunstncias, a distribuio de probabilidade da varivel
aleatria X: nmero de unidades perfeitas em 3 unidades selecionadas de um lote de 12
equipamentos dos quais 9 so perfeitos, hipergeomtrica:
x 3 x
9 3
3
12
C C
f(x)
C



x 3 x
9 3
1
C C , x 0,1, 2,...
220


Ento, a probabilidade de 2 unidades perfeitas entre as 3 selecionadas :
[ ]
2 3 2
9 3
1 1
P X 2 C C 36 3 0,49.
220 220


4.3.6 Distribuio geomtrica
O experimento geomtrico outro experimento derivado de uma seqncia de ensaios de
Bernoulli, independentes e com a mesma probabilidade p de sucesso. Se o nmero n desses
ensaios fixo, o experimento um experimento binomial e a varivel aleatria X: nmero de
sucessos, uma varivel aleatria com distribuio binomial b~(n,p). Se, em vez de fixar o
nmero de ensaios antecipadamente, repete-se os ensaios de Bernoulli at a ocorrncia do primeiro
sucesso, o experimento um experimento geomtrico. Ento, o nmero de sucessos fixo em 1 e
o nmero de ensaios uma varivel aleatria.
Seja X o nmero de ensaios efetuados at a ocorrncia do primeiro sucesso. Os valores
possveis de X so 1, 2, ..., onde X=x se e somente se x-1 falhas ocorrem em seqncia, antes da
ocorrncia do primeiro sucesso. A seqncia de ensaios de Bernoulli encerra-se quando o primeiro
sucesso ocorre. Assim, da condio de independncia dos ensaios, segue-se:
f(x) = (1-p)
x-1
p, x=1,2,...,
onde o parmetro p satisfaz 0<p1.
Essa distribuio de probabilidade denominada distribuio geomtrica, tambm
designada distribuio discreta de espera de tempo. Esta ltima denominao deriva-se do fato
de que, se a realizao de um ensaio de Bernoulli toma uma unidade de tempo, ento a espera de
tempo para a obteno de um nico sucesso a varivel aleatria com a distribuio geomtrica.
A distribuio geomtrica til no estudo de uma caracterstica rara de uma populao,
como, por exemplo, a incidncia de uma doena rara do sangue. Nesses casos, poder-se-ia
examinar um nmero especfico n de indivduos e contar o nmero afetado, ou examinar
indivduos at que seja encontrada uma pessoa afetada. A primeira alternativa corresponde
distribuio binomial, mas a amostra de n indivduos pode no conter uma nica pessoa afetada,
de modo que se obteria pouca informao sobre a incidncia da doena. O segundo mtodo de
amostragem, correspondente distribuio geomtrica, garante a presena de um indivduo com a
incidncia da doena na amostra.
Estatstica Bsica

86
- Mdia e varincia
A mdia e a varincia da distribuio geomtrica so:
E(X) = 1/p,
Var(X) = (1-p)/p
2
.

Exemplo 4.13. A incidncia de uma doena que afeta 5 por cento dos animais de um
rebanho de 50.000 bovinos deve ser avaliada pelo seguinte processo de amostragem dos animais:
Animais do rebanho so selecionados aleatoriamente, um por um, e examinados at que o primeiro
animal afetado pela doena seja encontrado. Determine a distribuio de probabilidade da varivel
aleatria X: nmero de ordem do primeiro animal que manifesta a doena. Quantos animais se
espera sejam examinados utilizando este mtodo de amostragem?
Se a populao consideravelmente grande, como no presente caso, pode-se supor que a
percentagem de animais afetados permanea praticamente constante nas selees sucessivas de um
animal. Logo, a distribuio da varivel aleatria X geomtrica, ou seja:
P[X=x] = 0,95
x-1
0,05, x=1,2,...
O nmero de animais que se espera sejam examinados at encontrar o primeiro que manifeste a
doena :
E(X) = 1/0,05 = 20.
4.3.7 Distribuio binomial negativa
Considere-se uma generalizao do experimento geomtrico: uma sucesso de ensaios de
Bernoulli independentes e com mesma probabilidade de sucesso p, at a ocorrncia do k-simo
sucesso. Esse experimento denominado um experimento binomial negativo, ou experimento
de Pascal.
Para derivar a distribuio de probabilidade da varivel aleatria X: nmero de ensaios
para a produo de k sucessos, observe-se que a ocorrncia do k-simo sucesso no x-simo ensaio
significa que um sucesso no x-simo ensaio precedido de k-1 sucessos e x-k falhas, em alguma
ordem especificada. Como cada sucesso ocorre com probabilidade p e cada falha com
probabilidade 1-p, a probabilidade do k-simo sucesso em uma ordem especfica ocorrer no x-
simo ensaio :
p
k-1
.(1-p)
x-k
p = p
k
(1-p)
x-k
.
Mas o nmero de ordens em que k-1 sucessos ocorrem em x-1 ensaios dado pela regra das
combinaes: C
x 1
k 1

. Como esses eventos "o k-simo sucesso ocorre no x-simo ensaio" so


mutuamente exclusivos para ordens de sucessos diferentes e tm a mesma probabilidade p
k
.(1-p)
x-
k
, a probabilidade de ocorrer o k-simo sucesso no x-simo experimento obtida pela
multiplicao da probabilidade do k-simo sucesso em uma ordem especfica ocorrer no x-simo
ensaio pelo nmero de diferentes ordens dos k sucessos. Portanto, a distribuio de probabilidade
da varivel aleatria X: nmero do ensaio em que ocorre o k-simo sucesso, :
f(x) = C
x 1
k 1

p
k
(1-p)
x-k
, x=k, k+1, k+2,...,
onde p e k so parmetros tais que 0<p1 e k=0,1,2,...
Varivel Aleatria e Distribuio de Probabilidade Discreta

87
- Mdia e varincia
A mdia e varincia da distribuio de Pascal so:
E(X) = k/p;
Var(X) = k(1-p)/p
2
.

Exemplo 4.14. Suponha que o experimento considerado no Exemplo 4.13 seja
modificado de modo que os animais so selecionados e examinados at a ocorrncia de 10 animais
afetados com a doena. Ento, a distribuio de probabilidade da varivel aleatria X: nmero de
animais que devem ser examinados at encontrar 10 animais com o sintoma da doena, :
P[X=x] = C
x 1
9

0,05
10
.0,95
x-10
, x=10,11,12,...
4.3.8 Distribuio de Poisson
Um experimento de Poisson uma seqncia de ensaios de Bernoulli com as mesmas
caractersticas de um experimento binomial, mas em que o interesse reside no no nmero de
sucessos em n ensaios mas no nmero de sucessos em um dado intervalo de tempo ou de espao.
Por exemplo, nmero de chuvas de granizo que ocorrem em um ano; nmero de frutos de uma
planta que caem em uma safra em decorrncia de uma doena; nmero de partos gmeos em um
rebanho de ovinos em um perodo de pario; nmero de bactrias por milmetro cbico em uma
dada cultura; e nmero de lebres em uma rea. Tais experimentos so caracterizados pelo nmero
esperado de sucessos por unidade de tempo ou de espao, enquanto o experimento binomial
caracterizado pelo nmero de sucessos na realizao de n ensaios. A especificao do intervalo de
tempo ou da regio substitui a especificao do tamanho n de um experimento binomial.
Um experimento binomial baseado em ensaios de Bernoulli, caracterizados pela
probabilidade comum p de sucesso. Em um experimento de Poisson, o intervalo de tempo ou a
regio em considerao deve ser dividido em subintervalos de amplitudes suficientemente
pequenas para garantir que em cada subintervalo de tempo ou sub-regio seja efetuado apenas um
ensaio de Bernoulli; por exemplo, ocorra apenas um granizo, ou caia apenas um fruto, ou aparea
apenas uma bactria. No exemplo do nmero de bactrias por milmetro cbico, por menor que
seja a unidade de rea considerada, sempre h a possibilidade da ocorrncia de mais de uma
bactria. Ento, o espao deve ser subdividido em unidades de reas to pequenas que seja
garantido que a probabilidade da ocorrncia de mais de uma bactria em uma unidade de rea seja
insignificante. Quando um intervalo de tempo ou de espao dividido em um nmero n de
subintervalos de modo que a ocorrncia de mais de um sucesso seja insignificante, tem-se uma
situao aproximada de um experimento de Poisson. Nessa situao, n usualmente muito grande
e a probabilidade p de sucesso muito pequena.
A varivel aleatria X: nmero de sucessos no intervalo de tempo ou de espao fixado,
tem a distribuio de Poisson:
f(x) =
e k
x!
k x
, x=0,1,2,...,
onde o parmetro k>0 o nmero mdio de sucessos que ocorrem no dado intervalo de tempo ou
de espao, e e=2,71828...
Estatstica Bsica

88

Exemplo 4.15. O nmero mdio de frutos que caem de um pessegueiro em uma safra
com a durao de 20 dias 2. Qual a distribuio de probabilidade da varivel aleatria X:
nmero de frutos que caem de um pessegueiro durante uma safra? Determine a probabilidade de
que em uma safra caia apenas um fruto de um pessegueiro?
A varivel aleatria X tem distribuio de Poisson com k=2:
P[X=x] =
e 2
x!
2 x
, x=0,1,2,...
Logo,
P[X=1] =
e 2
1!
e
2
2,71828
0,7358
2 1
2
2

2 .
A distribuio de Poisson tambm til como uma aproximao da distribuio binomial,
quando o nmero n de ensaios de Bernoulli muito grande e a probabilidade p de sucesso muito
pequena. Nessa situao, o clculo direto de probabilidades binomiais pode envolver clculos
trabalhosos. De fato, demonstra-se que, se uma varivel aleatria X tem distribuio binomial
b~(n;p) com n muito grande e p muito pequeno de modo que np permanece constante, ento a
distribuio de X aproxima-se da distribuio de Poisson com k=np, quando n cresce
indefinidamente.

Exemplo 4.16. Um medicamento para o tratamento de uma doena de bovinos manifesta
um efeito colateral raro em 0,25% dos animais a que administrado. Qual a probabilidade de
que 10 animais de um rebanho de 3.000 animais manifestem o efeito colateral?
Trata-se, claramente, de um experimento binomial com n=3.000 e p=0,0025. A
probabilidade em questo dada por:
P[X=10] =
10 10 2.990
3.000
C 0, 0025 0, 9975 !
Probabilidades para a varivel aleatria X podem ser obtidas, com boa aproximao, pela
distribuio de Poisson com k = np = 3.0000,0025 = 7,5:
P[X=x] =
-7,5 x
e 7, 5
x!
.
Donde:
P[X=10] =
-7,5 10
e 7, 5
10!
= 0,0858.
4.4 Distribuio Conjunta de Duas Variveis Aleatrias
Nas sesses anteriores, tratou-se da distribuio de uma varivel aleatria. Muito
freqentemente, entretanto, o pesquisador tem interesse em duas ou mais caractersticas do
resultado de um experimento aleatrio e, portanto, deve considerar as distribuies de duas ou
mais variveis aleatrias. Assim, no experimento do Exemplo 4.2, pode-se ter interesse na altura
da planta e no peso seco das razes aos vinte dias, alm da germinao da semente. Se as variveis
Varivel Aleatria e Distribuio de Probabilidade Discreta

89
observadas simultaneamente no so relacionadas, suas propriedades podem ser estabelecidas e
estudadas atravs das respectivas distribuies univariadas. Muito comumente, entretanto, as
variveis so relacionadas e a determinao de seu inter-relacionamento constitui um dos
propsitos da pesquisa. Neste caso, a distribuio conjunta das duas variveis deve ser
estabelecida e estudada.
O conceito de varivel aleatria estende-se para essa situao como segue:

Sejam X e Y duas variveis aleatrias que mapeam cada ponto do espao bsico S
em um e somente um ponto sobre o plano R
2
, de modo que a imagem inversa sobre S
de cada evento A do espao R
XY
2
(conjunto de pontos sobre R
2
gerados pelo
mapeamento efetuado por X e Y) seja um evento de S (Figura 4.7). Ento, o par
ordenado (X,Y) constitui uma varivel aleatria bidimensional.


Figura 4.7. Ilustrao do conceito de varivel aleatria bidimensional

De modo geral, tem-se um espao bsico S e n variveis aleatrias, definidas em S, que
mapeam o espao S em pontos do hiperplano R
n
, onde n um nmero inteiro igual ou maior que
2. Nesta Seo, tratar-se- da situao bivariada (n=2), concluindo-se com algumas observaes
referentes situao multivariada mais geral (n>2).
Se X e Y so duas variveis aleatrias discretas, a probabilidade de que X assuma o valor
x e Y assuma o valor y a probabilidade da interseo dos eventos C
1
= {sS | X(s)=x} e C
2
=
{sS | Y(s)= y}, denotada por P[X=x,Y=y]; ou seja:
P[X=x,Y=y] = P[{sS | X(s)=x e Y(s)=y].

Se X e Y so variveis aleatrias discretas, a funo f(x,y) = P[X=x,Y=y] definida
para os pares de valores (x,y) no espao de X e Y denominada funo distribuio
de probabilidade conjunta, ou funo de probabilidade conjunta, ou distribuio
de probabilidade conjunta de X e Y.

Como na situao univariada, a funo de probabilidade conjunta de X e Y pode ser
especificada por uma lista dos pares de seus distintos valores possveis (x,y) e suas respectivas
probabilidades, dispostos em uma tabela. Mais especificamente, suponha-se que as variveis
aleatrias X e Y assumem, respectivamente, I e J valores distintos x
1
x
2
...,x
I
e y
1
y
2
...,y
J
com
Estatstica Bsica

90
probabilidades positivas. Ento, a varivel aleatria bidimensional (X,Y) poder assumir
probabilidades positivas em IJ pares de valores (x
i
,y
i
), i=1,2,...,I; j=1,2,...,J. A distribuio de
probabilidade conjunta das duas variveis aleatrias discretas X e Y pode ser especificada por uma
tabela de dupla-entrada (Tabela 4.8), com os valores da varivel aleatria X em uma das entradas
e os valores da varivel aleatria Y na outra entrada, e as probabilidades f(x
i
,y
j
) correspondentes
aos pares de valores (x
i
,y
j
) nas clulas.

Tabela 4.8. Distribuio de probabilidade conjunta de duas variveis
aleatrias X e Y

Y
X
y
1
y
2
... y
J

x
1
f(x
1
,y
1
) f(x
1
,y
2
) ... f(x
1
,y
J
)
x
2
f(x
2
,y
1
) f(x
2
,y
2
) ... f(x
2
,y
J
)
... ... ... ... ...
x
I
f(x
I
,y
1
) f(x
I
,y
2
) ... f(x
I
,y
J
)

Exemplo 4.17. Considere-se o experimento de germinao de duas sementes, Exemplo
4.2, para o qual foi definida a varivel aleatria X: nmero de sementes que germinam. Outras
variveis aleatrias podem ser consideradas para esse mesmo experimento, como, por exemplo, Y:
germinao da primeira semente, e Z: germinao da segunda semente. As expresses dessas trs
variveis aleatrias so:
( ) X s
0, s gg
1, s Gg, gG
2, s GG

; ( ) Y s
0, s gg, gG
1, s Gg, GG

e ( ) Z s
0, s gg, Gg
1, s gG, GG


Os pares de valores das variveis aleatrias X e Y, nesta ordem, so: (0,0), (0,1), (1,0),
(1,1), (2,0), (2,1). Supondo que a probabilidade de uma semente germinar 0,9 (Exemplo 4.3), as
probabilidades para os dois primeiros pares de valores de X e Y so obtidas a seguir:
f(0,0) = P[X=0,Y=0] = P[{gg}{gg,gG}] = P[{gg}] = 0,10,1 = 0,01;
f(0,1) = P[X=0,Y=1] = P[{gg}{GG,Gg}] = P[] = 0.
A determinao das probabilidades dos eventos definidos pelos demais pares de valores (x
i
,y
j
), de
modo semelhante, produz a distribuio de probabilidade conjunta de X e Y da Tabela 4.9.

Varivel Aleatria e Distribuio de Probabilidade Discreta

91
Tabela 4.9. Distribuio de probabilidade conjunta de X e Y,
Exemplo 4.17.

Y
X
0 1
Soma
0 0,01 0,00 0,01
1 0,09 0,09 0,18
2 0,00 0,81 0,81
Soma 0,10 0,90 1,00

Semelhantemente, pode-se determinar a distribuio de probabilidade conjunta das
variveis aleatrias Y e Z, apresentada na Tabela 4.10.

Tabela 4.10. Distribuio de probabilidade conjunta de Y e Z,
Exemplo 4.17.

Y
Z
0 1
Soma
0 0,01 0,09 0,10
1 0,09 0,81 0,90
Soma 0,10 0,90 1,00

Alternativamente, a distribuio conjunta f(x,y) pode ser especificada, mais
convenientemente, por uma expresso analtica, ou seja, uma equao que exprima os valores
f(x,y) = P[X=x,Y=y] para cada par de valores (x,y) do espao da varivel aleatria (X,Y). Por
exemplo, a distribuio de probabilidade da Tabela 4.10 pode ser especificada, alternativamente,
pela equao:
f(y,z) = 0,9
y+z
.0,1
2-y-z
, y, z = 0, 1; y+z=2.
A probabilidade de qualquer evento referente ao espao de X e Y pode ser determinada a
partir da funo de probabilidade conjunta f(x,y). Assim, para o Exemplo 4.17:
P[X=1] = P[X=1,Y=0] + P[X=1,Y=1] = f(1,0) + f(1,1) = 0,09 + 0,09 = 0,18;
P[X+Y=2] = f(2,0) + f(1,1) = 0,0 + 0,09 = 0,09;
P[X>Y] = f(1,0) + f(2,0) + f(2,1) = 0,09 + 0,0 + 0,81= 0,90.
Estatstica Bsica

92
Propriedades da funo distribuio de probabilidade conjunta
Uma funo bivariada f(x,y) uma distribuio de probabilidade conjunta de
duas variveis aleatrias X e Y se e somente se satisfaz s duas seguintes propriedades,
anlogas quelas da funo de probabilidade de uma varivel aleatria discreta:
1) f(x,y) > 0 para qualquer par de valores de X e Y;
2)
y x
f(x,y) = 1, onde a soma dupla se estende sobre todos os pares de valores
possveis de X e Y do domnio de f(x,y).
Representao geomtrica
A distribuio de probabilidade conjunta f(x,y) representada, geometricamente, em um
espao de trs dimenses. A probabilidade de cada ponto (x,y) do plano R
2
representada por um
segmento de altura f(x,y). Para ilustrao, considere-se o Exemplo 4.18.

Exemplo 4.18. A Tabela 4.11 apresenta a distribuio de probabilidade conjunta,
derivada de observaes em um grande nmero de plantas de macieira, referente aos nmeros de
frutos em uma planta com dois tipos de defeitos raros D
1
e D
2
, denotados, respectivamente por X
e Y.

Tabela 4.11. Distribuio conjunta das variveis aleatrias X e Y
do Exemplo 4.18.

Y
X
0 1 2
Soma
0 0,50 0,10 0,05 0,65
1 0,15 0,10 0,05 0,30
2 0,05 0,00 0,00 0,05
Soma 0,70 0,20 0,10 1,00

A representao geomtrica da distribuio de probabilidade conjunta das variveis
aleatrias X e Y do Exemplo 4.18 apresentada na Figura 4.8.

Varivel Aleatria e Distribuio de Probabilidade Discreta

93

Figura 4.8. Representao geomtrica da funo de
probabilidade conjunta do Exemplo 4.18.

4.5 Distribuio de uma Funo de Duas Variveis Aleatrias
A distribuio de probabilidade de qualquer funo das variveis aleatrias X e Y pode
ser derivada da distribuio de probabilidade conjunta f(x,y). Para ilustrao, considere-se, no
Exemplo 4.18, o nmero de frutos de uma planta de macieira que apresentam defeitos de um dos
tipos D
1
ou D
2
, ou seja, a varivel aleatria Z = X+Y. Esta varivel aleatria Z pode assumir os
valores 0, 1, 2, 3 e 4. Probabilidades para Z podem ser determinadas como segue:
P[Z=0] = P[X+Y=0] = f(0,0) = 0,50;
P[Z=1) = P[X+Y=1] = f(1,0) + f(0,1) = 0,15+0,10 = 0,25;
P[Z=2] = P[X+Y=2] = f(2,0) + f(1,1) + f(0,2) = 0,05+0,10+0,05 = 0,20.
A distribuio de probabilidade de Z apresentada na Tabela 4.12.

Tabela 4.12. Distribuio de probabilidade de Z=X+Y, Exemplo 4.18

Z: 0 1 2 3 4
P[Z]: 0,50 0,25 0,20 0,05 0,00

4.6 Distribuio Marginal
As distribuies de probabilidade das variveis aleatrias X e Y podem ser obtidas da
distribuio de probabilidade conjunta f(x,y). A probabilidade de cada valor possvel x
i
de X a
soma das probabilidades conjuntas f(x
i
,y
j
) sobre os valores y
j
de Y para X=x
i
, ou seja: f
X
(x
i
) =
( )
f x , y
i j
j
. Semelhantemente, a probabilidade de cada valor possvel y
j
de Y a soma das
probabilidades conjuntas sobre os valores x
i
para Y=y
j
: f
Y
(y
j
) =
( )
f x , y
i j
i
. Para o Exemplo 4.18,
Estatstica Bsica

94
as probabilidades dos distintos valores de X esto na margem oposta entrada para X na Tabela
4.11, ou seja, na ltima coluna, e as probabilidades para Y, na ltima linha. Como essas
probabilidades so os totais marginais da tabela de dupla-entrada das probabilidades conjuntas,
essas distribuies de X e Y so denominadas distribuies marginais.

Se X e Y so variveis aleatrias discretas com distribuio de probabilidade
conjunta f(x,y), as funes:
f
X
(x
i
) = ( ) f x , y
i i
j
e
f
Y
(y
j
) = ( ) f x , y
i i
i

so denominadas distribuies marginais de X e Y, respectivamente.

Essas distribuies so, simplesmente, as distribuies univariadas de X e Y, aqui
denotadas por f
X
(x) e f
Y
(y) com os subscritos utilizados para distinguir os smbolos que denotam
as duas funes de probabilidade. O qualificativo "marginal" na designao da distribuio de uma
varivel aleatria , de fato, redundante. Quando aplicado distribuio de X, por exemplo, ele
apenas significa que outra varivel aleatria, alm de X, foi originalmente considerada no
problema e que a distribuio de X foi obtida a partir da tabela de dupla-entrada da distribuio
conjunta de X e Y.
4.7 Valor Esperado de uma Funo de Duas Variveis Aleatrias
O conceito de valor esperado pode ser estendido situao de duas variveis aleatrias
discretas:

Se Z = g(X,Y) uma funo de duas variveis aleatrias X e Y, com distribuio
conjunta f(x,y), seu valor esperado :
E[g(x,y)] = g( x, y) f ( x, y)
y x

.

So particularmente importantes as seguintes propriedades do valor esperado em
distribuies de duas variveis aleatrias.
a) O valor esperado (mdia) de cada uma das variveis aleatrias X e Y, com distribuio
conjunta f(x,y), pode ser determinado atravs das respectivas distribuies marginais. De fato, pela
definio:
E(X) = x f(x, y)
y x
= x f(x, y)
y x
= ( ) f x
x
x
;
E(Y) = y f(x, y)
y x
= y f(x, y)
y x
= ( ) f y
y
y
.
Semelhante propriedade pode ser estabelecida para as varincias e desvios padres de X e Y.
Varivel Aleatria e Distribuio de Probabilidade Discreta

95
b) O valor esperado da soma de duas variveis aleatrias a soma de seus valores
esperados:
E(X+Y) = (x + y) f(x, y)
y x
= x f(x, y) y f(x, y)
y x y x
+ =
= x f(x, y) y f(x, y)
y x y x
+ = xf (x) yf (y)
X
x
Y
y
+ =
= E(X) + E(Y).
Entretanto, a varincia da soma de duas variveis aleatrias igual soma das respectivas
varincias apenas na situao particular de que se tratar adiante.
4.8 Covarincia e Correlao de Duas Variveis Aleatrias
A covarincia das variveis aleatrias X e Y uma medida da variao conjunta de X e
Y:

A covarincia de duas variveis aleatrias X e Y, denotada por Cov(X,Y) ou
XY
,
o valor esperado do produto dos desvios dessas variveis aleatrias em relao aos
seus respectivos valores esperados:
Cov(X,Y) = E{[X-E(X)][Y-E(Y)]}.

Intuitivamente, pode-se dizer que X e Y variam na mesma direo se alta a
probabilidade de que valores elevados de X sejam associados com valores elevados de Y e valores
baixos de X sejam associados com valores baixos de Y. Nessa situao, a probabilidade de que os
desvios X-E(X) e Y-E(Y) sejam ambos positivos ou ambos negativos elevada, de modo que o
produto [X-E(X)][Y-E(Y)] predominantemente positivo. conseqentemente, o valor esperado
desse produto positivo e elevado. Por outro lado, se X e Y tendem a variar em sentidos opostos,
valores positivos de X-E(X) associam-se mais freqentemente com valores negativos de Y-E(Y), e
vice-versa. Ento, o produto [X-E(X)][Y-E(Y)] predominantemente negativo e seu valor
esperado negativo. Dessa forma, o sinal e a grandeza de E{[X-E(X)][Y-E(Y)]} refletem o
sentido e o grau da relao linear entre as variveis aleatrias X e Y. nesse sentido que a
covarincia exprime a relao, ou associao, entre os valores de X e Y.
Pode-se verificar que:
Cov(X,Y) = E{[X-E(X)][Y-E(Y)]},
= E(XY) - E(X).E(Y),
onde a ltima expresso pode ser obtida pelo desenvolvimento da primeira. Assim, a covarincia
de X e Y pode ser determinada a partir dos valores esperados de X e Y, que podem ser obtidos
atravs das respectivas distribuies (marginais), e do valor esperado do produto XY, que pode ser
obtido a partir da distribuio conjunta de X e Y, como segue:
E(XY) = xy
y x
P[X=x,Y=y].
O valor da Cov(X,Y) depende das unidades de medida associadas com as variveis
aleatrias X e Y. Muito freqentemente, conveniente uma medida da relao de associao linear
Estatstica Bsica

96
entre as duas variveis que no dependa de unidades de medida, como se logra com o uso do
coeficiente de variao como medida de disperso. Isso obtido pela diviso da covarincia pelos
desvios padres de X e Y, se estes desvios padres so ambos positivos. A medida resultante o
coeficiente de correlao de X e Y:

Uma medida da associao linear de duas variveis aleatrias X e Y coeficiente
de correlao linear, denotado por Corr(X,Y) ou
XY
e expresso por:

XY
=
( ) Cov X, Y
X Y

,
contanto que Cov(X,Y),
X
e
Y
existam, e
X
>0 e
Y
>0.

Exemplo 4.19. Para ilustrao do clculo da covarincia e do coeficiente de correlao,
considere-se a situao do Exemplo 4.18. As mdias das variveis aleatrias X e Y podem ser
obtidas a partir das respectivas distribuies marginais da Tabela 4.11:
E(X) = 00,65 + 10,30 + 20,05 = 0,4;
E(Y) = 00,70 + 10,20 + 20,10 = 0,4.
O valor de E(XY) determinado como segue:
E(XY) = xy f(x,y)
= 000,50 + 010,10 + 020,05 + 100,15 + 110,10 +
+ 120,05 + 200,05 + 210 + 220 = 0,20.
Assim,
Cov(X,Y) = 0,20 - 0,40,4 = 0,04.
Para determinar o coeficiente de correlao, necessita-se dos desvios padres de X e Y,
determinados como segue:
E(X
2
) = 0
2
0,65 + 1
2
0,30 + 2
2
0,05 = 0,5 e
E(Y
2
) = 0
2
0,70 + 1
2
0,20 + 2
2
0,10 = 0,6;
logo:
Var(X) = E(X
2
) - [E(X)]
2
= 0,5 - 0,4
2
= 0,34 e
Var(Y) = E(Y
2
) - [E(Y)]
2
= 0,6 - 0,4
2
= 0,44;
donde:

X
= 0,34 = 0,583 e

Y
= 0,44 = 0,663;
portanto, o coeficiente de correlao :

XY
=
0 04
0 583 0 663
,
, ,
= 0,103.
Varivel Aleatria e Distribuio de Probabilidade Discreta

97
Propriedades do coeficiente de correlao
1) O coeficiente de correlao situa-se no intervalo entre -1 e 1: -1
XY
1.
2) O coeficiente de correlao no se altera se as variveis aleatrias so adicionadas ou
multiplicadas de constantes com o mesmo sinal.
4.9 Distribuio Condicional e Independncia Estatstica
No Captulo 3, a probabilidade condicional de um evento A dado um evento B foi
definida como:
P(A | B) =
( )
( )
P A B
P B

, contanto que P(B)0.


Suponha-se que os pontos X=x e Y=y so os mapeamentos dos eventos A e B do espao
bsico de um experimento, efetuados pelas variveis aleatrias X e Y, respectivamente. Ento,
pode-se escrever:
P[X=x | Y=Y] =
[ ] P X x, Y y
P[Y y]


=
( ) f x, y
f (y)
Y
,
desde que P[Y=y] = f
Y
(y) 0, onde f(x,y) o valor da funo de distribuio conjunta de X e Y no
ponto (x,y) e f
Y
(y) o valor da distribuio marginal de Y em Y=y. Ento, denotando por f(x | y)
as probabilidades dos valores possveis da varivel aleatria X para um valor fixo qualquer y da
varivel aleatria Y, define-se a distribuio condicional de X dado um valor particular y de Y
como segue:

A funo:
f(x | y) =
( ) f x, y
f (y)
Y
, f
Y
(y)0,
definida para cada valor x no espao de X, denominada distribuio condicional de
X dado Y=y.

Semelhantemente, a funo:
f(y | x) =
( ) f x, y
f (x)
X
, f
X
(x)0,
para cada valor y no espao de Y, denominada distribuio condicional de Y dado X=x.

Estatstica Bsica

98
As variveis aleatrias X e Y so independentes (no sentido estatstico) se os
eventos {sS | X(s)=x
i
} e {sS | Y(s)=y
j
} so independentes para todos os pares de
valores possveis (x
i
,y
j
) de X e Y.

Sejam A e B os eventos no espao bsico S correspondentes aos pontos X(s)=x
i
e Y(s)=y
j
.
Ento, como A e B so independentes, por definio: P[AB] = P[A].P[B], o que implica que:
P[X=x
i
,Y=y
j
] = P[X=x
i
].P[Y=y
j
].
Ento, pode-se estabelecer a definio de independncia estatstica como segue:

As variveis aleatrias X e Y so independentes (no sentido estatstico) se:
f(x
i
,y
j
) = f
X
(x
i
).f
Y
(y
j
)
para todos os pares de valores possveis (x
i
,y
j
).

Isso significa que X e y so independentes se a probabilidade de cada ponto (x
i
,y
j
) no
espao
2
XY
R o produto das probabilidades marginais nos pontos X=x
i
e Y=y
i
, nos
correspondentes espaos R
X
e R
Y
. Na representao tabular da distribuio de probabilidade
conjunta, isto significa que as probabilidades nas clulas so os produtos das correspondentes
probabilidades totais nas margens (probabilidades marginais).

Exemplo 4.20. Para ilustrao, considere-se as distribuies de probabilidade
especificadas na Tabela 4.9 e na Tabela 4.10, do Exemplo 4.17. As variveis aleatrias X e Y
no so independentes, pois P[X=0,Y=0] = 0,01, enquanto que P[X=0].P[Y=0] = 00 = 0 (a falha
da condio de independncia para uma clula da tabela da distribuio conjunta suficiente para
implicar na dependncia das variveis aleatrias). Entretanto, de esperar que as variveis
aleatrias Y e Z sejam independentes, j que elas se referem a duas partes fisicamente
independentes de um experimento: o resultado da germinao da primeira semente no tem
qualquer implicao sobre a germinao da segunda semente. De fato, pode-se verificar que os
valores nas clulas da Tabela 4.10 so os produtos dos valores nas correspondentes margens.

A independncia de eventos implica nas seguintes propriedades importantes:
1) Se X e Y so variveis aleatrias independentes, ento:
E(XY) = E(X)E(Y).
De fato, a independncia de X e Y implica que f(x,y) = f
X
(x).f
Y
(y); logo:
E(XY) = xy
y x
f(x,y) = xy
y x
f
X
(x) f
Y
(y) =
= x
x
f
X
(x) y
y
f
Y
(y) = E(X).E(Y).
2) Se X e Y so independentes,
Cov(X,Y) = 0 e
Corr(X,Y) = 0.
Estas propriedades so imediatas.
Varivel Aleatria e Distribuio de Probabilidade Discreta

99
3) Se X e Y so independentes, ento:
Var(X+Y) = Var(X) + Var(Y).
Recorde-se que o valor esperado da soma de duas variveis aleatrias , sempre, igual
soma dos valores esperados das duas variveis, sejam elas independentes ou no. Entretanto,
propriedade semelhante no sempre vlida para a varincia. De fato,
Var(X+Y) = E[(X+Y) - E(X+Y)]
2
= E[{X-E(X)} + {Y-E(Y)}]
2
=
= E[X-E(X)]
2
+ E[Y-E(Y)]
2
+ 2E[X-E(X)][Y-E(Y)] =
= Var(X) + Var(Y) + 2Cov(X,Y).
Assim,
Var(X+Y) = Var(X) + Var(Y)
se e apenas se Cov(X,Y)=0, o que implicado pela independncia das variveis aleatrias X e Y.
Semelhantemente, pode-se demonstrar que Var(X-Y) = Var(X) + Var(Y) - 2Cov(X,Y), de
modo que Var(X-Y) = Var(X) + Var(Y), se e apenas se X e Y so independentes.
De acordo com a segunda propriedade, a independncia de duas variveis aleatrias
implica na nulidade de sua covarincia e, portanto, de sua correlao. Entretanto, a covarincia e
correlao nulas no implicam, necessariamente, na independncia estatstica.
4.10 Distribuio Conjunta de n Variveis Aleatrias
Todos os conceitos referentes distribuio de duas variveis aleatrias discretas podem
ser generalizados para a situao multivariada mais geral de n variveis aleatrias. A dificuldade
que surge a impossibilidade de representao geomtrica em espaos de mais de trs dimenses.
Tratar-se-, aqui, apenas das extenses importantes para os propsitos deste texto.

Se X
1
,X
2
,...,X
n
so n variveis aleatrias discretas definidas no mesmo espao
bsico S, ento, o vetor (X
1
,X
2
,...,X
n
) uma varivel aleatria n-dimensional
discreta, que assume valores com probabilidades positivas em um nmero contvel de
pontos (x
1
,x
2
,...,x
n
) do espao R
n
. Nesse caso, a funo distribuio de
probabilidade conjunta de X
1
,X
2
,...,X
n
, denotada por f
X X X
n 1 2
. . .
(x
1
,x
2
,...,x
n
) ou, mais
simplesmente, f(x
1
,x
2
,...,x
n
), definida como:
f
X X X
n 1 2
. . .
(x
1
,x
2
,...,x
n
) = P[X
1
=x
1
,X
2
=x
2
,...,X
n
=x
n
],
para todos os pontos do espao R
X
1
X
2
. . .X
n
n
.

Estatstica Bsica

100
Uma funo multivariada f(x
1
,x
2
,...,x
n
) uma funo distribuio de
probabilidade conjunta de n variveis aleatrias discretas X
1
,X
2
,...,X
n
se e apenas se
satisfaz s seguintes duas propriedades, extenses do caso bivariado:
1) f(x
1
,x
2
,...,x
n
) 0 para todo ponto (x
1
,x
2
,...,x
n
) em R
n
.
2) ... f(x , x ,..., x )
1 2 n
x x x
n

2 1
= 1, onde a soma estende-se sobre todos os valores
possveis de X
1
,X
2
,...,X
n
.

Na situao de mais de duas variveis aleatrias, pode-se considerar no apenas
distribuies marginais de variveis aleatrias individuais, mas, tambm, distribuies marginais
conjuntas de vrias variveis aleatrias:

A distribuio marginal de X
1
apenas dada por:
f
X
1
(x
1
) = ... f (x , x ,..., x )
X
1
X
2
. . . Xn 1 2 n
x x
n

2
,
para todos os valores x
1
do espao de X
1
. A distribuio marginal conjunta de
X
1
,X
2
,...,X
p
, p<n, dada por:
f
X X X
p 1
2. . .
(x
1,
x
2
,...,x
p
) = ... f (x , x ,..., x )
X
1
X
2
. . . Xn 1 2 n
x x
n p

+1
,
para todos os valores x
1
,x
2
,...,x
p
nos espaos de X
1
,X
2
,...,X
p
, respectivamente.

Outras distribuies marginais podem ser definidas de modo semelhante.
Semelhantemente, pode-se considerar vrios tipos de distribuies condicionais. Por
exemplo, se f(x
1
,x
2
,...,x
n
) o valor da distribuio conjunta das variveis aleatrias X
1
,X
2
,... ,X
n

em (x
1
,x
2
,...,x
n
), a distribuio condicional de X
1
dado X
2
,...,X
n
:
f
X X X
n 1 2
| . . .
(x
1
|

x
2
,...,x
n
) =
f (x , x ,..., x )
f (x ,..., x )
X
1
X
2
. . . X
n
1 2 n
X
2
. . . X
n
2 n
.
A distribuio condicional conjunta de X
1
,X
2
,...,X
p
(p<n) dado X
p+1
,...,X
n
:
f
X X
p
X
p
X
n 1 1
. . . | . . .
+
(x
1
,...,x
p
|

x
p+1
,...,x
n
) =
f (x , x ,..., x )
f (x ,..., x )
X
1
X
2
. . . X
n
1 2 n
X
p+1
. . . X
n
p+1 n

Em situaes de duas ou mais variveis aleatrias, questes de independncia so de
grande importncia. A definio de independncia estatstica generalizada como segue:

Varivel Aleatria e Distribuio de Probabilidade Discreta

101
Se f(x
1
,x
2
,...,x
n
) a distribuio de probabilidade conjunta de n variveis aleatrias
discretas X
1
,X
2
,...,X
n
e f x
X
i
i
( ) , i=1,2,...,n, a distribuio de probabilidade marginal
de X
i
, i=1,2,...,n, ento as variveis aleatrias X
1
,X
2
,...,X
n
so (estatisticamente)
independentes se e somente se:

f
X X X
n 1 2
. . .
(x
1
,x
2
,...,x
n
) = f x
X
1
1
( ) f x
X
2
2
( ) ... f x
X
n
n
( )
para todos os pontos (x
1
,x
2
,...,x
n
) do espao R
X
1
X
2
. . .X
n
n
.

Exemplo 4.21. Considere-se o experimento de germinao sucessiva de cinco sementes
em que a probabilidade de uma semente germinar p=0,9. Como a probabilidade de qualquer das
cinco sementes germinar no afetada pela germinao das demais sementes, a probabilidade de
que as trs primeiras sementes germinem e as duas ltimas no germinem : 0,90,90,90,10,1
= 0,0729.

Os conceitos de valor esperado e correspondentes propriedades podem ser estendidos
para variveis aleatrias n-dimensionais como segue:

O valor esperado de uma funo g(x
1
,x
2
,...,x
n
) de uma varivel aleatria n-
dimensional discreta (X
1
,X
2
,...,X
n
) com distribuio de probabilidade conjunta
f(x
1
,x
2
,...,x
n
) :
E[g(X
1
,X
2
,...,X
n
)] = ... g(x , x ,..., x ) f(x , x ,..., x )
1 2 n 1 2 n
x x x
n

2 1
.

Propriedades do valor esperado
1) Se X
1
,X
2
,...,X
n
so quaisquer n variveis aleatrias discretas:
E(X
1
+X
2
+...+X
n
) = E(X
1
) + E(X
2
) +...+ E(X
n
).
2) Se X
1
,X
2
,...,X
n
so variveis aleatrias independentes:
E(X
1
,X
2
,...,X
n
) = E(X
1
) E(X
2
)...E(X
n
).
3) Se c
1
,c
2
,...,c
n
so constantes e g
i
(x
1
,x
2
,...,x
n
), i=1,2, ...,n, so n funes das variveis
aleatrias X
1
,X
2
,...,X
n
, ento:
E[ c g
i i
i
n

1
(X
1
,X
2
,...,X
n
)] =
n
i
i 1
c

E[g
i
(x
1
,x
2
,...,x
n
)].
Valores esperados e varincias de combinaes lineares de variveis aleatrias so
freqentemente teis na teoria da amostragem e em problemas de inferncia estatstica. Sejam
X
1
,X
2
,...,X
n
variveis aleatrias e Y = a x
i i
i
n

1
, onde a
1
,a
2
,...,a
n
so constantes. Ento:
1) E(Y) = a
i
i
n

1
E(X
i
).
Estatstica Bsica

102
2) Var(Y) = a
i
i
n
2
1
Var(X
i
) +
<

i
n
i j
j
n
a a Cov(X
i
,X
j
)
onde a soma dupla estende-se para todos os valores de i e j de 1 a n, para i<j.
Se as variveis aleatrias X
1
,X
2
,...,X
n
so independentes, ento:
Var(Y) = a
i
i
n
2
1
Var(X
i
).
4.11 Distribuio Multinomial
Uma importante generalizao do experimento binomial uma seqncia de ensaios
independentes cada um com mais de dois resultados alternativos possveis, com a mesma
probabilidade dos respectivos resultados para todos os ensaios. Uma seqncia de tais ensaios
denominada um experimento multinomial. Essa situao ocorre, por exemplo, quando plantas de
um conjunto so classificadas em mais de duas categorias quanto ao nvel de infeco de uma
doena, como, por exemplo, sem infeco e com infeco fraca, regular e forte.
Considere-se uma seqncia de n ensaios independentes cada um com k resultados
alternativos possveis mutuamente exclusivos a
1
,a
2
,...,a
k
, respectivamente com probabilidades
p
1
,p
2
,...,p
k
(p
1
+p
2
+...+p
k
=1). Sejam X
1
,X
2
,...,X
n
as variveis aleatrias que exprimem os nmeros
dos resultados com as alternativas a
1
,a
2
,...,a
k
, respectivamente, nos n ensaios, com
X
1
+X
2
+...+X
k
=n.
Procedendo como na derivao da expresso da distribuio binomial, observe-se,
inicialmente, que a probabilidade de x
1
resultados com a alternativa a
1
, x
2
resultados com a
alternativa a
2
, etc. e x
k
resultados com a alternativa a
k
, em uma ordem especfica,
p p p
x x
k
x
k
1 2
1 2
... . O nmero de ordens em que podem ocorrer esses resultados alternativos dado
pela regra das permutaes com repeties, ou seja, P =
n!
x !x !... x !
1 2 k
. Assim, a probabilidade de
x
1
,x
2
,...,x
k
resultados dos n ensaios com as alternativas a
1
,a
2
,...,a
k
, respectivamente, dada por:
n!
x !x !... x !
1 2 k
p p p
x x
k
x
k
1 2
1 2
... .
As variveis aleatrias X
1
,X
2
,...,X
n
tm distribuio multinomial se e apenas se sua
distribuio de probabilidade conjunta :
f(x
1
,x
2
,...,x
k
) =
n!
x !x !... x !
1 2 k
p p p
x x
k
x
k
1 2
1 2
... ,
x
i
=0,1,2,...,n (i=1,2,...k), x
1
+x
2
+...+x
k
=n, onde n, p
1
,p
2
,...,p
k
so parmetros satisfazendo s
condies: n=1,2,..., 0p1, i=1,2, ...,k, p
1
+p
2
+...+p
k
= 1.
A designao "multinomial" provm do fato de que a probabilidade para cada conjunto de
valores x
1
,x
2
,...,x
k
igual ao termo correspondente da expanso multinomial de (p
1
+p
2
+...+p
k
)
n
.

Exemplo 4.22. De acordo com a teoria mendeliana da herana, o cruzamento de uma
planta de ervilha de semente amarela redonda com uma planta de ervilha de semente verde
angulosa produz uma planta que produz sementes amarela redonda, amarela angulosa, verde
Varivel Aleatria e Distribuio de Probabilidade Discreta

103
redonda e verde angulosa com probabilidades 9/16, 3/16, 3/16 e 1/16, respectivamente. Ento, a
probabilidade de que de nove plantas assim obtidas quatro produzam semente amarela redonda,
duas produzam semente amarela angulosa, trs produzam semente verde redonda e nenhuma
produza semente amarela angulosa dada por:
P[X
1
=4,X
2=
2,X
3
=3,X
4
=0] =
9!
4!2!3!0!
9
16
3
16
3
16
1
16
4 2 3 0
j
(
,
\
,
(
j
(
,
\
,
(
j
(
,
\
,
(
j
(
,
\
,
(
= 0,02923.
4.12 Exerccios
1. Supondo que a probabilidade de um casal ter um filho de olhos azuis igual a 1/4,
qual a probabilidade de em uma prole de 6 filhos:
a) Nenhum ter olhos azuis?
b) Pelo menos um ter olhos azuis?
2. Uma caixa contm 4 pintos da raa A e 6 pintos da raa B. Suponha que se retira
pintos da caixa atravs de um processo que atribui a cada pinto na caixa igual
probabilidade de ser extrado:
a) Extraindo-se um pinto, qual a probabilidade de sair um pinto da raa A?
b) Retirando-se dois pintos, simultaneamente (isto , sem reposio), qual a
probabilidade de sair um pinto de cada raa?
c) Extraindo-se dois pintos, com a reposio do primeiro antes da extrao do
segundo, qual a probabilidade de sair um pinto de cada raa?
3. Um lote de sementes tem poder germinativo igual a 80%. Se 5 sementes so
escolhidas ao acaso, quantas devem germinar para que se tenha no mnimo 60% de
germinao?
4. Um produtor de semente de soja produz sementes com 95% de poder germinativo e as
embala em sacos de 60 kg. Quando um lote vendido, o comprador tem direito
indenizao de um saco de semente para cada saco em que a germinao menor que
a indicada. Se esse produtor possui 500 sacos, determine:
a) Quantos sacos dever manter para indenizao?
b) Em um conjunto de 10 sacos que ele vende, qual a probabilidade de que at 3
deles apresentem germinao inferior a 95%?
5. Em um pomar de macieira foram arrancadas 100 plantas para verificar o grau de
incidncia de Phytophtora nas razes, obtendo-se os seguintes resultados: 60 plantas
no atacadas, 30 plantas levemente atacadas e 10 com ataque severo. Suponha que
desse mesmo pomar so arrancadas mais 10 plantas. Determine:
a) A probabilidade de se obter pelo menos 2 plantas levemente atacadas e 1
severamente atacada.
b) A mdia e a varincia das variveis aleatrias.
Estatstica Bsica

104
6. De acordo com a teoria mendeliana da herana de um carter, a fertilizao cruzada de
duas espcies de plantas de flores vermelhas e brancas produz descendentes dos quais
25% so plantas de flor vermelha. Suponha que um horticultor cruza 5 pares de
plantas vermelhas e brancas. Qual a probabilidade de que dos resultantes 5
descendentes se obtenha:
a) Nenhuma planta de flor vermelha.
b) Quatro ou mais plantas de flor vermelha.
7. Sabe-se que do acasalamento de um touro com vacas de um rebanho podem originar-
se descendentes aspados e mochos. Considere o experimento "acasalamento do touro
com trs vacas do rebanho e observao do carter aspas dos descendentes".
a) Especifique o espao de amostra do experimento.
b) Especifique o evento A: Pelo menos dois descendentes aspados.
c) Determine a expresso da varivel aleatria X: nmero de descendentes com aspas.
d) Suponha que a probabilidade do carter "aspas" em descendentes do acasalamento
do touro com vacas do rebanho 0,75. Determine a probabilidade do evento A
especificado no item b.
8. A probabilidade de um leito de uma leitegada de 10 leites viver at a idade adulta
0,3.
a) Quantos leites de uma leitegada de 10 leites se pode esperar viverem at a idade
adulta?
b) Qual a varincia do nmero de leites que chegam idade adulta?
c) Qual a probabilidade de que seis leites de uma leitegada de 10 leites atinjam a
idade adulta?
d) Qual a probabilidade de que 6 ou mais leites cheguem idade adulta?
9. Uma industria utiliza uma mquina para o enlatamento de compota de pssego em
latas de 500g que garante o peso da lata entre 485 e 515g. O controle de qualidade da
indstria classifica as latas produzidas em trs categorias: B-, A e B+, segundo o peso
da lata se situe nos intervalos 485-495, 495-505 e 505-515, respectivamente.
a) Considere o experimento aleatrio: "retirada de duas latas de uma pilha e sua
classificao". Especifique o espao bsico.
b) Para o experimento "retirada de uma lata de uma pilha e classificao da lata",
considere a seguinte varivel aleatria:

X

1, se a classificao B-
0, se a classificao A
1, se a classificao B+

cuja funo de probabilidade :
[ ]
3/4, se x=0
P X x
1/8, se x=-1,1


Determine: i) E(X); ii) Var(X); iii) P[X<1].
Varivel Aleatria e Distribuio de Probabilidade Discreta

105
c) Para o experimento especificado no item a, determine a probabilidade de que ambas
as latas sejam classificadas na categoria A.
10. A probabilidade de se obter, por autofecundaes sucessivas, uma boa variedade de
algodo 1/20.000. Qual a probabilidade de em 40.000 autofecundaes se
conseguir pelo menos uma boa variedade?
11. Trs pintos so retirados da caixa com 10 pintos mencionada no exerccio 2 (extrao
sem reposio). Suponha que X a varivel aleatria que denota o nmero de pintos
da raa A extrados da caixa.
a) Complete a seguinte tabela da distribuio de probabilidade:

x: 0 1 2 3
P[X=x]

b) Determine: i) P[X=2]; ii) P[0,5<X<2,5]; iii) F(3)=P[X3]; iv) E(X); v) Var(X).
12. A probabilidade de partos duplos em um rebanho de ovinos da raa Booroola 0,1.
Considere 5 partos de ovelhas desse rebanho. Determine:
a) E(X).
b) Var(X).
c) Probabilidade de um parto duplo.
d) Probabilidade de pelo menos um parto duplo.
13. A funo de probabilidade de uma varivel aleatria :

[ ] P X x

1/ 3, se x = 1,2,3
0, caso contrrio

Determine:
a) E(X).
b) Var(X).
c) P[X2].
14. Supondo que uma planta de caf tem a probabilidade de 0,30 de sobreviver a uma
geada, qual a probabilidade de que:
a) 9 em cada 10 plantas de um pomar resistam a uma geada;
b) pelo menos 7 plantas sobrevivam a uma geada.
15. Um engenheiro de segurana afirma que 1 em 10 acidentes de automvel so devidos
fadiga do motorista. Determine as probabilidades de que entre 5 acidentes 0, 1, 2, 3,
4 e 5 sejam devidos fadiga do motorista. Efetue a representao grfica dessa funo
de probabilidade.
16. Uma pesquisa revelou que 15 porcento dos pacientes que usam um certo medicamento
tm efeitos colaterais indesejveis. Usando a tabela de probabilidades da distribuio
binomial (Tabela I), determine a probabilidade de que entre 18 pacientes que recebem
esse medicamento:
Estatstica Bsica

106
a) nenhum tenha qualquer efeito colateral indesejvel;
b) exatamente 2 tenham efeitos colaterais indesejveis;
c) pelo menos 5 tenham efeitos colaterais indesejveis;
d) no mximo 8 tenham efeitos colaterais indesejveis.
17. Um engenheiro de controle de qualidade inspeciona uma amostra aleatria de 2
liquidificadores de cada lote de 2 liquidificadores, e aceita o lote apenas se os dois
aparelhos esto em boas condies de uso; caso contrrio, todos os liquidificadores do
lote so inspecionados com o custo imputado ao vendedor. Qual a probabilidade de
que um lote seja aceitado sem ulterior inspeo, se:
a) o lote contm 5 liquidificadores que no esto em boas condies de uso;
b) o lote contm 10 aparelhos que no esto em boas condies de uso;
c) o lote contm 15 aparelhos que no esto em boas condies de uso.
18. Artigos de uma fbrica dos quais 0,5 por cento so defeituosos so embalados em
caixas de papelo cada uma com 100 unidades.
a) Que proporo de caixas est livre de artigos defeituosos?
b) Qual a proporo de caixas que contm dois ou mais artigos defeituosos?
19. Considere a distribuio de probabilidade de Poisson para cada um dos seguintes
valores de : 0,25; 0,50 e 1,00.
a) Determine a distribuio de probabilidade para esses quatro valores de .
Arredonde as probabilidades para 4 algarismos decimais.
b) Efetue a representao grfica das 3 distribuies de probabilidade determinadas no
item anterior.
c) Determine o valor esperado e a varincia da distribuio para =0,25. Porque esses
valores so levemente diferentes de E(X) = = 0,25 e Var(X) = = 0,25 ?
20. Aditivos como antibiticos, vermfugos e inseticidas so incorporados em raes para
animais em partes por milho (ppm). Para mistura efetiva, o aditivo pode ser
comprimido em bolinhas ("pellets") do tamanho de um gro na rao e ento colorido
com tintura vegetal para facilidade de identificao. O controle de qualidade da
mistura efetuado pela extrao de uma amostra de volume fixo da rao com o
aditivo e contagem do nmero de bolinhas coloridos do aditivo. Suponha conhecido
que a contagem de bolinhas em um uma amostra de rao apropriadamente misturada
segue uma distribuio de Poisson com =2,5.
a) Determine a probabilidade de que: i) uma amostra no contenha nenhum bolinhas
de aditivo; ii) uma amostra contenha exatamente uma bolinha de aditivo; iii) uma
amostra contenha pelo menos uma bolinha de aditivo.
b) Determine os resultados mais provveis de ocorrem em aproximadamente 80% das
amostras.
21. Suponha que um processo alternativo de controle de qualidade de misturas
consideradas na questo anterior que requer uma amostra de dez volumes fixos
Varivel Aleatria e Distribuio de Probabilidade Discreta

107
extrados independentemente de cada partida de mistura. Em uma dessas amostras de
rao apropriadamente misturada, determine:
a) o nmero total esperado de bolinhas coloridas;
b) a probabilidade de no aparecer qualquer dessas bolinhas.
22. Um centro telefnico recebe um nmero mdio de 5 chamadas por hora. Admitindo
que o nmero de chamadas recebidas nesse centro por hora tenha distribuio de
Poisson, determine a probabilidade de que:
a) em uma hora particular sejam recebidas 5 chamadas;
b) decorra mais de meia hora entre duas chamadas sucessivas.
23. Uma loja vende, em mdia, 4 unidades de um certo por ms. A loja renova seu
estoque desse artigo uma vez por ms. Supondo que as vendas ocorrem aleatria e
independentemente, At que nmero deve a loja completar seu estoque para reduzir a
probabilidade de esgotamento do estoque para menos que 1/100?
24. Em um problema de hereditariedade, um geneticista no est seguro se as duas
alternativas A e a de uma caracterstica apresentam-se na razo 1:1 ou 3:1. Ento,
decide conduzir um experimento para basear sua concluso. Se ele deseja que a
diferena entre os valores esperados da alternativa A sob as duas hipteses (1:1 e 3:1)
seja mnima, qual o tamanho mnimo da amostra que deve escolher para seu
experimento?
25. Sejam X e Y variveis aleatrias independentes. Demonstre que E(XY) = E(X).E(Y).
26. Considere o experimento de plantio de trs sementes de um lote de sementes com
80% de poder germinativo.
a) Especifique o espao de amostra do experimento.
b) Especifique o evento "as duas primeiras sementes germinam" e determine a sua
probabilidade.
c) Estabelea as expresses das variveis aleatrias:
X = nmero de sementes que germinam;

Y
se ou mais sementes germinam
caso contrario

1 2
0
,
,

d) Determine as funes de probabilidade de X e de Y.
e) Determine a funo de probabilidade conjunta de X e Y.
f) Determine: i) E(X), E(Y) e E(XY); ii) Cov(X,Y); iii) Corr(X,Y).
27. Sejam X e Y variveis que exprimem as seguintes caractersticas referentes
produtividade de ovelhas de um rebanho da raa Corriedale:
X = cordeiros nascidos por ovelha parida;
Y = cordeiros desmamados por ovelha parida,
Suponha que as distribuies de probabilidade conjunta e marginais de X e Y sejam
dadas na seguinte tabela:

Estatstica Bsica

108
X
Y
1 2
P[Y=y]
0 0,15 0,05 0,20
1 0,50 0,20 0,70
2 0,00 0,10 0,10
P[X=x] 0,65 0,35 1,00

a) Determine: i) E(X); ii) E(Y); iii) Var(X); iv) Var(Y); v) E(X+Y); vi) E(XY);
vii) Cov(X,Y); viii)
XY
.
b) So as variveis X e Y independentes? Justifique a resposta.
28. Considere o seguinte experimento aleatrio: "Germinao de 3 sementes e observao
do resultado do teste de germinao". (Represente a germinao de uma semente por
G e a no germinao por g.)
a) Especifique o espao bsico S desse experimento.
b) Especifique as variveis aleatrias X e Y que exprimem as duas seguintes
caractersticas dos eventos elementares desse espao bsico S:
X: Ocorrncia de germinao na primeira semente;
Y: Nmero de sementes que germinam.
c) Supondo que a probabilidade de uma semente germinar 0,8, igual para as 3
sementes, determine as distribuies de probabilidade dessas 2 variveis aleatrias.
d) Estabelea a funo de probabilidade conjunta e as funes de probabilidade
marginais das variveis aleatrias X e Y, em uma tabela de dupla entrada.
e) Determine: i) E(X); ii) E(Y); iii) Var(X); iv) Var(Y); v) E(X+Y); vi) E(XY);
vii) Cov(X,Y); viii)
XY
.
f) Verifique se as variveis aleatrias X e Y so estatisticamente independentes.
29. Se o resultado "cara" um sucesso no lanamento de uma moeda, a obteno da face
6 um sucesso no lanamento de um dado e um s um sucesso na extrao de uma
carta de um baralho de 52 cartas, determine a mdia e o desvio padro do nmero total
de sucessos em um jogo com cada um dos seguintes esquemas alternativos, na
suposio de que a moeda, o dado e o baralho no sejam viciados e os
correspondentes processos de lanamento ou extrao sejam no tendenciosos:
a) lanamento de uma moeda, rolamento de um dado e extrao de uma carta de um
baralho;
b) lanamento de uma moeda trs vezes, rolamento de um dado duas vezes e extrao
de uma carta de um baralho.
30. Decida se cada uma das seguintes sentenas verdadeira ou falsa, indicando as letras
V ou F entre parnteses, respectivamente. Se a sentena for falsa, explique porque?
Varivel Aleatria e Distribuio de Probabilidade Discreta

109
( ) A probabilidade de escolher uma amostra aleatria de trs pessoas em que a
primeira responde "sim" e a ltima pessoa responde "no" de uma populao em
que P["sim"]=0,7 0,70,70,3.
( ) Se um casal particular normal, ento a probabilidade de que seu primo filho
seja uma menina aproximadamente 0,5.
( ) A probabilidade de escolher uma amostra aleatria de trs pessoas em que
exatamente duas respondem "sim" de uma populao em que P["sim"]=0,6
0,60,60,4.
( ) A probabilidade de obter duas faces "trs" no lanamento de dois dados
1/6+1/6 = 1/3.
( ) Em uma distribuio de probabilidade discreta, a rea total compreendida entre a
curva que representa a distribuio e o eixo horizontal igual a um.
( ) Em uma distribuio de probabilidade discreta, o comprimento de uma linha
vertical em um certo valor pode ser interpretado como a probabilidade de tal
valor resultar em uma amostragem aleatria.
( ) Em uma distribuio de probabilidade, a probabilidade de uma varivel aleatria
assumir um valor particular zero.
( ) Variveis aleatrias tm sempre valores numricos.
( ) Variveis nominais no podem ser diretamente modeladas por uma distribuio
de probabilidade.
( ) O valor esperado de uma distribuio de probabilidade pode ser interpretado
como o centro de gravidade.
( ) A varincia de uma distribuio de probabilidade pode ser definida
simbolicamente como E[X-E(X)]
2
e tambm pode ser expressa na forma E(X
2
)-
[E(X)]
2
.
( ) A varincia de uma distribuio de probabilidade uma medida de posio e o
valor esperado indica a disperso.
( ) Se duas distribuies de probabilidade tm a mesma varincia, ento seus
valores esperados tambm so iguais.
( ) Em um experimento binomial, os resultados correspondem a duas classes
mutuamente exclusivas.
( ) Em um experimento binomial com n ensaios de Bernoulli, a varivel aleatria
pode assumir qualquer dos n valores.
( ) Distribuies binomiais no so simtricas, exceto quando p=1-p.
( ) Sendo a distribuio binomial discreta, seu valor esperado um valor inteiro.
( ) Se o parmetro p da distribuio binomial 0,6, a probabilidade de exatamente
60 sucessos em 120 ensaios maior que a probabilidade de 72 sucessos em 120
ensaios.
( ) Se A e B so eventos mutuamente exclusivos, ento P[AB] = P[A] P[B].
Estatstica Bsica

110
( ) A varincia de distribuies discretas pode ser calculada pela frmula V(X) =
np(1-p).
( ) A regra da adio de probabilidades aplica-se apenas para eventos mutuamente
exclusivos.
( ) A distribuio binomial um exemplo de distribuio de probabilidade contnua.
( ) Para a determinao de probabilidades em uma distribuio binomial o nmero
de ensaios n e o parmetro p devem ser conhecidos.
( ) Em uma distribuio de Poisson, E(X)=np e Var(X)=np(1-p).
( ) Os valores de uma varivel aleatria com distribuio de Poisson so discretos,
contveis.
( ) Dado que E(X) usualmente pequeno para uma distribuio de Poisson, um
nmero relativamente grande de intervalos necessrio para estimar o parmetro
efetivamente.
( ) Uma caracterstica tpica da distribuio de Poisson que o valor esperado
maior que a varincia.
( ) A distribuio de Poisson algumas vezes chamada "distribuio de eventos
raros"; portanto, ela raramente encontrada na pesquisa experimental.
( ) A forma da distribuio de probabilidade de Poisson simtrica em relao a seu
valor esperado.
( ) H uma diferente distribuio de Poisson para cada par de valores de e n.
( ) A distribuio de Poisson pode ser sempre usada para aproximar probabilidades
de uma distribuio binomial.
( ) Em amostragens de uma distribuio de Poisson, dado que usualmente
pequeno, valores pequenos de X so muito mais provveis do que valores
grandes.
( ) Se X
1
e X
2
so variveis aleatrias com a mesma distribuio de probabilidade,
ento E(X
1
-X
2
)=0 e Var(X
1
-X
2
)=0.
( ) Se duas populaes tm a mesma mdia, ento elas tambm tm a mesma
varincia.

5 VARIVEL ALEATRIA CONTNUA E
DENSIDADE DE PROBABILIDADE
Contedo
5.1 Introduo.......................................................................................................................111
5.2 Densidade de Probabilidade...........................................................................................112
5.3 Distribuio Normal .......................................................................................................116
5.3.1 Introduo ...............................................................................................................116
5.3.2 Clculo de probabilidades para varivel aleatria normal ......................................118
5.4 Aproximao da Distribuio Binomial pela Distribuio Normal ...............................122
5.5 Distribuio Normal Bivariada ......................................................................................124
5.6 Combinao Linear de Variveis Aleatrias Normais...................................................126
Casos particulares ...................................................................................................126
5.7 Distribuio da Mdia de Variveis Aleatrias..............................................................127
5.8 Exerccios.......................................................................................................................128

5.1 Introduo
Recorde-se que uma varivel aleatria uma funo real definida no espao bsico qual
associada uma funo distribuio de probabilidade. A varivel aleatria discreta se essa
funo distribui a probabilidade total 1 a um nmero finito ou infinito contvel de seus valores.
Uma distribuio de probabilidade de varivel aleatria discreta atribui probabilidades
positivas a pontos isolados da reta. Dessa forma, probabilidades de intervalos podem ser
determinadas pela soma das probabilidades dos pontos nele includos.
No caso de espao bsico no contvel e varivel aleatria no discreta, a definio de
probabilidades envolve alguma complicao. Essa situao ilustrada no exemplo que segue.

Exemplo 5.1. Considere-se a possibilidade de acidente com um caminho que transporta
uma carga de soja de uma propriedade rural at um armazm, distante 100 km, e suponha que h
interesse na probabilidade de que ocorra um acidente em um certo trecho da estrada.
O espao bsico para este experimento consiste de um "continuum" de pontos no
intervalo de 0 a 100. Suponha-se que, se um acidente ocorre, a probabilidade de que ele ocorra em
um trecho de k quilmetros k/100. Essa atribuio de probabilidades consistente com os
axiomas 1 e 2 do conceito de probabilidade (Seo 3.9), visto que as probabilidades k/100 so no
negativas e P(S) = 100/100 = 1. A atribuio de probabilidades definidas aplica-se a intervalos do
Estatstica Bsica 112
segmento de reta compreendidos entre 0 e 100. Pelo axioma 3, pode-se, tambm, obter
probabilidades para a reunio de qualquer seqncia finita ou infinita contvel de intervalos
mutuamente exclusivos. Por exemplo, a probabilidade de que um acidente ocorra em qualquer de
dois intervalos que no se sobrepem, com extenses de k
1
e k
2
km, :
k k
1 2
100
+
e, de modo mais
geral, a probabilidade de que um acidente ocorra em algum intervalo de uma seqncia de
intervalos que no se sobrepe, de comprimentos k
1
, k
2
,...,
k k
1 2
100
+ +...
.

Probabilidades tambm podem ser calculadas para intervalos que se sobrepe. Por outro
lado, como a interseo de dois intervalos um intervalo e o complemento de um intervalo um
intervalo ou a unio de dois intervalos, pode-se calcular probabilidades para qualquer subconjunto
do espao bsico que possa ser obtido por unies ou intersees de um nmero finito ou infinito
contvel de intervalos, ou por complementos.
Dessa forma, nessa extenso do conceito de probabilidade ao caso contnuo, aplicam-se
os trs axiomas do conceito de probabilidade. Entretanto, em tais extenses, em geral, deve-se
excluir da definio de "evento" todos os subconjuntos do espao bsico que no podem ser
obtidos pela formao de reunies ou intersees de nmeros finitos ou infinitos contveis de
intervalos, ou por complementaes. Demonstra-se que tais eventos existem sobre a linha reta.
Entretanto, na prtica, esse fato no tem conseqncias importantes, pois, simplesmente, no se
atribui probabilidades a tais tipos de eventos sem interesse.
Por outro lado, considerando, ainda, o Exemplo 5.1, observe-se que a probabilidade de
um acidente ocorrer em um intervalo de amplitude muito pequena, seja 1 cm, apenas
0,000.000.1. Na medida que a amplitude do intervalo aproxima-se de zero, a probabilidade de um
acidente no intervalo tambm se aproxima-se de zero. Por essa razo, atribui-se probabilidade zero
a pontos individuais. Isto no significa que os eventos correspondentes no podem ocorrer, j que,
quando um acidente ocorre em um trecho de 100 km de uma rodovia, ele tem de ocorrer em algum
ponto, embora cada ponto tenha probabilidade zero.
5.2 Densidade de Probabilidade
O modo de assinalar probabilidades no Exemplo 5.1 muito particular, mas de natureza
semelhante ao modo em que se assinala probabilidades no caso de espao bsico discreto
equiprovvel, tal como seleo aleatria de uma garrafa de vinho de uma pilha. Para a melhor
compreenso do processo geral de associao de probabilidades com variveis aleatrias
contnuas, suponha-se que uma indstria de vinho est interessada na quantidade real de vinho que
preenchida por uma mquina em garrafas de 630 ml. A quantidade de vinho preenchida nas
garrafas ser varivel e poder assumir qualquer valor de um certo intervalo em torno de 630 ml;
portanto, uma varivel aleatria contnua. Entretanto, se o volume preenchido registrado com
preciso de mililitro, a correspondente varivel aleatria ser discreta, com uma distribuio de
probabilidade que pode ser representada em um histograma, como o da Figura 5.1.a, em que as
probabilidades correspondem s reas dos retngulos. Se os volumes preenchidos so registrados
com a preciso mais elevada de 1/5 de mililitro, a correspondente varivel aleatria ainda ser
discreta, com uma distribuio de probabilidade como a representada no histograma da Figura
5.1.b.

5. Varivel Aleatria Contnua e Densidade de Probabilidade
113

Figura 5.1. Funes de probabilidade das variveis aleatrias do Exemplo
5.1, com preciso crescente da escala de mensurao.

aparente que, se os volumes preenchidos so registrados com preciso crescente (de um
milsimo de milmetro, de um milionsimo de milmetro, e assim por diante), os histogramas das
distribuies de probabilidades das correspondentes variveis aleatrias discretas se aproximaro
de uma curva contnua, como a da Figura 5.1.c. Para cada um desses nveis de preciso, a
probabilidade de que a quantidade de vinho preenchida situe-se em um intervalo especfico a
soma das reas dos retngulos assentados sobre o intervalo. Essa probabilidade aproxima-se da
rea sob a curva no correspondente intervalo quando o nvel de preciso das medidas cresce. Dessa
forma, probabilidades correspondentes varivel aleatria contnua que exprime o volume de
vinho preenchido pela mquina em garrafas de 630 ml correspondem s reas sob essa curva.
De modo geral, a definio de probabilidade para uma varivel aleatria contnua X
presume a existncia de uma funo distribuio de probabilidade f(x) que atribui como
probabilidade associada com qualquer intervalo de valores do espao de X a rea sob a curva f(x),
compreendida no correspondente intervalo. Em outras palavras, a probabilidade de que uma
varivel aleatria contnua X assuma um valor em um intervalo (a, b) provida pela rea sob a
curva f(x), que obtida pela integrao da funo f(x) no intervalo (a, b). Esse argumento o
fundamento para o conceito que segue.

Uma funo f(x), definida no conjunto dos nmeros reais, uma funo
distribuio de probabilidade de uma varivel aleatria contnua X se e somente se:

b
a
P(a X b) = f(x) dx


para quaisquer nmeros reais a e b (ab).

Estatstica Bsica 114
A funo distribuio de probabilidade de uma varivel aleatria contnua , usualmente,
designada funo densidade de probabilidade, ou densidade de probabilidade, ou funo
densidade, ou, ainda mais simplesmente, densidade.
Observe-se que, agora, o valor da funo densidade de probabilidade de X em um ponto
c, ou seja, f(c), no corresponde probabilidade P[X=c], como no caso de varivel aleatria
discreta. De fato, para qualquer varivel aleatria contnua X, P[X=c] = 0 para qualquer valor c.
Assim, a funo de densidade f(x) associa probabilidades a intervalos; no a valores reais
especficos.
Em decorrncia dessa propriedade, as probabilidades associadas a uma varivel aleatria
contnua no se alteram pela alterao dos valores da correspondente funo densidade de
probabilidade para alguns valores particulares da varivel aleatria. Dessa forma, a probabilidade
de um intervalo a mesma sejam os seus extremos includos ou excludos, ou seja:
P(aXb) = P(aX<b) = P(a<Xb) = P(a<X<b).
Uma funo densidade de probabilidade satisfaz s seguintes propriedades, anlogas
quelas da funo massa de probabilidade, que seguem dos axiomas da probabilidade:
1) f(x) > 0, para - <x<;
2)
+
-
f(x) dx 1

.
Reciprocamente, qualquer funo real f(x) que satisfaa a essas duas propriedades uma funo
densidade de probabilidade.

Exemplo 5.2. A funo densidade para a varivel aleatria contnua do Exemplo 5.1. :
f(x) =
1 100 0 100
0
/ ,
,

x
caso contrario

Essa funo densidade representada na Figura 5.2.


Figura 5.2. Representao geomtrica da funo densidade da varivel
aleatria do Exemplo 5.1.

A probabilidade de um acidente entre os quilmetros 80 e 100 dada pela rea do
retngulo sobre o intervalo (80,100), ou seja: (100-80).
1
100
1
5
. Essa probabilidade (rea) a
integral definida da funo f(x) no intervalo (80,100), ou seja:
5. Varivel Aleatria Contnua e Densidade de Probabilidade
115
100
100
80
80
1 x 100 80 1
dx
100 100 100 5



Mais comumente, o clculo de probabilidades para variveis aleatrias contnuas no
pode ser efetuado, simplesmente, por processo geomtrico, como o ilustrado para o exemplo. Em
tais situaes, o conhecimento de Clculo Integral imprescindvel.
O conceito de valor esperado estendido para varivel aleatria contnua pela
transformao de soma em integrao:

A mdia (valor esperado) e a varincia de uma varivel aleatria contnua X so
definidos como segue:

+
-
(X) x f(x) dx

E , e
Var(X) = ( )
2
x x f (x) dx
+

, ]
]
E .

As propriedades do valor esperado e da varincia listada para varivel aleatria discreta
tambm se estendem para varivel aleatria contnua:
1) Se X uma varivel aleatria contnua e a e b so constantes, ento:
E(aX+b) = a E(X) + b.
Var(aX+b) = a
2
Var(X).
2) Se g
i
(X), i=1,2,...,n, so funes de uma varivel aleatria contnua X e c
i
, i=1,2,...,n,
so constantes, ento:
E[ c g
i
i
n
i

1
(X)] = c g
i
i
n
i

1
E[ (X)].
Os conceitos e propriedades referentes distribuio de duas ou mais variveis aleatrias
tambm se estendem ao caso contnuo.

Uma funo f(x,y) definida no plano R
XY
2
uma funo densidade de
probabilidade conjunta de duas variveis aleatrias contnuas X e Y se e somente se:
P[(x,y)A] =
A
f (x, y) dxdy


para qualquer regio (evento) A do plano R
XY
2
.

Uma funo densidade bivariada f(x,y) representada, geometricamente, por uma
superfcie em um espao de trs dimenses. O volume sob essa curva acima do plano XY igual a
um. A probabilidade de uma regio A do plano XY, ou seja, a probabilidade de que um valor da
varivel aleatria bidimensional (X,Y) situe-se na regio A, o volume do slido reto sob a
superfcie f(x,y) com base em A. Essa probabilidade (volume) a integral da funo f(x,y) na rea
A.
Estatstica Bsica 116
Uma funo bivariada f(x,y) uma funo densidade de probabilidade conjunta de
duas variveis aleatrias contnuas X e Y se seus valores satisfazem s duas propriedades que
seguem, derivadas dos postulados do conceito de probabilidade:
1) f(x,y) 0, -<x<+; -<y<+.
2)
+
-
f(x,y) dxdy = 1
+


.
Todos os conceitos e propriedades da distribuio de n variveis aleatrias discretas
estendem-se para a situao de n variveis aleatrias contnuas.
Ao contrrio de distribuies discretas, tais como binomial, binomial negativa e
hipergeomtrica, as distribuies de variveis aleatrias contnuas, usualmente, no podem ser
derivadas atravs de argumentos probabilistas simples. Em vez disso, para uma varivel aleatria
contnua, deve ser procedida uma escolha judiciosa da funo densidade de probabilidade, com
base em conhecimentos anteriores e em informaes providas por dados disponveis. Felizmente,
so disponveis algumas famlias paramtricas gerais de funes densidades de probabilidade que
se tm revelado apropriadas ou boas aproximaes para uma ampla gama de situaes
experimentais. Entre essas, salienta-se a funo de densidade de probabilidade normal, da qual se
tratar a seguir.
5.3 Distribuio Normal
5.3.1 Introduo
A distribuio normal a mais importante e amplamente utilizada distribuio em
estatstica aplicada. As distribuies de freqncias de observaes de muitas medidas fsicas de
fenmenos naturais tm a aparncia muito prxima da distribuio normal. Por exemplo, as
medidas de caractersticas biomtricas de seres vivos, como peso e altura, e erros de mensurao
em experimentos cientficos. As representaes grficas de freqncias relativas dessas
caractersticas, atravs de histogramas, aproximam-se da curva normal da Figura 5.1.c. Mas h
outra razo mais fundamental para a importncia da distribuio normal em estatstica. Uma
propriedade terica da mdia da amostra, derivada do teorema central do limite, permite o uso da
distribuio normal como uma aproximao dos modelos probabilistas para muitos experimentos
cujas observaes bsicas constituem realizaes de variveis aleatrias discretas ou contnuas no
normais.
A distribuio normal foi pela primeira vez pesquisada no sculo dezoito, quando
cientistas observaram um extraordinrio grau de regularidade em erros de mensurao. Eles
descobriram que os padres, ou distribuies, dos erros de medidas de fenmenos que observavam
podiam ser muito bem aproximados por uma curva contnua que referiram como "curva normal
dos erros". As propriedades matemticas da curva normal foram estudadas por Abraham de
Moivre (1667-1745), Pierre Laplace (1749-1827) e Karl Gauss (1777-1855).

5. Varivel Aleatria Contnua e Densidade de Probabilidade
117
Uma varivel aleatria X tem distribuio normal e referida como uma varivel
aleatria normal, se sua densidade de probabilidade expressa por:
f(x) =
2
2
(x )
2
1
, x
2

< <+

e
onde e
2
so parmetros que satisfazem -<<+ e > 0, e denota a base do
sistema logartmico neperiano, aproximadamente igual a 2,71828, e a conhecida
constante matemtica, aproximadamente igual a 3,14159.

O intervalo da varivel aleatria normal -<x<+. Isso pode parecer uma restrio
utilidade da distribuio normal, j que os erros de mensurao so, obviamente, demarcados em
algum intervalo e a maioria das variveis de interesse na natureza, em particular as variveis
biomtricas, so no negativas. O argumento para essa aparente contradio que, de fato, a
distribuio normal, como qualquer modelo probabilista e, em geral, qualquer modelo matemtico,
apenas uma aproximao s situaes reais modeladas. No caso de erros de medida, por
exemplo, o modelo probabilista normal pressupe, tacitamente, que a probabilidade de obter erros
de medida muito grandes muito pequena e a probabilidade de obter erros de medida negativos ,
tambm, muito pequena. O modelo probabilista normal aproxima a situao real do fenmeno
fsico que requer que essas probabilidades sejam nulas, assinalando probabilidades pequenas a
esses eventos. Essa aproximao semelhante aproximao que se obtm quando se pressupe
que observaes efetuadas atravs de instrumentos de medida discretos constituem realizaes de
variveis aleatrias contnuas.
Dado que uma funo densidade normal particular especificada por um par de valores
de e
2
, comum denotar que uma varivel aleatria X tem distribuio normal com mdia e
varincia
2
por X~N(,
2
).

A distribuio normal particular com mdia =0 e varincia
2
=1 denominada
distribuio normal padro. comum designar a varivel aleatria padro por Z, de
modo que: Z~N(0,1).

Claramente, f(x)>0 para qualquer valor real x de X. Entretanto, conhecimentos de Clculo
Integral so necessrios para demonstrar que f

+
(x,y) dx = 1 para quaisquer valores de e
2
, e
que E(X)= e Var(X)=
2
, o que justifica o uso dos smbolos e
2
para representarem os dois
parmetros da funo densidade normal.
A Figura 5.3 apresenta os grficos da funo densidade normal f(x) para: a) diferentes
valores de e
2
fixo, e b) diferentes valores de
2
e fixo. A Figura 5.3.a mostra que uma
alterao da mdia de
1
para
2
apenas desloca a curva
1
-
2
unidades ao longo do eixo x. A
forma da curva permanece inalterada. Por outro lado, um diferente valor do desvio padro resulta
em uma diferente altura mxima da curva e em uma diferente quantidade da rea em qualquer
intervalo fixo centrado em (Figura 5.3.b). Com a alterao de
2
apenas, a posio do centro da
curva no muda.
Estatstica Bsica 118

Figura 5.3. Grficos de funes de densidades normais com: a) diferentes
mdias e iguais varincias; b) iguais mdias e diferentes
varincias.

O grfico da funo densidade de probabilidade normal simtrico em relao mdia
e tem a forma de sino, com ponto de simetria em , que coincide com a moda e a mediana da
distribuio. Grficos para valores grandes de so espalhados em relao , enquanto grficos
para valores pequenos de tm um pico elevado no ponto e a maioria da rea sob o grfico
muito prxima de . Assim, valores grandes de implicam maior probabilidade para valores de X
afastados de do que valores pequenos de . Intervalos de mesma amplitude tm probabilidade
mais elevada quanto mais prximo da mdia se situam. Intervalos centrados em com extremos
afastados 1, 2 e 3 desvios padres de tm probabilidades, respectivamente, 0,683, 0,954 e 0,997,
ou seja:
P[-<X<+] = 0,683;
P[-2<X<+2] = 0,954;
P[-3<X<+3] = 0,997.
Assim, reas sob a curva externas a intervalos cujos extremos se afastam de mais de
trs desvios padres so muito pequenas.
5.3.2 Clculo de probabilidades para varivel aleatria normal
A probabilidade de um evento quando X tem uma distribuio normal, por exemplo,
P[a<X<b], provida pela integral definida da funo de densidade no intervalo (a,b), ou seja:
5. Varivel Aleatria Contnua e Densidade de Probabilidade
119
[ ]
2
2
2
(x )
1
P X dx
2

< <

b
a
a b e .
Essa integral no pode ser calculada pelas tcnicas de integrao usuais. Ademais, seu
valor depende dos parmetros e
2
, o que demandaria a avaliao da integral para cada par de
valores (,
2
). Felizmente, entretanto, demonstra-se que a transformao de varivel: Z =
x


conduz o clculo de P[a<X<b] a uma integrao definida que independe de e
2
. Essa
transformao desloca a mdia de para o ponto zero e altera a escala pela diviso por ,
tornando o desvio padro igual a um. De fato,
Z =
x

X = Z + ,
de modo que os seguintes eventos so equivalentes:
{s | a<X(s)<b} = {s | a<Z(s)+<b} =

s | < Z(s) <


a b-
.
Ento, substituindo x = z+ na expresso que define P[a<X<b] como a integral definida
da funo densidade da varivel aleatria X~N(,
2
), obtm-se:
2
b
a
z
2
1
P[a<X<b] = dz
2

e .
Pode-se reconhecer que o integrando , agora, a funo de densidade da varivel aleatria
normal padro Z, com mdia zero e varincia 1, ou seja: Z~N(0,1), e que:
P[ <X< ] = P < Z <
, ]
, ]
]
a b-
a b .
Desse modo, o clculo de probabilidade para uma varivel aleatria X~N(,
2
), para um
par de valores especficos de (,
2
), reduz-se ao clculo de probabilidade para a varivel aleatria
Z~N(0,1), que independe de e
2
.
Probabilidades para intervalos da varivel aleatria Z so disponveis em tabelas
especiais. Uma dessas tabelas a Tabela II, do Apndice.
Em inferncia estatstica, freqentemente, necessita-se de valores da estatstica Z que
demarcam pequenas reas nas caudas da curva normal padro. Denote-se por z

o valor da
estatstica que limita sua direita a rea sob a curva normal padro (Figura 5.4).
Estatstica Bsica 120

Figura 5.4. Grfico da distribuio normal padro, com a indicao do
100(1-)-simo percentil.

Como % da rea sob a curva normal padro situa-se direita de z, (1-)% da rea fica
esquerda de z

. Assim, z

o 100(1- )-simo percentil da distribuio normal padro, tambm


designado ponto -percentual superior ou desvio normal correspondente a . Por simetria, a
rea sob a curva normal padro esquerda de - z

tambm . Os valores z

so, usualmente,
referidos como valores crticos da distribuio normal padro.
A Tabela II contm os valores z

para diversos valores de . Atravs de consulta Tabela


II, pode-se obter o valor de P[Z > z

] para um dado , ou o valor de para uma dada P[Z > z

].
Essa tabela permite a determinao de probabilidades para variveis aleatrias normais mais
genricas X~N(,
2
), para qualquer intervalo infinito da forma (b, ), j que:
P[X>b] =
2
2
(x )
1
dx
2

b
e
=
2
z
z
2
1
dz
2

e .= P[X> z

],
onde z

=
b

. Essa probabilidade corresponde rea da cauda direita sob a curva f(x) da


Figura 5.4.
Assim, para obter essa probabilidade, subtrai-se a mdia de b e divide-se o resultado
pelo desvio padro , ou seja, calcula-se z = (b-)/. Entra-se com esse valor na Tabela II e l-se a
probabilidade na correspondente clula. Reciprocamente, dada a probabilidade de um intervalo da
forma (b,) para uma varivel aleatria X~N(,
2
), pode-se obter o valor de b, tambm pela
inspeo da Tabela II.

Exemplo 5.3. P[X>8], X~N(2,9).
Subtraindo a mdia =2 de ambos os membros da desigualdade X>8 e, logo aps,
dividindo ambos os membros por = 9 =3, obtm-se, sucessivamente:
P[X>8] = P[X-2>8-2] =
x-2 8 2
P
3 3
, ]
>
, ]
]

5. Varivel Aleatria Contnua e Densidade de Probabilidade
121
= P[Z2].
Entrando na Tabela II com z=2, obtm-se: P[Z2] = 0,0228 (valor de a correspondente a z

=2).
Portanto, P[X>8] = 0,0228.

A probabilidade de um intervalo infinito da forma (- ,b) pode ser obtida pela relao:
P[X<b] = 1-P[Xb].

Exemplo 5.4. P[X<3], X~N(2,9).
Pela relao anterior:
P[X<3] = 1-P[X>3].
Mas
P[X>3] =
x-2 3 2
P
3 3
, ]
>
, ]
]
= P[Z>0,33] = 0,3707,
onde 0,3707 o valor da Tabela II para z

=0,33. Logo,
P[X<3] = 1-0,3707 = 0,6293.

A Tabela II no inclui valores negativos de z

, j que, pela simetria da distribuio


normal padro em relao zero, probabilidades de intervalos infinitos com um extremo finito
negativo podem ser obtidas de probabilidades de intervalos infinitos com extremo finito positivo,
pelas relaes:
P[Z<- z

] =P[Z> z

] e
P[Z>- z

] = 1-P[Z<- z

] = 1-P[Z> z

].
Essas relaes podem ser verificadas com o auxlio da Figura 5.4.

Exemplo 5.4.
a) P[Z<-1,5] = P[Z>1,5] = 0,0668.
b) P[Z>-1,5] = 1-P[Z1,5] = 1-0,0668 = 0,9332.

A probabilidade de um intervalo finito, da forma P[a<X<b], pode ser obtida por uma
extenso simples dos argumentos anteriores. Esta probabilidade corresponde rea sombreada na
Figura 5.5. Ela pode ser calculada atravs da relao:
P[a<X<b] = P[X>a] - P[X>b],
onde ambas as probabilidades do segundo membro podem ser calculadas com o auxlio da Tabela
II, segundo procedimento indicado anteriormente.

Estatstica Bsica 122

Figura 5.5. Grfico da distribuio de uma varivel aleatria X~N(,
2
),
com a indicao das reas correspondentes a P[a<X<b],
P[X>a].

Exemplo 5.5. P[3<X<8], X~N(2,9].
De acordo com a ltima relao e usando resultados de exemplos anteriores, obtm-se:
P[3<X<8] = P[X>3] - P[X>8] =
= 0,6293 - 0,0228 = 0,6065.
5.4 Aproximao da Distribuio Binomial pela Distribuio Normal
A distribuio binomial b(n,p) a distribuio do nmero X de sucessos em n
experimentos independentes de Bernoulli com probabilidade de sucesso comum p. Demonstra-se
que a distribuio normal uma boa aproximao para a distribuio binomial com parmetros n
elevado e p no muito prximo de 0 ou 1.
Recorde-se que a mdia e a varincia da distribuio b(n,p) so: =np e
2
=np(1-p).
Conforme foi visto na Seo 4.3.8, quando o parmetro n grande mas np moderado, ou seja,
quando =np ou
2
=np(1-p) moderado, a distribuio de Poisson constitui uma boa aproximao
da distribuio binomial. A aproximao normal til na situao mais tpica em que n elevado
e p no muito prximo de 0 ou 1. Essa propriedade permite tratar uma varivel aleatria X com
distribuio b(n,p) como se ela tivesse distribuio N(np, np(1-p)).
Nessas circunstncias, a determinao da probabilidade de que X~b(n,p) assuma valores
em um intervalo [a,b], ou seja:
P[aXb] = ( )
n x x x
n
x
C P 1 p

b
a

pode ser procedida atravs do clculo da probabilidade de que X~N(np, np(1-p)) esteja no
intervalo [a,b]. Essa probabilidade pode ser determinada atravs da padronizao de X, ou seja,
atravs da varivel aleatria:
Z
X np
np(1 - p)



que tem distribuio N(0,1), de modo que (aproximadamente):
P[aXb] P
np
np p
Z
np a b

,
]
]
]
( ) 1 np(1 - p)

5. Varivel Aleatria Contnua e Densidade de Probabilidade
123
Essa probabilidade pode ser calculada a partir da tabela de probabilidades da distribuio
normal padro (Tabela II), conforme visto na Seo 5.3.2. Como uma regra geral, esta
aproximao usualmente satisfatria quando np e n(1-p) so ambos maiores do que 15.
A aproximao lograda pela distribuio normal ilustrada na Figura 5.6 que mostra o
histograma da distribuio b(15;0,4) e a curva da distribuio normal que a aproxima, com =
150,4 = 6,0 e
2
= 150,40,6 = 3,6. Essa ilustrao mostra que a aproximao razovel,
mesmo para um valor pequeno de n, ou seja 5, que implica np=6, muito menor do que o menor
valor de np indicado pela regra prtica mencionada anteriormente.


Figura 5.6. Histograma da distribuio b(15;0,4) e curva da distribuio
normal que a aproxima.

Para uma ilustrao mais concreta, considere-se a probabilidade de que X~b(15;0,4)
situe-se no intervalo [7,10]. O valor exato, obtido da tabela da distribuio binomial (Tabela I), :
P[7X10] = 0,991-0,610 = 0,381.
Por outro lado, a distribuio N(6; 3,6) que aproxima a distribuio b(15;0,4), d:
P[7<X<10] ] P
7 - 6
1,9
Z
10 - 6
1,9

,

,
]
]
]

= P[0,526 Z 2,105]
= 0,982 - 0,700 = 0,282.
Essa aproximao pode ser melhorada atravs de um ajustamento no processo de clculo.
De fato, observe-se que a probabilidade P[7X10] = 0,381 a rea das barras sombreadas na
Figura 5.6. Como essas barras estendem-se de 6,5 a 10,5, uma melhor aproximao da rea sob a
curva obtida se se considera o intervalo (6,5; 10,5). Com esse ajustamento, tem-se:
P[7<X<10] ] P
6,5 - 6
1,9
Z
10,5 - 6
1,9

,

,
]
]
]
=
= P[0,263 Z 2,368] =
= 0,991 - 0,604 = 0,387.
Estatstica Bsica 124
Esse resultado consideravelmente mais prximo do valor correto, 0,381, apesar de n ser pequeno.
Como atravs desse processo se est aproximando uma distribuio discreta atravs de
uma distribuio contnua, esse ajustamento denominado correo de continuidade.
Em resumo, se X~b(n,p) com os parmetros n grande e p no muito prximo de 0 ou 1, a
distribuio da varivel aleatria padronizada
( )
Z
X np
np 1 p

aproximadamente N(0,1), de
modo que:
P[aXb] ] P
np
np p
Z
np a b

,
]
]
]
( ) 1 np(1 - p)
(sem correo de continuidade)

( ) ( )
P
0,5 np
np 1 p
Z
- 0,5 np
np 1 p
a b

,
,
]
]
]
]
(com correo de continuidade)

Exemplo 5.6. Um levantamento de grande escala, efetuado recentemente, revelou que
30% das rvores de uma floresta estavam infestadas com um certo parasita. Supondo que o nvel
de infestao da floresta se tenha mantido estvel, qual a probabilidade de que em uma amostra
aleatria de 1.000 plantas o nmero de plantas infestadas seja menor do que 280?
Seja X o nmero de plantas infestadas na amostra de 1.000 plantas da floresta. Sob a
pressuposio de que a proporo de infestao na populao seja 0,3, X tem distribuio b(1.000;
0,3). Ento, como np=300 e np(1-p)=210 so ambos valores elevados, uma boa aproximao da
distribuio de X provida pela distribuio N(300, 210). Assim, a probabilidade de que o nmero
de plantas infestadas seja inferior a 280 pode ser obtida como segue:
a) Sem correo de continuidade:
P[X<279] P Z
279 300
14,5

,
]
]
]
= P[Z-1,448] = 0,074.
b) Com correo de continuidade:
P[X<279] P Z
279,5 300
14,5

,
]
]
]
= P[Z-1,414] = 0,079.

Observe-se que para a situao do Exemplo 5.6 a correo de continuidade pouco alterou
o resultado. Isso decorre do pouco efeito da subtrao de 0,5 no numerador quando o denominador
( ) np 1 p grande. De modo geral, a correo de continuidade dispensvel para valores
elevados de np que implicam em valores elevados de ( ) np 1 p .
5.5 Distribuio Normal Bivariada
A distribuio normal multivariada de especial importncia para os mtodos estatsticos
a serem tratados neste texto. A discusso que segue, entretanto, restringir-se- distribuio
normal bivariada, j que a situao multivariada requer notao matricial.
5. Varivel Aleatria Contnua e Densidade de Probabilidade
125

Um par de variveis aleatrias X e Y tem distribuio normal bivariada, se e
apenas se sua funo de densidade de probabilidade conjunta dada por:

1 1 2 2
2
1 1 2 2
2 2
2
x x y y 1
2(1 )
2
1 2
1
f (x, y)
2 1
, ]
j \ j \j \ j \
, ]
+
, ( , (, ( , (
, ]
( , ( ,( , ( ,
]


e
para -<x< e -<y<, onde
1
2
>0,
2
2
>0, e -1<<1.

Demonstra-se que os parmetros
1
,
2
,
1
2
e
2
2
so, respectivamente, as mdias e as
varincias das variveis aleatrias X e Y, ou seja:
E(X) =
1
; E(Y) =
2
;
Var(X) =
1
2
; Var(Y) =
2
2
.
O parmetro , ou
XY
, denominado coeficiente de correlao das variveis aleatrias X e YY.
Sua expresso :
( )

Cov X, Y

1 2
.
Dessa forma, o parmetro exprime a variao conjunta das variveis aleatrias X e Y.
As funes densidades condicionais das variveis de um par de variveis aleatrias com
distribuio normal bivariada tambm so importantes. Demonstra-se que, se X e Y tm
distribuio normal bivariada, a funo densidade condicional de Y dado X=x tambm normal,
com mdia:
E(Y | X=x) = ( )


Yx
x
|
+
2
2
1
1

e varincia:
Var(Y | X=x) =
Y|x
=
2
2
(1-
2
);
e a densidade de probabilidade condicional de X dado Y=y normal com mdia:
( ) ( )
X|y 1 2
1
2
X|Y=y x- +

E
e varincia:
Var(X | Y=y) =
X|y
=
1
2
(1-
2
);
A distribuio normal bivariada tem algumas propriedades importantes. Entre elas a
seguinte: Se duas variveis aleatrias tm distribuio normal bivariada, ento elas so
independentes se e somente se = 0. Se
XY
=0, diz-se que as variveis X e Y so no
correlacionadas.
Estatstica Bsica 126
5.6 Combinao Linear de Variveis Aleatrias Normais
Em sees anteriores, foram apresentados alguns conceitos referentes a funes de vrias
variveis aleatrias. Em particular, o conceito de valor esperado de uma funo g(X
1
,X
2
,...,X
n
) de
n variveis aleatrias. A distribuio de funes de variveis aleatrias essencial em inferncia
estatstica. Por exemplo, a distribuio de combinaes lineares de variveis aleatrias, das quais a
mdia da amostra um caso especial, tem um importante papel. Nesta Seo, tratar-se- da
distribuio de combinaes lineares de variveis aleatrias normalmente distribudas.
Preliminarmente, revisar-se- as expresses da mdia e da varincia de uma combinao
linear de variveis aleatrias, de que se tratou na Seo 4.10.
Sejam X
1
,X
2
,...,X
n
variveis aleatrias independentes com mdias
1
,
2
, ...,
n
e
varincias
2
1
,
2
2
,...,
n
2
, respectivamente. Seja Y uma combinao linear das vaiveis aleatrias
X
1
, X
2
, ...,X
n
, ou seja, uma varivel aleatria expressa por:
Y = a
1
X
1
+ a
2
X
2
+...+ a
n
X
n
,
onde a
1
, a
2
, ...,a
n
so constantes. Ento, Y possui s seguintes propriedades:
1) E(Y) = a
1
E(X
1
) + a
2
E(X
2
) +...+ a
n
E(Xn),
isto :

Y
= a
1

1
+ a
2

2
+ ... + a
n

n
.
Esta propriedade significa que o valor esperado de uma combinao linear de variveis
aleatrias igual combinao linear dos valores esperados dessas variveis aleatrias. Esta
relao vlida mesmo que as variveis aleatrias X
1
, X
2
, ...,X
n
sejam dependentes.
2) Var(X) = a
1
Var(X
1
) + a
2
Var(X
2
) +...+ a
n
Var(X
n
) ,
ou seja:

2
= a
1
2

1
2
+ a
2
2

21
2
+...+ a
n
2

n
2
.
Esta propriedade vlida apenas se as variveis aleatrias X
1
, X
2
, ...,X
n
so
independentes.
A propriedade fundamental referente combinao linear de variveis aleatrias, na
situao particular em que as variveis tm distribuio normal, a seguinte:
Se X
1
, X
2
, ...,X
n
so variveis aleatrias independentes normalmente distribudas, ento Y
= a
1
X
1
+ a
2
X
2
+...+ a
n
X
n
tambm uma varivel aleatria normalmente distribuda, com mdia
e varincia
2
, ou seja:
Y ~ N(a
1

1
+a
2

2
+...+ a
n

n
, a
1
2

1
2
+a
2
2

2
2
+...+a
n
2

n
2
).
Casos particulares
As duas propriedades da distribuio normal que seguem so importantes em muitas
aplicaes.
1) Se X~N(,
2
) e a e b so duas constantes, ento:
Y = a + b X ~ (a + b , b
2

2
).
5. Varivel Aleatria Contnua e Densidade de Probabilidade
127
Ou seja, a transformao linear de uma varivel aleatria normal, gera uma varivel aleatria
tambm normal.
2) Se X ~ N(
1
,
1
2
) e Y ~ N(
2
,
2
2
) e X e Y so estatisticamente independentes, ento:
X+Y ~ N(
1
+
2
,
1
2
+
2
2
) e
X-Y ~ N(
1
-
2
,
1
2
+
2
2
) .
Isto , a soma e a diferena de duas variveis aleatrias normais tambm so variveis aleatrias
normais.
5.7 Distribuio da Mdia de Variveis Aleatrias
O valor esperado e a varincia da mdia de n variveis aleatrias independentes podem
ser derivados dos resultados da seo anterior. Sejam X
1
, X
2
,...,X
n
n variveis aleatrias
independentes normalmente distribudas. A mdia dessas n variveis :
1 2 n
1 2 n
X +X +...+X 1 1 1
X X + X +...+ X
n n n n
.
O valor esperado e a varincia da mdia X so imediatamente derivados das duas
propriedades listadas na seo anterior:
( )
X
n
n
+ + +
1
1 2
... e
( )
X
1
2
2
2
n
2
n
2 1
+ + + ... .
Se as n variveis aleatrias X
1
, X
2
, ...,X
n
tm distribuio idntica, com mdia e varincia
comuns e
2
, respectivamente, as expresses do valor esperado e da varincia de sua mdia
simplificam-se:
( )
X
n
+ + +
1
... , e
( )

X
2 2 2
n
n
2
1 2
2
1
+ + + ...
n
.
Dessa forma, o valor esperado da mdia X das variveis aleatrias X
1
, X
2
,... ,X
n
o valor
esperado comum das variveis aleatrias individuais e a varincia de X a n-sima parte da
varincia comum dessas variveis aleatrias. Ademais, se as n variveis aleatrias X
1
, X
2
,... ,X
n

so normalmente distribudas com mdia e varincia
2
, a mdia X normalmente distribuda
com mdia e varincia
2
n

, ou seja: X ~ N(,

2
n
).
Na Seo 5.3.2, foi visto que subtraindo de uma varivel aleatria com distribuio
normal sua mdia e, ento, dividindo por seu desvio padro, a varivel aleatria resultante tem
distribuio normal padro, com mdia 0 e varincia 1. Assim, a varivel aleatria:
( )
n X
X
n



Estatstica Bsica 128
tem distribuio normal com mdia 0 e varincia 1, contanto que as variveis aleatrias X
1
, X
2
,...,
X
n
sejam todas normalmente distribudas com mdia e varincia comuns e
2
, respectivamente.
5.8 Exerccios
1. Determine a mdia e a varincia da varivel aleatria X com a seguinte funo de
densidade de probabilidade:
f x
x
caso contrario
( )
,
,

1
10
0 10
0

2. A quantidade real de caf (em gramas) em uma jarra de 8 hectogramas enchida por
uma mquina uma varivel aleatria com densidade de probabilidade:
f x
x
x
x
( )
, ,
, , ,
, ,

< <

0 7 9
5 7 9 8 1
0 8 1

Determine a probabilidade de que uma jarra de 8 hectogramas preenchida por essa
mquina contenha:
a) no mximo 7,93 hectogramas de caf;
b) entre 7,89 e 8,02 hectogramas de caf;
c) no mnimo 7,95 hectogramas de caf.
3. A varivel aleatria X que exprime o peso de indivduos de uma populao tem
distribuio normal com mdia igual a 70 kg e desvio padro igual a 10 kg. Determine
a probabilidade de indivduos dessa populao com peso compreendido em cada um
dos seguintes intervalos:
a) (40 kg, 60 kg); b) {x | x<100}; c) {x | x> 25}; d) {x | x >100}.
4. O tempo de vida sem defeito de um aparelho para uma determinao de laboratrio
tem distribuio normal com mdia de 12 meses e desvio padro de 2 meses. O
fabricante garante a substituio das unidades que produz caso demonstrem defeitos
no prazo de 15 meses. Se o fabricante produz 10.000 dessas unidades em um ano,
quantas dessas unidades deve esperar substituir dessa produo aps 15 meses ?
5. A temperatura mdia no dia 21 de maro em um local tem distribuio normal com
mdia de 22C e desvio padro de 5,5C. Qual a probabilidade da temperatura do
prximo dia 21 de maro situar-se: a) entre 26 e 32C; b) abaixo de 17C ?
6. Uma pesquisa mostrou que o tempo de vida de um certo tipo de bateria tem
distribuio normal com mdia de 1248 dias e desvio padro de 185 dias. Se o
fabricante dessas baterias garante a bateria por 24 meses (ou seja, 730 dias), que
percentagem das baterias ter que substituir para atender garantia ?
7. Quanto maior o contedo de enxofre do carvo, ele menos desejvel como
combustvel para aquecimento. Sabendo que a variabilidade da determinao do
enxofre de carvo produzido de uma certa mina = 6 kg por tonelada e que o
5. Varivel Aleatria Contnua e Densidade de Probabilidade
129
contedo de enxofre desse carvo tem distribuio normal, responda s seguintes
questes:
a) Se minas com 80 kg de enxofre por tonelada de carvo so inadequadas para
produo de carvo combustvel, qual a probabilidade de que uma mina com
contedo mdio de enxofre de 62 kg por tonelada seja considerada na categoria de
inadequada na base de uma amostra aleatria de uma tonelada de carvo ?
b) Algumas cidades no permitem a venda de carvo nos limites da cidade se o seu
contedo de enxofre superior a 34 kg por tonelada. Qual a probabilidade de que
carvo com contedo mdio de enxofre de 40 kg por tonelada ter permisso de ser
vendido na cidade na base de uma amostra aleatria de uma tonelada do carvo ?
8. So disponveis dados de potncia de trao de um trator, em kg. Suponha que os
dados possam ser considerados provenientes de uma distribuio normal com mdia
30 e varincia 25. Extraindo-se, aleatoriamente, uma observao simples, determine a
probabilidade de que ela seja maior do que 45?
9. Uma indstria de pssego em calda efetua o enlatamento de seu produto com o uso de
equipamento que preenche latas com peso lquido nominal de 1 kg, mas que se
distribui normalmente com mdia de 1 kg. O peso lquido de uma lata de compota
considerado apreciavelmente abaixo do peso nominal se for inferior a 985 gramas. Se
o risco desse fato deve ser menor que 0,01, qual o valor mximo permitido para o
desvio padro?
10. As especificaes de uma lata cilndrica para enlatamento de pssego em calda
estabelecem um dimetro interno de 25cm 0,5cm. Se o dimetro interno das latas
produzidas por uma indstria dessas embalagens distribudo normalmente com
mdia =25,1cm e desvio padro =0,3cm, qual a proporo das latas de sua
produo que satisfaro as especificaes ?
11. Registros anteriores revelam que a produo anual de leite de vacas de um rebanho
jrsei aproximadamente normal com mdia =35 kg e desvio padro =6 kg.
a) Qual a probabilidade de que a produo de leite para uma vaca escolhida
aleatoriamente desse rebanho situe-se no intervalo entre 30 e 45 kg?
b) Qual a probabilidade de que a produo de leite de uma vaca selecionada
aleatoriamente desse rebanho exceda 45 kg em um dado ano?
12. A quantidade de caf instantneo que uma mquina deposita em canecas com
capacidade para 180 gramas uma varivel aleatria com distribuio normal com
mdia igual a 180 gramas e desvio padro de 2,4 gramas. Determine a probabilidade
de que uma caneca preenchida por essa mquina contenha:
a) no mnimo 183 gramas;
b) menos do que 175 gramas;
c) entre 179 e 181 gramas.
13. O tempo de vida de lmpadas produzidas por uma indstria uma varivel aleatria
com distribuio normal com desvio padro de 25 horas. Determine o tempo mdio de
vida dessas lmpadas, se sabido que a probabilidade de que uma lmpada dessa
procedncia dure mais de 400 horas 0,10.
Estatstica Bsica 130
14. Uma mquina produz resistores eltricos com resistncia mdia de 50 ohms, com
desvio padro de 2 ohms. Admitindo-se que a distribuio da resistncia normal,
quais so os limites de tolerncia que devem ser impostos resistncia para assegurar
que no mais do que 1/1000 dos resistores caiam fora da faixa de tolerncia?
15. Outras resistncias so produzidas a partir daquelas fabricadas pela mquina
considerada na questo anterior, atravs da montagem em srie de duas resistncias
simples produzidas pela mquina. Supondo que os pares para montagem dessas
resistncias so escolhidos aleatoriamente, quais so os limites de tolerncia que
devem ser impostos resistncia total para assegurar que no mais do que 1/1000
delas caiam fora desses limites? (A resistncia total de dois resistores com resistncias
de R
1
e R
2
ohms montados em srie R
1
+ R
2
.)
16. Uma indstria produz tubos cilndricos cujo dimetro interno uma varivel aleatria
com mdia de 3 cm e desvio padro de 0,02 cm, e cuja espessura uma varivel
aleatria com mdia de 0,3 cm e desvio padro de 0,005 cm. Supondo que a espessura
do tubo independente do dimetro, quais so a mdia e o desvio padro da
distribuio do dimetro externo dos tubos produzidos por essa indstria?
17. Um fabricante sabe que, em mdia, dois porcento de seus produtos so defeituosos.
Usando a aproximao provida pela distribuio normal, determine a probabilidade de
que em um lote de 400 unidades ocorram:
a) exatamente 10 unidades defeituosas;
b) pelo menos 10 unidades defeituosas.
18. Se 60 por cento dos clientes de uma loja compram a prazo, qual a probabilidade de
que entre 200 clientes escolhidos aleatoriamente pelo menos 125 faam suas compras
a prazo? (Use a aproximao provida pela distribuio normal.)
19. Uma estao de televiso afirma que seu horrio de cinema de segunda-feira a noite
tem, regularmente, 35 por cento da audincia total. Se essa afirmao correta, qual
a probabilidade de que entre 100 telespectadores contatados por telefone em uma
noite de segunda-feira menos do que 25 estejam assistindo o filme?
20. Decida se cada uma das seguintes sentenas verdadeira ou falsa, indicando as letras
V e F entre parntesis, respectivamente. Se a sentena for falsa, explique porque.
( ) Teoricamente, variveis contnuas podem ser medidas to precisamente quanto
desejado, mas usualmente elas so arredondadas para uma unidade conveniente.
( ) Em uma distribuio de probabilidade contnua, a rea total entre a curva que
representa a distribuio e o eixo horizontal igual a 1.
( ) Em uma distribuio de probabilidade contnua, a probabilidade de qualquer
valor particular da varivel aleatria a distncia vertical, no ponto
correspondente a este valor, entre a curva que representa a distribuio e o eixo
horizontal.
( ) Nenhum dos dois parmetros de uma distribuio normal pode ser negativo.
( ) P(X>) = 0,5 apenas se X tem distribuio normal.
( ) Se as notas em uma disciplina de Estatstica de uma classe seguem a distribuio
normal N(7,0; 0,81), cerca de 95% da classe ter notas no intervalo entre 6,1 e
7,9.
5. Varivel Aleatria Contnua e Densidade de Probabilidade
131
( ) Pesquisa extensiva tem mostrado que a maioria dos podem ser considerados
como realizaes de variveis aleatrias com distribuio normal,
independentemente do campo de pesquisa.
( ) Todas funes de distribuies contnuas com representao geomtrica em
forma de sino so distribuies normais.
( ) Em uma distribuio normal, se a mdia tem valor numrico elevado, ento a
varincia tambm tende a ser grande.
( ) Em uma distribuio normal, cerca de 95% dos valores ficam no intervalo de -2
a 2.
( ) Na distribuio normal padro, a mdia e a varincia so, respectivamente, np e
np(1-p).
( ) Se X~N(4, 1), ento
X
= 1 n .
( ) P( X > a) P[Z > ( a
X
)/
X
], se X tem distribuio normal.

132 Estatstica Bsica
6 AMOSTRAGEM ALEATRIA E DISTRIBUIO
AMOSTRAL
Contedo
6.1 Introduo.......................................................................................................................133
6.2 Inferncia Indutiva .........................................................................................................133
6.3 Populao e Amostra......................................................................................................134
6.4 Distribuio Amostral ....................................................................................................136
6.5 Mdia e Varincia Amostrais.........................................................................................138
6.6 Teorema Central do Limite ............................................................................................139
6.7 Amostragem de Distribuies Normais .........................................................................142
6.7.1 Introduo ...............................................................................................................142
6.7.2 Distribuio da mdia da amostra...........................................................................143
6.7.3 Distribuio da varincia da amostra......................................................................144
6.7.4 Distribuio t de Student.........................................................................................150
6.7.5 Distribuio F..........................................................................................................154
6.8 Exerccios.......................................................................................................................158

6.1 Introduo
Nos captulos anteriores, tratou-se dos conceitos e aplicaes de probabilidade e de
algumas distribuies de probabilidade importantes. O propsito deste Captulo introduzir o
conceito de amostragem e as distribuies de variveis aleatrias importantes derivadas pela
amostragem. Ele conecta a matria referente a distribuies de probabilidade com o corpo da
estatstica propriamente dita, ou seja, os mtodos de inferncia estatstica, relacionados com
estimao e teste de hiptese, a serem tratados a partir do prximo captulo.
6.2 Inferncia Indutiva
O progresso do conhecimento cientfico freqentemente atribudo experimentao. A
pesquisa experimental conduzida para a busca de solues para problemas referentes a sistemas
de interesse. Com base nos dados gerados pela pesquisa, so extradas concluses que,
usualmente, extrapolam as condies do experimento particular. Ou seja, o pesquisador deriva
generalizaes a partir do experimento particular para uma classe de experimentos similares. Essa
extenso de uma situao particular para uma mais geral denominada inferncia indutiva.
Estatstica Bsica 134
A inferncia indutiva um processo de raciocnio fortuito, que gera concluses incertas.
Entretanto, se o experimento conduzido de acordo com certos princpios, o grau de incerteza da
inferncia indutiva pode ser mensurado. De fato, uma das funes da estatstica a proviso de
tcnicas para a derivao de inferncias indutivas que permitam a mensurao do grau de incerteza
envolvido. A incerteza expressa em termos de probabilidade. Por essa razo, os conceitos e as
propriedades relacionados com probabilidade so fundamentais para a compreenso dos mtodos
de inferncia estatstica.
Enquanto que as concluses derivadas da inferncia indutiva so apenas provveis,
aquelas obtidas por inferncia dedutiva so conclusivas. O processo de inferncia dedutiva mais
comum nas cincias exatas. O mtodo silogstico ilustra o processo de inferncia dedutiva. A partir
de duas proposies referentes a fatos aceitos, denominadas premissas principal e secundria,
derivada uma terceira proposio, a concluso. Por exemplo:
Premissa principal: Os ngulos internos de um retngulo tm 90.
Premissa secundria: O quadrado um retngulo.
Concluso: Os ngulos internos do quadrado tm 90.
Embora a inferncia dedutiva seja extremamente importante, o conhecimento do mundo
real deriva-se, preponderantemente, pelo processo de inferncia indutiva. O processo de inferncia
indutiva ilustrado atravs do Exemplo 6.1.

Exemplo 6.1. Suponha-se que um produtor de sementes tem em um tonel cinco milhes
de sementes de plantas de uma espcie que produz flores brancas e azuis e deseja saber a
proporo dessas sementes que produziro flores brancas. Esta questo pode ser respondida de
modo correto apenas atravs do plantio de cada uma das cinco milhes de sementes e a observao
da cor das flores de cada planta resultante. Entretanto, esse processo no apropriado, j que o
produtor deseja vender as sementes, ou quer obter a resposta sem utilizar todas as sementes de que
dispe ou sem despender tanto esforo. Um processo alternativo plantar algumas poucas
sementes e, com base nas cores das flores das plantas resultantes destas sementes, derivar uma
concluso referentes s cinco milhes de sementes. Naturalmente, esse processo no garantir uma
resposta certa, que poderia ser produzida apenas pela observao das cores das plantas produzidas
por todas as cinco milhes de sementes. A observao das cores das flores de plantas resultantes
de apenas algumas das sementes no permite uma predio exata. Entretanto, pode ser derivada
uma concluso probabilista satisfatria, se as sementes forem escolhidas atravs de processo
apropriado. Esse um processo de inferncia indutiva. Ou seja, seleciona-se uma parte das cinco
milhes de sementes, planta-se essas sementes, observa-se o nmero dessas sementes que
produzem plantas de flores brancas, e, com base nessas poucas sementes, faz-se uma predio
sobre a proporo das cinco milhes de sementes que correspondem a plantas de flores brancas.
Dessa forma, a partir do conhecimento das cores de poucas sementes, generaliza-se para o
conjunto total das cinco milhes de sementes. Esse processo no assegura a correo da resposta,
mas prov um nvel de confiana na concluso em um sentido probabilista.
6.3 Populao e Amostra
Na seo anterior, viu-se que o processo geral de aquisio de conhecimento do mundo
emprico a observao de poucas unidades ou elementos do conjunto total de unidades de
interesse e, na base dessas poucas unidades, derivaes de concluses para o conjunto maior. O
6. Amostragem Aleatria e Distribuio Amostral
135
conjunto de todas as unidades de interesse em uma pesquisa denominado populao objetivo,
ou, mais simplesmente, populao. No Exemplo 6.1, a populao objetivo o conjunto das cinco
milhes de sementes no tonel. Em outras situaes, a populao objetivo pode ser as lavouras
plantadas com trigo em uma regio, os animais adultos de uma raa de gado de corte em uma certa
poca, o conjunto hipottico das alturas de plantas de uma cultivar de soja, etc. A populao
objetivo pode ser real ou hipottica, mas deve ser bem definida, atravs da identificao de seus
elementos ou da especificao das condies para que um elemento lhe pertena.
A abordagem da inferncia indutiva, sob o ponto de vista da estatstica, a seguinte: O
objetivo de uma pesquisa desvendar algum aspecto da populao objetivo. Geralmente,
impossvel ou impraticvel ou inconveniente, examinar a populao inteira. Ento, examina-se
uma sua parte (ou seja, uma amostra da populao) e, com base nesta pesquisa limitada,
estabelece-se inferncias com respeito populao objetivo.
O problema que se levanta imediatamente o modo de seleo da amostra. A validade
das concluses probabilistas referentes populao objetivo depende do modo de seleo da
amostra. Particularmente importante o caso de amostra aleatria simples, que ser definida
adiante.
Como regra, o interesse de uma pesquisa no reside na populao propriamente, mas em
uma ou mais caractersticas de suas unidades. No Exemplo 6.1, a caracterstica de interesse a
cor das flores das plantas produzidas pelas sementes; no h interesse genrico nas sementes ou
nas plantas, ou em qualquer outra caracterstica das unidades da populao de sementes. Por essa
razo, usual restringir a designao de populao coleo das alternativas das caractersticas
de interesse (no caso, cores das flores das plantas resultantes das sementes), expressas por uma
varivel numrica, no conjunto de unidades que a pesquisa visa abranger. Neste texto, tratar-se-
apenas da situao de uma caracterstica.
Pressupe-se que a caracterstica de interesse na populao expressa por uma varivel
aleatria com uma distribuio de probabilidade conhecida, de modo que a cada elemento na
populao associado um valor numrico. No Exemplo 6.1, as cinco milhes de sementes no
tonel constituem a populao da qual deve ser extrada uma amostra. Cada semente uma unidade
da populao e produzir uma planta de flor branca ou azul. Dessa forma, a caracterstica de
interesse a cor da flor com duas alternativas: branca e azul.
Para a modelagem probabilista deve-se definir uma varivel aleatria que associe um
valor numrico com cada uma das alternativas da caracterstica, para cada elemento da populao.
Seja a varivel aleatria X
i
que assume os valor 1 ou 0, dependendo se a i-sima semente
amostrada produz uma planta de cor branca ou azul, respectivamente, i=1,2,...,n (n = tamanho da
amostra). Se o processo de amostragem das sementes tal que as variveis aleatrias X
1
, X
2
,...,X
n

so independentes e tm a mesma distribuio de probabilidade, ou seja, f(x
1
) = f(x
2
) =... = f(x
n
),
ento a amostra denominada aleatria simples.
O significado das variveis aleatrias X
1
, X
2
,...,X
n
fundamental para a compreenso do
conceito de amostra aleatria. A varivel aleatria X
i
uma representao para o valor numrico
que o i-simo elemento amostrado assumir. Aps a observao da amostra, os valores atuais
especficos de X
1
, X
2
,...,X
n
so conhecidos. Esses valores observados, denotados por x
1
, x
2
,...,x
n
,
respectivamente, so considerados uma realizao das variveis aleatrias X
1
, X
2
,...,X
n
.
Freqentemente, no possvel selecionar uma amostra aleatria da populao objetivo.
Uma amostra aleatria , ento, selecionada de alguma populao relacionada. Se X
1
, X
2
,...,X
n

Estatstica Bsica 136
uma amostra aleatria de uma populao com distribuio de probabilidade f(x), ento esta
populao denominada populao amostrada.
Atravs de amostras aleatrias, pode-se derivar sentenas probabilistas vlidas referentes
a populaes amostradas. Entretanto, concluses probabilistas sobre a populao objetivo no so
vlidas no sentido probabilista de freqncia relativa, a menos que a populao objetivo coincida
com a populao amostrada. Os seguintes exemplos ilustram a distino entre populao
amostrada e populao objetivo.

Exemplo 6.2. Suponha-se que um pesquisador conduz um levantamento para o estudo da
adoo de tecnologias por agricultores, atravs de uma amostra dos agricultores associados s
cooperativas de uma regio. Neste caso, a populao objetivo o conjunto dos agricultores da
regio, enquanto a populao amostrada compreende os agricultores cooperados da regio. O
pesquisador pode derivar concluses probabilistas vlidas sobre esta populao amostrada.
Entretanto, dever usar seu julgamento pessoal para extrapolar para a populao objetivo. A
confiabilidade dessa extrapolao no pode ser avaliada em termos probabilistas de freqncia
relativa.

Exemplo 6.3. Um pesquisador deve executar um experimento para a comparao de
cultivares de arroz com o propsito de derivar recomendao de cultivares para os agricultores de
uma regio. O pesquisador tem a sua disposio oito locais da regio onde pode conduzir o
experimento. Nessa situao, a populao amostrada compreende esses oito locais, enquanto a
populao objetivo constituda por todos os locais de cultivo de arroz da regio.

Daqui em diante, muito mais freqentemente, se far referncia populao amostrada.
Quando for usada a designao "populao" sem o qualificativo "amostrada" ou "objetivo", se
estar referindo populao amostrada.
A inferncia estatstica trata do problema de selecionar uma amostra de uma populao
com distribuio de probabilidade f(.) e, com base nas observaes dessa amostra, derivar
sentenas probabilistas referentes f(.).
6.4 Distribuio Amostral
Seja X uma varivel aleatria de uma populao com distribuio de probabilidade f(x).
Suponha-se que uma amostra de dois valores de X extrada aleatoriamente. Os nmeros
resultantes so denotados por x
1
e x
2
, na ordem de extrao, e designados, respectivamente,
primeira e segunda observao. A coleo de todos tais pares de nmeros que poderiam ter
resultado do processo de extrao aleatria de uma amostra de tamanho dois da populao
constitui uma distribuio bivariada. Cada um desses pares de nmeros (x
1
,x
2
) um valor (ou uma
realizao) da varivel aleatria bidimensional (X
1
,X
2
), e X
1
, X
2
uma amostra aleatria de
tamanho dois da distribuio f(x). Pela definio de amostra aleatria, a distribuio conjunta de
X
1
e X
2
, que se denomina distribuio da amostra de tamanho 2, dada por: f x x
X X
1 2
1 2
( , ) =
f x f x
X X
1
1
2
2
( ) ( ).

Exemplo 6.4. Seja X uma varivel aleatria com dois valores 0 e 1 que exprime uma
caracterstica com duas alternativas, com probabilidades p e 1-p, respectivamente. Ento, X tem
6. Amostragem Aleatria e Distribuio Amostral
137
distribuio discreta de Bernoulli e sua funo de probabilidade : f(x) = p
x
(1-p)
1-x
, x = 0, 1. A
distribuio conjunta para uma amostra aleatria de dois valores de X, sejam x
1
e x
2
, :
f x x
X X
1 2
1 2
( , ) = f x f x
X X
1
1
2
2
( ) ( ) = p p
x x x x
1 2 1 2
1
2 +
( ) , x
1
, x
2
=0, 1.
Observe-se que a funo f x x
X X
1 2
1 2
( , ) a distribuio da amostra na ordem de extrao.
A probabilidade de uma amostra em que extrado primeiro 0 e aps 1 : f
X X
1 2
0 1 ( , ) = p(1-p).
Assim, a funo bivariada considerada neste exemplo no a distribuio do nmero de sucessos,
seja Y, em dois ensaios de Bernoulli, cuja funo de densidade : f
Y
(y) = C
y
2
p
y
(1-p)
2 - y
, y = 0,1,2.

O conceito de amostra aleatria generaliza-se para uma amostra de tamanho n:

Seja X
1
, X
2
, ...,X
n
uma amostra aleatria de tamanho n de uma populao com
distribuio de probabilidade f(x). A distribuio da amostra aleatria X
1
, X
2
, ...,X
n

a distribuio conjunta de X
1
, X
2
, ...,X
n
, ou seja:
f x x x
X X X
n
n
1 2
1 2 ,...,
( , ,..., ) = f x f x f x
X X X
n
n
1
1
2
2
( ) ( ),..., ( )

Observe-se que a definio de varivel aleatria exclui, automaticamente, amostragem de
uma populao finita sem reposio, j que neste caso os resultados das extraes no so
independentes.
O problema bsico em estatstica o seguinte: desejado estudar uma populao que tem
uma distribuio de probabilidade cuja forma conhecida mas dependente de uma ou mais
caractersticas desconhecidas, denominadas parmetros. Dessa forma, a funo distribuio de
probabilidade no completamente conhecida; ela uma funo do parmetro desconhecido. Ou
seja, sua forma f(x;), onde denota o parmetro. O procedimento da estatstica clssica
extrair uma amostra aleatria X
1
, X
2
, ...,X
n
de tamanho n desta distribuio e aproximar o valor
desconhecido do parmetro por um estimador, ou seja, uma funo t(X
1
, X
2
,...,X
n
) dos valores
da amostra. Em geral, muitas funes podem cumprir esse propsito. O problema determinar a
melhor funo para estimar . Este problema ser formulado e tratado no prximo captulo. Nesta
seo, tratar-se- de certas funes de uma amostra aleatria. Inicialmente, definir-se- o conceito
de estatstica:

Uma estatstica uma funo de variveis aleatrias observveis que no depende
de qualquer parmetro desconhecido.

Assim, uma estatstica , tambm, uma varivel aleatria. O qualificativo "observvel"
requerido das variveis aleatrias tendo em conta a inteno do uso da estatstica na execuo de
inferncias referentes funo de distribuio das variveis aleatrias. Se as variveis aleatrias
no fossem observveis, ou seja, se seus valores no pudessem ser observados, elas no seriam
utilizveis em inferncias. Por exemplo, se X~N(,
2
), onde e
2
so desconhecidos, X- e (X-
)/
2
no so estatsticas, visto que elas no so funes apenas da varivel aleatria observvel
X, mas, tambm, de parmetros desconhecidos. Entretanto, X, X-2 e X
2
, por exemplo,

so
estatsticas.
Estatstica Bsica 138
6.5 Mdia e Varincia Amostrais
Seja X
1
, X
2
, ...,X
n
uma amostra aleatria de uma distribuio de probabilidade f(x;
). A mdia amostral, denotada por n X ou X, definida como:
X
1
n
(X X ... X )
1
n
X
1 2 n i
i 1
n
+ + +

.

O valor da mdia amostral para uma amostra particular (x
1
, x
2
,...,x
n
), denotado por x,
dado por:
x

1
n
x
i
i 1
n

conforme definido na Seo 2.5.
A mdia amostral X uma estatstica, ou seja, uma funo das variveis aleatrias X
1
,
X
2
, ...,X
n
. Logo, ela tambm uma varivel aleatria com uma distribuio de probabilidade. Em
geral, a distribuio de probabilidade de X depende da funo distribuio de probabilidade f(.) da
qual foi extrada a amostra aleatria.

Se X
1
, X
2
,...,X
n
uma amostra aleatria da funo de probabilidade f(.) com mdia
e varincia
2
e X =
1
n
(X
1
+X
2
+...+X
n
), ento (Seo 5.7):
( ) ( ) E X e Var X
1
n
X X
2 2
.

Estas propriedades da mdia amostral X sugerem a possibilidade de seu uso como uma
estimativa da mdia da distribuio f(.). A propriedade E(X) = significa que, na mdia, X
igual ao parmetro que est sendo estimado, ou seja, que a distribuio de X est centrada em .
A outra propriedade, Var(X) =
2
1
n
, significa que a disperso dos valores de X em torno da mdia
a n-sima parte da disperso da distribuio populacional f(.), e to menor quanto maior o
tamanho n da amostra. Por exemplo, a varincia de X para uma amostra de tamanho 10 a metade
da varincia para uma amostra de tamanho 5. Dessa forma, os valores de X tendem a ser mais
concentrados em torno de para uma amostra de tamanho grande do que para uma amostra de
tamanho pequeno.
Ademais, conforme visto na Seo 5.7, se X~N(,
2
), i=1,2, ...,n, ento X~N(,
2
/n), e
n (X-)/~N(0,1). Dessa forma, se a distribuio populacional normal, a mdia amostral
tambm tem distribuio normal, com disperso muito mais concentrada em torno da mdia do
que a varivel aleatria original. Essa propriedade ilustrada na Figura 6.1.


6. Amostragem Aleatria e Distribuio Amostral
139

Figura 6.1. Distribuies de probabilidade de X e da correspondente
mdia amostral X.

Se X
1
, X
2
, ...,X
n
uma amostra aleatria de tamanho n de uma distribuio f(x),
ento, a varincia amostral, denotada por S
n
2
ou S
2
, :
( ) S X X , n 1
2
i
2
i 1
n
1
n 1
>



Conforme definido na Seo 2.5, a varincia para uma amostra particular denotada por
s
2
e expressa por:
( )
2 n 2
i
i 1
1
n 1
s x x

.
A varincia amostral para uma amostra particular tambm designada quadrado mdio
e denotada, simbolicamente, por:
s
2
=
1
GL
SQX,
onde SQX = ( )
2 n
i
i 1
x x

a soma dos quadrados dos desvios dos valores amostrais x


i
em
relao mdia amostral x, ou soma dos quadrados de X corrigida para a mdia, e GL = n-1
denota os graus de liberdade associados com SQX.
A razo para o divisor n-1 em lugar de n, que poderia parecer mais natural na expresso
da varincia amostral S
2
, a propriedade conveniente que resulta para S
2
, ou seja: E(S
2
) =
2
.
6.6 Teorema Central do Limite
Na seo anterior, foram referidas propriedades importantes da distribuio da mdia
amostral X, ou seja, que E(X)= e Var(X)=
2
/n, qualquer que seja a distribuio populacional
f(x), e que, se esta distribuio normal, a distribuio de X tambm normal. O teorema
central do limite, enunciado a seguir, estabelece que, sob certas condies, a distribuio
aproximada de X normal, qualquer que seja a distribuio de probabilidade f(.).

Estatstica Bsica 140
Seja n X =
1
n
(X
1
+X
2
+...+X
n
) a mdia de uma amostra de tamanho n, X
1
, X
2
,...,X
n
,
de uma distribuio de probabilidade qualquer f(.) com mdia e varincia
2
e
defina-se:

n
n
X
Z

.
Ento, a distribuio de Z
n
aproxima-se da distribuio N(0,1) quando n tende para
infinito.

Este teorema central do limite estabelece, de modo mais geral, que a mdia e a soma de n
variveis aleatrias idntica e independentemente distribudas normal, qualquer que seja a
distribuio comum das variveis aleatrias.
Este um dos mais importantes teoremas em probabilidade e estatstica, por essa razo,
denominado teorema central do limite. Ele estabelece que a distribuio limite de Z
n
, ou seja da
mdia X
n
padronizada, a distribuio normal padro, e que a prpria mdia X
n
tem distribuio
aproximada, ou assinttica, normal com mdia e varincia
2
/n, qualquer que seja a distribuio
populacional comum (discreta ou contnua).
O extraordinrio desse teorema que ele no estabelece qualquer condio referente
forma da distribuio de probabilidade original. Sua importncia, sob o ponto de vista prtico,
que, para grandes amostras, a mdia amostral X
n
de uma amostra de qualquer distribuio com
mdia e varincia
2
tem, aproximadamente, distribuio normal, com mdia e varincia
2
/n,
desde que a mdia e a varincia sejam finitas.
Sob certas condies, o teorema central do limite tambm vlido quando as variveis
aleatrias no so identicamente distribudas. De modo geral, pode-se dizer que a generalizao
que ele estabelece vlida quando as contribuies das variveis aleatrias individuais para a
soma, ou mdia, so "pequenas" relativamente soma total. Nessa situao, substitudo por
1
n
(
1
+
2
+...+
n
) e
2
por
1
n
(
1
2
2
2 2
+ + + ...
n
), onde
i
e
2
i
e denotam a mdia e a varincia da
varivel aleatria X
i
.
A questo importante refere-se ao tamanho da amostra necessrio para o uso da
distribuio normal como uma aproximao para a distribuio de X, ou ao grau de aproximao
logrado com o uso de uma amostra de um dado tamanho n. O grau de aproximao depende do
tamanho da amostra e da grandeza do desvio da distribuio populacional em relao forma
normal, ou seja, da forma da distribuio de probabilidade f(.) das variveis aleatrias originais. Se
a distribuio da populao normal, ento a mdia X tem distribuio normal exata para
qualquer valor de n. Na medida em que a distribuio da populao afasta-se da normalidade,
valores maiores de n so requeridos para uma boa aproximao. Como uma regra geral, pode ser
esperado que para valores n>30 sejam logradas boas aproximaes em situaes em que a
distribuio populacional tem uma nica moda e no tem caudas demasiadamente longas.
A validade do teorema central do limite pode ser evidenciada empiricamente para
qualquer distribuio particular, atravs de construo experimental como a descrita a seguir.
Foram extradas amostras sucessivas de tamanho quatro da distribuio retangular e
determinadas as correspondentes mdias amostrais. A distribuio de freqncias foi, ento,
6. Amostragem Aleatria e Distribuio Amostral
141
construda e representada geometricamente na Figura 6.2, onde os pontos substituem os
retngulos, indicando as freqncias relativas nas classes em cujo centro se projetam. Atravs
desses pontos, foi traada uma curva suave, resultando um grfico em forma aproximada de sino,
caracterstica da distribuio normal. A Figura 6.3 apresenta o resultado de um experimento
semelhante efetuado com a distribuio triangular.


Figura 6.2. Distribuio emprica da mdia de amostras de tamanho quatro
da distribuio retangular.


Figura 6.3. Distribuio emprica da mdia de amostras de tamanho quatro
da distribuio triangular.

Os experimentos utilizados para ilustrao demonstraram, empiricamente, que a
distribuio amostral da mdia X aproximadamente normal, mesmo para duas distribuies
bsicas drasticamente no normais, como o so as distribuies retangular e triangular, e amostras
de tamanho bastante pequeno.
Assim, o teorema central do limite fundamental para a importncia da distribuio
normal em estatstica.
Na teoria dos erros, por exemplo, pode ser suposto, usualmente, que os erros tm
distribuio normal, j que eles so comumente compostos da soma de um grande nmero de
pequenos erros independentes.
A maioria dos procedimentos de inferncia em estatstica clssica, para estimao e teste
de hiptese, so baseados na mdia amostral. Se as variveis aleatria individuais que
Estatstica Bsica 142
compreendem a amostra so normalmente distribudas, ento a mdia amostral certamente
normal e a teoria para variveis aleatrias normais apropriada. Se as variveis aleatrias
individuais no so normalmente distribudas, mas seu nmero suficientemente grande, o
teorema central do limite assegura que a mdia amostral tem distribuio aproximadamente
normal, de modo que a teoria para variveis aleatrias normais tambm aplicvel. Entretanto, se
as variveis aleatrias individuais que compreendem a amostra tm distribuio desconhecida e
seu nmero no suficientemente grande, a distribuio da mdia amostral no pode ser
pressuposta normal. Nessa situao, a teoria baseada em distribuio normal no adequada e
deve-se recorrer a tcnicas no paramtricas.
A aproximao normal da distribuio binomial um exemplo particular da aplicao do
teorema central do limite. Seja X
i
uma amostra aleatria de uma distribuio de Bernoulli. Ento, a
distribuio de X
i
:
f x
p x
p x
i
i
i
( )
,
,

1
1 0

com mdia p e varincia p(1-p), conforme visto na Seo 4.3.2. Segundo o teorema central do
limite, a distribuio da mdia amostral X aproximadamente N(p, p(1-p)/n) quando n grande.
Agora, se Y = X
1
+X
2
+ ...+X
n
o nmero de sucessos nos n ensaios de Bernoulli, ento: Y=nX.
Logo, de acordo com propriedade da distribuio normal (Seo 5.6), Y~N(np, np(1-p)), j que
E(Y = np e Var(Y) = np(1-p). Portanto, Z = (Y-np)/ np(1- p) ~N(0,1), o mesmo resultado obtido
na Seo 5.4.
Em problemas de inferncia estatstica, a proporo de sucessos na populao p
desconhecida, constituindo, de fato, o propsito da pesquisa. Um procedimento de inferncia
estatstica , ento, obter o nmero de sucessos Y, ou a proporo de sucessos p=nY, a partir de
uma amostra, e, usando este valor observado, determinar um intervalo de valores plausveis para p.
6.7 Amostragem de Distribuies Normais
6.7.1 Introduo
A distribuio normal tem um papel predominante em estatstica. O teorema central do
limite um argumento para a adequabilidade da distribuio normal em muitas situaes.
Entretanto, h outras razes importantes para a extensa utilizao da distribuio normal. Em
primeiro lugar, a experincia em pesquisas em muitos campos tem demonstrado que a distribuio
normal apropriada, pelo menos como uma boa aproximao verdadeira distribuio, para
muitos tipos de medidas fsicas e de outras origens. Este fato tem sido considerado muito razovel
com suporte no prprio teorema central do limite. A distribuio das distncias dos pontos de
impacto dos projteis em relao a um alvo pode ser utilizada como ilustrao. O percurso do
projtil afetado por inmeros fatores, cada um de pequeno efeito. O desvio mdio o efeito
lquido de todos esses fatores. Supondo que o efeito de cada um dos fatores uma observao de
alguma populao, ento o efeito total , essencialmente, a mdia de um conjunto de observaes
de um conjunto de populaes. Como os desvios observados tm a natureza de mdias, pode-se
esperar que eles tenham distribuio aproximadamente normal. Essa ilustrao no tem a inteno
6. Amostragem Aleatria e Distribuio Amostral
143
de implicar que a maioria das populaes encontradas na prtica so normais, o que no o caso,
mas que distribuies aproximadamente normais so muito freqentes.
Um aspecto muito favorvel distribuio normal que distribuies amostrais baseadas
em uma distribuio normal so razoavelmente tratveis analiticamente. A obteno de
distribuies de funes de observaes amostrais usualmente mais fcil para amostras de uma
populao normal do que para qualquer outra distribuio. Como conseqncia, distribuies
amostrais de estatsticas derivadas da distribuio normal tm sido extensivamente estudadas e
tabuladas, o que torna muito conveniente o uso da teoria e de tabelas disponveis quando os dados
podem ser pressupostos como razoavelmente normais.
Uma outra considerao favorvel distribuio normal que muitas tcnicas nela
baseadas so robustas, ou seja, permanecem aproximadamente corretas para desvios razoveis da
normalidade. Deste modo, para muitos propsitos, a pressuposio de normalidade implica em
pequeno erro, contanto que o desvio no seja demasiadamente elevado.
Como conseqncia dessas razes favorveis distribuio normal, ela tem sido
freqentemente utilizada de modo inadequado. Portanto, conveniente alertar que a pressuposio
de normalidade no deve ser admitida sem a necessria considerao e cuidado. Nesse sentido,
testes apropriados so disponveis que podem ser utilizados em situaes em que a pressuposio
de normalidade no seja assegurada pela experincia do pesquisador ou indicao da literatura.
Antes da aplicao de mtodos estatsticos baseados na distribuio normal, o
pesquisador deve conhecer, pelo menos aproximadamente, a forma geral da funo de
probabilidade que suas observaes seguem. Se ela normal, os mtodos podem ser usados
diretamente; caso contrrio, algumas vezes, uma transformao de dados pode conduzir a
observaes transformadas que seguem uma distribuio normal. Se a normalidade no lograda
por uma transformao de dados ou se a forma da distribuio populacional no conhecida, ento
deve-se recorrer a outros mtodos de anlise mais geral mas usualmente menos poderoso,
denominados mtodos no paramtricos.
As distribuies amostrais das estatsticas importantes utilizadas nos mtodos de
inferncia a serem tratados neste texto so apresentadas a seguir.
6.7.2 Distribuio da mdia da amostra
A distribuio da mdia amostral de uma populao normal foi considerada na Seo 6.5.
Recorde-se que, se X
i
, i=1,2,...,n, uma amostra aleatria de uma distribuio N(,
2
), a mdia
X tem distribuio N(,
2
/n). Em outras palavras, a distribuio exata da mdia amostral depende
da distribuio populacional f(.) e tem a mesma forma desta, ou seja, , tambm, normal com a
mesma mdia e varincia reduzida n-sima parte.
A utilidade da distribuio da mdia amostral em inferncia estatstica evidenciada
como segue. Como a mdia, , de uma distribuio normal , em geral, desconhecida, de
interesse a obteno de um seu estimador, que possa ser usada para a construo de uma
aproximao da distribuio exata desconhecida. Esse estimador construdo atravs da
informao provida por uma amostra aleatria da populao. Intuitivamente, a mdia amostral X
um "bom" estimador da mdia populacional . Entretanto, a proximidade de X em relao a
depende da distribuio de X. Como essa distribuio conhecida exatamente, pode-se
determinar, por exemplo, a probabilidade (exata) de que o estimador X se situe em um intervalo
Estatstica Bsica 144
de uma certa amplitude em torno de , ou seja: P[X-aX+b], onde a e b so dois nmeros
reais, a<0 e b>0. Se a mdia e o desvio padro
2
fossem conhecidos, esta probabilidade poderia
ser determinada pela identidade:
P[X-a X+b] = P[b X- a] =
=
( )
P
n n X n
P
n
Z
n b a b a

,
]
]
]
,

,
]
]
]
,
onde Z ~ N(0,1). Esta expresso pode ser avaliada para quaisquer valores de a, b, e
2
, atravs
de consulta Tabela II.

Exemplo 6.5. Seja X
1
, X
2
, ...,X
n
uma amostra aleatria de dez observaes de uma
distribuio normal com mdia e varincia
2
. O ponto superior da distribuio N(0,1) que
limita uma rea 0,025 na cauda direita desta distribuio z
0,025
=1,96 (Tabela I). Ento, pode-se
escrever a seguinte sentena probabilista:
( )
P
X
-1,96
n
1,961 = 0,95

,
]
]
]

,
que pode ser rescrita como:
1, 96 1,96
P X- = 0,95
n n
, ]

, ]
]

Assim, a diferena entre o estimador X e o parmetro estimado, , situa-se no intervalo (-
1,96

/ n ; 1,96/ n ) com probabilidade 0,95; ou, em outras palavras, a probabilidade de que o
estimador X situe-se a uma distncia de inferior 1,96/ n 0,95.
6.7.3 Distribuio da varincia da amostra
A distribuio normal tem dois parmetros, e
2
. Na Seo 6.7.2, foi feita referncia
distribuio de X, que "estima" a caracterstica populacional desconhecida . Nesta Seo,
procurar-se- a distribuio da varincia amostral ( ) S
n
x x
i
i
n
2
1
2
1
1

, que estima a varincia


populacional
2
.
Para maior simplicidade, suponha-se, inicialmente, que X
i
~N(0,1). Seja
2
("qui-
quadrado") a soma dos quadrados dos valores amostrais. Ento,
2
= X
1
+X
2
+...+X
n
, tambm,
uma varivel aleatria, j que uma funo de variveis aleatrias. O contradomnio desta varivel
aleatria o intervalo [0, ), pois
2
uma soma de quadrados de variveis aleatrias com
contradomnio (- , ). Demonstra-se que a distribuio desta nova varivel aleatria :
( )
( )
( )
2
2
2
2
2
2 2 2
2
2
1
f e , 0
2

>

,
onde o parmetro (=n neste caso) um nmero inteiro positivo e (.) denota a funo gama,
definida por:
6. Amostragem Aleatria e Distribuio Amostral
145
( ) ( )
( )( )
( )( )
-1 - 2 ... 3 2 1, para par e 2
2 2
=
2 2
3 1
-1 - 2 ... , para mpar e 2
2 2 2 2
! =

>

>


e
(1) = 1 e
( )
1
=
2
.
Uma varivel aleatria contnua com esta funo densidade denominada uma varivel
aleatria qui-quadrado com graus de liberdade. Diz-se, ento, que a varivel aleatria
2
tem
distribuio qui-quadrado com parmetro , denominado nmero de graus de liberdade. O
parmetro o nmero de variveis aleatrias normais independentes cujos quadrados so
somados para compor a varivel aleatria
2
. Portanto, determinado pelo tamanho da amostra.
Denota-se que uma varivel aleatria W tem distribuio qui-quadrado com graus de
liberdade por W ~
2

.
Essa distribuio uma aproximao para as distribuies de variveis aleatrias que
exprimem medidas de caractersticas de muitos fenmenos fsicos, no necessariamente justificada
pela construo que motivou a definio da varivel aleatria qui-quadrado como a soma dos
quadrados de variveis aleatrias independentes e com idntica distribuio N(0,1). De fato, a
distribuio qui-quadrado um caso particular da distribuio gama, importante em muitas
aplicaes.
A representao grfica da funo densidade de
2
apresentada na Figura 6.4 para os
casos especficos correspondentes a =1 e =3; a representao grfica para =2 semelhante
da Figura 6.4.a; a representao da Figura 6.4.b a mais tpica da distribuio
2
- as
representaes grficas das densidades para >3 so semelhantes esta forma. Observe-se que a
forma tpica da distribuio
2
assimtrica, em vez de simtrica como a distribuio normal, e
que a probabilidade total 1 distribui-se no intervalo (0, ). Demonstra-se que a mdia e a varincia
da varivel aleatria qui-quadrado so dadas por: E(
2
) = e Var(
2
) = 2. Dessa forma, ambas
mdia e varincia populacionais dependem dos graus de liberdade.

Estatstica Bsica 146

Figura 6.4. Funo densidade da varivel aleatria
2
para a) =1 e b) =2 graus de
liberdade.

Em inferncia estatstica freqentemente de interesse a probabilidade de que
2
se situe
direita de um ponto
2
,
que limita uma rea na cauda superior da distribuio, expressa por:
P[
2

2
,
] = ( ) f d

2 2
2
,


Essas probabilidades e os correspondentes valores
2
,
, denominados pontos 100
percentuais superiores da distribuio qui-quadrado, so disponveis em tabelas, como a Tabela
III do Apndice. Por exemplo, para =5 e =0,10, tem-se:
P[
2
>
2
0,10;5
] = P[
2
9,236] = 0,10.
Se X
1
, X
2
,...,X
n
so variveis aleatrias independentes e normalmente distribudas com
mdias
1
,
2
, ...,
n
e varincias
1
2
2
2 2
, , ...,
n
, respectivamente, a varivel aleatria X
1
+X
2
+
...+X
n
no tem distribuio qui-quadrado. Isto porque as variveis aleatrias X
i
, i=1,2,...,n, no
satisfazem condio requerida de mdia zero e varincia unitria. Entretanto, as variveis
aleatrias:
Z
X
i n
i
i i
i

, , , ... , , 1 2
tm distribuio normal padro e so, tambm, estatisticamente independentes. Portanto,
2
n n
2 2
i i
i
i 1 i 1 i
X
Z

j \

, (

( ,


tem distribuio qui-quadrado com n graus de liberdade.
A distribuio qui-quadrado uma das poucas distribuies que satisfazem propriedade
da aditividade, de grandes implicaes para seu uso em inferncia estatstica, ou seja:
"Se duas variveis aleatrias

1
2
e

2
2
tm distribuies qui-quadrado, com
1
e
2
graus
de liberdade, a soma dessas variveis aleatrias:
6. Amostragem Aleatria e Distribuio Amostral
147

2
=

1
2
+

2
2
,
tambm tem distribuio qui-quadrado, com =
1
+
2
graus de liberdade".
Este teorema uma conseqncia imediata da definio da distribuio qui-quadrado. De
fato, a distribuio

1
2
equivalente distribuio da soma de quadrados de
1
variveis
independentes e normalmente distribudas, cada uma com mdia 0 e varincia unitria. Portanto, a
varivel aleatria

1
2
pode ser expressa como:


1
2
1
2
2
2 2
1
+ + + X X X ... ,
onde X
1
, X
2
,..., X

1
so variveis aleatrias independentes com a mesma distribuio N(0,1).
Semelhantemente,

2
2
pode ser expressa como:

2 2
2
1
2
2
2 2
+ + + Y Y Y ...

,
onde Y
i
, i=1,2,...,
2
, so variveis aleatrias independentes com distribuio N(0,1). Ento, a
varivel aleatria
2
pode ser escrita como:

2
= X
1
+X
2
+...+X

1
+ Y
1
+Y
2
+...+Y

2
,
onde os dois conjuntos de variveis aleatrias X
i
, i=1,2,...,
1
e Y
i
, i=1,2,...,
2
, so independentes,
em conseqncia da independncia de

1
2
e

2
2
. Assim,
2
a soma de
1
+
2
= variveis
aleatrias normal e independentemente distribudas, cada uma com mdia zero e varincia unitria.
Logo, por definio, a varivel aleatria
2
tem distribuio qui-quadrado com graus de
liberdade.
Por uma extenso do mesmo argumento, pode-se demonstrar que a propriedade da
aditividade da distribuio qui-quadrado estende-se para qualquer nmero finito de variveis
aleatrias independentes com distribuio qui-quadrado.
Essa propriedade e a anterior definio da distribuio qui-quadrado so as bases para a
derivao da distribuio da varincia amostral S
2
, que segue.
Como a mdia da distribuio da varincia amostral S
2
igual varincia populacional

2
, natural esperar que a varivel aleatria:
( )
2
n
2
i
i 1
1
S X X
n 1



seja um "bom" estimador da varincia
2
de uma distribuio normal em que a varincia
2

desconhecida. Intuitivamente, o processo de estimao o seguinte: Uma amostra aleatria de n
observaes extrada da distribuio normal em que a varincia
2
desconhecida; uma
realizao
2
da varivel aleatria S
2
, ento, determinada e usada como uma estimativa de
2
.
Essa estimativa ser to "melhor" quanto mais prxima do parmetro
2
se situar. Como essa
proximidade no pode ser assegurada para a estimativa obtida de uma amostra particular, busca-se
um estimador cuja distribuio de probabilidade se concentre mais em torno de
2
. Assim, uma
medida da proximidade de S
2
em relao a
2
, que exprime a qualidade do estimador, provida
Estatstica Bsica 148
pela probabilidade de que o estimador se situe em um intervalo de certa amplitude em torno de
2
,
ou seja, por:
[ ] P S S a b
2 2 2
,
onde a e b so dois nmeros reais. Essa probabilidade depende da distribuio de S
2
, ou melhor,
da distribuio de S
2
/
2
, que relacionada distribuio qui-quadrado.
Demonstra-se que, se X
1
, X
2
,...,X
n
so variveis aleatrias independentes e com idntica
distribuio normal com mdia e varincia
2
, ento, a varivel aleatria (n-1)S
2
/
2
tem
distribuio qui-quadrado com n-1 graus de liberdade. Esse resultado justificado a seguir.
A varivel aleatria (n-1)S
2
/
2
expressa por:
( )
( )
n S
X X
i
i
n

1
2
2
2
1
2


Observe-se que, se a mdia amostral X fosse substituda pela mdia populacional , a
expresso resultante ( )
1
2
1
2

X
i
i
n

teria distribuio qui-quadrado com n graus de liberdade, j


que
X
i

, i=1, 2,...n, so variveis aleatrias independentes e identicamente distribudas N(0,1).


Agora, a varivel aleatria (n-1)S
2
/
2
pode ser escrita como segue:
( ) n S 1
2
2

=
( ) X X
i
i
n

2
1
2

=
( ) ( )
[ ]
X X
i
i
n

1
2
2
=
=
( )
( )
X
X
i
i
n

1
2
2
2
2
,
donde:
( ) X
i
i
n

1
2
2
=
( ) ( ) n S
n X

+

j
(
,
,
\
,
(
(
1
2
2
2

.
Mas
( )
2
n
2
n
i
i 1
2
X

~ e ( )
X
N 0,1
n

~ ;
portanto, por definio,
( )
2
1
2
2
X
n

~ .
Por outro lado, demonstra-se que S
2
e X so variveis aleatrias independentes, o que
implica que os dois termos do segundo membro da ltima igualdade so variveis aleatrias
6. Amostragem Aleatria e Distribuio Amostral
149
independentes. Assim, o primeiro membro dessa igualdade tem distribuio
2
n
e o segundo
membro a soma de duas variveis aleatrias independentes, cujo segundo termo n(X-)
2
/
2
~
2
1
. Portanto, como conseqncia da aditividade da varivel aleatria
2
, (n-1)S
2
/
2
~
2
n 1
.
Uma ilustrao do uso da distribuio dessa varivel aleatria provida pelo Exemplo
6.6.

Exemplo 6.6. Seja X
1
, X
2
, ...,X
n
uma amostra aleatria de dez observaes de uma
distribuio N(,
2
). O ponto percentual superior da distribuio
2
9
que limita uma rea na cauda
direita de 0,05, provido pela Tabela III, 16,919. Como 9S
2
/
2
tem distribuio qui-quadrado com
9 graus de liberdade, pode-se escrever:
P
S 9
16 919 0 95
2
2

,
]
]
]
, , ,
que pode ser reescrita como:
P
S

2
2
9
16 919
0 95
,

,
]
]
]

,
, .
Esta , realmente, uma sentena probabilista referente varincia amostral S
2
e no
varincia populacional
2
, j que S
2
uma varivel aleatria e
2
uma constante. O evento a que
corresponde a probabilidade 0,95 o intervalo de amplitude infinita com extremo inferior aleatrio
9S
2
/16,919 (por depender da varivel aleatria S
2
). A sentena deve ser entendida como "a
probabilidade de que o intervalo aleatrio (9S
2
/16,919; ) inclua o parmetro desconhecido
2

0,95".

Em captulo ulterior, ser visto que sentenas probabilistas desse tipo provm
estimadores de intervalo (tambm denominados intervalos de confiana) para a varincia
populacional. Esta sentena probabilista tambm pode ser usada para testes de hipteses referentes
ao parmetro
2
. Por exemplo, para determinar se a varincia igual um valor particular
0
2
; ou
seja, se a varincia igual a
0
2
, quando 9S
2
/
2
deve ser usualmente menor do que 16,919.
A designao "graus de liberdade" pode ser interpretada como o nmero de termos
independentes que so somados para formar a estatstica qui-quadrado. A soma
X
i i
i
i
n

j
(
,
\
,
(

1
2

compreende n termos independentes, mas a soma
X X
i i
i
i
n

j
(
,
\
,
(

1
2
tem apenas n-1 termos
independentes, j que a relao ( ) X X
i
i
n

1
0 determina qualquer um dos desvios, dados os
outros n-1 desvios.
Estatstica Bsica 150
6.7.4 Distribuio t de Student
Na Seo 6.7.2, foi mostrado que, se X
1
, X
2
, ...,X
n
uma amostra aleatria da distribuio
N(,
2
), ento a mdia amostral padronizada, ou seja,
n X ( )

tem distribuio N(0,1). Esta


distribuio til em inferncias referentes mdia quando a varincia
2
conhecida. Por
exemplo, a sentena probabilista do Exemplo 6.5:
P
n
X
n

,

,
]
]
]
1 96 1 96 , ,


= 0,95,
til se o desvio padro conhecido, como pode ser o caso se informaes anteriores so
disponveis. Entretanto, usualmente, desconhecido. Nessa situao, parece natural utilizar uma
estimativa S em lugar do parmetro . Ocorre, todavia, que a varivel aleatria resultante
n X
S
( )
no tem distribuio normal. Uma soluo provida pela estatstica T, definida a
seguir.

Se X
1
, X
2
, ...,X
n
uma amostra aleatria de uma distribuio N(,
2
), ento a
varivel aleatria:

( )
T
n X
S



tem distribuio t (de Student) com n-1 graus de liberdade, o que denotado por:
T~t
n1


Observe-se que essa varivel aleatria , tradicionalmente, denotada pela letra minscula
t, contrariando notao usual de letra maiscula para varivel aleatria.
A funo densidade da varivel aleatria T com graus de liberdade tem a seguinte
expresso:
( )
( )
( )
1
2 1 2
2
T
2
t
f t 1
+

j \
+
, (
, (

( ,
, - < t < ,
onde o parmetro um nmero inteiro positivo e (.) denota a funo gama, definida na Seo
6.7.3. A representao geomtrica da varivel aleatria T ilustrada na Figura 6.5 para =1, =5
e =10.

6. Amostragem Aleatria e Distribuio Amostral
151

Figura 6.5. Distribuio de probabilidade da varivel aleatria t para 3
valores particulares do parmetro : 1, 5 e 10.

A curva da distribuio t tem a forma de sino e simtrica em relao origem 0,
semelhana da distribuio normal padro. De fato, medida em que o nmero de graus de
liberdade tende infinito, a distribuio t aproxima-se da distribuio normal padro. A mdia
da varivel aleatria T E(T)=0 para >1, e a varincia, Var(T)=

2
para >2. Probabilidades
referentes varivel aleatria T de interesse em inferncia estatstica so disponveis em tabelas,
como a Tabela IV do Apndice. A Tabela IV apresenta os pontos 100 -percentuais superiores
t
;
, que limitam uma rea a na cauda direita, que satisfazem condio:
P[T t
;
] = .
Por exemplo, para =5 graus de liberdade:
P[Tt
0,05;5
] = P[T>2,015] = 0,05 .
Para >30, t
;
prximo do ponto 100-percentual da distribuio normal padro, z

,
exceto para valores extremos de , ou seja, valores de muito prximos de 0 ou 1. Como a
distribuio t simtrica em relao origem, valores t
:
para 0,50 podem ser obtidos pela
relao t
:
= - t
1-;
.
A varivel aleatria T pode ser utilizada em inferncias estatsticas referentes mdia
populacional quando a varincia populacional
2
desconhecida.

Exemplo 6.7. Suponha-se, na situao do Exemplo 6.5, que a varincia populacional
2

no conhecida e que em seu lugar utiliza-se seu estimador S
2
correspondente a uma amostra
aleatria de dez observaes. Considerando o ponto da distribuio t que limita uma rea de 0,025
na causa superior, pode-se escrever a seguinte sentena probabilista:
P t
X
S
t

,
,
]
]
]
]

j
(
,
\
,
(
0 025 9 0 025 9
10
0 95
, ; , ;
,

,
ou seja:
Estatstica Bsica 152
P
X
S

,
,
]
]
]
]

j
(
,
\
,
(
2 262
10
2 262 0 95 , , ,


que pode ser rescrita como:
( ) P
S
X
S

,

,
]
]
]

2 262
10
2 262
10
0 95
, ,
,
Assim, a probabilidade de que a mdia amostral X se situe a uma distncia 2,262 S/ 10
da correspondente mdia populacional estimada 0,95. A comparao desse valor com aquele
obtido na situao em que a varincia era suposta conhecida (Exemplo 6.5), ou seja, 1,960/ 10 ,
mostra que a distribuio de X mais concentrada em torno da mdia quando a varincia
2

conhecida do que quando ela desconhecida e substituda por seu estimador S
2
.

A distribuio de
n X
S
( )
tambm pode ser usada para teste da hiptese de que
igual a um valor especfico
o
quando a varincia
2
desconhecida. Se =
0
, espera-se que a
varivel aleatria n (X-)/S se situe no intervalo (- t
/2;n-1
; t
/2;n-1
) com probabilidade 1-. Desse
modo, para uma probabilidade 1- grande, um valor dessa varivel aleatria fora desse intervalo
uma indicao de que no igual a
0
.
A distribuio t pode ser definida em um contexto mais geral do que o de amostragem
aleatria de uma populao normal, como segue:

Sejam X e
2
duas variveis aleatrias independentes, definidas no espao bsico de
um experimento aleatrio, tais que X tem distribuio normal padro e
2
tem
distribuio qui-quadrado com graus de liberdade. Ento, a varivel aleatria:
T
X

2

tem distribuio t (de Student) com graus de liberdade. A definio anterior um
caso particular dessa definio mais geral.

De fato, se X
1
, X
2
, ...,X
n
uma amostra aleatria de uma distribuio N(,
2
), ento:
( )
n(X - )
N 0,1

~ e
( )

n 1 S -
2
n-1
2


2
~ ,
onde:
( )
n
2
2
i
i 1
1
n 1
S X X

. Logo, pela definio mais geral,


T
n S

n(X - )

( ) 1
2
2

6. Amostragem Aleatria e Distribuio Amostral
153

n-1
n(X- )
S
T

~ ,
o que concorda com a primeira definio da varivel aleatria T.
A definio geral da distribuio t a base para a derivao de estatsticas teis em
inferncias referentes s mdias de duas ou mais distribuies normais. Para ilustrao, considerar-
se- a estatstica relacionada com a comparao de dois "tratamentos" em uma pesquisa
experimental. Suponha-se que uma amostra aleatria de n
X
unidades extrada da populao que
usa um tratamento padro e uma amostra aleatria de n
Y
unidades extrada da populao que
utiliza um novo tratamento. A comparao dos dois tratamentos julgada com base na magnitude
do valor observado da varivel aleatria X Y nas duas amostras. Assim, para efetuar decises a
respeito da eficcia do novo tratamento comparativamente ao tratamento padro, necessrio
examinar a distribuio de X Y .
Sejam X
1
, X
2
, ..., X
n
X
variveis aleatrias independentes e com idntica distribuio
N(
X
,
2
) e Y
1
, Y
2
, ..., Y
n
Y
variveis aleatrias independentes com idntica distribuio N(
Y
,

2
) e suponha-se que os dois conjuntos de variveis aleatrias so independentes. Ento, conforme
visto anteriormente,
X
X
2
i X
i=1 X
n
1
X = X N( , n )
n

~ ; Y =
1
n
Y N( n )
Y
i
i=1
X
Y Y
n
~ ,
2
;
( )
X
X
n
2 X X
n 1
2
2 i
i=1
2 2
(X -X)
n 1 S

~ e
( )
Y
Y
n
2 Y Y
n 1
2
2 i
i=1
2 2
(Y -Y)
n 1 S

~ .
Segundo propriedade de combinao linear de variveis aleatrias com distribuio
normal,
X Y ~ N
n n
X Y
X Y


+
j
(
,
\
,
( ,
2 2

Ento:
X Y
n n
X Y
X Y

+
j
(
,
\
,
(
( )
1 1

tem distribuio normal com mdia zero e varincia um. Se a varincia comum das duas
populaes
2
conhecida, o problema est resolvido. Entretanto, para as situaes mais usuais,
em que
2
desconhecida, a soluo alternativa a que segue.
De acordo com a propriedade da aditividade da distribuio qui-quadrado, a varivel
aleatria:
( ) ( ) n S n S
X X Y Y

+
1 1
2
2
2
2


Estatstica Bsica 154
tem distribuio qui-quadrado com n n
X Y
+ 2 graus de liberdade e, ademais, distribuda
independentemente de X Y . Ento, segundo a definio da distribuio t, a varivel aleatria:
( ) ( )
X Y
X Y
2 2
X X Y Y
X Y
2 2
1 1
(X Y) ( )
n n
n 1 S n 1 S
n n 2
j \
, ]
+
, (
]
( ,
j \

+ + , (
, (

( ,
=
( ) ( )
( ) ( )
X Y
n S n S
n n n n
X Y
X X Y Y
X Y X Y

+
+
+
j
(
,
\
,
(

1 1
2
1 1
2 2

tem distribuio t com n n
X Y
+ 2 graus de liberdade.
6.7.5 Distribuio F
Na Seo anterior, foi apresentada a estatstica T para a comparao das mdias de duas
populaes normais com igual varincia. Tambm muito freqente em inferncia estatstica a
situao de comparao das varincias de duas populaes normais. Uma dessas situaes ,
naturalmente, a comparao de varincias para verificao da condio de igualdade de varincias
necessria para a utilizao da referida estatstica T. O processo natural a extrao de uma
amostra aleatria de cada uma das duas populaes e, ento, comparar as varincias amostrais, o
que pode ser procedido atravs do quociente S
X
2
S
Y
2
. Se essa razo prxima de um, as duas
varincias populacionais so julgadas iguais; caso contrrio, no. Para efetuar decises adequadas
e quantificar a sentena "prxima de um", necessrio basear o processo de deciso na
distribuio da estatstica S
X
2
S
Y
2
.
Sejam X
1
, X
2
, ..., X
n
X
uma amostra aleatria de uma populao P
X
de tamanho n
X
, ou
seja, n
X
variveis aleatrias independentes e normalmente distribudas com mdia
X
e varincia

X
2
, e Y
1
, Y
2
, ..., Y
n
Y
uma amostra aleatria de uma populao P
Y
de tamanho n
Y
, ou seja, n
Y

variveis aleatrias independente e normalmente distribudas, cada uma com mdia
Y
e
varincia
Y
2
, e suponha-se que essas n n
X Y
+ variveis so independentes. Ento, a distribuio
de:
( ) n S
(X - X)
X X
2
X
2
i
2
i=1
X
X
2
n

1
1
2

~
n
X

e, semelhantemente,
( )
n S
(Y - Y)
Y Y
2
Y
2
i
2
i=1
Y
Y
2
n

1
1
2

~
n
Y

Alm disso, estas duas variveis qui-quadrado so independentes, j que ambos os conjuntos de
variveis aleatrias X
1
, X
2
, ..., X
n
X
e Y
1
, Y
2
, ..., Y
n
Y
so independentes. Ento, a razo:
6. Amostragem Aleatria e Distribuio Amostral
155
( )
( )
( )
( )
n S
n - 1
n S
n - 1
S
S
X X
2
X
2 X
Y Y
2
Y
2 Y
X
2
Y
2


1
1
2
2

X
Y

uma varivel aleatria com distribuio F com
X
n 1 e n
Y
1 graus de liberdade.
A distribuio F pode ser definida, de modo mais geral, como segue:

Se
2
1
e
2
2
so duas variveis aleatrias qui-quadrado independentes com
1
e
2

graus de liberdade, respectivamente, ento, a varivel aleatria F =


1
2
2
2
/
/
1
2
tem
distribuio F com
1 11 1
e
2 22 2
graus de liberdade, nesta ordem.

O contradomnio dessa varivel aleatria o intervalo (0, ), j que as variveis
aleatrias
2
1
e
2
2
so ambas no negativas. A funo densidade de probabilidade da varivel
aleatria F tem a seguinte expresso:
( )
( )
( )
( )
f f
f
+ f
f > 0
F
1

+
j
(
,
\
,
(
j
(
,
\
,
(
j
(
,
\
,
(


1 2
1
1
2
2
1 2
2 1
2 2
2
2 2
2 2
2 1
2
/
/
,
onde os parmetros
1
e
2
so nmeros inteiros positivos e (.) denota a funo gama, definida na
Seo 6.7.3.
Uma varivel aleatria contnua com essa funo densidade de probabilidade
denominada uma varivel aleatria F com
1 11 1
e
2
graus de liberdade; ou, alternativamente,
dita ter uma distribuio F com
1 11 1
e
2
graus de liberdade.
A representao geomtrica da funo de densidade da varivel aleatria F ilustrada na
Figura 6.6 para trs combinaes de graus de liberdade.

Estatstica Bsica 156

Figura 6.6. Distribuio de probabilidade da varivel aleatria F para 3 diferentes
combinaes de graus de liberdade:
1
=15,
2
=5;
1
=15,
2
=50 e
1
=15,

2
=10.000.

Como a distribuio qui-quadrado, a distribuio F assimtrica e distribui a
probabilidade total 1 no intervalo infinito direita da origem. A mdia e a varincia da varivel
aleatria F so dadas por:
( ) E F para

>


2
2
2
2
2 , e
( )
( )
( ) ( )
Var F para
+

>
2 2
2 4
4
2
2
2 1
1 2
2
2
2


,
Em inferncia estatstica so usualmente de interesse probabilidades correspondentes
reas sob a curva na cauda direita da distribuio F (Figura 6.7). Ou seja, probabilidades
correspondentes a pontos 100 -percentuais superiores da distribuio F, que satisfazem
condio:
P[F > F
; ;
1 2
] = .
Como a distribuio F depende de dois parmetros
1
e
2
, uma tabela de trs entradas
necessria para a tabulao dos valores de F correspondentes a diferentes probabilidades e valores
de
1
e
2
. A Tabela V do Apndice uma dessas tabelas.


6. Amostragem Aleatria e Distribuio Amostral
157

Figura 6.7. Pontos 100percentuais superiores da distribuio F.

Observe-se que, como a funo densidade da varivel aleatria F assimtrica em
1
e

2
, a ordem em que os graus de liberdade so dados importante. Os graus de liberdade da
varivel
2
do numerador da estatstica F so citados antes, seguidos dos graus de liberdade da
varivel
2
do denominador.
Pontos percentuais para valores de >0,50 podem ser obtidos pela relao:
P F P
F
1
2
2
2
1
2
2
2







/
/
/
/
; ;
; ;
1
2
1 2
1
2
1 2
1

,
]
]
]
<
,

,
,
]
]
]
]
.
Isso implica que:
P
1
2
2
2




/
/
; ;
1
2
1 2
1
1
,

,
,
]
]
]
]

F
.
Entretanto, ( ) ( )
2
2
2 1
2
1
/ / / tambm tem distribuio F mas com
2
e
1
graus de liberdade.
Assim,
P
1
2
2
2




/
/
; ;
1
2
2 1
1
1
,

,
]
]
]

F

Portanto,
F
F
1- ;
;
2
1


;
;
1
2
1

ou
F
F
;
1- ;
1
2


;
;
2
1
1
.
Por exemplo, o ponto percentual para =0,95,
1
=6 e
2
=8, ou seja, F
0,95;6;8
, pode ser obtido como
segue:
Estatstica Bsica 158
F
F
0 95 6
0 05 6
1 1
4 15
0 241
, ; ;8
, ;8;
,
, .
Observe-se que, se
1
=1, tem-se F
1
2
;
=
2
2
T

, e, se
2
=, F

1
;
=

1
1
2
/ .
6.8 Exerccios
1. O supervisor de uma indstria de peas examina um dcimo das unidades que saem da
linha de produo. Liste algumas condies sob as quais este mtodo pode no
produzir uma amostra aleatria.
2. Uma amostra aleatria de tamanho 64 tomada de uma populao normal com mdia
=51,4 e desvio padro =6,8. Determine a probabilidade de que a mdia da amostra
X:
a) exceda 53,1;
b) situe-se no intervalo entre 50,4 e 52,4;
c) seja menor que 50,8.
3. Suponha que o contedo de umidade por quilograma de um concentrado de protena
desidratada tem distribuio normal com mdia 3,5 e desvio padro 0,5. Uma amostra
aleatria de 16 pores de um quilograma extrada dessa protena desidratada. Seja
X a mdia dessa amostra de medidas de contedo de umidade.
a) Qual a distribuio de X? Qual a mdia e a varincia dessa distribuio?
b) Determine a probabilidade de que: i) X exceda 3,7; X situe-se entre 3,34 e 3,66.
4. Uma amostra aleatria de tamanho 100 extrada de uma populao normal com
varincia 625. Qual a probabilidade de que a mdia da amostra difira da mdia da
populao por 4 ou mais unidades?
5. So tomadas amostras independentes de tamanho 40 de duas populaes normais com
mesma mdia e varincias
2
1
=20 e
2
2
=60. Qual a probabilidade de que a diferena
entre as mdias das duas amostras seja menor do que 2?
6. So obtidas amostras aleatrias de tamanhos n
1
e n
2
de duas populaes normais com
mdias
1
e
2
e varincias As mdias e varincias
2
1
=150 e
2
2
=200. Qual a
probabilidade de que a mdia da primeira amostra exceda a mdia da segunda amostra
em pelo menos 4,5 unidades?
7. A distribuio da percentagem de gordura do leite de vacas holandesas em uma regio
em um perodo de 5 anos foi aproximadamente normal com mdia 3,9 e desvio padro
0,45.
a) Qual a proporo das vacas que tiveram percentagem de gordura no leite menor
que 3?
b) Qual a proporo das vacas que tiveram percentagem de gordura no leite maior
que 4,5?
c) Determine o intervalo em que se situaram 90% das percentagens de gordura do
leite.
6. Amostragem Aleatria e Distribuio Amostral
159
8. Suponha que uma amostra aleatria de 25 vacas selecionada da populao de vacas
holandesas da regio referida na questo anterior.
a) Descreva a distribuio da percentagem mdia de gordura do leite dessa amostra de
25 vacas.
b) Compare a distribuio da mdia da amostra considerada no item anterior com a
distribuio da mdia de uma amostra de 25 vacas do mesmo rebanho.
c) Qual a probabilidade de que a mdia da percentagem de gordura do leite da
amostra considerada no item a exceda 4%.
9. Sabe-se que a aplicao da dose padro de uma droga resulta na alterao mdia de
250 unidades no nvel de cido rico de uma pessoa, com desvio padro de 50
unidades. Uma nova dose da droga deve ser testada experimentalmente em 75
indivduos, dos quais ser medida a alterao de seus nveis de cido rico. A
conjetura a ser testada que a nova dose aumenta a alterao mdia do nvel de cido
rico da populao em 20 unidades, mas sem alterar o desvio padro.
a) Supondo que a conjetura verdadeira, qual a probabilidade de que a mdia da
amostra para 75 indivduos seja menor que 260 ou maior que 280 unidades?
b) Se alm de aumentar a mdia em 20 unidades, a nova dose altera o desvio padro de
50 para 64, qual a probabilidade de que a mdia da amostra seja menor que 260
ou maior que 280?
10. Uma amostra aleatria de tamanho 64 tomada de uma populao infinita com mdia
=112 e varincia
2
=144. Use o teorema central do limite para determinar a
probabilidade de que a mdia da amostra resulte maior que 114,5.
11. Uma amostra aleatria de tamanho 100 extrada de uma populao infinita com
mdia =53 e varincia
2
=444. Qual a probabilidade de que a mdia da amostra
situe-se entre 50 e 56?
12. Devero ser efetuadas 80 medidas repetidas do ponto de fuso de uma nova liga
metlica. Pelo conhecimento da preciso do aparelho de medida, sabe-se que o desvio
padro das medidas 7 graus. Qual a probabilidade de que a mdia da amostra de 80
medidas no se desvie do verdadeiro ponto de fuso por mais do que 1,54 graus?
13. A varivel que exprime uma caracterstica das unidades de uma populao tem
distribuio normal com varincia
2
=2.500. Determine a probabilidade de que a
varincia de uma amostra aleatria de tamanho 26 dessa varivel aleatria situe-se
entre 48 e 95.
14. A afirmativa de que a varincia de uma populao normal
2
=4 deve ser rejeitada se
a varincia de uma amostra aleatria de tamanho 9 excede 8,7675. Qual a
probabilidade de que essa afirmativa seja rejeitada mesmo que
2
=4?
15. A afirmativa de que a varincia de uma populao normal
2
=25 deve ser rejeitada
se a varincia de uma amostra aleatria de tamanho 16 excede 41,66 ou menor do
que 7,67. Qual a probabilidade de que a afirmativa referente varincia
populacional seja correta?
Estatstica Bsica 160
16. Com base em amostras aleatrias independentes de tamanhos 10 de duas populaes
normais que provm as estimativas de varincias s
1
2
=12,8 e s
2
2
=3,2, como se pode
concluir sobre a afirmativa de que as duas populaes tm a mesma varincia?
17. Uma amostra aleatria de tamanho 25 de uma populao normal tem mdia x=47 e
desvio padro s=6. Com base na estatstica T de Student, pode-se dizer que a
informao provida pela amostra suporta a hiptese de que a mdia da populao
=42?
18. A mdia e a varincia de uma amostra aleatria de tamanho 9 de uma populao
normal so x=27,7 e s
2
=3,24. Com base na estatstica t, pode-se dizer essa
informao suporta a afirmativa de que a mdia da populao =28,5?
19. Decida se cada uma das seguintes sentenas verdadeira ou falsa, indicando as letras
V e F entre parntesis, respectivamente. Se a sentena for falsa, explique porque.
( ) Amostragem completamente aleatria e amostragem aleatria simples so dois
diferentes mtodos de amostragem.
( ) Um instrumento de loteria pode ser um modo aceitvel de obter amostras
completamente aleatrias.
( ) Quando se usa uma tabela de nmeros aleatrios para selecionar uma amostra
comea-se, sempre, pelo incio da tabela.
( ) A escolha do delineamento de amostra no afeta a escolha do procedimento de
anlise estatstica a usar.
( ) Se possvel, amostras de tamanho maior do que um devem ser usadas para
propsitos de inferncia.
( ) Determinar um tamanho apropriado da amostra nunca um problema quando se
usam tcnicas estatsticas.
( ) Para muitas amostras aleatrias a mdia amostral no igual mdia da
populao da qual a amostra foi extrada.
( ) Uma mdia amostral calculada da mesma maneira que uma mdia de
populao.
( ) Uma varincia amostral calculada da mesma maneira que uma varincia de
populao.
( ) Se uma populao tem mdia 10 e desvio padro 2, ento a distribuio amostral
das mdias de amostras de tamanho n=2 tem mdia 10 e desvio padro 1.
( ) A varincia de uma distribuio amostral de mdias maior do que a varincia
da populao.
( ) A distribuio da mdia X de uma amostra aleatria de X, quando X tem
distribuio normal, tem desvio padro menor que o de X, se n>1.
( ) Se amostras aleatrias de tamanho fixo n so extradas de uma populao
normal, a distribuio das mdias amostrais permanece normal quando n cresce.
( ) O pico da distribuio normal de X cada vez menos pronunciado, na medida
em que o tamanho da amostra n cresce.
( ) A mdia de qualquer amostra aleatria mais provvel situar-se mais prxima
da mdia da populao na medida em que o tamanho da amostra cresce.
6. Amostragem Aleatria e Distribuio Amostral
161
( ) X uma varivel aleatria quando possui uma distribuio, e um nmero
quando toma um valor particular, denotado por x.
( ) De acordo com o teorema central do limite, se n grande, a distribuio amostral
de mdias bem aproximada por uma distribuio normal.
( ) O teorema central do limite pode ser aplicado apenas a distribuies simtricas.
( ) A distribuio normal uma ferramenta estatstica valiosa em virtude do teorema
central do limite.
( ) Se uma populao tem varincia igual a 12, ento a varincia das mdias de
todas as amostras de tamanho 3 extradas aleatoriamente da populao ser igual
a 4.
( ) A mdia de uma amostra aleatria de qualquer populao tem distribuio
normal com mdia m e varincia
2
.
( ) O "erro padro da mdia" o desvio padro das mdias de todas as amostras de
um tamanho fixo de uma populao.
( ) As outras condies permanecendo as mesmas, para reduzir o erro padro da
mdia pela metade necessrio dobrar o tamanho da amostra.
( ) Quando n grande e p prximo de 0,5, a distribuio binomial
aproximadamente uma distribuio normal.
( ) H apenas uma distribuio
2
.
( ) A estatstica
2
no tem uma distribuio contnua, mas a distribuio contnua
atribuda a Helmert fornece sentenas de probabilidade confiveis.
( ) Muitas populaes que ocorrem naturalmente podem ser modeladas pela
distribuio
2
.
( ) O valor esperado e a varincia de uma distribuio
2
so iguais.
( ) Para cada nmero de graus de liberdade inteiro positivo, h uma diferente
distribuio de t.
( ) O denominador de uma estatstica T algumas vezes chamado "erro padro".
( ) A proporo da rea da distribuio de t direita de um valor de t especificado
na cauda direita maior do que a proporo alm do mesmo valor na
distribuio normal padro.
( ) H muitas distribuies de F diferentes, uma para cada par ordenado de nmeros
de graus de liberdade.
( ) As distribuies de F so simtricas.
( ) Todos os valores de F so no negativos.

162 Estatstica Bsica
7 INFERNCIA ESTATSTICA
Contedo
7.1 Introduo.......................................................................................................................163
7.2 Estimao por Ponto.......................................................................................................164
7.2.1 Conceitos.................................................................................................................164
7.2.2 Propriedades de um estimador ................................................................................165
7.2.3 Distribuio amostral da mdia de uma populao normal ....................................165
7.2.4 Distribuio amostral da varincia de uma populao normal ...............................166
7.3 Estimao por Intervalo - Intervalo de Confiana .........................................................166
7.4 Teste de Hiptese ...........................................................................................................167
7.4.1 Conceitos.................................................................................................................167
7.4.2 Testes de hipteses referentes media de uma populao normal .........................170
7.4.3 Teste da hiptese de igualdade das mdias de duas populaes normais...............172
Populaes com mesma varincia ..........................................................................172
7.4.4 Teste unilateral e teste bilateral ..................................................................................174
7.5 Exerccios.......................................................................................................................174

7.1 Introduo
A inferncia estatstica ocupa-se das tcnicas que permitem, a partir da observao de
valores da varivel aleatria em uma amostra aleatria de uma populao, inferir sobre a natureza
da distribuio que governa a populao.
Uma amostra aleatria de uma populao uma parte da populao gerada por processo
que atribui a cada indivduo da populao a mesma probabilidade de integrar a amostra.
O procedimento de inferncia estatstica consiste no seguinte:
1) Postula-se que a distribuio que governa uma populao um membro de uma
famlia de distribuies indexada por um ou mais parmetros; isto , que a
distribuio da varivel aleatria X um membro de uma famlia de distribuies
caracterizada por valores especficos desconhecidos de um ou mais parmetros.
2) Com base em uma amostra aleatria de tamanho n da populao, isto , de uma
realizao particular (x
1
, x
2
,...,x
n
) de n variveis aleatrias X
1
, X
2
,...,X
n
,
independentes e com mesma probabilidade, identifica-se um membro particular da
famlia.
Estatstica Bsica 164
3) A partir da, procede-se como se a distribuio identificada fosse a verdadeira
distribuio que governa a populao.
Conseqncias: O resultado da inferncia depender da amostra e variar de amostra para
amostra. Logo, a inferncia est sujeita a erro.
A inferncia estatstica clssica se ocupa, basicamente, de trs classes de problemas:
Estimao por ponto,
Estimao por intervalo, e
Teste de hiptese
7.2 Estimao por Ponto
7.2.1 Conceitos
A estimao por ponto o processo de inferncia que determina um valor particular para
uso em lugar do parmetro (desconhecido), atravs de uma funo dos elementos da amostra.

Um estimador de um parmetro uma funo t(X
1
, X
2
,...,X
n
) dos elementos da
amostra aleatria X
1
, X
2
,...,X
n
que atribui valores para "aproximao" de um
parmetro.
Uma estimativa de um parmetro o valor do estimador correspondente a uma
realizao particular (x
1
, x
2
,...,x
n
) das n variveis aleatrias X
1
, X
2
,...,X
n
independente
e identicamente distribudas, gerada por uma amostra da populao.

Exemplo 7.1. Estimadores e estimativas dos parmetros da distribuio normal.
Um estimador da mdia de uma populao com distribuio normal :
X
X X X
n
n

+ + +
1 2
...
;
uma sua estimativa particular, obtida de uma amostra (x
1
, x
2
,...,x
n
) :
x
x x x
n
n

+ + +
1 2
...

Um estimador da varincia
2
:
( )
[ ]
S
n
X X X X X X
n
2
1
2
2
2 2
1
1

+ + + ) ( ) ... ( )
=
1
1
2
n
X X
i
i
( )
e uma estimativa particular:
( ) s x x
i
i
2
2

Assim, para uma populao normal, tem-se:

7. Inferncia Estatstica
165
Parmetro Nome Estimador Estimativa

Mdia
X x

2
Varincia S
2
s
2


7.2.2 Propriedades de um estimador
Um estimador t(X
1
, X
2
,...,X
n
) de um parmetro que indexa a famlia de
distribuies postulada para uma populao no tendencioso ou no viesado se a
mdia das correspondentes estimativas determinadas para todas as possveis amostras
aleatrias extradas da populao for igual ao (verdadeiro) valor do parmetro, ou seja,
se E[t(X
1
, X
2
,...,X
n
)] = .

Um estimador t(X
1
, X
2
,...,X
n
) denominado de varincia mnima do parmetro
se ele for o estimador de menor varincia entre todos os estimadores desse parmetro,
ou seja, se: Var[t(X
1
, X
2
,...,X
n
)] Var[t'(X
1
, X
2
,...,X
n
)], para qualquer outro estimador
t'(X
1
, X
2
,...,X
n
) de .

O melhor estimador ou estimador timo de um parmetro seu estimador no
tendencioso e de varincia mnima.

Exemplo 7.2. Os estimadores no tendenciosos e de varincia mnima dos parmetros e

2
da distribuio normal so a mdia e a varincia amostrais, ou seja X e S
2
, respectivamente.
De fato, pode-se demonstrar que:
E(X) = e Var(X)
2
Var(qualquer outro estimador de );
E(S
2
) =
2
e VAR(S
2
) Var(qualquer outro estimador de
2
).
7.2.3 Distribuio amostral da mdia de uma populao normal
Recorde-se que se X uma varivel aleatria com distribuio normal com mdia e
varincia
2
, o que se pode representar simbolicamente por X ~ N (,
2
), ento Z =
X

tem
distribuio normal padro, ou seja, distribuio normal com mdia zero e varincia igual a 1, o
que pode ser simbolicamente indicado por Z~N(0, 1).
Considere-se uma amostra de tamanho n de uma populao normal com mdia e
varincia
2
. Tem-se, ento, em considerao n variveis aleatrias: X
1
, X
2
,..., X
n
, independentes
e com idntica distribuio:
X
i
~N(,
2
), i = 1, 2,..., n.
A mdia dessas n variveis aleatrias :
Estatstica Bsica 166
X
X X X
n
n

+ + +
1 2
...
;
Demonstra-se que a distribuio de X tambm normal com a mesma mdia e varincia
2
/n,
isto , a varincia da populao reduzida n-sima parte:
X ~N(,

2
n
) .
Pela padronizao da varivel aleatria X, obtm-se a varivel aleatria normal padro:
Z
X
n

~ N(0, 1).
Distribuio t. A varincia
2
, em geral, desconhecida. Substituindo o desvio padro da
amostra s em lugar do desvio padro da populao na expresso de Z, obtm-se uma nova
varivel aleatria, designada por T que tem uma distribuio particular, denominada distribuio t
com n-1 graus de liberdade (isto , com os graus de liberdade correspondentes aos g.l. da estimativa
s
2
de
2
):
T
X
s n


~ T
n-1
.
Probabilidades referentes a intervalos da varivel aleatria T podem ser obtidos de tabelas
especiais, como a Tabela de t em anexo.
7.2.4 Distribuio amostral da varincia de uma populao normal
O estimador S
2
de
2
, determinado a partir de uma amostra de tamanho n, tem
distribuio de
2
(qui-quadrado) com n-1 graus de liberdade. Melhor dito,

S
2
2
~

2
,
onde v=n-1 o numero de graus de liberdade de S
2
. Probabilidades referentes distribuio de S
2

podem ser obtidas de tabelas especiais, como a Tabela de
2
em anexo.
7.3 Estimao por Intervalo - Intervalo de Confiana
Um intervalo de confiana com coeficiente de confiana 1- para o parmetro
de uma distribuio de probabilidade um intervalo aleatrio (a, b) tal que:
P(a < < b) = 1-;
isto , um intervalo aleatrio cuja probabilidade de conter o parmetro (desconhecido)
1-.

Um intervalo de confiana simtrico para a mdia de uma distribuio normal N(,
2
)
com coeficiente de confiana 1- pode ser obtido como segue:
7. Inferncia Estatstica
167
Os extremos do intervalo (-t', t') de valores da varivel aleatria
X
T
S n



correspondente probabilidade 1- podem ser obtidos da Tabela de t com a condio de que:
P (-t' < T < t') = 1-.
Substituindo
X
T
S n


e transformando a dupla desigualdade -t' < T < t' de modo a obter em seu
interior, obtm-se, sucessivamente:
X
t ' t '
S n

< <

;
donde:
t 'S t ' S
X
n n
< <
e
t 'S t ' S
X X
n n
< <
multiplicando por -1 (do que resulta a inverso de sentido da dupla desigualdade), obtm-se:
t 'S t 'S
X X
n n
< < +
Retornando sentena de probabilidade inicial, resulta:
t 'S t 'S
P X X 1
n n
j \
< < +
, (
( ,
.
Logo, o intervalo
X
t S
n
X
t S
n
+
j
(
,
\
,
(
'
,
'

um intervalo de confiana para com coeficiente de confiana 1 - .
7.4 Teste de Hiptese
7.4.1 Conceitos
Um teste de hiptese um processo de deciso estatstica entre duas proposies
alternativas referentes aos parmetros de uma populao. A primeira proposio, a
hiptese bsica, corresponde hiptese cientfica formulada negativamente. Por essa
razo ela designada hiptese de nulidade. Uma hiptese estatstica completamente
formulada inclui a denominada hiptese alternativa, isto , a deciso alternativa que
deve ser adotada caso a hiptese de nulidade seja rejeitada no processo de deciso.

Estatstica Bsica 168
Essas duas hipteses so, em geral, designadas por smbolos prprios: H
0
e H
A
,
respectivamente para representar as hipteses de nulidade e alternativa.
A hiptese de nulidade prope uma distribuio especfica da famlia de distribuies
postulada no processo de inferncia como apropriada para a populao em questo.
O teste de hiptese uma regra de deciso que, com base em dados da amostra, conduzir
deciso em favor da hiptese H
0
ou da hiptese H
A
, melhor dito, aceitao ou rejeio de H
0
(e,
portanto, rejeio ou aceitao da H
A
, respectivamente).
O processo consiste em escolher uma estatstica apropriada com distribuio de
probabilidade conhecida, denominada critrio de teste, e decidir com base no valor da estatstica
determinado a partir de uma amostra. Se esse valor se situa em uma regio de pequena rea, isto ,
de pequena probabilidade, arbitrariamente escolhida, na cauda da distribuio, a hiptese de
nulidade rejeitada, j que tal probabilidade pequena indica evidncia de que a distribuio da
estatstica no pertence distribuio especificada pela hiptese H
0
. Essa regio na cauda da
distribuio do critrio de teste denominada regio de rejeio (ou regio crtica) e a regio
complementar, regio de aceitao.
A regra de deciso , portanto:
- Aceitar H
0
se o valor da estatstica critrio de teste estiver na regio de aceitao;
- Rejeitar H
0
se o valor da estatstica estiver na regio de rejeio.

Exemplo 7.3. Suponha-se que resultados de pesquisas indiquem que a produo de gros
de uma cultivar de soja tem distribuio normal com mdia igual a 20 gramas e desvio padro de 4
gramas. O melhoramento gentico levado a efeito com a cultivar conduziu a uma nova cultivar
cuja produo mdia o pesquisador espera seja superior (e base terica assegura que no pode ser
inferior) da cultivar original, com o mesmo desvio padro.
Com o intuito de verificar a validade dessa pressuposio, o pesquisador toma uma
amostra de medidas da produo da cultivar melhorada para testar a seguinte hiptese:
0
A
H : 20
H : 20

>



Com base no valor da mdia da amostra, o pesquisador deve decidir sobre H
0
ou H
A
. Dois
tipos de erro podem ser cometidos pelo pesquisador quando ele efetua um teste de hiptese:
Erro tipo I: Rejeitar a hiptese de nulidade H
0
quando ela verdadeira;
Erro tipo II: Aceitar a hiptese de nulidade H
0
quando ela falsa.
As probabilidades de cometer cada um desses erros so designadas simbolicamente por:
= P(Erro tipo I),
= P(Erro tipo II).
As quatro situaes a que esse processo de deciso sob incerteza (dado o
desconhecimento da verdadeira situao) pode conduzir o pesquisador so representadas na
Figura 7.1:

7. Inferncia Estatstica
169
Deciso
Situao
verdadeira
H
0
H
A

H
o
Deciso correta Erro tipo I
H
A
Erro tipo II Deciso correta

Figura 7.1. Tabela de deciso em um processo de teste de
hiptese estatstica.

Em geral, o pesquisador tem alguma evidncia emprica em favor da hiptese alternativa
H
A
, de modo que ele conduz o experimento com o propsito de comprovar tal evidncia. Assim,
desejvel um teste de hiptese que atribua alta probabilidade de rejeio da hiptese de nulidade
H
0
se a hiptese alternativa for verdadeira, mantendo a probabilidade do erro tipo I adequadamente
baixa. Tal probabilidade denominada potncia do teste. Logo,
Potncia = P(Rejeitar H
0
quando H
0
verdadeira)
= 1 - P(Aceitar H
0
quando H
A
verdadeira)
= 1 - .
Assim, a potncia de um teste exprime a habilidade do teste para rejeitar hipteses de
nulidade falsas. Em experimentos comparativos, isto significa sensibilidade para detectar
diferenas reais.
Seria desejvel um teste que assegurasse probabilidades convenientemente pequenas para
ambos os erros tipo I e tipo II. Lamentavelmente, entretanto, essa condio no vivel, j que a
diminuio de implica em incremento de , e vice-versa. O exemplo que segue ilustra a
situao.

Exemplo 7.4. Considere-se a situao de melhoramento da cultura da soja, supondo,
agora, que o pesquisador afirma que a pesquisa elevou a produo para 25 gramas. A hiptese a
testar , ento:
0
A
H : 20
H : 25


O teste dessa hiptese um processo de deciso entre duas alternativas simples: a mdia da
populao = 20 (H
0
) ou =25 (H
A
). As curvas das funes de densidade correspondentes a essas
duas distribuies normais (ambas com mesmo desvio padro de 4 gramas) so apresentadas na
Figura 7.2. A regio de rejeio correspondente a um erro tipo I com probabilidade a regio
indicada com sombreamento mais escuro na cauda direita da curva esquerda; a regio de
aceitao o complemento da rea sob essa curva. Ento, a probabilidade do erro tipo II (aceitar a
hiptese H
0
quando H
A
a correta) a regio com sombreamento mais claro na cauda esquerda da
curva da distribuio correspondente hiptese H
A
(curva direita). Observe-se, ento, que a
tentativa de deslocar a fronteira entre as regies de rejeio e de aceitao de H
0
de modo a
diminuir a rea implica em incremento da rea , e vice-versa.

Estatstica Bsica 170

Figura 7.2. Representao grfica das distribuies de probabilidades da
produo de soja sob as hipteses de nulidade e alternativa
consideradas no Exemplo 7.4.

Como freqentemente o pesquisador est interessado na rejeio da hiptese de nulidade
H
0
, dada a impossibilidade de fixar ambas as probabilidades e pequenas, comum nos testes
de hiptese fixar um valor convenientemente pequeno para , sem considerao para o valor que
resulta, correspondentemente, para . Um teste de hiptese conduzido nessas condies
denominado teste de significncia. A probabilidade de erro tipo I , ento, designada nvel de
significncia do teste.
A potncia do teste a rea no sombreada 1- da curva direita, isto , o complemento da
rea achuriada ( ) sob aquela curva.
7.4.2 Testes de hipteses referentes media de uma populao normal
O exemplo anterior uma ilustrao de teste de hiptese referente mdia de uma
populao com distribuio normal X~N(,
2
) que, de modo geral, pode ser especificada por:
0
A
H : c (cons tan te)
H : c


Uma forma alternativa de especificar essa hiptese :
0
A
H : c 0
H : c 0


Nessa ltima forma, fica justificada a designao "hiptese de nulidade" para H
0
.
Para o teste dessa hiptese, o pesquisador deve dispor de valores x e s
2
das estatsticas
X e S
2
, determinados a partir de uma amostra de tamanho n da populao em referncia. Ento,
um critrio para teste dessa hiptese geral a estatstica:
T' =
0
n 1
x
H
X c
T
S

~
onde S S n
x

2
e n-1 o nmero de graus de liberdade da estimativa da varincia, s
2
.
7. Inferncia Estatstica
171

Exemplo 7.5. Suponha que seja conhecido que o coeficiente de digestibilidade de uma
rao administrada a ovinos 53,0 e que h indicaes de que a suplementao de torta de soja
pode alterar a digestibilidade da rao.
Para testar essa hiptese:
0
A
H : 53, 0
H : 53, 0


o pesquisador administra a rao suplementada com torta de soja a 7 animais e determina os
coeficientes de digestibilidade que seguem: 57,8; 56,2; 61,9; 54,4; 53,6; 56,4 e 53,2.
Os valores das estatsticas X e S
2
calculados para esta amostra so:
x = 56,21 e s
2
= 9,015;
logo:
s s n
x

2

9 015 7 ,
Supondo que a distribuio do coeficiente de digestibilidade normal, o teste da hiptese
especificada pode ser procedido atravs da estatstica t:
T' =
0
x
6
H
X 53, 0
T
S

~ .
Tem-se, no caso:
t' =
56 21 53 0
1134
3 21
1134
2 83
, ,
,
,
,
,

.
Consultando a Tabela de t, obtm-se, para 6 graus de liberdade e P = 0,025 (=0,05, j
que a rea de cada cauda da curva da distribuio de t 0,025), obtm-se:
t
6
= 2,447 ( = 0,05, bilateral).
Como
t' (calculado) > t (tabelado),
rejeita-se a hiptese H
0
. A Figura 7.3, mostra as regies de rejeio e de aceitao e indica que o
valor observado da estatstica T situa-se na regio de rejeio.



Figura 7.3. Regies de rejeio e de aceitao do teste de
hiptese ilustrado no Exemplo 7.4.

Estatstica Bsica 172
7.4.3 Teste da hiptese de igualdade das mdias de duas populaes normais
Populaes com mesma varincia
Em muitas situaes, o pesquisador tem interesse em testar a hiptese de igualdade das
medias
1
e
2
e de duas populaes P
1
: (
1
,
2
) e P
2
: (
2
,
2
) com mesma varincia
2
, ou seja,
a hiptese:
0 1 2
A 2 2
H :
H :




ou, o que o mesmo,
0 1 2
A 2 2
H : 0
H : 0




Para o teste dessa hiptese, ele deve obter duas amostras aleatrias independentes, uma de cada
uma das duas populaes. Sejam (X
11
, X
12
,...,X
1 n
1
) e (X
21
,X
22
,...X
2 n
2
) as duas amostras, de
tamanhos n
1
e n
2
, respectivamente, das populaes P
1
e P
2
. A partir dessas amostras, ele determina
as estatsticas X X S e S
1 2 1
2
2
2
, , . Ento, um critrio para o teste da hiptese em referncia a
estatstica:
T' =
0
1
x x
1 2
2
1 2
n n 2
H
X X
T
S

+

~ ,
onde S
x x
1 2

a estimativa do desvio padro da estimativa da diferena entre as medias das duas


populaes, ou seja, a raiz quadrada de
S
n n
S
x x
1 2
2
1 2
2
1 1

+
j
(
,
\
,
( ,
onde S
2
o estimador da varincia comum das duas populaes, determinado como a mdia
ponderada dos estimadores das varincias das duas amostras, tomando como pesos os respectivos
graus de liberdade, ou seja:
S
n S n S
n n
2 1 1
2
2 2
2
1 2
1 1
2

+
+
( ) ( )


+
+
SQX SQX
GLX GLX
1 2
1 2
,
onde SQX
i
a soma de quadrados dos valores amostrais de X
i
e GLX
i
o correspondente nmero
de graus de liberdade (i=1,2).

Exemplo 7.6. Os coeficientes de digestibilidade determinados para duas raes A e B
administradas a ovinos foram os seguintes:

7. Inferncia Estatstica
173
X
1
(Rao A) X
2
(Rao B)
57,8 64,2
56,2 58,7
61,9 63,2
54,4 62,5
53,6 59,8
56,4 59,2
53,2
393,5 367,6
x
1
= 56,21 x
2
= 61,26
SQX
1
= 54,09 SQX
2
= 26,52
s
1
2
= 9,015 s
2
2
= 5,304

O teste a hiptese de que as mdias populacionais dos coeficientes de digestibilidade das
duas raes so iguais contra a alternativa de que elas diferem, supondo que as varincias so
iguais (mas desconhecidas), ou seja:
0 1 2
A 2 2
H :
H :




procedido como segue:
A estimativa da varincia da estimativa da diferena entre as mdias populacionais dos
coeficientes de digestibilidade das duas raes :
s
2
54 09 26 52
7 1 6 1
7 328
+


, ,
( )( )
, ,
donde:
s
x x
1 2
2
1
7
1
6
7 3282 2 268

+
j
(
,
\
,
( , , ;
logo,
s
x x
1 2
2
2 268 1 5061

, , .
Portanto, o valor da estatstica T para a amostra dos treze ovinos :
t


56 21 61 26
1 5061
3 353
, ,
,
, .
Por outro lado, o ponto superior que limita uma rea (probabilidade) de 0,05/2 = 0,025 na cauda
direita da curva da distribuio t para n
1
+n
2
-2 = 11 graus de liberdade, obtido da tabela de t de
Student, t(0,05;11) = 2,201.
Como o valor absoluto do valor observado de t, ou seja, 3,353, superior a 2,201, o valor
observado da estatstica T situa-se na regio de rejeio. Logo, a hiptese de nulidade rejeitada.
Conclui-se que as duas medias diferiram significativamente no nvel de significncia =0,05.
Estatstica Bsica 174
7.4.4 Teste unilateral e teste bilateral
H duas formas de teste de significncia: a bilateral e a unilateral. O teste bilateral, o
mais freqentemente utilizado na prtica, apropriado quando o julgamento inicial, com base no
raciocnio lgico referente s condies do problema, de que o verdadeiro valor do parmetro
pode ser maior ou menor do que o valor sob a hiptese de nulidade. Nessa situao, um valor do
parmetro distante daquele correspondente hiptese de nulidade pode revelar-se atravs de um
valor t' grande e positivo ou pequeno e negativo. Assim, a regio de rejeio para um teste com
erro tipo I igual a compreende as reas simtricas nas duas caudas da distribuio t, cada uma
correspondente probabilidade /2. A hiptese de nulidade rejeitada quando o valor observado t'
da estatstica t situa-se em qualquer uma das duas caudas. Nesse caso, o procedimento para o teste
calcular o valor absoluto de t', denotado | t' |, ignorando seu sinal. Procura-se na tabela de t a
probabilidade de obter um valor de t maior do que o valor observado t' em qualquer das direes,
isto , a probabilidade de que |t | exceda o valor observado |t' | ( |t | significa "valor absoluto" de t).
O teste unilateral apropriado apenas quando sabido a priori o sinal da diferena entre
o parmetro e seu valor sob a hiptese de nulidade, se esta deve ser rejeitada. Assim, por exemplo,
em um experimento para verificar a eficcia de um inseticida sobre o controle de uma praga, o
pesquisador pode esperar, na pressuposio de que o inseticida no tem efeito txico prejudicial
sobre a produo, que a aplicao do inseticida, se este tem algum efeito, somente pode resultar
em aumento da produo. Nesse caso, a aplicao do teste unilateral apropriada; ela implica em
que o inseticida ou aumenta a produo ou no tem efeito sobre a produo; ele no pode
prejudicar a produo. A regio de rejeio para esse teste com erro tipo I igual a a cauda
direita da distribuio t; logo, a hiptese de nulidade rejeitada quando o valor observado t' da
estatstica t situa-se nessa cauda. Nesse caso, o procedimento para o teste calcular o valor de t'.
Se o sinal de t' for o esperado, procura-se na tabela de t a probabilidade de obter um valor de t
maior ou menor do que o valor observado t', conforme o sinal de t'. Se o sinal de t' for o oposto do
esperado, a hiptese de nulidade aceita, no havendo necessidade de recorrer tabela de t.
O valor de em um teste unilateral exatamente a metade daquele de um teste bilateral
com o mesmo t'. Assim, a hiptese de nulidade rejeitada com maior freqncia para testes
unilaterais do que para testes bilaterais.
7.5 Exerccios
1. Um pesquisador deseja conduzir um teste bilateral da hiptese de que a mdia de uma
populao igual a 12, sabendo que a varincia da populao 40. O pesquisador extrai
uma amostra aleatria de 20 itens da populao e determina a mdia da amostra.
a) Especifique as hipteses de nulidade e alternativa apropriadas.
b) Suponha que a mdia da amostra 9,1. Determine a estatstica para o teste da
hiptese e calcule, aproximadamente, a probabilidade de um valor mais extremo,
positivo ou negativo, do que o valor observado da estatstica.
c) Se o pesquisador escolheu o nvel de significncia =0,05 para o teste, deve ele
aceitar ou rejeitar a hiptese de nulidade? Escreva uma breve concluso.
7. Inferncia Estatstica
175
2. Considerando os mesmos valores para os parmetros e estatsticas dados no problema
1, efetue o teste de hiptese com cada uma das seguintes alteraes, comentando
como o teste de hiptese alterado:
a) =0,01 em lugar de =0,05.
b) Teste unilateral em lugar de teste bilateral.
3. Suponha que conhecido que o contedo de protena do po de trigo tem distribuio
normal com mdia igual a 12,0% e varincia igual a 2,25%. Uma amostra de 100 pes
com mistura de trigo e centeio analisada e revela o contedo mdio de 11,8% de
protena. Supondo que a mistura de centeio no altera a varincia do contedo de
protena do po, verifique se a amostra de 100 pes revela evidncia de que a mistura
de centeio ao trigo no altera o contedo mdio de protena do po. (Use o nvel de
significncia =0,05.)
4. O dano causado por uma praga lavoura de feijo uma preocupao para os
agricultores de uma regio. A pesquisa recomenda a aplicao de um inseticida para a
preveno de perdas econmicas quando o nmero de ovos do inseto por planta
excede 70 e afirma que o desvio padro do nmero de ovos em uma planta igual a 40.
Um agricultor colhe uma amostra aleatria de 80 plantas e obtm a mdia de 79 ovos
por planta. Com base nessa informao, deve ele aplicar inseticida em sua lavoura?
5. O contedo mdio de gua considerado como padro no controle de qualidade de
salsichas enlatadas de uma indstria 30%. Partidas de salsichas com mais de 30% de
gua devem ser rejeitadas. A anlise de uma amostra de 7 latas de salsichas de uma
partida forneceu as seguintes percentagens de gua: 32, 29, 33, 29, 33, 30 e 31. A
partida deve ou no ser rejeitada?
6. Os dados seguintes so medidas de presso do sangue de dois grupos de indivduos:
um grupo controle e um grupo tratado com sucrose (50 g/dia), aps 13 semanas de
tratamento:

Estatstica Bsica 176

Tratados
com
sucrose
Controle
110 106
134 98
122 108
104 104
118 120
131 124
114 108
96
100
X 833 964
SQX 99.837 103.976

O pesquisador deseja saber se a administrao de sucrose eleva a presso do sangue.
Efetue o teste de hiptese apropriado para responder questo do pesquisador.
7. Para o estudo do efeito de um contraceptivo oral sobre a elevao de colesterol no
sangue foi feita uma pesquisa utilizando dois grupos de dez mulheres, um dos quais
recebeu o contraceptivo e o outro serviu como testemunha. Os resultados esto
resumidos a seguir:

Contraceptivo Observaes SX SQX
Com: 163 157 245 169 93 110 937 160.553
Sem: 132 147 177 126 213 219 1.014 179.568

Efetue o teste de hiptese apropriado no nvel de significncia a=0,05.
8. Um pesquisador suspeita que o contedo de glicognio no tecido do peito de frango
reduzido pelo cozimento em microondas. Para verificar sua suspeita, ele efetua um
experimento com dois grupos de 5 peas de peito de frango. Os resultados foram os
seguintes:

Observaes X SQX
No cozido: 28 17 36 23 27 131 3.627
Cozido em microondas: 12 7 11 10 11 51 535

a) Esses resultados parecem confirmar a natural expectativa de que a diminuio do
contedo de glicognio tambm resulta em uma menor varincia. Efetue o teste de
hiptese apropriado.
7. Inferncia Estatstica
177
b) Tendo em conta o resultado obtido no item anterior, efetue o teste de hiptese
apropriado para responder questo de interesse do pesquisador.
9. Efetue o teste de homogeneidade de varincia para os dados do exerccio 6.
10. Foi efetuado um experimento para verificar se a infiltrao de gua de chuva difere
entre solo que recebeu plantio continuado de soja e de milho. Os resultados obtidos
em 7 talhes com cada um dos dois sistemas de cultivo foram os seguintes:

Soja contnua: 1,16 0,87 0,93 0,88 1,23 0,40 1,55
Milho contnuo: 0,84 1,96 0,73 1,42 1,41 0,89 0,73

Efetue o teste da hiptese formulada no plano do presente experimento.
11. Em propriedades de um municpio, observou-se o consumo de folhas de soja (em cm
2
)
por duas populaes de anticrcia, obtendo-se os seguintes resultados:

Populao 1: 327 265 65 441 236 198 242 155
Populao 2: 40 125 233 148 103 79 188 97

Atravs de teste de hiptese apropriado, verifique se os dados so consistentes com a
suspeita de que o consumo mdio difere entre as duas populaes.
12. Os seguintes dados foram obtidos num experimento executado para verificar se existe
diferena sistemtica na leitura da presso sangnea feita por dois aparelhos
diferentes:

Aparelho A: 136 142 140 147 150 147
Aparelho B: 141 167 141 145 127 146 135 152 135 152

Verifique se os dados confirmam a pressuposio.
13. Um experimento foi conduzido para determinar se o uso de um aditivo qumico
especial junto com um fertilizante acelera o crescimento das plantas. Ao final de
quatro semanas, as plantas foram medidas e os resultados foram os seguintes:

Sem aditivo: 20 31 16 22 19 32 25 18 20 19
Com aditivo: 23 34 15 21 22 31 29 20 24 23

Verifique se esses dados so consistentes com a hiptese de que o uso do aditivo
realmente acelera o crescimento das plantas.
14. Fenos de duas origens - feno de alfafa e feno de quicuio - foram testados em terneiros
machos da raa Charols de aproximadamente mesma idade, durante duas semanas.
Ao final do perodo, foram registrados os seguintes dados de ganho de peso dos
animais utilizados no experimento:

Estatstica Bsica 178
Feno de alfafa: 7,1 2,3 9,0 3,7 8,8
Feno de quicuio: 3,6 4,5 2,3 1,2 4,9 3,2 5,7

Verifique se existe diferena significativa entre os dois tipos de feno quanto ao ganho
de peso dos animais.
15. Uma amostra de 40 vasilhames de vinagre de uma partida de certa marca revelou o
contedo mdio lquido de 975 ml, com desvio padro 10 ml. Teste a hiptese
apropriada para verificar se o contedo mdio das garrafas da referida partida deve ser
considerado menor que 1.000 ml, conforme as exigncias legais.
16. Decida se cada uma das seguintes sentenas verdadeira ou falsa, indicando as letras
V e F entre parntesis, respectivamente. Se a sentena for falsa, explique porque.
( ) Os dois principais tipos de inferncia so estimao por ponto e estimao por
intervalo.
( ) Dois mtodos de estimao so intervalo de confiana e teste de hiptese.
( ) Dado que a mdia amostral um estimador no tendencioso da mdia da
populao, ento essas duas mdias so iguais.
( ) Uma das vantagens de usar uma mdia amostral em vez de uma nica
observao para estimar uma mdia populacional que a varincia amostral
mais provvel estar prxima da mdia da populao.
( ) Gosset (Student) descobriu que quando n pequeno, a estimativa da varincia
tende a superestimar a varincia.
( ) Um intervalo de confiana para a mdia com coeficiente de confiana de 0,95
contm 95% de todas as mdias da populao.
( ) Um intervalo de confiana baseado na distribuio de t mais estreito do que o
correspondente intervalo de confiana baseado na distribuio normal padro.
( ) Se a varincia de uma distribuio normal desconhecida e sua estimativa
utilizada, ento duas amostras aleatrias separadas de igual tamanho podem
produzir dois intervalos de confiana de diferentes amplitudes.
( ) Em intervalo de confiana, as outras condies permanecendo iguais, quanto
maior o tamanho da amostra, mais estreito o intervalo.
( ) Se X tem distribuio binomial, o melhor estimador por ponto p =X/n do
parmetro p situa-se exatamente na metade do intervalo de confiana para p com
coeficiente de confiana de 95%.
( ) Se o coeficiente de confiana aumentado de 0,95 para 0,99, o intervalo de
confiana torna-se mais estreito.
( ) Intervalos de confiana baseados em amostras grandes so mais provveis de
incluir o parmetro populacional do que aqueles baseados em amostras
pequenas.
( ) Para distribuies binomiais, as outras condies permanecendo constantes,
quanto maior o valor de p maior ser a amplitude do intervalo de confiana.
7. Inferncia Estatstica
179
( ) As outras condies permanecendo iguais, quanto maior o coeficiente de
confiana adotado maior ser a amplitude do intervalo de confiana.
( ) No processo de estimao de um parmetro populacional, um intervalo de
confiana mais provvel estar correto do que uma estimativa por ponto.
( ) O parmetro binomial p deve ser conhecido para se obter limites de confiana
para p.
( ) Amostras repetidas do mesmo tamanho obtidas de uma mesma populao
binomial produziro, sempre, intervalos de confiana com coeficiente de
confiana de 99% de mesma amplitude para o parmetro p.
( ) Intervalos de confiana para o parmetro de Poisson so simtricos em relao
estimativa por ponto do parmetro.
( ) Intervalos de confiana referem-se a parmetros; intervalos de predio referem-
se a observaes.
( ) A hiptese alternativa sempre a hiptese de pesquisa.
( ) ( ) A hiptese de nulidade pode ser a mesma hiptese cientfica.
( ) Em uma situao prtica, a hiptese de nulidade, a hiptese alternativa e o nvel
de significncia devem ser especificados antes da execuo do experimento.
( ) Uma deciso feita na base de um procedimento estatstico ser sempre correta.
( ) Se um procedimento estatstico correto utilizado, impossvel rejeitar uma
hiptese de nulidade verdadeira.
( ) Se a hiptese de uma pesquisa verdadeira, ento o acaso no interfere no
resultado da pesquisa.
( ) Uma das principais razes para usar amostragem aleatria determinar a
probabilidade de que um experimento produza um resultado particular por acaso
se a hiptese de nulidade verdadeira.
( ) Dizer que a hiptese de nulidade rejeitada no significa necessariamente que
ela falsa.
( ) Uma concluso com base em um procedimento estatstico corretamente aplicado
baseada somente em probabilidade.
( ) O nvel de significncia em um procedimento estatstico depende do campo de
pesquisa, do custo e da gravidade dos erros de deciso; entretanto, os nveis
tradicionais so freqentemente utilizados.
( ) Se X tem distribuio binomial e observa-se a freqncia x/n = 0,5, a hiptese de
nulidade H
0
: p=0,05 pode ser rejeitada.
( ) "Nvel de significncia" e "Regio de rejeio" so duas expresses para a
mesma cousa.
( ) O erro tipo I definido como "a probabilidade de rejeitar a hiptese de nulidade
quando ela verdadeira".
( ) Quando a hiptese de nulidade verdadeira, a probabilidade de cometer um erro
tipo I igual a .
( ) Usando uma boa tcnica estatstica, hipteses de nulidade verdadeiras so
provavelmente rejeitadas to freqentemente quanto hipteses de nulidade falsas.
Estatstica Bsica 180
( ) impossvel cometer um erro tipo I quando a hiptese de nulidade falsa.
( ) A probabilidade de rejeitar a hiptese H
0
quando H
0
falsa designada pela letra
grega .
( ) A potncia de um teste de hiptese 1-.
( ) impossvel cometer um erro tipo II quando a hiptese de nulidade falsa.
( ) impossvel cometer um erro tipo II quando a hiptese de nulidade rejeitada.
( ) Se se usa tamanho de amostra grande, h menor probabilidade de um erro tipo I
e de um erro tipo II.
( ) Se um experimento bem delineado e tanto como so pequenos, ele deve ser
um bom experimento.
( ) Mesmo quando um procedimento estatstico correto usado, impossvel aceitar
a hiptese de nulidade quando ela falsa.
( ) Quanto maior a regio de rejeio, maior a potncia do experimento.
( ) P (X est na regio de rejeio) = se a hiptese de nulidade verdadeira.
( ) Se a varincia de uma populao com distribuio normal conhecida, ento, se
necessrio, um teste de hiptese referente mdia pode ser realizado com uma
amostra de tamanho n=1.
( ) Um teste de hiptese envolvendo a estatstica Z freqentemente usado porque a
maioria das populaes experimentais seguem distribuies normais com
varincias conhecidas.
( ) Para um teste de hiptese usando a estatstica Z, a regio de rejeio
unicamente determinada pela hiptese alternativa e o tamanho da amostra.
( ) A regio de rejeio baseada na hiptese de nulidade.
( ) O perigo do mau uso de um teste unilateral quando um teste bilateral deve ser
usado que ele faz o erro tipo I maior do que o para o teste apropriado.
( ) O perigo do mau uso de um teste bilateral quando um teste unilateral deve ser
usado que ele faz o erro tipo II maior do que o para o teste apropriado.
( ) A potncia de um teste no pode ser menor que o erro tipo I.
( ) Quando se suspeita que a hiptese de nulidade falsa, seria aconselhvel
diminuir a de 0,05 para 0,01 para ser menos provvel rejeit-la por acaso.
( ) Em um teste de hiptese, as outras condies permanecendo iguais, quanto maior
o tamanho da amostra, menor o erro tipo I.
( ) Se o intervalo de confiana para a mdia com coeficiente de confiana 1-a no
contm a mdia correspondente a hiptese de nulidade, ento um teste bilateral
conduziria rejeio da hiptese de nulidade no nvel de significncia a.
( ) Se um intervalo de confiana no contm o valor p
0
do parmetro binomial p
definido pela hiptese de nulidade H
0
, essa hiptese pode ser rejeitada.
( ) Em testes de hiptese referentes ao parmetro de Poisson , a hiptese
alternativa pode ser unilateral ou bilateral.
( ) A potncia de um teste de hiptese para o parmetro l de uma distribuio de
Poisson aumentada quando se aumenta o nmero de intervalos amostrados.
7. Inferncia Estatstica
181
( ) Uma hiptese referente o parmetro binomial p testada pela distribuio
binomial exata e pela aproximao normal d exatamente as mesmas
probabilidades.
( ) A distribuio de t apropriada para amostras de pequeno tamanho, seja a
varincia conhecida ou no.
( ) Quando a varincia de uma distribuio normal conhecida, uma distribuio de
t no deve ser usada para propsitos de inferncia.
( ) Para um teste t de uma amostra, a regio de rejeio unicamente determinada
pela hiptese alternativa e o tamanho da amostra.
( ) Para um teste de hiptese referente a mdia de uma distribuio normal, a
distribuio de t usada em lugar da distribuio normal padro quando a
varincia desconhecida e n pequeno.
( ) O uso de um teste unilateral ou bilateral depende da questo perguntada pelo
experimentador.
( ) Testes unilaterais so usualmente escolhidos para reduzir a probabilidade de um
erro tipo I.
( ) Para um teste t em um nvel a fixo, o valor absoluto do valor crtico cresce
quando cresce o nmero de graus de liberdade.
( ) Se duas amostras consistem de pares de dados, o experimentador pode escolher o
teste t para dados emparelhados ou o teste t para duas amostras independentes.
( ) Desde que testes t para dados emparelhados tm maior potncia do que testes t
para duas amostras independentes, o experimentador pode tentar planejar
delineamento de pares combinados, se possvel.
( ) Em um teste t para dados emparelhados, o parmetro correspondente hiptese
de nulidade deve ser igual a zero.
( ) Em um teste t para comparao de mdias com dados emparelhados envolvendo
20 pares de gmeos, h 38 graus de liberdade.
( ) Mesmo quando as mdias de duas populaes normais so iguais, o valor
calculado de t pode ser suficientemente grande devido a erro de amostragem para
causar um erro tipo I.
( ) Se um teste t deixa de indicar significncia para a diferena entre duas mdias
amostrais, resulta um erro tipo II.
( ) Se as outras condies permanecem as mesmas, mais fcil rejeitar a hiptese
de igualdade das mdias de duas populaes normais quando a diferena entre
elas 1,5 do que quando ela 4,5.
( ) A varincia ponderada de duas amostras a mdia ponderada dos dois
correspondentes desvios padres.
( ) Um teste t para comparaes com dados emparelhados deve ser sempre usado
quando as varincias das duas populaes so iguais.
( ) Se um teste t determina que a diferena entre as mdias de duas amostras
significativa, ento o experimentador deve concluir que duas diferentes
populaes foram amostradas.
Estatstica Bsica 182
( ) Se as mdias de duas populaes normais so iguais, o valor calculado de t em
um teste t para duas amostras ser exatamente igual a zero.
( ) Se as varincias de duas populaes so iguais, a melhor estimativa da varincia
comum a mdia das estimativas de varincia das correspondentes amostras,
independentemente de outras consideraes.
( ) Se o experimentador est inseguro de que as mdias de duas populaes normais
so iguais, esta hiptese pode ser testada antes da realizao do teste t para duas
amostras.
( ) Se a hiptese de igualdade das mdias de duas populaes normais verdadeira
para o teste t para a comparao de grupos, ento a estatstica t deve situar-se
prxima de zero.
( ) Se o valor calculado de qui-quadrado maior que o valor crtico, a hiptese de
nulidade rejeitada.
( ) A hiptese H
0
: p=0,7 com H: p0,7 pode ser testada tanto com a distribuio
binomial como com a distribuio c
2
. Se o tamanho da amostra grande, a
concluso deve ser a mesma para os dois testes.
( ) Se h 75 observaes de um experimento binomial e no teste qui-quadrado
multinomial x
1
-e
1
=25, ento tambm x
2
-e
2
=25.
( ) Quanto maior o nmero de graus de liberdade, menos provavelmente os valores
amostrais de qui-quadrado estaro na regio de rejeio.
( ) Dizer que um valor calculado de qui-quadrado "significativo" indica que ele
numericamente menor do que o valor crtico com o qual comparado.
( ) Em um experimento binomial, para testar H
0
: p
1
=0,25, p
2
=0,50, p
3
=0,25, devem
ser usados 3 graus de liberdade.
( ) Se o tamanho da amostra menor do que 25, uma correo para continuidade
deve ser feita quando se efetua teste de uma razo 1:2:1.
( ) Com amostragem aleatria, valores significativos da estatstica qui-quadrado
sero obtidos apenas quando a hiptese de nulidade for falsa.
( ) A probabilidade de rejeitar a hiptese de nulidade aumenta na medida em que
aumenta o nmero de graus de liberdade para a distribuio de qui-quadrado.
( ) Com amostragem aleatria, pode ser obtido um valor calculado de qui-quadrado
maior do que o valor crtico, mesmo quando a hiptese de nulidade falsa.
( ) O valor da estatstica qui-quadrado deve ser relativamente grande se h estreita
concordncia entre as freqncias observadas e esperadas.
( ) O valor crtico para um teste multinomial de qui-quadrado, no nvel de
significncia =0,05, da hiptese de uma razo gentica 27:9:9:3:3:3:1 14,067.
( ) O teste de qui-quadrado multinomial um teste de qualidade de ajustamento.
( ) Para testar se um conjunto de amostras pode ser modelado por uma distribuio
de Poisson, o experimentador deve especificar o parmetro l antes da
amostragem.
7. Inferncia Estatstica
183
( ) Se a hiptese de nulidade para um teste de qualidade de ajustamento no
rejeitada, podemos concluir que os dados provm de uma populao com a
distribuio de probabilidade especificada.
( ) Um teste de qui-quadrado para uma tabela de contingncia no apropriado se
se suspeita que as categorias nas filas e nas colunas no so independentes.
( ) Rejeitar a hiptese de nulidade em um teste de independncia atravs da
estatstica
2
decidir que as categorias nas filas so independentes das
categorias nas colunas.
( ) O teste de
2
de homogeneidade pode ser usado se as razes sob a hiptese de
nulidade so desconhecidas mas podem ser iguais para toda populao
amostrada.
( ) Um teste de
2
de independncia para uma tabela k2 tem k-1 graus de liberdade
associado a ele.
( ) Um teste
2
de homogeneidade pode ser usado para testar a igualdade de
parmetros de duas distribuies binomiais.
( ) Um teste de
2
de independncia testa a hiptese de nulidade de que h uma
associao entre as categorias em filas e em colunas contra a alternativa de que
elas no so relacionadas.
( ) Se a hiptese de igualdade das varincias de duas populaes verdadeira, ento
a estatstica F deve situar-se prxima de zero.
( ) O teste F um procedimento para testar hipteses referentes a varincias apenas
quando as mdias so iguais.
( ) Quando as varincias de duas populaes so diferentes e desconhecidas e as
amostras so pequenas, no h teste exato para testar uma hiptese de igualdade
de mdias das duas populaes.

184 Estatstica Bsica
8 ANLISE DE REGRESSO E CORRELAO
LINEAR SIMPLES
Contedo
8.1 Introduo.......................................................................................................................186
8.1.1 Origens e importncia da anlise de regresso linear .............................................186
8.1.2 Relaes entre variveis..........................................................................................187
- Relaes deterministas .........................................................................................187
- Relaes semideterministas..................................................................................187
- Relaes empricas...............................................................................................188
8.1.3Relaes lineares......................................................................................................189
8.2 Relaes de Duas Variveis ...........................................................................................190
8.3 Grfico dos Dados..........................................................................................................191
8.4 Anlise de Regresso Linear Simples ............................................................................193
8.4.1 Introduo ...............................................................................................................193
8.4.2 Modelo estatstico ...................................................................................................194
8.4.3 Inferncia estatstica................................................................................................196
8.4.4 Estimao (por ponto) dos parmetros....................................................................196
Equao da linha reta ajustada................................................................................197
Resduos e estimativa da varincia do erro ............................................................198
Propriedades dos estimadores de quadrados mnimos ...........................................198
8.4.5 Teste de hiptese.....................................................................................................201
8.4.5.1 Hiptese de relao linear entre Y e X............................................................201
8.4.5.2 Hiptese referente declividade da linha de regresso...................................202
8.4.5.3 Anlise da variao .........................................................................................202
8.4.6 Coeficiente de determinao...................................................................................205
8.4.7 Intervalo de confiana.............................................................................................206
8.4.7.1 Intervalo de confiana para o coeficiente de regresso b................................206
8.4.7.2 Intervalo de confiana para E(Y|X).................................................................208
8.5 Correlao Linear Simples.............................................................................................209
Relao entre coeficiente de regresso e coeficiente de correlao .......................210
8.6 Exerccios.......................................................................................................................211

Estatstica Bsica 186
8.1 Introduo
8.1.1 Origens e importncia da anlise de regresso linear
Em muitas reas da pesquisa cientfica, a variao de caractersticas respostas de interesse
influenciada, em grande parte, por outras caractersticas cujas magnitudes variam no curso da
pesquisa. A incorporao na anlise estatstica de informaes referentes a estas caractersticas
explanatrias freqentemente importante para a descrio e a derivao de inferncias referentes
s caractersticas respostas. O conhecimento de relaes entre caractersticas tambm til para a
predio de umas caracterstica a partir de informaes sobre as outras, e seu controle e otimizao
atravs da manipulao de fatores influentes.
A anlise de regresso um conjunto de tcnicas estatsticas que tratam da formulao
de modelos estatsticos que especificam relaes entre variveis, e do uso desses modelos para
propsitos de inferncias, particularmente predio. Os mtodos mais usuais de anlise de
regresso, que sero abordados neste texto, tratam da situao de uma nica varivel resposta.
A palavra "regresso" foi empregada pela primeira vez no contexto aqui utilizado por
Francis Galton, na anlise da relao entre alturas de filhos e alturas mdias de seus pais. De seu
estudo, Galton concluiu que filhos de pais de estatura muito extrema (muito altos ou muito baixos)
eram geralmente de estatura mais extrema (maior e menor, respectivamente) do que a mdia, mas
no to extrema como a de seus pais. Em sua publicao de 1885, "Regresso para a mediocridade
em herana de estatura", Galton usou o termo "regresso" para significar que a altura do filho
tende para a mdia em vez de para valores mais extremos.
Desta origem, o termo "anlise de regresso" evoluiu para o contexto atual que diz
respeito anlise de dados envolvendo duas ou mais variveis com o objetivo de descobrir a
natureza de sua relao e explor-la para propsitos de predio.
O estudo de relaes entre variveis importante em muitos campos da pesquisa
cientfica, em particular da pesquisa experimental. Exemplos de relaes de interesse so dados a
seguir.
a) Produo de uma cultura e quantidades de fertilizantes aplicados ao solo, com o
objetivo de estabelecer a forma da relao ou predizer a combinao tima de fertilizantes.
b) Rendimento de uma cultura e vrias caractersticas de clima, com o objetivo de obter a
compreenso a cerca de possveis mecanismos de influncia de elementos do clima sobre o
desenvolvimento da cultura.
c) Curva de lactao de vaca leiteira e nveis de componentes da dieta alimentar, para a
compreenso da forma da tendncia da produo de leite, ou estabelecimento da forma geral da
curva de lactao com o propsito de subsequente exame dos efeitos de tratamentos sobre a curva
de lactao.
d) rea foliar e peso da folha de uma cultivar em vrios estdios de desenvolvimento da
planta, para a predio da rea foliar, uma caracterstica de difcil mensurao, atravs do peso da
folha, de fcil mensurao.
e) rea celular afetada e durao e intensidade de exposio a raios X, para
monitorizao de terapia de radiao.
8. Anlise de Regresso e Correlao Linear Simples
187
f) Taxa de descarga de um rio medida em um local particular e quantidade de precipitao
recente na correspondente bacia hidrogrfica, para a predio de enchentes.
8.1.2 Relaes entre variveis
Podem ser caracterizados trs tipos de relaes entre variveis: determinista,
semideterminista e emprica.
- Relaes deterministas
Certas relaes correspondem a leis conhecidas, expressas por funes matemticas
exatas. Bases tericas universalmente reconhecidas justificam a forma funcional. Desvios de
observaes que ocorrem para algumas dessas relaes so considerados erros experimentais sem
importncia para a maioria dos propsitos. Assim, por exemplo, se X cruzeiros so depositados em
uma conta de poupana ao juro anual de 100r%, a quantidade Y disponvel nessa conta ao
encerramento do n-simo ano relacionada a X, r e n pela equao exata:
Y = X(1+r)
n
.
Como um segundo exemplo, o tempo t para um objeto atingir a superfcie da terra quando lanado
de uma altura h relacionado com h pela lei fsica da gravitao:
t h g 2 / ,
onde g a constante gravitacional, que depende do local sobre a superfcie. A origem dessa
expresso matemtica foi a postulao por Galileu de que a altura da queda de um objeto
proporcional ao quadrado do tempo para atingir o solo. Estimativas exatas da constante
gravitacional foram ulteriormente obtidas por experimentao. Embora essa relao terica seja
aproximada, em decorrncia da variao das condies ambientais, para a maioria dos propsitos
tornam-se desnecessrias novas pesquisas experimentais. Dessa forma, esses casos so excludos
do domnio da anlise da regresso.
- Relaes semideterministas
Em algumas situaes, a forma da lei que relaciona as variveis estabelecida por uma
teoria conhecida, mas dependente de valores particulares de constantes desconhecidas
(parmetros) que aparecem em sua expresso matemtica. Aproximaes para a lei podem ser
obtidas pela substituio dos parmetros por estimativas, determinadas atravs de pesquisa
experimental. O estabelecimento da relao exata inviabilizado pela limitada preciso de
instrumentos de medida, perturbaes no controlveis das condies experimentais e outros
fatores que introduzem erros experimentais.

Exemplo 8.1. A presso (P) e o volume (V) de um gs, sob calor constante, so
relacionados pela "lei dos gases ideais":
PV
g
= constante,
onde g a taxa de calor especfico do gs particular, que deve ser estimada atravs de pesquisa
experimental.

Estatstica Bsica 188
Em alguns casos, h uma base terica que sugere uma forma plausvel para a relao, mas
a base no exata ou no aceita universalmente. Ademais, freqentemente, flutuaes adicionais
so produzidas por variveis no controlveis, no includas na relao.

Exemplo 8.2. Suponha-se que uma fbrica de compota de pssego produz latas de
compota por lotes e que o produtor deseja relacionar o custo de produo de um lote (Y) com o
tamanho do lote (X, nmero de latas no lote). Em um intervalo de variao realista de X, uma
parcela do custo (custos de instalaes e administrao, por exemplo) praticamente constante,
independentemente do tamanho do lote. Um outro componente, que inclui matria prima e o
trabalho para produzir a compota, diretamente proporcional ao nmero de latas produzidas.
Denote-se o componente fixo do custo por F e o componente varivel por c. Na ausncia de
qualquer outro fator, pode-se esperar uma relao custo - tamanho do lote determinista, expressa
por:
Y = F+cX.
Entretanto, h um terceiro componente do custo a considerar cuja magnitude de natureza no
previsvel. Por exemplo, o equipamento pode quebrar, ocasionalmente, do que pode resultar
variao de custos de reparo e tempo despendido. A ocorrncia de variao na qualidade da
matria prima tambm pode afetar o processo de produo. Dessa forma, uma relao determinista
pode ser mascarada por componentes aleatrios. Conseqentemente, uma relao adequada entre
Y e X deve ser estabelecida atravs de pesquisa experimental.
- Relaes empricas
Em contraste com as situaes anteriores, muito freqentemente a relao no
governada por uma lei conhecida. Isso o que ocorre com muitos fenmenos naturais, a que
correspondem variveis mutuamente relacionadas, ou uma varivel que dependente de um
nmero de variveis causais. Nessas situaes, a forma da relao comumente completamente
desconhecida. Aps a obteno de suficiente conhecimento emprico sobre a relao, muitas
vezes possvel a formulao de uma teoria que conduza a uma frmula matemtica correspondente
a uma relao semideterminista.

Exemplo 8.3. Suponha que desejado estudar a relao entre o rendimento de uma
cultivar de tomate (Y) e a quantidade (X) de um certo fertilizante aplicado ao solo, com as demais
condies to constantes quanto possvel. Para tal, pode ser conduzido um experimento, com a
aplicao de diversas doses do fertilizante a vrias parcelas em um intervalo de interesse.
Diferentes doses do fertilizante produziro diferentes rendimentos (o que ocorrer, tambm, com
diferentes parcelas com uma mesma dose do fertilizante), mas a relao entre rendimento e dose
no segue uma frmula matemtica exata. Nesse caso, alm das variaes aleatrias no
previsveis, tambm no h qualquer base terica conhecida para a determinao da forma da
relao.

Exemplo 8.4. O desempenho de um novo provador de vinho depende da durao do
perodo de treinamento e da natureza do programa de treinamento. A relao entre habilidade para
degustao e durao do treinamento no determinista, pelo simples fato de que dois seres
humanos no so exatamente idnticos. Assim, para a avaliao da eficcia de um programa de
treinamento, deve-se conduzir uma pesquisa experimental da relao entre habilidade de
8. Anlise de Regresso e Correlao Linear Simples
189
degustao Y e durao do treinamento X. Ademais, a prpria anlise dos dados referentes a essas
duas variveis pode auxiliar na pesquisa da natureza da relao e em seu uso na avaliao e
planejamento de um programa de treinamento.

Esses poucos exemplos ilustram o mbito de aplicao da anlise da regresso no
contexto mais simples do estudo da relao de uma varivel de interesse com uma nica outra
varivel. Em situaes mais complexas, uma varivel de interesse pode depender de vrias
variveis causais, ou vrias variveis podem inter-relacionar-se. Por exemplo, o rendimento de
tomate pode ser estudado em relao dosagem de um fertilizante e ao espaamento entre plantas.
A utilidade da anlise de regresso estende-se a essas situaes multivariadas. Ela fornece os
mtodos para a construo de modelos para as relaes de interesse, estimao de parmetros de
interesse, determinao de variveis de importncia e de variveis redundantes, e o emprego dos
modelos para propsitos de predio e controle.
8.1.3 Relaes lineares
Na anlise de regresso, postula-se, para a populao, que a relao entre uma varivel de
interesse Y e um conjunto de outras k variveis {X
1
,X
2
,...,X
k
} representada, , por um membro
particular (desconhecido) de uma famlia de equaes que exprimem Y como uma funo de X
1
,
X
2
,...,X
k
e um conjunto de constantes {a
1
,a
2
,...,a
p
}:
Y = f(X
1
,X
2
,...,X
k
; a
1
,a
2
,...,a
p
),
onde Y denominada varivel dependente, ou varivel resposta, X
1
,X
2
,...,X
k
so denominadas
variveis independentes, ou variveis explanatrias, ou variveis preditoras, e a
1
,a
2
,...,a
p
so
constantes desconhecidas, denominadas parmetros.
Cada membro dessa famlia de equaes especificado pela fixao de valores
particulares para o conjunto de constantes {a
1
,a
2
,...,a
p
}. Entretanto, a determinao do membro
especfico desta famlia de equaes que corresponde a uma populao de interesse , em geral,
inviabilizada pelo desconhecimento dos valores particulares dessas constantes apropriados para a
populao. O propsito da inferncia estatstica em anlise de regresso a obteno de uma
aproximao e de outras informaes referentes aos parmetros e, conseqentemente, sobre a
equao particular para a populao. Essa equao particular (desconhecida) para a populao
pode ser adequadamente expressa por:
E(Y) = f(X
1
,X
2
,...,X
k
; a
1
,a
2
,...,a
p
),
onde E(Y) indica valor esperado (ou valor populacional) da varivel Y.
O processo de inferncia estatstica se baseia em um conjunto de n observaes
{x
1j
,x
2j
,...,x
kj
, y
j
:j=1,2,...,n} das k+1 variveis X
1
,X
2
,...,X
k
e Y, providas por uma amostra de n
indivduos ou unidades (amostra de tamanho n) da populao de interesse. Um modelo de
regresso especificado com o estabelecimento da equao que exprime a relao de cada valor
observado da varivel dependente Y com os correspondentes valores das variveis independentes,
e das pressuposies referentes aos termos e smbolos da equao.
Um modelo de regresso denominado um modelo linear se sua equao um caso
particular da seguinte forma geral:
Y = a
0
+ a
1
X
1
+ a
2
X
2
+...+ a
k
X
k
.
Um caso particular dessa forma geral a equao do modelo de regresso polinomial:
Estatstica Bsica 190
Y = a
0
+ a
1
X + a
2
X
2
+...+ a
k
X
k
,
em que: X
1
=X, X
2
=X
2
,..., X
k
=X
k
. Esta equao exprime a relao de uma varivel resposta Y com
uma nica varivel explanatria X, representada por uma curva polinomial de grau k em um plano
(espao de duas dimenses).
Um caso ainda mais particular desse modelo linear o modelo de regresso linear
simples, que corresponde relao de uma varivel resposta Y com uma nica varivel
explanatria X representada por uma linha reta, cuja equao :
Y = a + bX.
8.2 Relaes de Duas Variveis
De modo geral, os modelos de relaes de duas variveis podem ser classificados em trs
categorias:
- Modelo linear, com equao da forma: Y = aX + b.
- Modelo linear por anamorfose: Modelo de equao no linear que pode tornar-se
linear atravs de uma transformao de variveis. Por exemplo, a equao Y = ab
x
pode ser
transformada, atravs de uma transformao logartmica, em
Z = A + BX,
onde: Z = log Y, A = log a e B = log b.
Outros exemplos de funes lineares por anamorfose so apresentados na Figura 8.1.
- Modelo no linear: Modelo no linear cuja equao pode ser tornada linear. Por
exemplo, o modelo de Mitscherlich, com a seguinte equao exponencial:
Y = A[1-10
-c(X+b)
].
Embora na maioria das situaes de interesse prtico a relao de duas variveis seja no
linear, a relao linear importante por duas razes:
a) Em um modelo linear por anamorfose, uma transformao da equao no linear que
relaciona as variveis conduz a uma relao linear. Esse o caso de algumas relaes
representadas por equaes multiplicativas ou exponenciais que podem ser linearizadas por
transformaes logartmicas, como exemplificado na Figura 8.1.

8. Anlise de Regresso e Correlao Linear Simples
191




Figura 8.1. Vrias formas de funes de equaes no lineares e suas
transformadas logartmicas lineares, mostrando como logaritmos
podem converter curvas no lineares em linhas retas.

b) A linha reta pode ser uma boa aproximao para um segmento de uma curva no linear
em um intervalo limitado da varivel independente.

8.3 Grfico dos Dados
No estudo da relao de duas variveis Y e X os dados so n pares de valores observados
dessas duas variveis: (x
1
,y
1
), (x
2
,y
2
), ...,(x
n
,y
n
), que podem ser arranjados na forma da Tabela 8.1.

Estatstica Bsica 192
Tabela 8.1. Forma dos dados em um estudo de relao de duas variveis.

Observao: 1 2 ... n
X: x
1
x
2
... x
n

Y: y
1
y
2
... y
n


O primeiro passo no estudo da relao de duas variveis a representao grfica dos
dados atravs de um diagrama de disperso de pontos. A inspeo desse diagrama pode permitir
uma caracterizao da relao entre as variveis quanto sua existncia e forma; indica se os
pontos se aglomeram em torno de alguma curva geomtrica particular, como uma linha reta, por
exemplo; e fornece uma apreciao visual da extenso da variao em torno de tal linha ou curva.
O diagrama de disperso particularmente importante quando, como ocorre em muitas situaes,
no h uma relao terica conhecida a priori. Em tais situaes, ele til na pesquisa de um
modelo apropriado para exprimir a relao.

Exemplo 8.5. Para uma ilustrao concreta, considere-se que os dados da Tabela 8.2 so
as observaes em 10 parcelas de um experimento de fertilizao do solo com nitrognio para a
cultura do tomate, onde doses de nitrognio e produo so expressos em unidades de medida
convenientes.

Tabela 8.2. Dose de nitrognio e produo de tomate em 10 parcelas de
um experimento.

Dose (X): 1 1 2 3 4 4 5 6 6 7
Produo (Y): 2,1 2,5 3,1 3,0 3,8 3,2 4,3 3,9 4,4 4,8

O diagrama de disperso para essas observaes apresentado na Figura 8.2. Este
diagrama mostra que os pontos parecem se aglomerar em torno de uma linha reta, o que revela que
a relao particular de natureza aproximadamente linear.

8. Anlise de Regresso e Correlao Linear Simples
193


Figura 8.2. Diagrama de pontos para os dados da Tabela 8.2.

O Exemplo 8.5 ilustra a relao mais simples entre duas variveis, representada pela
linha reta.
8.4 Anlise de Regresso Linear Simples
8.4.1 Introduo
Recorde-se que, se a relao entre uma varivel dependente Y e uma varivel
independente X corresponde exatamente a uma linha reta, ento ela expressa algebricamente pela
equao:
Y = a + bX,
representada na Figura 8.3, onde a a ordenada da interseo da reta com o eixo Y, denominada
ordenada na origem, ou interseo, ou coeficiente linear da reta, e b a tangente trigonomtrica
do ngulo que a reta forma com o eixo X, denominada declividade, ou coeficiente angular da
reta. O coeficiente angular b corresponde alterao na grandeza de Y por uma unidade de
alterao no valor de X. Assim, a linha reta a curva com a propriedade particular importante de
taxa de alterao constante, isto , acrscimos de Y para intervalos de X de mesma amplitude so
iguais.

Estatstica Bsica 194


Figura 8.3. Representao grfica da linha reta.

8.4.2 Modelo estatstico
Em situaes no deterministas, relaes lineares so mascaradas por variaes aleatrias
ou erros experimentais, de modo que, em um diagrama de disperso, os pontos correspondentes a
uma srie de observaes no se situam exatamente sobre uma reta.
A anlise de regresso linear simples corresponde ao estudo da relao entre duas
variveis Y e X da forma E(Y) = a+bX, em que a varivel explanatria X controlada pelo
experimentador, ou no sujeita a erro, a varivel resposta Y sujeita a fontes de erro no
controlveis, e a e b so constantes desconhecidas (parmetros).
A questo estatstica fundamental em anlise de regresso a derivao de inferncias
referentes aos parmetros a e b. Como qualquer processo de inferncia estatstica, inicia-se pela
obteno de uma amostra de observaes - pares de valores de X e Y - da populao de interesse.
Seja {(x
1
,y
1
), (x
2
,y
2
),..., (x
n
,y
n
)} um conjunto de n observaes referentes s variveis X e
Y, obtidas de uma amostra de tamanho n (ou seja, de n unidades) de uma populao. A anlise de
regresso linear simples pressupe que a relao entre a varivel resposta Y e a varivel
explanatria X para a j-sima observao expressa pela seguinte equao:
y
j
= a + bx
j
+ e
j
, j=1,2,...,n,
onde x
j
e y
j
so os valores das variveis X e Y referentes observao j, a e b so constantes
especficas para a populao em considerao, e e
j
o desvio entre o valor observado e o valor
esperado da varivel resposta (correspondente verdadeira relao linear postulada para a
populao): e
j
= y
j
- E(y
j
).
O modelo estatstico para regresso linear simples completa-se com as seguintes
pressuposies referentes aos termos e smbolos da equao:
a) A varivel X medida sem erro, ou seja, {x
1
,x
2
,...,x
n
} um conjunto de valores
selecionados pelo pesquisador para o estudo, no sujeitos a erro, logo, um conjunto de constantes
conhecidas.
b) Os coeficientes a e b, que determinam a linha reta, so constantes desconhecidas, isto
, parmetros.
8. Anlise de Regresso e Correlao Linear Simples
195
c) e
1
, e
2
,...,e
n
so realizaes de n variveis aleatrias com mdia zero: E(e
j
)=0, que
satisfazem s seguintes pressuposies:
c
1
) Homogeneidade de varincia: Var(e
j
) =
Y X :
2
(constante, comum para todas as
observaes).
c
2
) Distribuio normal.
c
3
) Independncia estatstica.
De acordo com esse modelo, o valor y
j
da varivel resposta, observado para o nvel x
j
da
varivel explanatria, uma realizao de uma varivel aleatria com distribuio normal de
mdia E(Y) = a+bX e varincia Var(Y) =
Y X :
2
. Isto significa que a observao do valor sobre a
verdadeira linha de regresso impedida pelo desvio (erro) aleatrio. Essa estrutura de erro
ilustrada na Figura 8.4, que mostra que a distribuio de Y para cada nvel de X tem mdia sobre
a verdadeira linha reta desconhecida a+bX e varincia comum
Y X :
2
, tambm desconhecida. Um
importante propsito da anlise de regresso estimar essa reta e essa varincia.




Figura 8.4. Distribuio normal de Y com mdias sobre a linha reta
E(Y) = a+bX.

Exemplo 8.6. Para a ilustrao que segue utilizar-se- os dados da Tabela 8.3,
provenientes do registro de informaes anuais de quantidade de frango comercializado e
correspondente preo, nos Estados Unidos, no perodo de 1950 a 1959.

Tabela 8.3. Dados anuais de quantidade de frango comercializado (em
milhes, X) e correspondente preo (em US$ por 50 kg, Y),
nos Estados Unidos, no perodo de 1950 a 1959.

j 1 2 3 4 5 6 7 8 9 10
x
j
73 79 80 69 66 75 78 74 74 84
y
j
18,0 20,0 17,8 21,4 21,6 15,0 14,4 17,8 19,6 14,1

Estatstica Bsica 196
A "lei da oferta e da procura" em Economia estabelece que o valor da produo varia
inversamente com a quantidade produzida, ou seja, o aumento da produo implica em diminuio
do valor do produto. Dessa forma, segundo esta lei, h uma relao linear negativa entre valor da
produo e quantidade do produto ofertada. Entretanto, essa relao afetada por outras
circunstncias do mercado, tal como oferta de outros produtos substitutivos, de modo que pode ser
interessante a verificao de sua ocorrncia em uma situao prtica.
A relao entre preo e quantidade de frango produzido revelada pelos dados do exemplo
mostrada no diagrama de pontos da Figura 8.5.



Figura 8.5. Diagrama de pontos que mostra a relao entre preo do
frango (Y) e nmero de frangos comercializados anualmente
(X) nos Estados Unidos (1950-1959).

8.4.3 Inferncia estatstica
Em regresso linear simples, como, em geral, em qualquer aplicao da estatstica,
interessam as seguintes inferncias a respeito dos parmetros do modelo estatstico:
Estimao por ponto,
Estimao por intervalo - Intervalo de confiana,
Teste de hiptese.
8.4.4 Estimao (por ponto) dos parmetros
Os parmetros a e b da equao do modelo estatstico podem ser estimados pelo mtodo
dos quadrados mnimos, que determina para estimadores dos parmetros os valores de a e b que
minimizam a soma de quadrados dos erros (como funo de a e b), isto :
f(a,b) = e
j
j
n
2
1

8. Anlise de Regresso e Correlao Linear Simples
197
= ( ) y a bx
ij
j
n
j

1
2
.
O processo de minimizao dessa soma de quadrados dos erros conduz ao seguinte sistema de
duas equaes com as duas incgnitas a e b:
n n
j j
j 1 j 1
n n n
2
j j j j
j 1 j 1 j 1
!
!
na x b y
!
!
x a x b x y
( )
( ) ( )




cuja soluo ( ,

a b) corresponde aos estimadores dos parmetros a e b:
SPXY
!
b
SQX

e


a y bx ,
onde:
SPXY

( )( ) ( )( ) x x y y x y x y
j j j j j j
j
n
j
n
j
n
j
n
n
1
1 1 1 1

e
SQX


( ) ( ) x x x x
j j j
j
n
j
n
j
n
n
2 2
2
1
1 1
1
.
Equao da linha reta ajustada
A substituio dos parmetros na equao do modelo de regresso pelas correspondentes
estimativas fornece a equao da linha reta ajustada (tambm denominada equao ajustada,
equao predita ou equao de quadrados mnimos):


y a bx + .
Uma outra forma da equao de quadrados mnimos pode ser obtida pela substituio da
expresso do estimador do parmetro a nesta equao:


( ) y y b x x + .
O valor y
0
para um valor particular x
0
da varivel explanatria X estima o correspondente
ponto sobre a reta (desconhecida) para a populao: E(Y: X=x
0
) = a+bx
0
, isto , estima a mdia de
Y para a populao que corresponde a um dado valor x
0
de X.
Em particular, pode-se determinar os valores preditos (ou ajustados) da varivel resposta
Y correspondentes aos valores experimentais ou observados da varivel explanatria: x
j
,
j=1,2,...,n. Esses valores preditos so as projees sobre a reta de quadrados mnimos, ortogonais
ao eixo X, dos pontos no plano que correspondem aos pares de valores observados (x
j
, y
j
),
j=1,2,...,n.
Estatstica Bsica 198
Resduos e estimativa da varincia do erro
Os valores ajustados, em geral, diferem dos valores observados. A diferena entre um
valor observado da varivel resposta e seu correspondente valor ajustado uma estimativa do
desvio da regresso para a correspondente observao, denominada resduo da observao:
e y y
j j j
, j=1,2,...,n.
Uma estimativa da varincia comum dos desvios da regresso fornecida pela soma dos
quadrados dos resduos dividida pelo correspondente nmero de graus de liberdade, n-2 (onde 2
o nmero de parmetros estimados do modelo):
n
2 2
Y:X j j
j 1
1
!
s (y y )
n 2


.
Essa estimativa da varincia dos desvios da regresso pode ser mais convenientemente obtida
atravs do procedimento da anlise da variao (que se ver adiante), usualmente utilizado para
efetuar testes de hipteses de interesse.
Propriedades dos estimadores de quadrados mnimos
Os estimadores de quadrados mnimos tm as seguintes propriedades:
1) A soma dos resduos nula:
( ) e y y
j
j
n
j j
j
n


1 1
0.
2) A soma dos quadrados dos resduos mnima, ou seja, a soma dos quadrados das
distncias entre os valores observados (x
j
,y
j
), j=1,2,...n, e suas correspondentes projees sobre um
plano no espao de trs dimenses, ortogonais ao plano X
1
X
2
, mnima quando esse plano o
plano de quadrados mnimos.

Exemplo 8.6 (continuao). Para os dados do Exemplo 8.6, as estimativas dos
parmetros a e b podem ser obtidas com o auxlio da Tabela 8.4.
Tabela 8.4
8. Anlise de Regresso e Correlao Linear Simples
199
Tabela 8.4. Dados e clculos para a determinao das somas de quadrados e
somas de produtos.

j x
j
y
j

x x
j
y y
j

( ) x x
j

2
( ) y y
j

2

j j
(x x)(y y)
1 73 18,0 -2,2 0,03 4,84 0,0009 -0,066
2 79 20,0 3,8 2,03 14,44 4,1209 7,714
3 80 17,8 4,8 -0,17 23,04 0,0289 -0,816
4 69 21,4 -6,2 3,43 38,44 11,7649 -21,266
5 66 21,6 -9,2 3,63 84,64 13,1769 -33,396
6 75 15,0 -0,2 -2,97 0,04 8,8209 0,594
7 78 14,4 2,8 -3,57 7,84 12,7449 -9,996
8 74 17,8 -1,2 -0,17 1,44 0,0289 0,204
9 74 19,6 -1,2 1,63 1,44 2,6569 -1,956
10 84 14,1 8,8 -3,87 77,44 14,9769 -34,056
Soma 752 179,7 0 0 253,60 68,321 -93,040
Mdia 75,2 17,97

Obtm-se:
93, 04
!
b
253, 60

= -0,367
e
a = 17,97-(-0,367)75,2 = 45,57.
A equao de regresso ajustada , ento:
y = 45,57-0,367x.
Essa equao fornece o valor estimado (ou predito) do preo de frango para uma produo anual
particular. Por exemplo, o preo de frango (em US$/50 kg) estimado para uma produo anual de
73 milhes de frangos :
y
X73
= 45,57-0,367(73) = 18,779.
Esse valor ajustado difere do correspondente valor observado (18,0). O resduo para essa
observao :
e
1
= 18,0-18,78 = -0,78.
A Tabela 8.5 apresenta os resduos para as 10 observaes da amostra e correspondentes
valores de outras estatsticas de que se tratar adiante.

Estatstica Bsica 200
Tabela 8.5. Produo anual de frangos (em milhes, X) e correspondente
preo (em US$/50 kg, Y), nos Estados Unidos, no perodo
1950-59, correspondentes valores ajustados e resduos da
regresso de Y em relao a X, e desvios padres e intervalos
de confiana para os valores ajustados.

j x
j
y
j

y
j
e
j
s
y
j


EI
j
ES
j

1 73 18,0 18,78 -0,78 0,713 17,14 20,42
2 79 20,0 16,58 3,42 0,819 17,69 18,47
3 80 17,8 16,21 1,59 0,903 14,13 18,29
4 69 21,4 20,24 1,16 1,036 17,85 22,63
5 66 21,6 21,35 0,25 1,361 18,21 24,49
6 75 15,0 18,04 -3,04 0,654 16,53 19,55
7 78 14,4 16,94 -2,54 0,748 15,22 18,67
8 74 17,8 18,41 -0,61 0,672 16,86 19,96
9 74 19,6 18,41 1,19 0,672 16,86 19,96
10 84 14,1 14,74 -0,64 1,316 11,71 17,78
Soma 752 179,7 179,70 0

A Figura 8.6 mostra a representao grfica da reta de quadrados mnimos e dos resduos
correspondentes aos valores observados.



Figura 8.6. Representao grfica da reta de quadrados mnimos
ajustada para representar a relao entre preo de frango
comercializado e quantidade de frango produzido, e dos
resduos da regresso.

A estimativa da varincia do desvio da regresso , ento,
8. Anlise de Regresso e Correlao Linear Simples
201
[ ]
2
Y:X
1 1
s = 34,132 = 4,2665 (-0,78)2+3,422+...+(-0,64)2
8 8
.
8.4.5 Teste de hiptese
8.4.5.1 Hiptese de relao linear entre Y e X
Uma hiptese fundamental na anlise de regresso linear simples diz respeito
linearidade da forma da relao entre a varivel resposta e a varivel explanatria. A hiptese
estatstica correspondente especificada como segue:
H b
H b
A
0
0
0
:
:


Um critrio para o teste dessa hiptese provido pela seguinte estatstica:
!
b
T
s
!
b
,
onde s
b

a estimativa do desvio padro da estimativa do coeficiente de regresso b, isto , a raiz


quadrada da estimativa da varincia da estimativa de b:
2 2
! Y:X
b
1
s s
SQX
.
Sob a hiptese de nulidade (H
0
:b=0), esta estatstica tem distribuio t (de Student) com os graus
de liberdade da estimativa da varincia do erro, ou seja, n-2. Ento, em um teste de hiptese com
probabilidade de erro tipo I =0,05, a hiptese de nulidade H
0
: b=0 rejeitada se o valor da
estatstica T observado para a amostra particular situar-se em uma das duas caudas da distribuio
de t cada uma com rea igual a /2=0,025: na cauda superior acima do valor t

e na cauda inferior
abaixo do valor #t

.

Exemplo 8.6 (continuao). Para o Exemplo 8.6, tem-se

b = -0,367 e:
4, 267
2
s
!
253, 6 b
= 0,01684;
donde:
s
b

, 0 01684 = 0,12976 .
Ento, a hiptese H
0
: b=0 rejeitada se o valor observado da estatstica:
| 0, 367|
t
0,12976

= 2,8283,
superar o ponto percentual bilateral superior da distribuio t (Tabela IV) para 8 graus de liberdade
da estimativa da varincia do resduo, ou seja:
t
P
P
P 8
2 306 0 05
3 355 0 01
;
, , ,
, , ,


Estatstica Bsica 202
Como esse valor observado t=2,8283 est compreendido entre estes dois valores da tabela, rejeita-
se a hiptese de nulidade, concluindo-se que h uma relao linear significativa (P<0,05) entre o
preo do frango comercializado e a quantidade de frango produzido.
8.4.5.2 Hiptese referente declividade da linha de regresso
Em algumas circunstncias, h interesse em testar a hiptese de que a linha de regresso
tem uma dada declividade, com base em alguma condio ou conjetura; ou seja, em testar a
seguinte hiptese referente declividade da linha reta:
0 0
A 0
H : b b
H : b b


onde b
0
a declividade conjeturada.
Um critrio para o teste dessa hiptese provido pela seguinte estatstica T:
0
!
b b
T
s
!
b

.
Sob a hiptese de nulidade (H
0
: b=b
0
), esta estatstica tem distribuio t (de Student) com n-2
graus de liberdade.
8.4.5.3 Anlise da variao
O desvio total de uma observao particular em relao mdia de todas as observaes
pode ser decomposto em dois desvios, conforme ilustrado na Figura 8.7:
y y y y y y
j j j j
+ ( ) ( ) ,
onde:
y y
j
: desvio atribuvel regresso, isto , grandeza do coeficiente de regresso b;
y y
j j
: desvio devido ao afastamento do valor observado de Y em relao linha de
regresso ajustada, ou seja, o resduo.

8. Anlise de Regresso e Correlao Linear Simples
203


Figura 8.7. Decomposio do desvio total de uma observao no desvio
atribuvel regresso e no resduo.

Elevando ao quadrado ambos os membros da igualdade, obtm-se:
( ) ( ) ( ) ( )( ) y y y y y y y y y y
j j j j j j j
+ +
2 2 2
2
e, somando para todas as n observaes:
( ) ( ) ( ) y y y y y y
j
j
n
j
j
n
j j
j
n
+


2
1
2
1
2
1
,
dado que a soma dos produtos dos dois desvios nula.
Assim, a variao total de Y, expressa pela soma dos quadrados (dos desvios) de Y,
denotada por SQY, decomposta em dois componentes:
( ) y y
j
j
n

1
2
: variao atribuvel regresso - soma de quadrados da regresso:
SQRegresso, e
( ) y y
j j
j
n

2
1
: variao atribuvel ao desvio da regresso - soma de quadrados do desvio
ou resduo: SQDesvio ou SQResduo.
Demonstra-se que:
SQRegresso =

b
2
SQX =
=

bSPXY,
onde as expresses de SQX e SPXY foram dadas anteriormente. De fato, da equao que exprime
o valor ajustado para a j-sima observao:


( ) y y b x x
j j
+
obtm-se a seguinte expresso:


( ) y y b x x
j j

Estatstica Bsica 204
que, elevada ao quadrado e somada para todas as n observaes, produz:
( )

( ) y y b x x
j j
j
n
j
n



2 2 2
1 1
=
=

b SQX
2
.
Correspondentemente decomposio da variao total, os n-1 graus de liberdade para o
total das n observaes tambm so decompostos em 1 grau de liberdade correspondente
estimativa do coeficiente de regresso e n-2 graus de liberdade correspondentes ao resduo.
Essa decomposio da variao da varivel resposta Y usualmente efetuada com o
auxlio da seguinte "tabela da anlise da variao":

Fonte de variao GL SQ QM
Regresso 1 SQRegresso QMRegresso
Desvio n-2 SQDesvio QMDesvio
Total n-1 SQY

onde:
SQDesvio = SQY-SQRegresso,
QMRegresso = SQRegresso,
QMDesvio = SQDesvio/(n-2).
Demonstra-se que o QMDesvio = s
Y X :
2
um estimador no tendencioso da varincia do
desvio da regresso
Y X :
2
, isto , que:
E(QMDesvio) =
Y X :
2

e que:
E(QMRegresso) =
Y X j
j
n
b x x
:
( )
2 2
1
2
+

.
Por outro lado, ambos os quadrados mdios QMDesvio e QMRegresso so estatisticamente
independentes. Logo, a estatstica F=QMRegresso/QMDesvio tem distribuio F com 1 e n-2
graus de liberdade correspondentes QMR e QMD, respectivamente. Dessa forma, a estatstica:
QMRegresso
F
QMDesvio

um critrio para o teste da hiptese de linearidade da relao entre Y e X:
H b
H b
A
0
0
0
:
:


Essa estatstica F um critrio equivalente estatstica t para o teste desta mesma hiptese. De
fato, demonstra-se que F = T
2
.

Exemplo 8.6 (continuao). Para os dados do Exemplo 8.6, tem-se:
SQRegresso = (-0,367)(-93,04) = 34,16 ;
8. Anlise de Regresso e Correlao Linear Simples
205
SQTotal = 68,32 ;
SQResduo = SQTotal - SQRegresso
= 68,32 - 34,16 = 34,16
A anlise da variao completada na seguinte tabela:
Tabela da anlise da variao:

Fonte de variao GL SQ QM F F(0,05) F(0,01)
Regresso 1 34,16 34,16 8,00 5,32 11,26
Resduo 8 34,16 4,27
Total 9 68,32

Se o nvel de significncia (erro tipo I) escolhido para o teste foi =0,05, dado que
F>F(0,05), rejeita-se a hiptese H
0
. Conclui-se que h uma relao linear significativa (P<0,05),
no caso negativa, entre a varivel Y (preo de frango) e a varivel X (quantidade de frango
comercializado), isto , que o preo de frango decresce significativamente com o aumento da
quantidade de frango produzido.
Essa concluso a mesma obtida anteriormente pelo teste t. De fato, pode-se verificar
que:
2
8
T = F
1;8
.
8.4.6 Coeficiente de determinao
O coeficiente de determinao definido como:
2
SQRegresso
r
SQTotal
,
isto , a proporo da variao total da varivel resposta Y que levada em conta pelo ajuste do
modelo de regresso linear simples, isto , que explicada pela variao da varivel independente
X atravs da relao linear.
Segundo sua expresso de definio, o coeficiente de determinao uma grandeza com
o seguinte intervalo de variao:
0 r
2
1,
j que a SQRegresso e a SQTotal so ambas, por definio, no negativas e, necessariamente,
SQRegresso SQTotal.
O coeficiente de determinao uma medida da qualidade do ajuste da equao de
regresso linear simples. Nas situaes extremas, tem-se:
- Ajuste perfeito SQRegresso = SQTotal r
2
=1,
- Ajuste extremamente mau SQRegresso = 0 r
2
=0.

Exemplo 8.6 (continuao). Tem-se, para o Exemplo 8.6, SQRegresso = 34,16 e
SQTotal = 68,32. Logo,
Estatstica Bsica 206
r
2
=
34,16
68, 32
= 0,50.
Assim, 50% da variao total do preo do frango explicada pela variao da quantidade de
frango produzido, atravs da relao linear.

8.4.7 Intervalo de confiana
8.4.7.1 Intervalo de confiana para o coeficiente de regresso b
Um intervalo de confiana para o coeficiente de regresso linear b com coeficiente de
confiana 1- o intervalo com extremos inferior (EI) e superior (IS) aleatrios que satisfaz a
seguinte condio de probabilidade:
Prob[EI < b < ES] = 1-.
Uma expresso para esse intervalo de confiana, ou seja, para os extremos EI e ES desse
intervalo, pode ser derivada do fato de que a estatstica:
!
b
!
b b
T
s

,
tem distribuio T (de Student) com graus de liberdade da estimativa
!
b
s do desvio padro de
!
b .
Ento, a probabilidade de que a estatstica T se situe no intervalo (-t
;
, t
;
) igual a 1-, onde t
;

o ponto superior da distribuio t que limita a cauda direita de rea /2; ou seja:
!
b
!
b b
- t t Prob 1
s
; ;
, ]

< < , ]
, ]
]
.
A relao expressa pela dupla desigualdade:
- t
;
<
!
b
!
b b
s

< t
;.
no se altera se seus trs membros so multiplicados por
!
b
s , obtendo-se:
! !
b b
!
t s b b t s
, ,
< < ;
ento, isolando o parmetro b no membro interno da dupla desigualdade, tem-se:
! !
b b
! !
b t s b b t s
, ,
< < + ,
e, multiplicando esta dupla desigualdade por #1, vem:
! !
b b
! !
b t s b b t s
, ,
< < + .
Portanto, a sentena de probabilidade anterior pode ser posta sob a forma:
! !
b b
! !
Prob 1 b t s b b t s
, ,
, ]
< < +
]
.
8. Anlise de Regresso e Correlao Linear Simples
207
Essa uma sentena de probabilidade porque o intervalo (
!
b
!
b t s
,
,
!
b
!
b t s
,
+ )
aleatrio, j que seus extremos so funes de
!
b e
!
b
s que so estatsticas, ou seja, funes das
observaes de qualquer amostra aleatria que possa ser derivada da populao sob considerao.
Essa sentena de probabilidade vlida a priori, ou seja, antes da obteno da amostra e
correspondente determinao das estimativas

b e s
b
particulares para essa amostra. Aps a
obteno de uma amostra particular, ela no tem mais sentido, pois, ento, os extremos no so
mais variveis aleatrias, mas realizaes particulares dessas variveis aleatrias, ou seja,
constantes conhecidas.
Nessas circunstncias, diz-se que o intervalo (EI=
!
b
!
b t s
,
, ES-=
!
b
!
b t s
,
+ ) determinado a
partir de uma amostra particular um intervalo de confiana para o coeficiente de regresso
linear b com coeficiente de confiana 1- , o que pode ser denotado por:
IC b (1-):
! ;
b
! ;
b
!
EI b t s
!
ES b t s


onde t
;
o valor obtido da tabela de pontos percentuais superiores bilaterais da distribuio t
(Tabela IV) para graus de liberdade da estimativa da varincia do desvio da regresso s
Y X :
2
e
probabilidade .
De fato, a sentena de probabilidade Prob(EI<b<ES)=1- significa o seguinte: Se fossem
extradas todas as amostras aleatrias possveis da populao e para cada uma dessas amostras se
determinasse um intervalo de confiana para o parmetro b com coeficiente de confiana 1-,
ento a proporo 1- do total dos intervalos de confiana determinados conteria o parmetro
desconhecido b. Posto de modo mais prtico: se fossem determinados os intervalos de confiana
para b com coeficientes de confiana de 95% para cada um conjunto particular de, por exemplo,
100 amostras aleatrias da populao, ento, o (valor real do) parmetro estaria contido em
aproximadamente 95% dos intervalos determinados.
Como usualmente desejado coeficiente de confiana elevado, escolhe-se para a
probabilidade um valor convenientemente pequeno, muito freqentemente:
= 0,05 coeficiente de confiana = 0,95 (95%),
= 0,01 coeficiente de confiana = 0,99 (99%).
Observe-se, entretanto, que a amplitude do intervalo de confiana, ou seja:
ES # EI =
!
b
!
b t s
,
+ (
!
b
!
b t s
,
) =
!
b
2t s
,
,
ser to maior quanto menor for a probabilidade e, portanto, quanto maior for o coeficiente de
confiana 1-. Dessa forma, a fixao de um coeficiente de confiana exageradamente grande
implicaria em conseqente intervalo de confiana de amplitude tambm exageradamente grande,
que prover informao demasiadamente vaga sobre a localizao do parmetro b.

Exemplo 8.6 (continuao). Intervalo de confiana para o parmetro b com coeficiente
de confiana de 95% para a situao do Exemplo 8.6.
Estatstica Bsica 208
Tem-se:

b=-0,367; s
b

=0,12976; t
8;0,05
= 2,306. Logo:
EI = -0,367 - 2,306x0,12976 = -0,6662;
ES = -0,367 + 2,306x0,12976 = -0,0678.
Assim, um intervalo de confiana para o coeficiente de regresso linear b com coeficiente de
confiana 0,95 : (-0,6662; -0,0678).
8.4.7.2 Intervalo de confiana para E(Y|X)
Um intervalo de confiana para a ordenada de um ponto sobre a reta postulada para
a populao, para um valor particular x
0
de X, isto , um intervalo de confiana para E(Y|X=x
0
),
com coeficiente de confiana 1- um intervalo com extremos inferior EI e superior IS
aleatrios que satisfaz a condio de probabilidade:
Prob(EI < E(Y|X=x
0
) < ES) = 1-,
onde os extremos tm as seguintes expresses:
0
; ! y:x
!
EI y t s

e
0
; ! y:x
!
ES y t s

+ , e =n-2 e s
y x :
0

a estimativa do desvio padro do valor ajustado y para um valor particular x
0
, ou seja, a raiz
quadrada da varincia do valor ajustado y
x
0
:
0
2
2 2
0
! Y:X y:x
(x x) 1
s s
n SQX
, ]

+
, ]
, ]
]
.
Esse intervalo de confiana pode ser denotado por:
IC E(Y|X=x
0
) (1-):
EI y t s
ES y t s
y x
y x

+

;
;
:
:


0
0


Exemplo 8.6 (continuao). Intervalo de confiana para o ponto sobre a reta de
regresso E(Y) = a + bX para o valor de X correspondente primeira observao, ou seja, X=73.
Para X=73, obtm-se:
2
2
! y:X 73
1 (73 75, 2)
s 4, 27 0, 5085
10 253, 60

, ]

+
, ]
, ]
]
;
donde:
! y:X 73
s 0, 5085

= 0,7131.
Ento, u intervalo de confiana para E(Y|X=73) com coeficiente de confiana de 95% obtido
como segue:
EI = 18,78-(2,306)(0,7131) = 17,14 ,
ES = 18,78+(2,306)(0,7131) = 20,42 .
Logo:
IC E(Y|X=73) (95%): (17,14; 20,42).
8. Anlise de Regresso e Correlao Linear Simples
209
8.5 Correlao Linear Simples
O coeficiente de correlao linear simples de duas variveis aleatrias Y e X exprime o
grau de associao linear entre essas variveis. Ele denotado pela letra grega e expresso por:

Cov X Y
Var X Var Y
( , )
( ) ( )
.
O coeficiente de correlao linear simples estimado pela estatstica:
n
j j
j 1
n n
2 2
j j
j 1 j 1
(x x)(y y)
SPXY
r
SQX SQY
(x x) (y y)





.

Exemplo 8.6 (continuao). Retorne-se aos dados do Exemplo 8.6, referentes
quantidade anual de frangos comercializados e correspondentes preos no perodo de 1950 a 1959.
A questo bsica de interesse a seguinte: os dados confirmam a associao linear negativa
esperada entre preo e oferta nesse perodo (ou seja, maiores produes so acompanhadas de
preos mais baixos)? Esse fato aparentemente evidenciado pelo diagrama de pontos da Figura
8.5 que revela a tendncia geral dos pontos esquerda situarem-se em posio mais elevada do
que os pontos direita. Entretanto, para quem esperasse uma associao bastante elevada entre
preo e oferta, a disperso dos pontos mostrada nessa figura pode ser desapontadora. Os pontos
parecem situar-se dentro de uma elipse, o que tpico de diagramas que correspondem
associao linear de grau mdio.
Utilizando resultados anteriores, obtm-se a estimativa do coeficiente de correlao
linear:
93, 04
r - 0, 7068
(253, 60)(68, 32)

.
A Figura 8.8 ilustra diagramas de disperso de pontos correspondentes a associaes de
vrios graus. Em uma associao perfeita os pontos situam-se exatamente sobre uma reta no
paralela ao eixo X. Nesse caso, a associao positiva se a declividade da reta (em relao ao eixo
horizontal X) positiva, e negativa se a declividade negativa. Na situao usual em que os
pontos no se situam todos sobre uma reta, o sinal da associao corresponde ao sinal da
declividade do eixo maior da elipse que contorna os pontos. A associao nula corresponde
situao em que a elipse reduz-se a um crculo.

Estatstica Bsica 210



Figura 8.8. Diagramas de pontos correspondentes a diferentes graus de associao de
duas variveis e respectivos coeficientes de correlao.

Demonstra-se que o coeficiente de correlao linear simples entre duas variveis
aleatrias X e Y a raiz quadrada do coeficiente de determinao correspondente ao ajuste da
regresso linear simples de Y em relao a X. Essa relao entre coeficiente de correlao e
coeficiente de determinao a justificativa para o uso dos correspondentes smbolos: r e r
2
. No
exemplo, o coeficiente de determinao linear simples foi r
2
=0,50. Assim, o coeficiente de
correlao linear simples tambm pode ser obtido como segue:
r 0 50 0 707 , , .
Relao entre coeficiente de regresso e coeficiente de correlao
Demonstra-se que:
SQX
!
r b
SQY
,
de modo que o coeficiente de correlao linear tem o mesmo sinal do coeficiente de regresso
linear.

Exemplo 8.6 (continuao).
8. Anlise de Regresso e Correlao Linear Simples
211
r 0 367 0 7068
253
68,32
, ,
,60
.
8.6 Exerccios
1. Um experimento foi realizado com o objetivo de verificar se existe uma relao linear
entre a quantidade de fsforo no tecido da planta de uma cultivar de feijo e a
quantidade de fsforo adicionada ao solo como fertilizante. A quantidade mdia de
fsforo no tecido das plantas colhidas das parcelas para anlise (em ppm, Y) e as
correspondentes doses de fsforo aplicadas ao solo (em kg/ha, X) so dadas a seguir:

X: 0 20 40 60 80
Y: 0,2 0,3 0,5 0,6 0,8

a) Estime a equao de regresso: E(Y) = a + bX.
b) Efetue a anlise da variao e teste a hiptese H
0
: b=O; H
A
: bO, atravs da
estatstica F.
c) Calcule o coeficiente de determinao r
2
.
d) Calcule os valores ajustados de Y para as doses de fsforo utilizadas no
experimento. Determine o coeficiente de correlao entre os valores observados e
os valores ajustados de Y. Verifique que o quadrado desse coeficiente de correlao
igual ao valor do coeficiente de determinao encontrado no item anterior.
e) Redija a concluso referente adequabilidade da relao linear, com base nos
resultados obtidos nos itens b) e c).
2. Em um experimento em que se estudou o efeito do nvel de gua aplicada atravs de
irrigao sobre o rendimento de gros de arroz irrigado foram obtidos os seguintes
resultados:

Soma
Nvel de gua (X): 12 18 24 30 36 42 48 210
Produo (Y): 5,27 5,68 6,25 7,21 8,02 8,71 8,42 49,56

A soma dos produtos para as variveis X e Y, corrigida para as correspondentes
mdias, 103,68.
a) Especifique as pressuposies para o ajustamento do modelo de regresso linear
E(Y) = a+bX.
b) Efetue o ajustamento do modelo de regresso linear especificado no item anterior.
c) Teste a hiptese H
0
: b=0 contra a alternativa H
A
: b0.
d) Interprete o significado geomtrico dos coeficientes a e b do modelo de regresso
linear simples.
e) Calcule e interprete o coeficiente de determinao.
f) Redija as concluses.
Estatstica Bsica 212
3. No estudo da relao linear entre duas variveis negativamente correlacionadas foram
obtidos os seguintes dados:
x=0; y=12; s
x
=8; s
y
=10; e r
2
=0,64.
Determine a estimativa da equao de regresso linear de Y em relao a X.
4. No estudo da relao linear entre duas variveis negativamente correlacionadas foram
obtidos os seguintes dados:
5. Decida se cada uma das seguintes sentenas verdadeira ou falsa, indicando as letras
V e F entre parnteses, respectivamente. Se a sentena for falsa, explique porque.
( ) A soma dos quadrados dos desvios da regresso no pode ser maior que a soma
de quadrados total.
( ) Se a declividade da reta de regresso ajustada um valor numrico grande, a
relao entre Y e X forte.
( ) Se todos os valores da amostra ficam sobre a reta de regresso ajustada, a soma
de quadrados total igual a zero.
( ) Uma das pressuposies da anlise de regresso que a varivel dependente tem
distribuio normal.
( ) Em testes de significncia referentes ao coeficiente de regresso b pressupe-se
que Y tem a mesma varincia para todos os valores fixos de X.
( ) Aceitar a hiptese de nulidade da declividade da reta de regresso decidir que
no h relao linear entre Y e X.
( ) Aceitar a hiptese de nulidade do coeficiente de correlao linear decidir que
no h relao entre Y e X.
( ) Quando cresce o grau de associao de duas variveis, melhora o ajustamento da
reta de regresso.
( ) Quanto maior a magnitude de r, mais forte a relao linear entre X e Y.
( ) Quando calcula um coeficiente de correlao, o experimentador pressupe que
h uma relao de causa-efeito entre X e Y.
( ) Em inferncias referentes ao coeficiente de correlao, os valores de X podem
ser fixos ou provenientes de amostragem aleatria, mas os valores de Y devem
provir de uma amostra aleatria.
( ) Se os papis de X e Y so trocados, a equao de regresso permanece a mesma.
( ) Se os papis de X e Y so trocados, o coeficiente de correlao permanece o
mesmo.










APNDICE






Tabela A-I. Distribuio cumulativa binomial............................................................
Tabela A-II. Pontos -percentuais superiores da distribuio normal padro.........
Tabela A-III. Pontos -percentuais superiores da distribuio qui-quadrado...........
Tabela A-IV. Pontos percentuais da distribuio t (de Student)................................
Tabela A-V. Pontos percentuais superiores da distribuio F..................................
215
222
223
224
225


Estatstica Bsica 214

8. Anlise de Regresso e Correlao Linear Simples
215
Tabela A-I. Distribuio cumulativa binomial: F(x; n, p) = P[Xx] =
x
n t n-t
t
t=0
C p (1-p)

.
p
n x
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90 0,95
1 0 0,990 0,950 0,900 0,800 0,750 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,050
1 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

2 0 0,980 0,902 0.810 0,640 0,563 0,490 0,360 0,250 0,160 0,090 0,040 0,010 0,002
1 1,000 0,997 0,990 0,960 0,938 0,910 0,840 0,750 0,640 0,510 0,360 0,190 0,097
2 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

3 0 9,970 0,857 0,729 0,512 0,422 0,343 0,216 0,125 0,064 0,027 0,008 0,001 0,000
1 1,000 0,993 0,972 0,896 0,844 0,784 0,648 0,500 0,352 0,216 0,104 0,028 0,007
2 1,000 0,999 0,992 0,984 0,973 0,936 0,875 0,784 0,657 0,488 0,271 0,143
3 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

4 0 0,961 0,815 0,656 0,410 0,316 0,240 0,130 0,063 0,026 0,008 0,002 0,000 0,000
1 1,000 0,986 0,948 0,819 0,738 0,652 0,475 0,313 0,179 0,084 0,027 0,004 0,000
2 1,000 0,996 0,973 0,949 0,916 0,821 0,688 0,525 0,348 0,181 0,052 0,014
3 1,000 0,998 0,996 0,992 0,974 0,938 0,870 0,760 0,590 0,344 0,185
4 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

5 0 0,951 0,774 0,590 0,328 0,237 0,168 0,078 0,031 0,010 0,002 0,000 0,000 0,000
1 0,999 0,977 0,919 0,737 0,633 0,528 0,337 0,188 0,087 0,031 0,007 0,000 0,000
2 1,000 0,999 0,991 0,942 0,896 0,837 0,683 0,500 0,317 0,163 0,058 0,009 0,001
3 1,000 1,000 0,993 0,984 0,969 0,913 0,813 0,663 0,472 0,263 0,081 0,023
4 1,000 0,999 0,998 0,990 0,969 0,922 0,832 0,672 0,410 0,226
5 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

6 0 0,941 0,735 0,531 0,262 0,178 0,118 0,047 0,016 0,004 0,001 0,000 0,000 0,000
1 0,999 0,967 0,886 0,655 0,534 0,420 0,233 0,109 0,041 0,011 0,002 0,000 0,000
2 1,000 0,998 0,984 0,901 0,831 0,744 0,544 0,344 0,179 0,070 0,017 0,001 0,000
3 1,000 0,999 0,983 0,962 0,930 0,821 0,656 0,456 0,256 0,099 0,016 0,002
4 1,000 0,998 0,995 0,989 0,959 0,891 0,767 0,580 0,345 0,114 0,033
5 1,000 1,000 0,999 0,996 0,984 0,953 0,882 0,738 0,469 0,265
6 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

7 0 0,932 0,698 0,478 0,210 0,133 0,082 0,028 0,008 0,002 0,000 0,000 0,000 0,000
1 0,998 0,956 0,850 0,577 0,445 0,329 0,159 0,063 0,019 0,004 0,000 0,000 0,000
2 1,000 0,996 0,974 0,852 0,756 0,647 0,420 0,227 0,096 0,029 0,005 0,000 0,000
3 1,000 0,997 0,967 0,929 0,874 0,710 0,500 0,290 0,126 0,033 0,003 0,000
4 1,000 0,995 0,987 0,971 0,904 0,773 0,580 0,353 0,148 0,026 0,004
5 1,000 0,999 0,996 0,981 0,938 0,841 0,671 0,423 0,150 0,044
6 1,000 1,000 0,998 0,992 0,972 0,918 0,790 0,522 0,302
7 1,000 1,000 1,000 1,000 1,000 1,000 1,000
Estatstica Bsica 216
Tabela A-I (continuao).

p
n x
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90 0,95
8 0 0,923 0,663 0,430 0,168 0,100 0,058 0,017 0,004 0,001 0,000 0,000 0,000 0,000
1 0,997 0,943 0,813 0,503 0,367 0,255 0,106 0,035 0,009 0,001 0,000 0,000 0,000
2 1,000 0,994 0,962 0,797 0,679 0,552 0,315 0,145 0,050 0,011 0,001 0,000 0,000
3 1,000 0,995 0,944 0,886 0,806 0,594 0,363 0,174 0,058 0,010 0,000 0,000
4 1,000 0,990 0,973 0,942 0,826 0,637 0,406 0,194 0,056 0,005 0,000
5 0,999 0,996 0,989 0,950 0,855 0,685 0,448 0,203 0,038 0,006
6 1,000 1,000 0,999 0,991 0,965 0,894 0,745 0,497 0,187 0,057
7 1,000 0,999 0,996 0,983 0,942 0,832 0,570 0,337
8 1,000 1,000 1,000 1,000 1,000 1,000 1,000

9 0 0,913 0,630 0,387 0,134 0,075 0,040 0,010 0,002 0,000 0,000 0,000 0,000 0,000
1 0,996 0,929 0,775 0,436 0,300 0,196 0,071 0,020 0,004 0,000 0,000 0,000 0,000
2 1,000 0,992 0,947 0,738 0,601 0,463 0,232 0,090 0,025 0,004 0,000 0,000 0,000
3 0,999 0,992 0,914 0,834 0,730 0,483 0,254 0,099 0,025 0,003 0,000 0,000
4 1,000 0,999 0,980 0,951 0,901 0,733 0,500 0,267 0,099 0,020 0,001 0,000
5 1,000 0,997 0,990 0,975 0,901 0,746 0,517 0,270 0,086 0,008 0,001
6 1,000 0,999 0,996 0,975 0,910 0,768 0,537 0,262 0,053 0,008
7 1,000 1,000 0,996 0,980 0,929 0,804 0,564 0,225 0,071
8 1,000 0,998 0,990 0,960 0,866 0,613 0,370
9 1,000 1,000 1,000 1,000 1,000 1,000

10 0 0,904 0,599 0,349 0,107 0,056 0,028 0,006 0,001 0,000 0,000 0,000 0,000 0,000
1 0,996 0,914 0,736 0,376 0,224 0,149 0,046 0,011 0,002 0,000 0,000 0,000 0,000
2 1,000 0,988 0,930 0,678 0,526 0,383 0,167 0,055 0,012 0,002 0,000 0,000 0,000
3 0,999 0,987 0,879 0,776 0,650 0,382 0,172 0,055 0,011 0,001 0,000 0,000
4 1,000 0,998 0,967 0,922 0,850 0,633 0,377 0,166 0,047 0,006 0,000 0,000
5 1,000 0,994 0,980 0,953 0,834 0,623 0,367 0,150 0,033 0,002 0,000
6 0,999 0,996 0,989 0,945 0,828 0,618 0,350 0,121 0,013 0,001
7 1,000 1,000 0,998 0,988 0,945 0,833 0,617 0,322 0,070 0,012
8 1,000 0,998 0,989 0,954 0,851 0,624 0,264 0,086
9 1,000 0,999 0,994 0,972 0,893 0,651 0,401
10 1,000 1,000 1,000 1,000 1,000 1,000

11 0 0,895 0,569 0,314 0,086 0,042 0,020 0,004 0,000 0,000 0,000 0,000 0,000 0,000
1 0,995 0,898 0,697 0,322 0,197 0,113 0,030 0,006 0,001 0,000 0,000 0,000 0,000
2 1,000 0,985 0,910 0,617 0,455 0,313 0,119 0,033 0,006 0,001 0,000 0,000 0,000
3 0,998 0,981 0,839 0,713 0,570 0,296 0,113 0,029 0,004 0,000 0,000 0,000
4 1,000 0,997 0,950 0,885 0,790 0,533 0,274 0,099 0,022 0,002 0,000 0,000
5 1,000 0,988 0,996 0,922 0.753 0,500 0,247 0,078 0,012 0,000 0,000
6 0,998 0,992 0,978 0,901 0,726 0,467 0,210 0,050 0,003 0,000
7 1,000 0,999 0,996 0,971 0,887 0,704 0,430 0,161 0,019 0,002
8 1,000 0,999 0,994 0,967 0,881 0.687 0,383 0,090 0,015
9 1,000 0,999 0,994 0,970 0,887 0,678 0,303 0,102
10 1,000 1,000 0,996 0,980 0,914 0,686 0,431
11 1,000 1,000 1,000 1,000 1,000
8. Anlise de Regresso e Correlao Linear Simples
217
Tabela A-I (continuao).

p
n x
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90 0,95
12 0 0,886 0,540 0,282 0,069 0,032 0,014 0,002 0,000 0,000 0,000 0,000 0,000 0,000
1 0,994 0,882 0,659 0,275 0,158 0,085 0,020 0,003 0,000 0,000 0,000 0,000 0,000
2 1,000 0,980 0,889 0,558 0,391 0,253 0,083 0,019 0,003 0,000 0,000 0,000 0,000
3 0,998 0,974 0,795 0,649 0,493 0,225 0,073 0,015 0,002 0,000 0,000 0,000
4 1,000 0,996 0,927 0,842 0,724 0,438 0,194 0,057 0,009 0,001 0,000 0,000
5 0,999 0,981 0,946 0,882 0,665 0,387 0,158 0,039 0,004 0,000 0,000
6 1,000 0,996 0,986 0,961 0,842 0,613 0,335 0,118 0,019 0,001 0,000
7 0,999 0,997 0,991 0,943 0,806 0,562 0,276 0,073 0,004 0,000
8 1,000 1,000 0,998 0,985 0,927 0,775 0,507 0,205 0,026 0,002
9 1,000 0,997 0,981 0,917 0,747 0,442 0,111 0,020
10 1,000 0,997 0,980 0,915 0,725 0,341 0,118
11 1,000 0,998 0,986 0,931 0,718 0,460
12 1,000 1,000 1,000 1,000 1,000

13 0 0,878 0,513 0,254 0,055 0,024 0,010 0,001 0,000 0,000 0,000 0,000 0,000 0,000
1 0,993 0,865 0,621 0,234 0,127 0,064 0,013 0,002 0,000 0,000 0,000 0,000 0,000
2 1,000 0,975 0,866 0,502 0,333 0,202 0,058 0,011 0,001 0,000 0,000 0,000 0,000
3 0,997 0,966 0,747 0,584 0,421 0,169 0,046 0,008 0,001 0,000 0,000 0,000
4 1,000 0,994 0,901 0,794 0,654 0,353 0,133 0,032 0,004 0,000 0,000 0,000
5 0,999 0,970 0,920 0,835 0,574 0,291 0,098 0,018 0,001 0,000 0,000
6 1,000 0,993 0,976 0,938 0,771 0,500 0,229 0,062 0,007 0,000 0,000
7 0,999 0,994 0,982 0,902 0,709 0,426 0,165 0,030 0,001 0,000
8 1,000 0,999 0,996 0,968 0,867 0,647 0,346 0,099 0,006 0,000
9 1,000 0,999 0,992 0,954 0,831 0,579 0,253 0,034 0,003
10 1,000 0,999 0,989 0,942 0,798 0,498 0,134 0,025
11 1,000 0,998 0,987 0,936 0,766 0,379 0,135
12 1,000 0,999 0,990 0,945 0,746 0,487
13 1,000 1,000 1,000 1,000 1,000

14 0 0,869 0,488 0,229 0,044 0,018 0,007 0,001 0,000 0,000 0,000 0,000 0,000 0,000
1 0,992 0,847 0,585 0,198 0,101 0,047 0,008 0,001 0,000 0,000 0,000 0,000 0,000
2 1,000 0,970 0,842 0,448 0,281 0,161 0,040 0,006 0,001 0,000 0,000 0,000 0,000
3 0,996 0,956 0,698 0,521 0,355 0,124 0,029 0,004 0,000 0,000 0,000 0,000
4 1,000 0,991 0,870 0,742 0,584 0,279 0,090 0,018 0,002 0,000 0,000 0,000
5 0,999 0,956 0,888 0,781 0,486 0,212 0,058 0,008 0,000 0,000 0,000
6 1,000 0,988 0,962 0,907 0,692 0,395 0,150 0,031 0,002 0,000 0,000
7 0,998 0,990 0,969 0,850 0,605 0,308 0,093 0,012 0,000 0,000
8 1,000 0,998 0,992 0,942 0,788 0,514 0,219 0,044 0,001 0,000
9 1,000 0,998 0,982 0,910 0,721 0,416 0,130 0,009 0,000
10 1,000 0,996 0,971 0,876 0,645 0,302 0,044 0,004
11 0,999 0,994 0,960 0,839 0,552 0,158 0,030
12 1,000 0,999 0,992 0,953 0,802 0,415 0,153
13 1,000 0,999 0,993 0,956 0,771 0,512
14 1,000 1,000 1,000 1,000 1,000
Estatstica Bsica 218
Tabela A-I (continuao).

p
n x
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90 0,95
15 0 0,860 0,463 0,206 0,035 0,013 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,990 0,829 0,549 0,167 0,080 0,035 0,005 0,000 0,000 0,000 0,000 0,000 0,000
2 1,000 0,964 0,816 0,398 0,236 0,127 0,027 0,004 0,000 0,000 0,000 0,000 0,000
3 0,995 0,944 0,648 0,461 0,297 0,091 0,018 0,002 0,000 0,000 0,000 0,000
4 0,999 0,987 0,836 0,686 0,515 0,217 0,059 0,009 0,001 0,000 0,000 0,000
5 1,000 0,998 0,939 0,852 0,722 0,403 0,151 0,034 0,004 0,000 0,000 0,000
6 1,000 0,982 0,943 0,869 0,610 0,304 0,095 0,015 0,001 0,000 0,000
7 0,996 0,983 0,950 0,787 0,500 0,213 0,050 0,004 0,000 0,000
8 0,999 0,996 0,985 0,905 0,696 0,390 0,131 0,018 0,000 0,000
9 1,000 0,999 0,996 0,996 0,849 0,597 0,278 0,061 0,002 0,000
10 1,000 0,999 0,991 0,941 0,783 0,485 0,164 0,013 0,001
11 1,000 0,998 0,982 0,909 0,703 0,352 0,056 0,005
12 1,000 0,996 0,973 0,873 0,602 0,184 0,036
13 1,000 0,995 0,965 0,833 0,451 0,171
14 1,000 0,995 0,965 0,794 0,537
15 1,000 1,000 1,000 1,000

16 0 0,851 0,440 0,185 0,028 0,010 0,003 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,989 0,811 0,515 0,141 0,063 0,026 0,003 0,000 0,000 0,000 0,000 0,000 0,000
2 0,999 0,957 0,789 0,352 0,197 0,099 0,018 0,002 0,000 0,000 0,000 0,000 0,000
3 1,000 0,993 0,932 0,598 0,405 0,246 0,065 0,011 0,001 0,000 0,000 0,000 0,000
4 0,999 0,983 0,798 0,630 0,450 0,167 0,038 0,005 0,000 0,000 0,000 0,000
5 1,000 0,997 0,918 0,810 0,660 0,329 0,105 0,019 0,002 0,000 0,000 0,000
6 0,999 0,973 0,920 0,825 0,527 0,227 0,058 0,007 0,000 0,000 0,000
7 1,000 0,993 0,973 0,926 0,716 0,402 0,142 0,026 0,001 0,000 0,000
8 0,999 0,993 0,974 0,858 0,598 0,284 0,074 0,007 0,000 0,000
9 1,000 0,998 0,993 0,942 0,773 0,473 0,175 0,027 0,001 0,000
10 1,000 0,998 0,981 0,895 0,671 0,340 0,082 0,003 0,000
11 1,000 0,995 0,962 0,833 0,550 0,202 0,017 0,001
12 0,999 0,989 0,935 0,754 0,402 0,068 0,007
13 1,000 0,998 0,982 0,901 0,648 0,211 0,043
14 1,000 0,997 0,974 0,859 0,485 0,189
15 1,000 0,997 0,972 0,815 0,560
16 1,000 1,000 1,000 1,000

17 0 0,843 0,418 0,167 0,023 0,008 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,988 0,792 0,482 0,118 0,050 0,019 0,002 0,000 0,000 0,000 0,000 0,000 0,000
2 0,999 0,950 0,762 0,310 0,164 0,077 0,012 0,001 0,000 0,000 0,000 0,000 0,000
3 1,000 0,991 0,917 0,549 0,353 0,202 0,046 0,006 0,000 0,000 0,000 0,000 0,000
4 0,999 0,978 0,758 0,574 0,389 0,126 0,025 0,003 0,000 0,000 0,000 0,000
5 1,000 0,995 0,894 0,765 0,597 0,264 0,072 0,011 0,001 0,000 0,000 0,000
6 0,999 0,962 0,893 0,775 0,448 0,166 0,035 0,003 0,000 0,000 0,000
7 1,000 0,989 0,960 0,895 0,641 0,315 0,092 0,013 0,000 0,000 0,000
8 0,997 0,988 0,960 0,801 0,500 0,199 0,040 0,003 0,000 0,000
9 1,000 0,997 0,987 0,908 0,685 0,359 0,105 0,011 0,000 0,000
8. Anlise de Regresso e Correlao Linear Simples
219
Tabela A-I (continuao).

p
n x
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90 0,95
10 0,999 0,997 0,965 0,834 0,552 0,225 0,038 0,001 0,000
11 1,000 0,999 0,989 0,928 0,736 0,403 0,106 0,005 0,000
12 1,000 0,997 0,975 0,874 0,611 0,242 0,022 0,001
13 1,000 0,994 0,954 0,798 0,451 0,083 0,009
14 0,999 0,988 0,923 0,690 0,238 0,050
15 1,000 0,998 0,981 0,882 0,518 0,208
16 1,000 0,998 0,977 0,833 0,582
17 1,000 1,000 1,000 1,000

18 0 0,835 0,397 0,150 0,018 0,006 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,986 0,774 0,450 0,099 0,039 0,014 0,001 0,000 0,000 0,000 0,000 0,000 0,000
2 0,999 0,942 0,734 0,271 0,135 0,060 0,008 0,001 0,000 0,000 0,000 0,000 0,000
3 1,000 0,989 0,902 0,501 0,306 0,165 0,033 0,004 0,000 0,000 0,000 0,000 0,000
4 0,998 0,972 0,716 0,519 0,333 0,094 0,015 0,001 0,000 0,000 0,000 0,000
5 1,000 0,994 0,867 0,717 0,534 0,209 0,048 0,006 0,000 0,000 0,000 0,000
6 0,999 0,949 0,861 0,722 0,374 0,119 0,020 0,001 0,000 0,000 0,000
7 1,000 0,984 0,943 0,859 0,563 0,240 0,058 0,006 0,000 0,000 0,000
8 0,996 0,981 0,940 0,737 0,407 0,135 0,021 0,001 0,000 0,000
9 0,999 0,995 0,979 0,865 0,593 0,263 0,060 0,004 0,000 0,000
10 1,000 0,999 0,994 0,942 0,760 0,437 0,141 0,016 0,000 0,000
11 1,000 0,999 0,980 0,881 0,626 0,278 0,051 0,001 0,000
12 1,000 0,994 0,952 0,791 0,466 0,133 0,006 0,000
13 0,999 0,985 0,906 0,667 0,284 0,028 0,002
14 1,000 0,996 0,967 0,835 0,499 0,098 0,011
15 0,999 0,992 0,940 0,729 0,266 0,058
16 1,000 0,999 0,986 0,901 0,550 0,226
17 1,000 0,988 0,982 0,850 0,603
18 1,000 1,000 1,000 1,000

19 0 0,826 0,377 0,135 0,014 0,004 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,985 0,755 0,420 0,083 0,031 0,010 0,001 0,000 0,000 0,000 0,000 0,000 0,000
2 0,999 0,933 0,705 0,237 0,111 0,046 0,005 0,000 0,000 0,000 0,000 0,000 0,000
3 1,000 0,987 0,885 0,455 0,263 0,133 0,023 0,002 0,000 0,000 0,000 0,000 0,000
4 0,998 0,965 0,673 0,465 0,282 0,070 0,010 0,001 0,000 0,000 0,000 0,000
5 1,000 0,991 0,837 0,668 0,474 0,163 0,032 0,003 0,000 0,000 0,000 0,000
6 0,998 0,932 0,825 0,666 0,308 0,084 0,012 0,001 0,000 0,000 0,000
7 1,000 0,977 0,923 0,818 0,488 0,180 0,035 0,003 0,000 0,000 0,000
8 0,993 0,971 0,916 0,667 0,324 0,088 0,011 0,000 0,000 0,000
9 0,998 0,991 0,967 0,814 0,500 0,186 0,033 0,002 0,000 0,000
10 1,000 0,998 0,989 0,912 0,676 0,333 0,084 0,007 0,000 0,000
11 1,000 0,997 0,965 0,820 0,512 0,182 0,023 0,000 0,000
12 0,999 0,998 0,916 0,692 0,334 0,068 0,002 0,000
13 1,000 0,997 0,968 0,837 0,526 0,163 0,009 0,000
14 0,999 0,990 0,930 0,718 0,327 0,035 0,002
15 1,000 0,998 0,977 0,867 0,545 0,115 0,013
Estatstica Bsica 220
Tabela A-I (continuao).

p
n x
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90 0,95
16 1,000 0,995 0,954 0,763 0,295 0,067
17 0,999 0,990 0,917 0,580 0,245
18 1,000 0,999 0,986 0,865 0,623
19 1,000 1,000 1,000 1,000

20 0 0,818 0,358 0,122 0,012 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,983 0,736 0,392 0,069 0,024 0,008 0,001 0,000 0,000 0,000 0,000 0,000 0,000
2 0,999 0,925 0,677 0,206 0,091 0,035 0,004 0,000 0,000 0,000 0,000 0,000 0,000
3 1,000 0,984 0,867 0,411 0,225 0,107 0,016 0,001 0,000 0,000 0,000 0,000 0,000
4 0,997 0,957 0,630 0,415 0,238 0,051 0,006 0,000 0,000 0,000 0,000 0,000
5 1,000 0,989 0,804 0,617 0,416 0,126 0,021 0,002 0,000 0,000 0,000 0,000
6 0,998 0,913 0,786 0,608 0,250 0,058 0,006 0,000 0,000 0,000 0,000
7 1,000 0,968 0,898 0,772 0,416 0,132 0,021 0,001 0,000 0,000 0,000
8 0,990 0,959 0,887 0,596 0,252 0,057 0,005 0,000 0,000 0,000
9 0,997 0,986 0,952 0,755 0,412 0,128 0,017 0,001 0,000 0,000
10 0,999 0,996 0,983 0,872 0,588 0,245 0,048 0,003 0,000 0,000
11 1,000 0,999 0,995 0,943 0,748 0,404 0,113 0,010 0,000 0,000
12 1,000 0,999 0,979 0,868 0,584 0,288 0,032 0,000 0000
13 1,000 0,994 0,942 0,750 0,392 0,087 0,002 0,000
14 0,998 0,979 0,874 0,584 0,196 0,011 0,000
15 1,000 0,994 0,949 0,762 0,370 0,043 0,003
16 0,999 0,984 0,893 0,589 0,133 0,016
17 1,000 0,996 0,965 0,794 0,323 0,075
18 0,999 0,992 0,931 0,608 0,264
19 1,000 0,999 0,988 0,878 0,642
20 1,000 1,000 1,000 1,000

25 0 0,778 0,277 0,072 0,004 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
1 0,974 0,642 0,271 0,027 0,007 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 0,998 0,873 0,537 0,098 0,032 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000
3 1,000 0,966 0,764 0,234 0,096 0,033 0,002 0,000 0,000 0,000 0,000 0,000 0,000
4 0,993 0,902 0,421 0,214 0,090 0,009 0,000 0,000 0,000 0,000 0,000 0,000
5 0,999 0,967 0,617 0,378 0,193 0,029 0,002 0,000 0,000 0,000 0,000 0,000
6 1,000 0,991 0,780 0,561 0,341 0,074 0,007 0,000 0,000 0,000 0,000 0,000
7 0,998 0,891 0,727 0,512 0,154 0,022 0,001 0,000 0,000 0,000 0,000
8 1,000 0,953 0,851 0,667 0,274 0,054 0,004 0,000 0,000 0,000 0,000
9 0,983 0,929 0,811 0,425 0,115 0,013 0,000 0,000 0,000 0,000
10 0,994 0,970 0,902 0,586 0,212 0,034 0,002 0,000 0,000 0,000
11 0,998 0,980 0,956 0,732 0,345 0,078 0,006 0,000 0,000 0,000
12 1,000 0,997 0,983 0,846 0,500 0,154 0,017 0,000 0,000 0,000
13 0,999 0,994 0,922 0,655 0,268 0,044 0,002 0,000 0,000
14 1,000 0,998 0,966 0,788 0,414 0,098 0,006 0,000 0,000
15 1,000 0,987 0,885 0,575 0,189 0,017 0,000 0,000
16 0,996 0,946 0,726 0,323 0,047 0,000 0,000
8. Anlise de Regresso e Correlao Linear Simples
221
Tabela A-I (continuao).

p
n x
0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90 0,95
17 0,999 0,978 0,846 0,488 0,109 0,002 0,000
18 1,000 0,993 0,926 0,659 0,220 0,009 0,000
19 0,998 0,971 0,807 0,383 0,033 0,001
20 1,000 0,991 0,910 0,579 0,098 0,007
21 0,998 0,967 0,766 0,236 0,034
22 1,000 0,991 0,902 0,463 0,127
23 0,998 0,973 0,729 0,358
24 1,000 0,996 0,928 0,723
25 1,000 1,000 1,000

Estatstica Bsica 222

Tabela A-II. Pontos -percentuais superiores da distribuio normal padro - Probabilidade
da varivel aleatria Z = (X-)/ ser maior do que o valor nas margens
(algarismo inteiro e primeira decimal na margem esquerda; segunda decimal na
margem superior).

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0223
2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
3,0 0,0013 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0011
3,1 0,0010 0,0010 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
3,9 0,0000

8. Anlise de Regresso e Correlao Linear Simples
223

Tabela A-III. Pontos -percentuais superiores da distribuio qui-quadrado - Probabilidade
de um valor de
2
maior do que o valor na tabela.

Prob >
2

n
0,995 0,990 0,975 0,950 0,900 0,750 0,500 0,250 0,100 0,050 0,025 0,010 0,005
1 0,00003 0,00015 0,00098 0,00393 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88
2 0,01 0,0201 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,6
3 0,0717 0,115 0,216 0,352 0,584 1,21 2,37 4,11 6,25 7,81 9,35 11,34 12,84
4 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 1,14 13,28 14,86
5 0,412 0,554 0,831 1,15 1,61 2,67 4,35 6,63 9,24 11,07 12,83 15,09 16,75
6 0,676 0,872 1,24 1,64 2,2 3,45 5,35 7,84 10,64 12,59 14,45 16,81 18,55
7 0,989 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,02 14,07 16,01 18,48 20,28
8 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,22 13,36 15,51 17,53 20,09 21,96
9 1,73 2,09 2,7 3,33 4,17 5,9 8,34 11,39 14,68 16,92 19,02 21,67 23,59
10 2,6 2,56 3,25 3,94 4,87 6,74 9,34 12,55 15,99 18,31 20,48 23,21 25,19
11 2,6 3,05 3,82 4,57 5,58 7,58 10,33 13,7 17,28 19,68 21,92 24,72 26,76
12 3,07 3,57 4,40 5,23 6,3 8,44 11,33 14,85 18,55 21,03 23,34 26,22 28,30
13 3,57 4,11 5,01 5,89 7,04 9,30 12,33 15,98 19,81 22,36 24,74 27,69 29,82
14 4,07 4,66 5,63 6,57 7,79 10,17 13,33 17,12 21,06 23,68 26,12 29,14 31,32
15 4,6 5,23 6,26 7,26 8,55 11,04 14,33 18,25 22,31 25,00 27,49 30,58 32,80
16 5,14 5,81 6,91 7,96 9,31 11,91 15,33 19,37 23,54 26,30 28,85 32,00 34,27
17 5,7 6,41 7,56 8,67 10,09 12,79 16,33 20,49 24,77 27,59 30,19 33,41 35,72
18 6,26 7,01 8,23 9,39 10,86 13,68 17,33 21,6 25,99 28,87 31,53 34,81 37,16
19 6,84 7,63 8,91 10,12 11,65 14,56 18,33 22,72 27,20 30,14 32,85 36,19 38,58
20 7,43 8,26 9,59 10,85 12,44 15,45 19,33 23,83 28,41 31,41 34,17 37,57 40,00
21 8,03 8,9 10,28 11,59 13,24 16,34 20,33 24,93 29,62 32,67 35,48 38,93 41,40
22 8,64 9,54 10,98 12,34 14,04 17,24 21,33 26,04 30,81 33,92 36,78 40,29 42,80
23 9,26 10,20 11,69 13,09 14,85 18,14 22,33 27,17 32,01 35,17 38,08 41,64 44,18
24 9,89 10,86 12,40 13,85 15,66 19,04 23,33 28,24 33,20 36,42 39,36 42,98 45,56
25 10,52 11,52 13,12 14,61 16,47 19,94 24,33 29,34 34,38 37,65 40,65 44,31 46,93
26 11,16 12,20 13,84 15,38 17,29 20,84 25,33 30,43 35,56 38,89 41,92 45,64 48,29
27 11,81 12,88 14,57 16,15 18,11 21,75 26,33 31,53 36,74 40,11 43,19 46,96 49,64
28 12,46 13,56 15,31 16,93 18,94 22,66 27,33 32,62 37,92 41,34 44,46 48,28 50,99
29 13,12 14,26 16,05 17,71 19,77 23,57 28,33 33,71 39,09 42,56 45,72 49,59 52,34
30 13,79 14,95 16,79 18,49 20,60 24,48 29,33 34,8 40,26 43,77 45,98 50,89 53,67
40 20,71 22,16 24,43 26,51 29,05 33,66 39,33 45,62 51,80 55,76 59,34 63,69 66,77
50 27,99 29,71 32,36 34,76 37,69 42,94 49,33 56,33 63,17 67,50 71,42 76,15 79,49
60 35,53 37,48 40,48 43,19 46,46 52,29 59,33 66,98 74,40 79,08 83,30 88,38 91,95
70 43,28 45,44 48,76 51,74 55,33 61,70 69,33 77,58 85,53 90,53 95,02 100,42 104,22
80 51,17 53,54 57,15 60,39 64,28 71,14 79,33 88,13 96,58 101,88 106,63 112,33 116,32
90 59,20 61,75 65,65 69,13 73,29 80,62 89,33 98,64 107,56 113,14 118,14 124,12 128,30
100 67,33 70,06 74,22 77,93 82,36 90,13 99,33 109,14 118,50 124,34 129,56 153,81 140,17

Estatstica Bsica 224
Tabela A-IV. Pontos percentuais da distribuio t (de Student).

Pontos bilaterais superiores: Prob.(|t| > t
P
)

0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001
1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,941
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,859
6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,405
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073
16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015
17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850
21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,767
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,690
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,659
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646
35 0,682 0,852 1,052 1,306 1,690 2,030 2,438 2,724 3,591
40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551
45 0,680 0,850 1,048 1,301 1,680 2,014 2,412 2,690 3,520
50 0,680 0,849 1,047 1,299 1,676 2,008 2,403 2,678 3,496
55 0,679 0,849 1,047 1,297 1,673 2,004 2,396 2,669 3,476
60 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660 3,460
70 0,678 0,847 1,045 1,294 1,667 1,994 2,381 2,648 3,435
80 0,678 0,847 1,044 1,293 1,665 1,989 2,374 2,638 3,416
90 0,678 0,846 1,043 1,291 1,662 1,986 2,369 2,631 3,402
100 0,677 0,846 1,042 1,290 1,661 1,982 2,365 2,625 3,390
120 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373
200 0,676 0,844 1,039 1,286 1,653 1,972 2,345 2,601 3,340
500 0,676 0,843 1,037 1,284 1,648 1,965 2,334 2,586 3,310
1000 0,675 0,842 1,037 1,283 1,647 1,962 2,330 2,581 3,301
Inf. 0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,291
0,25 0,20 0,15 0,10 0,05 0,025 0,01 0,005 0,0005

Pontos unilaterais superiores: Prob.(t > t
P
)
8. Anlise de Regresso e Correlao Linear Simples
225
Tabela A-V. Pontos percentuais superiores da distribuio F: Prob.[F(
1
,
2
) > F
P
].

2
P
1 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 60 120 Inf.

0,05 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,0 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
1
0,025 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,7 963,3 968,6 976,7 984,9 984,9 993,1 997,2 1001, 1006, 1010, 1014, 1018,

0,01 4052, 5000, 5403, 5625, 5764, 5859, 5928, 5982, 6022, 6056, 6082, 6106, 6157, 6209, 6235, 6261, 6287, 6313, 6339, 6366,

0,001 4053* 5000* 5404* 5625* 5764* 5859* 5929* 5981* 6023* 6056* 6084* 6107* 6158* 6209* 6235* 6261* 6287* 6313* 6340* 6366*

0,05 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
2
0,025 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,50

0,01 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,41 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50

0,001 998,5 999,0 999,2 999,2 999,3 999,3 999,4 999,4 999,4 999,4 999,4 999,4 999,4 999,4 999,5 999,5 999,5 999,5 999,5 999,5

0,05 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
3
0,025 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 39,43 14,17 14,12 14,08 14,04 13,99 13,95 13,90

0,01 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,13 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13

0,001 167,0 148,5 141,1 137,1 134,6 132,8 131,6 130,6 129,9 129,2 128,8 128,3 127,4 126,4 125,9 125,4 125,0 124,5 124,0 123,5

0,05 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,93 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
4
0,025 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,66 8,56 8,51 8,46 8,41 8,36 8,31 8,26

0,01 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46

0,001 74,14 61,25 56,18 53,44 51,71 50,53 49,66 49,00 48,47 48,05 47,70 47,41 46,76 46,10 45,77 45,43 45,09 44,75 44,40 44,05

0,05 6,61 5,79 5,41 5,19 5,05 4,95 4,88 8,82 4,77 4,74 4,70 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
5
0,025 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,46 6,33 6,28 6,23 6,18 6,12 6,07 6,02

0,01 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02

0,001 47,18 37,12 33,20 31,09 29,75 28,84 28,16 27,64 27,24 26,92 26,64 26,42 25,91 25,39 25,14 24,87 24,60 24,33 24,06 23,79

0,05 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
6
0,025 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,27 5,17 5,12 5,07 5,01 4,96 4,90 4,85

0,01 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88

0,001 35,51 27,00 23,70 21,92 20,81 20,03 19,46 19,03 18,69 18,41 18,18 17,99 17,56 17,12 16,89 16,67 16,44 16,21 15,99 15,75

0,05 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 6,60 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
7
0,025 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 3,51 4,47 4,42 4,36 4,31 4,25 4,20 4,14

0,01 12,25 9,55 8,45 7,85 4,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65

0,001 29,25 21,69 18,77 17,19 16,21 15,52 15,02 14,63 14,33 14,08 13,88 13,71 13,32 12,93 12,73 12,53 12,33 12,12 11,91 11,70

0,05 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
8
0,025 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,10 4,00 3,95 3,89 3,84 3,78 3,73 3,67

0,01 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,74 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86

0,001 25,42 18,49 15,83 14,39 13,49 12,86 12,40 12,04 11,77 11,54 11,35 11,19 10,84 10,48 10,30 10,11 9,92 9,73 9,53 9,33

0,05 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
9
0,025 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,77 3,67 3,61 3,56 3,51 3,45 3,39 3,33

0,01 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31

0,001 22,86 16,39 13,90 12,56 11,71 11,13 10,70 10,37 10,11 9,89 9,72 9,57 9,24 8,90 8,72 8,55 8,37 8,19 8,00 7,81

0,05 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
10
0,025 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,52 3,42 3,37 3,31 3,26 3,20 3,14 3,08

0,01 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,78 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91

0,001 21,04 14,91 12,55 11,28 10,48 9,92 9,52 9,20 8,96 8,75 8,59 8,45 8,13 7,80 7,64 7,47 7,30 7,12 6,94 6,76

0,05 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
11
0,025 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,33 3,23 3,17 3,12 3,06 3,00 2,94 2,88

0,01 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60

0,001 19,69 13,81 11,56 10,35 9,58 9,05 8,66 8,35 8,12 7,92 7,76 7,63 7,32 7,01 6,85 6,68 6,52 6,35 6,17 6,00

0,05 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
12
0,025 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,18 3,07 3,02 2,96 2,91 2,85 2,79 2,72

0,01 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36

0,001 18,64 12,97 10,80 9,63 8,89 9,38 8,00 7,71 7,48 7,29 7,14 7,00 6,71 6,40 6,25 6,09 5,93 5,76 5,59 5,42
*
Estes valores devem ser multiplicados por 100.

Estatstica Bsica 226

Tabela A-V (continuao)

2
P
1 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 60 120 Inf.

0,05 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
13
0,025 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 3,05 2,95 2,89 2,84 2,78 2,72 2,66 2,60

0,01 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17

0,001 17,81 12,31 10,21 9,07 8,35 7,86 7,49 7,21 6,98 6,80 6,65 6,52 6,23 5,93 5,78 5,63 5,47 5,30 5,14 4,97

0,05 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,56 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
14
0,025 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,95 2,84 2,79 2,73 2,67 2,61 2,55 2,49

0,01 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00

0,001 17,14 11,78 9,73 8,62 7,92 7,43 7,08 6,80 6,58 6,40 6,26 6,13 5,85 5,56 5,41 5,25 5,10 4,94 4,77 4,60

0,05 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
15
0,025 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,86 2,76 2,70 2,64 2,59 2,52 2,46 2,40

0,01 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87

0,001 16,59 11,34 9,34 8,25 7,57 7,09 6,74 6,47 6,26 6,08 5,94 5,81 5,54 5,25 5,10 4,95 4,80 4,64 4,47 4,31

0,05 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,45 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
16
0,025 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,79 2,68 2,63 2,57 2,51 2,45 2,38 2,32

0,01 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,61 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 2,75

0,001 16,12 10,97 9,00 7,94 7,27 6,81 6,46 6,19 5,98 5,81 5,67 5,55 5,27 4,99 4,85 4,70 4,54 4,39 4,23 4,06

0,05 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
17
0,025 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,72 2,62 2,56 2,50 2,44 2,38 2,32 2,25

0,01 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65

0,001 15,72 10,66 8,73 7,68 7,02 6,56 6,22 5,96 5,75 5,58 5,44 5,32 5,05 4,78 4,63 4,48 4,33 4,18 4,02 3,85

0,05 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
18
0,025 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,67 2,67 2,56 2,50 2,44 2,38 2,32 2,26 2,19

0,01 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,44 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57

0,001 15,38 10,39 8,49 7,46 6,81 6,35 6,02 5,76 5,56 5,39 5,25 5,13 4,87 4,59 4,45 4,30 4,15 4,00 3,84 3,67

0,05 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
19
0,025 5,92 4,51 3,90 3,36 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,62 2,51 2,45 2,39 2,33 2,27 2,20 2,13

0,01 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49

0,001 15,08 10,16 8,28 7,26 6,62 6,18 5,85 5,59 5,39 5,22 5,08 4,97 4,70 4,43 4,29 4,14 3,99 3,84 3,68 3,51

0,05 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
20
0,025 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,57 2,46 2,41 2,35 2,29 2,22 2,16 2,09

0,01 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,30 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42

0,001 14,82 9,95 8,10 7,10 6,46 6,02 5,69 5,44 5,24 5,08 4,94 4,82 4,56 4,29 4,15 4,00 3,86 3,70 3,54 3,38

0,05 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
21
0,025 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,53 2,42 2,37 2,31 2,25 2,18 2,11 2,04

0,01 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36

0,001 14,59 9,77 7,94 6,95 6,32 5,88 5,56 5,31 5,11 4,95 4,81 4,70 4,44 4,17 4,03 3,88 3,74 3,58 3,42 3,26

0,05 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
22
0,025 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,50 2,39 2,33 2,27 2,21 2,14 2,08 2,00

0,01 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31

0,001 14,38 9,61 7,80 6,81 6,19 5,76 5,44 5,19 4,99 4,83 4,70 4,58 4,33 4,06 3,92 3,78 3,63 3,48 3,32 3,15

0,05 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
23
0,025 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,47 2,36 2,30 2,24 2,18 2,11 2,04 1,97

0,01 7,88 5,66 4,76 4,26 3,94 9,71 3,54 3,41 3,30 3,21 3,14 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26

0,001 14,19 9,47 7,67 6,69 6,08 5,65 5,33 5,09 4,89 4,73 4,60 4,48 4,23 3,96 3,82 3,68 3,53 3,38 3,22 3,05

0,05 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
24
0,025 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,44 2,33 2,27 2,21 2,15 2,08 2,01 1,94

0,01 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21

0,001 14,03 9,34 7,55 6,59 5,98 5,55 5,23 4,99 4,80 4,64 4,51 4,39 4,14 3,87 3,74 3,59 3,45 3,29 3,14 2,97

8. Anlise de Regresso e Correlao Linear Simples
227

Tabela A-V (continuao)

2
P
1 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 60 120 Inf.

0,05 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
25
0,025 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,41 2,30 2,24 2,18 2,12 2,05 1,98 1,91

0,01 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,05 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,27 2,17

0,001 13,88 9,22 7,45 6,49 5,88 5,46 5,15 4,91 4,71 4,56 4,42 4,31 4,06 3,79 3,66 3,52 3,37 3,22 3,06 2,89

0,05 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
26
0,025 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,39 2,28 2,22 2,16 2,09 2,03 1,95 1,88

0,01 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,23 2,13

0,001 13,74 9,12 7,36 6,41 5,80 5,38 5,07 4,83 4,64 4,48 4,35 4,24 3,99 3,72 3,59 3,44 3,30 3,15 2,99 2,82

0,05 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,16 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
27
0,025 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,36 2,25 2,19 2,13 2,07 2,00 1,93 1,85

0,01 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,98 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,20 2,10

0,001 13,61 9,02 7,27 6,33 5,73 5,31 5,00 4,76 4,57 4,41 4,28 4,17 3,92 3,66 3,52 3,38 3,23 3,08 2,92 2,75

0,05 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
28
0,025 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,34 2,23 2,17 2,11 2,05 1,98 1,91 1,83

0,01 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,95 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,17 2,06

0,001 13,50 8,93 7,19 6,25 5,66 5,24 4,93 4,69 4,50 4,35 4,22 4,11 3,86 3,60 3,46 3,32 3,18 3,02 2,86 2,69

0,05 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
29
0,025 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,32 2,21 2,15 2,09 2,03 1,96 1,89 1,81

0,01 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,92 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,14 2,03

0,001 13,39 8,85 7,12 6,19 5,59 5,18 4,87 4,64 4,45 4,29 4,16 4,05 3,80 3,54 3,41 3,27 3,12 2,97 2,81 2,64

0,05 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,12 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
30
0,025 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,31 2,20 2,14 2,07 2,01 1,94 1,87 1,79

0,01 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,90 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01

0,001 13,29 8,77 7,05 6,12 5,53 5,12 4,82 4,58 4,39 4,24 4,11 4,00 3,75 3,49 3,36 3,22 3,07 2,92 2,76 2,59

0,05 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
40
0,025 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,18 2,07 2,01 1,94 1,88 1,80 1,72 1,64

0,01 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80

0,001 12,61 8,25 6,60 5,70 5,13 4,73 4,44 4,21 4,02 3,87 3,75 3,64 3,40 3,15 3,01 2,87 2,73 2,57 2,41 2,23

0,05 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
60
0,025 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 2,06 1,94 1,88 1,82 1,74 1,67 1,58 1,48

0,01 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60

0,001 11,97 7,76 6,17 5,31 4,76 4,37 4,09 3,87 3,69 3,54 3,42 3,31 3,08 2,83 2,69 2,55 2,41 2,25 2,08 1,89

0,05 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,86 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
120
0,025 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,94 1,82 1,76 1,69 1,61 1,53 1,43 1,31

0,01 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,40 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38

0,001 11,38 7,32 5,79 4,95 4,42 4,04 3,77 3,55 3,38 3,24 3,12 3,02 2,78 2,53 2,40 2,26 2,11 1,95 1,76 1,54

0,05 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
Inf.
0,025 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,83 1,71 1,64 1,57 1,48 1,39 1,27 1,00

0,01 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,24 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00

0,001 10,83 6,91 5,42 4,62 4,10 3,74 3,47 3,27 3,10 2,96 2,84 2,74 2,51 2,27 2,13 1,99 1,84 1,66 1,45 1,00


BIBLIOGRAFIA

BARBETTA, P.A. Estatstica Aplicada s Cincias Sociais. Florianpolis: Editora da
UFSC. 1998. 316p.
BARBETTA, P.A.; REIS, M.M.; BORNIA, A.C. Estatstica para Cursos de Engenharia
e Informtica. So Paulo: Atlas. 2004. 416p.
BUSSAB, W. O. MORETTIN, P. A. Estatstica Bsica. 5. ed. So Paulo: Saraiva. 2002.
526 p.
BLACKWELL, D. Estatstica Bsica. So Paulo: McGraw-Hill do Brasil. 1974. 143p.
CALZADA B., J. Introduccin a la estadstica. Lima, Per: El Estudiante. 1969. 244p.
CORRA DA SILVA, J.G. Estatstica Bsica. Verso preliminar. Instituto de Fsica e
Matemtica, Universidade Federal de Pelotas. Pelotas, 1992. 173p.
DEVORE, J. Probability and Statistics for Engineering and the Sciences. Monterrey,
California: Brooks/Cole. 1982. 640p.
FONSECA, J.S.; MARTINS, G.A. Curso de Estatstica. 6. ed. So Paulo: Atlas. 1996.
318p.
FREUND, J.E. Mathematical statistics. 2. ed. London: Prentice-Hall. 1972. 463p.
FREUND, J.E.; SIMON, G.A. Estatstica Aplicada - Economia, Administrao e
Contabilidade. 9. ed. Porto Alegre: Bookman. 2000.404p.
FREUND, J.E.; WALPOLE, R.E. Mathematical Statistics, 3. ed. New Jersey: Englewood
Cliffs. 1980. 548p.
HOEL, P.G. Estatstica Elementar. So Paulo: Atlas. 1980. 430p.
LAPIN, L. Statistics - Meaning and Method. 2. ed. New York: Harcourt Brace
Jovanovich. 1980. 543p.
LEVIN, J. Estatstica Aplicada a Cincias Humanas. 2. ed. So Paulo: Harper & Row do
Brasil. 1987. 392p.
LOPES, P.A. Probabilidades & Estatstica - Conceitos, Modelos, Aplicaes em Excel.
Rio de Janeiro: Reichmann & Affonso. 1999. 174p.
MENDENHALL, W. Introduction to Probability and Statistics. 2. ed. Belmont,
California: Wadsworth. 1969. 393p.
MEYER, P.L. Probabilidade - Aplicaes Estatstica. 2. ed. Rio de Janeiro: Livros
Tcnicos e Cientficos. 2000. 426p.
MILLER, I.; FREUND, J.E. Probability and Statistics for Engineers. New Jersey:
Englewood Cliffs. 1965. 432p.
MONTGOMERY, D.C. e RUNGER, G.C. Estatstica Aplicada e Probabilidade para
Engenheiros. Rio de Janeiro: Livros Tcnicos e Cientficos. 2003. 720p.
MONTGOMERY, D.C.; RUNGER, G.C.; HUBELE. N.F. Estatstica Aplicada
Engenharia. 2. ed. Rio de Janeiro: Livros Tcnicos e Cientficos. 2004. 335p.
Estatstica Bsica 230
MOORE, D.S. A Estatstica Bsica e sua Prtica. Rio de Janeiro: Livros Tcnicos e
Cientficos. 2000. 482p.
MOORE, D.S. The Active Practice of Statistics - A Text for Multimedia Learning. New
York: W. H. Freeman. 1997. 432p.
MOORE, D.S. Statistics: Concepts and Controversies. San Francisco: W. H. Freeman.
1979. 313p.
MORETTIN, P.A. Introduo Estatstica para Cincias Exatas. So Paulo: Atual
Editora Ltda. 1981. 211p.
NICK, E.; KELLNER, S.R.O. Fundamentos de Estatstica para as Cincias do
Comportamento. Rio de Janeiro: Renes. 1971. 316p.
PARADINE, C.G.; RIVETT, B.H.P. Mtodos Estatsticos para Tecnologistas. So Paulo:
Polgono/EDUSP. 1974. 350p.
PARADINE, C.G.; RIVETT, B.H.P. Mtodos Estatsticos para Tecnologistas. So Paulo:
Polgono/Universidade de So Paulo. 1974. 350p.
PIMENTEL GOMES, F. Iniciao Estatstica. 6. ed. So Paulo; Livraria Nobel S. A.
1978. 211p.
SILVEIRA JNIOR, P.S.; MACHADO, A.A.; ZONTA, E.P.; SILVA, J.B. Curso de
Estatstica, vol. 1. Pelotas: Editora Universitria, UFPEL. 1989. 135p.
SILVEIRA JNIOR, P.S.; MACHADO, A.A.; ZONTA, E.P.; SILVA, J.B. Curso de
Estatstica, vol. 2. Pelotas: Editora Universitria, UFPEL. 1992. 234p.
SPIEGEL, M.R. Estatstica. So Paulo: McGraw-Hill do Brasil. 1975. 580p.
WALPOLE, R.E. Introduction to Statistics. New York: Macmillan. 1968. 365p.
WALPOLE, R.E.; MYERS, R.H. Probability and Statistics for Engineers and Scientists.
2. ed. New York: Macmillan. 1978. 580p.

Você também pode gostar