Você está na página 1de 221

UNIVERSIDADE FEDERAL DE PELOTAS

INSTITUTO DE FSICA E MATEMTICA


DEPARTAMENTO DE MATEMTICA E ESTATSTICA












E
EEs
sst
tta
aat
tt
s
sst
tti
iic
cca
aa B
BB
s
ssi
iic
cca
aa
Verso Preliminar




Clause Ftima de Brum Piana
Amauri de Almeida Machado
Lisiane Priscila Roldo Selau








Pelotas, 2009.



Sumrio

Unidade I. Introduo

1.1. Consideraes gerais................................................................................................ 5
1.2. Populao e amostra................................................................................................. 5
1.3. Conceito e diviso..................................................................................................... 5
1.4. Informaes histricas.............................................................................................. 6
1.5. Conceitos fundamentais........................................................................................... 7
1.5.1. Caracterstica e varivel.................................................................................... 7
1.5.2. Escalas de medida............................................................................................. 7
1.5.3. Classificao de variveis.................................................................................. 10
1.5.4. Observao e conjunto de dados...................................................................... 10
1.6. Bibliografia................................................................................................................. 12
Unidade II. Estatstica Descritiva

2.1. Apresentao de dados............................................................................................ 14
2.1.1. Sries estatsticas.............................................................................................. 14
2.1.2. Tabelas.............................................................................................................. 18
2.1.3. Grficos.............................................................................................................. 21
2.2. Distribuies de freqncias e grficos.................................................................. 24
2.2.1. Tabelas de classificao simples....................................................................... 24
2.2.2. Tabelas de classificao cruzada...................................................................... 33
2.3. Medidas descritivas................................................................................................... 36
2.3.1. Medidas de localizao ou tendncia central.................................................... 37
2.3.2. Medidas separatrizes......................................................................................... 43
2.3.3. Medidas de variao ou disperso.................................................................... 45
2.3.4. Medidas de formato........................................................................................... 49
2.3.6. Medidas descritivas para dados agrupados em classe..................................... 52
2.4. Anlise exploratria de dados.................................................................................. 57
2.5. Bibliografia................................................................................................................. 64

Unidade III. Elementos de Probabilidade

3.1. Introduo teoria das probabilidades................................................................... 66
3.1.1. Introduo......................................................................................................... 66
3.1.2. Conceitos fundamentais................................................................................... 68
3.1.3. Conceitos de probabilidade.............................................................................. 69
3.1.4. Teoremas para o clculo de probabilidades..................................................... 69
3.1.5. Probabilidade condicional e independncia...................................................... 73
3.2. Variveis aleatrias................................................................................................... 77
3.2.1. Introduo e conceito........................................................................................ 77
3.2.2. Variveis aleatrias discretas........................................................................... 79
3.2.3. Variveis aleatrias contnuas.......................................................................... 86
3.3. Distribuies de probabilidade................................................................................ 92
3.3.1. Distribuies de probabilidade de variveis discretas...................................... 92
3.3.2. Distribuies de probabilidade de variveis contnuas..................................... 104
3.3. Bibliografia................................................................................................................. 117
Unidade IV. Inferncia Estatstica
4.1. Introduo e histrico................................................................................................ 119
4.2. Conceitos fundamentais............................................................................................ 121
4.3. Distribuies amostrais............................................................................................. 124
4.3.1. Distribuies amostrais de algumas estatsticas importantes......................... 130
4.4. Estimao de parmetros.......................................................................................... 137
4.4.1. Conceitos fundamentais.................................................................................. 137
4.4.2. Propriedades dos estimadores........................................................................ 134
4.4.3. Processos de estimao.................................................................................. 135
4.5. Testes de hipteses................................................................................................... 155
4.5.1. Testes para a mdia populacional................................................................... 155
4.5.2. Testes para a varincia populacional.............................................................. 166
4.5.3. Testes para a proporo populacional............................................................ 171
4.6. Quebras nas pressuposies adotadas no processo de inferncia..................... 174
4.6.1. Heterogeneidade de varincias....................................................................... 174
4.6.2. Dependncia entre as amostras...................................................................... 175
4.7. Regresso linear simples.......................................................................................... 179
4.7.1. Introduo................................................................................................. 179
4.7.2. Anlise de regresso....................................................................................... 182

4.8. Testes de qui-quadrado............................................................................................. 196
4.8.1. Consideraes gerais...................................................................................... 196
4.8.2. Estatstica do teste.......................................................................................... 196
4.8.3. Classificao simples...................................................................................... 197
4.8.4. Classificao dupla.......................................................................................... 197
4.8.5. Critrio de deciso........................................................................................... 198
4.9. Bibliografia.................................................................................................................. 203
Apndice
1. Notao somatrio..................................................................................................... 205
2. Noes sobre conjuntos........................................................................................... 206
3. Notao fatorial.......................................................................................................... 209
4. Anlise combinatria................................................................................................. 209
5. Noes sobre derivao e integrao...................................................................... 211
6. Tabelas estatsticas................................................................................................... 213
7. Lista de respostas dos exerccios propostos......................................................... 219






Unidade I
Introduo


1.1. Consideraes gerais................................................................................................ 5
1.2. Populao e amostra................................................................................................. 5
1.3. Conceito e diviso..................................................................................................... 5
1.4. Informaes histricas.............................................................................................. 6
1.5. Conceitos fundamentais........................................................................................... 7
1.5.1. Caracterstica e varivel.................................................................................... 7
1.5.2. Escalas de medida............................................................................................. 7
1.5.3. Classificao de variveis.................................................................................. 10
1.5.4. Observao e conjunto de dados...................................................................... 10
1.6. Bibliografia................................................................................................................. 12

Piana, Machado e Selau Introduo


5
1.1. Consideraes gerais

A coleta, o processamento, a interpretao e a apresentao de dados numricos
pertencem todos aos domnios da estatstica. Essas atribuies compreendem desde o clculo
de pontos em esportes, a coleta de dados sobre nascimentos e mortes, a avaliao da
eficincia de produtos comerciais, at a previso do tempo. A informao estatstica
apresentada constantemente em todos os meios de comunicao de massa: jornais, televiso,
rdio e internet.
Observamos uma abordagem crescentemente quantitativa utilizada em todas as
cincias, na administrao e em muitas atividades que afetam diretamente nossas vidas. Isto
inclui o uso de tcnicas matemticas nas decises econmicas, pblicas ou privadas; na
avaliao de controles de poluio; na anlise de problemas de trfego; no estudo dos efeitos
de vrios medicamentos; na adoo de novas tcnicas agrcolas e novas cultivares; em
estudos demogrficos como crescimento populacional e migrao.
A partir destes poucos exemplos, podemos notar a importncia da Estatstica como
ferramenta necessria para a compreenso dos fenmenos que ocorrem nas mais diferentes
reas.


1.2. Populao e amostra

difcil encontrar duas coisas exatamente iguais. H um pouco de variabilidade em
quase tudo. De modo bem geral, podemos dizer que o objetivo da Estatstica fornecer
mtodos para se conviver, de modo racional, com a variabilidade. Isto feito atravs da
descoberta de regularidade nos dados relativos s situaes em estudo. Para isso, duas ideias
so de fundamental importncia. Primeiramente, embora as observaes sejam variveis
sempre possvel associar a elas a ideia de regularidade e expressar essa regularidade
matematicamente. Por outro lado, devido variabilidade inerente aos indivduos, os pontos de
interesse da Estatstica so referentes aos grupos de indivduos, ou seja, estudamos os
indivduos atravs dos grupos.
Quando estudamos uma determinada caracterstica, geralmente, queremos obter
concluses para o conjunto de todos os indivduos que apresentam tal caracterstica.
Chamamos de populao o conjunto de todos os indivduos ou objetos que apresentam uma
caracterstica em comum. Na maioria dos casos, ao estudarmos uma populao, no temos
acesso a todos os seus elementos. O estudo feito, ento, a partir de uma parte desta
populao, denominada amostra, que tem por objetivo represent-la.


1.3. Conceito e diviso

A Estatstica, durante muitos sculos, esteve relacionada apenas com as informaes
a respeito do Estado. Hoje em dia, o conjunto de teorias, conceitos e mtodos denominado
Estatstica est associado ao processo de descrio e inferncia, debruando-se, de modo
particular, sobre questes relativas a sumarizao eficiente de dados, planejamento e anlise
de experimentos e levantamentos e natureza de erros de medida e de outras causas de
variao em um conjunto de dados.
A estatstica pode ser dividida em duas partes principais: a Estatstica Descritiva e a
Inferncia Estatstica ou Estatstica Analtica.
Enquanto a Estatstica Descritiva cuida do resumo e da apresentao de dados de
observao por meio de tabelas, grficos e medidas, sem se preocupar com as populaes de
onde esses dados foram retirados, a Inferncia Estatstica tem como objetivo fornecer mtodos
que possibilitem a realizao de inferncia sobre populaes a partir de amostras delas
provenientes. A Inferncia Estatstica tem por base o clculo de probabilidades e compreende
dois grandes tpicos: a estimao de parmetros e os testes de hipteses.
Embora a Estatstica Descritiva seja um ramo fundamental da Estatstica, em muitos
casos ela se torna insuficiente. Isto ocorre porque quase sempre as informaes so obtidas
de amostras e, consequentemente, sua anlise exige generalizaes que ultrapassam os
Piana, Machado e Selau Introduo


6
dados disponveis. Essa necessidade, aliada ao desenvolvimento dos mtodos probabilsticos,
promoveu o crescimento da Estatstica pela nfase aos mtodos generalizadores (Inferncia
Estatstica), em acrscimo aos mtodos puramente descritivos.
Alguns exemplos ilustram a necessidade dos mtodos generalizadores:
prever a durao mdia da vida til de uma calculadora, com base no desempenho
de muitas dessas calculadoras;
comparar a eficincia de duas dietas para reduzir peso, com base nas perdas de
peso de pessoas que se submeteram s dietas;
determinar a dosagem ideal de um novo medicamento, com base em testes feitos
em pacientes voluntrios de hospitais selecionados aleatoriamente;
prever o fluxo de trfego de uma rodovia ainda em construo, com base no trfego
observado em rodovias alternativas.
Em todas essas situaes existe incerteza porque dispomos apenas de informaes
parciais, incompletas ou indiretas. A Inferncia Estatstica trata de problemas onde a incerteza
inerente, utilizando mtodos que se fundamentam na teoria das probabilidades. Os mtodos
de inferncia tornam-se necessrios para avaliar a confiabilidade dos resultados observados.


1.4. Informaes histricas

Embora a palavra estatstica ainda no existisse, existem indcios de que h 3000
anos a.C. j se faziam censos na Babilnia, China e Egito.

A prpria Bblia leva-nos a esse resgate histrico:
o livro quarto do Velho Testamento, intitulado Nmeros, comea com a seguinte
instruo a Moiss: Fazer um levantamento dos homens de Israel que estivessem aptos para
guerrear;
na poca do Imperador Csar Augusto, saiu um edito para que se fizesse o censo
em todo o Imprio Romano. Por isso Maria e Jos teriam viajado para Belm.

A Estatstica teve origem na necessidade do Estado Poltico em conhecer os seus
domnios. Sob a palavra estatstica, provavelmente derivada da palavra status (estado, em
latim), acumularam-se descries e dados relativos ao Estado. Nas mos dos governantes, a
Estatstica passou a constituir-se verdadeira ferramenta administrativa.

Em 1085, Guilherme, o Conquistador, ordenou que se fizesse um levantamento
estatstico da Inglaterra, que deveria incluir informaes sobre terras, proprietrios, uso da
terra, empregados, animais e que serviria tambm de base para o clculo de impostos. Esse
levantamento originou um volume intitulado Domesday Book (Livro do dia do juzo final).



No sculo XVII, ganhou destaque na
Inglaterra, a partir das Tbuas de
mortalidade de Jonh Graunt e William
Petty, a aritmtica poltica que
consistiu de exaustivas anlises de
nascimentos e mortes. Dessas
anlises resultou a concluso, entre
outras, de que a percentagem de
nascimentos de crianas do sexo
masculino era ligeiramente superior
de crianas do sexo feminino.



Em 1708, foi organizado o primeiro curso de Estatstica na Universidade de Yena, na
Alemanha.
Jonh Graunt
(1620 - 1674)
William Petty
(1623 - 1687)
Piana, Machado e Selau Introduo


7
A palavra estatstica foi cunhada pelo acadmico alemo Gottfried Achenwall, em
1740. Tambm ele quem estabelece as relaes da Estatstica com outras reas, definindo-
lhe o campo de ao.

Contudo, foi o casamento entre o clculo das probabilidades e a Estatstica, em
meados do sculo XIX, que permitiu que a Estatstica fosse organicamente estruturada e
ampliasse largamente o seu campo de ao. O avano na teoria das probabilidades
possibilitou a descoberta das distribuies de probabilidade e, como consequncia, a criao
de tcnicas de amostragem mais adequadas e de formas de relacionar as amostras com as
populaes de onde provieram.

Outro marco decisivo no desenvolvimento dos mtodos estatsticos foi o advento da
computao eletrnica, ferramenta valiosssima que permitiu que a Estatstica alargasse ainda
mais os seus horizontes.


1.5. Conceitos fundamentais


1.5.1. Caracterstica e varivel

As unidades de uma populao se distinguem e se caracterizam por um conjunto de
particularidades, propriedades ou atributos. Cada uma dessas particularidades ou propriedades
uma caracterstica ou atributo da populao e de suas unidades. Cada caracterstica pode
manifestar-se nas unidades sob diferentes alternativas ou nveis. Por exemplo, sexo e grau de
instruo so caractersticas de indivduos de uma populao. Os nveis (alternativas) para a
caracterstica sexo so dois: masculino e feminino, e para a caracterstica grau de instruo
poderiam ser quatro: fundamental, mdio, graduao e ps-graduao.
Em geral, o conjunto de caractersticas das unidades de uma populao
demasiadamente vasto e no totalmente conhecido para ser completamente descrito. Assim,
apenas as caractersticas relevantes numa pesquisa especfica que so consideradas. O
conjunto dessas caractersticas ir depender dos objetivos e das condies de realizao da
pesquisa. Desse modo, o interesse estar sempre focalizado no nas unidades em si, mas nas
suas caractersticas relevantes.
O termo varivel utilizado genericamente para indicar aquilo que sujeito variao
ou inconstncia. No contexto da pesquisa cientfica, uma varivel definida como a funo
que estabelece uma correspondncia entre os nveis de uma caracterstica e os valores de um
conjunto numrico segundo uma escala de medida. Em outras palavras, uma varivel uma
caracterstica populacional que pode ser medida de acordo com alguma escala.


1.5.2. Escalas de medida

O termo escala de medida usualmente relacionado com instrumentos como rgua,
balana, copos de medida, utilizados para determinar comprimento, peso, volume, etc. Ou seja,
comumente tende-se a associar a mensurao com um processo de medida fsica com escala
bem definida que possui uma origem ou ponto zero natural e uma unidade de medida
constante. Frequentemente, entretanto, caractersticas devem ser representadas por escalas
menos informativas, que no possuem as propriedades associadas com a maioria das medidas
fsicas.
Podemos classificar as escalas de medida em quatro categorias: escala nominal,
escala ordinal, escala intervalar e escala de razo ou racional. Cada escala de medida possui
seu prprio conjunto de pressuposies referentes correspondncia de nmeros com
entidades do mundo real e ao significado da realizao das vrias operaes matemticas
sobre esses nmeros. A complexidade e a informao aumentam conforme aumenta o nvel da
escala de medida.

Piana, Machado e Selau Introduo


8
Escala nominal

Uma varivel de escala nominal classifica as unidades em classes ou categorias
quanto caracterstica que representa, no estabelecendo qualquer relao de grandeza ou de
ordem. denominada nominal porque duas categorias quaisquer se diferenciam apenas pelo
nome.
A escala nominal a menos restritiva. A igualdade ou equivalncia de classes
caracterizada pelas seguintes trs propriedades:
reflexividade: cada unidade em uma classe igual a ela prpria;
simetria: para cada duas unidades em uma mesma classe, sejam A e B, A=B implica
B=A;
transitividade: para quaisquer trs unidades em uma classe, sejam A, B e C, A=B e
B=C implica A=C.

Os rtulos das categorias eventualmente podem ser numricos, mas operaes
aritmticas sobre esses nmeros no tm qualquer significado com respeito aos objetos do
mundo real que eles identificam. A escala nominal permite apenas algumas operaes
aritmticas mais elementares. Pode-se contar o nmero de elementos de cada classe e
determinar a classe mais numerosa ou efetuar testes de hipteses estatsticas referentes
distribuio das unidades da populao nas classes. Como uma escala nominal apenas
classifica unidades, mas no infere grau ou quantidade, as vrias classes no podem ser
manipuladas matematicamente (por exemplo, por adio ou subtrao de equivalentes
numricos daquelas classes). Consequentemente, a maioria das estatsticas usuais, como
mdia e desvio padro no tm sentido, pois as operaes para sua determinao no so
permitidas. Se tudo o que pode ser dito sobre um objeto que ele diferente de outros, ento
a escala de medida nominal.


Escala ordinal

Uma varivel de escala ordinal classifica as unidades em classes ou categorias quanto
caracterstica que representa, estabelecendo uma relao de ordem entre as unidades
pertencentes a categorias distintas. A escala ordinal uma escala de ordenao, designando
uma posio relativa das classes segundo uma direo. Qualquer conjunto de valores que
preservem a ordem so vlidos para essa varivel tornando, dessa forma, a escala ordinal
invariante sob transformaes que preservem a ordem. Ou seja, uma escala ordinal pode ser
transformada em outra escala ordinal. Isto implica que, se eventualmente forem empregados
nmeros para representar as classes, apenas a propriedade de ordem deve ser respeitada.
Assim como na escala nominal, operaes aritmticas (somas, diferenas, etc.) entre
esses valores no tm sentido. A escala ordinal mantm a propriedade da equivalncia de
classes da escala nominal, no sentido de que unidades equivalentes recebem a mesma ordem.
Alm da propriedade de simetria da escala nominal, a escala ordinal tem a propriedade de
assimetria. Isso significa que classes podem ser designadas no apenas como equivalentes a
outras classes, mas tambm como no equivalentes. Assim, por exemplo, uma escala ordinal
pode designar que a classe A maior do que a classe B e, portanto, que a classe B menor
que a classe A. A propriedade de transitividade preservada na escala ordinal: se a classe A
maior ou mais elevada que a classe B, qualquer unidade particular da classe A maior ou mais
elevada que qualquer unidade especfica da classe B.
Essas propriedades adicionais caracterizam a superioridade da escala ordinal em
relao escala nominal. Entretanto, as descries estatsticas ainda so limitadas. As
medidas descritivas restringem-se ao grupo das medidas de ordem (separatrizes) porque as
operaes aritmticas usuais no podem ser efetuadas com smbolos que caracterizam apenas
ordem e designam quantidade vagamente. Alguns procedimentos estatsticos so
especificamente apropriados para dados de ordem. Se o que pode ser dito sobre um objeto
que ele maior, melhor, mais colorido, etc. que outro, ento a escala ordinal.


Piana, Machado e Selau Introduo


9
Escala intervalar

Uma varivel de escala intervalar, alm de ordenar as unidades quanto
caracterstica mensurada, possui uma unidade de medida constante. A escala intervalar, ou
escala de intervalo, aproxima-se da concepo comum de medida, mas no possui uma origem
(ou ponto zero) nica. O ponto zero dessa escala arbitrrio e no expressa ausncia de
quantidade.
Os exemplos mais comuns de escala de intervalo so as escalas Celsius e Fahrenheit,
usadas para medir a temperatura. Cada uma dessas escalas assinala um zero arbitrrio e
diferenas de temperatura iguais so determinadas atravs da identificao de volumes iguais
de expanso no lquido usado no termmetro. Dessa forma, a escala de intervalo permite
inferncias referentes a diferenas entre unidades a serem medidas, mas no se pode dizer
que um valor em um intervalo especfico da escala seja um mltiplo de outro. Por exemplo, a
mensurao da temperatura de unidades permite determinar quanto uma mais quente do que
outra, mas no correto dizer que um objeto com 30
o
C est duas vezes mais quente que um
com temperatura de 15
o
C.
Segundo a frmula de converso de graus Celsius para graus Fahrenheit,
= + F 9 5C 32, essas temperaturas, 30
o
C e 15
o
C, expressas em graus Fahrenheit so,
respectivamente 86
o
F e 59
o
F, que no esto na razo 2:1. Pode-se dizer, entretanto, que uma
diferena entre dois valores em uma escala um mltiplo de uma diferena entre dois outros
valores. Por exemplo, a diferena 30 C 0 C o dobro da diferena 15 C 0 C. As
correspondentes diferenas na escala Fahrenheit so 86F 32 C e 59F 32 C, que esto
na mesma razo 2:1.
A escala intervalar invariante sob transformaes lineares positivas (ou seja,
transformaes da forma = + > y a bx, b 0 ). Isso significa que uma escala de intervalo pode ser
transformada em outra por meio de uma transformao linear positiva. A transformao de
graus Celsius em Fahrenheit um exemplo de transformao linear.
A maioria das medidas descritivas, tais como mdia, desvio padro, coeficiente de
correlao, requer apenas escala de intervalo. Entretanto, algumas medidas, como o
coeficiente de variao, podem ser enganosas quando aplicadas a dados de varivel de escala
intervalar. Se o que pode ser dito sobre um objeto que ele tantas unidades maior que outro,
ento a escala de medida intervalar.


Escala de razo

Uma varivel de escala de razo ou racional ordena as unidades quanto
caracterstica mensurada, possui uma unidade de medida constante e sua origem (ou ponto
zero) nica. Nessa escala o valor zero expressa ausncia de quantidade. A escala de razo,
ou escala racional, a mais elaborada das escalas de medida, no sentido de que permite todas
as operaes aritmticas. a escala de medida mais comum nas cincias fsicas, tais como as
escalas para a medida de comprimento, peso, etc.
Conforme a designao sugere, razes iguais entre valores da escala racional
correspondem a razes iguais entre as unidades mensuradas. Dessa forma, escalas de razo
so invariantes sob transformaes de proporo positivas, ou seja, transformaes da forma
= > y cx, x 0 . Por exemplo, se uma unidade tem 3m e a outra 1m, pode-se dizer que a primeira
unidade tem altura 3 vezes superior a da segunda. Isso porque, se as alturas das duas
unidades forem transformadas em centmetros, suas medidas sero, respectivamente, 300cm e
100cm, que esto na mesma razo 3:1. Pode-se efetuar a transformao das medidas de uma
escala racional para outra escala racional meramente pela multiplicao por uma constante
apropriada. Se puder ser dito que um objeto tantas vezes maior, mais pesado, etc. que outro,
ento a escala de medida de razo.
A escala racional contm toda a informao das escalas de nvel mais baixo, ou seja,
igualdade de classe, ordem e igualdade de diferenas, e mais ainda. Todas as medidas
descritivas podem ser determinadas para dados de uma varivel expressa em escala racional.

Piana, Machado e Selau Introduo


10
1.5.3. Classificao de variveis

De modo geral, as variveis podem ser divididas em dois grupos: variveis categricas
e variveis numricas.

As variveis categricas, tambm denominadas fatores de classificao ou
simplesmente fatores, so aquelas cujos valores representam categorias ou classes.
Caracterizam-se por possuir um conjunto limitado de valores (nveis) que usualmente se
repetem entre as unidades. As variveis categricas podem ser qualitativas ou quantitativas.

Variveis categricas qualitativas descrevem qualidades e, de acordo com a escala de
medida, so classificadas em:
Nominais: quando no houver um sentido de ordenao entre os seus possveis
valores. Exemplos: sexo (com os nveis masculino e feminino), raa de cavalos (com os nveis
manga-larga, crioulo e rabe, por exemplo), regio geogrfica (com os nveis norte, sul,
sudeste e leste), estado civil (com os nveis solteiro, casado e divorciado, por exemplo),
linhagens de uma cultivar em um processo de melhoramento vegetal, etc.
Ordinais: quando houver um sentido de ordenao entre os seus possveis valores.
Exemplos: faixas de idade (criana, adolescente, adulto, idoso), intensidade de cor (claro,
escuro), intensidade de infestao (forte, mdia, fraca), grau de instruo (fundamental, mdio,
graduao, ps-graduao) etc.

Variveis categricas quantitativas descrevem quantidades. Possuem os mesmos
atributos das variveis qualitativas, mas, uma vez que seus nveis expressam quantidade, a
cada nvel est associado um valor, denominado valor do nvel. Por exemplo, se uma varivel
exprime a quantidade de um tranquilizante utilizado contra a insnia, ento os nveis podero
ser Dose 1, Dose 2 e Dose 3 e as quantidades (valores) associadas podero ser 0, 2 e 4 mg.

As variveis numricas so aquelas cujos valores so nmeros reais, de modo que
cada valor representa um valor da varivel e no uma categoria ou uma classe. De acordo com
o processo de obteno dos seus dados (valores), as variveis numricas so classificadas
em:
Discretas: descrevem dados discretos ou de enumerao, ou seja, obtidos por
processo de contagem. As variveis discretas s podem assumir valores do conjunto dos
nmeros inteiros no negativos (0, 1, 2, 3, ...). Exemplos: nmero de sementes germinadas,
nmero de pacientes que se recuperam, nmero de frutos estragados, nmero de filhos de um
casal, etc.
Contnuas: descrevem dados contnuos ou de mensurao, ou seja, obtidos por
processo de medio. As variveis contnuas podem assumir qualquer valor do conjunto dos
reais (-10, 0, 2 , ). Exemplos: peso, altura, tempo de sono, teor de umidade, temperatura
corporal, etc.

Observemos que variveis categricas quantitativas so, de certa forma, variveis
numricas, mas, nesse caso, os valores representam quantidades associadas a categorias
(nveis do fator).
A classificao correta de uma varivel fundamental, uma vez que esta
discriminao que ir indicar a possibilidade e a forma de utilizao dos procedimentos
estatsticos disponveis.


1.5.4. Observao e conjunto de dados

Os nmeros, taxas e outras informaes coletados em experimentos ou
levantamentos so denominamos dados. Todo dado um valor de uma varivel (numrico ou
no numrico). A unidade da populao em que so medidas as variveis de interesse
chamada de unidade de observao. Uma planta, por exemplo, pode ser a unidade de
Piana, Machado e Selau Introduo


11
observao em uma determinada pesquisa. Os valores obtidos para a varivel medida nas
unidades de observao (nas plantas) so os dados.

Observao o conjunto de valores referentes a todas as variveis medidas em uma
unidade de observao. Por exemplo, os valores referentes ao peso de matria seca,
estatura e ao nmero de perfilhos de uma planta constituem uma observao. O conjunto de
todas as observaes, ou seja, todos os valores referentes a todas as unidades de observao,
constituem o conjunto de dados.

As variveis so representadas por letras maisculas (X, Y, Z, etc) e os seus valores
(dados) por letras minsculas (x, y, z, etc.). Assim, se uma varivel representada por X (xis
maisculo), todos os seus valores sero representados por x (xis minsculo).
Para diferenciar ou individualizar os valores de uma varivel, acrescenta-se um ndice
i = 1, 2, ..., n, que representa a unidade ou a observao. Assim, um conjunto de n valores de
uma varivel X ser representado por x
1
, x
2
, x
3
, ..., x
n
.

Como exemplo, tomemos o conjunto de dados apresentado na tabela abaixo. Esse
conjunto constitudo por 19 unidades ou observaes (i), uma varivel identificadora (nome),
uma varivel do tipo fator (sexo) e trs variveis numricas contnuas (idade, estatura e peso).

i Nome Sexo Idade Estatura Peso
1 Alfredo M 14 1,75 51,03
2 Carol F 14 1,60 46,49
3 Jane F 12 1,52 38,33
4 Joo M 12 1,50 45,13
5 Lusa F 12 1,43 34,93
6 Roberto M 12 1,65 58,06
7 William M 15 1,69 50,80
8 Brbara F 13 1,66 44,45
9 Juca M 12 1,46 37,65
10 Joca M 13 1,59 38,10
11 Judite F 14 1,63 40,82
12 Felipe M 16 1,83 68,04
13 Tomas M 11 1,46 38,56
14 Alice F 13 1,44 38,10
15 Henrique M 14 1,61 46,49
16 Janete F 15 1,59 51,03
17 Joice F 11 1,30 22,91
18 Maria F 15 1,69 50,80
19 Ronaldo M 15 1,70 60,33

Este conjunto de dados representado simbolicamente na tabela abaixo.

i A B X Y Z
1 a
1
b
1
x
1
y
1
z
1

2 a
2
b
2
x
2
y
2
z
2

3 a
3
b
3
x
3
y
3
z
3

... ... ... ... ... ...
19 a
19
b
19
x
19
y
19
z
19




Piana, Machado e Selau Introduo


12
1.6. Bibliografia


COSTA, S.F. Introduo Ilustrada Estatstica (com muito humor!). 2.ed., So Paulo:
Harbra, 1992. 303p.

FARIA, E.S. de. Estatstica. Edio 97/1. (Apostila)

FERREIRA, D.F. Estatstica Bsica. Lavras: Editora UFLA, 2005, 664p.

FREUND, J.E., SIMON, G.A. Estatstica Aplicada. Economia, Administrao e
Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p.

PIMENTEL GOMES, F. Iniciao Estatstica. So Paulo: Nobel, 1978. 211p.

SILVA, J.G.C. da. Estatstica experimental: anlise estatstica de experimentos. (Apostila)
2000. 318p.

SILVEIRA JNIOR, P., MACHADO, A.A., ZONTA, E.P., SILVA, J.B. da Curso de Estatstica.
v.1, Pelotas: Universidade Federal de Pelotas, 1989. 135p.

SPIEGEL, M.R. Estatstica. So Paulo: McGraw-Hill, 1972. 520p.

Sistema Galileu de Educao Estatstica. Disponvel em: http://www.galileu.esalq.usp.br






Unidade II
Estatstica Descritiva


2.1. Apresentao de dados............................................................................................ 14
2.1.1. Sries estatsticas............................................................................................. 14
2.1.2. Tabelas............................................................................................................. 18
2.1.3. Grficos............................................................................................................. 21
2.2. Distribuies de frequncias e grficos.................................................................. 24
2.2.1. Tabelas de classificao simples...................................................................... 24
2.2.2. Tabelas de classificao cruzada..................................................................... 33
2.3. Medidas descritivas................................................................................................... 36
2.3.1. Medidas de localizao ou tendncia central................................................... 37
2.3.2. Medidas separatrizes........................................................................................ 43
2.3.3. Medidas de variao ou disperso................................................................... 45
2.3.4. Medidas de formato.......................................................................................... 49
2.3.5. Medidas descritivas para dados agrupados em classe.................................... 52
2.4. Anlise exploratria de dados.................................................................................. 57
2.5. Bibliografia................................................................................................................. 64

Piana, Machado e Selau Estatstica Descritiva


14
2. Estatstica Descritiva

O mtodo cientfico, quando aplicado para soluo de um problema cientfico,
frequentemente gera dados em grande quantidade e de grande complexidade. Desse modo, a
anlise da massa de dados individuais, na maioria das vezes, no revela a informao
subjacente, gerando a necessidade de algum tipo de condensao ou resumo dos dados.
A Estatstica Descritiva a parte da Estatstica que desenvolve e disponibiliza
mtodos para resumo e apresentao de dados estatsticos com o objetivo de facilitar a
compreenso e a utilizao da informao ali contida.
Em resumo, a Estatstica Descritiva tem por finalidade a utilizao de tabelas, grficos,
diagramas, distribuies de frequncia e medidas descritivas para:
examinar o formato geral da distribuio dos dados;
verificar a ocorrncia de valores atpicos;
identificar valores tpicos que informem sobre o centro da distribuio;
verificar o grau de variao presente nos dados.
Evidentemente, a validade do resumo dos dados est intimamente ligada quantidade
de informao disponvel e qualidade da obteno dos dados. Pode-se pensar que todo
mtodo descritivo possui uma entrada, os dados, e uma sada, que pode ser uma medida
descritiva ou um grfico. Se a entrada deficiente a sada tambm ser de m qualidade.


2.1. Apresentao de dados

2.1.1. Sries Estatsticas

A reunio ou agrupamento de dados estatsticos, quando apresentados em tabelas ou
em grficos, para apreciao ou investigao, determina o surgimento das sries estatsticas.
As sries estatsticas resumem um conjunto ordenado de observaes atravs de trs
fatores fundamentais:
a) tempo: refere-se a data ou a poca em que o fenmeno foi investigado;
b) espao: refere-se ao local ou regio onde o fato ocorreu;
c) espcie: refere-se ao fato ou fenmeno que est sendo investigado e cujos
valores numricos esto sendo apresentados.
As sries estatsticas so classificadas de acordo com o fator que estiver variando,
podendo ser simples ou mistas.


Sries simples: so aquelas em que apenas um fator varia. Podem ser de trs tipos:

Srie histrica (temporal ou cronolgica ou evolutiva): onde varia o tempo
permanecendo fixos o espao e a espcie do fenmeno estudado.

Exemplo:

Tabela 2.1. Casos de sarampo notificados no Brasil de 1987 a 1992.

Ano Nmero de casos
1987 65.459
1988 26.173
1989 55.556
1990 61.435
1991 45.532
1992 7.934
Fonte: Anurios estatsticos IBGE.
Piana, Machado e Selau Estatstica Descritiva


15
Srie geogrfica (territorial ou regional): onde varia o espao permanecendo fixos o
tempo e a espcie do fenmeno estudado.

Exemplo:

Tabela 2.2. Necessidades mdias de energia em alguns pases, em
1973.

Pas kcal/per capita/dia
Brasil 2.174
Estados Unidos 2.397
Etipia 2.120
Japo 1.125
Mxico 2.114
Fonte: Necessidades Humanas de Energia IBGE.


Srie especificativa (qualitativa ou categrica): onde varia a espcie do fenmeno
estudado permanecendo fixos o tempo e espao.

Exemplo:

Tabela 2.3. Abate de animais, por espcie, no Brasil, em 1993.

Espcie Nmero de cabeas
Aves 1.232.978.796
Bovinos 14.951.359
Sunos 13.305.932
Ovinos 926.818
Caprinos 803.188
Equinos 165.691
Fonte: Anurio Estatstico do Brasil (1994).


Sries mistas: so aquelas em que mais de um fator varia ou um fator varia mais de
uma vez.

Exemplos:

Srie histrica geogrfica (ou geogrfica histrica)

Tabela 2.4. Taxa de atividade feminina urbana (em percentual) em trs
regies do Brasil, 1981/90.

Ano
Regio
1981 1984 1986 1990
Norte 28,9 30,3 34,0 37,1
Nordeste 30,2 32,6 34,3 37,8
Sudeste 34,9 37,2 40,1 40,7
Fonte: Anurio Estatstico do Brasil (1992).
Piana, Machado e Selau Estatstica Descritiva


16
Srie especificativa geogrfica (ou geogrfica especificativa)


Tabela 2.5. Consumo per capita anual de alguns tipos de alimentos, em
algumas regies metropolitanas do Brasil, no ano de 1988.

Consumo (kg)
Cidade
Hortalias Carnes Pescado
Belo Horizonte 44,5 21,6 1,3
Rio de Janeiro 54,3 24,7 4,9
So Paulo 46,7 26,1 2,9
Curitiba 36,2 24,1 1,7
Porto Alegre 48,9 34,2 1,5
Fonte: Anurio Estatstico do Brasil (1992).



Srie especificativa histrica (ou histrica especificativa)


Tabela 2.6. Taxa de mortalidade (em percentual) de menores de um ano no Brasil,
segundo as trs principais causas, no perodo de 1984 a 1987.

Causa 1984 1985 1986 1987
Doenas infecciosas intestinais 20,6 17,3 17,9 16,8
Pneumonia 12,1 11,7 12,0 10,8
Perinatal 42,4 45,8 45,3 48,0
Fonte: Informe Epidemiolgico SUS.



Srie especificativa histrica geogrfica


Tabela 2.7. Nmero de vtimas em acidentes, segundo as grandes regies do
Brasil, nos anos de 1991 e 1992.

Vtimas fatais Vtimas no fatais
Regio
1991 1992 1991 1992
Norte 1.188 1.165 10.229 9.739
Nordeste 3.857 3.843 23.774 23.942
Sudeste 11.555 10.217 130.938 159.669
Sul 4.402 4.213 61.797 58.832
Centro-Oeste 2.220 1.949 22.147 22.086
Brasil 23.222 21.387 248.885 274.268
Fonte: Anurio Estatstico do Brasil (1994).

Piana, Machado e Selau Estatstica Descritiva


17
Srie distribuio de frequncias: ocorre quando nenhum dos fatores varia. Nesta
srie os dados so agrupados em classes (intervalos com limites predeterminados) segundo
suas respectivas frequncias. Segundo a natureza dos dados, as distribuies de frequncias,
podem ser de dois tipos.


Para dados de enumerao

Tabela 2.8. Nmero de alarmes falsos, acionados acidentalmente ou por
mau funcionamento do equipamento, recebidos diariamente por uma
empresa de segurana, na cidade de Pelotas, no ms de abril de 2003.

Classes
(Nmero de alarmes falsos)
Frequncia
(Nmero de dias)
2 2
3 6
4 8
5 4
6 5
7 3
8 2
Total 30
Fonte: Dados fictcios.


Para dados de mensurao

Tabela 2.9. Peso de 80 estudantes da Escola So Jos,
em 1980.

Classes
(Peso, em kg)
Frequncia
(Nmero de estudantes)
40 | 50 12
50 | 60 28
60 | 70 25
70 | 80 10
80 | 90 5
Total 80
Fonte: Dados fictcios.


A srie distribuio de frequncias ser abordada com maiores detalhes na Seo 2.2
desta unidade.

Piana, Machado e Selau Estatstica Descritiva


18
2.1.2. Tabelas

A tabela a forma no discursiva de apresentar informaes, das quais o dado
numrico se destaca como informao central. Sua finalidade apresentar os dados de modo
ordenado, simples e de fcil interpretao, fornecendo o mximo de informao num mnimo de
espao.
A construo de uma tabela, entretanto, deve obedecer a uma srie de normas
tcnicas. Estas normas podem ser encontradas na publicao do IBGE intitulada "Normas de
Apresentao Tabular" que tem como objetivo orientar a apresentao racional e uniforme de
dados estatsticos na forma tabular.
Seguem abaixo algumas das principais normas e recomendaes.

Elementos da tabela

Uma tabela estatstica composta de elementos essenciais e elementos
complementares. Os elementos essenciais so:

Ttulo: a indicao que precede a tabela contendo a designao do fato observado,
o local e a poca em que foi estudado.
Corpo: o conjunto de linhas e colunas onde esto inseridos os dados.
Cabealho: a parte superior da tabela que indica o contedo das colunas.
Coluna indicadora: a parte da tabela que indica o contedo das linhas.

Os elementos complementares so:

Fonte: entidade que fornece os dados ou elabora a tabela.
Notas: informaes de natureza geral, destinadas a esclarecer o contedo das
tabelas.
Chamadas: informaes especficas destinadas a esclarecer ou conceituar dados
numa parte da tabela. Devero estar indicadas no corpo da tabela, em nmeros arbicos entre
parnteses, esquerda nas casas e direita na coluna indicadora.

Os elementos complementares devem situar-se no rodap da tabela, na mesma
ordem em que foram descritos.

Nmero da tabela

Uma tabela deve ter nmero para identific-la sempre que o documento apresentar
uma ou mais tabelas, permitindo, assim, a sua localizao. A identificao da tabela deve ser
feita em nmeros arbicos, de modo crescente, precedidos da palavra Tabela, podendo ou no
ser subordinada a captulos ou sees de um documento. Exemplos: Tabela 5, Tabela 10.4.

Apresentao de dados numricos

Toda tabela deve ter dado numrico para informar a quantificao de um fato
especfico observado, o qual deve ser apresentado em nmeros arbicos.
A parte inteira dos dados numricos deve ser separada por pontos ou espaos de trs
em trs algarismos, da direita para a esquerda, por exemplo: 12.243.527 ou 12 243 527. A
separao da parte inteira da decimal deve ser feita por vrgula, por exemplo: 25,67.
No sistema ingls, a separao da parte inteira feita por vrgula, e a separao da
parte inteira da decimal feita por ponto, ou seja, o inverso do sistema brasileiro.

Sinais convencionais

Sempre que um dado numrico no puder ser apresentado, o mesmo deve ser
substitudo por um sinal convencional. A substituio de um dado numrico deve ser feita por
um dos sinais abaixo, conforme o caso.
Piana, Machado e Selau Estatstica Descritiva


19
a) (trao): indica dado numrico igual a zero no resultante de arredondamento;
b) .. (dois pontos): indica que no se aplica dado numrico;
c) ... (trs pontos): indica dado numrico no disponvel;
d) x (xis): indica dado numrico omitido a fim de evitar a individualizao da
informao;
e) 0, 0,0 ou 0,00: indica dado numrico igual a zero resultante de arredondamento.
f) ? (interrogao): quando h dvida sobre a veracidade da informao.

Quando uma tabela contiver sinais convencionais, estes devero ser apresentados em
nota geral com seus respectivos significados.

Arredondamento

Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o
ltimo algarismo a permanecer. Exemplo: 48,23 48,2.
Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9, aumenta-se de uma
unidade o ltimo algarismo a permanecer. Exemplo: 23,87 23,9.

Unidade de medida

Uma tabela deve ter unidade de medida, inscrita no cabealho ou nas colunas
indicadoras, sempre que houver necessidade de se indicar, complementarmente ao ttulo, a
expresso quantitativa ou metrolgica a dos dados numricos.
Esta indicao deve ser feita com smbolos ou palavras, entre parnteses. Exemplos:
(m) ou (metros), (t) ou (toneladas), (R$) ou (reais).

uando os dados numricos forem divididos por uma constante, esta deve ser indicada
por algarismos arbicos, smbolos ou palavras, entre parnteses, precedendo a unidade de
medida, quando for o caso. Exemplos:
(1.000 t): indica dados numricos em toneladas que foram divididos por mil;
(1.000 R$): indica dados numricos em reais que foram divididos por mil;
(%) ou (percentual): indica dados numricos proporcionais a cem;
(1/1.000): indica dados numricos divididos por 1/1.000, ou seja, multiplicados por mil.

Classe de frequncia

A classe de frequncia cada um dos intervalos no superpostos em que se divide
uma distribuio de frequncias. Toda classe deve ser apresentada, sem ambiguidade, por
extenso ou com notao.
Toda a classe que inclui o extremo inferior do intervalo (EI) e exclui o extremo superior
(ES), deve ser apresentada de uma destas duas formas:

EI | ES ou [EI; ES)

Apresentao de tempo

Toda a srie histrica consecutiva deve ser apresentada por seus pontos inicial e final,
ligados por hfen (). Exemplos:
1892-912: quando varia o sculo;
1960-65: quando variam os anos dentro do sculo;
out 1991 - mar 1992: quando variam os meses dentro de anos.

Toda a srie histrica no consecutiva deve ser apresentada por seus pontos inicial e
final, ligados por barra (/). Exemplos:
1981/85: indica dados no apresentados para pelo menos um ano do intervalo;
out 1991 / mar 1992: indica dados no apresentados para pelo menos um ms do
intervalo.
Piana, Machado e Selau Estatstica Descritiva


20
Apresentao da tabela

O corpo da tabela deve ser delimitado, no mnimo, por trs traos horizontais.
Recomenda-se no delimitar as tabelas direita e esquerda por traos verticais.
facultativo o uso de traos verticais para a separao de colunas no corpo da tabela.
Quando, por excessiva altura, a tabela tiver que ocupar mais de uma pgina, no
deve ser delimitada inferiormente, repetindo-se o cabealho na pgina seguinte. Deve-se usar
no alto do cabealho a palavra continuao ou concluso, conforme o caso.
Se possuir muitas linhas e poucas colunas, poder ser apresentada em duas ou
mais partes dispostas lado a lado e separadas por trao duplo.
A disposio da tabela deve estar na posio normal de leitura. Caso isso no seja
possvel, a apresentao ser feita de forma que a rotao da pgina seja no sentido horrio.

Exemplo:

Tabela 2.10. Total de estabelecimentos, pessoal ocupado, valor da produo e valor da
transformao industrial das indstrias metalrgicas, por Unidade da Federao do Brasil,
1982.
Unidade da Federao
Total de
estabelecimentos
Pessoal
ocupado
(1)

Valor da produo
(2)

(1.000 Cr$)

Valor da transformao
industrial (1.000 Cr$)
Rondnia 1 x x x
Acre 2 x x x
Amazonas 31 1.710 21.585 10.103
Roraima 2 x x x
Par 43 1.675 6.492 3.287
Amap
Maranho 14 328 498 251
Piau 12 193 454 159
Cear 74 5.336 21.732 10.878
Rio Grande do Norte 11 343 1.267 383
Paraba 30 794 2.089 1.265
Pernambuco 105 5.171 44.673 14.506
Alagoas 20 439 4.101 1.768
Sergipe 20 423 1.447 534
Bahia 116 5.527 89.072 27.679
Minas Gerais 736 54.264 954.258 306.856
Esprito Santo 42 2.281 22.923 6.297
Rio de Janeiro 847 40.768 635.731 177.358
So Paulo 4.699 272.983 2.531.363 939.032
Paran 449 11.118 43.797 22.014
Santa Catarina 305 10.816 84.294 41.894
Rio Grande do Sul 706 30.103 156.680 74.316
Mato Grosso do Sul 29 485 1.643 623
Mato Grosso 13 528 884 686
Gois 106 2.686 9.860 4.800
Distrito Federal 28 843 2.577 1.301
Brasil 8.452 448.932 4.637.512 1.646.043
Fonte: Pesquisa Industrial - 1982-1984. Dados gerais, Brasil. Rio de Janeiro: IBGE, v.9, 410p.
Nota: Sinais convencionais utilizados:
x Dado numrico omitido a fim de evitar a individualizao da informao.
Dado numrico igual a zero no resultante de arredondamento.
(1)
Em 31.12.1982.
(2)
Inclui o valor dos servios prestados a terceiros e a estabelecimentos da mesma empresa.

Piana, Machado e Selau Estatstica Descritiva


21
2.1.3. Grficos

Outro modo de apresentar dados estatsticos sob uma forma ilustrada, comumente
chamada de grfico. Os grficos constituem-se numa das mais eficientes formas de
apresentao de dados.
Um grfico , essencialmente, uma figura construda a partir de uma tabela; mas,
enquanto a tabela fornece uma ideia mais precisa e possibilita uma inspeo mais rigorosa aos
dados, o grfico mais indicado para situaes que visem proporcionar uma impresso mais
rpida e maior facilidade de compreenso do comportamento do fenmeno em estudo.
Os grficos e as tabelas se prestam, portanto, a objetivos distintos, de modo que a
utilizao de uma forma de apresentao no exclui a outra.
Para a confeco de um grfico, algumas regras gerais devem ser observadas:


Normas para representao grfica

Os grficos, geralmente, so construdos num sistema de eixos chamado sistema
cartesiano ortogonal. A varivel independente localizada no eixo horizontal (abscissas),
enquanto a varivel dependente colocada no eixo vertical (ordenadas). No eixo vertical, o
incio da escala dever ser sempre zero, ponto de encontro dos eixos.
Iguais intervalos para as medidas devero corresponder a iguais intervalos para as
escalas. Exemplo: Se ao intervalo 10-15 kg corresponde 2 cm na escala, ao intervalo 40-45 kg
tambm dever corresponder 2 cm, enquanto ao intervalo 40-50 kg corresponder 4 cm.
O grfico dever possuir ttulo, fonte, notas e legenda, ou seja, toda a informao
necessria sua compreenso, sem auxlio do texto.
O grfico dever possuir formato aproximadamente quadrado para evitar que
problemas de escala interfiram na sua correta interpretao.


Tipos de grficos

Podemos considerar quatro tipos principais de representao grfica:

Estereogramas: so grficos onde as grandezas so representadas por volumes.
Geralmente so construdos num sistema de eixos bidimensional, mas podem ser construdos
num sistema tridimensional para ilustrar a relao entre trs variveis. Exemplo:
Figura 2.1. Consumo, em kg, de alguns tipos de alimentos per capita
anual em algumas regies metropolitanas do Brasil, em 1988.
Fonte: Anurio Estatstico do Brasil (1992).
0
10
20
30
40
50
60
Belo
Horizonte
Rio de
Janeiro
So Paulo Curitiba Porto
Alegre
Hortalias Carnes Pescado
Piana, Machado e Selau Estatstica Descritiva


22
Cartogramas: so representaes em cartas geogrficas (mapas).

Pictogramas ou grficos pictricos: so grficos puramente ilustrativos, construdos
de modo a ter grande apelo visual, dirigidos a um pblico muito grande e heterogneo. No
devem ser utilizados em situaes que exijam maior preciso. Exemplo:

Figura 2.2. Problemas a serem solucionados pelo governo
brasileiro de acordo com um levantamento encomendado pelo
Ministrio da Educao, em 1985.
Fonte: Silveira Jnior et al. (1989).

Diagramas: so grficos geomtricos de duas dimenses, de fcil elaborao e
grande utilizao. Podem ser ainda subdivididos em: grficos de colunas, de barras, de linhas
ou curvas e de setores.

a) Grfico de colunas: neste grfico as grandezas so comparadas atravs de
retngulos de mesma largura, dispostos verticalmente e com alturas proporcionais s
grandezas. A distncia entre os retngulos deve ser, no mnimo, igual a 1/2 e, no mximo, 2/3
da largura da base dos mesmos. Exemplo:
Figura 2.3. Efetivo do rebanho suno no Brasil, segundo as
grandes regies em 1992.
Fonte: Anurio Estatstico do Brasil (1994).
Piana, Machado e Selau Estatstica Descritiva


23
b) Grfico de barras: segue as mesmas instrues que o grfico de colunas, tendo a
nica diferena que os retngulos so dispostos horizontalmente. usado quando as
inscries dos retngulos forem maiores que a base dos mesmos. Exemplo:
Figura 2.4. Casos notificados de AIDS nos cinco estados brasileiros
de maior incidncia em 1992.
Fonte: Anurio Estatstico do Brasil (1994).


c) Grfico de linhas ou curvas: neste grfico os pontos so dispostos no plano de
acordo com suas coordenadas, e a seguir so ligados por segmentos de reta. muito utilizado
em sries histricas e em sries mistas quando um dos fatores de variao o tempo, como
instrumento de comparao. Exemplo:


Figura 2.5. Eleitores inscritos para as eleies brasileiras - 1978/90.
Fonte: Anurio Estatstico do Brasil (1992).


d) Grfico em setores: recomendado para situaes em que se deseja evidenciar o
quanto cada informao representa do total. A figura consiste num crculo onde o total (100%)
representa 360, subdividido em tantas partes quanto for necessrio representao. Essa
diviso se faz por meio de uma regra de trs simples. Com o auxlio de um transferidor efetua-
se a marcao dos ngulos correspondentes a cada diviso. Exemplo:


0 1000 2000 3000 4000 5000 6000
So Paulo
Rio de Janeiro
Rio Grande do Sul
Minas Gerais
Paran
Estados
Casos
Piana, Machado e Selau Estatstica Descritiva


24

Figura 2.6. Hospitalizaes pagas pelo SUS, segundo a
natureza do prestador de servio 1993.
Fonte: Anurio Estatstico do Brasil (1994).



2.2. Distribuio de frequncias e grficos

Um grande nmero de dados necessita de uma forma eficiente de sumarizao. Uma
das formas mais comuns de resumir e apresentar dados atravs de tabelas de distribuio de
frequncias. Estas tabelas podem ser de dois tipos: de classificao simples ou de
classificao cruzada.


2.2.1. Tabelas de classificao simples

As tabelas de classificao simples so tabelas de frequncias relativas a uma
varivel. As caractersticas dessas tabelas variam de acordo com o tipo de varivel em estudo.
Se a varivel do tipo categrica (fator), ento so obtidas as frequncias de ocorrncia de
cada nvel dessa varivel. Se a varivel do tipo numrica contnua, primeiro so obtidos
intervalos de mesma amplitude e depois contados os valores que ocorrem em cada intervalo.


2.2.1.1. Distribuio de frequncias de variveis categricas

Quando a varivel em estudo for categrica ou, em alguns casos, numrica discreta, a
tabela de distribuio de frequncias apresentar a seguinte caracterstica: cada valor da
varivel constituir uma classe.

Construo da tabela

A construo da tabela de distribuio de frequncia para variveis categricas
envolve apenas dois passos bastante simples:

1
o
passo: ordenar os nveis do fator, ou seja, coloc-los em ordem crescente de
grandeza (rol). Cada nvel constituir uma classe. O nmero de cada classe da distribuio
ser representado por j, tal que j = 1, 2, ..., k.

2
o
passo: contar o nmero de elementos em cada classe, ou seja, contar quantas
vezes o dado est repetido.

Piana, Machado e Selau Estatstica Descritiva


25
Veremos, por meio de exemplos, como construir uma tabela de distribuio de
frequncias para os dados de uma varivel categrica (Exemplo 1) e de uma varivel numrica
discreta (Exemplo 2).

Exemplo 1:

Seja a varivel em estudo o conceito obtido por 60 estudantes na disciplina de
Estatstica, para o qual os dados observados foram os seguintes:

ruim, mdio, bom, mdio, ruim, mdio, ruim, mdio, ruim, bom, mdio, mdio, bom, mdio,
mdio, mdio, timo, mdio, bom, timo, bom, timo, mdio, timo, mdio, ruim, mdio, timo,
mdio, mdio, bom, ruim, bom, bom, mdio, ruim, mdio, mdio, timo, mdio, bom, ruim, ruim,
bom, mdio, mdio, ruim, bom, mdio, mdio, bom, bom, bom, mdio, ruim, bom, mdio,
mdio, ruim, mdio

Podemos observar que esta varivel categrica qualitativa ordinal apresenta quatro
nveis (ruim, mdio, bom e timo). Como cada nvel deve constituir uma classe da distribuio
de frequncias, j est determinado que o nmero total de classes (k) quatro. O primeiro
passo a ordenao dos nveis da varivel. Assim, temos

Nmero da
classe (j)
Classe
1 Ruim
2 Mdio
3 Bom
4 timo

O passo seguinte a contagem do nmero de estudantes em cada nvel. Estes
valores so denotados por
j
F e chamados de frequncias absolutas das classes. A partir da
frequncia absoluta podemos obter outras frequncias de interesse numa distribuio, tais
como:
frequncia absoluta acumulada na classe j, denotada por
j
F , que expressa o
nmero de elementos (observaes) acumulados at a classe j;

frequncia relativa da classe j, denotada por
j
f , que expressa a proporo de
elementos (observaes) na classe j;

frequncia relativa acumulada na classe j, denotada por
j
f , que expressa a
proporo de elementos (observaes) acumulados at a classe j.

As frequncias obtidas so ento apresentadas na forma tabular.

Tabela 2.11. Frequncia do conceito obtido por estudantes na
disciplina de Estatstica. UFPel, 2001.

j Classe
j
F
j
F
j
f
j
f
1 Ruim 12 12 0,2 0,2
2 Mdio 27 39 0,45 0,65
3 Bom 15 54 0,25 0,9
4 timo 6 60 0,1 1
60 - 1 -

Piana, Machado e Selau Estatstica Descritiva


26
Exemplo 2:

Muito frequentemente, as tabelas de distribuio de frequncia de variveis numricas
discretas so construdas da mesma forma que as das variveis categricas. Consideremos
agora que a varivel em estudo seja o nmero de animais portadores de brucelose em 350
propriedades rurais. Os valores observados para esta varivel foram:

2, 5, 6, 0, 4, 4, 3, 4, 2, 2, 3, 3, 5, 3, 5, 1, 2, 4, 2, 3, 5, 4, 3, 3, 2, 3, 0, 4, 4, 3, 4, 0, 3, 1, 2, 4, 2, ...

Como cada valor da varivel deve constituir uma classe e foram observados apenas
sete valores diferentes para esta varivel, a tabela de distribuio de frequncias ter sete
classes.

Nmero da
classe (j)
Classe
1 0
2 1
3 2
4 3
5 4
6 5
7 6

Atravs da contagem do nmero de vezes que cada valor apareceu, ou seja, do
nmero de observaes em cada classe, obtemos as frequncias absolutas, relativas e
acumuladas, apresentadas na tabela a seguir.

Tabela 2.12. Frequncia do nmero de animais portadores de
brucelose em 350 propriedades rurais. UFPel, 2001.

j Classe
j
F
j
F
j
f
j
f
1 0 55 55 0,1571 0,1571
2 1 60 115 0,1714 0,3286
3 2 112 227 0,32 0,6486
4 3 82 309 0,2343 0,8829
5 4 31 340 0,0886 0,9714
6 5 8 348 0,0229 0,9943
7 6 2 350 0,0057 1,0000
350 - 1,0000 -

Devemos observar, ainda, que to importante quanto saber construir uma tabela
saber interpretar os seus valores. Vejamos, como exemplo, o significado de alguns valores da
tabela:
4
F = 82 significa que, das 350 propriedades rurais consultadas, 82 possuem trs
animais portadores de brucelose.

3
F = 227 significa que, das 350 propriedades rurais consultadas, 227 possuem
menos de trs animais portadores de brucelose.
2
f = 0,1714 significa que a proporo de propriedades rurais que possuem apenas
um animal portador de brucelose de 0,1714 (em percentual: 17,14).

5
f = 0,9714 significa que a proporo de propriedades rurais que possuem menos
de quatro animais portadores de brucelose de 0,9714 (em percentual: 97,14).
Piana, Machado e Selau Estatstica Descritiva


27
2.2.1.2. Distribuio de frequncias de variveis numricas contnuas

Ao contrrio das variveis discretas, as variveis contnuas assumem, em geral,
muitos valores e, em sua grande maioria, diferentes uns dos outros. Para contornar problemas
desse tipo, as tabelas de distribuio de frequncias para variveis contnuas so construdas
de modo que cada classe seja constituda por um intervalo de valores da varivel.
Devemos observar, no entanto, que em algumas situaes uma varivel discreta
tambm poder assumir tantos valores diferentes que a construo de uma tabela onde cada
valor constitui uma classe seja impraticvel. Em outras palavras, pode ocorrer que ela tenha
tantas linhas que sua construo pouco auxilie na descrio resumida dos dados. Nesses
casos, por uma questo de simplificao, usual agrupar os dados discretos em intervalos de
classe, da mesma forma que se agrupam os dados contnuos.

Construo da tabela

O processo de construo da tabela de distribuio de frequncia para variveis
numricas segue os seguintes passos:

1
o
passo: ordenar o conjunto de dados, ou seja, colocar os dados brutos em ordem
crescente de grandeza (rol).

2
o
passo: determinar o nmero de classes da tabela. De modo geral, este valor no
dever ser inferior a 5 e nem superior a 15. A definio do nmero de classes dever ser
orientada pelos objetivos do trabalho, mas existem algumas regras objetivas de determinao,
como, por exemplo:
, k 1 3 32 logn = + (Frmula de Sturges) ou = k n ,
onde:
k = nmero de classes;
n = nmero de observaes;
log = logaritmo de base 10.

3
o
passo: determinar a amplitude do intervalo. Para isto, podemos utilizar a seguinte
expresso:
=
t
a
i
k

onde:
i = amplitude do intervalo;
=
t
a ES EI : amplitude total do conjunto de valores;
k = nmero de classes.

Convencionamos, tambm, que o arredondamento no nmero de classes (k) ou na
amplitude do intervalo (i) sempre feito para cima.

4
o
passo. Construir os intervalos de classe. O limite inferior da primeira classe ser
sempre o menor valor do conjunto de dados (x
(1)
) e o limite superior ser o limite inferior
acrescido do valor da amplitude do intervalo de classe (i). Na sequncia, o limite inferior da
segunda classe ser o limite superior da primeira e o limite superior da segunda classe ser
este limite inferior acrescido da amplitude do intervalo. Para todas as classes subsequentes, os
intervalos devero ser construdos da mesma forma que para a segunda:

j Classe
1 x
(1)
| x
(1)
+ i
2 x
(1)
+ i | x
(1)
+ 2i
... ...
k x
(1)
+ (k -1)i | x
(1)
+ ki
Piana, Machado e Selau Estatstica Descritiva


28
Notamos, assim, que a amplitude do intervalo constante para todas as classes. O
intervalo fechado esquerda e aberto direita, representado pelo smbolo | , garante a no
superposio de classes.

Exemplo:

Tomemos a seguinte varivel:

X = peso ao nascer (em kg) de 60 bovinos machos da raa Ibag, para a qual os
valores observados (e j ordenados) foram:

16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 23, 23, 23, 23,
23, 23, 23, 25, 25, 25, 25, 25, 25, 26, 26, 27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 30,
30, 30, 30, 30, 30, 30, 31, 32, 33, 33, 33, 34, 34, 35, 36, 39.

Sendo o peso uma varivel contnua cujos valores poderiam ser todos diferentes entre
si, no podemos considerar cada valor como sendo uma classe, de modo que no podemos
saber de antemo o nmero de classes da distribuio de frequncia. Este valor dever ser
determinado e, para isto, usaremos a frmula de Sturges. Para n = 60, temos

k 1 3,32 logn
k 1 3,32 log60
k 1 3,32 1,778 6,9
= +
= +
= + =


Como o nmero de classes tem que ser um nmero inteiro, teremos que arredondar o
valor 6,9. Usaremos como regra o arredondamento para cima. Deste modo, o nmero de
classes ser k = 7.
Uma vez determinado o valor de k, temos que obter a amplitude dos intervalos. Sendo
k = 7 e a amplitude total do conjunto de dados

=
= =
t
t
a ES EI
a 39 16 23,

temos
= = =
t
a 23
i 3,2857.
k 7


Por uma questo de praticidade, vamos arredondar o valor da amplitude do intervalo
para uma casa decimal, lembrando que o arredondamento, tambm neste caso, dever ser
sempre para cima. Assim, temos i = 3,3.
O prximo passo a construo dos intervalos de classe. Tomamos como limite
inferior da primeira classe o menor valor do conjunto de dados x
(1)
= 16. Somando ao 16 o valor
da amplitude do intervalo i = 3,3, obtemos o limite superior deste intervalo. Todos os demais
intervalos so construdos considerando como limite inferior o limite superior do intervalo de
classe que o precede e como limite superior a soma do limite inferior com o valor 3,3. Assim,
temos:

j Classes
1 16,0 | 19,3
2 19,3 | 22,6
3 22,6 | 25,9
4 25,9 | 29,2
5 29,2 | 32,5
6 32,5 | 35,8
7 35,8 || 39,1
Piana, Machado e Selau Estatstica Descritiva


29
Para a obteno das frequncias absolutas das classes, contamos quantos valores
(observaes) do conjunto de dados pertencem a cada intervalo. As demais frequncias, como
j vimos anteriormente, derivam da frequncia absoluta.

Em distribuies de frequncias de variveis contnuas, geralmente existe interesse
em uma outra quantidade conhecida como ponto mdio ou centro de classe, denotada por c
j
.
Os centros de classe so calculados da seguinte forma:

+
=
j j
j
EI ES
c
2
,
onde:
j
EI = extremo inferior da classe j
j
ES = extremo superior da classe j

No exemplo, temos:
= = =
= = =
= = =
1
2
7
16+19,3 35,3
c 17,65
2 2
19,3+22,6 41,9
c 20,95
2 2
35,8+39,1 74,9
c 37, 45.
2 2



A tabela de frequncias completa apresentada a seguir.

Tabela 2.13. Frequncia do peso ao nascer (em kg) de 60 bovinos machos
da raa Ibag. UFPel, 2001.

j Classes
j
F
j
F
j
f
j
f
j
c
1 16 | 19,3 7 7 0,1167 0,1167 17,65
2 19,3 | 22,6 9 16 0,15 0,2667 20,95
3 22,6 | 25,9 15 31 0,25 0,5167 24,25
4 25,9 | 29,2 12 43 0,2 0,7167 27,55
5 29,2 | 32,5 9 52 0,15 0,8667 30,85
6 32,5 | 35,8 6 58 0,1 0,9667 34,15
7 35,8 || 39,1 2 60 0,0333 1,0000 37,45
60 1,0000

A interpretao das frequncias da tabela exemplificada atravs de alguns valores:

3
F = 15 significa que 15 dos 60 bovinos nasceram com peso entre 22,6 e 25,9 kg
(exclusive).

5
F = 52 significa que 52 dos 60 bovinos nasceram com peso entre 16,0 e 32,5 kg
(exclusive).
2
f = 0,15 significa que a proporo de bovinos que nasceram com peso entre 19,3 e
22,6 kg (exclusive) de 0,15 (em percentual: 15).

6
f = 0,9667 significa que a proporo de bovinos que nasceram com peso entre 16
e 35,8 kg (exclusive) de 0,9667 (em percentual: 96,67).
Piana, Machado e Selau Estatstica Descritiva


30
Exerccios propostos:

2.1. Os dados a seguir se referem aos nmeros de pes no vendidos em uma certa padaria
at a hora do encerramento do expediente:

0 0 4 2 0 1 0 2 0 4
1 0 0 3 2 0 1 0 0 0
2 0 0 1 0 0 3 2 1 7
0 1 0 0 2 0 0 3 2 1

Construa a distribuio de frequncias para esses dados.


2.2. Os dados em rol (ordenao horizontal) abaixo se referem aos valores gastos (em reais)
pelas primeiras 50 pessoas que entraram em um determinado supermercado, no dia
01/01/2000.

3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39
18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47
24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37
38,98 38,64 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65
50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34

Faa a distribuio de frequncias desses dados.

Piana, Machado e Selau Estatstica Descritiva


31
2.2.1.3. Representao grfica das distribuies de frequncias

As distribuies de frequncias podem ser representadas graficamente de duas
formas distintas e exclusivas, so elas: o histograma e o polgono de frequncias.

Histograma

O histograma consiste de um conjunto de retngulos contguos cuja base igual
amplitude do intervalo e a altura proporcional frequncia das respectivas classes.

Na figura abaixo podemos observar o histograma da distribuio de frequncias da
Tabela 2.13.

Figura 2.6. Peso ao nascer (em kg) de 60 bovinos machos
da raa Ibag. UFPel, 2001.

Quando trabalhamos com variveis discretas, os retngulos dos histogramas se
reduzem a retas e, consequentemente, deixam de ser contguos. Vejamos um exemplo na
figura a seguir que representa a distribuio da Tabela 2.12.

Figura 2.7. Nmero de animais portadores de brucelose
em 350 propriedades rurais. UFPel, 2001.
F
j

F
j

Piana, Machado e Selau Estatstica Descritiva


32
Polgono de frequncia

O polgono de frequncias constitudo por segmentos de retas que unem os pontos
cujas coordenadas so o ponto mdio e a frequncia de cada classe. O polgono de
frequncias fechado tomando-se uma classe anterior a primeira e uma posterior a ltima,
uma vez que ambas possuem frequncia zero.

Na Figura 2.8 podemos observar o polgono de frequncias da distribuio da Tabela
2.13.

Figura 2.8. Peso ao nascer (em kg) de 60 bovinos machos da
raa Ibag. UFPel, 2001.




Exerccio proposto:

2.3. Faa a representao grfica (histograma e polgono de frequncias, quando for o caso)
das distribuies de frequncias construdas nos Exerccios 2.1 e 2.2 da pgina 30.

Piana, Machado e Selau Estatstica Descritiva


33
2.2.2. Tabelas de classificao cruzada

Em algumas situaes, pode haver interesse no estudo de duas ou mais variveis
simultaneamente. Da surgem as distribuies conjuntas de frequncias. As tabelas de
classificao cruzada so tabelas de frequncias relativas a duas variveis, numricas ou
categricas. Existe um nmero razovel de tipos de tabelas e grficos para descrever esses
casos.


2.2.2.1. Frequncias cruzadas de variveis categricas

Quando um estudo envolve duas variveis categricas (fatores), a tabela de
frequncia cruzada dessas duas variveis conhecida tambm como tabela de dupla entrada,
tabela de associao ou tabela de contingncia. As regras bsicas para sua construo so
semelhantes s das tabelas de classificao simples. A diferena que agora a tabela
apresenta duas margens, cada qual com os totais referentes a um dos fatores.

Na Tabela 2.14, por exemplo, os 60 alunos da escola E foram classificados segundo
duas variveis categricas: Conceito em Estatstica e Hbito de fumar. Para isso,
primeiramente, os alunos so classificados de acordo com o Conceito em Estatstica e,
posteriormente, dentro de cada nvel deste fator, so classificados quanto ao Hbito de fumar.


Tabela 2.14. Distribuio dos alunos da escola E,
segundo o hbito de fumar e conceito em Estatstica.

Hbito de fumar
Conceito
Sim No
Totais
Ruim 5 8 13
Mdio 10 16 26
Bom 5 10 15
timo 2 4 6
Totais 22 38 60

Podemos observar que, com as frequncias marginais (totais) da tabela cruzada,
poderamos resgatar a tabela de classificao simples de cada fator.

A representao grfica de distribuies de frequncias de variveis categricas
pode ser feita atravs de dois tipos de grficos:

Grficos em duas dimenses (diagramas): descrevendo a variao de um fator
dentro dos nveis do outro.

Por exemplo, na Figura 2.9, observamos a variao do fator Hbito de fumar dentro de
cada nvel do fator Conceito em Estatstica, enquanto que, na Figura 2.10, fica mais evidente a
variao do fator Conceito em Estatstica dentro de cada nvel do fator Hbito de fumar.

Pode no ser necessrio apresentar os dois grficos simultaneamente. mais comum
apresentar apenas um deles, de acordo com o fato que desejamos ressaltar. Assim, no
exemplo, se for mais importante ressaltar a distribuio de fumantes e no fumantes dentro de
cada conceito, utilizamos a Figura 2.9. Se for mais importante ressaltar a distribuio do
conceito em estatstica dentro dos grupos de fumantes e no fumantes, utilizamos a Figura
2.10. Naturalmente, se ambas as situaes forem relevantes podemos apresentar os dois
diagramas.
Piana, Machado e Selau Estatstica Descritiva


34

Figura 2.9. Distribuio dos alunos da escola
E, segundo o hbito de fumar e conceito em
Estatstica.

Figura 2.10. Distribuio dos alunos da
escola E, segundo o hbito de fumar e
conceito em Estatstica.


A observao atenta destes grficos j pode fornecer uma ideia da possvel
associao existente entre os fatores. Por exemplo, se o um fator apresenta o mesmo
comportamento dentro de todos os nveis do outro, podemos supor que eles no esto
associados, ou seja, comportam-se independentemente um do outro. Devemos observar,
entretanto, que os grficos fornecem apenas indicaes, para verificar tais hipteses
(suposies) devemos utilizar os testes apropriados que sero vistos posteriormente.


Grficos tridimensionais (estereogramas): compostos por paralelogramos, dispostos
em eixos tridimensionais, separados entre si, cujas bases so determinadas pelos nveis dos
fatores e as alturas pelas suas respectivas frequncias (Figura 2.11).


Figura 2.11. Distribuio dos alunos da escola E, segundo o
hbito de fumar e conceito em Estatstica.
Piana, Machado e Selau Estatstica Descritiva


35
2.2.2.2. Frequncias cruzadas de variveis numricas

Ao estudarmos conjuntamente duas variveis numricas, as tabelas de classificao
cruzada so, agora, denominadas tabelas de correlao. As ideias bsicas sobre a construo
dessas tabelas j foram vistas em sees anteriores.

As tabelas de frequncias cruzadas de duas variveis contnuas tambm so
construdas de modo similar s de classificao simples, ou seja, seguindo todos os passos j
descritos na Seo 2.2.1.2. Primeiramente, procedemos classificao das observaes
segundo uma das variveis, para em seguida, dentro de cada classe da primeira, classific-las
de acordo com a outra varivel. Por exemplo, na Tabela 2.15, observamos a classificao dos
400 alunos do Colgio C, segundo duas variveis contnuas: Nota em Estatstica e Nota em
Matemtica.

Tabela 2.15. Distribuio dos alunos do Colgio C,
segundo suas notas em Estatstica e Matemtica.

Matemtica
Estatstica
0 | 4 4 | 7 7 | 10
Totais
0 | 4 32 25 5 62
4 | 7 20 183 82 285
7 | 10 7 27 19 53
Totais 59 235 106 400


Os grficos geralmente utilizados para descrever dados como estes so os
histogramas em trs dimenses (estereogramas), nos quais os retngulos cedem lugar aos
paralelogramos. Agora, a base de cada paralelogramos definida pelas amplitudes das
classes das variveis envolvidas. Este tipo de grfico pouco utilizado em trabalhos cientficos
pela dificuldade de execuo e interpretao atravs dos meios disponveis.

A relao entre duas variveis contnuas tambm comumente representada por
diagramas de disperso. Tomemos outro exemplo: para estudar o relacionamento entre as
variveis Peso do pai (X) e Peso do filho (Y), foram medidos os pesos (em kg) de dez alunos
do Colgio C e de seus respectivos pais. Os resultados so apresentados numa tabela de
correlao:

Observao ( i ) 1 2 3 4 5 6 7 8 9 10
Peso dos pais (x
i
) 78 65 86 68 83 68 75 80 82 66
Peso dos filhos (y
i
) 60 52 68 53 65 57 58 62 65 53


Esta tabela possibilita a construo do diagrama de disperso de pontos (Figura
2.12). Este tipo de grfico pode fornecer uma indicao do tipo de relacionamento que
existe entre as duas variveis. Por exemplo, se os pontos apresentarem a forma de elipse
indicam a existncia de uma relao linear (positiva ou negativa) entre as variveis. A
Figura 2.12 parece evidenciar um relacionamento linear positivo entre os pesos dos dez
alunos e os pesos dos seus respectivos pais, sugerindo um estudo mais aprofundado desta
correlao.
Atravs da anlise de regresso linear, que ser abordada mais adiante,
possvel obter uma equao do tipo Y = a + bX, que descreve o peso dos filhos (Y) como
uma funo linear do peso dos pais (X).
Piana, Machado e Selau Estatstica Descritiva


36

Figura 2.12. Disperso dos pesos (em kg) de dez alunos
do Colgio C e de seus respectivos pais.



2.3. Medidas Descritivas

As medidas descritivas tm o objetivo de reduzir um conjunto de dados
observados (numricos) a um pequeno grupo de valores que deve fornecer toda a
informao relevante a respeito desses dados. Estas medidas so funes dos valores
observados e podem ser classificadas em quatro grupos:

Medidas de localizao, tambm denominadas medidas de tendncia central ou
medidas de posio: indicam um ponto central onde, em muitas situaes importantes, est
localizada a maioria das observaes.

Medidas separatrizes: indicam limites para propores de observaes em um
conjunto, podendo ser utilizadas para construir medidas de disperso.

Medidas de variao tambm denominadas medidas de disperso: informam sobre a
variabilidade dos dados.

Medidas de formato: informam sobre o modo como os valores se distribuem.
Compreendem as medidas de assimetria, que indicam se a maior proporo de valores est no
centro ou nas extremidades, e as medidas de curtose, que descrevem grau de achatamento da
distribuio.


Existe uma enorme variedade de medidas descritivas, muitas delas competidoras
entre si. Um guia geral para escolha da medida mais adequada pode ser visto a seguir:

Com que objetivo a medida est sendo obtida?
A medida fcil de interpretar? intuitiva?
Existem valores atpicos que podem afet-la exageradamente?
O propsito da anlise meramente descritivo ou planeja-se fazer inferncias?

Uma medida descritiva dever, sempre que possvel, possuir as seguintes
caractersticas: ser representativa, ser de fcil interpretao e prestar-se bem a tratamento
matemtico e/ou estatstico em etapas posteriores.


Piana, Machado e Selau Estatstica Descritiva


37
2.3.1. Medidas de localizao ou tendncia central

As medidas de localizao ou tendncia central tm o objetivo de representar o ponto
de equilbrio ou o centro de uma distribuio. Em muitos casos, podem ser considerados
valores tpicos ou representativos do conjunto.
As medidas mais utilizadas so a mdia aritmtica, a mediana e a moda, embora
outras tambm possam ser teis em algumas situaes.


Mdia aritmtica

A mdia aritmtica, pela sua facilidade de clculo e de compreenso aliada s suas
propriedades matemticas, a medida de localizao mais conhecida e utilizada. Pode ser de
dois tipos: simples ou ponderada.

A mdia aritmtica simples, representada por x , calculada considerando que todas
as observaes participam com o mesmo peso. Assim, para um conjunto de n observaes
(x
1
, x
2
, ..., x
n
), a mdia aritmtica simples ou simplesmente mdia definida por

=
=

n
i
i 1
x
x
n

Exemplo:

Se X = tempo (h)
Para x
i
= 9, 7, 5, 10, 4, temos

+ + + +
= = = =

i
x 9 7 5 10 4 35
x 7
n 5 5
h


A mdia aritmtica ponderada, representada por
p
x , calculada considerando que
pelo menos uma das observaes deve participar com peso diferente das demais. Assim, se as
observaes x
1
, x
2
, ..., x
n
forem associadas aos pesos p
1
, p
2
, ..., p
n
, a mdia aritmtica
ponderada dada por
=
=
=

n
i i
i 1
p n
i
i 1
x p
x
p

Exemplo:

Para x
i
= 7, 8, 6, 10, e
i
p = 10, 10, 8, 2, temos

+ + +
= = = =
+ + +

i i
p
i
x p 7 10 8 10 6 8 10 2 218
x 7,02
p 10 10 8 2 30




Propriedades matemticas da mdia aritmtica

1
a
propriedade: A mdia de um conjunto de dados que no varia, ou seja, cujos
valores so uma constante, a prpria constante.
Piana, Machado e Selau Estatstica Descritiva


38
2
a
propriedade: Ao somar (ou subtrair) uma constante c por todos os valores de um
conjunto de dados, sua mdia tambm somada (ou subtrada) por esta constante.

Demonstrao:
+
+ + + + + + +
= =
+
=
+
=
= + = + = +


i 1 2 n
x c
i
i
i i
(x c) x c x c x c
x
n n
x c
n
x nc
n
x x nc
c x c
n n n


Verificao numrica:

Ao somarmos a constante 2 a todos os valores do conjunto x
i
= 9, 7, 5, 10, 4, cuja
mdia = x 7, teremos um novo conjunto de valores x
i
+ 2 = 11, 9, 7, 12, 6, com uma nova
mdia

+ + + +
= = = = + =

i
x+2
x 11 9 7 12 6 45
x 9 7 2
n 5 5
,

logo, a mdia 7 sofreu a mesma operao que os valores x
i
.


3
a
propriedade: Ao multiplicar (ou dividir) uma constante c por todos os valores de um
conjunto de dados, sua mdia tambm multiplicada (ou dividida) por esta constante.

Demonstrao:
( )
+ + +
= =
+ + +
=
= = =


i 1 2 n
cx
1 2 n
i i
cx cx cx cx
x
n n
c x x x
n
c x x
c cx
n n


Verificao numrica:

Ao multiplicarmos a constante 2 por todos os valores do conjunto de dados x
i
= 9, 7, 5,
10, 4, cuja mdia = x 7, teremos um novo conjunto de valores 2x
i
= 18, 14, 10, 20, 8, com
uma nova mdia

+ + + +
= = = = =

i
2x
x 18 14 10 20 8 70
x 14 2 7
n 5 5
,

logo, a mdia 7 sofreu a mesma operao que os valores x
i
.


4
a
propriedade: A soma de todos os desvios em relao mdia de um conjunto de
valores nula, entendendo por desvio a diferena entre a observao e a mdia aritmtica, ou
seja,
( ) =

i
x x 0 .
Piana, Machado e Selau Estatstica Descritiva


39
possvel demonstrar esta propriedade aplicando as propriedades do somatrio:

( ) =

i i
x x x x
=

i
x nx , sendo =

i
x
x
n
, temos

=
= =


i
i
i i
x
x n
n
x x 0




5
a
propriedade: A soma dos quadrados dos desvios em relao a uma constante c,

2
i
x c ( ) , mnima quando = c x .

Podemos demonstrar esta propriedade, somando e subtraindo do desvio uma
constante de interesse ( x ) e aplicando as propriedades do somatrio:

= +
= +
= + +
= + +
= + + =
= +

2 2
i i
2
i
2 2
i i
2 2
i i
2 2
i i i
2 2
i
,
x c x c x x
x x c
x x 2 x x x c x
x x 2 x x x x c
x x 2 x c x x n x c sendo x x 0, temos
x x n x c
( ) ( )
[( ) (x )]
[( ) ( )( ) ( c) ]
( ) ( )( c) ( )
( ) ( ) ( ) ( ) ( )
( ) ( )


Observamos que ( )

2
i
x c assumir o menor valor quando = c x , pois, neste caso,
=
2
n x c 0 ( ) .


Podemos verificar a 3
a
e a 4
a
propriedades da mdia aritmtica no seguinte conjunto
de dados:

i x
i

i
x x ( )
2
i
x x ( )
2
i
x 6 ( )
2
i
x 9 ( )
1 9 2 4 9 0
2 7 0 0 1 4
3 5 -2 4 1 16
4 10 3 9 16 1
5 4 -3 9 4 25
35 0 26 31 46


Verificamos, assim, que:


( ) =

i
x x 0 (terceira propriedade da mdia)
( ) ( )
( ) ( )
= =
= =
( <
(
<
(



2 2
i i
2 2
i i
(quarta propriedade da mdia)
x x 26 x 6 31
x x 26 x 9 46

Piana, Machado e Selau Estatstica Descritiva


40
Mediana

A mediana, representada por Md, a medida que divide um conjunto de dados
ordenado em duas partes iguais: 50% dos valores ficam abaixo e 50% ficam acima da
mediana.

Existem dois casos diferentes para o clculo da mediana, mas em ambos o primeiro
passo a ser tomado a ordenao dos dados.

1
o
caso: quando n mpar

Determinamos, primeiramente, a posio mais central (p) do conjunto de dados
ordenado
+
=
n 1
p
2
.

A mediana ser o valor do conjunto de dados que ocupa a posio p, ou seja,

Md = x
p
.

Exemplo:

Se X = tempo (h)
Para x
i
= 4, 5, 7, 9, 10, temos

+ +
= = =
n 1 5 1
p 3
2 2
,
logo,
= = =
p 3
Md x x 7 h


2
o
caso: quando n par

Neste caso, temos duas posies centrais no conjunto de dados ordenado, denotadas
por p
1
e p
2
. Ao utilizarmos a expresso
+
=
n 1
p
2
, obtemos um valor no inteiro. As posies p
1

e p
2
so os dois inteiros mais prximos do valor de p.

A mediana ser a mdia aritmtica simples dos valores do conjunto de dados que
ocupam as posies p
1
e p
2
, ou seja,
+
=
1 2
p p
x x
Md
2
.

Exemplo:

Se X = tempo (h)
Para x
i
= 4, 5, 7, 9, 10, 12, temos

,
1
2
p 3 n+1 6+1
p 3 5
p 4 2 2
=
= = =
=

logo,
+
+ +
= = = =
1 2
p p
3 4
x x
x x 7 9
Md 8h
2 2 2
.
Piana, Machado e Selau Estatstica Descritiva


41
Moda

A moda, representada por Mo, o valor de maior ocorrncia num conjunto de dados.
a nica medida que pode no existir e, existindo, pode no ser nica.

Exemplos:

X = peso (kg)

1. Para x
i
= 2, 3, 7, 5, 7, 5, 8, 7, 9, temos Mo = 7 kg

2. Para x
i
= 1, 3, 4, 5, 4, 8, 6, 8, temos Mo = 4 kg e 8 kg (conjunto bimodal)

3. Para x
i
= 5, 7, 8, 3, 9, 1, 4, no existe Mo (conjunto amodal)

4. Para x
i
= 1, 3, 4, 4, 5, 1, 3, 5, no existe Mo (conjunto amodal)




C
a
r
a
c
t
e
r

s
t
i
c
a
s

d
a
s

p
r
i
n
c
i
p
a
i
s

m
e
d
i
d
a
s

d
e

l
o
c
a
l
i
z
a

o

o
u

t
e
n
d

n
c
i
a

c
e
n
t
r
a
l

O

q
u
a
d
r
o

a
b
a
i
x
o

a
p
r
e
s
e
n
t
a

a
s

p
r
i
n
c
i
p
a
i
s

c
a
r
a
c
t
e
r

s
t
i
c
a
s

d
a

m

d
i
a
,

d
a

m
e
d
i
a
n
a

e

d
a

m
o
d
a
,

d
e
s
t
a
c
a
n
d
o

a
s

v
a
n
t
a
g
e
n
s

e

d
e
s
v
a
n
t
a
g
e
n
s

d
e

c
a
d
a

u
m
a

e
m

r
e
l
a

s

d
e
m
a
i
s
.


M

d
i
a

a
r
i
t
m

t
i
c
a

M
e
d
i
a
n
a

M
o
d
a

V
a
n
t
a
g
e
n
s

V
a
n
t
a
g
e
n
s

V
a
n
t
a
g
e
n
s

-

N
o

c

l
c
u
l
o

d
a

m

d
i
a

p
a
r
t
i
c
i
p
a
m

t
o
d
o
s

o
s

v
a
l
o
r
e
s

o
b
s
e
r
v
a
d
o
s
.

-


u
m
a

m
e
d
i
d
a

d
e

f

c
i
l

i
n
t
e
r
p
r
e
t
a

o

e

p
r
e
s
t
a
-
s
e

m
u
i
t
o

b
e
m

a

t
r
a
t
a
m
e
n
t
o
s

e
s
t
a
t

s
t
i
c
o
s

a
d
i
c
i
o
n
a
i
s
.

-


u
m
a

m
e
d
i
d
a

q
u
e

s
e
m
p
r
e

e
x
i
s
t
e

e

g
i
d
a

e

u
n
i
c
a
m
e
n
t
e

d
e
t
e
r
m
i
n
a
d
a
.

-


u
m

v
a
l
o
r

t

p
i
c
o

d
e

u
m

c
o
n
j
u
n
t
o

d
e

d
a
d
o
s
,

p
o
d
e
n
d
o

s
u
b
s
t
i
t
u
i
r

t
o
d
o
s

o
s

v
a
l
o
r
e
s

d
e

u
m

c
o
n
j
u
n
t
o

s
e
m

a
l
t
e
r
a
r

o

t
o
t
a
l
.

-


o

p
o
n
t
o

d
e

e
q
u
i
l

b
r
i
o

d
e

u
m
a

d
i
s
t
r
i
b
u
i

o
,

s
e
n
d
o

t

o

m
a
i
s

e
f
i
c
i
e
n
t
e

q
u
a
n
t
o

m
a
i
s

s
i
m

t
r
i
c
a

f
o
r

a

d
i
s
t
r
i
b
u
i

o

d
o
s

v
a
l
o
r
e
s

a
o

s
e
u

r
e
d
o
r
.


-

D
e
f
i
n
e

e
x
a
t
a
m
e
n
t
e

o

c
e
n
t
r
o

d
e

u
m
a

d
i
s
t
r
i
b
u
i

o
,

m
e
s
m
o

q
u
a
n
d
o

o
s

v
a
l
o
r
e
s

s
e

d
i
s
t
r
i
b
u
e
m

a
s
s
i
m
e
t
r
i
c
a
m
e
n
t
e

e
m

t
o
r
n
o

d
a

m

d
i
a
.

-

P
o
d
e

s
e
r

d
e
t
e
r
m
i
n
a
d
a

m
e
s
m
o

q
u
a
n
d
o

n

o

s
e

c
o
n
h
e
c
e

t
o
d
o
s

o
s

v
a
l
o
r
e
s

d
o

c
o
n
j
u
n
t
o

d
e

d
a
d
o
s
.

-


u
m
a

m
e
d
i
d
a

q
u
e

s
e
m
p
r
e

e
x
i
s
t
e

e

n
i
c
a
.

-

E
s
t
a

m
e
d
i
d
a

p
o
d
e

s
e
r

u
t
i
l
i
z
a
d
a

p
a
r
a

d
e
f
i
n
i
r

o

m
e
i
o

d
e

u
m

n

m
e
r
o

d
e

o
b
j
e
t
o
s
,

p
r
o
p
r
i
e
d
a
d
e
s

o
u

q
u
a
l
i
d
a
d
e
s

q
u
e

p
o
s
s
a
m

d
e

a
l
g
u
m
a

f
o
r
m
a

s
e
r

o
r
d
e
n
a
d
o
s
.

-


u
m
a

m
e
d
i
d
a

r
e
s
i
s
t
e
n
t
e
,

o
u

s
e
j
a
,

n

o

s
o
f
r
e

i
n
f
l
u

n
c
i
a

d
e

v
a
l
o
r
e
s

d
i
s
c
r
e
p
a
n
t
e
s
.


-


u
m
a

m
e
d
i
d
a

q
u
e

t

m

e
x
i
s
t

n
c
i
a

r
e
a
l

d
e
n
t
r
o

d
o

c
o
n
j
u
n
t
o

d
e

d
a
d
o
s

e

e
m

g
r
a
n
d
e

n

m
e
r
o

d
e

v
e
z
e
s
.

-

N

o

e
x
i
g
e

c

l
c
u
l
o
,

a
p
e
n
a
s

u
m
a

c
o
n
t
a
g
e
m
.

-

P
o
d
e

s
e
r

d
e
t
e
r
m
i
n
a
d
a

t
a
m
b

m

p
a
r
a

v
a
r
i

v
e
i
s

q
u
a
l
i
t
a
t
i
v
a
s

n
o
m
i
n
a
i
s
.

D
e
s
v
a
n
t
a
g
e
m


D
e
s
v
a
n
t
a
g
e
m


D
e
s
v
a
n
t
a
g
e
n
s

-


u
m
a

m
e
d
i
d
a

a
l
t
a
m
e
n
t
e

i
n
f
l
u
e
n
c
i
a
d
a

p
o
r

v
a
l
o
r
e
s

d
i
s
c
r
e
p
a
n
t
e
s

(
n

o

r
e
s
i
s
t
e
n
t
e
)
.

-


u
m
a

m
e
d
i
d
a

q
u
e

n

o

s
e

p
r
e
s
t
a

a

c

l
c
u
l
o
s

m
a
t
e
m

t
i
c
o
s
.


-


u
m
a

m
e
d
i
d
a

q
u
e

n

o

s
e

p
r
e
s
t
a

a

c

l
c
u
l
o
s

m
a
t
e
m

t
i
c
o
s
.

-

D
e
i
x
a

s
e
m

r
e
p
r
e
s
e
n
t
a

o

t
o
d
o
s

o
s

v
a
l
o
r
e
s

d
o

c
o
n
j
u
n
t
o

d
e

d
a
d
o
s

q
u
e

n

o

f
o
r
e
m

i
g
u
a
i
s

a

e
l
a
.


Piana, Machado e Selau Estatstica Descritiva


43
2.3.2. Medidas separatrizes

As medidas separatrizes delimitam propores de observaes de uma varivel
ordinal. Elas estabelecem limites para uma determinada proporo 0p1 de observaes. So
medidas intuitivas, de fcil compreenso e frequentemente resistentes.
Para discutir medidas separatrizes, vamos considerar um conjunto de dados
ordenado, representado como y
(1)
, y
(2)
, ..., y
(n)
, pressupondo uma ordenao ascendente, de
modo que y
(1)
o menor valor e y
(n)
o maior valor do conjunto.
Em todas as medidas separatrizes, importante conhecer a posio que um valor
ordenado ocupa em relao aos valores extremos, ou seja, a distncia em relao ao extremo
mais prximo. A posio ocupada por uma observao ordenada em relao extremidade
mais prxima denominada profundidade.
Como a definio feita em termos da extremidade mais prxima, a profundidade do
mnimo e do mximo igual a 1. O segundo menor e o segundo maior tm profundidade 2, o
terceiro, 3 e assim por diante. Deste modo, tm profundidade i as observaes y
(i)
e y
(n+1-i)
. A
profundidade de um valor ordenado o menor valor entre i e n-i+1. Evidentemente, a
profundidade cresce no sentido do centro at um certo ponto, decrescendo a seguir.
Se o nmero de observaes mpar, ento existe no conjunto um valor que tem a
profundidade mxima. Dos n-1 valores que sobram, metade est direita desse valor e metade
est esquerda. A mediana o valor com a maior profundidade em qualquer conjunto de
dados ordenado, sendo, portanto, a medida descritiva mais prxima do centro. Como um
indicador do centro do conjunto, a mediana tambm uma medida de localizao que compete
com a mdia.
Como a mediana divide o conjunto em duas metades, razovel pensar numa medida
separatriz que efetue uma diviso adicional: dividir cada metade em duas metades. Essas
medidas separatrizes so denominadas quartis. Todo o raciocnio relativo aos quartis e
mediana facilmente estendidos para divises adicionais. Cada quarta parte do conjunto de
dados pode ser dividida em duas de modo que o conjunto fique dividido em oito partes. A
medida separatriz dessas propores denominada oitavo.
De modo semelhante, possvel encontrar valores que delimitem pores expressas
em percentagem de dados em um conjunto ordenado. Esses valores so denominados
percentis. Entretanto, de todas essas medidas separatrizes, teremos interesse particular na
mediana, j discutida na seo anterior, e nos quartis que sero tratados a seguir.


Quartis

Os quartis, representados por Q
i
, onde i = 1, 2 e 3, so trs medidas que dividem um
conjunto de dados ordenado em quatro partes iguais. So elas:

Primeiro quartil (Q
1
): 25% dos valores ficam abaixo e 75% ficam acima desta
medida.

Segundo quartil (Q
2
): 50% dos valores ficam abaixo e 50% ficam acima desta
medida. O segundo quartil de um conjunto de dados corresponde mediana (Q
2
= Md).

Terceiro quartil (Q
3
): 75% dos valores ficam abaixo e 25% ficam acima desta
medida.

Observa-se facilmente que o primeiro quartil o percentil 0,25, a mediana o percentil
0,5 e o terceiro quartil o percentil 0,75.

O processo para obteno dos quartis, da mesma forma que o da mediana, consiste
em, primeiramente, ordenar os dados e, em seguida, determinar a posio (p) do quartil no
conjunto de dados ordenado. Existem dois casos diferentes para a determinao de p:
1
o
caso: quando n mpar

Piana, Machado e Selau Estatstica Descritiva


44
Para Q
1
, temos:
+
=
n 1
p
4
;
Para Q
2
, temos:
( ) +
=
2 n 1
p
4
;
Para Q
3
, temos:
( ) +
=
3 n 1
p
4
.

2
o
caso: quando n par

Para Q
1
, temos:
+
=
n 2
p
4
;
Para Q
2
, temos:
+
=
2n 2
p
4
;
Para Q
3
, temos:
+
=
3n 2
p
4
.

O quartil Q
i
ser o valor do conjunto de dados que ocupa a posio p, ou seja, Q
i
= x
p
.
No caso de p no ser um nmero inteiro, o quartil ser a mdia aritmtica dos dois valores que
ocupam as posies correspondentes ao menor e ao maior inteiros mais prximos de p. Por
exemplo, se p=7,5, o quartil ser a mdia aritmtica dos valores que ocupam as posies 7 e 8.

Exemplos:

1
o
caso: quando n mpar

Seja X = peso (kg) e x
i
= 3, 3, 4, 6, 7, 9, 9, 11 e 12

Para Q
1
, temos
+ +
= = =
n 1 9 1
p 2,5
4 4


Como p no um nmero inteiro, Q
1
ser a mdia aritmtica dos valores que ocupam as
posies 2 e 3, ou seja,

+ +
= = =
2 3
1
x x 3 4
Q 3,5kg
2 2


Para Q
2
, temos
( ) ( ) + +
= = =
2 n 1 2 9 1
p 5
4 4


Como p inteiro, Q
2
= x
p
, ou seja,

= =
2 5
Q x 7kg


Para Q
3
, temos
( ) ( ) + +
= = =
3 n 1 3 9 1
p 7,5
4 4

Como p no inteiro, Q
3
ser a mdia aritmtica dos valores que ocupam as posies 7 e 8,
ou seja,
Piana, Machado e Selau Estatstica Descritiva


45
+ +
= = =
7 8
3
x x 9 11
Q 10kg
2 2


2
o
caso: quando n par

Seja X = Peso (kg) e x
i
= 3, 3, 4, 6, 7, 9, 9, 11, 12 e 14

Para Q
1
, temos
+ +
= = =
n 2 10 2
p 3
4 4


Sendo p um nmero inteiro, ento,

= =
1 3
Q x 4kg
Para Q
2
, temos
+ +
= = =
2n 2 2 10 2
p 5,5
4 4


Como p no inteiro, Q
2
ser a mdia aritmtica dos valores que ocupam as posies 5 e 6,
ou seja,
+ +
= = =
5 6
2
x x 7 9
Q 8kg
2 2


Para Q
3
, temos
+ +
= = =
3n 2 3 10 2
p 8
4 4


Sendo p um nmero inteiro, ento,

= =
3 8
Q x 11kg


2.3.3. Medidas de variao ou disperso

As medidas de variao ou disperso complementam as medidas de localizao ou
tendncia central, indicando quanto as observaes diferem entre si ou o grau de afastamento
das observaes em relao mdia.

As medidas de variao mais utilizadas so: a amplitude total, a varincia, o desvio
padro e o coeficiente de variao.


Amplitude total

A amplitude total, denotada por
t
a , fornece uma ideia de variao e consiste na
diferena entre o maior valor e o menor valor de um conjunto de dados. Assim, temos

=
t
a ES EI ,
onde:
ES: extremo superior do conjunto de dados ordenado;
EI: extremo inferior do conjunto de dados ordenado.
A amplitude total uma medida pouco precisa, uma vez que utiliza apenas os dois
valores mais extremos de um conjunto de dados. Tambm por esta razo extremamente
Piana, Machado e Selau Estatstica Descritiva


46
influenciada por valores discrepantes. utilizada quando apenas uma ideia rudimentar da
variabilidade dos dados suficiente.

Exemplo:

Se X = tempo (h)
Para x
i
= 9, 7, 5, 10, 4, temos

= = =
t
a ES EI 10 4 6h.

Significado: todos os valores do conjunto de dados diferem, no mximo, em 6h.


Amplitude interquartlica

A amplitude interquartlica, denotada por
q
a , a diferena entre o terceiro quartil (Q
3
)
e o primeiro quartil (Q
1
). Assim, temos

=
q 3 1
a Q Q .


Apesar de ser uma medida pouco utilizada, a amplitude interquartlica apresenta uma
caracterstica interessante que a resistncia, ou seja, esta medida, ao contrrio da amplitude
total, no sofre nenhuma influncia de valores discrepantes.

Exemplo:

Seja X = peso (kg) e x
i
= 3, 3, 4, 6, 7, 9, 9, 11, 12,

onde: Q
3
= 10 kg e Q
1
= 3,5 kg., temos

= = =
q 3 1
a Q Q 10 3,5 6,5kg

Significado: 50% dos valores (mais centrais) esto dentro deste intervalo, portanto,
diferem, no mximo, em 6,5 kg.


Varincia

A varincia, denotada por
2
s , a medida de disperso mais utilizada, seja pela sua
facilidade de compreenso e clculo, seja pela possibilidade de emprego na inferncia
estatstica. A varincia definida como sendo a mdia dos quadrados dos desvios em relao
mdia aritmtica. Assim, temos

2
2 i
x x
s
n 1
( )
,
onde:
n 1: o nmero de graus de liberdade ou desvios independentes.

A utilizao do denominador n 1, em vez de n, tem duas razes fundamentais:
1. Como a soma dos desvios nula, ou seja, ( ) =

i
x x 0 , existe n 1 desvios
independentes, isto , conhecidos n 1 desvios o ltimo est automaticamente determinado,
pois a soma zero.
2. O divisor n 1 faz com que a varincia possua melhores propriedades estatsticas.
Piana, Machado e Selau Estatstica Descritiva


47
Nos casos em que a varincia for utilizada apenas para descrever a variao de um
conjunto de dados, ento, ela poder ser calculada utilizando o nmero de observaes (n)
como denominador e ser denotada por
2
n
s , ou seja,

=

2
2 i
n
x x
s
n
( )
.

Mas se o objetivo for descrever a variao dos dados de uma amostra que ser
utilizada para inferir sobre a populao, ento a medida que deve ser utilizada a varincia
com denominador n 1.

Exemplo:

Se X = tempo (h)
Para x
i
= 9, 7, 5, 10, 4, onde = x 7h , temos

.

+ + + +
=

= = =

2
2 i
2 2 2 2 2
2
x x
s
n 1
(9 7) (7 7) (5 7) (10 7) (4 7)
5 1
4+0+4+9+9 26
6,5h
4 4
( )



Propriedades matemticas da varincia

1
a
propriedade: A varincia de um conjunto de dados que no varia, ou seja, cujos
valores so uma constante, zero.

2
2
c
c c
s 0
n 1
( )
= =

.

2
a
propriedade: Se somarmos uma constante c a todos os valores de um conjunto de
dados, a varincia destes dados no se altera.

| |
+
+ + +
= = = =


2
2 2
i 2 2 i i
x c
x c x c x x c c x x
s s
n 1 n 1 n 1
( ) ( ) ( ) ( )
.

3
a
propriedade: Se multiplicarmos todos os valores de um conjunto de dados por uma
constante c, a varincia destes dados fica multiplicada pelo quadrado desta constante.

| |
.

= = = = =


2
2 2 2 2
i 2 2 2 2 i i i
cx
c x x cx cx c x x x x
s c c s
n 1 n 1 n 1 n 1
( ) ( ) ( ) ( )



Desvantagens da varincia:

Como a varincia calculada a partir da mdia, uma medida pouco resistente, ou
seja, muito influenciada por valores discrepantes.

Como a unidade de medida fica elevada ao quadrado, a interpretao da varincia
se torna mais difcil.
Piana, Machado e Selau Estatstica Descritiva


48
Desvio Padro

O desvio padro, denotado por s, surge para solucionar o problema de interpretao
da varincia e definido como a raiz quadrada positiva da varincia. Assim, temos

=
2
s s .
Exemplo:

Se X = tempo (h)
Para x
i
= 9, 7, 5, 10, 4, onde =
2 2
s 6,5h , temos

= = =
2 2
s s 6,5h 2,55h

Podemos observar que o desvio padro expresso na mesma unidade de medida que
os dados, o que facilita a sua interpretao. Geralmente, o desvio padro apresentado junto
com a mdia do conjunto de dados da seguinte forma: x s . Deste modo, temos a indicao
da variao mdia dos dados em torno da mdia aritmtica.


Coeficiente de Variao

O coeficiente de variao, denotado por CV, a medida mais utilizada quando existe
interesse em comparar variabilidades de diferentes conjuntos de dados. Embora esta
comparao possa ser feita atravs de outras medidas de variao, nas situaes em que as
mdias dos conjuntos comparados so muito desiguais ou as unidades de medida so
diferentes, devemos utilizar o CV.
O coeficiente de variao definido como a proporo da mdia representada pelo
desvio padro e dado por
=
s
CV 100
x
.
Exemplo:

Se X = tempo (h)
Para x
i
= 9, 7, 5, 10, 4, onde = x 7h e = s 2,55h , temos

= = =
s 2,55h
CV 100 100 36, 4%
x 7h


As vantagens do coeficiente de variao sobre as demais medidas de variao so as
seguintes:

O CV desprovido de unidade de medida, uma vez que, expresso em
percentagem;
O CV uma medida relativa, ou seja, que relaciona o desvio padro (s) com a sua
respectiva mdia aritmtica ( x ). Deste modo, um desvio padro maior pode, algumas vezes,
representar uma variabilidade menor quando relacionado com a sua mdia.

A convenincia da utilizao do CV para a comparao das variabilidades de
conjuntos de dados com mdias ou com unidades de medida diferentes pode ser verificada nos
seguintes exemplos:

1. Consideremos que x
1i
e x
2i
so conjuntos de valores referentes a produo diria de
leite (em kg) de vacas das raas Holandesa e Jersey, respectivamente, para os quais foram
obtidas as seguintes medidas:
Piana, Machado e Selau Estatstica Descritiva


49
Holandesa: =
1
x 25kg, =
1
s 4,2 kg , =
1
CV 16,8%
Jersey: =
2
x 13kg , =
2
s 3, 4kg , =
2
CV 26,2%

Podemos observar que se utilizssemos o desvio padro para comparar as variaes
dos conjuntos de dados, concluiramos que o grupo das vacas holandesas mais varivel, pois
apresenta o maior valor para esta medida. Entretanto, no podemos deixar de considerar que o
desvio padro 4,2, mesmo sendo o maior, quando relacionado mdia 25, representa uma
poro menor deste valor do que o desvio padro 3,4 quando relacionado mdia 13. Sendo
assim, quando as mdias so muito desiguais, devemos utilizar na comparao dos conjuntos
de valores o CV que uma medida relativa.

2. Consideremos, agora, que x
i
e y
i
so conjuntos de valores referentes a alturas (em
cm) e pesos (em kg), respectivamente, de um grupo de estudantes, para os quais foram
obtidas as seguintes medidas:

Altura: = x 165cm, =
X
s 30cm, =
X
CV 18,2%
Peso: = y 58kg , =
Y
s 9kg , =
Y
CV 15,5%

Verificamos, neste caso, que para a comparao de conjuntos de valores expressos
em diferentes unidades de medida, o CV a nica medida que pode ser utilizada por ser
desprovida de unidade de medida. Se utilizssemos qualquer outra medida de variao
estaramos comparando centmetros com quilogramas, o que no seria possvel, uma vez que
tais grandezas no so comparveis.


2.3.4. Medidas de formato

O formato um aspecto importante de uma distribuio. Embora mudanas em uma
medida de variao tambm provoquem alteraes no aspecto visual, o formato de uma
distribuio se relaciona com as ideias de simetria e curtose.

Vrias medidas tm o objetivo de informar sobre o formato de uma distribuio. Entre
as mais precisas esto os coeficientes de assimetria e de curtose, que so calculados a partir
dos momentos da distribuio.


Momentos

Os momentos, denotados por m
r
, so medidas calculadas com o propsito de estudar
a distribuio. De um modo geral, tanto mais conhecemos uma distribuio quanto mais
conhecermos sobre os seus momentos. O momento de ordem r centrado num valor a dado
por

=

r
i
r
x a
m
n
( )
.


Dois valores de a geram momentos importante num conjunto de dados:

Quando = a 0 , temos os momentos centrados na origem, denominados momentos
ordinrios de ordem r e representados por
r
m . Assim, temos

=

r
i
r
x
m
n
.
Piana, Machado e Selau Estatstica Descritiva


50
Exemplos:
Para r = 1, temos: =

i
1
x
m
n

Para r = 2, temos: =

2
i
2
x
m
n

Para r = 3, temos:
3
i
3
x
m
n
=


Para r = 4, temos:
4
i
4
x
m
n
=



Quando = a x , temos os momentos de ordem r centrados na mdia e representados
por
r
m . Assim, temos

=

r
i
r
x x
m
n
( )
.

Exemplos:
Para r = 1, temos:

=

i
1
x x
m
n
( )

Para r = 2, temos:

=

2
i
2
x x
m
n
( )

Para r = 3, temos:

=

3
i
3
x x
m
n
( )

Para r = 4, temos:

=

4
i
4
x x
m
n
( )



Coeficiente de assimetria

Entre as vrias medidas de assimetria que devem informar se a maioria dos valores se
localiza esquerda, ou direita, ou se esto uniformemente distribudos em torno da mdia
aritmtica, temos o coeficiente de assimetria, denotado por
3
a . Esta medida indica o grau e o
sentido do afastamento da simetria e obtida utilizando o segundo e o terceiro momentos
centrados na mdia, atravs da seguinte expresso

=
3
3
2 2
m
a
m m
.

A classificao da distribuio quanto a simetria feita de acordo com o valor do
3
a :

Se
3
a < 0, a distribuio classificada como assimtrica negativa, indicando que a
maioria dos valores so maiores ou se localizam direita da mdia aritmtica.

Se
3
a = 0, a distribuio classificada como simtrica, indicando os valores esto
uniformemente distribudos em torno da mdia aritmtica.

Se
3
a > 0, a distribuio classificada como assimtrica positiva, indicando que a
maioria dos valores so menores ou se localizam esquerda da mdia aritmtica.
Piana, Machado e Selau Estatstica Descritiva


51

Assimtrica negativa Simtrica Assimtrica positiva


Coeficiente de curtose

As medidas de curtose indicam o grau de achatamento de uma distribuio. O
coeficiente de curtose, denotado por
4
a , calculado a partir do segundo e do quarto momentos
centrados na mdia, atravs da seguinte expresso

=
4
4 2
2
m
a
m
.

A curtose est relacionada com o grau de concentrao das observaes no centro e
nas caudas da distribuio e no tem interpretao to intuitiva quanto a simetria. A
classificao da distribuio feita de acordo com o valor do
4
a , tendo por base a curtose que
ocorre na distribuio normal, que classificada como mesocrtica.

Se <
4
a 3, a distribuio classificada como platicrtica, indicando que ocorre baixa
concentrao de valores no centro, tornando a distribuio mais achatada que a distribuio
normal. A concentrao de valores nos eixos mdia mais ou menos o desvio padro maior
que na distribuio normal.

Se =
4
a 3 , a distribuio classificada como mesocrtica, indicando que a
concentrao das observaes ocorre de forma semelhante da distribuio normal. A
concentrao de valores nos eixos mdia mais ou menos o desvio padro maior que na
distribuio normal.

Se >
4
a 3 , a distribuio classificada como leptocrtica, indicando que ocorre alta
concentrao de valores no centro e nas caudas, o que provoca um pico maior que o da
distribuio normal. A concentrao de valores em torno dos eixos mdia mais ou menos o
desvio padro menor do que na distribuio normal.


Platicrtica Mesocrtica Leptocrtica

As medidas de curtose so muito pouco utilizadas, exceto em algumas reas
especficas como vendas, onde geralmente existe interesse no estudo da extenso dos picos
das distribuies.
Piana, Machado e Selau Estatstica Descritiva


52
2.3.5. Medidas descritivas para dados agrupados em classe

As medidas descritivas podem ser calculadas a partir de dados agrupados em classe.
Entretanto, quando calculadas a partir de tabelas de distribuio de frequncias de variveis
contnuas, essas medidas, em geral, so apenas aproximaes das medidas obtidas a partir
dos dados no agrupados.


Medidas de localizao ou tendncia central

Mdia aritmtica

Nas distribuies de frequncias de variveis contnuas inexistem valores individuais.
Consideramos, ento, que o melhor representante dos valores de uma classe o centro de
classe (c
j
) e, a partir destes valores, determinamos a mdia da varivel. Devemos observar, no
entanto, que os centros de classe representam nmeros diferentes de observaes, no
podendo participar da mdia com o mesmo peso. Assim, a mdia da distribuio ser a mdia
ponderada (pelas frequncias absolutas) dos centros de classe, que definida por

= =

k k
j j j j
j=1 j=1
p k
j
j=1
c F c F
x
n
F
.

O valor da mdia de uma distribuio obtido com um erro provocado pelo
agrupamento dos dados. Esse erro tanto menor quanto maior for a simetria dos valores de
cada classe em relao ao seu centro ou ponto mdio (c
j
). Entretanto, nas distribuies
discretas, como a da Tabela 2.12, tal erro no cometido, pois no existe representao pelo
centro de classe.


Classe mediana e classe modal

Embora existam expresses para o clculo aproximado da mediana e da moda a partir
de dados agrupados em classe, aqui nos interessar apenas determinar a classe mediana e a
classe modal.

A classe mediana aquela onde est compreendida a mediana. Esta classe a
primeira cuja frequncia absoluta acumulada (
j
F ) maior ou igual ao valor de p (posio da
mediana). A posio da mediana, como j vimos anteriormente, obtida atravs da expresso

n+1
p =
2
.

A classe modal aquela que possui a maior frequncia absoluta, mas no ,
necessariamente, a classe que compreende a moda do conjunto de valores.


Medidas de variao ou disperso

Varincia

Devido inexistncia de valores individuais na distribuio de frequncias, devemos
utilizar para o clculo da varincia a seguinte expresso
Piana, Machado e Selau Estatstica Descritiva


53
( )

2
j j p
2
F c x
s
n 1
.

A varincia pode ser entendida como uma medida da extenso de um histograma ou
de um polgono de frequncias sobre o eixo horizontal.

Desvio padro e coeficiente de variao

O desvio padro e o coeficiente de variao para dados agrupados so obtidos da
mesma forma que para dados no agrupados. Assim, temos

=
2
s s e
p
s
CV = 100
x
.

Medidas de formato

As expresses que definem o coeficiente de assimetria e o coeficiente de curtose,
tambm permanecem as mesmas que para os dados no agrupados, respectivamente,

=
3
3
2 2
m
a
m m
e =
4
4 2
2
m
a
m
.

Porm, os momentos centrados da mdia, utilizados no clculo desses coeficientes,
pelas mesmas razes j mencionadas para a varincia e para a mdia, so assim definidos

=

2
j j p
2
F c x
m
n
( )
,

=

3
j j p
3
F c x
m
n
( )
e

=

4
j j p
4
F c x
m
n
( )
.

Vamos utilizar a distribuio de frequncias apresentada na Tabela 2.13, para
exemplificar o clculo das medidas descritivas a partir de dados agrupados em classe.

Para facilitar a obteno destas medidas, convm utilizar a tabela auxiliar abaixo que
inclui todos os clculos intermedirios necessrios.

j Classes
j
c
j
F
j
F
j j
c F
2
j j p
F c x ( )
3
j j p
F c x ( )
4
j j p
F c x ( )
1 16 | 19,3 17,65 7 7 123,55 496,27 -4.178,63 35.184,10
2 19,3 | 22,6 20,95 9 16 188,55 235,93 -1.207,96 6.184,75
3 22,6 | 25,9 24,25 15 31 363,75 49,69 -90,43 164,58
4 25,9 | 29,3 27,55 12 43 330,60 26,28 38,90 57,57
5 29,2 | 32,5 30,85 9 52 277,65 205,64 982,94 4.698,44
6 32,5 | 35,8 34,15 6 58 204,90 391,72 3.165,08 25.573,88
7 35,8 || 39,1 37,45 2 60 74,90 259,01 2.947,52 33.542,78
60 1.563,9 1.664,54 1.657,42 105.406,11

A partir dos totais da ltima linha da tabela, podemos facilmente calcular as medidas.
Assim temos:

Mdia aritmtica: = = =

k
j j
j=1
p
c F
1563,9
x 26,07kg
n 60

Piana, Machado e Selau Estatstica Descritiva


54
Como n par, existem duas posies centrais no conjunto. Sendo

n+1 60+1
p 30,5
2 2
= = = ,

as posies p
1
e p
2
so os inteiros mais prximos de 30,5, ou seja, 30 e 31, respectivamente. A
primeira classe a apresentar freqncia absoluta acumulada igual posio (de maior valor, no
caso de n par) da mediana a terceira, =
j
F 31, significando que os valores que ocupam as
posies 30 e 31 pertencem a esta classe. Portanto, a classe mediana a terceira.

A classe com maior frequncia absoluta tambm a terceira, =
3
F 15 . Assim, a classe
modal a terceira.

Varincia:
( )

= =

=

2
2
j j p
2 2
F c x
1664,54kg
s 28,21kg
n 1 60 1



Desvio padro: = = =
2 2
s s 28,21kg 5,331kg


Coeficiente de variao: = = =
p
s 5,331kg
CV 100 100 20,37%
x 26,07kg


Momentos centrados na mdia:

= = =

2
2
j j p 2
2
F c x
1664,54kg
m 27,74kg
n 60
( )

= = =

3
3
j j p 3
3
F c x
1657, 42kg
m 27,62kg
n 60
( )

= = =

4
4
j j p 4
4
F c x
105406,11kg
m 1756,77kg
n 60
( )


Coeficientes de assimetria e curtose:

= = =
3
3
3
2 2
2 2
m 27,62kg
a 0,189
m m
27,74kg 27,74kg
indica que a distribuio simtrica

( )
= = =
4
4
4 2 2
2
2
m 1756,77 kg
a 2,283
m
27,74 kg
indica que a distribuio platicrtica

Devemos salientar que as medidas para dados agrupados em classe vm sendo cada
vez menos utilizadas. A obteno de medidas descritivas a partir de distribuies de
frequncias tem como principal objetivo facilitar o processo de clculo, pois, quando se trata de
conjuntos de dados muito grandes, essa tarefa bastante trabalhosa. Outra razo que justifica
o uso dessas medidas a falta de acesso aos dados originais (no agrupados). Contudo,
sabe-se que medidas obtidas a partir de dados agrupados em classe, na maioria das vezes,
Piana, Machado e Selau Estatstica Descritiva


55
no so exatas. Com o advento da computao e o desenvolvimento de programas
estatsticos, o problema da dificuldade no processo de clculo foi superado, uma vez que estes
programas executam clculos trabalhosos com rapidez e exatido. Sendo assim, no havendo
mais a dificuldade para a obteno das medidas exatas, no h razo para continuarmos
utilizando as medidas aproximadas.
No quadro abaixo podemos observar os valores das medidas calculadas a partir dos
dados no agrupados e a partir da tabela de distribuio de frequncias.

Dados no agrupados Dados agrupados em classe
x = 25,78 kg x = 26,07 kg
Md = 25 kg Classe mediana: [22,6 ; 25,9)
Mo = 23 kg Classe modal: [22,6 ; 25,9)
s
2
= 28,64 kg
2
s
2
= 28,21 kg
2

s = 5,352 kg s = 5,331 kg
CV = 20,76% CV = 20,37%
m
2
= 28,16 kg
2
m
2
= 27,74 kg
2

m
3
= 32,48 kg
3
m
3
= 27,62 kg
3

m
4
= 1.875,62 kg
4
m
4
= 1.756,77 kg
4

a
3
= 0,218 a
3
= 0,189
a
4
= 2,365 a
4
= 2,283

Comparando os valores das medidas calculadas pelos dois processos, podemos
verificar que as medidas obtidas dos dados agrupados em classe so aproximaes daquelas
obtidas a partir dos dados no agrupados, que so as medidas exatas. Tanto maior ser esta
aproximao, quanto mais simtrica for a distribuio dos valores dentro dos intervalos de
classe.


Medida descritiva e escala de medida

Algumas medidas descritivas exigem uma escala de medida mnima para serem
obtidas. A tabela relaciona a escala necessria para algumas medidas.


Medida Escala mnima
Moda Escala nominal
Percentis Escala ordinal
Mdia aritmtica Escala intervalar

Piana, Machado e Selau Estatstica Descritiva


56
Exerccios propostos:

2.5. Os valores que seguem so os tempos (em segundos) de reao a um alarme de incndio,
aps a liberao de fumaa de uma fonte fixa:

12 9 11 7 9 14 6 10

Calcule as medidas de localizao (mdia, mediana e moda) e as medidas de variao
(amplitude total, varincia, desvio padro e coeficiente de variao) para o conjunto de dados.


2.6. Foram registrados os tempos de frenagem para 21 motoristas que dirigiam a 30 milhas por
hora. Os valores obtidos foram:

69 58 70 80 46 61 65 74 75 55 67
56 70 72 61 66 58 68 70 68 58

Para este conjunto de valores, calcule os quartis e a amplitude interquartlica e
interprete esses valores.

2.7. Calcule as medidas descritivas para o conjunto de dados referente ao nmero de pes no
vendidos em uma certa padaria at a hora do encerramento do expediente

j Classes
j
F

j
F
j j
c F

2
j j p
F c x ( )
3
j j p
F c x ( )
4
j j p
F c x ( )
1 0 20
2 1 7
3 2 7
4 3 3
5 4 2
6 5 1
40


2.8. Calcule as medidas descritivas para o conjunto de dados agrupados em classes,
apresentado na tabela abaixo.

Frequncia do valor gasto (em reais) pelas primeiras 50 pessoas que entraram em um
determinado supermercado, no dia 01/01/2000.

j Classes
j
c
j
F

j
F
j j
c F

2
j j p
F c x ( )
3
j j p
F c x ( )
4
j j p
F c x ( )
1 3,11 | 16,00 8
2 16,00 | 28,89 20
3 28,89 | 41,78 6
4 41,78 | 54,67 8
5 54,67 | 67,56 3
6 67,56 | 80,45 1
7 80,45 || 93,34 4
50
Piana, Machado e Selau Estatstica Descritiva


57
2.4. Anlise exploratria de dados

Vimos que a mdia aritmtica e a varincia, por serem medidas de fcil compreenso
e apresentarem boas propriedades matemticas e estatsticas, so muito utilizadas para
representar, respectivamente, a tendncia central e a disperso de um conjunto de valores.
Entretanto, importante destacar que essas medidas descrevem de forma tima apenas as
distribuies de frequncias unimodais, simtricas e mesocrticas. Podemos citar pelo menos
uma limitao importante do uso indiscriminado da mdia e da varincia na descrio de um
conjunto de dados. Sabemos que essas duas medidas so pouco resistentes; portanto, numa
distribuio assimtrica, seus valores seriam bastante afetados pelos valores discrepantes.

John Tukey, em 1970, props algumas tcnicas que, dentre outras vantagens,
contornavam esse problema advindo do uso da mdia e da varincia para descrever
distribuies assimtricas. O conjunto dessas tcnicas, denominado Anlise Exploratria de
Dados, no s constituiu um complemento s tcnicas estatsticas clssicas, como foi tambm
uma valiosa alternativa para descrever dados que no seguem o modelo unimodal, simtrico e
mesocrtico. O enfoque proposto pela Anlise Exploratria de Dados pretende obter medidas
resistentes e robustas.

Vimos que medidas resistentes so aquelas que se mostram pouco sensveis
presena de valores anmalos (discrepantes do ncleo central da distribuio). Uma medida
resistente mostrar poucas variaes diante da substituio dos valores originais por outros
muito diferentes, devido a sua focalizao na parte central ou relativamente agrupada da
distribuio. Dentre as medidas resistentes, o enfoque clssico tem a mediana como principal
exemplo. So denominadas medidas robustas aquelas que apresentam pouca sensibilidade
diante dos desvios aos pressupostos bsicos inerentes aos modelos probabilsticos, como
acontece com relao forma da distribuio, por exemplo.

As tcnicas exploratrias ajudam a comprovar as condies de aplicao dos testes
de hipteses (que sero vistos, mais adiante, na Inferncia Estatstica), a detectar erros ou
valores discrepantes, a buscar a melhor transformao de dados quando houver necessidade,
etc. Em geral, do uma viso distinta, prvia, mas complementar s tcnicas de Inferncia,
tambm chamadas de confirmatrias. Tudo isso repercute em melhor qualidade da anlise de
dados.

Nosso objetivo aqui apresentar trs dessas tcnicas: o resumo de cinco nmeros, o
grfico em caixa (box plot) e o diagrama de ramos e folhas. O grfico em caixa, alm de
representar os dados dando uma ideia precisa do formato da distribuio, ainda permite a
identificao de valores discrepantes.

Resumo de cinco nmeros

O resumo de cinco nmeros descreve o conjunto de dados atravs de cinco valores: a
mediana (Md), os quartis, primeiro (Q
1
) e terceiro (Q
3
), e os extremos, inferior (EI) e superior
(ES). A partir desses valores, podemos calcular: a amplitude interquartlica (a
q
), obtida pela
diferena entre os quartis; a disperso inferior (DI), obtida pela diferena entre a mediana e o
extremo inferior; e a disperso superior (DS), diferena entre o extremo superior e a mediana.
O resumo de cinco nmeros fornece uma ideia acerca da simetria da distribuio porque o
percentual de observaes compreendido dentro de cada um desses intervalos conhecido
(25%).
Assim, se a diferena entre o primeiro quartil e extremo inferior aproximadamente
igual diferena entre o extremo superior e o terceiro quartil (
1 3
Q EI ES Q ) e a diferena
entre a mediana e o primeiro quartil aproximadamente igual diferena entre o terceiro
quartil e a mediana (
1 3
Md Q Q Md ), a distribuio considerada simtrica. Na figura
abaixo podemos observar alguns casos simtricos.
Piana, Machado e Selau Estatstica Descritiva


58


Se uma dessas duas condies no for atendida, ento, a distribuio ser
assimtrica. Por exemplo, se a disperso superior for muito maior que a disperso inferior,
teremos uma distribuio assimtrica positiva, indicando que a maior concentrao de valores
est entre o extremo inferior e a mediana, ou ainda que os valores que se localizam abaixo da
mediana so mais homogneos do que aqueles que se localizam acima dela. Se, em caso
contrrio, a disperso inferior for maior que a disperso superior, teremos uma distribuio
assimtrica negativa. Na figura abaixo podemos observar alguns exemplos de distribuies
assimtricas.





Consideremos agora um exemplo resolvido:


Os dados abaixo se referem aos pesos ao nascer (em kg) de 61 bovinos machos da
raa Ibag.

16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20,
20, 21, 21, 22, 22, 23, 23, 23, 23, 23, 23,
23, 23, 23, 25, 25, 25, 25, 25, 25, 26, 26,
27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 30,
30, 30, 30, 30, 30, 30, 31, 32, 33, 33, 33,
34, 34, 35, 36, 39, 45

Para esses dados vamos obter o esquema de cinco nmeros, a amplitude
interquartlica e a disperso inferior e a disperso superior.

Piana, Machado e Selau Estatstica Descritiva


59


O resumo de cinco nmeros permite verificar que a distribuio no simtrica, pois
as distncias entre esses valores so diferentes.
Veremos a seguir que, atravs dos quartis e da amplitude interquartlica, tambm
possvel identificar a presena de valores discrepantes no conjunto de dados.


Identificao de valores discrepantes

Um critrio objetivo para a identificao de valores discrepantes num conjunto de
dados utiliza duas medidas denominadas cerca inferior (CI) e cerca superior (CS). A cerca
inferior calculada subtraindo-se do primeiro quartil uma e meia amplitude interquartlica, e a
cerca superior, somando-se esta mesma quantidade ao terceiro quartil. Assim, temos:

=
1 q
CI Q 1,5a e = +
3 q
CS Q 1,5a

So considerados discrepantes os valores que estivem fora do seguinte intervalo:

+ (

1 q 3 q
Q 1,5a Q 1,5a ; .

Valores menores que a cerca inferior so denominados discrepantes inferiores e os
valores maiores que a cerca superior so os discrepantes superiores.

No exemplo, sero considerados discrepantes os valores que estiverem fora dos
limites da cerca superior e da cerca inferior:

= = =
1 q
CI Q 1,5a 22 1,5 8 10
= + = + =
3 q
CS Q 1,5a 30 1,5 8 42

Verificamos que o valor 45 ultrapassa a cerca superior, portanto, classificado como
discrepante superior.


Grfico em caixa (box plot)

A informao dada pelo resumo de cinco nmeros pode ser apresentada em forma de
um grfico em caixa, que agrega uma srie de informaes a respeito da distribuio, tais
como localizao, disperso, assimetria, caudas e dados discrepantes. Antes de construir o
grfico precisamos definir o que so valores adjacentes. So adjacentes o menor e o maior
valores no discrepantes de um conjunto de dados, ou seja, o maior valor que no ultrapassa a
cerca superior e o menor valor que no ultrapassa a cerca inferior. Se num conjunto de dados
Piana, Machado e Selau Estatstica Descritiva


60
nenhum valor considerado discrepante, os valores adjacentes so os prprios extremos. Para
construir o grfico em caixa, consideraremos um retngulo onde estaro representados os
quartis e a mediana. A partir do retngulo, para cima e para baixo, seguem linhas,
denominadas bigodes, que vo at os valores adjacentes. Os valores discrepantes recebem
uma representao individual atravs de uma letra ou um smbolo. Assim, obtemos uma figura
que representa muitos aspectos relevantes de um conjunto de dados, como podemos observar
na ilustrao abaixo.



A posio central dos valores dada pela mediana e a disperso pela amplitude
interquartlica (a
q
). As posies relativas da mediana e dos quartis e o formato dos bigodes do
uma noo da simetria e do tamanho das caudas da distribuio.

Na figura abaixo podemos observar o grfico em caixa representando diferentes tipos
de distribuies:

a) distribuio assimtrica positiva, com trs valores discrepantes superiores;
b) distribuio simtrica, com um valor discrepante inferior;
c) distribuio assimtrica negativa, sem valores discrepantes.



a) assimtrica positiva b) simtrica c) assimtrica negativa
Piana, Machado e Selau Estatstica Descritiva


61
Vale lembrar que quando encontramos um valor discrepante num conjunto de dados, a
sua origem deve ser investigada. Muitas vezes, os valores discrepantes, de fato, fazem parte
do conjunto de dados, reforando a caracterstica assimtrica da distribuio. Mas,
eventualmente, estes valores podem ser oriundos de erros na aferio ou no registro dos
dados. Em geral, distribuies com caudas longas (indicadas por bigodes longos no grfico),
caracterstica comum de distribuies assimtricas, apresentam uma tendncia maior de
produzir valores discrepantes. Nas figuras acima, os bigodes de diferentes tamanhos indicam
distribuies assimtricas. O valor discrepante parece ser uma anomalia maior na figura b, pois
se trata de uma distribuio simtrica e com caudas curtas. De qualquer modo, uma cuidadosa
inspeo nos dados e nas eventuais causas da ocorrncia desse(s) valor(es) sempre uma
providncia necessria antes que qualquer atitude seja tomada em relao a esses dados.
A seguir temos o grfico em caixa representando o conjunto de dados do exemplo,
que se refere aos pesos ao nascer de bovinos machos da raa Ibag.




Diagrama de ramo e folhas

Trata-se de uma ferramenta exploratria til para descrever pequenos conjuntos de
dados. O mtodo fornece uma boa viso geral dos dados sem que haja uma perda de
informao detectvel. Cada valor retm sua identidade e a nica informao perdida a
ordem em que foram obtidos os dados. Eventualmente, alguns algarismos podem ser
desprezados para facilitar a representao do conjunto.
O diagrama de ramos e folhas um procedimento alternativo para resumir um
conjunto de valores, que fornece uma ideia da forma de sua distribuio, semelhante a um
histograma. Este grfico uma boa opo quando temos em mos somente os dados, caneta
e papel.

Para ilustrar a montagem do diagrama de ramo e folhas, consideremos os seguintes
dados relativos s notas de 40 alunos em uma prova de Estatstica.

78 59 86 94 43 56 78 84
57 49 96 68 67 65 75 73
67 87 84 45 56 94 87 56
85 76 86 79 78 77 59 76
68 49 86 87 83 94 85 96

O primeiro passo a separao dos dados, combinando todos os valores que
comeam com 4, todos que comeam com 5, todos que comeam com 6, e assim por diante.
Assim, temos

Piana, Machado e Selau Estatstica Descritiva


62
43 49 45
59 56 57 56 56 59
68 67 65 67 68
78 78 75 73 76 79 78 77 76
86 84 89 87 84 87 85 86 86 87 83 85
94 96 94 94 96

Esse arranjo j bastante informativo, mas no o tipo de diagrama utilizado na
prtica. Para simplificar ainda mais, mostramos o primeiro dgito uma vez para cada linha,
esquerda e separando dos outros dgitos por meio de uma linha vertical. Assim, temos

4
5
6
7
8
9
3 5 9
9 6 7 6 6 9
8 7 5 7 8
8 8 5 3 6 9 8 7 6
6 4 9 7 4 7 5 6 6 7 3 5
4 6 4 4 6

Isso o que denominamos diagrama de ramo e folhas. Nesse arranjo, cada linha
denominada ramo, cada nmero no ramo esquerda da linha vertical chamado rtulo do
ramo e cada nmero direita da linha vertical denominado folha. bastante interessante que
as folhas do diagrama sejam ordenadas facilitando ainda mais a interpretao. Dessa forma,
nosso diagrama resulta assim:

4
5
6
7
8
9
3 5 9
6 6 6 7 9 9
5 7 7 8 8
3 5 6 6 7 8 8 8 9
3 4 4 5 5 6 6 6 7 7 7 9
4 4 4 6 6

Existem vrias maneiras de organizar um diagrama de ramo e folhas. Por exemplo, os
rtulos dos ramos ou as folhas poderiam ser de dois dgitos, como por exemplo, o conjunto
240, 242, 245, 248 e 249, sendo representado de duas formas:

24| 0 2 5 8 9
ou
2| 40 42 45 48 49.

Em casos de muitos valores pode ser necessrio obter mais ramos, repetindo cada
rtulo de ramo, por exemplo, duas vezes, sendo o primeiro com as folhas de 0 a 4 e o segundo
com as folhas de 5 a 9. Esse tipo de diagrama chamado diagrama de ramos duplos. Um
diagrama de ramo e folhas pode ainda ser complementando com informaes adicionais, como
o nmero de observaes em cada ramo.

Piana, Machado e Selau Estatstica Descritiva


63
Exerccios propostos:

2.9. Os dados abaixo se referem aos valores gastos (em reais) pelas primeiras 50 pessoas que
entraram em um determinado Supermercado, no dia 01/01/2000.

3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39
18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47
24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37
38,98 38,64 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65
50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34

Para esses dados:
a) Obtenha o resumo de cinco nmeros.
b) Verifique se existem valores discrepantes.
c) Construa o grfico em caixa.
d) Com base no grfico, classifique a distribuio quanto simetria. Justifique sua resposta.


2.10. As duraes (em horas de uso contnuo) de 25 componentes eletrnicos selecionados de
um lote de produo so:

834, 919, 784, 865, 839, 912, 888, 783, 655,
831, 886, 842, 760, 854, 939, 961, 826, 954,
866, 675, 760, 865, 901, 632, 718.

Construa um diagrama de ramo e folhas com rtulos de ramos com um dgito e folhas de dois
dgitos. Use esse diagrama de ramo e folhas para decidir sobre a simetria desses dados.


Piana, Machado e Selau Estatstica Descritiva


64
2.5. Bibliografia


ANDRES, A.M., CASTILLO, J. de D.L. del Bioestadistica para las Cincias de la Salud.
Madrid: Ediciones Norma, 1988. 614 p.

BOTELHO, E.M.D., MACIEL, A.J. Estatstica Descritiva (Um Curso Introdutrio) Viosa:
Universidade Federal de Viosa, 1992. 65p.

COSTA, S.F. Introduo Ilustrada Estatstica (com muito humor!). 2.ed., So Paulo:
Harbra, 1992. 303p.

FARIA, E.S. de Estatstica Edio 97/1. (Apostila)

FERREIRA, D.F. Estatstica Bsica. Lavras: Editora UFLA, 2005, 664p.

FREUND, J.E., SIMON, G.A. Estatstica Aplicada. Economia, Administrao e
Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p.

PIMENTEL GOMES, F. Iniciao Estatstica So Paulo: Nobel, 1978. 211p.

SILVEIRA JNIOR, P., MACHADO, A.A., ZONTA, E.P., SILVA, J.B. da Curso de Estatstica
v.1, Pelotas: Universidade Federal de Pelotas, 1989. 135p.

SPIEGEL, M.R. Estatstica So Paulo: McGraw-Hill, 1972. 520p.

Sistema Galileu de Educao Estatstica. Disponvel em: <http://www.galileu.esalq.usp.br>






Unidade III
Elementos de Probabilidade


3.1. Introduo teoria das probabilidades................................................................... 66
3.1.1. Introduo......................................................................................................... 66
3.1.2. Conceitos fundamentais................................................................................... 68
3.1.3. Conceitos de probabilidade.............................................................................. 69
3.1.4. Teoremas para o clculo de probabilidades..................................................... 69
3.1.5. Probabilidade condicional e independncia...................................................... 73
3.2. Variveis aleatrias................................................................................................... 77
3.2.1. Introduo e conceito........................................................................................ 77
3.2.2. Variveis aleatrias discretas........................................................................... 79
3.2.3. Variveis aleatrias contnuas.......................................................................... 86
3.3. Distribuies de probabilidade................................................................................ 92
3.3.1. Distribuies de probabilidade de variveis discretas...................................... 92
3.3.2. Distribuies de probabilidade de variveis contnuas..................................... 104
3.3. Bibliografia................................................................................................................. 117

Piana, Machado e Selau Elementos de Probabilidade


66
3.1. Introduo teoria das probabilidades

3.1.1. Introduo

A Estatstica, desde as suas origens (antigo Egito 2000 anos a.C.) at meados do
sculo XIX, se preocupava apenas com a organizao e a apresentao de dados de
observao coletados empiricamente (Estatstica Descritiva).

Somente com o desenvolvimento da teoria das probabilidades foi possvel que a
Estatstica se estruturasse organicamente e ampliasse seu campo de ao, atravs da criao
de tcnicas de amostragem mais adequadas e de formas de relacionar as amostras com as
populaes de onde provieram (Inferncia Estatstica).

A probabilidade uma rea relativamente nova da matemtica (considerando a idade
da matemtica) que tem como finalidade a modelagem de fenmenos aleatrios. Modelar
significa conhecer matematicamente. Uma das funes da matemtica a criao de modelos
que possibilitem o estudo dos fenmenos da natureza. Ao estudar um fenmeno, temos
sempre o interesse de tornar a sua investigao mais precisa e, para isso, tentamos formular
um modelo matemtico que melhor o explique.

Na formulao do modelo matemtico mais adequado deve-se levar em conta que
certos pormenores sejam desprezados com o objetivo de simplificar o modelo. Deste modo,
tanto maior ser a representatividade do modelo quanto menor foi a importncia destes
detalhes na elucidao do fenmeno considerado.

A verificao da adequao do modelo escolhido no pode ser feita sem que alguns
dados de observao sejam obtidos. Atravs da comparao dos resultados previstos pelo
modelo com um determinado nmero de valores observados, poderemos concluir se o modelo
ou no adequado para explicar o fenmeno em estudo.

Dependendo do fenmeno que est sendo estudado, os modelos matemticos podem
ser de dois tipos:

a) Modelo determinstico: aquele em que ao conhecer as variveis de entrada, ou
seja, as condies do experimento, possvel determinar as variveis de sada, isto , os seus
resultados. Para os fenmenos determinsticos existe a certeza do resultado que ocorrer. Na
fsica clssica, a maioria dos fenmenos estudados so determinsticos.
Exemplo: Se o deslocamento de um objeto definido pela expresso s v t = e so
conhecidos os valores de v (velocidade) e t (tempo), ento o valor de s fica implicitamente
determinado.

b) Modelo estocstico, probabilstico ou aleatrio: aquele em que, mesmo
conhecendo as condies do experimento, no possvel determinar o seu resultado final.
Neste modelo, introduzido um componente aleatrio e s possvel determinar a chance de
ocorrncia de um resultado. Na biologia, os fenmenos so probabilsticos.
Exemplo: O nascimento de um bovino. No possvel determinar o sexo do recm
nascido, somente a sua probabilidade de ocorrncia: 0,5 para fmea e 0,5 para macho.

A modelagem de um experimento aleatrio implica em responder trs questes
fundamentais:
Quais as possveis formas de ocorrncia?
Quais so as chances de cada ocorrncia?
De que forma se pode calcular isso?
Piana, Machado e Selau Elementos de Probabilidade


67
Um pouco de histria...








































O estudo das probabilidades teve suas origens
no sculo XVII, a partir do interesse de dois
matemticos franceses, Pascal e Fermat, em resolver
problemas relacionados com jogos de azar, que lhes
eram propostos pelo nobre francs Cavalheiro de
Mre.
Data de 1713, entretanto, o primeiro grande
tratado nesse campo escrito por Jacques Bernoulli
denominado Ars Conjectandi (Arte das Conjecturas).
Bernoulli exemplificou seu trabalho principalmente em
termos de jogos de azar.
Blaise Pascal
(1623 -1662)
Pierre Fermat
(1601 -1665)
Carl Friedrich Gauss
(1777 -1855)
Na mesma linha seguiram alguns trabalhos subsequentes, com destaque para a obra
de Abraham de Moivre iniciada, em 1718, com Doctrine of Changes. A famosa distribuio
normal foi deduzida pelo francs de Moivre como resultado do limite da expanso do binmio
(a + b)
n
, embora ainda no tivesse sido colocada como uma distribuio de probabilidade.
Mais tarde, essa relao veio a ter uma importncia muito grande por estabelecer a
aproximao da distribuio binomial em relao normal.
O extraordinrio avano das probabilidades, entretanto, deu-se no incio do sculo
XIX, atravs do matemtico Laplace com seu clssico Therie analytique des probabilits
(1812), onde mostra que a rea sob a curva normal e fornece uma prova formal sobre o
mtodo dos quadrados mnimos.
Abraham de Moivre
(1667 -1754)
Praticamente no mesmo perodo, o
matemtico e astrnomo alemo Gauss, chegou
aos mesmos resultados sobre a curva normal de
probabilidades, estudando a distribuio dos erros
de medida. Mas somente no sculo XX que se
desenvolveu uma teoria matemtica rigorosa
baseada em axiomas, definies e teoremas.
As distribuies de probabilidades so
consideradas hoje a espinha dorsal da teoria
estatstica, pois todos os processos de inferncia
so aplicaes de distribuies de probabilidades.
Assim, o conhecimento dos conceitos
advindos da teoria das probabilidades de grande
importncia para a correta utilizao da estatstica.
Blaise Pascal nunca frequentou
escola, foi educado pelo pai que era
matemtico. Quando Blaise estava
com 11 anos descobriu sozinho que a
soma dos ngulos de um tringulo era
180 graus! A 32
a
proposio de
Euclides! E ele jamais tinha ouvido
falar em Euclides, pois seu pai lhe
havia escondido, temendo que a
geometria fosse lhe cansar a cabea.
Quando o pai ficou sabendo o que o
filho acabava de (re)descobrir, chorou
de alegria e ficou to contente que lhe
deu de presente os treze livros dos
Elementos de Euclides. (Guedj, 2000)
Com o intuito de ajudar o pai que, alm de matemtico,
tambm era cobrador de impostos e tinha muitas contas a
fazer, Blaise Pascal inventou uma mquina de calcular, a
pascaline. O principal problema do clculo mecnico o
que fazer quando, chegando a nove, se acrescenta um.
Pascal criou um pequeno mecanismo em que ningum
tinha pensado antes dele, um transportador que
transportava automaticamente este nmero. Por conta da
engenhoca, que na poca era chamada de mquina
aritmtica, Pascal tinha se tornando um pequeno
empresrio. Havia montado uma empresa, feito o projeto
de sua mquina, contratado operrios, patenteado o
processo e fabricado umas cinquenta pascalines. Produo
em srie, vendida a cem libras cada mquina. Ganhou um
dinheiro! (Guedj, 2000)
Piana, Machado e Selau Elementos de Probabilidade


68
3.1.2. Conceitos fundamentais

Experimento probabilstico ou aleatrio: toda experincia cujos resultados
podem no ser os mesmos, ainda que sejam repetidos sob condies idnticas. Caractersticas
desses experimentos:
cada experimento pode ser repetido indefinidamente sob condies inalteradas;
embora no possamos afirmar que resultado ocorrer, sempre possvel descrever
o conjunto de todos os possveis resultados.
quando o experimento for realizado repetidamente, os resultados individuais
parecem ocorrer de forma acidental; mas se for repetido um grande nmero de vezes uma
configurao definida ou regularidade surgir.

Exemplos:

Experimento 1: Jogar um dado e observar a sua face superior.
Experimento 2: Lanar uma moeda at que aparea cara e contar o nmero de
lanamentos.
Experimento 3: Selecionar uma carta do baralho e anotar o seu valor e naipe.
Experimento 4: Acender uma lmpada e medir o tempo at que ela se apague.

Espao amostral (S): o conjunto de todos os possveis resultados de um
experimento aleatrio, ou seja, o conjunto universo relativo aos resultados de um
experimento. A cada experimento aleatrio est associado um conjunto de resultados possveis
ou espao amostral.

Exemplos:

S
1
= {1, 2, 3, 4, 5, 6} enumervel e finito
S
2
= {1, 2, 3, 4, ...} enumervel e infinito
S
3
= {s de ouro, ..., rei de ouro, s de paus, ..., rei de paus, ..., s de espada, ..., rei
de espada, s de copas, ..., rei de copas} enumervel e finito
S
4
= {t; t 0} contnuo e infinito

Evento ou ocorrncia: todo conjunto particular de resultados de S ou, ainda, todo
subconjunto de S. Geralmente designado por uma letra maiscula (A, B, C). A todo evento
ser possvel associar uma probabilidade.

Exemplo:

Se S = {1, 2, 3, 4, 5, 6}, ento

A = {1, 2, 3},
B = Ocorrncia de faces pares,
C = {5}, so eventos de S.

Operaes com eventos

Como o espao amostral S e os eventos so conjuntos, as mesmas operaes
realizadas com conjuntos so vlidas para eventos.

Exemplo: Se A e B, so eventos de S, ento:

Ocorre A B, se ocorrer A ou B (ou ambos).
Ocorre A B, se ocorrer A e B.
Ocorre A , se ocorrer S, mas no ocorrer A.
Ocorre A B, se ocorrer A, mas no ocorrer B.
Piana, Machado e Selau Elementos de Probabilidade


69
Ponto amostral: qualquer resultado particular de um experimento aleatrio. Todo
espao amostral e todo evento so constitudos por pontos amostrais.

Eventos especiais

Evento impossvel: aquele evento que nunca ir ocorrer, tambm conhecido
como o conjunto vazio (). um evento porque subconjunto de qualquer conjunto, portanto
subconjunto de S ( S).

Exemplo: A
1
= {(x, y); x
2
+ y
2
< 0}

Evento certo: aquele evento que ocorre toda vez que se realiza o experimento,
portanto, esse evento o prprio S. evento porque todo conjunto subconjunto de si mesmo
(S S).

Exemplo: A
2
= {(x, y); x
2
+ y
2
0}

Eventos mutuamente exclusivos

Dois eventos A e B associados a um mesmo espao amostral S, so mutuamente
exclusivos quando a ocorrncia de um impede a ocorrncia do outro. Na teoria dos conjuntos,
correspondem aos conjuntos disjuntos, que no possuem elementos comuns (A B = ).

Exemplos:

Experimento 1: Lanamento de uma moeda e observao do resultado.

S = {c, k}, se definimos
A = Ocorrncia de cara A = {c}
B = Ocorrncia de coroa B = {k}, ento A e B so mutuamente exclusivos.

Experimento 2: Lanamento de um dado e observao da face superior.

S = {1, 2, 3, 4, 5, 6}, se definimos
A = Ocorrncia de nmero mpar A = {1, 3, 5}
B = Ocorrncia de maior do que 4 B = {5, 6}
A B = {5}, logo, os eventos A e B no so mutuamente exclusivos.


3.1.3. Conceitos de probabilidade

3.1.3.1. Conceito clssico ou probabilidade a priori


Pierre-Simon Laplace
(1749 - 1827)
Como a teoria das probabilidades est historicamente ligada aos jogos de
azar, esta associao gerou, inicialmente, um conceito chamado conceito
clssico ou probabilidade a priori, devido a Laplace.

Definio: Seja E um experimento aleatrio e S o espao amostral a ele
associado, com n pontos amostrais, todos equiprovveis. Se existe, em S,
m pontos favorveis realizao de um evento A, ento a probabilidade de
A, indicada por P(A), ser:

#
#
= =
m A
P(A)
n S
.
Piana, Machado e Selau Elementos de Probabilidade


70
Notemos, entretanto, que, para que este conceito tenha validade, duas
pressuposies bsicas devem ser atendidas:
1. O espao amostral S enumervel e finito.
2. Os elementos do espao amostral S so todos equiprovveis.

Exemplo:

Consideremos o seguinte experimento: lanamento de uma moeda honesta duas
vezes e observao do lado superior.
O espao amostral deste experimento S = {cc, ck, kc, kk} e todos os seus pontos
amostrais so equiprovveis:
p(cc) = p(kc) = p(ck) = p(kk) =
1
4

Define-se o evento A = ocorrncia de uma cara, ento

A = {ck, kc}
e
#
#
= = = =
m A 2 1
P(A)
n 4 2 S
,
pois S possui quatro pontos amostrais, dos quais dois so favorveis ocorrncia de A.

Consideremos, agora, outra situao onde o espao amostral S refere-se ao nmero
de caras obtido nos dois lanamentos da moeda honesta.
O espao amostral passa a ser S = {0, 1, 2} e o evento A = ocorrncia de uma cara, ou
seja, A = {1}.
Observamos, nesta situao, que os pontos amostrais de S (0, 1 e 2) no so todos
equiprovveis, pois
p(0) = p(kk) =
1
4
, p(1) = p(kc) + p(ck) =
1
4
+
1
4
=
1
2
e p(2) = p(cc)=
1
4
.
Portanto, embora o evento A seja o mesmo, como uma das pressuposies bsicas
no foi atendida, o conceito clssico no pode ser imediatamente aplicado para calcular a sua
probabilidade.

Podemos observar, a seguir, que a aplicao do conceito clssico, nesta situao, no
conduz ao um resultado incorreto:
#
#
= = =
m A 1
P(A)
n 3 S
.

Recomendamos, ento, partir sempre do espao amostral original do experimento
para aplicar o conceito clssico.


3.1.3.2. Frequncia relativa ou probabilidade a posteriori

O conceito de frequncia relativa como estimativa de probabilidade ou
probabilidade a posteriori surgiu atravs de Richard Von Mises.

Definio: Seja E um experimento aleatrio e A um evento. Se aps n
realizaes do experimento E (sendo n suficientemente grande), forem
observados m resultados favorveis ao evento A, ento uma estimativa
da probabilidade P(A) dada pela frequncia relativa

=
m
f
n
. Richard Von Mises
(1883 - 1953)

Piana, Machado e Selau Elementos de Probabilidade


71
Este conceito baseado no princpio estatstico da estabilidade, ou seja, a medida que
o nmero de repeties do experimento (n) aumenta, a frequncia relativa =
m
f
n
se aproxima
de P(A). O n deve ser suficientemente grande para que se possa obter um resultado com
margem de erro razovel. Define-se o erro desta estimativa pela expresso

f - P(A) = erro.

A Figura 3.1 ilustra o princpio da estabilidade, tomando-se por base o nmero
crescente de lanamentos de uma moeda e a probabilidade de se obter cara.


Figura 3.1. Estabilizao da frequncia relativa f quando n cresce.


Exemplo: Em Sobral (CE), observaram-se seis anos de seca no perodo de 1901-66
(66 anos). Qual a probabilidade de ser seco o prximo ano?

A frequncia relativa f ser uma estimativa da probabilidade de ocorrer seca no prximo ano:

= = =
m 6 1
f
n 66 11



3.1.3.3. Conceito moderno ou axiomtico




J no sculo XX, como a conceituao at ento no era apropriada a
um tratamento matemtico mais rigoroso, Andrei Nikolaevich
Kolmogorov conceituou probabilidade atravs de axiomas rigorosos,
tendo por base a teoria da medida.

Definio: Se A um evento do espao amostral S, ento o nmero
real P(A) ser denominado probabilidade da ocorrncia de A se
satisfizer os seguintes axiomas:

Axioma 1. 0 P(A) 1.
Axioma 2. P(S) = 1.
Axioma 3. Se A e B so eventos de S mutuamente exclusivos,
ento P(A B) = P(A) + P(B).
Andrei N. Kolmogorov
(1903 - 1987)

Piana, Machado e Selau Elementos de Probabilidade


72
Notemos que A e B so mutuamente exclusivos se e somente se A B = .

O terceiro axioma pode ser generalizado para um nmero finito de eventos
mutuamente exclusivos
=

n
1 2 3 n i
i=1
P(A A A A ) P(A )

O conceito axiomtico no fornece formas e sim condies para o clculo das
probabilidades. Deste modo, os conceitos a priori e a posteriori se enquadram no conceito
axiomtico.

A principal vantagem do conceito axiomtico a possibilidade de extenso do estudo
s variveis contnuas, englobando eventos pertencentes a espaos amostrais infinitos no
enumerveis.


3.1.3.4. Probabilidade geomtrica ou calculada como rea

Seja S o espao amostral associado a um experimento e A um evento de S.
Definimos, ento



=
rea de A
P(A)
rea de S





Exemplo: Seja o tringulo ABC um espao amostral S e o tringulo CDE um evento A.
A probabilidade P(A) obtida da seguinte forma:




/

= = =

= = =
= = =
b h 2 1
rea de 1
2 2
b h 2 1/2 1
rea de A
2 2 4
rea de A 1 4 1
P(A)
rea de 1 4
S
S



Vemos que a probabilidade de ocorrncia de um evento a medida do conjunto que
representa o evento e pode ser calculada de diversas formas. Da podemos fazer a seguinte
generalizao:


Piana, Machado e Selau Elementos de Probabilidade


73
3.1.4. Teoremas para o clculo de probabilidades

Teorema 1. Se um evento impossvel, ento P() = 0.

Como A = A, ento P(A ) = P(A) e
A = , ento A e so mutuamente exclusivos.

Utilizando ento o terceiro axioma, temos

P(A ) = P(A) + P()
P(A) = P(A) + P()
P() = P(A) P(A) = 0


Teorema 2. Se A o complemento de A, ento P( A ) = 1 P(A).

Se A A = S, sendo A e A mutuamente exclusivos, ento

P(S) = P(A A ) = P(A) + P( A )
1 = P(A) + P( A )
P( A ) = 1 - P(A)


Teorema 3. Se A e B so dois eventos quaisquer, ento P(A B) = P(A) P(A B).


P(A) P(A B) = P(A B)


Teorema da soma das probabilidades

Se A e B so dois eventos quaisquer, ento P(A B) = P(A) + P(B) P(A B).


P(A) + P(B) P(A B) = P(A B)


3.1.5. Probabilidade condicional e independncia

Sejam A e B dois eventos associados a um mesmo espao amostral S. Se A e B no
so eventos mutuamente exclusivos, ou seja, se A B , ento A e B podero ser eventos
independentes ou condicionados.
Para definir o que so eventos condicionados e eventos independentes, tomaremos,
como exemplo, um experimento aleatrio que ser considerado em duas situaes distintas.

Piana, Machado e Selau Elementos de Probabilidade


74
Experimento: Uma caixa contm cinco bolas equiprovveis, sendo trs azuis e duas
brancas. Duas bolas so retiradas uma a uma e sua cor observada. Definimos, ento, dois
eventos:
A
1
: a primeira bola retirada azul.
A
2
: a segunda bola retirada branca.

As probabilidades dos eventos A
1
e A
2
sero calculadas em duas situaes.

Situao 1. Consideremos que a primeira bola retirada no reposta (retirada sem reposio).

Sendo o espao amostral enumervel, finito e equiprovvel, podemos calcular
probabilidade dos eventos atravs do conceito clssico. Deste modo,

#
#
= =
1
1
A 3
P(A )
5 S
.

Entretanto, a probabilidade do A
2
vai depender da ocorrncia ou no do A
1.

Se ocorreu A
1
, ento
#
#
= =
2 1
2 1
A A 2
P(A A )
4
/
/
S


Se no ocorreu A
1
, ento
#
#
= =
2
2
A 1
P(A )
4 S
.

Observamos, nesta situao, que, se a bola no for reposta, a probabilidade de
ocorrncia do A
2
fica alterada pela ocorrncia ou no de A
1
. Podemos definir, ento:

Eventos condicionados: dois eventos quaisquer, A e B, so condicionados quando
a ocorrncia de um altera a probabilidade de ocorrncia do outro.
A probabilidade condicional de A denotada por P(A/B) (l-se probabilidade de A
dado que ocorreu B).


Situao 2. Consideremos que a primeira bola retirada reposta antes de tirar a segunda
(retirada com reposio).
#
#
= =
1
1
A 3
P(A )
S 5


Como a primeira bola reposta, independente de ter ocorrido ou no A
1
, a
probabilidade de ocorrncia de A
2
ser a mesma.

Se ocorreu A
1
, ento
#
#
= =
2 1
2 1
A A 2
P(A A )
5
/
/
S


Se no ocorreu A
1
, ento
#
#
= =
2
2
A 2
P(A )
5 S
.

Podemos verificar agora que, se a bola for reposta, a probabilidade de ocorrncia do
A
2
no alterada pela ocorrncia ou no do A
1
, ou seja, P(A
2
) = P(A
2
/A
1
). Podemos definir,
ento:

Eventos independentes: dois eventos quaisquer, A e B, so independentes quando
a ocorrncia de um no altera a probabilidade de ocorrncia do outro, ou seja,

P(A) = P(A/B) e P(B) = P(B/A).
Piana, Machado e Selau Elementos de Probabilidade


75
Teorema do produto das probabilidades

Se A e B so dois eventos quaisquer, ento

P(A B) = P(A) P(B/A) = P(B) P(A/B).

Definimos, tambm


= =
P(A B) P(A B)
P(A/B) e P(B/A)
P(B) P(A)


Se A e B so dois eventos independentes, ento

P(A) = P(A/B) e P(B) = P(B/A).
Logo,
P(A B) = P(A) P(B).




Teorema de Bayes

Se S um espao amostral, com n=4 parties, onde est definido o evento A


podemos definir o evento A como
=
=
=
=
=

)
1 2 3 4
1 2
1 2
i j
1 2
B B B B
B B
B B
B B
B B

S

Thomas Bayes
(1702 1761)

=
1 2 3 4
A (A B ) (A B ) (A B ) (A B ) , logo,
| | =
1 2 3 4
P(A) P(A B ) P(A B ) P(A B ) P(A B ) .

Utilizando o terceiro axioma, temos

= + + +
1 2 3 4
P(A) P(A B ) P(A B ) P(A B ) P(A B ) .

Utilizando o teorema do produto, temos

= + + + =

4
1 1 2 2 3 3 4 4 i i
i=1
P(A) P(B )P(A/B ) P(B )P(A/B ) P(B )P(A/B ) P(B )P(A/B ) P(B )P(A/B )
e

= =

1 1 1
1 4
i i
i=1
P(A B ) P(B ) P(A/B )
P(B /A)
P(A)
P(B ) P(A/B )

.

Definimos, a partir desse exemplo, o teorema de Bayes:


Piana, Machado e Selau Elementos de Probabilidade


76
Seja S um espao amostral e B
1
, B
2
,..., B
n
, uma de suas parties possveis, tal que
= =
n
i j i
i=1
B B e B

S . Se A um evento de S, ento:

=

n
i i
i=1
P(A) P(B )P(A/B ) e =

i i
i n
i i
i=1
P(B ) P(A/B )
P(B /A)
P(B ) P(A/B )

.


Exerccios propostos:


3.1. Em 660 lanamentos de uma moeda, foram observadas 310 caras. Qual a probabilidade
de, num lanamento dessa moeda, obter-se coroa?


3.2. Se os registros indicam que 504, dentre 813 lavadoras automticas de pratos vendidas por
uma grande loja de varejo, exigiram reparos dentro da garantia de um ano, qual a
probabilidade de uma lavadora dessa loja no exigir reparo dentro da garantia?


3.3. Um grupo de pessoas constitudo de 60 homens e 40 mulheres. Sabe-se que 45 desses
homens e 30 dessas mulheres votaram numa determinada eleio. Tomando-se,
aleatoriamente, uma dessas pessoas, calcule a probabilidade de:
a) ser homem;
b) ser mulher;
c) ter votado;
d) no ter votado;
e) ser homem, sabendo-se que votou;
f) ser mulher, sabendo-se que no votou;
g) ter votado, sabendo-se que mulher;
h) no ter votado, sabendo-se que homem.


3.4. Em uma fbrica de parafusos, as mquinas A, B e C produzem 25 %, 35 % e 40 % do total
produzido. Da produo de cada mquina, 5 %, 4 % e 2 %, respectivamente, so defeituosos.
Escolhe-se ao acaso um parafuso e verifica-se que ele defeituoso. Qual a probabilidade de
que seja da mquina A, da mquina B e da mquina C?


3.5. Em um estado (dos Estados Unidos) onde os automveis devem ser testados quanto
emisso de poluentes, 25% de todos os carros emitem quantidades excessivas de poluentes.
Ao serem testados, 99% de todos os carros que emitem excesso de poluentes so reprovados,
mas 17% dos que no acusam emisso excessiva de poluentes tambm so reprovados. Qual
a probabilidade de um carro reprovado no teste acusar efetivamente excesso de emisso de
poluentes?


3.6. Em uma certa comunidade, 6 % de todos os adultos com mais de 45 anos tm diabetes.
Um novo teste diagnostica corretamente 84% das pessoas que tm diabetes e 98% das que
no tem a doena.
a) Qual a probabilidade de uma pessoa diagnosticada como diabtica no teste, ter de fato
a doena?
b) Qual a probabilidade de uma pessoa que faa o teste, seja diagnosticada como no
diabtica?
Piana, Machado e Selau Elementos de Probabilidade


77
3.2. Variveis aleatrias

3.2.1. Introduo e conceito

Para facilitar a compreenso do conceito de varivel aleatria, vamos tomar como
exemplo o seguinte experimento aleatrio.

Exemplo: Lanamento de uma moeda honesta trs vezes e observao das faces que
ocorrem.

O espao amostral do experimento

S = {ccc, cck, ckc, kcc, kkc, kck, ckk, kkk}.

Como a moeda honesta, a probabilidade de ocorrer cara igual probabilidade de
correr coroa: P(c) = P(k) =
1
2
.
Para que ocorra o resultado trs caras (ccc), necessrio que ocorram,
sucessivamente, os trs eventos: cara no primeiro lanamento, cara no segundo lanamento e
cara no terceiro lanamento, ou seja, deve ocorrer a interseco destes trs eventos. Como os
lanamentos so independentes entre si, a probabilidade de ocorrer cara a mesma em todos
eles:
P(c) =
1
2
.
Logo, a probabilidade de ocorrer trs caras P(ccc), dada pelo produto das probabilidades de
ocorrer cara em cada lanamento
= + + = =
1 1 1 1
P(ccc) P(c) P(c) P(c)
2 2 2 8

De forma anloga, obtemos as probabilidades de todos os demais resultados possveis.
= + + = =
1 1 1 1
P(cck) P(c) P(c) P(k)
2 2 2 8

...
= + + = =
1 1 1 1
P(kkk) P(k) P(k) P(k)
2 2 2 8
.

Podemos observar, ento, que

P(ccc) = P(cck) = P(ckc) = P(kcc) = P(kkc) = P(kck) = P(ckk) = P(kkk) =
1
8
,

o que torna o espao amostral equiprovvel.

Observamos, tambm, que o espao amostral formado pela unio dos eventos (ccc),
(cck), (ckc), (kcc), (kkc), (kck), (ckk) e (kkk), que so todos mutuamente exclusivos. Sendo
assim, a probabilidade do espao amostral, P(S), dada pela soma das probabilidades de
cada evento

P(S) = P(ccc) + P(cck) + P(ckc) + P(kcc) + P(kkc) + P(kck) + P(ckk) + P(kkk)
= + + + + + + + =
1 1 1 1 1 1 1 1
P( )
8 8 8 8 8 8 8 8
1 S .
Piana, Machado e Selau Elementos de Probabilidade


78
Seja X a varivel que representa o nmero de caras ocorrido nos trs lanamentos,
quais so os possveis valores de X?

X = {0, 1, 2, 3}




=
=
=
=
=
=
=
=
X(ccc) 3
X(cck) 2
X(ckc) 2
X(kcc) 2
X(kkc) 1
X(kck) 1
X(ckk) 1
X(kkk) 0



Atravs de X foi possvel transformar um
conjunto no numrico com oito pontos
amostrais em um conjunto numrico com
quatro pontos.


A partir deste exemplo podemos definir:

Varivel aleatria uma funo (ou regra) que transforma um espao amostral
qualquer em um espao amostral numrico que ser sempre um subconjunto do conjunto dos
nmeros reais.

No exemplo anterior, se X fosse a varivel que representa o nmero de coroas, os
conjuntos seriam os mesmos, mas a funo seria outra, pois a correspondncia outra.

De modo geral, uma varivel aleatria pode ser representada pelo esquema abaixo




X = funo que
transforma











As variveis aleatrias podem ser classificadas como discretas ou contnuas. Por
questes didticas e de praticidade, vamos estudar cada tipo separadamente. Inicialmente,
abordaremos as variveis aleatrias discretas e suas principais distribuies de probabilidades
e, mais adiante, as variveis aleatrias contnuas.


X(s)
S
Espao amostral
S
X

Espao amostral da
varivel X


s
Piana, Machado e Selau Elementos de Probabilidade


79
3.2.2. Variveis aleatrias discretas

Definio: So discretas todas as variveis cujo espao amostral S
X
enumervel
finito ou infinito. Assim se X uma varivel aleatria discreta, ento S
X
um subconjunto dos
inteiros.

Tomemos como exemplo o seguinte experimento:

Lanamento de uma moeda at que ocorra face cara.

O espao amostral bsico deste experimento ser

S = {c, kc, kkc, kkkc, kkkkc, kkkkkc, ...}.

Se definimos a varivel aleatria X como o nmero de lanamentos at que ocorra
cara, ento, temos
=
X
X
S S {1, 2, 3, 4 ,5,...}.

Se definimos outra varivel aleatria Y como o nmero de coroas at que ocorra cara,
ento temos
=
Y
Y
S S {0, 1, 2, 3, 4,...}.

Observamos que X e Y so variveis aleatrias discretas, pois seus espaos
amostrais so enumerveis.


3.2.2.1. Funo de probabilidade

Definio: Seja X uma varivel aleatria discreta e S
X
o seu espao amostral. A
funo de probabilidade = P(X x) , ou simplesmentep(x) , ser a funo que associa a cada
valor de X a sua probabilidade de ocorrncia, desde que satisfaa duas condies:

1. p(x) 0, x S
X


2.

X
x
p(x) 1
S


Existem trs formas distintas de representar uma funo:

Representao tabular: consiste em relacionar em uma tabela os valores da funo
de probabilidade.

Representao grfica: consiste em representar graficamente a relao entre os
valores da varivel e suas probabilidades.

Representao analtica: estabelece uma expresso geral para representar o valor
da funo num ponto genrico da varivel.

Para exemplificar as formas de representao de uma funo de probabilidade, vamos
considerar o seguinte experimento aleatrio.

Exemplo: De uma urna com trs bolas pretas e duas brancas, retiram-se, de uma vez,
duas bolas. Se X o nmero de bolas pretas retiradas, determine a funo de probabilidade
= P(X x) .

Piana, Machado e Selau Elementos de Probabilidade


80
Observamos que o espao amostral bsico do experimento um conjunto no
numrico

S = {P
1
B
1
, P
1
B
2
, P
2
B
1
, P
2
B
2
, P
3
B
1
, P
3
B
2
, P
1
P
2
, P
1
P
3
, P
2
P
3
, B
1
B
2
}

e que a varivel X transforma este espao num conjunto numrico

S
X
= {0, 1, 2}

Como o espao amostral bsico S enumervel, finito e equiprovvel, podemos obter
as probabilidades associadas aos valores de X atravs do conceito clssico. J vimos
anteriormente que, neste tipo de experimento, o nmero de elementos do espao e o nmero
de pontos favorveis ocorrncia do evento desejado podem ser obtidos atravs da
combinao. Da, temos:

= = = = =
0 2
3 2
1 2 2
5
C C 1
P(X 0) P(B B ) 0,1
C 10
= 0,1
= = + + + + + = = =
1 1
3 2
1 1 1 2 2 1 2 2 3 1 3 2 2
5
C C 6
P(X 1) P(PB ) P(PB ) P(P B ) P(P B ) P(P B ) P(P B ) 0,6
C 10

= = + + = = =
2 0
3 2
1 2 1 3 2 3 2
5
C C 3
P(X 2) P(PP ) P(PP ) P(P P ) 0,3
C 10


Obtidas as probabilidades, podemos fazer a representao tabular da funo.

= X x 0 1 2
= P(X x)
0,1 0,6 0,3 1


Da mesma forma, possvel construir o grfico para a funo.


A representao analtica da funo feita atravs da generalizao da expresso
utilizada para o clculo da probabilidade de cada valor de X:

= =
x 2 x
3 2
2
5
C C
P(X x)
C
, para S
X
= {0, 1, 2}



Observamos que = P(X x) uma
funo contnua para todo o
xS
X
, ou seja, a funo = P(X x)
assume o valor zero para todo o
xS
X
.
Piana, Machado e Selau Elementos de Probabilidade


81
3.2.2.2. Funo de distribuio ou probabilidade acumulada

Definio: Seja X uma varivel aleatria discreta e S
X
o seu espao amostral. A
funo de distribuio, definida por F(x) ou P(X x) a funo que associa a cada valor de X a
probabilidade P(X x) . Desta forma, temos

= = =

t x
F(x) P(X x) P(X t)

Para o exemplo anterior, temos:

= = = = = =

x 0
F(0) P(X 0) P(X x) P(X 0) 0,1

= = = = = + = = + =

x 1
F(1) P(X 1) P(X x) P(X 0) P(X 1) 0,1 0,6 0,7

= = = = = + = + = = + + =

x 2
F(2) P(X 2) P(X x) P(X 0) P(X 1) P(X 2) 0,1 0,6 0,3 1


Podemos tambm representar a funo de distribuio acumulada de trs formas:

representao tabular

= X x 0 1 2
= P(X x)
0,1 0,6 0,3 1
F(x) 0,1 0,7 1 -


representao grfica



representao analtica

= =

t 2 t
3 2
2
t x
5
C C
F(x) P(X x)
C
, para S
X
= {0, 1, 2}


Piana, Machado e Selau Elementos de Probabilidade


82
3.2.2.3. Medidas descritivas

Visto que as medidas descritivas servem para descrever conjuntos de dados
numricos e que o espao amostral de uma varivel aleatria sempre um conjunto numrico,
podemos utilizar essas medidas para representar as distribuies de probabilidades de
variveis aleatrias.


Mdia ou valor esperado

Definio: Seja X uma varivel aleatria discreta e S
X
o seu espao amostral. O valor
mdio de X representado por E(X) ou
X
ou simplesmente , a mdia dos valores de X
ponderada pelas suas respectivas probabilidades de ocorrncia. Deste modo, temos

= = =
=

X
X
X
x S
x S
x S
xp(x)
E(X) xp(x)
p(x) 1


Considerando o exemplo cuja distribuio de probabilidade a seguinte

= X x 0 1 2
= P(X x)
0,1 0,6 0,3 1

o valor esperado para o nmero de bolas pretas retiradas ser:

= = = + + =

X
x S
E(X) xp(x) 0 0,1 1 0,6 2 0,3 1,2 bolas


Devemos destacar que a mdia ou valor esperado possui propriedades matemticas
importantes, algumas j vistas na Unidade II, as quais so relacionadas a seguir.


Propriedades matemticas da mdia

1
a
propriedade: Se c uma constante, ento

E(c) = c


2
a
propriedade: Se X uma varivel aleatria e c uma constante, ao somarmos a
constante aos valores da varivel, a mdia da varivel tambm fica somada da constante.

E(c+X)=c+E(X)


3
a
propriedade: Se X uma varivel aleatria e c uma constante, ao multiplicarmos a
varivel pela constante, a mdia da varivel tambm fica multiplicada pela constante.

E(cX)=cE(X)


4
a
propriedade: A mdia dos desvios igual a zero.

E(X) = 0
Piana, Machado e Selau Elementos de Probabilidade


83
5
a
propriedade: A mdia dos desvios quadrticos mnima.

E(X)
2
< E(Xc)
2
0


6
a
propriedade: Se X e Y so duas variveis aleatrias, a mdia da soma (ou
diferena) das duas variveis igual soma (ou diferena) de suas mdias.

E(X Y) = E(X) E(Y)


7
a
propriedade: Se X e Y so duas variveis aleatrias independentes, a mdia do
produto das duas variveis igual ao produto de suas mdias.

E(XY) = E(X)E(Y), se X e Y so independentes.


Varincia

Definio: Seja X uma varivel aleatria discreta e S
X
o seu espao amostral. O grau
mdio de disperso dos valores de X em relao a sua mdia conhecido como varincia que
representada por V(X), ou
2
X
, ou simplesmente
2
, e definida como a mdia dos quadrados
dos desvios em relao mdia. Sendo assim, temos

= = =

X
2 2 2
x S
V(X) E(X ) (x ) p(x) (Frmula de definio)
ou
= =
2 2 2
V(X) E(X ) , onde

=

X
2 2
x S
E(X) x p(x) (Frmula prtica)

Para o exemplo cuja distribuio de probabilidade

= X x 0 1 2
= P(X x)
0,1 0,6 0,3 1

e o valor esperado = 1,2 bolas, a varincia do nmero de bolas pretas retiradas ser:

= = = + + =

X
2 2 2 2 2
x S
V(X) (x ) p(x) (0 1,2) 0,1 (1 1,2) 0,6 (2 1, 2) 0,3 0,36 bolas
2
.


A varincia destaca-se entre as medidas de variao por apresentar algumas
propriedades matemticas.


Propriedades matemticas da varincia:

1
a
propriedade: Se k uma constante, ento

V(k) = 0


2
a
propriedade: Se X uma varivel aleatria e c uma constante, ao somarmos a
constante aos valores da varivel a varincia da varivel no se altera.

V(X+c)=V(X)
Piana, Machado e Selau Elementos de Probabilidade


84
3
a
propriedade: Se X uma varivel aleatria e k uma constante, ao multiplicarmos a
varivel pela constante a varincia da varivel fica multiplicada pelo quadrado constante.

V(kX) = k
2
V(X)


4
a
propriedade: Se X e Y so duas variveis aleatrias independentes, a varincia da
soma (ou diferena) das duas variveis igual soma de suas varincias.

V(X Y) = V(X) + V(Y), se X e Y so independentes


Desvio padro

A partir da varincia podemos obter o desvio padro, denotado por e definido como
a raiz quadrada da varincia:

2
= .

No exemplo: = = =
2
0,36 0,6bolas.


Momentos

J vimos anteriormente que os momentos so quantidades que auxiliam na descrio
de um conjunto de valores. Da mesma forma, aqui, essas medidas so utilizadas para
descrever as distribuies de probabilidade de variveis aleatrias. A expresso geral do
momento de ordem r de uma varivel aleatria a seguinte:

=
r
r
E(X a)

Os tipos mais importantes de momentos so dois:

Quando a = 0, temos os momentos centrados na origem ou momentos ordinrios de
ordem r:

= =
r r
r
E(X 0) E(X )

Para r = 1, temos

= =

X
1
x S
E(X) xp(x)

Para r = 2, temos

= =

X
2 2
2
x S
E(X ) x p(x)

Para r = 3, temos

X
3 3
3
x S
E(X ) x p(x)

= =



Para r = 4, temos

X
4 4
4
x S
E(X ) x p(x)

= =


Piana, Machado e Selau Elementos de Probabilidade


85
Quando a = , temos os momentos de ordem r centrados na mdia

=
r
r
E(X )

Para r = 1, temos

=
=
= =



1
1
1
E(X )
E(X) E( )
0



Para r = 2, temos

= =

X
2 2
x S
2
E(X ) (x ) p(x) (Frmula de definio)

=
= +
= +
= +
= +
=






2
2
2 2
2
2 2
2
2 2
2
2 2 2
2
2 2
2
E(X )
E(X 2X )
E(X ) E(2X ) E( )
E(X ) 2 E(X)
E(X ) 2
E(X ) (Frmula prtica)



Para r = 3, temos

= =

X
3 3
x S
3
E(X ) (x ) p(x) (Frmula de definio)

=
= +
= +
= +
= +
= +
= +







3
3
3 2 2 3
3
3 2 2 3
3
3 2 2 3
3
3 2 2 3
3
3 2 3 3
3
3 2 3
3
E(X )
E(X 3X 2X )
E(X ) E(3X ) E(3X ) E( )
E(X ) 3 E(X ) 3 E(X)
E(X ) 3 E(X ) 3
E(X ) 3 E(X ) 3
E(X ) 3 E(X ) 2 (Frmula prtica)



Para r = 4, temos

= =

X
4 4
x S
4
E(X ) (x ) p(x) (Frmula de definio)

4 3 2 2 4
4
E(X ) 4 E(X ) 6 E(X ) 3 (Frmula prtica) = +





Coeficiente de assimetria
= =


3 3
3
3/2
2 2 2
a

Coeficiente de curtose
=

4
4
2
2
a
Piana, Machado e Selau Elementos de Probabilidade


86
3.2.3. Variveis aleatrias contnuas

Vamos considerar agora o seguinte experimento: tomar aleatoriamente uma pea de
uma linha de fabricao, coloc-la em funcionamento e medir por quanto tempo ela funciona.
Um possvel espao amostral bsico para este experimento seria a anotao do dia e da hora
em que a pea parou de funcionar. Um procedimento equivalente (e mais adequado do ponto
de vista das aplicaes) seria associar a cada ponto desse espao amostral o tempo de
funcionamento decorrido. Assim, teramos uma varivel aleatria X definida como o tempo de
funcionamento da pea. Esta varivel X seria uma varivel aleatria contnua, visto que o
conjunto dos seus valores no poderia ser enumerado, e o seu espao amostral poderia ser
representado como {x; x 0}. Observamos tambm que, sendo X uma varivel contnua, entre
quaisquer dois valores distintos de X sempre existiro infinitos valores. A partir deste exemplo,
podemos definir uma varivel aleatria contnua.

Definio: So contnuas todas as variveis cujo espao amostral S
X
infinito no
enumervel. Assim, se X uma varivel aleatria contnua, ento X pode assumir qualquer
valor num intervalo [a; b] ou no intervalo (-; +) e o conjunto S
X
ser sempre definido como
um intervalo.

So exemplos de variveis aleatrias contnuas: o tempo de vida de um animal, a vida
til de um componente eletrnico, o peso de uma pessoa, a produo de leite de uma vaca, a
quantidade de chuva que ocorre numa regio.


3.2.3.1. Funo densidade de probabilidade

Definio: Seja X uma varivel aleatria contnua e S
X
o seu espao amostral. Uma
funo f associada varivel X denominada funo densidade de probabilidade se satisfizer
duas condies:


1. f(x) 0, x S
X

2. = =

X
X
S
f(x)dx 1 P(X ) S



Consideremos agora dois exemplos resolvidos.


Exemplo 1. Seja a funo f(x) = 2x, no intervalo S
X
=[0,1]. Verifique se f(x) uma
funo densidade de probabilidade.


Primeira condio: f(x) 0, x S
X

Como a funo f(x) = 2x linear, apenas dois pontos so suficientes para traar a reta
que representa a relao entre x e f(x). Podemos obter, ento, os valores da funo f(x) nos
pontos 0 e 1 que so os limites do intervalo S
X
:

para x = 0, temos f(0) = 2 0 = 0,
para x = 1, temos f(1) = 2 1 = 2.

A partir desses dois pontos possvel construir o grfico da funo
A rea sob a funo f(x) no intervalo S
X

um, pois corresponde probabilidade de a
varivel X pertencer ao espao amostral S
X
.
Piana, Machado e Selau Elementos de Probabilidade


87


Podemos observar que todos os valores da funo f(x) so no negativos no intervalo
de 0 a 1; portanto, a primeira condio foi atendida.

Segunda condio: =

X
S
f(x)dx 1

A integral a ferramenta utilizada para se obter a rea sob a funo f(x) no intervalo
S
X
, que equivale a P(XS
X
) e deve ser igual a 1. Entretanto, na funo f(x) = 2x essa rea
adquire a forma de um tringulo, podendo ser mais facilmente calculada atravs da expresso
bh/2. Assim, temos
rea =

= =
bh 1 2
1
2 2
.

Como a rea sob a funo f(x) igual a 1, a segunda condio tambm foi atendida.
Logo, a funo f(x) = 2x no intervalo S
X
=[0, 1] uma funo densidade de probabilidade.



Exemplo 2. Seja a funo f(x) = 6x 6x
2
, no intervalo S
X
=[0,1]. Verifique se f(x) uma
funo densidade de probabilidade.

Primeira condio: f(x) 0, x S
X

Como f(x) = 6x 6x
2
uma funo quadrtica, so necessrios, pelo menos, trs
pontos para traar a parbola que representa a relao entre x e f(x). Devemos obter, ento, os
valores da funo f(x) nos pontos 0 e 1, que so os limites do intervalo S
X
, e no valor que
corresponde ao ponto crtico da funo. Para determinar este valor de x derivamos a funo e
igualamos a zero a primeira derivada. Deste modo, para

f(x) = 6x 6x
2
, temos



= =
=
= =
f (x) 6 12x, sendo f (x) 0, temos
0 6 12x
6 1
x valor deXquecorrespondeaopontocrticodef (x)
12 2


Derivando a funo pela segunda vez, possvel determinar se o ponto crtico um
ponto de mximo ou de mnimo.

= f (x) 12


Piana, Machado e Selau Elementos de Probabilidade


88
Sabemos que:

se < f (x) 0 , a parbola tem concavidade para baixo, ou seja, tem ponto de mximo.
se > f (x) 0 , a parbola tem concavidade para cima, ou seja, tem ponto de mnimo.

Como a segunda derivada resultou negativa, conclumos que a funo tem ponto de
mximo. Assim, obtemos os valores da funo f(x) = 6x 6x
2
nos pontos 0, 1/2 e 1:

para x = 0, temos f(0) = 6 0 6 0
2
= 0,
para x = 1/2, temos f(1/2) = 6 1/2 6 (1/2)
2
= 3/2,
para x = 1, temos f(1) = 6 1 6 1
2
= 0.

A partir desses trs pontos possvel traar o grfico da funo



Observamos que todos os valores da funo f(x) so maiores que zero no intervalo de
0 a 1; portanto, a primeira condio foi atendida.

Segunda condio: =

X
S
f(x)dx 1

Como a representao grfica de f(x) no intervalo [0, 1] uma parbola, a rea sob a
funo pode ser obtida atravs da integrao da diferencial da funo (f(x)dx) neste intervalo.
Da, temos
( )
( ) ( )
( (
= = = = =
( (

= = =

0
1 1
1 1 1 1 1 1 2 3
2 2 2
0 0 0 0 0 0 0
2 2 3 3
x x
rea f(x)dx 6x 6x dx 6xdx 6x dx 6 xdx 6 x dx 6 6
2 3
3 1 0 2 1 0 3 2 1.


Como a rea sob a funo f(x) no intervalo S
X
, que equivale a P(XS
X
), igual a 1, a
segunda condio tambm foi atendida.

Portanto, a funo f(x) = 6x 6x
2
, no intervalo S
X
=[0, 1] uma funo densidade de
probabilidade.


3.2.3.2. Funo de distribuio ou probabilidade acumulada

Definio: Seja X uma varivel aleatria contnua e S
X
o seu espao amostral. A
funo de distribuio, definida por F(x) ou P(X x), a funo que associa a cada valor de x
S
X
a sua probabilidade acumulada P(X x). Desta forma, temos

F(x) = P(X x) =

x
a
f(t)dt , para S
X
=[a, b].
Piana, Machado e Selau Elementos de Probabilidade


89
Sendo S
X
=[a, b]., temos

F(a) = P(X a) = 0
F(b) = P(X b) = 1


Consideremos o Exemplo 1. Para a funo densidade de probabilidade f(x) = 2x, no
intervalo S
X
=[0,1], definem-se os seguintes eventos:



As probabilidades dos eventos A e B correspondem s suas respectivas reas:

P(A) = rea de A =
(
| |
= = = =
( |
\


1/2
2 1/2 1/2 2
2
0 0 0
x 1 1
2xdx 2 xdx 2 0
2 2 4


P (B) = rea de B =
( | | | |
= = = = = =
( | |
\ \


3/4
2 2 3/4 3/4 2
1/2 1/2 1/2
x 3 1 9 1 9 4 5
2xdx 2 xdx 2
2 4 2 16 4 16 16

Para f(x) = 2x, a funo de distribuio acumulada F(x) ser

F(x) = P(X x) =
(
= = =
(

x
x 2
2 2 2
0 0
t
2tdt 2 x 0 x
2
.
As probabilidades dos eventos A e B podem ser obtidas de outra forma atravs da
funo de distribuio acumulada F(x) = P(X x) =
2
x . Assim, temos

F(1/2) = P(X 1/2)
| |
= =
|
\
2
1 1
2 4
e
F(3/4) = P(X 3/4)
| |
= =
|
\
2
3 9
4 16
,
donde resulta
P(A) = F(1/2) =
1
4

e
P(B) = F(3/4) F(1/2) = =
9 1 5
16 4 16



Para o Exemplo 2:

Seja f(x) = 6x 6x
2
uma funo densidade de probabilidade definida no intervalo
S
X
=[0,1]. Para f(x) a funo de distribuio acumulada F(x) ser
A = {x; 0 < x 1/2}

B = {x; 1/2 x 3/4}
Piana, Machado e Selau Elementos de Probabilidade


90
( )
( (
= = = =
( (


x x
x x x 2 3
2 2 2 3
0 0 0 0 0
t t
F(x) 6t 6t dt 6tdt 6t dt 6 6 3x 2x
2 3
.


3.2.3.3. Medidas descritivas

Mdia ou valor esperado

Definio: Seja X uma varivel aleatria contnua e S
X
o seu espao amostral. O valor
mdio de X, representado por E(X) ou , ser dado por

E(X) = =

X
x f(x)dx
S


Sempre que a funo for par e, portanto, simtrica, F() = 1/2.


Varincia

Definio: Seja X uma varivel aleatria contnua e S
X
o seu espao amostral. A
varincia de X, representada por V(X) ou
2
, ser dada por

V(X) =
2
=
2
E(X ) =

X
2
(x ) f(x)dx
S
(Frmula de definio)
ou
V(X) =
2
=
2 2
E(X ) =
(
(
(

X
2 2
x f(x)dx
S
(Frmula prtica)
Para o Exemplo 1: f(x) = 2x, S
X
=[0,1], temos:

E(X) = =
( | |
= = = = = = =
| (
\


1
1 1 1 3 3 3
2 2
0 0 0 0
x 1 0 2
E(X) x2xdx 2x dx 2 x dx 2 2
3 3 3 3

e

( ( ( | |
= = = = = = =
( ( ` ( |
\ ( (
)


1
2 1 1 4
2 2 2 3 2
0 0 0
x 2 1 4 9 8 1
V(X) x 2xdx 2x dx 2
4 3 2 9 18 18



Para o Exemplo 2: f(x) = 6x 6x
2
, S
X
=[0,1], temos:

( ) ( )
= = =
( (
= = = =
( (


1 1 1 1
2 2 3 2 3
0 0 0 0
1 1
3 4
0 0
E(X) x 6x 6x dx 6x 6x dx 6x dx 6x dx
x x 6 8 6 1
6 6 2
3 4 4 4 2

e

( ) ( )
( (
= = =
( (
( (


( ( ( | |
= = = = =
( ` ( ( |
\ (
)



1 1
2 2 2 2 3 4 2
0 0
1 1
2 1 1 4 5
3 4 2
0 0 0 0
V(X) x 6x 6x dx 6x 6x dx
x x 1 3 6 1 30 24 5 1
6x dx 6x dx 6 6
4 5 2 2 5 4 20 20

Piana, Machado e Selau Elementos de Probabilidade


91
Momentos

Segundo momento:

= =

X
2 2
2
E(X ) (x ) f(x)dx
S
(Frmula de definio)
(
( = =
(

X
2 2
2
2 2
E(X ) x f(x)dx (Frmula prtica)
S



Terceiro momento:

= =

X
3 3
3
E(X ) (x ) f(x)dx
S
(Frmula de definio)
( (
( ( = + = +
( (



X X
3 2 3
3
3 2 3
E(X ) 3 E(X ) 2 x f(x)dx 3 x f(x)dx 2 (Frmula prtica)
S S



Quarto momento:

= =

X
4 4
4
E(X ) (x ) f(x)dx
S
(Frmula de definio)
= +
( ( (
( ( ( = +
( ( (




X X X
4 3 2 2 4
4
4 3 2 2 4
E(X ) 4 E(X ) 6 E(X ) 3
x f(x)dx 4 x f(x)dx 6 x f(x)dx 3 (Frmula prtica)
S S S



Coeficiente de assimetria
= =


3 3
3
3/2
2 2 2
a


Coeficiente de curtose
=

4
4
2
2
a

Piana, Machado e Selau Elementos de Probabilidade


92
3.3. Distribuies de probabilidade

At o momento, as variveis aleatrias consideradas no possuam, necessariamente,
qualquer sentido de aplicao. Entretanto, algumas variveis aleatrias so muitos importantes
e, devido a esta importncia, surge o interesse em estudar suas distribuies de probabilidade.

Uma distribuio de probabilidade essencialmente um modelo de descrio
probabilstica de uma populao, entendendo por populao o conjunto de todos os valores de
uma varivel aleatria. As ideias de populao e distribuio de probabilidade so, deste modo,
indissociveis e sero, a partir de agora, tratadas como sinnimos. As distribuies de
probabilidade formam a espinha dorsal da metodologia estatstica, uma vez, que pela sua
natureza, a estatstica somente trabalha com variveis cujos valores no ocorrem de modo
determinstico.

No estudo de uma varivel aleatria importante saber:
o tipo de distribuio de probabilidade da varivel;
a funo de probabilidade da varivel;
os parmetros da distribuio;
as medidas descritivas da distribuio (mdia, varincia, assimetria).

Existem inmeros modelos descrevendo o comportamento probabilstico de variveis
discretas e contnuas. Nas sees a seguir sero discutidos os principais tipos de distribuies
discretas e contnuas.



3.3.1. Distribuies de probabilidade de variveis discretas

As distribuies discretas mais importantes e utilizadas so: Bernoulli, Binomial,
Hipergeomtrica, Poisson, Uniforme, Multinomial, Geomtrica, Binomial negativa e
Hipergeomtrica negativa. Todavia, nesta seo, trataremos apenas as cinco primeiras.


3.3.1.1. Distribuio de Bernoulli

Jacob Bernoulli
(1654 1705)


Esta distribuio foi deduzida no final do sculo XVII pelo matemtico
suo Jacob Bernoulli.

Definio: modelo de descrio probabilstica dos resultados de um
experimento de Bernoulli.

O experimento (ou ensaio) de Bernoulli definido como o experimento
aleatrio que possui apenas dois resultados possveis.


Exemplos:

Experimento 1. Uma lmpada colocada numa luminria.

S = {acende, no acende}

Vamos considerar um dos resultados como sucesso, por exemplo, sucesso = acender.
Definimos, ento, a varivel X como nmero de sucessos em uma repetio do experimento.

X = nmero de sucessos
Piana, Machado e Selau Elementos de Probabilidade


93
A varivel X s poder assumir dois valores

0, se a lmpada no acender
X
1, se a lmpada acender
, sendo S
X
= {0, 1}.


Experimento 2. Uma semente colocada para germinar.

S = {germina, no germina}

Se sucesso = germinar, ento, a varivel X = nmero de sucessos ser

0, se a semente no germinar
X
1, se a semente germinar
, sendo S
X
= {0, 1}.

Se for conhecido o poder germinativo do lote de sementes, por exemplo, 87%, ento,
podemos concluir que a probabilidade de a semente germinar 0,87. Como o evento {no
germinar} complemento do evento {germinar}, a probabilidade de no germinar ser 1 0,87.
Temos, ento

= X x 0 1
= P(X x) 0,13 0,87 1


Experimento 3. O nascimento de um bovino.

S = {macho, fmea}

Se sucesso = fmea, ento, a varivel X = nmero de sucessos ser

0, se nascer macho
X
1, se nascer fmea
, sendo S
X
= {0, 1}

Sabe-se que a probabilidade de nascer fmea a mesma de nascer macho. Temos,
ento

= X x 0 1
= P(X x) 0,5 0,5 1


Funo de probabilidade

De modo geral, se X uma varivel que tem distribuio de Bernoulli, ento a sua
funo de probabilidade ser:

Representao tabular

= X x 0 1
= P(X x)
(1)
1

onde:
= probabilidade de sucesso
(1) = probabilidade de fracasso

Piana, Machado e Selau Elementos de Probabilidade


94
Representao analtica

x 1 x
P(X x) (1 )

= = , para S
X
= {0, 1}


Parmetros

A distribuio de Bernoulli tem apenas um parmetro:

= probabilidade de sucesso

Dizemos, ento, que
X ~ Ber ().


Medidas descritivas

Mdia ou valor esperado:

= =

X
x S
E(X) xp(x)
E(X) 0 (1 ) 1 = + =

Teorema: E(X) = =


Varincia: = =
2 2 2
V(X) E(X )

Como
X
2 2 2 2
x S
E(X ) x p(x) 0 (1 ) 1

= = + =

,
temos
2 2 2
V(X) E(X ) (1 ). = = =

Teorema:
2
V(X) (1 ) = =


Coeficiente de Assimetria: =


3
3
2 2
a
onde:
= =
= = +


2 2 2
3 3 2 3
2
3
E(X ) E(X )
E(X ) E(X ) 3 E(X ) 2


Teorema:
3
(1 )
a
(1 )

=







3.3.1.2. Distribuio binomial

Definio: modelo que descreve probabilisticamente os resultados de uma sequncia
de experimentos de Bernoulli independentes, ou seja, onde a probabilidade de sucesso
sempre a mesma.

Piana, Machado e Selau Elementos de Probabilidade


95
Podemos dizer que, se
= + + +
1 2 n
X Y Y Y ,
onde:
i
Y ~ Ber () e
i's
Y so independentes, ento X tem distribuio binomial.

Exemplo: Em uma estncia 60% dos bovinos foram vacinados contra uma
determinada doena. Se um bovino dessa estncia for escolhido ao acaso, ento, teremos um
experimento de Bernoulli com

S = {vacinado, no vacinado},
onde:
P(vacinado) = 0,6 e P(no vacinado) = 0,4.

Se trs bovinos forem escolhidos ao acaso, ento teremos uma sequncia de trs
experimentos de Bernoulli independentes uma vez que, a cada escolha, a probabilidade de
sucesso permanecer inalterada. O espao amostral deste experimento ser

S = {VVV, VVN, VNV, NVV, NNV, NVN, VNN, NNN},
onde:
V = vacinado e N = no vacinado.

Se a varivel X definida como o nmero de sucessos em n experimentos de
Bernoulli independentes, com probabilidade de sucesso igual a , ento, no exemplo, onde n =
3 e = 0,6 (se considerarmos sucesso = vacinado), o espao amostral da varivel X ser S
X
=
{0, 1, 2, 3} e as probabilidades P(X = x) ser:

P(X = 0) = 1
0
(1 )
3
= 1 . 0,6
0
0,4
3
= 0,064

P(X = 1) = 3
1
(1 )
2
= 3 . 0,6
1
0,4
2
= 0,288

P(X = 2) = 3
2
(1 )
1
= 3 0,6
2
0,4
1
= 0,432

P(X = 3) = 1
3
(1 )
0
= 1 0,6
3
0,4
0
= 0,216

Sendo assim, a distribuio de probabilidade da varivel X ser

= X x 0 1 2 3
= P(X x) 0,064 0,288 0,432 0,216 1


Funo de probabilidade

De modo geral, se X uma varivel que tem distribuio binomial, ento a sua funo
de probabilidade ser:

x x x x ,n n
P(X x) P (1 )

= = , para S
X
= {0, 1, ..., n}

Parmetros

A distribuio binomial tem dois parmetros:

n = nmero de repeties do experimento de Bernoulli
= probabilidade de sucesso

Dizemos, ento, que
X ~ Bin (n, ).
Piana, Machado e Selau Elementos de Probabilidade


96
Medidas descritivas

Mdia ou valor esperado:

= =

X
x S
E(X) xp(x)
Considerando que uma varivel X com distribuio binomial pode ser definida como a
soma de variveis de n variveis Y independentes, podemos utilizar as propriedades da mdia.

Sendo = + + +
1 2 n
X Y Y Y ,
temos
1 2 n
1 2 n
E(X) E(Y Y Y )
E(X) E(Y ) E(Y ) E(Y )
E(X) n
= + + +
= + + +
= + + + =


Teorema: E(X) n = =


Varincia: = =
2 2 2
V(X) E(X )

Sendo = + + +
1 2 n
X Y Y Y ,
temos
1 2 n
1 2 n
V(X) V(Y Y Y )
V(X) V(Y ) V(Y ) V(Y )
V(X) (1 ) (1 ) (1 ) n (1 )
= + + +
= + + +
= + + + =


Teorema:
2
V(X) n (1 ). = =


Coeficiente de assimetria: =


3
3
2 2
a
Teorema:
3
(1 )
a
n (1 )

=





Interpretao do coeficiente de assimetria:

Se > (1), a distribuio binomial assimtrica negativa.
Se = (1) = 0,5, a distribuio binomial simtrica.
Se < (1), a distribuio binomial assimtrica positiva.


Coeficiente de curtose:
4
4
2
2
a =



Fazendo
4 4
a a 3 = , temos:

Teorema:
( )
( )
4
1 6 1
a
n 1

=





Interpretao do coeficiente de curtose
4
a :

Se
4
a 0 < , a distribuio binomial platicrtica.
Se
4
a 0 = , a distribuio binomial mesocrtica.
Se
4
a 0 > , a distribuio binomial leptocrtica.

Piana, Machado e Selau Elementos de Probabilidade


97
No exemplo:

E(X) = 3 0,6 = 1,8 bolas

Significado do valor esperado: Se o experimento (escolher trs bovinos) for repetido
um grande nmero de vezes, o valor esperado ser o nmero mdio de sucessos (bovinos
vacinados) obtidos nesses experimentos.

V(X) = 3 0,6 0,4 = 0,72 bolas
2


Significado da varincia: Se o experimento (escolher trs bovinos) for repetido um
grande nmero de vezes, a varincia expressar a variao mdia do nmero de sucessos
(bovinos vacinados) obtidos nesses experimentos em relao ao valor esperado.

= =

3
0,4 0,6
a 0,24
3 0,6 0,4
distribuio assimtrica negativa

Significado do coeficiente de assimetria: A probabilidade de ocorrer valores maiores
que a mdia (1,8) maior que a probabilidade de ocorrer valores menores.

4
1 6 0,6 (1 0,6)
a 0,61
3 0,6 (1 0,6)

= =

distribuio platicrtica



3.3.1.3. Distribuio hipergeomtrica

Definio: modelo que descreve probabilisticamente os resultados de uma sequncia
de experimentos de Bernoulli dependentes. Refere-se a experimentos que se caracterizam por
retiradas sem reposio, ou seja, onde a probabilidade de sucesso se altera a cada retirada.

Tais experimentos podem ser descritos genericamente da seguinte forma:

Consideremos uma populao de tamanho N, dividida em duas sub-populaes de
tamanho N
1
e N
2
. Suponha que desejamos retirar dessa populao um grupo de n elementos,
um a um, sem reposio. Se a varivel aleatria X definida como o nmero de elementos da
sub-populao de tamanho N
1
, observa-se uma relao de dependncia entre os elementos
retirados, pois, como no h reposio, a probabilidade de sucesso (retirar elemento da sub-
populao de tamanho N
1
) muda a cada retirada.

N


(N = N
1
+ N
2
)
sub-populao
de interesse

n elementos, retirados sem reposio

X = nmero de elementos da sub-populao (de interesse) de tamanho N
1


Exemplo: Dentre 10 painis solares apresentados numa exposio, sete so do tipo
placa plana e trs so do tipo concentrador. Uma pessoa que visita a exposio escolhe, ao
acaso, trs painis para observar. Se a varivel aleatria X definida como o nmero de
painis do tipo placa plana observados, construa a distribuio de probabilidade de X.

N
1
N
2

Piana, Machado e Selau Elementos de Probabilidade


98
N = 10 painis


sub-populao
de interesse


escolher 3 painis, sem reposio


S = {C
1
C
2
C
3
, C
1
C
2
P
1
, C
1
C
2
P
2
, ..., P
5
P
6
P
7
}

#S =
3
10
C

X = nmero de painis do tipo placa plana observados

S
X
= {0, 1, 2, 3}

= = = = =
0 3
7 3
3
10
C C
1 1 1
P(X 0) 0,008333
120 120 C

= = = = =
1 2
7 3
3
10
C C
7 3 21
P(X 1) 0,175
120 120 C

= = = = =
2 1
7 3
3
10
C C
21 3 63
P(X 2) 0,525
120 120 C

= = = = =
3 0
7 3
3
10
C C
351 35
P(X 3) 0,2917
120 120 C


Sendo assim, a distribuio de probabilidade da varivel X ser

= X x 0 1 2 3
= P(X x)
1/120 21/120 63/120 35/120 1


Funo de probabilidade

De modo geral, se X uma varivel que tem distribuio hipergeomtrica, ento sua
funo de probabilidade ser:

= =
1 2
x n x
N N
n
N
C C
P(X x)
C
, para S
X
= {max (0, n N
2
), ..., min (n, N
1
)}

Parmetros

A distribuio hipergeomtrica tem trs parmetros:
N

= tamanho da populao
N
1
= nmero de elementos da sub-populao de interesse
n = nmero de elementos retirados (repeties do experimento de Bernoulli)

Dizemos, ento, que

X ~ Hip (N, N
1
, n).

N
2
= 3
Concentrador
N
1
= 7
Plana
Piana, Machado e Selau Elementos de Probabilidade


99
Medidas descritivas

Mdia ou valor esperado:

= =

X
x S
E(X) xp(x)
Teorema: = =
1
N
E(X) n
N



Varincia: = =
2 2 2
V(X) E(X )
Teorema:
| |
= =
|

2 1 2
N N N n
V(X) n
N N N 1
,
onde:

N n
N 1
o fator de correo para populaes finitas.

Agora torna-se necessrio definirmos mais claramente quando uma populao
considerada finita.
Entendemos por populao finita aquela que pode ser esgotada por processo de
amostragem. Uma populao ser considerada finita quando tiver um nmero finito de
elementos e a amostragem for efetuada sem reposio. De maneira anloga, podemos definir
uma populao infinita como aquela que no se esgota por processo de amostragem. Assim,
uma populao ser considerada infinita quando tiver um nmero infinito de elementos ou
quando amostragem for efetuada com reposio.

Para o exemplo, as medidas descritivas so:

= =
7
E(X) 3 2,1
10
painis
| |
= =
|

\
7 3 10 3
V(X) 3 0,49
10 10 10 1
painis
2




3.3.1.4. Distribuio de Poisson


Simon Denis Poisson
(1781 - 1840)

A distribuio de Poisson, assim designada em homenagem ao
matemtico e fsico francs Simon Denis Poisson.

Definio: modelo que descreve probabilisticamente a sequncia de um
grande nmero de fenmenos independentes entre si, cada um com
probabilidade de sucesso muito pequena.

Esta distribuio importante no estudo de variveis aleatrias de
ocorrncia rara em relao ao nmero total de ocorrncias, como por
exemplo:

nmero de peas defeituosas observadas em uma linha de produo
num determinado perodo de tempo;
nmero de partculas radioativas emitidas numa unidade de tempo;
nmero de cultivares selecionadas num processo de melhoramento;
nmero de acidentes de trabalho ocorridos numa grande empresa
num determinado perodo de tempo;
nmero de ciclones ocorridos em certa regio num determinado
perodo de tempo
Piana, Machado e Selau Elementos de Probabilidade


100
A distribuio de Poisson tem inmeras aplicaes na simulao de sistemas
modelando o nmero de eventos ocorridos num intervalo de tempo, quando os eventos
ocorrem a uma taxa constante.


Funo de probabilidade

De modo geral, se X uma varivel que tem distribuio de Poisson, ento a sua
funo de probabilidade ser:
x
P(X x) e
x!

= =

, para S
X
= {0, 1, 2, ...},
onde:
X: nmero de sucessos;
e: nmero base dos logaritmos neperianos = 2,718 (constante);
: nmero mdio de sucessos (sempre maior que zero).

Podemos demonstrar que a funo
x
P(X x) e
x!

= =


uma funo de probabilidade
provando que

x
x
p(x) 1
S
. Como S
X
= {0, 1, 2, ...}, temos
x
x 0 x 0
x
x 0
2 3
0
p(x) e
x!
e
x!
e 1+ + + +
2! 3!
e (e )
e e 1

= =



=
=
| |
=
|
\
=
= = =



Parmetros

A distribuio de Poisson tem apenas um parmetro:

: nmero mdio de sucessos

Dizemos, ento, que
X ~ Poi ().


Medidas descritivas

Mdia ou valor esperado:

= =

X
x S
E(X) xp(x)
x
x 0 x 0
x 1 x 1
x 0 x 0 x 1
x 1 x 1
x 1 x 1
y
0
y 0
E(X) xp(x) xe
x!
x
e x e x e x
x! x(x 1)! x (x 1)!
e =e , fazendo y x 1, temos
(x 1)! (x 1)!
e e e e e
y!

= =


= = =


= =

+
=




= =
= = =

= =

= = = = =


Piana, Machado e Selau Elementos de Probabilidade


101
Teorema: E(X) = =


Varincia: = =
2 2 2
V(X) E(X )

2 2
x 0
x
2 2
x 0 x 0
x 1 x 1
2
x 1 x 1
E(X ) x p(x)
x
x e e x
x! x!
e x e x , fazendo y x 1, temos
x (x 1)! (x 1)!

=


= =


= =

=
= = =
= = =





y y y
2
y 0 y 0
y y
y 0 y 0
0 2 0 2
E(X ) e (y +1) e y +
y! y! y!
e y e ( e e )
y! y!
e e e e e e


= =


= =




= =
= + = +
= + = + = +
| |

|
\
| |


|
\





Assim, temos
2 2 2 2
V(X) E(X ) = = + = .

Teorema:
2
V(X) = =


Coeficiente de assimetria: =


3
3
2 2
a

Teorema:
3
1
a =

Distribuio assimtrica positiva, tendendo para a simetria


quando cresce.


Coeficiente de curtose:
4
4
2
2
a =



Teorema:
4
a = Distribuio platicrtica, tendendo para mesocrtica quando
cresce.


3.3.1.5. Formas limite da distribuio binomial

Sob determinadas circunstncias, uma distribuio de probabilidade pode tender para
outra. Os casos mais importantes de aproximaes entre distribuies e as circunstncias em
que ocorrem so os seguintes:

1. Hipergeomtrica se aproxima da Binomial

Quando N (tamanho da populao) muito grande (ou tende para +), a distribuio
hipergeomtrica se aproxima da distribuio binomial. Isso ocorre porque o fator de correo
para populaes finitas tende a 1.

Piana, Machado e Selau Elementos de Probabilidade


102

= =

N n N n N n n
1 1
N 1 N N N N



De modo geral, esta aproximao considerada satisfatria quando o nmero de
elementos retirados (n) no excede 5% da populao (N), ou seja,

n (0,05) N.


2. Binomial se aproxima da Poisson

Quando n (nmero de repeties do experimento) muito grande (ou tende para + )
e (probabilidade de sucesso) muito pequena (ou tende para 0) a distribuio binomial se
aproxima da distribuio de Poisson. Esta aproximao considerada satisfatria quando

n < 10 e n 100.


3. Binomial se aproxima da Normal

Quando n (nmero de repeties do experimento) muito grande (ou tende para + )
e (probabilidade de sucesso) se aproxima de 0,5, a distribuio binomial se aproxima da
distribuio normal.

Se = (1) = 0,5, ento a distribuio binomial ser simtrica.

Em alguns casos, a distribuio hipergeomtrica pode ser aproximada por uma
distribuio binomial e esta binomial pode ser aproximada por uma distribuio de Poisson.
Assim, existem situaes em que a distribuio hipergeomtrica pode ser aproximada por uma
distribuio de Poisson.


Consideremos o exemplo seguinte:

Um auditor foi contratado para examinar uma coleo de 6.000 faturas, das quais 128
contm erros. Se foi selecionada uma amostra de 120 faturas, qual a probabilidade desta
amostra conter exatamente duas faturas com erros?

Resoluo:

As caractersticas do experimento evidenciam que a varivel X = nmero de sucessos
(faturas com erros) tem distribuio hipergeomtrica com os seguintes parmetros: N = 6.000,
N
1
= 128 e n = 120.
N = 6.000 faturas



sub-populao
de interesse

n = 120 faturas, sem reposio

Como N suficientemente grande, pois

120 < 0,05 6.000 = 300,
N
1
=128
Com erro
N
2
= 5872
Sem erro
Piana, Machado e Selau Elementos de Probabilidade


103
razovel utilizarmos a aproximao binomial, cujos parmetros so:

n = 120 e = = =
1
N 128
N 6000
0,02133.

Como n pode ser considerado suficientemente grande e suficientemente pequeno,
uma vez que
n = 120 > 100 e n = 120 0,02133 = 2,56 < 10,

tambm razovel utilizarmos a aproximao de Poisson, com parmetro

= E(X) = n = 2,56.

Da temos
x 2
2,56
2,56 6,5536
P(X 2) e e 0,0773 0,2533.
x! 2! 2

= = = =



Verificamos, assim, que nas situaes que envolvem grandes valores de n e valores
ainda maiores de N, a distribuio de Poisson torna-se bastante til.



Exerccios propostos:

3.8. A probabilidade de um atirador acertar o alvo de 0,25. Se quatro atiradores atiram, qual
a probabilidade do alvo ser atingido?


3.9. A taxa mdia de chegada de clientes em um posto de servios de 0,5 por minuto.
Calcular a probabilidade de, em um dado minuto, chegarem dois clientes.


3.10. Sendo de 1% o percentual de canhotos numa populao, qual a probabilidade de haver
apenas um canhoto numa classe de 30 alunos?
Piana, Machado e Selau Elementos de Probabilidade


104
3.3.2. Distribuies de probabilidade de variveis contnuas

difcil identificar o tipo de distribuio de probabilidade de uma varivel contnua.
Geralmente necessrio fazer uma pesquisa bibliogrfica para saber se a varivel de interesse
j foi estudada antes e a sua distribuio de probabilidade j foi identificada. Uma das formas
de identificar o tipo de distribuio de uma varivel contnua observando o campo de variao
desta varivel.
Existem vrios tipos de distribuies contnuas, dentre as quais podemos citar:
Uniforme, Normal, Exponencial, Gama, Beta, Lognormal, Weibull, Gumbel. Aqui trataremos
apenas das trs primeiras, consideradas as mais importantes.


3.3.2.1. Distribuio uniforme

Definio: Seja X uma varivel aleatria contnua que assume valores no intervalo
[, ]. Se a probabilidade de X assumir valores num subintervalo a mesma que para qualquer
outro subintervalo de mesmo comprimento, ento, esta varivel tem distribuio uniforme.




Funo densidade de probabilidade

De modo geral, se X uma varivel aleatria contnua que tem distribuio uniforme,
ento sua funo densidade de probabilidade ser:

1
, para x
f(x)
0, em caso contrrio

=




Podemos demonstrar que uma funo densidade de probabilidade provando que
x
S
f(x)dx 1 =

.
x
S
1 x
f(x)dx dx 1


| | (
= = = = =
| (

\





Parmetros

A distribuio uniforme tem dois parmetros:

: menor valor para o qual a varivel X est definida;
: maior valor para o qual a varivel X est definida.

Dizemos, ento, que

X ~ U (, ).
Piana, Machado e Selau Elementos de Probabilidade


105
Medidas descritivas

Mdia ou valor esperado: = =

X
E(X) xf(x)dx
S

x
S
2
2 2
E(X) x f(x)dx
1 1 x
x dx
2
1 ( )( ) ( )

2 2( ) 2


= =
( | |
= =
| (

\
| | + +
= = =
|

\




Teorema:
( )
E(X)
2
+
= =




Varincia: = =
2 2 2
V(X) E(X )

x
3
2 2
S
3
2
3 3 3
E(X ) x f(x)dx
1 1 x
x dx
3
1

3 3( )


=
( | |
= =
| (

\
| |
= =
|

\




Assim, temos
3 3 2
2 2 2
3 3 3 3 2
3 3 3 2 2 3
3 3 3 2 3 2
( )
V(X) E(X )
3( ) 4
4( ) 3( )( )

12( )
4 4 +3 + 3 3 3

12( )
+ 3 3 ( ) ( )

12( ) 12( ) 12
+
= = =

+
=


= = =












Teorema:
2
2
( )
V(X)
12

= =




Funo de distribuio acumulada

A funo de distribuio acumulada da uniforme facilmente encontrada:

F(x) = P(X x) =


x
dx f(x) =
0, se x
x
, se x
1, se x
<

>


Piana, Machado e Selau Elementos de Probabilidade


106
Vejamos um exemplo resolvido.

Seja X uma varivel aleatria contnua com distribuio uniforme no intervalo [5, 10].
Determinar as probabilidades:
a) P(X < 7)
b) P(X > 8,5)
c) P(8 < x < 9)
d) P(|x - 7,5| > 2)

Resoluo:

Utilizando a funo de distribuio acumulada:

a)
7 5 2
P(X 7) F(7) 0, 4
10 5 5

< = = = =



b)
8,5 5 3,5
P(X 8,5) 1 F(8,5) 1 1 1 0,7 0,3
10 5 5

< = = = = =



c)
9 5 8 5 4 3
P(8 X 9) F(9) F(8) 0,2
10 5 10 5 5 5
1
< < = = = = =



d) P( X 7 2) P(X 7,5 2 ou X 7,5 2)
P(X 9,5 ou X 5,5) 1 F(9,5) F(5,5)
9,5 5 5,5 5
1 0,1 0,1 0,2
10 5 10 5
> = > <
= > < = +

= + = =





3.3.2.2. Distribuio exponencial

Definio: Seja X uma varivel aleatria contnua que s assume valores no negativos. Se
esta varivel o tempo decorrido entre ocorrncias sucessivas de um processo de Poisson,
ento ela tem distribuio exponencial.



Na distribuio de Poisson, a varivel aleatria definida como o nmero de
ocorrncias (sucessos) em determinado perodo de tempo, sendo a mdia das ocorrncias no
perodo definida como . Na distribuio exponencial, a varivel aleatria definida como o
tempo entre duas ocorrncias, sendo a mdia de tempo entre ocorrncias igual a 1/. Por
exemplo, se a mdia de atendimentos no caixa de uma loja de = 6 clientes/min, ento o
tempo mdio entre atendimentos 1/ = 1/6 de minuto ou 10 segundos.
Piana, Machado e Selau Elementos de Probabilidade


107
A distribuio exponencial muito utilizada no campo da confiabilidade para a
modelagem do tempo at a ocorrncia de falha em componentes eletrnicos, bem como do
tempo de espera em sistemas de filas.


Funo densidade de probabilidade

De modo geral, se X uma varivel aleatria contnua que tem distribuio
exponencial, ento sua funo densidade de probabilidade ser:

x
e , para x 0
f(x)
0, em caso contrrio

>
=




Podemos demonstrar que uma funo densidade de probabilidade provando que
1 dx f(x)
x
S
=

.
x
x x
0
S 0
f(x) dx e dx e e e 0 ( 1) 1
0



(
= = = = =




Parmetros

A distribuio exponencial tem apenas um parmetro:

: nmero mdio de ocorrncias em determinado perodo de tempo (>0);

Dizemos, ento, que

X ~ Exp().


Medidas descritivas

Mdia ou valor esperado: = =

X
E(X) xf(x)dx
S


x
S
x
0
E(X) x f(x) dx
1
x e dx

= =
= =



Teorema:
1
E(X) = =




Varincia: = =
2 2 2
V(X) E(X )
( )
x
S
x
0
V(X) x f(x)dx
1 1
x e dx

2 2 2
2
2 2

(
= =
(
(

(
= =
(


Piana, Machado e Selau Elementos de Probabilidade


108
Teorema:
1
V(X)
2
2
= =




Funo de distribuio acumulada

A funo de distribuio acumulada da exponencial pode ser facilmente encontrada:

F(x) = P(X x) =


x
dx f(x) =
x
0, se x 0
1 e , se x 0

<



Desta forma,
x x
P(X x) 1 F(x) 1 1 e e ( )

> = = = .


Propriedade da distribuio exponencial

A distribuio exponencial apresenta uma propriedade interessante que denominada
falta de memria. Isso significa que a probabilidade de ocorrncia dos valores de X no
afetada pelo conhecimento da ocorrncia de valores anteriores, ou seja,

(s t)
t
s
P(X s t X s) P(X s t) e
P(X s t | X s) e P(X t)
P(X s) P(X s) e
+

> + > > +


> + > = = = = = >
> >
.


Consideremos o seguinte exemplo resolvido:

Suponha que um componente eletrnico tenha um tempo de vida X (em unidades de 1000
horas) que segue uma distribuio exponencial de parmetro = 1. Suponha que o custo de
fabricao do item seja 2 reais e que o preo de venda seja 5 reais. O fabricante garante
devoluo total se X < 0,90. Qual o lucro esperado por item?

Resoluo:

Neste caso, temos
x
f(x) e , para x 0

= > .

A probabilidade de um componente durar menos de 900 horas dada por:


0,9
P(X 0,9) F(0,9) 1 e 0,5934

< = = =

Assim, o lucro do fabricante ser uma varivel aleatria discreta Y com a seguinte distribuio:

Y y = -2 3
P(Y y) = 0,5934 0,4066 1

Ento o lucro esperado ser:

E(Y) = -2 0,5934 + 3 0,4066 = R$ 0,03



Piana, Machado e Selau Elementos de Probabilidade


109
3.3.2.3. Distribuio normal

A distribuio normal (ou distribuio de Gauss ou distribuio de Gauss-Laplace)
uma distribuio especialmente importante na metodologia estatstica. Sua importncia advm
das suas propriedades, do nmero de fenmenos (variveis) que podem, pelo menos
aproximadamente, ser modelados atravs dela e da quantidade de mtodos e tcnicas que so
derivados tendo-a como pressuposio bsica. Esse conjunto de mtodos e tcnicas forma a
chamada Estatstica Clssica ou Estatstica Paramtrica.

uma distribuio terica de frequncias, onde a maioria das observaes se situa
em torno da mdia (centro da distribuio) e diminui gradual e simetricamente no sentido dos
extremos. A distribuio normal representada graficamente pela curva normal (tambm
chamada curva de Gauss) que tem a forma de sino e simtrica em relao ao centro, onde se
localiza a mdia .

Curva normal




Funo densidade de probabilidade

De modo geral, se X uma varivel aleatria contnua, X possui distribuio normal se
sua funo densidade de probabilidade for

=

2
2
(x )
2
1
f(x) e
2
, - < X < +

Parmetros

A distribuio normal tem dois parmetros:

= mdia (determina o centro da distribuio)

2
= varincia (determina a disperso da distribuio)

Dizemos, ento, que

X ~ N (,
2
).

Cada vez que um dos parmetros muda de valor, temos uma curva normal diferente.

Piana, Machado e Selau Elementos de Probabilidade


110

Populaes normais com mdias
diferentes e mesma varincia
Populaes normais com varincias
diferentes e mesma mdia


Como consequncia, existe um nmero infinito de curvas normais. Na figura abaixo,
podemos observar alguns exemplos de curvas.



Medidas descritivas

Mdia ou valor esperado: = =

X
E(X) xf(x)dx
S

| |
|
= =
|
\

X
2
2
(x )
2
1
E(X) x e dx
2
S


Varincia: = =

X
2 2
V(X) (x ) f(x)dx
S

| |
|
= =
|
\

X
2
2
(x )
2
2 2
1
V(X) (x ) e dx
2
S



Propriedades da distribuio normal

1. O mximo da funo densidade de probabilidade se d no ponto x = .
Piana, Machado e Selau Elementos de Probabilidade


111
2. A distribuio simtrica em relao ao centro onde coincidem a mdia, a moda e a
mediana.
= Mo = Md

3. Os pontos de inflexo (onde a curva passa de convexa para cncava) so
exatamente e +.

4. Verifica-se na distribuio normal que:

P( < X < +) = 0,6825
P( 2 < X < +2) = 0,9544
P( 3 < X < +3) = 0,9974

Considerando que a rea sob a curva no intervalo de interesse que corresponde a
probabilidade, utilizamos as curvas abaixo para ilustrar esta propriedade.



Vimos que, para cada valor de e de , existe uma distribuio normal diferente. Da
existirem infinitas distribuies (e curvas) normais, pois basta que mude um dos parmetros
para termos outra distribuio. Deste modo, o clculo de reas sob a curva normal,
frequentemente necessrio, dever ser feito sempre em funo dos particulares valores de e
. Para evitar a trabalhosa tarefa de calcular essas reas todas as vezes que desejssemos
obter as probabilidades associadas a uma certa varivel X, foi determinada uma distribuio
normal padro ou reduzida. Atravs da distribuio normal padro possvel estudar qualquer
varivel que tenha distribuio normal, com quaisquer valores para e .


Distribuio normal padro

Definio: a distribuio normal de uma varivel Z que tem mdia igual a zero ( = 0)
e desvio padro igual a um ( = 1). Para a varivel Z, a funo densidade de probabilidade
resulta

2
z
2
1
f(z) e
2
, - < Z < + .

A funo densidade de probabilidade mais simplificada da distribuio normal padro,
facilitou o clculo das reas sob a sua curva. Assim, a curva normal padro foi dividida em
pequenas tiras, cujas reas foram calculadas e apresentadas numa tabela. Na tabela da
Piana, Machado e Selau Elementos de Probabilidade


112
distribuio normal padro (Tabela I do Apndice), podemos encontrar as reas
correspondentes aos intervalos de 0 a z.



Os valores negativos no so apresentados na tabela porque a curva simtrica;
portanto, as reas correspondentes a estes valores so exatamente iguais s dos seus
simtricos positivos, por exemplo, P(-1 < Z < 0) = P(0 < Z < 1). Podemos observar tambm, na
tabela da distribuio normal padro, que os valores de Z vo de 0 a 3,99. Este limite
estabelecido com base na quarta propriedade da distribuio normal, como podemos observar
na figura abaixo.



Sabemos que no intervalo [-3; +3], que na normal padro corresponde ao
intervalo [-3; 3], temos 99,74 % dos valores de Z. Portanto, como podemos verificar na tabela, a
rea compreendida entre de 0 e 3,99 j aproximadamente 0,5.

Veremos agora como a distribuio normal padro e sua tabela podem ser utilizadas
para a obteno de probabilidades correspondentes a qualquer varivel X que tenha
distribuio normal.
A distribuio de uma varivel X, com quaisquer valores para e , pode ser obtida
pela transformao da varivel X na varivel Z, atravs da expresso

=
X
Z

Assim, se
1
x e
2
x so valores de X com distribuio normal e
1
z e
2
z so valores de
Z, tais que
1
1
x
z

=

e
2
2
x
z

=

,

ento, P(x
1
< X < x
2
) = P(z
1
< Z < z
2
).
Piana, Machado e Selau Elementos de Probabilidade


113
A relao evidente, uma vez que a transformao muda as variveis, mas no altera
a rea sob a curva, como podemos verificar na figura a seguir.



X ~ N (,
2
)








Z ~ N (0, 1)









P(x
1
< X < x
2
) = P(z
1
< Z < z
2
)



Sendo assim, para utilizar os valores da tabela, devemos transformar X em Z.

X ~ N (,
2
)
transformar
X
Z

=


Z ~ N (0, 1)


Aps a transformao, podemos procurar na tabela a rea compreendida entre 0 e z,
que corresponder rea entre e x.


Consideremos o exemplo resolvido a seguir.

Sabendo que as notas de 450 alunos esto normalmente distribudas, com mdia =
3,9 e desvio padro = 0,28, determine:

a) a probabilidade de um aluno ter nota maior que 4,27;
b) o nmero de alunos que tm nota superior a 4,27.

Resoluo:

a) Sabemos que a probabilidade de ocorrer um valor dentro de um determinado intervalo
corresponde rea sob a funo densidade dentro deste intervalo. Sendo assim, para
determinar a probabilidade de ocorrer uma nota maior do que 4,27, devemos encontrar a rea
localizada direita de 4,27 na curva normal.


Piana, Machado e Selau Elementos de Probabilidade


114
Para encontrar essa rea, vamos utilizar a tabela da distribuio normal padro. Inicialmente,
fazemos a transformao da varivel X para a varivel Z, atravs da expresso
X
Z

=

.
Desta forma, determinamos o valor de z que corresponde ao valor x = 4,27.




Assim, temos

= =
4,27 3,9
z 1,32
0,28




Sabemos que a tabela fornece a rea entre 0 e z, portanto, o valor 0,4066, encontrado na
tabela para z = 1,32, expressa a rea compreendida entre 0 e 1,32. Como a rea que nos
interessa a rea direita de 1,32 e sabemos que a rea correspondente metade da curva
0,5, podemos encontrar a rea de interesse calculando a diferena entre essas duas reas.


Piana, Machado e Selau Elementos de Probabilidade


115
Assim, fazemos

P(Z > 1,32) = P(Z > 0) P(0<Z<1,32)
P(Z > 1,32) = 0,5 0,4066
P(Z > 1,32) = 0,0934



Sabendo que a rea direita de z = 1,32 e igual rea direita de x = 4,27, conclumos que a
probabilidade de Z ser maior que 1,32 igual probabilidade de X ser maior que 4,27. Sendo
assim, a probabilidade de um aluno tirar uma nota acima de 4,27 de 0,0934 ou 9,34%, ou
seja, P(X > 4,27) = 0,0934.




b) Para determinar o nmero de indivduos que tm nota superior a 4,27, devemos saber qual
o percentual da populao que tm nota acima de 4,27. No item a, vimos que este percentual
de 9,34%. Sendo assim, atravs de uma regra de trs simples, podemos determinar quantos
estudantes correspondem a 9,34% de uma populao de 450 estudantes. Esse valor pode ser
obtido facilmente multiplicando o tamanho da populao pela probabilidade de ocorrer uma
nota maior que 4,27. Assim, temos:

450 0,0934 = 42,03

Conclumos, ento, que, dos 450 estudantes, 42 tm nota superior a 4,27.

Piana, Machado e Selau Elementos de Probabilidade


116
Exerccios propostos:

3.11. Uma varivel X uniformemente distribuda no intervalo [10, 20]. Determine:
a) valor esperado e varincia de X;
b) P(12,31 < X < 16,50).


3.12. Os tempos at a falha de um dispositivo eletrnico seguem o modelo exponencial, com
uma taxa de falha = 0,012 falhas/hora. Indique qual a probabilidade de um dispositivo
escolhido ao acaso sobreviver a 50 horas? E a 100 horas?


3.13. Suponha que um mecanismo eletrnico tenha um tempo de vida X (em unidades de 1000
horas) que considerado uma varivel aleatria com funo densidade de probabilidade dada
por:
f(x) = e
-x
, x > 0
= 0, em caso contrrio.
Suponha ainda que o custo de fabricao de um item seja 2 reais e o preo de venda seja 5
reais. O fabricante garante total devoluo se X 0,8. Qual o lucro esperado por item?


3.14. Seja Z uma varivel aleatria com distribuio normal padro. Determine as seguintes
probabilidades:

a) P(0 < Z < 1,73)
b) P(0,81 < Z < + )
c) P(-1,25 Z -0,63)


3.15. Suponha que a estatura de recm-nascidos do sexo feminino uma varivel com
distribuio normal de mdia = 48 cm e = 3 cm. Determine:

a) a probabilidade de um recm-nascido ter estatura entre 42 e 49 cm;
b) a probabilidade de um recm-nascido ter estatura superior a 52 cm;
c) o nmero que de recm-nascidos que tm estatura inferior +cm, dentre os 532 que
nasceram numa determinada maternidade, no perodo de um ms.


3.16. Suponha que as notas de uma prova sejam normalmente distribudas, com mdia =72 e
desvio padro =1,3. Considerando que 18% dos alunos mais adiantados receberam conceito
A e 10% dos mais atrasados o conceito R, encontre a nota mnima para receber A e a
mxima para receber R.

Piana, Machado e Selau Elementos de Probabilidade


117
3.3. Bibliografia


COSTA, S.F. Introduo Ilustrada Estatstica (com muito humor!). 2.ed., So Paulo:
Harbra, 1992. 303p.

DEVORE, J. Probability and statistics for engineering and the sciences Brooks/Cole
Publishing Companig. 1982. 640p.

FARIA, E.S. de Estatstica Edio 97/1. (Apostila)

FERREIRA, D.F. Estatstica Bsica. Lavras: Editora UFLA, 2005, 664p.

FREUND, J.E., SIMON, G.A. Estatstica Aplicada. Economia, Administrao e
Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p.

GUEDJ, D. O teorema do papagaio. So Paulo: Companhia das Letras, 2000. 501p.

MEYER, P. L. Probabilidade: aplicaes estatstica. Rio de Janeiro: LTC, 1976.

PIMENTEL GOMES, F. Iniciao Estatstica So Paulo: Nobel, 1978. 211p.

SILVEIRA JNIOR, P., MACHADO, A.A., ZONTA, E.P., SILVA, J.B. da Curso de Estatstica.
v.1, Pelotas: Universidade Federal de Pelotas, 1989. 135p.

SILVEIRA JNIOR, P., MACHADO, A.A., ZONTA, E.P., SILVA, J.B. da. Curso de
Estatstica.v.2, Pelotas: Universidade Federal de Pelotas, 1992. 234p.

SPIEGEL, M.R. Estatstica. So Paulo: McGraw-Hill, 1972. 520p.

VIEIRA, S. Estatstica Experimental. 9.ed., So Paulo: Atlas, 1999. 185p.



Unidade IV
Inferncia Estatstica

Unidade IV. Inferncia Estatstica
4.1. Introduo e histrico................................................................................................ 119
4.2. Conceitos fundamentais............................................................................................ 121
4.3. Distribuies amostrais............................................................................................. 124
4.3.1. Distribuies amostrais de algumas estatsticas importantes......................... 130
4.4. Estimao de parmetros.......................................................................................... 137
4.4.1. Conceitos fundamentais.................................................................................. 137
4.4.2. Propriedades dos estimadores........................................................................ 134
4.4.3. Processos de estimao.................................................................................. 135
4.5. Testes de hipteses................................................................................................... 155
4.5.1. Testes para a mdia populacional................................................................... 155
4.5.2. Testes para a varincia populacional.............................................................. 166
4.5.3. Testes para a proporo populacional............................................................ 171
4.6. Quebras nas pressuposies adotadas no processo de inferncia..................... 174
4.6.1. Heterogeneidade de varincias....................................................................... 174
4.6.2. Dependncia entre as amostras...................................................................... 175
4.7. Regresso linear simples.......................................................................................... 179
4.7.1. Introduo................................................................................................. 179
4.7.2. Anlise de regresso....................................................................................... 182
4.8. Testes de qui-quadrado............................................................................................. 196
4.8.1. Consideraes gerais...................................................................................... 196
4.8.2. Estatstica do teste.......................................................................................... 196
4.8.3. Classificao simples...................................................................................... 197
4.8.4. Classificao dupla.......................................................................................... 197
4.8.5. Critrio de deciso........................................................................................... 198
4.9. Bibliografia.................................................................................................................. 203
Piana, Machado e Selau Inferncia Estatstica


119
4.1. Introduo e histrico

Estudamos na Unidade II as tcnicas para resumir e descrever variveis associadas a
conjuntos de dados obtidos de populaes inteiras ou de subconjuntos de populaes. Na
Unidade III, vimos como construir modelos probabilsticos, identificados por parmetros,
capazes de representar adequadamente o comportamento de algumas variveis. Nesta
unidade veremos os fundamentos tericos para fazer afirmaes sobre caractersticas de uma
populao com base em informaes fornecidas por amostras.
No preciso beber toda a garrafa para saber se o vinho bom. Esta frase bastante
popular ilustra melhor do que qualquer exemplo tcnico o conceito de inferncia estatstica: dar
informao sobre o todo, com base no conhecimento da parte. O uso de informaes parciais
para concluir sobre o todo faz parte do cotidiano da maioria das pessoas. Basta observar como
a cozinheira prova a comida que est preparando ou como um comprador experimenta um
pedao de laranja na feira antes de decidir se vai comprar as laranjas ou no. Essas decises
so baseadas em procedimentos amostrais.
Na pesquisa cientfica, em geral, o processo tambm esse. Levantamentos
amostrais e experimentos so feitos com amostras, mas o pesquisador no quer suas
concluses restritas amostra com a qual trabalhou, ao contrrio, o ele quer estender os
resultados que obteve para toda a populao. Assim, o pesquisador quer fazer inferncia.
Podemos conceituar a Inferncia Estatstica como o conjunto de procedimentos
estatsticos que tm por finalidade generalizar concluses de uma amostra para uma
populao.
Outro exemplo da aplicao dos mtodos de inferncia estatstica, presente em nosso
dia a dia, so as pesquisas eleitorais. Vejamos o esquema da abaixo.



Para poder generalizar as concluses obtidas da amostra para a populao, no basta
saber descrever convenientemente os dados da amostra, preciso garantir que o processo de
amostragem seja eficiente, ou seja, que a amostra seja representativa da populao. Isto
significa que a amostra deve possuir as mesmas caractersticas bsicas da populao no que
diz respeito s variveis que desejamos pesquisar.
A partir desta generalizao surge o conceito fundamental de erro provvel. A
possibilidade de erro inerente ao processo de inferncia, ou seja, sempre que estudamos
uma populao a partir de uma amostra, existe a possibilidade de cometermos algum tipo de
erro de concluso. A grande aplicao da Inferncia Estatstica fornecer mtodos que
permitam quantificar esse erro provvel.
Piana, Machado e Selau Inferncia Estatstica


120
Um pouco de histria...



Lambert Qutelet
(1796 - 1855)




Karl Pearson
(1857 - 1936)


Francis Galton
(1822 - 1911)




Egon Pearson
(1895 - 1980)



Jerzy Neyman
(1894 - 1981)

O casamento entre a Estatstica e o clculo das
probabilidades se deve ao astrnomo belga Lambert
Adolphe Jacques Qutelet, que, atravs de estudos na
rea social, mostrou que muitos fenmenos vivos
apresentavam um comportamento regular. A
expresso matemtica dessa regularidade
conhecida, hoje, como distribuio de probabilidade.

Aps Qutelet, a Estatstica teve um
desenvolvimento sem precedentes, sendo o fenmeno
da regularidade observado em muitos campos de
pesquisa. As distribuies de probabilidade
comearam a ser deduzidas, aumentando ainda mais o
campo de aplicao.

O bilogo ingls Francis Galton, estudando a
hereditariedade do carter estatura na espcie
humana, foi o primeiro a empregar o termo regresso
para designar o fenmeno de retorno mdia.

Em 1890, o ingls Karl Pearson, estimulado
pelos trabalhos de Francis Galton, iniciou o estudo
sobre relacionamento entre variveis e, em 1900,
deduziu a distribuio Qui-quadrado. Em 1908, o ingls
William Gosset, aluno de Pearson, descobriu a
distribuio t no intuito de resolver problemas relativos
a pequenas amostras.

Alguns anos mais tarde, outro ingls, Ronald
Aylmer Fisher, trouxe contribuies extremamente
valiosas Estatstica. Fisher, com os resultados de
Gosset, rapidamente descobriu as distribuies
amostrais dos coeficientes de correlao, regresso,
correlao mltipla e a distribuio da razo entre duas
varincias. Foi ele tambm quem estendeu e deu ideia
mais precisa tcnica chamada Anlise da Variao,
at hoje uma das mais poderosas utilizadas na
Estatstica. Fisher trabalhou por quatorze anos na
Estao Experimental de Rothamstead, Inglaterra, e,
devido aos trabalhos que l desenvolveu,
considerado o pai da Estatstica Experimental.

Aps 1925, emergiram dois campos de extrema
importncia na Inferncia Estatstica, considerados os
pilares da cincia: a teoria dos testes de hipteses, sob
inspirao de Egon Sharpe Pearson e Jerzy Neyman,
e a teoria da estimao de parmetros, desenvolvida
por Fisher.
Ronald Fisher
(1890 - 1962)





Piana, Machado e Selau Inferncia Estatstica


121
4.2. Conceitos fundamentais

Inicialmente, veremos alguns conceitos fundamentais da Inferncia Estatstica.

Populao o conjunto de todos os indivduos ou elementos que atendem a
determinadas caractersticas definidoras. Estas caractersticas dependem do objetivo do
estudo.
Exemplos:

1. Pesquisa eleitoral no Rio Grande do Sul.
Objetivo: Conhecer a preferncia eleitoral no estado.
Populao: Todos os eleitores que votam no RS.

2. Pesquisa scio-econmica na Universidade Federal de Pelotas.
Objetivo: Estimar a renda mdia das famlias dos estudantes da UFPel.
Populao: Todos os estudantes da UFPel.

Amostra um subconjunto retirado da populao com o objetivo de represent-la.

Exemplos:

1. Pesquisa eleitoral no Rio Grande do Sul.
Amostra: Conjunto de 1.000 a 2.000 eleitores votantes no RS que sero
entrevistados pelos pesquisadores.

2. Pesquisa scio-econmica na Universidade Federal de Pelotas.
Amostra: Conjunto de 200 estudantes da UFPel que sero entrevistados pelos
pesquisadores.

Amostragem o mtodo de seleo que empregamos para obteno de amostras.
Podemos distinguir dois tipos de amostragem: probabilstica e no probabilstica. A amostra
ser probabilstica se todos os elementos da populao tiverem probabilidade conhecida e
diferente de zero de participarem da amostra. Caso contrrio, a amostragem ser no
probabilstica. A amostragem probabilstica a mais recomendvel por garantir a
imparcialidade da amostra. Assim, qualquer discrepncia entre populao e amostra
atribuda ao acaso.

Vejamos a seguir uma breve descrio dos principais tipos de amostragem.

Amostragem probabilstica:

Amostragem aleatria simples: considera a populao homognea e consiste num
sorteio para a seleo dos elementos que comporo a amostra. Deste modo, todos os
elementos da populao tm a mesma probabilidade de fazer parte da amostra.

Amostragem aleatria estratificada: utilizada quando a populao pode ser dividida
em subgrupos cujos elementos so semelhantes entre si. A amostragem consiste em obter-se
de cada grupo uma amostra aleatria. Esse processo pode gerar amostras bastante precisas,
mas s recomendado quando os grupos so homogneos internamente e heterogneos
entre si, ou seja, a populao heterognea e as diferenas constituem os estratos (grupos).

Amostragem aleatria por conglomerados: neste caso, a populao j dividida em
diferentes grupos (conglomerados) e extraem-se amostras apenas de conglomerados
selecionados, e no de toda a populao. O ideal que cada conglomerado represente tanto
quanto possvel o total da populao. Na prtica, selecionam-se os conglomerados
geograficamente. Escolhem-se aleatoriamente algumas regies, em seguida algumas sub-
regies e finalmente, alguns lares. Esse processo possibilita ao pesquisador entrevistar apenas
poucas pessoas.
Piana, Machado e Selau Inferncia Estatstica


122
Amostragem aleatria sistemtica: ocorre quando os elementos da populao se
apresentam ordenados e a retirada dos elementos da amostra feita periodicamente. Por
exemplo, em uma linha de produo, podemos, a cada dez itens produzidos, retirar um para
avaliar a qualidade da produo. um processo de amostragem mais preciso que a aleatria
simples e to preciso quanto amostragem estratificada.

Amostragem no probabilstica:

Amostragem de convenincia: de acordo com determinado critrio, escolhido
convenientemente um grupo de elementos que comporo a amostra. O pesquisador se dirige a
grupos de elementos dos quais deseja saber a opinio. A amostra pesquisada muitas vezes
est disponvel no local e no momento onde a pesquisa estava sendo realizada.

Amostragem por julgamento: enquadram-se aqui os diversos casos em que o
pesquisador deliberadamente escolhe certos elementos para pertencer amostra, por julgar
tais elementos bem representativos. O perigo desse tipo de amostragem grande, pois o
pesquisador pode facilmente se enganar em seu pr-julgamento.

Amostragem por quota: o pesquisador procura obter uma amostra que seja similar
apenas em alguns aspectos populao. H necessidade de conhecer caractersticas
especficas da populao para determinar a amostra.

Amostragem a esmo ou sem norma: a amostragem em que o pesquisador, para
simplificar o processo, procura ser aleatrio sem, no entanto, realizar propriamente o sorteio
usando algum dispositivo aleatrio confivel. Os resultados da amostragem a esmo so, em
geral, equivalentes aos da amostragem probabilstica se a populao homognea e se no
existe a possibilidade de o pesquisador ser inconscientemente influenciado por alguma
caracterstica dos elementos da populao.

Amostragem acidental: trata-se da formao de amostras por aqueles elementos que
vo aparecendo. Este mtodo utilizado, geralmente, em pesquisas de opinio, em que os
entrevistados so acidentalmente escolhidos.


Dos exemplos relacionados, centraremos nossa ateno na amostragem aleatria
simples que a maneira mais fcil de selecionarmos uma amostra probabilstica de uma
populao. Alm disso, esse procedimento ser a base para o desenvolvimento de outros
procedimentos amostrais.


Amostra aleatria simples, tambm chamada de amostra casual simples, aquela
obtida de tal forma que todas as unidades da populao tenham a mesma probabilidade de
fazer parte da amostra, ou ainda, que todas as possveis amostras tenham igual probabilidade
de serem selecionadas.

O processo de obteno das unidades que comporo a amostra aleatria simples o
sorteio (com ou sem reposio) de todos as unidades da populao. Esse sorteio pode ser
realizado utilizando-se pedacinhos de papel, tabelas de nmeros aleatrios ou programas
computacionais.

Outra maneira bastante prtica de efetuar o sorteio com a utilizao de nmeros
aleatrios fornecidos pelas calculadoras cientficas. Este procedimento envolve apenas trs
passos:
1) Identificar cada unidade da populao por um nmero, numa seqncia de 1 a N ou
de C a N+C1.
2) Obter uma sequncia de n nmeros aleatrios utilizando a funo Random da
calculadora.
Piana, Machado e Selau Inferncia Estatstica


123
3) Efetuar para cada nmero aleatrio a seguinte operao:

[UN] + C,
onde:
U: nmero aleatrio, sendo 0U<1;
N: tamanho da populao;
[UN]: parte inteira do produto UN;
C: nmero de ordem da primeira observao.

Por exemplo, se desejamos extrair uma amostra de tamanho n=10 de uma populao
de tamanho N=150, devemos enumerar de 1 a 150 as unidades da populao e obter da
calculadora uma seqncia de dez nmeros aleatrios (U). Na tabela abaixo temos uma
sequncia de dez nmeros aleatrios e, para cada um deles, os dois passos da operao
[UN] + 1.

U U150 [U150] + 1
0.301 45,15 46
0.938 140,70 141
0.574 86,10 87
0.205 30,75 31
0.720 108,00 109
0.702 105,30 106
0.152 22,80 23
0.505 75,75 76
0.633 94,95 95
0.566 84,90 85


Assim, as unidades da populao que iro compor a amostra so aquelas
identificadas pelos nmeros 23, 31, 46, 76, 85, 87, 95, 106, 109 e 141.

A amostragem aleatria simples o processo mais simples de amostragem, de modo
que, dada uma populao de N elementos, podemos extrair k amostras diferentes de tamanho
n, onde
n
n
N
,
,
N se as retiradas so feitas com reposio
k
C se as retiradas so feitas sem reposio



A probabilidade associada a cada uma das k amostras possveis de tamanho n
assim definida
1
p(amostra)
k
= .

Na prtica, a amostra sorteada da populao unidade por unidade e, se o sorteio for
com reposio, a probabilidade associada a cada unidade

1
p(unidade)
N
= .

Do ponto de vista da quantidade de informao contida na amostra, amostrar sem
reposio mais adequado. Entretanto, a amostragem com reposio conduz a um tratamento
terico mais simples, uma vez que implica na independncia entre as unidades selecionadas.
Essa independncia facilita o desenvolvimento das propriedades dos estimadores que sero
considerados.

Piana, Machado e Selau Inferncia Estatstica


124
4.3. Distribuies amostrais

Vamos adotar a partir de agora o conceito de populao que mais adequado para o
tratamento terico. Em vez de considerar a populao como um conjunto de indivduos ou
objetos (populao real), vamos trabalhar com a ideia de populao apresentada na unidade
III, ou seja, como o conjunto de todos os possveis valores de uma varivel aleatria, cuja
distribuio de probabilidade conhecida ou passvel de ser obtida. Chamaremos este
conjunto de valores de populao estatstica. Observemos que para utilizar os conceitos de
probabilidade em Estatstica essencial saber qual a distribuio de probabilidade da
varivel em estudo.

Vejamos tambm o significado mais preciso de uma amostra. Entendemos por
amostra aleatria aquela amostra cujos elementos [X
1
, X
2
, ..., X
n
] so todos independentes
entre si e tm a mesma distribuio de probabilidade da populao (X), ou seja,

i's
i's

- os X so independentes
- os X tm a mesma distribuio de X


Para garantir a independncia entre os elementos da amostra, as escolhas devem ser
feitas com reposio. Como os valores que compem a amostra so aleatrios, qualquer
funo (total, mdia, varincia, etc.) dos elementos da amostra ser tambm uma varivel
aleatria. Denominamos estatstica qualquer valor obtido em funo da amostra. Como as
estatsticas so funes de variveis aleatrias, tambm so variveis aleatrias e, como
consequncia, tero alguma distribuio de probabilidade com mdia, varincia, etc. A
distribuio de probabilidade de uma estatstica chamada de distribuio amostral.

O objetivo da inferncia estatstica inferir para a populao a partir da amostra.
Assim, todas as informaes que temos sobre a populao so providas pela amostra, ou seja,
trabalhamos efetivamente com estatsticas, que so variveis aleatrias. Por essa razo,
fundamental que conheamos as distribuies amostrais dessas estatsticas.
A mdia da amostra ( X ) a estatstica mais utilizada porque apresenta propriedades
interessantes. Vamos utilizar o exemplo a seguir para demonstrar as propriedades da
distribuio amostral da mdia.

O mecnico de uma oficina de regulagem para carros com 4, 6 e 8 cilindros, cobra
pelo servio 40, 45 e 50 reais, respectivamente. Seja a varivel X = valor cobrado pelo
mecnico, com a seguinte distribuio de probabilidade:

X = x 40 45 50
P(X = x) 0,2 0,3 0,5 1

a) Determine a mdia e a varincia da populao.

b) Supondo a retirada de uma amostra aleatria de tamanho n, determine a
distribuio de probabilidade, a mdia e a varincia de cada elemento da amostra
[X
1
, X
2
, ..., X
n
]

c) Supondo a retirada de uma amostra de tamanho n = 2, com reposio, quantas e
quais so as possveis amostras retiradas da populao e qual a probabilidade
associada a cada uma? Determine a mdia e a varincia da distribuio amostral
da mdia X .

d) Supondo a retirada de uma amostra de tamanho n = 3, com reposio, quantas e
quais so as possveis amostras retiradas da populao e qual a probabilidade
associada a cada uma? Determine a mdia e a varincia da distribuio amostral
da mdia.

Piana, Machado e Selau Inferncia Estatstica


125
Resoluo:

a) Mdia e a varincia da populao:

= = = + + =

X
x S
E(X) x p(x) 40 0,2 45 0,3 50 0,5 46,5
= = = + + =
2 2 2 2 2 2 2
V(X) E(X ) (40 0,2 45 0,3 50 0,5) 46,5 15,25


b) Distribuio de probabilidade, mdia e varincia de cada elemento da amostra [X
1
, X
2
, ..., X
n
]

Amostra aleatria de tamanho n [X
1
, X
2
, ..., X
n
]

Distribuio de probabilidade de X
1


X
1
= x
1
40 45 50
P(X
1
= x
1
) 0,2 0,3 0,5 1

E(X
1
) = = 46,5
V(X
1
) =
2
= 15,25

Distribuio de probabilidade de X
2

X
2
= x
2
40 45 50
P(X
2
= x
2
) 0,2 0,3 0,5 1

E(X
2
) = = 46,5
V(X
2
) =
2
= 15,25

Distribuio de probabilidade de X
n


X
n
= x
n
40 45 50
P(X
n
= x
n
) 0,2 0,3 0,5 1

E(X
n
) = = 46,5
V(X
n
) =
2
= 15,25

Verificamos, assim, que se [X
1
, X
2
, ..., X
n
] uma amostra aleatria, o valor esperado
de cada elemento da amostra igual mdia da populao e a varincia de cada elemento da
amostra igual varincia da populao, ou seja,

E(X
i
) = e V(X
i
) =
2



c) O nmero de amostras aleatrias possveis obtido por meio da expresso

k = N
n
,
onde:
k = nmero de amostras possveis de um mesmo tamanho
N = tamanho da populao
n = tamanho da amostra

Assim, supondo uma amostra de tamanho dois, temos k = N
n
= 3
2
= 9.

Piana, Machado e Selau Inferncia Estatstica


126
O conjunto de todas as possveis amostras de tamanho dois, retiradas desta
populao de tamanho trs, consiste no conjunto de todos os arranjos desses trs elementos
tomados dois a dois. A probabilidade associada a cada amostra obtida pelo produto das
probabilidades de cada elemento da amostra.
Na tabela abaixo temos todas as amostras possveis, com suas respectivas
probabilidades, e a mdia de cada amostra, obtida pela expresso =
i
X
X
n


Amostra [X
1
, X
2
] P [X
1
, X
2
]
X
1 (40, 40) 0,2 0,2 = 0,04 40
2 (40, 45) 0,2 0,3 = 0,06 42,5
3 (40, 50) 0,2 0,5 = 0,10 45
4 (45, 40) 0,3 0,2 = 0,06 42,5
5 (45, 45) 0,3 0,3 = 0,09 45
6 (45, 50) 0,3 0,5 = 0,15 47,5
7 (50, 40) 0,5 0,2 = 0,10 45
8 (50, 45) 0,5 0,3 = 0,15 47,5
9 (50, 50) 0,5 0,5 = 0,25 50

Para construir a distrubuio amostral da mdia, tomamos todos os diferentes valores
que a estatstica X assume e calculamos a probabilidade de ocorrncia de cada um. A
probabilidade associada a cada valor de X obtida da seguinte maneira:

= = P(X 40) P(40, 40) = 0,04
= = P(X 42,5) P(40, 45) + P(45, 40) = 0,06 + 0,06 = 0,12
P(X 45) = = P(40, 50) + P(45, 45) + P(50, 40) = 0,10 + 0,09 + 0,10 = 0,29
P(X 47,5) = = P(45, 50) + P(50, 45) = 0,15 + 0,15 = 0,30
= = P(X 50) P(50, 50) = 0,25

Assim, temos a distribuio amostral da mdia das amostras de tamanho dois. Essa
distribuio de probabilidade pode ser apresentada na forma tabular abaixo.

= X x
40 42,5 45 47,5 50
= P(X x)
0,04 0,12 0,29 0,3 0,25 1

Como todos os possveis valores de X constituem uma populao, tambm podemos
obter o valor esperado a mdia E(X) e a varincia V(X) desta populao:

= = = + + + + =

X
X
x S
E(X) x p(x) 40 0,04 42,5 0,12 45 0,29 47,5 0,3 50 0,25 46,5
= = = + + + =
2 2 2 2 2 2 2
X X
V(X) E(X ) (40 0,04 42,5 0,12 50 0,25) 46,5 7,625


d) Supondo uma amostra de tamanho trs, temos

k = N
n
= 3
3
= 27 amostras possveis.

Da mesma forma como j visto no item c, podemos obter todas as possveis amostras
de tamanho trs, suas probabilidades e suas mdias. Essas valores so apresentados na
tabela a seguir.

Piana, Machado e Selau Inferncia Estatstica


127

A partir desses dados, construmos a distribuio amostral da mdia das amostras de
tamanho trs, apresentada na tabela abaixo.

= X x
40 41,7 43,3 45 46,7 48,3 50
= P(X x)
0,008 0,036 0,114 0,207 0,285 0,225 0,125 1

Assim, obtemos tambm o valor esperado e a varincia da mdia das amostras de
tamanho trs.

= = = + + + =

X
X
x S
E(X) xp(x) 40 0,008 41,7 0,036 50 0,125 46,5
= = = + + + =
2 2 2 2 2 2 2
X X
V(X) E(X ) (40 0,008 41,7 0,036 50 0,125) 46,5 5,083


Resultados importantes

Relacionando as medidas da distribuio amostral da mdia ( X ) com as medidas da
distribuio populacional (X), podemos verificar algumas propriedades importantes:

A mdia das mdias de todas as k amostras aleatrias possveis, de mesmo
tamanho n, extradas de uma populao, igual mdia da populao, ou seja,

= E(X) .

A varincia das mdias de todas as k amostras aleatrias possveis, de mesmo
tamanho n, extradas de uma populao, igual varincia da populao dividida pelo
tamanho da amostra, ou seja,
=

2
V(X)
n
.

Deste resultado podemos obter tambm o desvio padro da mdia que igual ao
desvio padro da populao dividido pela raiz do tamanho da amostra, ou seja,

= = = =

2 2
X
V(X)
n n n


Amostra [X
1
, X
2
, X
3
] P[X
1
, X
2
, X
3
]
X
Amostra [X
1
, X
2
, X
3
] P[X
1
, X
2
, X
3
]
X
1 (40, 40, 40) 0,008 40 15 (45, 45, 50) 0,045 46,7
2 (40, 40, 45) 0,012 41,7 16 (45, 50, 40) 0,030 45
3 (40, 40, 50) 0,020 43,3 17 (45, 50, 45) 0,045 46,7
4 (40, 45, 40) 0,012 41,7 18 (45, 50, 50) 0,075 48,3
5 (40, 45, 45) 0,018 46,7 19 (50, 40, 40) 0,020 43,3
6 (40, 45, 50) 0,030 45 20 (50, 40, 45) 0,030 45
7 (40, 50, 40) 0,020 43,3 21 (50, 40, 50) 0,050 46,7
8 (40, 50, 45) 0,030 45 22 (50, 45, 40) 0,030 45
9 (40, 50, 50) 0,050 48,3 23 (50, 45, 45) 0,045 46,7
10 (45, 40, 40) 0,012 41,7 24 (50, 45, 50) 0,075 48,3
11 (45, 40, 45) 0,018 43,3 25 (50, 50, 40) 0,020 46,7
12 (45, 40, 50) 0,030 45 26 (50, 50, 45) 0,075 48,3
13 (45, 45, 40) 0,018 43,3 27 (50, 50, 50) 0,125 50
14 (45, 45, 45) 0,027 45
Piana, Machado e Selau Inferncia Estatstica


128
Comparando o histograma da populao X com os histogramas da mdia X para as
amostras de tamanhos n = 2 e n = 3, observamos que, mesmo a distribuio da populao no
sendo simtrica, a distribuio amostral da mdia se aproxima da simetria medida que o
tamanho da amostra cresce. Podemos observar tambm que, conforme n vai aumentando, o
histograma tende a se concentrar cada vez mais em torno de E(X) = E( X ) = 46,5 e os valores
extremos passam a ter pequena probabilidade de ocorrncia.


Populao Mdia das amostras de tamanho 2 Mdia das amostras de tamanho 3


A tendncia para a simetria e consequente aproximao para a normal pode ser
verificada nos grficos da figura 4.1, que mostram o comportamento do histograma para vrias
formas de distribuio da populao e vrios tamanhos da amostra.


Figura 4.1. Histogramas correspondentes s distribuies amostrais de X para amostras
extradas de algumas populaes.
Fonte: Bussab e Morettin, 2006.
Piana, Machado e Selau Inferncia Estatstica


129
Assim, para a pergunta qual a distribuio da mdia ( X )? existem duas respostas
diferentes:

1. Se a populao (X) de onde foi extrada a amostra aleatria tiver distribuio
normal, a distribuio amostral da mdia ( X ) ser normal. Pode-se dizer que:



2. Se a populao (X) de onde foi extrada a amostra aleatria no tiver distribuio
normal, a distribuio amostral da mdia ( X ) se aproximar da normal medida que o
tamanho da amostra (n) cresce. Por exemplo, o nmero de insetos mortos na aplicao de um
inseticida uma varivel que tem distribuio discreta, mas a distribuio do nmero mdio de
insetos mortos com a aplicao pode ser normal dependendo do tamanho da amostra.

Este resultado pode ser derivado do teorema fundamental da estatstica paramtrica,
denominado Teorema Central do Limite (TCL).

Teorema Central do Limite: Se (X
1
, X
2
, ..., X
n
) uma amostra aleatria de X, ento
a distribuio da soma de X (
+
=
i
X X ) se aproxima da distribuio normal com mdia n e
varincia n
2
. Assim, para n suficientemente grande, temos:

( ) ~
+

=

2
x
X n
Z N 0,1
n
.

Como consequncia, a distribuio da mdia ( X ) se aproxima da normal com mdia
e varincia
2
/n. Assim, temos:

( )
( ) ~
+


= = =

2
x
x
x
n X
X n X
Z N 0,1
n
n
.

A demonstrao completa desse teorema no ser dada porque exigiria recursos dos
quais no dispomos, mas o importante sabermos como esse resultado pode ser usado.
A importncia da distribuio normal na estatstica se deve em grande parte a este
teorema. Observemos que se a populao tem distribuio normal, ento X ter distribuio
normal exata. Se a populao no tem distribuio normal, X poder ter distribuio normal
aproximada ou assinttica.
O TCL afirma que X aproxima-se de uma normal quando n tende para o infinito e a
rapidez dessa convergncia depende da distribuio da populao da qual a amostra retirada
(Figura 4.1). Se a populao tem uma distribuio prxima da normal, a convergncia rpida;
mas se esta populao se afasta muito da normal, a convergncia mais lenta, implicando
numa amostra maior para que X tenha uma distribuio aproximadamente normal. Para a
ordem de 30 a 50 elementos a aproximao pode ser considerada satisfatria.
Distribuies importantes como Binomial e Poisson (definidas como a soma de
variveis Bernoulli) se aproximam naturalmente da normal. Se a distribuio Binomial
simtrica (=0,5), a aproximao (ou convergncia) mais rpida.
As mdias so iguais,
mas a varincia de
X n vezes menor.
se X ~ N (,
2
),

ento, X ~ N (,
2
/n).
Piana, Machado e Selau Inferncia Estatstica


130
Combinao linear de variveis

Seja [X
1
, X
2
, ..., X
n
] uma amostra aleatria e seja c
1
, c
2
, ... , c
n
um conjunto de
constantes, ento,
= + + +
1 1 2 2 n n
Y c X c X c X

uma combinao linear de variveis.

Sendo Y funo de uma varivel aleatria, tambm ser uma varivel aleatria e,
como consequncia, ter uma distribuio de probabilidade, com valor esperado e varincia.
Se Y for a combinao linear de variveis que tm distribuio normal, ou seja, X
i
~ N (,
2
),
ento, a distribuio de Y tambm ser normal, com os seguintes parmetros:

Valor esperado
= + ++
= + ++
= + ++
1 1 2 2 n n
1 1 2 2 n n
1 1 2 2 n n
E(Y) E(c X c X c X )
E(c X ) E(c X ) E(c X )
c E(X ) c E(X ) c E(X )

Como E(X
i
) = , temos
n
1 2 n i
i=1
E(Y) c c c c = + ++ =



Varincia
= + ++
1 1 2 2 n n
V(Y) V(c X c X c X )

Como os X
is
so todos independentes entre si, temos

= + ++
= + ++
1 1 2 2 n n
2 2 2
1 1 2 2 n n
V(Y) V(c X ) V(c X ) V(c X )
c V(X ) c V(X ) c V(X )


Como V(X
i
) =
2
, temos
n
2 2 2 2 2 2 2 2
1 2 n i
i=1
V(Y) c +c c c = ++ =



Verificamos, assim, que se Y a combinao linear de um conjunto de variveis que
tm distribuio normal, ento Y ~ N (

n
i
i=1
c ,

n
2 2
i
i=1
c ).


4.3.1. Distribuies amostrais de algumas estatsticas importantes

Nesta seo sero apresentadas com mais detalhe as distribuies de probabilidade
das estatsticas mais utilizadas nos processos de inferncia.

Distribuio qui-quadrado (
2
)

Seja uma varivel aleatria X ~ N (,
2
) e [X
1
, X
2
, ..., X
n
] uma amostra aleatria dela
proveniente. Assim,
X
i
~ N (,
2
).

Padronizando, ou seja, transformando X
i
em Z
i
, temos

i
i
X
Z ~ N (0, 1), sendo - < z
i
<+.
Piana, Machado e Selau Inferncia Estatstica


131
Seja Q uma nova varivel definida como a soma dos quadrados de variveis Z
independentes. Ento, dizemos que a varivel Q tem distribuio qui-quadrado, denotada por

2
, com parmetro , ou seja,

...

= = + + +

2 2 2 2
i 1 2
i=1
Q Z Z Z Z ~
2
(),

onde: = nmero de graus de liberdade ou variveis independentes somadas.

A funo densidade de probabilidade da distribuio
2
dada por

=
| |

|
\
q
1
2 2
2
1
f(q) e q
2
2
, com 0 q < +.

Sendo a varivel Q definida como uma soma de quadrados, seus valores nunca sero
negativos. A curva da distribuio
2
, representao grfica da funo densidade de
probabilidade, muda o seu formato medida que varia o nmero de graus de liberdade.

Exemplos:





A distribuio
2
tem mdia = e varincia
2
= 2.
Piana, Machado e Selau Inferncia Estatstica


132
Uma varivel importante na determinao de intervalos de confiana e testes de
hipteses a respeito da varincia da populao (
2
) tem distribuio
2
e assim definida

2
2
(n 1)S
Q ~
2
(), onde = n 1.

Esta varivel surge da seguinte situao: seja a varivel X ~ N (,
2
) e [X
1
, X
2
, ..., X
n
]
uma amostra aleatria dela proveniente. A varincia desta amostra ser

( )

2
i
2
X X
S
n 1
ou
( )
2
2
i
(n 1)S X X =

.

Dividindo os dois termos por uma constante de interesse (
2
), no alteramos a
igualdade. Assim, temos
( )

2
2
i
2 2
X X
(n 1)S


Somando e subtraindo outra constante de interesse (), resolvendo o binmio e
aplicando as propriedades da soma, temos

| | +
| |
= = = =
|
|
|
\
\





2
2 2 2 2
2 2
i i i
i
2 2 2 2 2
(X X) (X X ) (X )
X (n 1)S n(X ) X
n


Fazendo

i
i
X
Z e

X
Z
n
, temos

... ~
| |
= = + + + =
|
\


2
2 2 2 2 2 i
i 1 2 n n
X
Z Z Z Z Q (n)
e
~
| |

= =
|
|
\

2
2 2
1
X
Z Q (1)
n
,
ento,
( )
n 1
2
2
i
2 2
X X
(n 1)S
Q Q

= =

,
donde resulta

~
1
2 2 2 2 2
n 1 1 2 n (n )
Q Q (Z Z Z ) Z Q (n 1)

= + ++ = .


Outros exemplos de variveis com distribuio
2
de ocorrncia comum nos testes de
hipteses envolvendo dados de enumerao so:

( )
~
=

2
k
i i 2
i 1 i
X E
Q ( )
E
, onde = k 1

( )
~
2
r s
ij ij
2
i 1 j 1 ij
X E
Q ( )
E
= =

, onde = (r1)(s1)
Piana, Machado e Selau Inferncia Estatstica


133
Distribuio t de Student

Seja uma varivel Z, com distribuio normal padro, e uma varivel Q, com
distribuio
2
independentes, ento, dizemos que uma varivel T definida como:

Z
T
Q
=



tem distribuio t de Student com parmetro .


Nesse contexto, uma varivel Z com distribuio normal padro e uma varivel Q com
distribuio
2
nas quais temos grande interesse nas aplicaes so:

~

X
Z N(0, 1)
n

e
~
2
2
2
(n 1)S
Q ( )

, onde = n 1.

Ento,
2
2
2
2
(n 1)S
Q Q S
n 1 n 1

= = =


,

donde resulta

= = = =


2
2
X X
Z X n n
T
S
Q S n
S


Assim, temos ~
X
T t( )
S n

=

, onde = n 1

De uma maneira geral, uma varivel com distribuio t muito parecida com uma
normal padro, exceto que o desvio padro, que aparece no denominador, o desvio padro
amostral e no o populacional.

A funo densidade de probabilidade da distribuio t de Student com graus de
liberdade dada por

+ | |
| |
|
+ \
|
\

1
2
2
1 1
f(t) =
1
,
t
2 2 1
, com - < t < +.

Podemos observar, nos exemplos a seguir, que a curva da distribuio t de Student,
representao grfica da funo densidade de probabilidade, muda o seu formato medida
que varia o valor de .



Piana, Machado e Selau Inferncia Estatstica


134
Exemplos:





A distribuio t de Student tem mdia = 0 e varincia =

2
2
.

A varivel ~

=


X
T t( )
S n
importante na determinao de intervalos de confiana e
testes de hipteses a respeito da mdia da populao ().

De uma maneira geral, a razo

E( )
T
S( )
tem distribuio t, sendo

uma
combinao linear de variveis normais e

E( ) o seu valor esperado.



Por exemplo,

= +
1 1 2 2
c X c X , onde =
1
c 1e =
2
c 1,

ento,
=
1 2
e
( )

=
1 2
S( ) S X X ,
resultando que

( ) ( )
( )
~

=

1 2 1 2
1 2
X X
T t( )
S X X
.
Piana, Machado e Selau Inferncia Estatstica


135
Distribuio F de Snedecor

Sejam duas variveis Q
1
e Q
2
com distribuio
2
independentes, ento, dizemos que
uma varivel F definida como:
1
1
2
2
Q
F
Q
=

,
tem distribuio F, com parmetros
1
e
2
.

A varivel F definida como a razo entre duas variveis que tm distribuio
2
.
Vimos que uma varivel com esta distribuio nunca assume valores negativos, portanto, os
valores da varivel F tambm no podero ser negativos.

A funo densidade de probabilidade da distribuio F dada por


+
| |
=
|
| |
\
| |
|
+
\
|
\

1 1
1 2
1
2 2
1
1 2 2
2
1
2
1 f
g(f)
,
2 2 1 f
, com 0 f < +.

O grfico desta funo muda o seu formato medida que os valores de
1
e
2
se
alteram.

Exemplos:


Piana, Machado e Selau Inferncia Estatstica


136
Outra varivel comumente utilizada na determinao de intervalos de confiana e
testes de hipteses a respeito da varincia da populao (
2
) tem distribuio F e surge da
seguinte situao: sejam as variveis aleatrias
2
1 1 1
X ( , ) e
2
2 2 2
X ( , ) e (
1
11 12 1n
X , X ,, X
e (
2
21 22 2n
X , X ,, X amostras aleatrias delas provenientes. As respectivas varincias dessas
amostras sero
( )

2
1i 1
2
1
1
X X
S
n 1
e
( )

2
2i 2
2
2
2
X X
S
n 1


Podemos reescrever as expresses da seguinte forma

( )
~

= =

2
2
1i 1
2 1 1
1 1
2 2
1 1
X X
(n 1)S
Q (n 1)
e
( )
~

= =

2
2
2i 2
2 2 2
2 2
2 2
2 2
X X
(n 1)S
Q (n 1) .

Se
~ =

1
1
1 2
2
2
Q
F F( , )
Q
,
onde:

= =


2
1 1
2 2
1 1 1
2
1 1 1
(n 1)S
Q S
n 1

e

= =


2
2 2
2 2
2 2 2
2
2 2 2
(n 1)S
Q S
n 1
,

ento, temos
~ = =


2
1 1
2
1 1
1 2
2
2
2
2
2
2
S Q
F F( , )
Q
S
.

No caso de as varincias populacionais serem iguais, ou seja, = =
2 2 2
1 2
, temos

~ = =

1
2
1 1
1 2
2
2
2
2
Q
S
F F( , )
Q
S
,
onde:
1 1
n 1 = ;
2 2
n 1 = .
Piana, Machado e Selau Inferncia Estatstica


137
4.4. Estimao de parmetros

4.4.1. Conceitos fundamentais

de fundamental importncia a compreenso e o domnio de alguns termos que sero
usados com bastante frequncia nos tpicos que seguem. Veremos, a seguir, os conceitos de
parmetro, estimador e estimativa.

Os parmetros so valores (medidas) calculados diretamente da populao e servem
para caracteriz-la. Os parmetros geralmente so valores desconhecidos, sempre so
constantes, e so representados, genericamente, pela letra grega teta (). So exemplos de
parmetros: a mdia da populao () e a varincia da populao (
2
).

Os estimadores so valores (medidas) calculados em uma amostra com objetivo de
obter informao sobre os parmetros e sobre a prpria populao. Todos os estimadores so
estatsticas, uma vez que so valores amostrais. Sendo estatsticas, so tambm variveis
aleatrias, pois podem assumir diferentes valores dependendo da amostra. Os estimadores
so representados, genericamente, pela letra teta com um acento circunflexo (

), onde se l
teta chapu. Dentre os exemplos de estimadores podemos citar a mdia da amostra ( X ) e a
varincia da amostra (S
2
).



Sendo o estimador uma varivel que pode assumir diferentes valores, chamamos de
estimativa um valor particular que o estimador assume.

Consideremos como exemplo a seguinte populao constituda por quatro valores
(N = 4):

X = x 1 2 3 4
P(X=x) 0,2 0,3 0,3 0,2

onde: = 2,5 e
2
= 1,05.

Desta populao, retiramos uma amostra aleatria de tamanho dois (n = 2), [X
1
, X
2
].

Assim, podemos calcular o nmero de diferentes amostras de tamanho dois que
podem ser extradas desta populao de tamanho quatro:

k = N
n
= 4
2
= 16 amostras.

Sendo possvel obter 16 amostras diferentes, para cada um dos parmetros, e
2
,
ser possvel obter 16 estimativas. Na tabela a seguir temos todas as possveis estimativas de
cada um desses parmetros.
Piana, Machado e Selau Inferncia Estatstica


138
Parmetro = 2,5
2
= 1,05
Estimador =
i
X
X
n

2
i 2
(X X)
n 1
S
Amostra 1: (1, 1)
+
= =
1
1 1
x 1
2

+
= =

2 2
2
1
(1 1) (1 1)
0
2 1
s
Amostra 2: (1, 2)
+
= =
2
1 2
x 1,5
2

+
= =

2 2
2
2
(1 1,5) (2 1,5)
0,5
2 1
s
Amostra 3: (1, 3) =
3
x 2
=
2
3
2 s
Amostra 4: (1, 4) =
4
x 2,5
=
2
4
4,5 s
Amostra 5: (2, 1) =
5
x 1,5
=
2
5
0,5 s
Amostra 6: (2, 2) =
6
x 2
=
2
6
0 s
Amostra 7: (2, 3) =
7
x 2,5
=
2
7
0,5 s
Amostra 8: (2, 4) =
8
x 3
=
2
8
2 s
Amostra 9: (3, 1) =
9
x 2
=
2
9
2 s
Amostra 10: (3, 2) =
10
x 2,5
=
2
10
0,5 s
Amostra 11: (3, 3) =
11
x 3
=
2
11
0 s
Amostra 12: (3, 4) =
12
x 3,5
=
2
12
0,5 s
Amostra 13: (4, 1) =
13
x 2,5
=
2
13
4,5 s
Amostra 14: (4, 2) =
14
x 3
=
2
14
2 s
Amostra 15: (4, 3) =
15
x 3,5
=
2
15
0,5 s
Estimativas
Amostra 16: (4, 4) =
16
x 4
=
2
16
0 s

Devemos considerar tambm que podem existir vrios estimadores para um mesmo
parmetro. Por exemplo, a mdia aritmtica simples ( X ) e a mdia aritmtica ponderada (
p
X ),
calculadas na amostra, bem como qualquer elemento em particular de uma amostra aleatria
(
i
X ), so todos estimadores da mdia populacional ().

i
i i
p
i
i
X
X
n
Xp
X
p
X

=
`

estimadores de

Da mesma forma, as varincias
2
S (com denominador n 1) e
2
n
S (com denominador
n), calculadas na amostra, so dois estimadores da varincia populacional (
2
).

=


`


=

)

2
i 2
2
i 2
n
(X X)
n 1
(X X)
n
S
S
estimadores de
2


Para escolher o melhor dentre todos os estimadores de um mesmo parmetro,
devemos optar pelo que tem melhores propriedades.
Piana, Machado e Selau Inferncia Estatstica


139
4.4.2. Propriedades dos estimadores

Imparcialidade ou no tendenciosidade

Um estimador

um estimador imparcial do parmetro se o valor esperado de


for igual a .

= E( )
Exemplos:
X um estimador imparcial de , pois E( X ) = .
p
X um estimador imparcial de , pois E(
p
X ) = .
1
X um estimador imparcial de , pois E(
1
X ) = .
2
S um estimador imparcial de
2
, pois E(
2
S ) =
2
.
2
n
S no um estimador imparcial de
2
, pois E(
2
n
S ) =
1 n
n

2


Eficincia ou varincia mnima

Se dois ou mais estimadores de um mesmo parmetro so imparciais, mais eficiente
aquele que possui a menor varincia.

Exemplo: Dentre todos os estimadores imparciais de ( X ,
p
X e
1
X ), a mdia simples
( X ) o mais eficiente porque tem a menor varincia.

Demonstrao: Considere uma amostra de tamanho n = 3 | |
1 2 3
X , X , X

Mdia simples ( X ) Mdia ponderada (
p
X )


( )
( ) ( )
( ) ( )
( ) ( ) ( ) ( )
( ) ( )
( )
+ +
= = + +
(
= + +
(

( = + +

( = + +

=
= =


1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
2 2 2
2
2
X X X 1
X X X X
3 3
1
V X V X X X
3
1
V X V X X X
9
1
V X V X V X V X
9
1
V X + +
9
3
V X 0,33
9

( )
( ) ( )
( ) ( )
( ) ( ) ( ) ( )
( ) ( )
( )
+ +
= = + +
(
= + +
(

( = + +

( = + +

= + +
= =


1 2 3
p 1 2 3
p 1 2 3
p 1 2 3
p 1 2 3
2 2 2
p
2
2
p
1X 2X 1X 1
X X 2X X
4 4
1
V X V X 2X X
4
1
V X V X 2X X
16
1
V X V X 4V X V X
16
1
V X 4
16
6
V X 0,38
16


Comparando as varincias dos trs estimadores: = < = < =
2 2 2
p 1
V(X) 0,33 V(X ) 0,38 V(X ) ,
verificamos que a mdia aritmtica simples tem a menor variao, portanto, o estimador mais
eficiente.

Consistncia

Um estimador consistente se medida que o tamanho da amostra aumenta o valor
do estimador se aproxima do parmetro.

n N

Piana, Machado e Selau Inferncia Estatstica


140
Exemplo:
2
n
S um estimador consistente de
2
.

Com base nessa propriedade, podemos concluir que:
Se a amostra for pequena, devemos utilizar
2
S para estimar
2
.

Se a amostra for grande, podemos utilizar
2
S ou
2
n
S para estimar
2
.


4.4.3. Processos de estimao

Um parmetro pode ser estimado de duas formas: por ponto ou por intervalo.

Estimao por ponto

o processo atravs do qual obtemos um nico ponto, ou seja, um nico valor para
estimar o parmetro.

Exemplo: Amostra (1, 3, 2)

+ +
= = =
i
x
1 3 2
x 2
n 3
estimativa pontual ou por ponto de

+ +
= = =

2
2 2 2
i 2
(x x)
(1 2) (3 2) (2 2)
1
n 1 3 1
s estimativa pontual ou por ponto de
2


Estimao por intervalo

um processo que permite obter um intervalo onde, com uma determinada
probabilidade (nvel de confiana), podemos esperar encontrar o verdadeiro valor do
parmetro.
LI < < LS

As estimativas por intervalo so preferveis s estimativas por ponto porque indicam a
preciso, ou seja, sabemos a probabilidade de o intervalo conter o parmetro.



4.4.3.1. Intervalos de confiana para a mdia

Intervalo de confiana para a mdia de uma populao ()

Para a construo do intervalo de confiana devemos levar em conta se conhecemos
a varincia populacional. Sendo assim, duas situaes sero consideradas:


Situao 1. Quando a varincia da populao (
2
) conhecida

Considere que desejamos estimar a mdia de uma populao X.

Para determinar o intervalo de confiana (IC) para , utilizamos o estimador X que,
como j foi demonstrado, o melhor estimador de .

De acordo com o TCL, se X ~ N (,
2
), ento, X ~ N (,

2
n
).
Piana, Machado e Selau Inferncia Estatstica


141
Padronizando a varivel X , temos

= = = =


2
X
X X X X
Z
V(X)
n
n
,

sendo que Z tem distribuio normal com mdia igual a zero e varincia igual a um, ou seja,

X
Z
n
~ N (0, 1)

De acordo com a figura abaixo, vemos que 1 a probabilidade de que a varivel Z
assuma um valor entre -z
/2
e z
/2
e a probabilidade de Z no estar entre -z
/2
e z
/2
.

Da, temos
P(-z
/2
< Z < z
/2
) = 1

O valor denominado nvel de significncia ou taxa de erro (usualmente com valor
0,05 ou 0,01), enquanto o valor 1 representa o nvel de confiana do intervalo.

Sabendo que

X
Z
n
e fazendo a substituio, temos
P(-z
/2
<

X
n
< z
/2
) = 1 .

Como o objetivo construir um intervalo de confiana para a mdia da populao,
devemos isolar na expresso. Podemos alcanar este objetivo manipulando a expresso:

P(-z
/2
<

X
n
< z
/2
) = 1
P(-z
/2

n
< X < z
/2

n
) = 1
P(- X -z
/2

n
< < - X + z
/2

n
) = 1
P[(- X -z
/2

n
< < - X + z
/2

n
) (-1)] = 1
P( X +z
/2

n
> > X -z
/2

n
) = 1
Piana, Machado e Selau Inferncia Estatstica


142
Da resulta a expresso do intervalo de confiana para a mdia de uma populao:

P( X -z
/2

n
< < X +z
/2

n
) = 1

Este intervalo de confiana tambm pode ser expresso da seguinte forma:

IC (; 1 ): X z
/2

n

onde:
X : o estimador de ;
z
/2
: o valor da varivel Z que delimita a rea /2 (Tabela I do Apndice);
n: o tamanho da amostra;
: desvio padro da populao (parmetro).

importante salientar que um parmetro (constante) e os limites do intervalo
que so aleatrios. Assim, a interpretao do intervalo ao nvel de 95% de confiana, por
exemplo, deve ser da seguinte maneira: se pudssemos construir uma quantidade grande de
intervalos, todos baseados em amostras de tamanho n, 95% deles conteriam o parmetro ,
como ilustra a figura abaixo.





Observemos que, escolhida uma amostra e encontrada sua mdia
0
x , podemos
construir o intervalo
0 /2 0 /2
x z ; x z
n n

| |
+
|
\

, mas este intervalo pode ou no conter o
parmetro . A probabilidade de que contenha o parmetro 1.
Piana, Machado e Selau Inferncia Estatstica


143
Podemos verificar tambm que todos os intervalos com mesmo nvel de confiana tm
a mesma amplitude:
/2
2z
n


.
Na maioria dos casos no conhecemos, de fato, o parmetro , pois no estudamos a
populao inteira. Entretanto, com base na propriedade de consistncia dos estimadores,
quando a amostra tem tamanho grande, a estimativa de um parmetro considerada
suficientemente prxima do parmetro. Assim, quando trabalhamos com grandes amostras a
estimativa de , que s (desvio padro da amostra), pode ser usada no lugar do parmetro.
Consideramos a amostra suficientemente grande para utilizar a varivel Z quando n maior
que 30.

Duas pressuposies devem ser atendidas para a utilizao desta metodologia:
1. A varivel em estudo tem distribuio normal, X ~ N (,
2
).
2. A varincia populacional conhecida ou o tamanho da amostra suficientemente
grande para obteno de uma estimativa aproximada da variao populacional ().


Consideremos o seguinte o exemplo resolvido.

Uma amostra de 100 terneiros de dois meses de idade da raa Ibag apresentou peso
mdio de 65,5kg e desvio padro de 4,8kg. Obtenha o intervalo de confiana, ao nvel de 95%,
para o verdadeiro peso mdio de terneiros e redija a concluso.

Varivel em estudo: X = peso de terneiros (kg)

Pressuposies: 1. A varivel em estudo tem distribuio normal.
2. A amostra tem tamanho suficiente para estimar .

Estimativas:
x = 65,5 kg
s = 4,8 kg
n = 100 terneiros

z
/2
= z
0,025
= 1,96
IC (; 1 ): X z
/2

n

IC (; 0,95): 65,5 1,96
4,8
100

IC (; 0,95): 65,5 0,941
Limite inferior = 65,5 0,941 = 64,56
Limite superior = 65,5 + 0,941 = 66,44

P(64,56 < < 66,44) = 0,95

Conclumos que o intervalo de confiana, ao nvel de 95%, para o verdadeiro peso
mdio de terneiros de dois meses de idade da raa Ibag de 64,56 a 66,44 kg.


Situao 2. Quando a varincia da populao (
2
) desconhecida

Quando a amostra pequena, no podemos supor que o desvio padro da amostra
(s) seja uma estimativa suficientemente aproximada do parmetro . Como no conhecemos a
varincia populacional, no podemos utilizar a varivel Z, que tem distribuio normal padro,
para construir o intervalo de confiana para .
Piana, Machado e Selau Inferncia Estatstica


144
Nesse caso, em vez de Z, utilizamos a estatstica T que no tem distribuio normal e
sim distribuio t de Student, com parmetro :

=
X
T
S
n
~ t (),
onde:
X : a mdia da amostra (estimador de );
S: o desvio padro da amostra (estimador de );
n: tamanho da amostra;
= n 1: o nmero de graus de liberdade associado varincia da amostra S
2
.

Sob o ponto de vista das aplicaes, podemos definir a estatstica T de uma forma
mais genrica:
( )

= T
S
~ t (),
onde:
: o parmetro que est sendo estimado;

: o estimador do parmetro;
S(

): o estimador do desvio (ou erro) padro de

.


Distribuio t

Em 1908, o pesquisador ingls William Gosset, ao tentar resolver problemas relativos
a pequenas amostras, descobriu a distribuio t.



William Gosset
(1876 - 1937)


Gosset trabalhava, na poca, numa cervejaria na Irlanda
e estava ciente de que seus empregadores no queriam
que funcionrios publicassem o que quer que fosse, com
receio de que segredos industriais cassem no domnio
pblico e, principalmente, nas mos da concorrncia.
Por isso Gosset ao descobrir uma nova distribuio de
probabilidades (distribuio t), publicou seus trabalhos
sob o pseudnimo de Student.

A distribuio t tem formato de campnula, simtrica em torno da mdia ( = 0) que
est localizada no centro da distribuio e varia de - a +. Sua curva se assemelha da
distribuio normal padro, sendo um pouco mais achatada no centro.

Como o parmetro da distribuio t o nmero de graus de liberdade ( = n -1), o
formato da curva se altera toda vez que muda o tamanho da amostra (n).

A distribuio t se aproxima da normal padro medida que o n cresce. Isto ocorre
porque quando o tamanho da amostra se aproxima do tamanho da populao (n N), o
estimador S se aproxima do parmetro (S ) e, consequentemente, a estatstica T se
aproxima da varivel Z (T Z).

Piana, Machado e Selau Inferncia Estatstica


145
Na prtica, com 30 graus de liberdade a distribuio t aproximadamente igual
distribuio normal padro e com 120 graus de liberdade exatamente igual, ou seja, as
curvas se sobrepem. Por essa razo, o tamanho 30 adotado como referncia para
considerarmos uma amostra grande ou pequena. Quando n menor ou igual a 30, a amostra
considerada pequena para utilizarmos a varivel Z, devemos, portanto, utilizar a distribuio t
para construir o intervalo.

Como j foi visto para a varivel Z, na figura a seguir podemos observar que 1 a
probabilidade de que a varivel T assuma um valor entre -t
/2
e t
/2
e a probabilidade de T
no estar entre -t
/2
e t
/2
.


Da, temos
P(-t
/2
< T < t
/2
) = 1.

Sabendo que

=
X
T
S
n
e fazendo a substituio, temos
P(-t
/2
<
X
S
n
< t
/2
) = 1.

Isolando o parmetro na expresso, temos

P(-t
/2
<
X
S
n
< t
/2
) = 1
P(-t
/2

S
n
< X < t
/2
S
n
) = 1
P(- X -t
/2

S
n
< < - X + t
/2
S
n
) = 1
P[(- X -t
/2

S
n
< < - X + t
/2
S
n
) (-1)] = 1
P( X +t
/2

S
n
> > X -t
/2
S
n
) = 1
P( X -t
/2
S
n
< < X +t
/2
S
n
) = 1
donde resulta
IC (;1): X t
/2
S
n
,
sendo t
/2
o valor da estatstica T que delimita a rea /2. Este valor encontrado na tabela da
distribuio t de Student (Tabela II do Apndice), a partir dos valores de e de .
Piana, Machado e Selau Inferncia Estatstica


146
Generalizando a expresso, temos

IC ( ; 1):

t
/2
S(

).

Assim, para o caso particular de = , temos:

= X e S(

) = S( X ) =
S
n
.

Para a utilizao desta metodologia a seguinte pressuposio deve ser atendida:

A varivel em estudo tem distribuio normal: X ~ N (,
2
).

Devido aproximao com a distribuio normal padro a partir de =30, a estatstica
T, que tem distribuio t de Student, poder ser utilizada para construir intervalos de confiana
para a mdia, tambm quando a amostra for grande.


Consideremos o seguinte exemplo resolvido.

Atravs da amostra de tamanho 15 que segue, procura-se estimar a verdadeira
potncia mdia de aparelhos eletrnicos de alta sensibilidade medida em microwatts:

26,7; 25,8; 24,0; 24,9; 26,4; 25,9; 24,4; 21,7; 24,1; 25,9; 27,3; 26,9; 27,3; 24,8; 23,6.

Resoluo:

Varivel em estudo: X = potncia de aparelhos eletrnicos de alta sensibilidade (w)
Pressuposio: A varivel em estudo tem distribuio normal.

Obteno das estimativas:

+ ++
= =
26,7 25,8 23,6
x 25,31
15
w
+ ++
= =

2 2 2
2
(26,7 25,31) (25,8 25,31) (23,6 25,31)
2,493
15 1
s w
2

= = s 2,493 1,579 w

Sendo = , temos

= = X 25,31

= = = =
S 1,579
S() S(X) 0,4076
n 15

= n 1 = 15 1 = 14
t
/2()
= 2,145

IC ( ; 1):

t
/2
S(

)
IC (; 0,95): 25,31 2,145 0,4076
IC (; 0,95): 25,31 0,874
Limite inferior = 25,31 0,874 = 24,44
Limite superior = 25,31 + 0,874 = 26,18

P(24,44 < < 26,18) = 0,95

Conclumos que a probabilidade de o intervalo de 24,44w a 26,18w conter a
verdadeira potncia mdia de aparelhos eletrnicos de alta sensibilidade de 0,95.
Piana, Machado e Selau Inferncia Estatstica


147
Intervalo de confiana para diferena entre mdias de duas populaes (
1
-
2
)

Para utilizar a estatstica T no estudo de uma varivel X em duas populaes distintas,
trs pressuposies devem ser atendidas:

1. A varivel em estudo tem distribuio normal.
X ~ N (,
2
)
2. As varincias das populaes so iguais (
2
1
=
2
2
).
3. As amostras retiradas das populaes so independentes.



Atendidas as pressuposies, desejamos comparar as mdias das populaes,
estimando por intervalo, o parmetro
1 2
= . Utilizamos, ento, a varivel aleatria T.

T
S( )
~ t (),
onde:
1 2
=

=
1 2
X X

1 2
S( ) S(X X ) =
( ) ( )
1 2 1 2
n 1 n 1 n n 2 = + = +

Vejamos como se obtm a estimativa do desvio (ou erro) padro de

. Sendo

=
1 2
X X , o desvio padro

obtido extraindo a raiz quadrada da varincia da diferena


entre as mdias, ou seja,

2
1 2 1 2
S( ) S(X X ) S (X X ) = = .

Como as variveis
1
X e
2
X so independentes, podemos utilizar a propriedade de que
a varincia da soma ou diferena de variveis igual soma das varincias dessas variveis.
Da, temos
=
2 2 2
1 2 1 2
S (X X ) S (X ) S (X ) .

Como a varincia da mdia =

2
V(X)
n
, ento, o estimador desta varincia ser
=
2
2
S
S (X)
n
. Como consequncia, temos
( ) ( )
= +
2 2
2 2 1 2
1 2
1 2
S S
S X +S X
n n
.
Piana, Machado e Selau Inferncia Estatstica


148
Sendo as varincias amostrais,
2
1
S e
2
2
S , estimativas da mesma varincia (
2
),
possvel combin-las atravs da mdia. Assim, em vez de duas estimativas (
2
1
S e
2
2
S ),
utilizamos
2
S que a mdia das varincias das amostras, ponderada pelos seus respectivos
graus de liberdade, ou seja,

( ) ( )
( ) ( )
+
=
+
2 2
1 1 2 2 2
1 2
S n 1 S n 1
S
n 1 n 1
.

Da resulta que

| |
+ = + = +
|
\
2 2 2 2
2 1 2
1 2 1 2 1 2
S S S S 1 1
S
n n n n n n
.

Assim, o estimador do erro padro de

dado por

2
1 2
1 2
1 1
S( ) S(X X ) S
n n
| |
= = +
|
\
, onde
( ) ( )
( ) ( )
+
=
+
2 2
1 1 2 2 2
1 2
S n 1 S n 1
S
n 1 n 1
.

Sabemos que, de modo geral, o intervalo de confiana para um parmetro assim
definido


/2
IC( ; 1 ) : t S( ) .

Para o caso particular de
1 2
= , temos

| |
= +
|
\

2
1 2 1 2 /2
1 2
1 1
IC( ; 1 ) X X t S
n n
.


Vejamos um exemplo resolvido.

Dez cobaias adultas criadas em laboratrio, foram separadas, aleatoriamente, em dois
grupos: um foi tratado com rao normalmente usada no laboratrio (padro) e o outro grupo
foi submetido a uma nova rao (experimental). As cobaias foram pesadas no incio e no final
do perodo de durao do experimento. Os ganhos de peso (em gramas) observados foram os
seguintes:

Rao padro 200 180 190 190 180
Rao experimental 220 200 210 220 210

Construa o intervalo de confiana, ao nvel de 99%, para a diferena entre as mdias
das duas populaes.

Resoluo:

Varivel em estudo: X = ganho de peso (g)
Pressuposies:

- A varivel em estudo tem distribuio aproximadamente normal, X ~ N (,
2
).
- As varincias das populaes so iguais ( = =
2 2 2
1 2
).
- As amostras retiradas das populaes so independentes.
Piana, Machado e Selau Inferncia Estatstica


149


Estimativas:

Amostra 1: n
1
= 5 = =
2
1 1
x 188 s 70
Amostra 2: n
2
= 5 = =
2
2 2
x 212 s 70

Sendo
1 2
= , temos:

= = =
1 2
X X 188 212 24

( ) ( )
( ) ( )
+ +
= = =
+ +
2 2
1 1 2 2 2
1 2
S n 1 S n 1 70 4 70 4
S 70
n 1 n 1 4 4

2
1 2
1 2
1 1 1 1
S( ) S(X X ) + S + 70 5,292
n n 5 5
| |
| |
= = = =
| |
\
\


( ) ( ) = + = + =
1 2
n 1 n 1 4 4 8

t
/2()
= 3,36


/2
IC( ; 1 ) : t S( )
IC (
1 2
; 0,99): -24 3,36 5,292
IC (
1 2
; 0,99): -24 17,78

Limite inferior = -24 - 17,78 = -41,78
Limite superior = -24 + 17,78 = -6,22

P(-41,78 <
1 2
< -6,22) = 0,99

Conclumos que a probabilidade de o intervalo de -41,78 a -6,22 conter a verdadeira
diferena entre o ganho de peso mdio da populao que recebeu rao padro e o ganho de
peso mdio da populao que recebeu a rao experimental de 0,99. Como o valor zero est
fora do intervalo podemos concluir que as mdias no so iguais.





Piana, Machado e Selau Inferncia Estatstica


150
4.4.3.2. Intervalo de confiana para a varincia de uma populao (
2
)

Sabemos que o estimador no-tendencioso de
2
S
2
. No entanto, para se construir
um intervalo de confiana para
2
necessrio ainda conhecer como este estimador S
2
se
comporta, ou seja, qual a sua distribuio de probabilidade. Considerando uma populao
com distribuio normal, com mdia e varincia
2
, e que desta populao seja selecionada
uma amostra aleatria de tamanho n, ento:

( )
~
n
2
i 2
2 i=1
2 2
X X
(n 1)S
Q ( )

= =

,

ou seja, a varincia da amostra (S
2
) uma varivel aleatria que tem distribuio
2
com
parmetro =n1 graus de liberdade. Assim, a distribuio
2
a base para inferncias a
respeito da varincia
2
.

De acordo com a figura abaixo, vemos que 1 a probabilidade de que a varivel Q
assuma um valor entre
/2
q

e
/2
q

e a probabilidade de Q no estar entre


/2
q

e
/2
q




Da, temos
P(
/2
q

< Q <
/2
q

) = 1.

Sendo

2
2
(n 1)S
Q , ao substituirmos Q na expresso acima, obtemos:
P(
/2
q

<

2
2
(n 1)S
<
/2
q

) = 1.

A manipulao algbrica desta desigualdade resulta no intervalo de confiana para
2
:

P
2 2
2
/2 /2
(n 1)S (n 1)S
q q

| |

< <
|

\
= 1.
onde:
S
2
o estimador da varincia populacional
2
;
n o tamanho da amostra;
= n1 o nmero de graus de liberdade associado varincia;
/2
q

o valor da distribuio qui-quadrado, com graus de liberdade, que delimita a


rea /2 esquerda (Tabela III do Apndice);
/2
q

o valor da distribuio qui-quadrado com graus de liberdade que delimita a


rea /2 direita (Tabela III do Apndice).
Piana, Machado e Selau Inferncia Estatstica


151
Assim, os limites do intervalo de confiana para a varincia populacional (
2
) so
dados por:
2 2
/2 /2
(n 1)S (n 1)S
;
q q

(

(


.

Para determinar um intervalo de confiana para o desvio padro populacional ()
basta tomar a raiz quadrada positiva dos limites do intervalo para a varincia populacional:

2 2
/2 /2
(n 1)S (n 1)S
;
q q

(

(

(




Consideremos um exemplo resolvido:

Uma das maneiras de manter sob controle a qualidade de um produto controlar sua
variabilidade. Uma mquina de encher garrafas de refrigerante est regulada para ench-las
conforme uma distribuio normal com mdia de 200ml. Colheu-se uma amostra de 11
garrafas e observou-se uma varincia de 8,38ml
2
. Construa o intervalo, ao nvel de 90% de
confiana, para a varincia populacional e um intervalo de mesma confiabilidade para o desvio
padro da populao.

Resoluo:

Devemos, inicialmente, determinar os valores da distribuio
2
com 10 graus de
liberdade, de modo que
/2
q

e
/2
q

tenham uma rea igual a 0,05 sua esquerda e sua


direita, respectivamente. Estes valores so:
/2( )
q

= 3,94 e
/2( )
q

= 18,31.

Assim, o intervalo de confiana para a varincia ser:

| |
, ,
2 2
/2 /2
(n 1)s (n 1)s (11 1) 8,38 (11 1) 8,38
; ; 4,58; 21,27
q q 18 31 3 94

(
(
= =
(
(



.


E o intervalo de confiana para o desvio padro ser:


| |
, ,
2 2
/2 /2
(n 1)s (n 1)s (11 1) 8,38 (11 1) 8,38
; ; 2,14; 4,61
q q 18 31 3 94

(
(

( = =
(

(


.

Conclumos, com uma confiana de 90%, que os intervalos 4,58 a 21,27 e 2,14 a 4,61
cobrem, respectivamente, a verdadeira varincia e o verdadeiro desvio padro da populao.


4.4.3.3. Intervalo de confiana para a proporo de uma populao ()

Se o objetivo estimar a proporo populacional (), atravs de uma amostra
aleatria desta populao, utilizamos como estimador a proporo da amostra (P).

Piana, Machado e Selau Inferncia Estatstica


152
De acordo com o teorema central do limite, quando np>5 e n(1-p)>5, a distribuio
amostral de P se aproxima da distribuio normal com mdia
P
= e desvio padro
P
(1 )
n

=

.

Deste modo, podemos utilizar a distribuio normal para construir o intervalo de
confiana para a proporo populacional. Lembramos que 1 a probabilidade de que a
varivel Z assuma um valor entre -z
/2
e z
/2
e a probabilidade de Z no estar entre -z
/2
e
z
/2
.


Assim, temos que:
P(-z
/2
< Z < z
/2
) = 1.


Como

= =



P
P
P P
Z
(1 )
n
, substitumos Z na expresso acima e obtemos:

P(-z
/2
<


P
(1 )
n
< z
/2
) = 1

A manipulao algbrica desta desigualdade resulta no intervalo de confiana para :

P(P - z
/2

(1 )
n
< < P +z
/2

(1 )
n
) = 1.

Como podemos verificar na expresso, o erro padro

P
(1 )
n
um valor
desconhecido, uma vez que no conhecemos . Entretanto, com base na propriedade de
consistncia dos estimadores, quando o tamanho da amostra grande, podemos considerar o
valor do estimador (P) suficientemente prximo do parmetro (), o que possibilita a
substituio de por P na expresso do intervalo de confiana. Assim, temos:

P(P - z
/2

P(1 P)
n
< < P + z
/2

P(1 P)
n
) = 1.
onde:
P o estimador da proporo populacional ;
n o tamanho da amostra e
z
/2
o valor da varivel Z que delimita a rea /2 (Tabela I do Apndice).
Piana, Machado e Selau Inferncia Estatstica


153
Vejamos um exemplo resolvido:

Foi realizada uma pesquisa de mercado para verificar a preferncia da populao de
em relao ao consumo de determinado produto. Para isso, foi colhida uma amostra de 300
consumidores, dos quais 180 disseram consumir o produto. Encontre o intervalo ao nvel de
99% de confiana para a proporo de consumidores do produto na populao.

Resoluo:

A estimativa por ponto para a proporo populacional ser: p = 180/300 = 0,60.

Como o nvel de confiana adotado de 99%, temos = 0,01. Assim, o valor de Z que
delimita a rea /2 = 0,005 direita 2,575.

Ento, o intervalo de confiana de 99% para a proporo populacional ser:


/2
P(1 P)
IC( ; 0,99) : P z
n
0,60(1 0,60)
IC( ; 0,99) : 0,60 2,575
300
IC( ; 0,99) : 0,60 2,575 0,0283
IC( ; 0,99) : 0,60 0,0728


Limite inferior = 0,60 0,0728 = 0,5272
Limite superior = 0,60 + 0,0728 = 0,6728

P(0,5272 < < 0,6728) = 0,99

Concluindo, pode-se afirmar, com uma confiana de 99%, que o intervalo de 0,53 a
0,67 contm a proporo populacional de consumidores que preferem o produto pesquisado.



Exerccios propostos:

4.1. Um engenheiro de desenvolvimento de um fabricante de pneus est investigando a vida do
pneu em relao a um novo componente de borracha. Ele fabricou 40 pneus e testou-os at o
fim da vida em um teste na estrada. A mdia e o desvio padro da amostra so 61.492 km e
6.085 km, respectivamente. O engenheiro acredita que a vida mdia desse novo pneu est em
excesso em relao a 60.000 km. Obtenha o intervalo de confiana, ao nvel de 95%, para a
vida mdia do pneu e conclua a respeito da suposio do engenheiro.


4.2. Um agrnomo realizou um levantamento para estudar o desenvolvimento de duas
espcies de rvores, a Bracatinga e a Canafstula. Para esta finalidade foram coletadas duas
amostras de tamanhos igual a 10 rvores. Os resultados para altura, em metros, esto
descritos abaixo para as duas amostras:

Bracatinga 6,5 6,9 6,9 8,6 8,7 8,2 10,0 10,3 13,4 14,4
Canafstula 9,3 10,1 11,4 15,2 17,2 14,8 15,9 20,6 21,9 23,8

Para verificar a hiptese de que as alturas das duas espcies so diferentes, o agrnomo
adotou o seguinte critrio. Construir os intervalos com 95% de confiana, para cada uma das
espcies. Se os intervalos se sobrepem (se interceptam) concluir que no h diferenas
significativas entre as duas alturas medias, caso contrrio, concluir que h diferenas entre as
mesmas. Baseado neste critrio qual a concluso do agrnomo?
Piana, Machado e Selau Inferncia Estatstica


154
4.3. Na fabricao de semicondutores o ataque qumico por via mida frequentemente usado
para remover silicone da parte posterior das pastilhas antes da metalizao. A taxa de ataque
uma caracterstica importante nesse processo e sabido que ela segue uma distribuio
normal. Duas solues diferentes para ataque qumico so comparadas, usando duas
amostras aleatrias de pastilhas. As taxas observadas de ataque (10-3 polegadas/min) so
dadas a seguir:

Soluo 1 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1
Soluo 2 10,2 10,6 10,7 10,4 10,5 10,0 10,7 10,4 10,3 -

Os dados justificam a afirmao de que a taxa mdia de ataque seja a mesma para as duas
solues? Considere que ambas as populaes tm varincias iguais, construa o intervalo de
confiana, ao nvel de 95%, para a diferena entre as mdias e conclua.


4.4. Considere os dados do exerccio 4.1. Construa um intervalo de 90% para a varincia da
vida do pneu. Depois converta esse intervalo apresentando-o em termos de desvio padro.


4.5. Uma amostra aleatria de 250 dispositivos eletrnicos apresentou 27 unidades
defeituosas. Estime a frao de no conformes e construa um intervalo de 95% de confiana
para o verdadeiro valor da frao de no conformes.

Piana, Machado e Selau Inferncia Estatstica


155
4.5. Testes de hipteses

O teste de hiptese um procedimento estatstico em que se busca verificar uma
hiptese a respeito da populao, no sentido de aceit-la ou rejeit-la, a partir de dados
amostrais, tendo por base a teoria das probabilidades.

Em geral, um problema cientfico (expresso na forma de pergunta) conduz a uma
hiptese cientfica (resposta provisria a esta pergunta) que requer uma pesquisa cientfica
para a sua verificao. O teste de hiptese um dos procedimentos mais utilizados na
pesquisa cientfica, sobretudo na pesquisa experimental.

De modo geral, podemos definir cinco passos para construo de um teste de
hipteses:

1. Definir as hipteses estatsticas.
2. Fixar a taxa de erro aceitvel.
3. Escolher a estatstica para testar a hiptese e verificar as pressuposies para o
seu uso.
4. Usar as observaes da amostra para calcular o valor da estatstica do teste.
5. Decidir sobre a hiptese testada e concluir.


4.5.1. Testes para a mdia populacional

Hipteses estatsticas

A hiptese estatstica uma suposio feita a respeito de um ou mais parmetros, tais
como, mdias de populaes (), varincias de populaes (
2
), etc. As hipteses estatsticas
surgem de problemas cientficos.

Existem dois tipos bsicos de hipteses estatsticas:

Hiptese de nulidade (H
0
): a hiptese que est sob verificao. Esta hiptese supe
a igualdade dos parmetros que esto sendo testados.

Hiptese alternativa (H
A
): a hiptese que ser considerada caso a hiptese de
nulidade seja rejeitada. Esta hiptese supe que os parmetros testados so diferentes.

Duas situaes so comuns em testes de hipteses a respeito da mdia da populao ():

1. Comparao de uma mdia () com um valor padro (
0
)

Nesta situao, temos uma populao da qual extrada uma amostra e a mdia
desta amostra comparada com um valor j conhecido (valor padro) que serve como
referncia.

: = =
0 0 0
H ou 0

> >
`

< <
)



A 0 0
0 0 A
0 0
H : ou 0 hiptese bilateral
ou 0 hiptese unilateral direita Devemos escolher a H mais apropriada
ou 0 hiptese unilateral esquerda

Piana, Machado e Selau Inferncia Estatstica


156
2. Comparao entre duas mdias (
1
e
2
)

Nesta situao, temos duas populaes, de cada uma extrada uma amostra, e as
mdias das duas amostras so comparadas.

: = =
0 1 2 1 2
H ou 0

> >
`

< <
)



A 1 2 1 2
1 2 1 2 A
1 2 1 2
H : ou 0 hiptese bilateral
ou 0 hiptese unilateral direita Devemos escolher a H mais apropriada
ou 0 hiptese unilateral esquerda

Consideremos o exemplo a seguir.

Vamos supor que nosso problema cientfico seja a pergunta As raas bovinas
Holandesa e Jersey diferem quanto produo de leite? e nossa hiptese cientfica seja a
afirmao A raa Holandesa produz mais leite que a raa Jersey. Esta hiptese pode ser
verificada de duas formas: pela avaliao das populaes inteiras de vacas das duas raas, ou
seja, todas as vacas das raas Holandesa e Jersey, ou por meio da avaliao de amostras que
sero retiradas dessas populaes. Obviamente, seria impossvel avaliar todas as vacas das
duas raas. E ainda que fosse possvel, sabemos que o processo de amostragem pode
fornecer preciso suficiente; portanto, ser muito mais econmico e menos trabalhoso utilizar
uma amostra.

Ao utilizarmos amostras, consideremos que temos duas populaes:

Populao 1 vacas da raa Holandesa
Populao 2 vacas da raa Jersey

Nestas populaes vamos estudar a varivel contnua X = produo de leite, supondo
que X ~ N (,
2
) e que =
2 2
1 2
, conforme figura abaixo


Assim nossos parmetros de interesse so:

E(X
1
) =
1
= produo mdia da populao 1
E(X
2
) =
2
= produo mdia da populao 2

Assim, devemos considerar as seguintes hipteses estatsticas.

=



0 1 2
A 1 2
H :
H :


Piana, Machado e Selau Inferncia Estatstica


157
Observemos que a hiptese alternativa no corresponde necessariamente
expectativa do pesquisador, ou seja, hiptese cientfica. A hiptese a ser testada em um teste
sempre a hiptese de igualdade entre os parmetros, enquanto a hiptese alternativa deve
ser definida pelo pesquisador, podendo ser bilateral ou unilateral. A escolha entre uma e outra,
entretanto, jamais deve ser feita com base nos dados da amostra, tampouco na expectativa do
pesquisador. A hiptese bilateral mais genrica e deve ser utilizada quando no temos
motivos suficientes para esperar que um dos parmetros seja maior ou menor que o outro.
Assim, supomos apenas que os parmetros sero diferentes, caso a hiptese de igualdade
seja rejeitada.

As situaes de aplicao da hiptese unilateral so mais restritas e nem sempre so
muito claras. A opo por uma hiptese unilateral exige que tenhamos mais informaes sobre
o comportamento da varivel de interesse na situao da pesquisa. Estudos anteriores, por
exemplo, podem prover evidncias que suportem uma hiptese unilateral.

A hiptese unilateral pode ser tambm uma decorrncia lgica da situao de
pesquisa, como, por exemplo, quando comparamos a mdia de um grupo tratado (que recebe
determinado tratamento) com a mdia de um grupo controle ou testemunha (que no recebe o
tratamento). Neste caso, se o tratamento no tem efeito, esperamos que as mdias dos dois
grupos sejam iguais; mas se o tratamento tem efeito significativo bastante razovel esperar
que a mdia do grupo tratado (que expressa este efeito) seja maior (e nunca menor do que a
mdia do grupo controle. Outra situao tpica da aplicao da hiptese unilateral ser
apresentada e discutida na seo 4.9.

Um teste de hiptese tambm pode ser classificado de acordo com o tipo de hiptese
alternativa que adota: se a hiptese alternativa bilateral, dizemos que o teste bilateral; se a
hiptese unilateral, o teste unilateral.


Erros de Concluso

J vimos que um elemento intrnseco ao processo de inferncia o erro. Num teste de
hipteses, devemos considerar que as hipteses estatsticas so estabelecidas a respeito de
valores populacionais (parmetros) e as concluses so obtidas a partir de dados amostrais
(estimativas), ou seja, baseamos nossas concluses em apenas uma parte da informao
(amostra) que, eventualmente, pode no representar o todo (populao), portanto, existe a
possibilidade de estarmos cometendo um erro de concluso. Como a hiptese sob verificao
H
0
, dois tipos de erro esto associados deciso a respeito dela, so eles:

Erro Tipo I: rejeitar H
0
quando ela verdadeira
= P(erro tipo I) probabilidade de cometer o erro tipo I

Erro Tipo II: no reijeitar H
0
quando ela falsa
= P(erro tipo II) probabilidade de cometer o erro tipo II

A tabela a seguir ilustra os dois tipos de erro.

Situao de H
0

Deciso
Verdadeira Falsa
No rejeitar Acerto Erro Tipo II
Rejeitar Erro Tipo I Acerto

Como consequncia, temos que: 1 a probabilidade de no cometer o erro tipo I,
ou seja, a capacidade de no rejeitar H
0
verdadeira, e 1 a probabilidade de no cometer
o erro tipo II, ou seja, a capacidade de rejeitar H
0
falsa. A probabilidade 1 denominada
Piana, Machado e Selau Inferncia Estatstica


158
poder do teste. Podemos dizer, ento, que o poder do teste a probabilidade de declarar
diferenas quando elas, de fato, existem. O poder de um teste est relacionado com os
seguintes fatores: tamanho da amostra, variabilidade da varivel e magnitude da diferena
existente entre as mdias.

importante ressaltar ainda que as duas taxas de erro ( e ) esto relacionadas
negativamente, de modo que a reduo de implica no aumento de e vice-versa. Para que
os testes de hipteses tenham validade, necessrio que sejam delineados de modo a
minimizar os erros de concluso. Entretanto, o nico meio de reduzir ambos os tipos de erro
aumentando o tamanho da amostra, o que nem sempre vivel. Na prtica, devemos definir
qual dos dois erros mais grave e, ento, minimiz-lo. Podemos adiantar, contudo, que, via de
regra, a preocupao est voltada para o erro tipo I, pois na maioria dos casos ele
considerado o mais grave. A probabilidade de ocorrncia do erro tipo I () chamada de nvel
de significncia do teste.


Estatstica do teste

Para testar hipteses a respeito do parmetro , utilizamos a varivel aleatria T,
( )

= T
S
.

Vejamos agora como o valor da varivel T obtido nas duas situaes mais comuns
de testes de hipteses a respeito de .

Situao 1. Comparao de uma mdia () com um valor padro (
0
).

Inicialmente, devemos lembrar que para compararmos uma mdia com um valor
padro utilizando a varivel aleatria T, a seguinte pressuposio deve ser verdadeira:

A varivel em estudo tem distribuio normal, ou seja, X ~ N (,
2
).

Neste caso, a hiptese estatstica sob verificao ser:

:
0 0
H = .

Sob
0
H verdadeira, a varivel aleatria
( )

= T
S
tem distribuio t com parmetro ,
onde:
0
= =

X =

= =
S
S( ) S(X)
n

= n 1

Da resulta que
( )

= T
S
0
X
S
n

=



Podemos verificar que, sendo
0
um valor conhecido, a varivel aleatria T torna-se
uma estatstica, pois passa a ser funo apenas da amostra.

Piana, Machado e Selau Inferncia Estatstica


159
Situao 2. Comparao entre duas mdias (
1
e
2
)

Ao compararmos duas mdias populacionais utilizando a estatstica T, trs
pressuposies devem ser verdadeiras:
1. A varivel em estudo tem distribuio normal, ou seja, X ~ N (,
2
);
2. As varincias das populaes so iguais ( =
2 2
1 2
);
3. As amostras retiradas das populaes so independentes.

Atendidas as pressuposies, a hiptese estatstica sob verificao ser:

: =
0 1 2
H 0.

Quando
0
H supe que o parmetro estimado igual a zero, ou seja, = =
1 2
0 ,
temos:
( ) ( ) ( )





= = =
0
T
S S S
~ t ().

Da resulta que
( )

1 2
2
1 2
X X
T
S
1 1
S
n n

= =
| |
+
|
\
,
onde:

=
1 2
X X

| |
= = +
|
\

2
1 2
1 2
1 1
S( ) X X S
n n
, sendo
( ) ( )
( ) ( )
+
=
+
2 2
1 1 2 2 2
1 2
S n 1 S n 1
S
n 1 n 1

( ) ( ) = +
1 2
n 1 n 1

Observemos que, tambm nesta situao, a varivel aleatria T passa a ser uma
estatstica.


Critrio de deciso

A regra de deciso a respeito de
0
H pode ser estabelecida com base num valor
crtico:

Teste bilateral: se a hiptese alternativa for bilateral, o valor crtico ser:

t
/2()
: valor da estatstica T, para graus de liberdade, que delimita a rea /2,
encontrado na tabela da distribuio t (limites bilaterais da Tabela II do Apndice).

Teste unilateral: se a hiptese alternativa for unilateral, o valor crtico ser:

t
()
: valor da estatstica T, para graus de liberdade, que delimita a rea ,
encontrado na tabela da distribuio t (limites unilaterais da Tabela II do Apndice).

Para decidir comparamos o valor da estatstica

T
S( )
com o valor crtico:

Rejeitamos
0
H , ao nvel , se o valor da estatstica, em mdulo, for maior que o
valor crtico:
| t | > valor crtico
Piana, Machado e Selau Inferncia Estatstica


160
No temos motivos suficientes para rejeitar
0
H , ao nvel , se o valor da estatstica,
em mdulo, for menor que o valor crtico:

| t | < valor crtico



Podemos observar a seguir as regies de rejeio
0
H na curva da distribuio t para
cada uma das trs possibilidades de hiptese alternativa:

Para hiptese alternativa bilateral, ou seja,
A 1 2
H : 0




Para hiptese alternativa unilateral direita, ou seja, >
A 1 2
H : 0 , temos:


Para hiptese alternativa unilateral esquerda, ou seja, <
A 1 2
H : 0 , temos:


Piana, Machado e Selau Inferncia Estatstica


161
Outro critrio tem sido frequentemente utilizado para decidir sobre
0
H . Essa deciso
tambm pode ser baseada em um valor que expressa a probabilidade de que seja obtido um
valor t mais extremo que o valor observado, dado que
0
H verdadeira. Esta probabilidade
conhecida como valor p.


A deciso a respeito de H
0
tomada da seguinte forma:

Se o valor p for maior ou igual a , no rejeitamos a hiptese nula, pois t tpico ou
est em uma regio de alta probabilidade.


Se o valor p for menor que , rejeitamos a hiptese nula, pois t atpico ou est em
uma regio de baixa probabilidade.




Consideraes finais

Os intervalos de confiana e os testes de hipteses bilaterais so procedimentos
estatsticos equivalentes. Portanto, se forem utilizados para analisar os mesmos dados, ao
mesmo nvel de significncia, devem conduzir aos mesmos resultados.
O intervalo de confiana para uma mdia equivale ao teste de hipteses que compara
uma mdia com um padro. Observe as expresses:

Intervalo de confiana para uma mdia ()
/2
S
IC( ; 1 ) : X t
n

.
Estatstica T para a comparao de uma mdia () com um valor padro (
0
)

=

0
X
T
S
n
.
Piana, Machado e Selau Inferncia Estatstica


162
Da mesma forma, o intervalo de confiana para a diferena entre duas mdias
equivale ao teste de hipteses que compara duas mdias. Observe as expresses:

Intervalo de confiana para a diferena entre duas mdias (
1

2
)

2
1 2 1 2 /2
1 2
1 1
IC( ; 1 ) : X X t S
n n

| |
+
|
\


Estatstica T para a comparao entre duas mdias (
1
e
2
)

=
| |
+
|
\
1 2
2
1 2
X X
T
1 1
S
n n


Exemplos:

1. Se no teste de hipteses, ao nvel de 1% de significncia, rejeitamos : =
0 0
H 0 ,
significa que a diferena entre a mdia e o valor padro diferente de zero, ou seja, a mdia
diferente do valor padro. Construindo o intervalo de confiana para , ao nvel de 99%,
devemos esperar que o valor padro (
0
) esteja fora do intervalo. Caso contrrio, os resultados
seriam contraditrios.
2. Se no teste de hipteses, ao nvel de 5% de significncia, no rejeitamos
: =
0 1 2
H 0 significa que a diferena entre as duas mdias deve ser zero, ou seja, as
mdias podem ser consideradas iguais. Construindo o intervalo de confiana, ao nvel de 95%,
para a diferena entre essas mdias (
1

2
), devemos esperar que o valor zero esteja dentro
do intervalo. Caso contrrio, os resultados seriam contraditrios.


Vejamos a seguir dois exemplos resolvidos:

Exemplo 1. Um botnico recebeu a informao de que o dimetro mdio de flores de uma
determinada planta de 9,6cm. Para testar a veracidade da informao, tomou uma amostra
aleatria de 30 plantas, cujo dimetro mdio de flores observado foi 9,3cm, com desvio padro
de 3,2cm.

a) Verifique, utilizando teste de hipteses ao nvel de 5% de significncia, se a
informao recebida pelo botnico verdadeira.
b) Verifique se a informao verdadeira, utilizando intervalo de confiana ao nvel de
95%.
c) Houve coerncia entre os resultados do teste de hipteses e do intervalo de
confiana?

Resoluo:

a) Teste de hipteses

Varivel em estudo: X = dimetro de flores (cm)

1. Pressuposio: A varivel em estudo tem distribuio normal.

2. Hipteses estatsticas:
=



0 0
A 0
H : 0
H : 0

A hiptese de nulidade supe que o dimetro mdio de flores da populao desta
espcie de planta igual ao valor padro 9,6cm.
Piana, Machado e Selau Inferncia Estatstica


163
3. Estatstica do teste

= =
0
0

=
0
X

= =
S
S( ) S(X)
n

= n 1


= =

0
X
T
S
S( )
n


Assim, temos:

= =
0
x 9,3 9,6 0,3
= =
s 3,2
0,5842
n 30

= 30 1 = 29
t
/2(29)
= 2,045

= =
0,3
t 0,5135
0,5842


4. Deciso e concluso

Como |t = 0,5135| < t
/2(29)
= 2,045, no temos motivos para rejeitar
0
H . Conclumos,
ao nvel de 5% de significncia, que o dimetro mdio de flores desta planta no difere
significativamente do valor padro =
0
9,6. Portanto, a informao recebida pelo botnico
verdadeira.


b) Intervalo de confiana

Pressuposio: A varivel em estudo tem distribuio normal.

Estimativas:

= x 9,3
= =
s 3,2
0,5842
n 30

= 30 1 = 29
t
/2(29)
= 2,045

Sendo

/2
IC( ; 1 ) : t S( )



/2
S
IC( ; 1 ) : X t
n


temos:
IC (; 0,95): 9,3 2,045 0,5842

Limite inferior = 9,3 1,195 = 8,11
Limite superior = 9,3 + 1,195 = 10,50

P(8,11 < < 10,50) = 0,95
Piana, Machado e Selau Inferncia Estatstica


164
Conclumos que o intervalo de confiana, ao nvel de 95%, para o verdadeiro dimetro
mdio de flores desta planta de 8,11 a 10,50cm.

c) Sim, o resultado do teste de hipteses esta coerente com o do intervalo de
confiana, pois o valor padro 9,6, que segundo o teste de hiptese no difere de , est
dentro do intervalo de confiana, ou seja, um valor possvel para .


Exemplo 2. Para investigar se o treinamento ou no transferido pelo cido nuclico, 10 ratos
foram treinados em discriminar se havia luz ou escurido. Posteriormente, esses ratos foram
mortos, o cido nuclico dos mesmos foi extrado e injetado em 10 ratos. Simultaneamente o
cido nuclico de 10 ratos no treinados foi injetado em outros 10. Os 20 ratos injetados com
cido nuclico foram observados durante um perodo de tempo quanto capacidade de
discriminar luz e escurido. O nmero de erros relativos a cada rato est na tabela abaixo.

Treinados 7 9 6 11 13 8 7 13 12 9
No treinados 12 8 9 13 14 9 8 10 7 15

a) Verifique, utilizando teste de hipteses ao nvel de 5% de significncia, se o
treinamento ou no transferido pelo cido nuclico.
b) Construa o intervalo de confiana, ao nvel de 95%, para a diferena entre as
mdias das duas populaes.
c) Houve coerncia entre os resultados do teste de hipteses e do intervalo de
confiana?

Resoluo:

a) Teste de hipteses

Varivel em estudo: X = nmero de erros ao discriminar luz e escurido

1. Pressuposies:

A varivel em estudo tem distribuio normal, ou seja, X ~ N (,
2
);
As varincias das populaes so iguais ( = =
2 2
1 2
);
As amostras retiradas das populaes so independentes.




2. Hipteses estatsticas:
=



0 1 2
A 1 2
H : 0
H : 0


A hiptese de nulidade supe a igualdade entre as mdias das duas populaes.
Piana, Machado e Selau Inferncia Estatstica


165
3. Estatstica do teste

= =
1 2
0

=
1 2
X X

| |
= = +
|
\

2
1 2
1 2
1 1
S( ) S(X X ) S
n n

( ) ( ) = +
1 2
n 1 n 1


= =
| |
+
|
\

1 2
2
1 2
X X
T
S( )
1 1
S
n n


Amostra 1: n
1
= 10 = =
2
1 1
x 9,5 s 6,722
Amostra 2: n
2
= 10 = =
2
2 2
x 10,5 s 7,833

= =
1 2
x x 9,5 10,5 1
( ) ( )
( ) ( )
+ +
= = =
+ +
2 2
1 1 2 2 2
1 2
s n 1 s n 1 6,722 9 7,833 9
s 7,278
n 1 n 1 9 9

| |
| |
+ = + =
| |
\
\
2
1 2
1 1 1 1
s 7,278 1,206
n n 10 10


= + = 9 9 18
t
/2(18)
= 2,101

= =
1
t 0,8292
1,206


4. Deciso e concluso

Como |t = 0,8292| < t
/2(18)
= 2,101, no temos motivos para rejeitar
0
H . Conclumos,
ento, ao nvel de 5% de significncia, que a mdia de erros do grupo que recebeu cido
nuclico de ratos treinados no diferiu significativamente da mdia de erros do grupo que
recebeu cido nuclico de ratos no treinados. Se o treinamento fosse transferido pelo acido
nuclico, a mdia de erros da populao 1 deveria ser menor que a mdia de erros da
populao 2. Portanto, h evidncias de que o treinamento no transferido pelo cido
nuclico.


b) Intervalo de confiana para a diferena entre as mdias

Varivel em estudo: X = nmero de erros ao discriminar luz e escurido

Pressuposies:
A varivel em estudo tem distribuio normal, ou seja, X ~ N (,
2
);
As varincias das populaes so iguais ( = =
2 2 2
1 2
);
As amostras retiradas das populaes so independentes.

Estimativas:

= =
1 2
x x 9,5 10,5 1
Piana, Machado e Selau Inferncia Estatstica


166
( ) ( )
( ) ( )
+ +
= = =
+ +
2 2
1 1 2 2 2
1 2
s n 1 s n 1 6,722 9 7,833 9
s 7,278
n 1 n 1 9 9

| |
| |
+ = + =
| |
\
\
2
1 2
1 1 1 1
s 7,278 1,206
n n 10 10


= + = 9 9 18
t
/2(18)
= 2,101

Sendo
2
1 2 1 2 /2
1 2
1 1
IC( ; 1 ) : X X t S
n n

| |
+
|
\
,
temos:
IC (
1
-
2
; 0,95): -1 2,101 1,206
IC (
1
-
2
; 0,95): -1 2,533
Limite inferior = -1 - 2,533 = -3,533
Limite superior = -1 + 2,533 = 1,533

P(-3,533 <
1
-
2
< 1,533) = 0,95

Conclumos que a probabilidade de a verdadeira diferena entre a mdia de erros da
populao que recebeu cido nuclico de ratos treinados e a mdia de erros da populao que
recebeu cido nuclico de ratos no treinados estar entre -3,533 e 1,533 de 0,95.

c) Pelo teste de hipteses, conclumos que a verdadeira diferena entre as mdias
deve ser zero e, pelo intervalo de confiana, conclumos que zero um valor possvel para a
verdadeira diferena entre as mdias, uma vez que se encontra dentro do intervalo. Portanto, o
resultado do teste de hipteses est de acordo com o do intervalo de confiana.


4.5.2. Testes para a varincia populacional

4.5.2.1. Teste para a varincia de uma populao

Para aplicar o teste para a varincia necessrio supor a normalidade da populao
de onde ser extrada a amostra. Se essa suposio violada, o teste deixa de ser exato. Uma
hiptese testada com frequncia que a varincia tenha um valor especificado
2
0
. Assim, as
hipteses a serem testadas so:


:
:
=

>
<




2 2
0 0
2 2
A 0
2 2
0
2 2
0
H
H hiptese bilateral
hiptese unilateral direita
hiptese unilateral esquerda


A estatstica do teste Q que tem distribuio qui-quadrado com parmetro = n1 e
assim definida:
~
2
2
0
2
(n 1)S
Q ( )

,
onde:
S
2
o estimador da varincia populacional
2
;
n o tamanho da amostra;
= n1 o nmero de graus de liberdade associado varincia.
Piana, Machado e Selau Inferncia Estatstica


167
A regio de rejeio de H
0
definida em funo do tipo de hiptese alternativa. Logo,
fixado um nvel de significncia , a hiptese nula rejeitada se o valor da estatstica do teste
ultrapassar o valor crtico (inferior ou superior) da distribuio qui-quadrado (Tabela III do
Apndice):
se
( ) /2
q q

> ou
( ) /2
q q

> , rejeitamos H
0
;
se
( ) /2
q q

< e
( ) /2
q q

< , no rejeitamos H
0
.

Para
2 2
A 0
H : (bilateral)



Para
2 2
A 0
H : < (unilateral esquerda) Para
2 2
A 0
H : > (unilateral direita)




Esse teste tem larga aplicao no controle da qualidade, uma vez que o
monitoramento da variabilidade essencial para a garantia de qualidade.


Consideremos o exemplo resolvido.

Uma mquina de empacotar caf est regulada para encher os pacotes com desvio
padro de 10g e mdia de 500g e onde o peso de cada pacote distribui-se normalmente.
Colhida uma amostra de n = 16, observou-se uma varincia de 169g
2
. possvel afirmar com
este resultado que a mquina est desregulada quanto variabilidade, supondo uma
significncia de 5%?

Resoluo:
Piana, Machado e Selau Inferncia Estatstica


168
Hipteses estatsticas:
:
:
2 2
2 2
0 0
A 0
H
H




Sendo
2
0
100 = , =
2
s 169 e n = 16, temos:

= = =

2
2
0
(n 1)s (16 1) 169
q 25,35
100
.

Como = 0,05 e =15, os valores crticos so
) 0,025(15
q 6,26 = e
0,025(15)
q 27,49 = . O
valor calculado est contido neste intervalo, portanto, no rejeitamos H
0
. Conclumos, ao nvel
de 5% de significncia, que no h evidncia de que e a mquina esteja desregulada.


4.5.2.2. Teste de homogeneidade de varincias (teste F)

Considere duas estimativas distintas e independentes de
2
, representadas por
2
1
s e
2
2
s , com
1
e
2
graus de liberdade, respectivamente. Frequentemente, temos interesse em
verificar se tais estimativas so homogneas, ou seja, se so de fato estimativas de um mesmo
parmetro. Um teste apropriado para essa finalidade o teste F. Neste teste, verificamos a
hiptese de nulidade (
0
H ) por meio de uma estatstica que tem distribuio F, com parmetros

1
e
2
.

Hipteses estatsticas

A hiptese que est sob verificao (
0
H ) a hiptese de igualdade entre as varincias
populacionais. O conjunto das hipteses, incluindo todas as possveis hipteses alternativas, :

:
:
= =

> >
< <




2 2 2 2
0 1 2 1 2
2 2 2 2
A 1 2 1 2
2 2 2 2
1 2 1 2
2 2 2 2
1 2 1 2
H ou / 1
H ou / 1 hiptese bilateral
ou / 1 hiptese unilateral direita
ou / 1 hiptese unilateral esquerda


Estatstica do teste

Como vimos na seo 4.4.3, dadas duas amostras independentes, de tamanhos n
1
e
n
2
, retiradas de duas populaes normais, a varivel aleatria F tem distribuio F, com
parmetros
1
e
2

=

2
1
2
1
2
2
2
2
S
F
S
~
1 2
, F( ) ,
onde:
2 2
1 2
S e S : so as varincias das amostras retiradas das populaes 1 e 2,
respectivamente;

2 2
1 2
e : so as varincias das populaes 1 e 2, respectivamente;
( ) ( ) = =
1 1 2 2
n 1 e n 1 : so os graus de liberdade de
2 2
1 2
S e S , respectivamente.

Se a hiptese de nulidade verdadeira, ou seja, = =
2 2 2
1 2
, a varivel F torna-se
Piana, Machado e Selau Inferncia Estatstica


169
= = =


2 2
1 1
2 2 2
1 1
2 2 2
2 2 2
2 2
2
S S
S
F
S S S
.
Deste modo, dizemos que, sob
0
H verdadeira, a estatstica ~ =
2
1
1 2
2
2
,
S
F F( )
S
, ou seja,
a estatstica F, obtida atravs da razo de duas varincias amostrais independentes, tem
distribuio F com parmetros
1
e
2
, graus de liberdade do numerador e denominador,
respectivamente.

Assim, para que a estatstica F possa ser utilizada na comparao das varincias
populacionais, duas pressuposies devem ser atendidas:
1. A varivel em estudo tem distribuio normal, X ~ N (,
2
).
2. As amostras so independentes.

Critrio de deciso

Para efetuar o teste F, convencionamos que a estatstica F obtida fixando a maior
varincia no numerador. Isto garante que o valor da estatstica nunca ser menor que 1 e
possibilita a utilizao das tabelas mais comumente disponveis para consulta. Por conveno,
vamos considerar que
2 2
1 2
S S .

A regra de deciso a respeito de
0
H pode ser estabelecida com base no valor crtico
1 2
/2( , )
f

, que, para os graus de liberdade
1
e
2
, delimita a rea /2 (Tabela IV do Apndice).

Rejeitamos
0
H , ao nvel , se o valor da estatstica F for maior que o valor crtico:
=
2
1
2
2
s
f
s
>
1 2
/2( , )
f

.

No rejeitamos
0
H , ao nvel , se o valor da estatstica F for menor que o valor
crtico:
=
2
1
2
2
s
f
s
<
1 2
/2( , )
f

.

Podemos observar a seguir as regies de rejeio de
0
H na curva da distribuio F,
para os casos de hiptese alternativa unilateral e de hiptese alternativa bilateral.

Para >
2 2
A 1 2
H : (unilateral direita) Para
2 2
A 1 2
H : (bilateral)

Piana, Machado e Selau Inferncia Estatstica


170
Neste caso, quando a hiptese alternativa bilateral, dizemos que o teste bilateral
condicionado, porque somente um lado da curva ser considerado. Como a tabela usualmente
utilizada adequada para testes F unilaterais, a rea de rejeio direita do valor crtico ser
representada por /2.


Consideremos dois exemplos resolvidos:

Exemplo 1. Os valores abaixo se referem aos pesos ao nascer (em kg) de bovinos da raa
Ibag, em duas pocas distintas:

Agosto 18 25 16 30 35 23 21 33 32 22 - - -
Setembro 27 30 20 30 33 34 17 33 20 23 39 23 28

Efetue o teste de homogeneidade de varincias, ao nvel = 0,05.

Resoluo:

Varivel em estudo: X = peso ao nascer (em kg) de bovinos da raa Ibag

1. Pressuposies
A varivel em estudo tem distribuio normal, X ~ N (,
2
).
As amostras retiradas das populaes so independentes.

2. Hipteses estatsticas:
:
:
=



2 2
0 1 2
2 2
A 1 2
H
H


3. Estatstica do teste

=
2
1
2
2
S
F
S

Amostra 1 (agosto):
1
= n
1
1 = 9 = =
2
1 1
x 25,5 s 43,83
Amostra 2 (setembro):
2
= n
2
1 = 12 = =
2
2 2
x 27,46 s 42,60
= = =
2
1
2
2
s 43,83
f 1,029
42,60 s


4. Deciso e concluso

Como f = 1,029 < f
0,025(9, 12)
= 3,44, no temos informaes suficientes para rejeitar
0
H . Assim, conclumos, ao nvel de 5% de significncia, que as varincias de pesos ao nascer
de bovinos da raa Ibag nas diferentes pocas so homogneas.


Exemplo 2. Um experimento foi conduzido para comparar duas cultivares de soja (A e B)
quanto ao rendimento mdio por hectare. Os resultados obtidos foram os seguintes:

Cultivar A: n
1
= 8 = =
-1 2 -1 2
1 1
x 3,8t.ha s 0,04(t.ha )
Cultivar B: n
2
= 10 = =
-1 2 -1 2
2 2
x 4,6t.ha s 0,36(t.ha )

Verifique, utilizando =0,05, se a pressuposio de homogeneidade de varincias foi
atendida.
Piana, Machado e Selau Inferncia Estatstica


171
Resoluo:

Varivel em estudo: X = rendimento de soja (por hectare)

1. Pressuposies
A varivel em estudo tem distribuio normal, X ~ N (,
2
).
As amostras retiradas das populaes so independentes.

2. Hipteses estatsticas:
:
:
=



2 2
0 1 2
2 2
A 1 2
H
H


3. Estatstica do teste

=
2
1
2
2
S
F
S


Amostra 1 (cultivar A):
1
= n
1
1 = 7 = =
-1 2 -1 2
1 1
x 3,8t.ha s 0,04(t.ha )
Amostra 2 (cultivar B):
2
= n
2
1 = 9 = =
-1 2 -1 2
2 2
x 4,6t.ha s 0,36(t.ha )

Por conveno colocamos a maior estimativa no numerador, resultando assim

= = =
2
2
2
1
s 0,36
f 9
0,04 s
.

4. Deciso e concluso

Como f = 9 > f
0,025(9, 7)
= 4,82, temos evidncias suficientes para a rejeio de
0
H .
Assim, podemos concluir, ao nvel de 5% de significncia, que as varincias de rendimento de
gros (em t/ha) das cultivares A e B no so homogneas.


4.5.3. Testes para a proporo populacional

4.5.3.1. Teste para a proporo de uma populao

O teste para a proporo populacional, em geral, utilizado para verificar se a
proporo de elementos da populao que possuem uma determinada caracterstica igual a
um determinado valor
0
. Assim as hipteses estatsticas so:


:
:
0 0 0
A 0 0
0 0
0 0
H ou 0
H ou 0 hiptese bilateral
ou 0 hiptese unilateral direita
ou 0 hiptese unilateral esquerda
= =

> >
< <






O estimador da proporo a proporo amostral P, que tem uma distribuio
aproximadamente normal, com mdia =
P
e desvio padro

P
(1 )
n
, quando a
amostra grande, ou seja, quando np>5 e n(1-p)>5.

Assim, utilizamos a varivel Z para testar H
0
:


P
Z
(1 )
n
.
Piana, Machado e Selau Inferncia Estatstica


172
Sob : =
0 0
H verdadeira, temos


0
0 0
P
Z
(1 )
n


A deciso sobre H
0
baseada nos valores crticos z
/2
, para o teste bilateral, ou z

,
para o teste unilateral, encontrados na tabela da distribuio Z (Tabela I do Apndice).


Assim, fixando o nvel de significncia , a hiptese nula ser rejeitada se:

|z| > z
/2
, no teste bilateral;
z > z

, no teste unilateral direita;


z < z

, no teste unilateral esquerda.




Vamos considerar um exemplo resolvido:

As condies de mortalidade de uma regio so tais que a proporo de nascidos que
sobrevivem at 70 anos de 0,60. Testar esta hiptese ao nvel de 5% de significncia se em
1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes at os 70 anos.

Resoluo:
Hipteses estatsticas:
:
:
=



0 0
A 0
H
H


Sendo
0
= 0,60 e p = 0,53, temos:


= = =


0
0 0
p 0,53 0,60
z 4,52
(1 ) 0,60(1 0,60)
1000 n
.

Considerando que o teste bilateral e tendo = 0,05, os valores crticos so
-z
/2
= -1,96 e z
/2
=1,96.

Como este valor pertence regio de rejeio, rejeitamos a hiptese nula, ao nvel de
5% de significncia. Conclumos que a taxa dos que sobrevivem at os 70 anos menor do
que 60%.



Piana, Machado e Selau Inferncia Estatstica


173
4.5.3.2. Teste para a diferena entre duas propores

A aproximao da distribuio normal tambm pode ser usada para testar hipteses
sobre diferenas entre propores de duas populaes, ou seja, para testar as hipteses:


:
:
0 1 2 1 2
A 1 2 1 2
1 2 1 2
1 2 1 2
H ou
H ou hiptese bilateral
ou hiptese unilateral direita
ou hiptese unilateral esquerda
0
0
0
0
= =

> >
< <







Nesse caso, duas amostras aleatrias de tamanho n
1
e n
2
so retiradas das
populaes, gerando x
1
e x
2
itens pertencentes s classes da caracterstica de interesse. Ento
=
1 1 1
P X /n e =
2 2 2
P X /n so os estimadores das propores populacionais
1
e
2
.

A varivel
1 2
P P ter uma distribuio aproximadamente normal com mdia
1 2
e
varincia
1 2
2 1 1 2 2
P P
1 2
(1 ) (1 )
n n


= +

.

Assim, a varivel Z resulta:

( )
1 2 1 2
1 1 2 2
1 2
P P ( )
Z
(1 ) (1 )
n n

=

+


.

Sob :
0 1 2
H = verdadeira, temos
1 2
0 = e como consequncia:

( )
1 2
1 1 2 2
1 2
P P
Z
(1 ) (1 )
n n

=

+

.

Como os valores de
1
e
2
no so conhecidos, devemos utilizar suas estimativas p
1

e p
2
. Desta forma, o valor de Z :

1 2
1 1 2 2
1 2
p p
z
p (1 p ) p (1 p )
n n

=

+
.

A deciso sobre H
0
baseada nos valores crticos z
/2
, para o teste bilateral, ou z

,
para o teste unilateral, encontrados na tabela da distribuio normal padro.


Vejamos o exemplo resolvido:

Em uma pesquisa de opinio, 32 entre 80 homens declararam apreciar certa revista,
acontecendo o mesmo com 26 entre 50 mulheres. Ao nvel de 5% de significncia os homens e
as mulheres apreciam igualmente a revista?
Resoluo:

Hipteses estatsticas:
:
:
=



0 1 2
A 1 2
H
H

Piana, Machado e Selau Inferncia Estatstica


174
Sendo p
1
= 32/80 = 0,40 e p
2
= 26/50 = 0,52, temos:

1 2
1 1 2 2
1 2
p p 0,40 0,52
z 1,34
p (1 p ) p (1 p ) 0,40 0,60 0,52 0,48
80 50 n n

= = =

+ +


Como = 0,05, ento, z
/2
= 1,96.

Sendo o |z| calculado menor que o valor crtico, no rejeitamos a hiptese de
igualdade entre as preferncias de homens e mulheres. Conclumos, ao nvel de 5% de
significncia, que no h diferena significativa entre as preferncias de homens e mulheres
quanto revista.



4.6. Quebras nas pressuposies adotadas no processo de inferncia

O teste t somente pode ser aplicado com resultados exatos se as pressuposies de
normalidade, homogeneidade de varincias e independncia entre amostras forem atendidas.
Das trs, a pressuposio de normalidade a mais robusta, ou seja, mesmo com normalidade
aproximada o teste poder ser realizado. Ademais, o teorema central do limite um poderoso
auxiliar nestes casos, uma vez que a distribuio necessita ser considerada em termos da
mdia da varivel. As outras duas devero ser consideradas com maior cuidado. No caso de
varincias heterogneas, apenas procedimentos aproximados podero ser utilizados. Veremos
a seguir dois procedimentos alternativos para os casos de violao dessas pressuposies.


4.6.1. Heterogeneidade de varincias

Se as varincias das populaes no so iguais (
2 2
1 2
), no podemos combinar as
varincias amostrais,
2 2
1 2
S e S , pois estas no so mais estimativas de um mesmo parmetro
(
2
). Nesse caso, o erro padro do estimador resulta em:

( )

= = +
2 2
1 2
1 2
1 2
S S
S( ) S X X
n n


Diversas modificaes do teste so propostas na literatura, entretanto, nenhuma
considerada completamente satisfatria. Aqui ser mencionada uma delas, bastante utilizada,
proposta por Satterthwaite, que estima o nmero de graus de liberdade associado estatstica,
uma vez que no existe uma varincia ponderada com nmero nico de graus de liberdade,
como no caso de varincias homogneas. Para a obteno do valor crtico, utilizamos, ento, o
nmero de graus de liberdade estimado ( ), atravs da Frmula de Satterthwaite:

( )
( ) ( )
+
=
+


2
2 2
1 2
2 2
2 2
1 2
1 2
S S
S S
n 1 n 1


Nesse caso, rejeitamos
0
H , ao nvel , se | t | > t ( ).
Vamos considerar o exemplo resolvido:

Com referncia ao Exemplo 2 da seo 4.7.2.2, verifique se os rendimentos mdios
das cultivares A e B diferem significativamente entre si, utilizando = 0,05.

Piana, Machado e Selau Inferncia Estatstica


175
Resoluo:

1. Pressuposies:

- A varivel em estudo tem distribuio aproximadamente normal, X ~ N (,
2
).
- As amostras retiradas das populaes so independentes.

2. Hipteses estatsticas:
=



0 1 2
A 1 2
H : 0
H : 0


A hiptese de nulidade supe a igualdade entre as mdias das duas populaes.

3. Estatstica do teste

= =
1 2
0

= = =
1 2
X X 3,8 4,6 0,8

Como verificamos na resoluo do Exemplo 2, a pressuposio de homogeneidade de
varincias no foi atendida, portanto, no podemos combinar as varincias das amostras.
Temos, ento

| |
| |
= = + = + = =
|
|
\
\

2 2
1 2
1 2
1 2
S S 0,04 0,36
S( ) S(X X ) 0,041 0,2025
n n 8 10


= = =

0,8
T 3,951
0,2025
S( )


4. Deciso e concluso

Devido heterogeneidade das varincias, o nmero de graus de liberdade deve-se ser
estimado pela frmula de Satterthwaite:

( )
( ) ( )
( )
( ) ( )
+
+
= = = =
+
+
+



2
2 2 2
1 2
2 2 2 2
2 2
1 2
1 2
s s
0,04 0,36
0,16
10,94
0,0002286 0,0144
0,04 0,36
s s
8 1 10 1
n 1 n 1


Para consulta tabela, o nmero de graus de liberdade pode ser arredondado. No
exemplo, o valor crtico ser t
0,025(11)
= 2,201.

Como |t = 3,951| > t
/2()
= 2,201, temos motivos para rejeitar
0
H . Conclumos, ento,
ao nvel de 5% de significncia, que o rendimento mdio de gros da cultivar A diferiu
significativamente do rendimento mdio de gros da cultivar B. Portanto, h evidncias de que
a cultivar B mais produtiva.


4.6.2. Dependncia entre as amostras

Quando comparamos as mdias de duas populaes, pode ocorrer uma diferena
significativa devido a fatores externos no-controlveis que inflacionam as estimativas das
varincias. Um modo de contornar este problema coletar observaes aos pares, de modo
que os dois elementos de cada par sejam homogneos em todos os sentidos, exceto naquele
que se quer comparar.
Piana, Machado e Selau Inferncia Estatstica


176
Por exemplo, para testar dois mtodos de ensino A e B, pode-se usar pares de
gmeos, sendo que um recebe o mtodo de ensino A e o outro o mtodo de ensino B. Este
procedimento controla a maioria dos fatores externos que afetam a aprendizagem. Se houver
diferena, ela realmente se deve ao mtodo.
Outra forma fazer as observaes das duas amostras no mesmo indivduo. Por
exemplo, medindo uma caracterstica do indivduo antes e depois dele ser submetido a um
tratamento.
Nesses casos, temos duas amostras, mas as observaes esto emparelhadas, isto ,
a amostra formada pelos pares:

(X
1
, Y
1
), (X
2
, Y
2
), ..., (X
n
, Y
n
).

Ao usarmos esse procedimento, passamos a ter uma dependncia entre as
observaes de um mesmo par. Por essa razo, no podemos preceder o teste de
comparaes de mdias da mesma forma como realizado no caso de independncia entre as
amostras.

Assim, para verificar se existe diferena entre
X
e
Y
, definimos a varivel D= X
i
-Y
i
.
Como resultado, temos a amostra: D
1
= X
1
- Y
1
, D
2
= X
2
- Y
2
, ..., D
n
= X
n
- Y
n
. Desta forma, reduz-
se o problema para anlise de uma nica populao.

Supondo que D tem distribuio
D D
N( , ) , temos = = =
i i i
1 1
D D (X Y) X Y
n n
, e
assim D ter distribuio

D
D
N( , )
n
. Definindo:

= =

2 2
i 2 2
D i
D nD
1
(D D)
n 1 n 1
S , tem-se que
a estatstica:
~

=


D
D
D
T t( )
n
S
, onde =n-1.

As hipteses de interesse so:


:
:
0 X Y D
A X Y D
X Y D
X Y D
H ou
H ou hiptese bilateral
ou hiptese unilateral direita
ou hiptese unilateral esquerda
0
0
0
0
= =

> >
< <






Sob :
0 X Y
H = verdadeira, temos
D
0 = e como consequncia:

= ~
D
D D D
D D 0 D
T t( )
n n n
S S S

= =

.

A deciso sobre H
0
tomada comparando o valor calculado para t com o valor crtico
da distribuio t (Tabela II do Apndice).


Vejamos um exemplo resolvido:

Cinco operadores de mquinas so treinados em duas mquinas de diferentes
fabricantes, para verificar qual delas apresentava maior facilidade de aprendizagem. Mediu-se
o tempo que cada um dos operadores gastou na realizao de uma mesma tarefa com cada
um dos dois tipos de mquinas. Os resultados esto na tabela a seguir.
Piana, Machado e Selau Inferncia Estatstica


177
Operador Mquina X Mquina Y Diferena
1 80 75 5
2 72 70 2
3 65 60 5
4 78 72 6
5 85 78 7

Ao nvel de 5% possvel afirmar que h diferena no tempo mdio da tarefa realizada na
mquina X e na mquina Y?

Resoluo:

Hipteses estatsticas:
=



0 X Y
A X Y
H :
H :


Pela tabela vemos que:

d
i
= 5, 2, 5, 6 e 7,

logo,
d 5 = e
( )
2
i
2
D
d d
28,5
n 1
s

= =

.

Assim, obtemos
D
d 5
t 2,094
5,339
5 n
s
= = = .

Sendo = 0,05 e = 4, temos t
0,025(4)
= 2,778.

Como o t calculado menor que o valor crtico, no rejeitamos a hiptese nula. Conclumos, a
5% de significncia, que no h diferena no tempo mdio da tarefa realizada na mquina X e
na mquina Y.



Exerccios propostos:

4.6. Cinco medidas do contedo de alcatro em um cigarro X acusaram: 14,5, 14,2, 14,4, 14,8,
e 14,1 miligramas por cigarro. Este conjunto de cinco valores tem mdia 14,4 e desvio padro
0,274. O leitor pretende testar a hiptese nula H
0
: = 14,1 (conforme declarado no mao) ao
nvel de 0,05 de significncia.

a) H
0
seria aceita, contra a alternativa H
A
: 14,1?
b) H
0
seria aceita, contra a alternativa H
A
: < 14,1?
c) H
0
seria aceita, contra a alternativa H
A
: > 14,1?
d) Que suposies so necessrias para fazer o teste de hipteses?

4.7. Suponha que um fabricante sem escrpulos deseje uma prova cientfica de que um
aditivo qumico totalmente incuo melhora o rendimento.

a) Se um grupo de pesquisa analisa esse aditivo com um experimento, qual a
probabilidade de chegar a um resultado significativo com = 0,05 (para promover o
aditivo com afirmaes cientficas) mesmo que o aditivo seja totalmente incuo?
Piana, Machado e Selau Inferncia Estatstica


178
b) Se dois grupos independentes de pesquisa analisam o aditivo, qual a probabilidade
de que pelo menos um deles chegue a um resultado significativo, mesmo que o aditivo
seja totalmente incuo?

c) Se 32 grupos independentes de pesquisa analisam o aditivo, qual a probabilidade de
que pelo menos um deles chegue a um resultado significativo, mesmo que o aditivo
seja totalmente incuo?


4.8. Suponha que um farmacutico pretenda achar um novo unguento para reduzir inchao.
Para tanto, ele fabrica 20 medicamentos diferentes e testa cada um deles, ao nvel de 0,10 de
significncia, quanto a finalidade em vista.

a) Qual a probabilidade de ao menos um deles se revelar eficaz mesmo que todos sejam
totalmente incuos?

b) Qual a probabilidade de mais de um deles se revelarem eficazes, mesmo que todos
sejam totalmente incuos?


4.9. O fabricante de uma certa marca de aparelhos eletrnicos informou que a potncia mdia
dos seus aparelhos de 27 microwatts. O gerente de uma loja que vende os aparelhos utiliza
uma amostra de 15 aparelhos para checar se a informao do fabricante verdadeira. Os
valores (em microwatts) obtidos para a amostra foram os seguintes:

26,7; 25,8; 24,0; 24,9; 26,4; 25,9; 24,4; 21,7; 24,1; 25,9; 27,3; 26,9; 27,3; 24,8; 23,6

Utilize um teste de hiptese, ao nvel de 5% de significncia, e verifique qual foi a concluso do
gerente.


4.10. Dez cobaias adultas criadas em laboratrio, foram separadas, aleatoriamente, em dois
grupos: um foi tratado com rao normalmente usada no laboratrio (padro) e o outro grupo
foi submetido a uma nova rao (experimental). As cobaias foram pesadas no incio e no final
do perodo de durao do experimento. Os ganhos de peso (em gramas) observados foram os
seguintes:
Rao padro 200 180 190 190 180
Rao experimental 220 200 210 220 210

Utilize um teste de hiptese, ao nvel =0,01, para verificar se as duas raes diferem entre si.


4.11. Os valores abaixo se referem aos pesos ao nascer (em kg) de bovinos da raa Ibag, em
duas pocas distintas:

Agosto: 18 25 16 30 35 23 21 33 32 22
Setembro: 27 30 20 30 33 34 17 33 20 23 39 23 28

Efetue o teste de homogeneidade de varincias, ao nvel = 0,05.


4.12. Um engenheiro deseja testar a hiptese de que o percentual de peas defeituosas
inferior a 10%. Uma amostra aleatria com 75 peas revelou 6 peas defeituosas. Use = 0,05
e conclua a respeito.



Piana, Machado e Selau Inferncia Estatstica


179
4.7. Regresso linear simples

4.7.1. Introduo

Em muitos estudos estatsticos, o objetivo do pesquisador estabelecer relaes que
possibilitem predizer uma ou mais variveis em termos de outras. Assim que se fazem
estudos para predizer as vendas futuras de um produto em funo do seu preo, a perda de
peso de uma pessoa em decorrncia do nmero de dias que se submete a uma determinada
dieta, a despesa de uma famlia com mdico e remdios em funo da renda, o consumo per
capita de certos alimentos em funo do seu valor nutritivo e do gasto com propaganda na TV,
a produo de uma determinada cultura em funo da quantidade de nutriente aplicada no
solo, etc.
Naturalmente, o ideal seria que pudssemos predizer uma quantidade exatamente em
termos de outra, mas isso raramente possvel. Na maioria dos casos devemos contentar-nos
com a predio de mdias, ou valores esperados. Por exemplo, no podemos predizer
exatamente quanto ganhar um bacharel nos 10 anos aps a formatura, mas com base em
dados adequados, possvel predizer o ganho mdio de todos os bacharis nos 10 anos aps
a formatura. Analogamente, podemos predizer a safra mdia de certa variedade de trigo em
termos do ndice pluviomtrico de julho, e a nota mdia de um estudante em funo do seu QI.
Sendo assim, podemos dizer que a predio do valor mdio de uma varivel em funo dos
valores de outra constitui o problema principal da regresso.
A origem desse termo remonta a Francis Galton (1822-1911), que o empregou pela
primeira vez em um estudo da relao entre as alturas de pais e filhos. Galton observou, nesse
estudo, que filhos de pais muito altos, em mdia, no eram to altos quanto os seus pais, da
mesma forma que filhos de pais muito baixos, em mdia, no eram to baixos quanto os seus
pais. A partir dessas observaes, concluiu que a altura dos filhos tendia para a mdia () da
espcie, ou seja, a cada gerao a altura dos filhos convergia ou regredia para a mdia. Esse
fenmeno de retorno mdia foi, ento, denominado regresso.



Por questes histricas o termo utilizado at hoje, mas abriga uma srie de tcnicas
estatsticas.
A expresso regresso linear simples utilizada por duas razes: a regresso linear
porque a relao entre X e Y expressa por uma equao de primeiro grau, representada
graficamente por uma reta, e simples porque envolve apenas duas variveis.


Ajustamento de curvas

Sempre que possvel, procuramos expressar em termos de uma equao matemtica
as relaes entre grandezas conhecidas e grandezas que devem ser determinadas. Isso ocorre
Piana, Machado e Selau Inferncia Estatstica


180
com frequncia nas cincias naturais, onde, por exemplo, a relao entre o volume (y) e
presso (x) de um gs, a uma temperatura constante, dada pela expresso
=
k
y
x
,
sendo k uma constante numrica. Outro exemplo pode ser a relao entre uma cultura de
bactrias (y) e o tempo (x) em que esteve exposta a certas condies ambientais, que dada
por
=
x
y ab ,
onde a e b so constantes numricas. Mais recentemente, equaes como essas tm sido
usadas para descrever relaes tambm no campo das cincias do comportamento, das
cincias sociais e outros.
Essa representao matemtica dos fenmenos feita ajustando-se uma curva aos
dados observados, de tal forma que, a partir dessa curva ajustada, possamos representar,
grfica ou analiticamente, a relao entre as variveis. Ento, ajustar uma curva determinar
uma funo matemtica que possa representar um conjunto de observaes. Sempre que
utilizamos dados observados para chegar a uma equao matemtica encontramos trs tipos
de problema:

1. Devemos decidir que tipo de curva e, da, que tipo de equao de predio
queremos utilizar.

2. Devemos achar a equao particular que a melhor em determinado sentido.

3. Devemos investigar possveis problemas relativos ao mrito da equao escolhida e
da predio feita a partir dela.

Aqui vamos restringir nosso estudo s equaes lineares com duas incgnitas. Estas
equaes lineares so teis e importantes no s porque muitas relaes tm efetivamente
esta forma, mas tambm porque em geral constituem boas aproximaes de relaes que, de
outro modo, seriam difceis de descrever em termos matemticos.


Modelo estatstico

Sendo x e y duas variveis que se relacionam de forma linear, esta relao expressa
pela seguinte equao:
= +
0 1
x y ,

Na figura a seguir podemos observar a representao grfica desta equao.



Piana, Machado e Selau Inferncia Estatstica


181
Se Y uma varivel aleatria, ento, est sujeita a um erro de observao. Este erro
(e
i
) dever ser adicionado ao modelo, desde que se admitam como verdadeiras as seguintes
pressuposies:

1. Os erros so aleatrios, tm mdia zero e varincia constante, ou seja, E(e
i
) = 0 e
V(e
i
) =
2
.

2. Os erros tm distribuio normal e so independentes entre si.

3. O modelo adequado para todas as observaes, no podendo haver nenhum
valor de X que produza um valor de Y discrepante dos demais.

4. A varivel X fixa (no aleatria).
Assim, o modelo de regresso linear simples ser:

= + +
i 0 1 i i
y x e
onde:
y
i
: a varivel resposta (dependente)
x
i
: a varivel preditora (independente)
0
: o intercepto ou coeficiente linear
1
: o coeficiente angular ou de regresso
e
i
: erro (variao aleatria no controlvel)

Sendo assim, verificamos que este modelo composto por uma parte fixa e uma parte
aleatria:


A parte fixa do modelo informa como X influencia Y e a parte aleatria mostra que Y
possui uma variabilidade inerente, significando que X no a nica varivel que influencia Y,
embora consideremos que sua influncia seja preponderante. Alis, devemos ressaltar que
este modelo ser adequado quando a parte fixa for preponderante sobre a aleatria.


A ttulo de ilustrao, consideremos o exemplo a seguir.

Exemplo 1. Um experimento foi conduzido para estudar o efeito da dose de Nitrognio
aplicada no solo sobre a produo de uma espcie de forrageira. Para as cinco doses
utilizadas, foram observados os seguintes resultados:

Parcela
Dose de Nitrognio
(kg/ha)
Produo de
forragem (kg/ha)
1 0 2.160
2 50 2.880
3 100 3.360
4 150 3.720
5 200 4.020


De modo geral, um grfico de disperso de valores observados para a varivel
resposta j suficiente para indicar o tipo de curva (reta, parbola, etc) que melhor descreve o
padro geral dos dados. A figura a seguir mostra a disperso dos valores observados para a
varivel produo de forragem quando diferentes doses de Nitrognio foram aplicadas.
Piana, Machado e Selau Inferncia Estatstica


182
Podemos observar uma tendncia linear dos dados, o que nos permite supor que a relao
entre dose de Nitrognio e produo de forragem seja linear.



Admitindo, ento, o relacionamento linear entre as variveis, vamos adotar o modelo
de regresso linear simples:

= + +
i 0 1 i i
y x e ,
onde:
y
i
a produo de forragem (varivel resposta), em kg;
x
i
a dose de Nitrognio (varivel preditora), em kg;
0
a produo de forragem quando a dose de Nitrognio aplicada for nula
(intercepto), em kg;

1
a quantidade que varia na produo de forragem para cada unidade (kg) aplicada
de Nitrognio (coeficiente de regresso), em kg/kg.
e
i
o erro (variao aleatria no controlvel)


4.7.2. Anlise de regresso

A anlise de regresso tem por objetivo determinar a equao que melhor representa
a relao existente entre duas variveis e, a partir desta equao, fazer predies para a
varivel resposta. Para isso, necessrio que uma sequncia de passos seja seguida:
1. Obteno das estimativas (por ponto) dos coeficientes
0
e
1
para ajustar a
equao da regresso.
2. Aplicao dos testes de significncia para as estimativas obtidas, a fim de verificar
se a equao de regresso adequada.
3. Clculo dos intervalos de confiana para os valores estimados pela equao de
regresso.


4.7.2.1. Estimao dos parmetros do modelo

Quando temos n observaes, temos n pares de valores, (x
1
, y
1
); (x
2
, y
2
); ... ; (x
n
, y
n
),
onde os valores observados para a varivel resposta (y
i
) so representados pela equao da
regresso:
Piana, Machado e Selau Inferncia Estatstica


183
= + +

= + + = + +

= + +




1 0 1 1 1
2 0 1 2 2 i 0 1 i i
n 0 1 n n
y x e
y x e y x e
i 1,2, ,n
y x e



Os coeficientes
0
e
1
so os parmetros do modelo, e, portanto, constantes
desconhecidas, que sero estimados a partir dos valores da amostra.

Se = + +
i 0 1 i i
y x e , ento
= + +
= + +
= +



i 0 1 i i
i 0 1 i i
i 0 1 i
E(y ) E( x e )
E(y ) E( ) E( x ) E(e )
E(y ) x



Sendo assim, se = + +
i 0 1 i i
y x e , ento
= +
i i i
y E(y ) e ,
logo,
=
i i i
e y E(y ) .

A estimao dos parmetros
0
e
1
efetuada atravs do mtodo dos mnimos
quadrados.

Mtodo dos mnimos quadrados

Este mtodo tem como objetivo obter as estimativas dos parmetros
0
e
1
de tal
forma que a soma dos quadrados dos erros (

i
2
e ) seja o menor valor possvel.

Vimos que =
i i i
e y E(y ) e = +
i 0 1 i
E(y ) x ,
logo,
| | | | = = +

2 2
2
i i i i 0 1 i
e y E(y ) y ( x ) .

Para encontrar os valores de
0
e
1
que tornam mnima a soma de quadrados dos
erros, devemos, inicialmente, encontrar para a expresso acima as derivadas parciais em
relao a
0
e
1
.


2
i
i 0 1 i
0
2
i
i 0 1 i i
1
e
2 (y x ).( 1)
e
2 (y x ).( x )


Observamos que os valores de
0
e
1
das duas expresses acima variam de acordo
com os valores que se atribui s derivadas parciais. Entretanto, para obter os pontos crticos
(mximos ou mnimos), devemos igualar essas derivadas a zero, onde
0
e
1
assumem um
valor particular, ou seja, representam as estimativas dos parmetros de forma que a soma dos
quadrados dos erros seja mnima. Deste modo, igualando a zero as derivadas parciais, temos


=

i 0 1 i
2 (y x ) 0 , sendo

=

i 0 1 i
(y x ) 0
e
Piana, Machado e Selau Inferncia Estatstica


184

i 0 1 i i
2 (y x ) x , sendo

=

2
i i 0 i 1 i
(y x x x ) 0 .

Podemos, ento determinar os valores de

0
e

1
, atravs de um sistema de
equaes normais.

i 0 1 i
2
i i 0 i 1 i
y x 0
y x x x 0

( )

( )


Aplicando as propriedades da soma, temos

=
=



i 0 1 i
2
i i 0 i 1 i
y n x 0
y x x x 0


)


e arrumando a expresso para que os termos fiquem positivos, temos


=
=



0 1 i i
2
0 i 1 i i i
n x y
x + x y x




A resoluo do sistema pode ser feita por substituio. Comeamos por isolar o

0
na
primeira equao:

+ =
+ =
+ =





0 1 i i
1 i i 0
i i 0
1
n x y
x y n
n n n
x y n
n n n




+ =
=


0 1
0 1
x y
y x


Determinado o valor de

0
, isolamos o

1
na segunda equao:

( )
+ =
+ =
+ =
+ =
+ =
=

= = =





2
0 i 1 i i i
2
1 i 1 i i i
2
i i 1 1 i i i
2
i 1 i 1 i i i
2
i 1 i 1 i i i
2
1 i i i i i
i
i i i i i
i i i
1
2
i 2 i i
i i
x x y x
(y x) x x y x
x y x x x y x
x y x x x y x
x y x x x y x
x x x y x x y
y
y x x y x
y x x y
n
x x x x
x x
n




( )

i i
2
i 2
i
x y
n
.
x
x
n

Piana, Machado e Selau Inferncia Estatstica


185
Os estimadores

0
e

1
so os pontos crticos das razes das equaes

=

2
i
0
e
0 e

2
i
1
e
0 , podendo ser pontos de mnimo ou de mximo. Entretanto, demonstra-se que os
pontos crticos de qualquer funo que seja uma soma de quadrados sero sempre pontos de
mnimo. Da podemos concluir que de

0
e
1

so pontos de mnimo, ou seja, a soma de


quadrados dos erros mnima.

Consideremos agora o experimento descrito no Exemplo 1. importante lembrar que,
sendo uma tcnica de inferncia, a anlise de regresso linear simples tem o objetivo de
determinar a equao que melhor represente o relacionamento entre as variveis na
populao. No exemplo em questo, busca modelar a resposta mdia desta espcie de
forrageira quando diferentes doses de Nitrognio so aplicadas no solo. Sendo assim, cada
parcela do experimento constitui uma amostra da populao para uma determinada dose de
Nitrognio. Atravs da equao da reta ajustada podemos obter as estimativas dos valores
mdios das populaes, denotados por
i
E(y/x ) ou
i
, para qualquer quantidade de Nitrognio
que pertena ao intervalo estudado, no exemplo, de 0 a 200 kg/ha. Vejamos agora como essas
estimativas so obtidas.
Vimos que os valores observados so expressos por = + +
i 0 1 i i
y x e e os valores
esperados por = +
i i 0 1 i
E(y /x ) x . As estimativas destes valores esperados so denotadas por
i
e podem ser obtidas atravs da equao ajustada:

= +
0 1 i i
x



A partir da podemos obter tambm as estimativas dos erros. Sendo =
i i i i
e y E(y /x ) ,
as estimativas dos erros so obtidas por

=
i i ii
e y .

Utilizando os dados do Exemplo 1, vamos estimar os parmetros do modelo de
regresso linear simples. Inicialmente, devemos construir uma tabela auxiliar que inclua todos
os clculos intermedirios para a obteno das estimativas dos parmetros, atravs do modelo
= + +
i 0 1 i i
y x e .

Tabela auxiliar:

i
Dose de
Nitrognio
(
i
x )
Produo de
forragem (
i
y )
2
i
x
i i
x y
1 0 2.160 0 0
2 50 2.880 2.500 144.000
3 100 3.360 10.000 336.000
4 150 3.720 22.500 558.000
5 200 4.020 40.000 804.000
500 16.140 75.000 1.842.000
Mdia 100 3.228 - -

Obtidas a soma de quadrados X e a soma de produtos de X e Y, podemos calcular as
estimativas de
1
e
0
.
Piana, Machado e Selau Inferncia Estatstica


186
( )



= = = =

i i
i i
1
2 2
i
2
i
x y
500 16140
1842000 y x
228000
5 n
9,12
25000 500
x
75000
x
5
n



= = =
0 1
y x 3228 9,12 100 2316

Podemos obter agora as estimativas das mdias de produo de forragem e dos erros
para cada dose de Nitrognio.

Sendo = +
i i
2316 9,12x , temos

= = + = +
1 1
2316 9,12x 2316 9,12 0 2.316 kg/ha;
= = + = +
2 2
2316 9,12x 2316 9,12 50 2.772 kg/ha;
= = + = +
3 3
2316 9,12x 2316 9,12 100 3.228 kg/ha;
= = + = +
4 4
2316 9,12x 2316 9,12 150 3.684 kg/ha;
= = + = +
5 5
2316 9,12x 2316 9,12 200 4.140 kg/ha;

Sendo =
i i ii
e y , temos

= = =
1 1 1
e y 2160 2316 156 kg/ha;
= = =
2 2 2
e y 2880 2772 108 kg/ha;
= = =
3 3 3

e y 3360 3228 132 kg/ha;


= = =
4 4 4
e y 3720 3684 36 kg/ha;
= = =
5 5 5

e y 4020 4140 120 kg/ha.




Na figura abaixo podemos observar o grfico de disperso dos valores de Y com a
reta ajustada.



Piana, Machado e Selau Inferncia Estatstica


187
Admitindo que a varivel resposta tem distribuio normal, os valores
i
estimam a
produes mdias populacionais
i
E(y/x ) correspondentes s cinco doses de Nitrognio
aplicadas. O valor =
5
y 4.020 kg/ha , por exemplo, o valor observado na parcela que recebeu
200 kg/ha de Nitrognio e que constitui uma amostra aleatria da populao que recebe esta
dose, enquanto o valor

=
5
y 4.140 kg/ha a estimativa da mdia desta populao
=
i
E(y/x ) 200, conforme podemos observar na figura a seguir.




importante destacar tambm que o modelo de regresso linear simples pressupe
que as varincias das populaes de valores de Y so iguais para quaisquer valores de X.
Essa homogeneidade de varincias representada na figura 4.4 pelas curvas de mesmo
formato.


4.7.2.2. Testes de significncia para a estimativa de
1


Devemos considerar que as estimativas de
0
e
1
, obtidas at agora, so estimativas
por ponto, de modo que no sabemos o quo prximas elas esto dos parmetros. Dentre os
parmetros do modelo de regresso linear simples, o coeficiente de regresso (
1
)
considerado o mais importante, pois ele quem define a declividade da reta. Sendo assim,
quando estimamos o
1
, devemos verificar se esta estimativa difere significativamente de zero.
Esta verificao feita atravs de um teste de hipteses, cujas hipteses de interesse so:

=

0 1
A 1
H : 0
H : 0


Piana, Machado e Selau Inferncia Estatstica


188
Se o
1
no diferir estatisticamente de zero significa que o efeito linear de X sobre Y
no significativo. Para testar H
0
podemos utilizar dois procedimentos: a anlise da variao e
o teste t, j estudado anteriormente.


Anlise da variao

A anlise da variao consiste em decompor a variao total das observaes,
representada pelos desvios
i
(y y) , em duas partes:
- a variao explicada pela reta da regresso, representada pelos desvios
i
( - y) .
- a variao aleatria, no explicada pela reta, representada pelos desvios
i i
(y ) .
Assim, a variao de cada observao pode ser representada pela seguinte
expresso:

= +
= +

i i i i
i i i
(y y) ( y) (y )

(y y) ( y) e



Esses desvios podem ser observados na figura abaixo, onde temos o grfico de
disperso dos pontos e a reta ajustada para os dados do experimento com Nitrognio
(Exemplo 1).




Considerando que a soma de desvios em relao mdia sempre zero, para
obtermos a variao total das observaes, devemos somar os quadrados dos desvios, o que
resulta
= +

2 2 2
i i i i
(y y) ( y) (y )
variao desvio explicado desvio no explicado
total pela reta pela reta (erro)

Ao dividirmos as somas de quadrados (Q) pelos graus de liberdade obtemos as
varincias (V), tambm denominadas quadrados mdios.

Piana, Machado e Selau Inferncia Estatstica


189
Os graus de liberdade e as varincias (quadrados mdios) so obtidos da seguinte
forma:

Grau de liberdade total:
Total
= n1, onde n o nmero de observaes.

Grau de liberdade da regresso:
Reg
= p1, onde p o nmero de parmetros do
modelo.
Grau de liberdade do erro:
Erro
= np
Varincia da regresso: V
Reg
=
Reg
Reg
Q


Varincia do erro: V
Erro
=
Erro
Erro
Q



A varincia do erro (V
Erro
) e a varincia da regresso (V
Reg
) so utilizados para testar a
hiptese de interesse ( =
0 1
H : 0 ). A V
Erro
estima a variao aleatria (
2
), enquanto a V
Reg

estima a variao da regresso (
2
Reg
) que composta pela variao aleatria (
2
) mais o
efeito linear de X sobre Y (
Reg
), ou seja, = +
2 2
Reg Reg
. Assim, temos um conjunto de
hipteses a respeito das varincias que corresponde ao conjunto de hipteses a respeito do
1
:

>



2 2
0 Reg
2 2
A Reg
H : efeito linear de X sobre Y no significativo
H :



=

0 1
A 1
H : 0 efeito linear de X sobre Y no significativo
H : 0


Para testar H
0
, utilizamos a estatstica F, que definida como a razo entre duas
varincias e tem distribuio F, com parmetros
1
e
2
:

F =
Reg
Erro
V
V


Se esta razo for significativamente maior do que 1 (um), conclumos que a variao
da regresso significativamente maior que a variao do erro e que, portanto, esta diferena
se deve ao efeito linear de X sobre Y. Vale lembrar que o modelo s adequado para explicar
o relacionamento entre as duas variveis quando a parte fixa do modelo (Regresso)
preponderante sobre a parte aleatria (Erro).

Em geral, a anlise da variao apresentada na forma de tabela, conforme o
esquema abaixo.

Tabela da anlise da variao:

Fonte de variao Q E(V) F
Regresso p 1

2
i
( y) +
2
Reg

Reg
Erro
V
V

Erro n p =

2 2
i i i
e y ( )

2


Total n 1

2
i
(y y)

Piana, Machado e Selau Inferncia Estatstica


190
Para facilitar o processo de clculo na obteno das somas de quadrados, as
seguintes frmulas prticas podem ser utilizadas:

Q
Total
=

2
i 2
i
( y )
y
n
;

Q
Reg
=



2 2
1 i
(x x) ;

Q
Erro
= Q
Total
Q
Reg
(por diferena).


A deciso a respeito de H
0
ser tomada comparando o valor da estatstica F com o
valor crtico encontrado na tabela de F.

Rejeitamos H
0
, ao nvel de significncia, se
Reg
Erro
V
f
V
= >
1 2
( , )
f

.

No rejeitamos H
0
, ao nvel de significncia, se
Reg
Erro
V
f
V
= <
1 2
( , )
f

.

Para o Exemplo 1 vamos testar a hiptese de interesse a respeito do
1
. Inicialmente,
obtemos as somas de quadrados, atravs das frmulas prticas. Temos ento:

Q
Total
= = =

2
i 2
i
( y )
260499600
y 54248400 2148480
n 5


Q
Reg
=

= =

2 2 2
1 i
(x x) 9,12 25000 2079360

Q
Erro
= Q
Total
Q
Reg
= 2148480 2079360 = 69120


Obtidas as somas de quadrados, os demais resultados podem ser apresentados
diretamente na tabela da anlise da variao.


Tabela da anlise da variao:

Fonte de variao Q V F
Regresso 1 2.079.360 2.079.360 90,25
Erro 3 69.120 23.040
Total 4 2.148.480


Como o valor calculado f = 90,25 foi maior que o valor crtico
0,01(1,3)
f 34,12 = ,
conclumos, ao nvel = 0,01, que o efeito linear da dose de Nitrognio sobre a produo desta
forrageira significativo, sendo que essa relao pode ser expressa pela equao
= +
i i
2316 9,12x . Isto significa que para cada kg/ha de Nitrognio aplicado no solo a
produo de forragem aumenta, em mdia, 9,12 kg/ha.



Piana, Machado e Selau Inferncia Estatstica


191
Teste t

Outro procedimento que pode ser utilizado para testar =
0 1
H : 0 o teste t. Como j
visto em sees anteriores, utilizamos a estatstica T que tem distribuio t de Student quando
0
H verdadeira. Nesse caso, temos = =
1
0 , resultando:

~



= = =



0
T t( )
S( ) S( ) S( )
,
onde:

=
1
;

=
1
S( ) S( ) ;
= n 2;

A estimativa do erro padro do estimador do coeficiente de regresso, )

( S
1
, obtida
da seguinte forma:
i i
1
2
i
2
1 i i
2
i
y (x x)
V( ) V
(x x)
1
V( ) = V y (x x)
(x x)

| |

= |
|

\
| |
( |

|


2
1 i i
2
2
i
i
1
2
i
2
1
2
i
1
V( ) ( x x) V(y )
(x x)
V(y )
V( )
(x x)
V( )
(x x)

=
(



Sendo
2
um parmetro desconhecido, utilizamos o seu estimador

= =


2 2
i i i 2
(y ) e
S
n 2 n 2



para obter a estimativa da varincia do estimador do coeficiente de regresso

= =



2
i
2
2
1
2 2
i i

e
S
n 2
S ( )
(x x) (x x)

.

Da resulta que

= =

2
i
2
1 1
2
i

e
n 2
S( ) S ( )
(x x)

.

Assim, sob H
0
verdadeira, temos
Piana, Machado e Selau Inferncia Estatstica


192
~ = =

1 1
2
1
i
2
i
T t( )
S( )
e
n 2
(x x)



No exemplo, temos
= = = =

1
1
9,12 9,12
t 9,5
0,96
23040 s( )
25000



Como o valor calculado t = 9,5 foi maior que o valor crtico valor t
/2(3)
= 5,841,
conclumos, ao nvel = 0,01, que o efeito linear da dose de Nitrognio sobre a produo desta
forrageira significativo. Podemos verificar tambm a correspondncia entre os valores das
estatsticas F e T. O valor da estatstica F deve ser igual ao quadrado do valor da estatstica T
=
2
(f t ) . Para esse exemplo temos = = =
2 2
f 90,25 9,5 t .

Vimos em sees anteriores que o teste t bilateral e o intervalo de confiana, para um
mesmo nvel , so procedimentos estatsticos equivalentes de modo que conduzem aos
mesmos resultados. Sendo assim, o intervalo de confiana tambm pode ser utilizado para
verificar se
1
difere significativamente de zero ou no. Utilizando as mesmas expresses
acima deduzidas, podemos obter o intervalo de confiana para o
1
. Partindo da expresso
geral para intervalos de confiana


/2
IC( ; 1 ) : t S( )

,

e fazendo as substituies referentes ao parmetro em questo, temos

1 1 /2 1
2
i
1 1 /2
2
i

IC( ; 1 ) : t S( )
e
n 2
IC( ; 1 ) : t
(x x)




No exemplo, temos
2
i
1 1 /2
2
i
1
1
1

e
n 2
IC( ; 1 ) : t
(x x)
23040
IC( ;0,99) : 9,12 5,841
25000
IC( ;0,99) : 9,12 5,61
Limite inferior : 9,12 5,61 3,51
Limite superior : 9,12 5,61 14,63
P(3,51 14,63) 0,99

=
+ =
< < =



Assim, conclumos que probabilidade de os limites 3,51 e 14,63 conterem o verdadeiro
valor do coeficiente de regresso
1
de 0,99. Portanto, o efeito linear da dose de Nitrognio
sobre a produo da forrageira significativo.
Piana, Machado e Selau Inferncia Estatstica


193
O teste de significncia e o intervalo de confiana para o parmetro
0
so feitos de
maneira anloga. Nesse caso, a estatstica

T t( )
S( )

utilizada considerando o seguinte:

0
= ;
0

= ;
( ) ( )

( (
( ( = = + = +

( (




2
2 2
i 2
0
2 2
i i
e
1 x 1 x
S( ) S( ) S
n n n 2
x x x x
;
= n 2.




4.7.2.3. Intervalos de confiana para as mdias das populaes
i


Como vimos anteriormente,
i
um parmetro e
i
a estimativa pontual desse
parmetro. Vejamos agora como construir um intervalo de confiana para
i
. Consideremos a
expresso geral do intervalo de confiana:


/2
IC( ; 1 ) : t S( )

,
onde:
=
i

=
i


=
i
S( ) S( )


= n 2.

Para obter o erro padro do estimador
i
, partimos do modelo

= +
0 1 i i
x

,
Sendo

=
0 1
y x , temos
= +
= +


1 i
i
i 1
i 1
y x x
y (x x).


Para este modelo temos
i
i
i 1
i 1
2
i i 1
V( ) V y (x x)
V( ) V(y) V (x x)
V( ) V(y) (x x) V( )

(
= +

(
= +

= +




Sendo

i i
1
2
i
y (x x)
(x x)
,
2
V(y)
n
=

e
2
=


2
i
e
n 2
, temos
Piana, Machado e Selau Inferncia Estatstica


194
2
i i 2
i i
2
i
2 2
2
i i
2
i
2
2 i
i
2
i
2
2
i
i
i
2
i
y (x x)
V( ) (x x) V
n (x x)
V( ) (x x)
n (x x)
(x x) 1
V( )
n (x x)
e
(x x) 1
V( )
n n 2 (x x)

| |

= + |
|

\
= +

| |

= + |
|

\
| | | |

= + | |
| |

\ \



Sendo
2
um valor desconhecido, utilizamos o seu estimador
=

2
i 2
e
S
n 2

para obter a estimativa da varincia do estimador
i


| | | | | |

= + = + | | |
| | |

\ \ \



2
2 2
i 2 2 i i
i
2 2
i i

e
(x x) (x x) 1 1
S ( ) S
n n n 2 (x x) (x x)
.
Da resulta que

| | | |

= = + | |
| |

\ \

2
2
i 2 i
i i
2
i

e
(x x) 1
S( ) S ( )
n n 2 (x x)
.

O intervalo de confiana para
i
obtido pela expresso

i i /2 i
2
2
i
i
i i /2
2
i
IC( ; 1 ) : t S( )
e
(x x) 1
IC( ; 1 ) : t
n n 2 (x x)


| || |

+ | |
| |

\ \




Utilizando a expresso acima, vamos construir os intervalos de confiana para as
mdias do Exemplo 1. Na tabela auxiliar abaixo temos os clculos intermedirios e os valores
obtidos para os limites dos intervalos, considerando = 0,05 e o valor t
/2(3)
= 3,183.

i
i
x
i
y
2
i
(x x)
i

2
i
e
i
s( )
/2 i
t s( )


Limite
inferior
Limite
superior
1 0 2160 10000 2.316 24.336 117,58 374,26 1.941,76 2.690,24
2 50 2880 2500 2.772 11.664 83,14 264,63 2.507,37 3.036,63
3 100 3360 0 3.228 17.424 67,88 216,06 3.011,93 3.444,07
4 150 3720 2500 3.684 1.296 83,14 264,63 3.419,37 3.948,63
5 200 4020 10000 4.140 14.400 117,58 374,26 3.765,76 4.514,24
500 16.140 25.000 16.140 69.120 - - - -

A figura a seguir apresenta o grfico de disperso dos valores de Y com os intervalos
ao nvel de 95% de confiana estimados para as mdias
i
. Podemos observar que o intervalo
de confiana tem maior preciso no ponto =
i
x x , onde o desvio
i
(x x) igual a zero.
medida que se distancia da mdia, o intervalo de confiana aumenta sua amplitude, ou seja,
diminui a preciso.
Piana, Machado e Selau Inferncia Estatstica


195


Disperso dos valores de Y com os intervalos ao nvel de 95% de confiana
estimados para as mdias
i
.
Piana, Machado e Selau Inferncia Estatstica


196
4.8. Testes de qui-quadrado (
2
)

4.8.1. Consideraes gerais

At agora tratamos da anlise dos chamados dados de medio ou mensurao, que
so valores referentes a variveis numricas de variao contnua, tais como peso, altura,
temperatura, etc.
Em muitos casos, entretanto, comum o pesquisador defrontar-se com problemas em
que necessita verificar, a partir de um grupo de indivduos (amostra), se frequncias
observadas em classes de uma varivel qualitativa (cor, forma, estado, opinio, etc.) esto de
acordo com frequncias resultantes de uma teoria.
As classes, tambm denominadas categorias, so as alternativas das variveis
qualitativas em estudo. Os indivduos que constituem a amostra so enquadrados nessas
classes e contados. As observaes numricas resultantes dessa contagem so dados de
enumerao e representam as frequncias observadas nessas classes. Os dados de
enumerao provenientes de uma teoria so denominados frequncias esperadas.
O teste que permite verificar se frequncias observadas esto de acordo com
frequncias esperadas denominado teste qui-quadrado por utilizar a estatstica Q que tem
distribuio qui-quadrado. A seguir so relacionados alguns exemplos de propores que
podem ser verificadas atravs do teste qui-quadrado:
- propores de germinao de sementes;
- proporo de pacientes curados aps a aplicao de uma vacina ou medicamento;
- proporo de peas defeituosas que saem de uma linha de montagem;
- em estudos no campo da gentica, propores de fentipos resultantes de
cruzamentos de indivduos.


4.8.2. Estatstica do teste

Quando queremos verificar se as diferenas entre as frequncias observadas e
esperadas nas classes de uma varivel qualitativa so reais ou casuais, utilizaremos o teste
qui-quadrado dado por uma estatstica Q, que tem distribuio qui-quadrado com parmetro .
Esta estatstica assim definida:

Q =
( )

2
k
i i
i=1 i
X E
E
~
2
(),
onde:
X
i
: a frequncia observada da classe i;
E
i
: a frequncia esperada da classe i;
k: nmero total de classes da varivel;
= k 1: o nmero de graus de liberdade ou classes independentes.


O teste qui-quadrado est sujeito a algumas restries que devem ser observadas
sempre que ele for utilizado.

1. O teste vlido apenas para frequncias absolutas. Percentagens e propores devem
ser transformadas em frequncias absolutas antes da realizao do teste.

2. A distribuio qui-quadrado uma distribuio derivada da distribuio normal, sendo,
portanto, uma distribuio contnua. Como os dados analisados atravs de procedimentos qui-
quadrado so provenientes de processos de contagem, algumas consideraes devero ser
feitas para garantir uma boa aproximao.

Piana, Machado e Selau Inferncia Estatstica


197
a) Usar uma correo, chamada de correo de continuidade, sempre que se
trabalha com apenas um grau de liberdade. Essa correo consiste em subtrair
0,5 do mdulo da diferena entre as frequncias observada e esperada, ou seja,

( )

=

2
k
i i
i=1 i
X E 0,5
Q
E
.

b) A aproximao de distribuies discretas para contnuas s razovel quando se
assegura que nenhuma frequncia esperada seja inferior a 5, de forma que a
aproximao melhora para valores maiores. Assim, quando h frequncias
esperadas menores que 5 conveniente agrup-las.



4.8.3. Classificao simples

Quando o objetivo for verificar se as frequncias observadas concordam com as
frequncias esperadas dadas por uma teoria, teremos uma tabela de classificao simples, ou
seja, onde os indivduos so classificados segundo um nico fator qualitativo. De modo geral,
podemos representar esta tabela da seguinte forma

A A
1
A
2
... A
k

Frequncia observada X
1
X
2
... X
k

Frequncia esperada E
1
E
2
... E
k


onde:
A a varivel categrica;
A
i
so as classes (categorias) da varivel;
k o nmero total de classes da varivel;
X
i
so as frequncias observadas nas classes da varivel;
E
i
so as frequncias esperadas para as classes da varivel segundo uma
determinada teoria.

Neste caso, a hiptese de nulidade a ser testada a hiptese de aderncia ou
concordncia que supe que os dados observados se ajustam a teoria dada pelas frequncias
esperadas. A hiptese alternativa, naturalmente, deve supor o contrrio. Assim temos

H
0
: as frequncias observadas concordam com as frequncias esperadas
H
A
: as frequncias observadas no concordam com as frequncias esperadas


4.8.4. Classificao dupla

Em muitos casos, o objetivo no apenas verificar se as frequncias observadas
concordam com as esperadas, mas sim verificar se duas variveis qualitativas (A e B) inerentes
de um mesmo indivduo so ou no independentes entre si.

Neste caso, os indivduos so classificados segundo essas duas variveis e dispostos
em uma tabela de dupla entrada denominada tabela de contingncia. A mais simples dessas
tabelas a 2 2, na qual cada varivel tem apenas duas alternativas (classes). Entretanto,
numa tabela r s (linha por coluna) pode haver mais de duas alternativas para um ou ambas
as variveis.


Piana, Machado e Selau Inferncia Estatstica


198
B
A
B
1
B
2
B
s

Totais
A
1
X
11
(E
11
) X
12
(E
12
) X
1s
(E
1s
) X
1+

A
2
X
21
(E
21
) X
22
(E
22
) X
2s
(E
1s
) X
2+


A
r
X
r1
(E
r1
) X
r2
(E
r2
) X
rs
(E
rs
) X
r+

Totais X
+1
X
+2
X
+s
X
++



O teste efetuado atravs da varivel Q, assim definida:

2
ij ij
i j ij
(X E )
Q
E
~
2
(),
onde:
X
ij
: frequncia observada da linha i e coluna j, sendo i = 1, 2,..., r e j = 1, 2,..., s;
E
ij
: frequncia esperada da linha i e coluna j;
r: nmero total de linhas (classes da varivel A);
s: nmero total de colunas (classes da varivel B);
= (r 1).(s 1) : nmero de graus de liberdade ou classes independentes.

As frequncias esperadas (E
ij
) so obtidas atravs da seguinte expresso

= =
+j i+ +j
ij i+
++ ++
X X X
E X
X X
,

onde:
i+
X : somatrio da linha i
+j
X : somatrio da coluna j
++
X : somatrio de todas as linhas e todas as colunas

A hiptese a ser testada a hiptese de independncia, que supem que as variveis
A e B independem entre si, ou seja,

H
0
: a varivel A independe da varivel B
H
A
: a varivel A depende da varivel B


4.8.5. Critrio de deciso

A regra de deciso a respeito de
0
H pode ser estabelecida com base no valor crtico
( )
q

que, para o nmero de graus de liberdade , delimita a rea (Tabela III do Apndice),
ou seja,

- Rejeitamos H
0
, ao nvel , se
( )
=

2
k
i i
i 1 i
x e
q
e
>
( )
q

.
- No temos motivos suficientes para rejeitar
0
H , se
( )
=

2
k
i i
i 1 i
x e
q
e
<
( )
q

.


Podemos observar na figura abaixo a regio de rejeio de
0
H na curva da
distribuio qui-quadrado:
Piana, Machado e Selau Inferncia Estatstica


199


Consideremos os exemplos resolvidos:

Exemplo 1. Num determinado cruzamento, os indivduos resultantes foram classificados em
quatro fentipos e contados, sendo observado o seguinte:

Fentipo Nmero de indivduos (X
i
)
A 103
B 37
C 28
D 8

Verifique se esse resultado concorda com as respectivas propores de 9/16; 3/16;
3/16 e 1/16 dadas pelas leis de Mendel, usando = 0,05.

Resoluo:

1. Hipteses estatsticas

H
0
: as frequncias observadas concordam com as frequncias esperadas
H
A
: as frequncias observadas no concordam com as frequncias esperadas


2. Estatstica do teste

Obteno das frequncias esperadas (E
i
)

X
i
E
i

103 =
9
176 99
16

37 =
3
176 33
16

28 =
3
176 33
16

8 =
1
176 11
16

176 176

Grau de liberdade: = k - 1 = 4 - 1 = 3

Piana, Machado e Selau Inferncia Estatstica


200
Taxa de erro: = 0,05

( ) ( ) ( ) ( ) ( )
=
= = + + +
= + + + =

2 2 2 2 2
k
i i
i 1 i
x - e 103- 99 37- 33 28- 33 8-11
q
e 99 33 33 11
q 0,1616 0,4848 0,7576 0,8182 2,222


3. Deciso e concluso

Como q = 2,222 <
( )
q

= 7,81, no temos motivos para rejeitar H
0
. Assim, conclumos,
ao nvel de 5% de significncia, que as frequncias observadas no diferem significativamente
das frequncias esperadas segundo as leis de Mendel.



Exemplo 2. Nos resultados de uma determinada pesquisa de opinio, foram obtidas 35
respostas favorveis opo 1 e 46 respostas favorveis opo 2. Verifique se esses
resultados concordam com as propores esperadas de 1/2 para a opo 1 e 1/2 para a opo
2. Use =0,01.

Resoluo:

1. Hiptese estatstica

H
0
: as frequncias observadas concordam com as frequncias esperadas
H
A
: as frequncias observadas no concordam com as frequncias esperadas

2. Estatstica do teste

Obteno das frequncias esperadas (E
i
)

X
i
E
i

35 =
1
81 40,5
2

46 =
1
81 40,5
2

81 81

Grau de liberdade: = k 1 = 2 1 = 1

Taxa de erro: = 0,01

Como o nmero de graus de liberdade igual a 1, obtm-se o valor da estatstica Q
procedendo correo de continuidade:

( ) ( ) ( )
=

= = + = + =

2 2 2
k
i i
i 1 i
x e 0,5 35 40,5 0,5 46 40,5 0,5
q 0,7469 0,7469 1,494
e 40,5 40,5


3. Deciso e concluso

Como q = 1,494 <
( )
q

= 6,63, no temos motivos para rejeitar H
0
. Conclumos, ento,
ao nvel de 1% de significncia, que as frequncias observadas no diferem significativamente
das frequncias esperadas. Portanto, as duas opes tm a mesma frequncia.
Piana, Machado e Selau Inferncia Estatstica


201
Exemplo 3. Trezentos proprietrios de uma certa marca de carro foram entrevistados sobre o
desempenho e o consumo de combustvel de seus carros. Os resultados obtidos na pesquisa
de opinio foram os seguintes:

Desempenho
Consumo
Regular Bom
Totais
Alto 152 48 200
Baixo 88 12 100
Totais 240 60 300

Verifique, com = 0,05, se os atributos consumo e desempenho so independentes.


Resoluo:

1. Hiptese estatstica

H
0
: o consumo independe do desempenho
H
A
: o consumo depende do desempenho

2. Estatstica do teste

Obteno das frequncias esperadas (E
i
)

= =
11
240
E 200 160
300
, = =
12
60
E 200 40
300

= =
21
240
E 100 80
300
, = =
22
60
E 100 20
300


Desempenho
Consumo
Regular Bom
Totais
Alto 152 (160) 48 (40) 200
Baixo 88 (80) 12 (20) 100
Totais 240 60 300

Grau de liberdade: = (r1).(s1) = (2 1) . (2 1) = 1

Taxa de erro: = 0,05

Como o nmero de graus de liberdade igual a 1, obtm-se o valor da estatstica Q
procedendo correo de continuidade:

( ) ( ) ( ) ( ) ( )


= = + + +
= + + + =

2
2 2 2 2
ij ij
i, j i
x e 0,5
152 160 0,5 48 40 0,5 88- 80 - 0,5 12 20 0,5
q
e 160 40 80 20
q 0,3516 1,406 0,7031 2,813 5,274

3. Deciso e concluso

Como q = 5,274 >
( )
q

= 3,84, temos motivos suficientes para rejeitar H
0
. Conclumos,
ento, ao nvel de 5% de significncia, que as frequncias observadas diferem
significativamente das frequncias esperadas. Portanto, o consumo de combustvel depende
do desempenho do carro.
Piana, Machado e Selau Inferncia Estatstica


202
Exemplo 4. O efeito de diversos tratamentos no controle de certa doena est apresentado na
tabela abaixo

Evoluo da doena
Tratamento
Regrediu No regrediu
Totais
A 92 13 105
B 62 12 74
C 35 14 49
D 19 13 32
Totais 208 52 260

Verifique qual a relao existente entre os diversos tratamentos e a evoluo da
doena, utilizando = 0,05.

Resoluo:

1. Hiptese estatstica

H
0
: a evoluo da doena independe do tratamento
H
A
: a evoluo da doena depende do tratamento

2. Estatstica do teste

Obteno das frequncias esperadas (E
i
)

= =
11
208
E 105 84
260
= =
21
208
E 74 59,2
260
= =
31
208
E 49 39,2
260
= =
41
208
E 32 25,6
260


= =
12
52
E 105 21
260
= =
22
52
E 74 14,8
260
= =
32
52
E 49 9,8
260
= =
42
52
E 32 6,4
260



Evoluo da doena
Tratamento
Regrediu No regrediu
Totais
A 92 (84) 13 (21) 105
B 62 (59,2) 12 (14,8) 74
C 35 (39,2) 14 (9,8) 49
D 19 (25,6) 13 (6,4) 32
Totais 208 52 260

Grau de liberdade: = (r1).(s1) = (4 1) . (2 1) = 3

Taxa de erro: = 0,05

( ) ( ) ( ) ( )


= = + + +
= + ++ =

2
2 2 2
ij ij
i, j i
x e
92 84 13 21 13 6,4
q
e 84 21 6,4
q 0,7619 3,048 6,806 15,23


3. Deciso e concluso

Como q = 15,23 >
( )
q

= 7,81, temos motivos suficientes para rejeitar H
0
. Assim,
conclumos, ao nvel de 5% de significncia, que as frequncias observadas diferem
significativamente das frequncias esperadas. Portanto, a evoluo da doena depende do
tratamento utilizado.
Piana, Machado e Selau Inferncia Estatstica


203
4.9. Bibliografia


COSTA, S.F. Introduo Ilustrada Estatstica (com muito humor!). 2.ed., So Paulo:
Harbra, 1992. 303p.

DEVORE, J. Probability and statistics for engineering and the sciences. Brooks/Cole
Publishing Companig. 1982. 640p.

FARIA, E.S. de Estatstica Edio 97/1. (Apostila)

FERREIRA, D.F. Estatstica Bsica. Lavras: Editora UFLA, 2005, 664p.

FREUND, J.E., SIMON, G.A. Estatstica Aplicada. Economia, Administrao e
Contabilidade. 9.ed., Porto Alegre: Bookman, 2000. 404p.

MEYER, P. L. Probabilidade: aplicaes estatstica. Rio de Janeiro: LTC, 1976.

RIBEIRO, J.L.D.; TEN CATEN, C.S. Estatstica Industrial. Porto Alegre, Universidade Federal
do Rio Grande do Sul, 2000. 135p.

SILVA, J.G.C. da. Estatstica Experimental. 1. Planejamento de Experimentos. 1. ed. Pelotas,
RS: Instituto de Fsica e Matemtica, Universidade Federal de Pelotas, 1997. v.1. 216p.

SILVA, J.G.C. da Estatstica experimental: anlise estatstica de experimentos. Pelotas, RS:
Instituto de Fsica e Matemtica, Universidade Federal de Pelotas, 2000. 318p.

SPIEGEL, M.R. Estatstica So Paulo: McGraw-Hill, 1972. 520p.

VIEIRA, S. Estatstica Experimental. 9.ed., So Paulo: Atlas, 1999. 185p.





Apndice



1. Notao somatrio..................................................................................................... 205
2. Noes sobre conjuntos........................................................................................... 206
3. Notao fatorial.......................................................................................................... 209
4. Anlise combinatria................................................................................................. 209
5. Noes sobre derivao e integrao...................................................................... 211
6. Tabelas estatsticas................................................................................................... 213
7. Lista de respostas dos exerccios propostos......................................................... 219
Piana, Machado e Selau Inferncia Estatstica


205
1. Notao somatrio

Consideremos a seguinte tabela de valores:

i x
i
y
i


1 1 2
2 0 1
3 2 -2
4 -1 1
5 4 0

onde:
i o nmero da observao, tal que i = 1, 2, ..., n
n o nmero total de observaes
x
i
o valor da varivel X para a observao i, tal que x
1
= 1, x
2
= 0,...,x
5
= 4
y
i
o valor da varivel Y para a observao i, tal que y
1
= 2, y
2
= 1,...,y
5
= 0
x
(i)
o valor da varivel X para a observao i, tal que x
(1)
x
(2)
... x
(n)
x
(1)
o menor valor da varivel X
x
(n)
o maior valor da varivel X

Somatrio ()

A notao indica a soma seqencial de um conjunto de valores. De modo geral,
temos

n
i
i=1
x




A notao
=

n
i 1
inclui todos os valores do intervalo e pode ser simplificada por , onde
omitimos os ndices, ou seja,
=
=

n
i 1


Exemplos:

1.
=
+ + + + =

5
1 2 3 4 5 i
i 1
x x x x x x
2.
=
+ + =

4
2 3 4 i
i 2
y y y y

Outras quantidades de interesse:
1.
=
+ + + + =

5
2 2 2 2 2 2
1 2 3 4 5 i
i 1
x x x x x x (soma de quadrados)
2. ( )
=
| |
+ + + + =
|
|
\

2
5
2
1 2 3 4 5 i
i 1
x x x x x x (quadrado da soma)
3.
=
+ + + + =

5
1 1 2 2 3 3 4 4 5 5 i i
i 1
x y x y x y x y x y x y (soma de produtos)
4. ( ) ( ) + + + + + + + + =

5 5
1 2 3 4 5 1 2 3 4 5 i i
i=1 i=1
x x x x x y y y y y x y (produto da soma)
Somatrio Valor que est sendo somado
Limite superior da soma
Limite inferior da soma
Nmero da observao
Piana, Machado e Selau Inferncia Estatstica


206
Propriedades da soma

1
a
propriedade: A soma distributiva, ou seja, se cada termo da soma multiplicado
por uma constante c, os termos podem ser somados e a soma multiplicada pela constante.

( )
= =
= + ++ = + + + =

n n
i 1 2 n 1 2 n i
i 1 i 1
c x c x c x c x c x x x c x

2
a
propriedade: A soma de uma constante c sobre n termos igual a n vezes esta
constante.

( )
=
= + ++ = + ++ =

n
i 1
c c c c c 1 1 1 nc

3
a
propriedade: A soma associativa, ou seja, o somatrio da soma igual a soma de
somatrios.
( )
( ) ( ) ( ) ( ) ( )
= = =
+ = +
+ + + ++ + = + ++ + + ++

n n n
i i i i
i 1 i 1 i 1
1 1 2 2 n n 1 2 n 1 2 n
x y x y
x y x y x y x x x y y y


As propriedades devem ser usadas no sentido de simplificar as operaes. Sempre
que houver uma operao que precede a soma, devemos desenvolv-la antes de aplicar as
propriedades.
( ) ( )
= =
= = =
= = =
= =
= +
= +
= +
= +




n n
2
2 2
i i i
i 1 i 1
n n n
2 2
i i
i 1 i 1 i 1
n n n
2 2
i i
i 1 i 1 i 1
n n
2 2
i i
i 1 i 1
x c x 2cx c
x 2cx c
x 2c x c
x 2c x nc



2. Noes sobre conjuntos


Conjunto

Um conjunto uma coleo bem definida de objetos chamados membros ou
elementos. Geralmente, um conjunto denotado por letra maiscula (A, B, C) e os seus
elementos por letras minsculas (a, b, c).
Um conjunto pode ser definido de duas formas:

Mtodo da listagem: relacionando todos os elementos do conjunto.

Exemplo: A = {a, e, i, o, u} conjunto das vogais do alfabeto

Mtodo da propriedade: indicando uma propriedade que seja vlida para todos os
elementos do conjunto e s para eles.

Exemplo: A = {x; x uma vogal} conjunto das vogais do alfabeto
Piana, Machado e Selau Inferncia Estatstica


207
Conjunto universal ou universo

Quando restringimos nosso estudo a subconjuntos de um determinado conjunto, ento
este conjunto chamado de conjunto universal, ou universo, ou espao e denotado por U.

Exemplo: Conjunto dos nmeros reais R

A = {x R; a x b}
B = {x R; 0 < x < b}

Conjunto vazio

O conjunto vazio, denotado por ou { }, um conjunto desprovido de elementos. O
conjunto vazio subconjunto de qualquer conjunto.

Exemplo: A = {x R; x
2
< 0}=


Representao geomtrica de conjuntos

Um universo pode ser representado geometricamente pelo conjunto de pontos
interiores de um retngulo e os seus subconjuntos, tais como A e B, so representados pelos
pontos interiores de crculos. Tais representaes, denominadas diagramas de Venn, so teis
para dar intuio geomtrica sobre a relao entre conjuntos.





Operaes com conjuntos

1. Unio ()

A unio de dois conjuntos A e B, representada por A B, o conjunto de todos os
elementos que pertencem a A ou a B ou a ambos.



Piana, Machado e Selau Inferncia Estatstica


208
2. Interseco ()

A interseco de dois conjuntos A e B, representada por A B, o conjunto de todos
os elementos que pertencem a e a B.





3. Diferena ou complemento relativo

A diferena de dois conjuntos A e B, denotada por A B, ou o complemento de B em
relao a A, denotado por
A
B , o conjunto de todos os elementos que pertencem a A e no
pertencem a B.





4. Complemento absoluto

O complemento absoluto ou simplesmente complemento de A, denotado por A , o
conjunto de todos os elementos que no pertencem a A.



Principais propriedades da unio:
Piana, Machado e Selau Inferncia Estatstica


209

A = A
A A = A
A B = B A
(A B) C = A (B C)
A (B C) = (A B) (A C)

Principais propriedades da interseco:

A =
A A = A
A B = B A
(A B) C = A (B C)
A (B C) = (A B) (A C)


3. Notao fatorial

O produto dos inteiros positivos de 1 a n representado pelo smbolo especial n! (l-
se n fatorial). Assim, temos

= n! 1 2 3 (n 2) (n 1) n

Define-se, tambm, que 0! = 1.

Exemplos:

!
!
! !
! !
! !
= =
= =
= = =

= = =
2 2 1 2
4 4 3 2 1 24
5 5 4 5 24 120
8 8 7 6
8 7 56
6 6



4. Anlise combinatria

Algumas tcnicas de contagem foram desenvolvidas para determinar, sem
enumerao direta, o nmero de elementos de certo conjunto, ou o nmero de resultados
possveis de um certo experimento. Essas tcnicas so chamadas de anlise combinatria.

Seja um conjunto A com n elementos distintos entre si. Se x elementos so retirados
de A possvel formar grupos de trs tipos:

Permutaes: Grupos que se distinguem apenas pela ordem dos seus elementos. Se
x = n, ento, o nmero de possveis permutaes de n dado por

! =
n
P n grupos

Arranjos: Grupos que se distinguem pela ordem e pela natureza dos seus elementos.
Se x < n, ento, o nmero de possveis arranjos de n, tomados x a x, dado por

!
!
=

x
n
n
A
(n x)
grupos
Piana, Machado e Selau Inferncia Estatstica


210
Combinaes: Grupos que se distinguem apenas pela natureza dos seus elementos.
Se x < n, ento, o nmero de possveis combinaes de n, tomados x a x, dado por

!
! !
=

x
n
n
C
x (n x)
grupos

Exemplo:

Seja A = {a, b, c, d}, onde n = 4.

1. Se so retirados quatro elementos, quantos grupos possvel formar?

Se x = n, ento, os grupos formados sero permutaes:

! = =
4
P 4 24 grupos

{(a, b, c, d), (a, b, d, c), (a, c, b, d), (a, c, d, b), (a, d, b, c), (a, d, c, b), (b, a, c, d), (b, a,
d, c), (b, c, a, d), (b, c, d, a), (b, d, a, c) (b, d, c, a), (c, a, b, d), (c, a, d, b), (c, b, a, d), (c, b, d, a),
(c, d, a, b), (c, d, b, a), (d, a, b, c), (d, a, c, b), (d, b, a, c), (d, b, c, a), (d, b, a, c)}


2. Se so retirados dois elementos, quantos grupos que diferem pela ordem e pela
natureza possvel formar?

Se os grupos formados devem diferir pela ordem e pela natureza, ento sero
arranjos:
!
!
= = =

2
4
4 24
A 12
(4 2) 2
grupos

{(a, b), (b, a), (a, c), (c, a), (a, d), (d, a), (b, c), (c, b), (b, d), (d, b), (c, d), (d, c)}


3. Se so retirados dois elementos, quantos grupos que diferem apenas pela natureza
possvel formar?

Se os grupos formados devem diferir apenas pela natureza, ento sero combinaes:

!
! !
= = =
2
4
4 24
C 6
2 (4- 2) 4
grupos

{(a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}


Permutaes com repetio: Grupos com elementos repetidos que se distinguem
apenas pela ordem dos seus elementos. Neste caso, n passa a ser o nmero de elementos
retirados e x o nmero de repeties de um dado elemento. O nmero de possveis
permutaes de n, com x repeties um dado elemento, dado por

!
! !

x,n x
n
n
P
x (n x)
grupos

Exemplo:

Seja um conjunto A formado por trs moedas de ouro e quatro de prata.
A = {o, o, o, p, p, p, p}
Piana, Machado e Selau Inferncia Estatstica


211
1. Se quatro moedas so retiradas, de quantas maneiras diferentes podemos retirar
duas moedas de prata?

Se n = 4 e x =2, ento,

!
! !

= = =

2,4 2
4
4 24
P 6
2 (4 2) 4


{(p, p, o, o), (p, o, p, o), (p, o, o, p), (o, o, p, p), (o, p, o, p), (o, p, p, o)}


2. Se quatro moedas so retiradas, de quantas maneiras diferentes podemos retirar
Trs moedas de prata?

Se n = 4 e x =3, ento,

!
! !
= = =

3,4-3
4
4 24
P 4
3 (4 3) 6


{(p, p, p, o), (p, p, o, p), (p, o, p, p), (o, p, p, p)}

Piana, Machado e Selau Inferncia Estatstica


212
5. Tabelas estatsticas


z 0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2133 0,2157 0,2190 0,2224
0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549
0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Tabela I. rea sob a curva normal padro de 0 a z,
P(0 Z z).
Piana, Machado e Selau Inferncia Estatstica


213


Limites bilaterais: P(( t( > t
/2
)
Nvel de Significncia ()
Graus de
Liberdade ()
0,50 0,20 0,10 0,05 0,025 0,02 0,01 0,005
1 1,000 3,078 6,314 12,706 25,542 31,821 63,657 127,320
2 0,816 1,886 2,920 4,303 6,205 6,965 9,925 14,089
3 0,715 1,638 2,353 3,183 4,177 4,541 5,841 7,453
4 0,741 1,533 2,132 2,776 3,495 3,747 4,604 5,598
5 0,727 1,476 2,015 2,571 3,163 3,365 4,032 4,773

6 0,718 1,440 1,943 2,447 2,969 3,143 3,707 4,317
7 0,711 1,415 1,895 2,365 2,841 2,998 3,500 4,029
8 0,706 1,397 1,860 2,306 2,752 2,896 3,355 3,833
9 0,703 1,383 1,833 2,262 2,685 2,821 3,250 3,690
10 0,700 1,372 1,813 2,228 2,634 2,764 3,169 3,581

11 0,697 1,363 1,796 2,201 2,503 2,718 3,106 3,497
12 0,695 1,356 1,782 2,179 2,560 2,681 3,055 3,428
13 0,694 1,350 1,771 2,160 2,533 2,650 3,012 3,373
14 0,692 1,345 1,761 2,145 2,510 2,624 2,977 3,326
15 0,691 1,341 1,753 2,132 2,490 2,602 2,947 3,286

16 0,690 1,337 1,746 2,120 2,473 2,583 2,921 3,252
17 0,689 1,333 1,740 2,110 2,458 2,567 2,898 3,223
18 0,688 1,330 1,734 2,101 2,445 2,552 2,878 3,197
19 0,688 1,328 1,729 2,093 2,433 2,539 2,861 3,174
20 0,687 1,325 1,725 2,086 2,423 2,528 2,845 3,153

21 0,686 1,323 1,721 2,080 2,414 2,518 2,831 3,135
22 0,686 1,321 1,717 2,074 2,406 2,508 2,819 3,119
23 0,685 1,319 1,714 2,069 2,398 2,500 2,807 3,104
24 0,685 1,318 1,711 2,064 2,391 2,492 2,797 3,091
25 0,684 1,316 1,708 2,060 2,385 2,485 2,787 3,078

26 0,684 1,315 1,706 2,056 2,379 2,479 2,779 3,067
27 0,684 1,314 1,703 2,052 2,373 2,473 2,771 3,057
28 0,683 1,313 1,701 2,048 2,369 2,467 2,763 3,047
29 0,683 1,311 1,699 2,045 2,364 2,462 2,756 3,038
30 0,683 1,310 1,697 2,042 2,360 2,457 2,750 3,030

40 0,681 1,303 1,684 2,021 2,329 2,423 2,705 2,971
60 0,679 1,296 1,671 2,000 2,299 2,390 2,660 2,915
120 0,677 1,289 1,658 1,980 2,270 2,358 2,617 2,860
... 0,674 1,282 1,645 1,960 2,241 2,326 2,576 2,807
0,25 0,10 0,05 0,025 0,0125 0,01 0,005 0,0025
Nvel de Significncia ()
Graus de
Liberdade ()
Limites unilaterais: P(( t( > t

)
Tabela II. Limites da distribuio t de Student.
Piana, Machado e Selau Inferncia Estatstica


214


Nvel de significncia ()
Esquerda (q) Direita (q)
Graus de
Liberdade
()
0,005 0,01 0,025 0,05 0,1 0,1 0,05 0,025 0,01 0,005
1 0,00 0,00 0,00 0,00 0,02 2,71 3,84 5,02 6,63 7,88
2 0,01 0,02 0,05 0,10 0,21 4,61 5,99 7,38 9,21 10,60
3 0,07 0,11 0,22 0,35 0,58 6,25 7,81 9,35 11,34 12,84
4 0,21 0,30 0,48 0,71 1,06 7,78 9,49 11,14 13,28 14,86
5 0,41 0,55 0,83 1,15 1,61 9,24 11,07 12,83 15,09 16,75


6 0,68 0,87 1,24 1,64 2,20 10,64 12,59 14,45 16,81 18,55
7 0,99 1,24 1,69 2,17 2,83 12,02 14,07 16,01 18,48 20,28
8 1,34 1,65 2,18 2,73 3,49 13,36 15,51 17,53 20,09 21,95
9 1,73 2,09 2,70 3,33 4,17 14,68 16,92 19,02 21,67 23,59
10 2,16 2,56 3,25 3,94 4,87 15,99 18,31 20,48 23,21 25,19


11 2,60 3,05 3,82 4,57 5,58 17,28 19,68 21,92 24,72 26,76
12 3,07 3,57 4,40 5,23 6,30 18,55 21,03 23,34 26,22 28,30
13 3,57 4,11 5,01 5,89 7,04 19,81 22,36 24,74 27,69 29,82
14 4,07 4,66 5,63 6,57 7,79 21,06 23,68 26,12 29,14 31,32
15 4,60 5,23 6,26 7,26 8,55 22,31 25,00 27,49 30,58 32,80


16 5,14 5,81 6,91 7,96 9,31 23,54 26,30 28,85 32,00 34,27
17 5,70 6,41 7,56 8,67 10,09 24,77 27,59 30,19 33,41 35,72
18 6,26 7,01 8,23 9,39 10,86 25,99 28,87 31,53 34,81 37,16
19 6,84 7,63 8,91 10,12 11,65 27,20 30,14 32,85 36,19 38,58
20 7,43 8,26 9,59 10,85 12,44 28,41 31,41 34,17 37,57 40,00


21 8,03 8,90 10,28 11,59 13,24 29,62 32,67 35,48 38,93 41,40
22 8,64 9,54 10,98 12,34 14,04 30,81 33,92 36,78 40,29 42,80
23 9,26 10,20 11,69 13,09 14,85 32,01 35,17 38,08 41,64 44,18
24 9,89 10,86 12,40 13,85 15,66 33,20 36,42 39,36 42,98 45,56
25 10,52 11,52 13,12 14,61 16,47 34,38 37,65 40,65 44,31 46,93


26 11,16 12,20 13,84 15,38 17,29 35,56 38,89 41,92 45,64 48,29
27 11,81 12,88 14,57 16,15 18,11 36,74 40,11 43,19 46,96 49,64
28 12,46 13,56 15,31 16,93 18,94 37,92 41,34 44,46 48,28 50,99
29 13,12 14,26 16,05 17,71 19,77 39,09 42,56 45,72 49,59 52,34
30 13,79 14,95 16,79 18,49 20,60 40,26 43,77 46,98 50,89 53,67


40 20,71 22,16 24,43 26,51 29,05 51,81 55,76 59,34 63,69 66,77
50 27,99 29,71 32,36 34,76 37,69 63,17 67,50 71,42 76,15 79,49
60 35,53 37,48 40,48 43,19 46,46 74,40 79,08 83,30 88,38 91,95
70 43,28 45,44 48,76 51,74 55,33 85,53 90,53 95,02 100,43 104,21
80 51,17 53,54 57,15 60,39 64,28 96,58 101,88 106,63 112,33 116,32
90 59,20 61,75 65,65 69,13 73,29 107,57 113,15 118,14 124,12 128,30
100
67,33 70,06 74,22 77,93 82,36 118,50 124,34 129,56 135,81 140,17
Nota: Se o teste for bilateral, o valor de deve ser dividido por dois.
Tabela III. Limites unilaterais da distribuio qui-quadrado (
2
).
Piana, Machado e Selau Inferncia Estatstica


215


2

1 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 60 120 Inf.

0,05 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,0 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
1 0,025 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,7 963,3 968,6 976,7 984,9 984,9 993,1 997,2 1001, 1006, 1010, 1014, 1018,
0,01 4052, 5000, 5403, 5625, 5764, 5859, 5928, 5982, 6022, 6056, 6082, 6106, 6157, 6209, 6235, 6261, 6287, 6313, 6339, 6366,
0,001 4053* 5000* 5404* 5625* 5764* 5859* 5929* 5981* 6023* 6056* 6084* 6107* 6158* 6209* 6235* 6261* 6287* 6313* 6340* 6366*

0,05 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
2 0,025 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,50
0,01 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,41 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50
0,001 998,5 999,0 999,2 999,2 999,3 999,3 999,4 999,4 999,4 999,4 999,4 999,4 999,4 999,4 999,5 999,5 999,5 999,5 999,5 999,5

0,05 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
3 0,025 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 39,43 14,17 14,12 14,08 14,04 13,99 13,95 13,90
0,01 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,13 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
0,001 167,0 148,5 141,1 137,1 134,6 132,8 131,6 130,6 129,9 129,2 128,8 128,3 127,4 126,4 125,9 125,4 125,0 124,5 124,0 123,5

0,05 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,93 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
4 0,025 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,66 8,56 8,51 8,46 8,41 8,36 8,31 8,26
0,01 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46
0,001 74,14 61,25 56,18 53,44 51,71 50,53 49,66 49,00 48,47 48,05 47,70 47,41 46,76 46,10 45,77 45,43 45,09 44,75 44,40 44,05

0,05 6,61 5,79 5,41 5,19 5,05 4,95 4,88 8,82 4,77 4,74 4,70 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
5 0,025 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,46 6,33 6,28 6,23 6,18 6,12 6,07 6,02
0,01 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
0,001 47,18 37,12 33,20 31,09 29,75 28,84 28,16 27,64 27,24 26,92 26,64 26,42 25,91 25,39 25,14 24,87 24,60 24,33 24,06 23,79

0,05 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
6 0,025 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,27 5,17 5,12 5,07 5,01 4,96 4,90 4,85
0,01 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
0,001 35,51 27,00 23,70 21,92 20,81 20,03 19,46 19,03 18,69 18,41 18,18 17,99 17,56 17,12 16,89 16,67 16,44 16,21 15,99 15,75

0,05 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 6,60 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
7 0,025 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 3,51 4,47 4,42 4,36 4,31 4,25 4,20 4,14
0,01 12,25 9,55 8,45 7,85 4,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
0,001 29,25 21,69 18,77 17,19 16,21 15,52 15,02 14,63 14,33 14,08 13,88 13,71 13,32 12,93 12,73 12,53 12,33 12,12 11,91 11,70

0,05 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
8 0,025 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,10 4,00 3,95 3,89 3,84 3,78 3,73 3,67
0,01 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,74 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86
0,001 25,42 18,49 15,83 14,39 13,49 12,86 12,40 12,04 11,77 11,54 11,35 11,19 10,84 10,48 10,30 10,11 9,92 9,73 9,53 9,33

0,05 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
9 0,025 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,77 3,67 3,61 3,56 3,51 3,45 3,39 3,33
0,01 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
0,001 22,86 16,39 13,90 12,56 11,71 11,13 10,70 10,37 10,11 9,89 9,72 9,57 9,24 8,90 8,72 8,55 8,37 8,19 8,00 7,81

0,05 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
10 0,025 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,52 3,42 3,37 3,31 3,26 3,20 3,14 3,08
0,01 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,78 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91
0,001 21,04 14,91 12,55 11,28 10,48 9,92 9,52 9,20 8,96 8,75 8,59 8,45 8,13 7,80 7,64 7,47 7,30 7,12 6,94 6,76

0,05 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
11 0,025 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,33 3,23 3,17 3,12 3,06 3,00 2,94 2,88
0,01 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60
0,001 19,69 13,81 11,56 10,35 9,58 9,05 8,66 8,35 8,12 7,92 7,76 7,63 7,32 7,01 6,85 6,68 6,52 6,35 6,17 6,00

0,05 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
12 0,025 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,18 3,07 3,02 2,96 2,91 2,85 2,79 2,72
0,01 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36
0,001 18,64 12,97 10,80 9,63 8,89 9,38 8,00 7,71 7,48 7,29 7,14 7,00 6,71 6,40 6,25 6,09 5,93 5,76 5,59 5,42


*
Estes valores devem ser multiplicados por 100. Continua


Tabela IV. Limites unilaterais superiores da distribuio F:
P[F > f

]
Piana, Machado e Selau Inferncia Estatstica


216

Continuao

2

1 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 60 120 Inf.

0,05 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
13 0,025 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 3,05 2,95 2,89 2,84 2,78 2,72 2,66 2,60
0,01 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17
0,001 17,81 12,31 10,21 9,07 8,35 7,86 7,49 7,21 6,98 6,80 6,65 6,52 6,23 5,93 5,78 5,63 5,47 5,30 5,14 4,97

0,05 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,56 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
14 0,025 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,95 2,84 2,79 2,73 2,67 2,61 2,55 2,49
0,01 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00
0,001 17,14 11,78 9,73 8,62 7,92 7,43 7,08 6,80 6,58 6,40 6,26 6,13 5,85 5,56 5,41 5,25 5,10 4,94 4,77 4,60

0,05 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
15 0,025 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,86 2,76 2,70 2,64 2,59 2,52 2,46 2,40
0,01 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87
0,001 16,59 11,34 9,34 8,25 7,57 7,09 6,74 6,47 6,26 6,08 5,94 5,81 5,54 5,25 5,10 4,95 4,80 4,64 4,47 4,31

0,05 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,45 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
16 0,025 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,79 2,68 2,63 2,57 2,51 2,45 2,38 2,32
0,01 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,61 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 2,75
0,001 16,12 10,97 9,00 7,94 7,27 6,81 6,46 6,19 5,98 5,81 5,67 5,55 5,27 4,99 4,85 4,70 4,54 4,39 4,23 4,06

0,05 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
17 0,025 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,72 2,62 2,56 2,50 2,44 2,38 2,32 2,25
0,01 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65
0,001 15,72 10,66 8,73 7,68 7,02 6,56 6,22 5,96 5,75 5,58 5,44 5,32 5,05 4,78 4,63 4,48 4,33 4,18 4,02 3,85

0,05 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
18 0,025 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,67 2,67 2,56 2,50 2,44 2,38 2,32 2,26 2,19
0,01 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,44 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57
0,001 15,38 10,39 8,49 7,46 6,81 6,35 6,02 5,76 5,56 5,39 5,25 5,13 4,87 4,59 4,45 4,30 4,15 4,00 3,84 3,67

0,05 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
19 0,025 5,92 4,51 3,90 3,36 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,62 2,51 2,45 2,39 2,33 2,27 2,20 2,13
0,01 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49
0,00115,08 10,16 8,28 7,26 6,62 6,18 5,85 5,59 5,39 5,22 5,08 4,97 4,70 4,43 4,29 4,14 3,99 3,84 3,68 3,51

0,05 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
20 0,025 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,57 2,46 2,41 2,35 2,29 2,22 2,16 2,09
0,01 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,30 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42
0,001 14,82 9,95 8,10 7,10 6,46 6,02 5,69 5,44 5,24 5,08 4,94 4,82 4,56 4,29 4,15 4,00 3,86 3,70 3,54 3,38

0,05 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
21 0,025 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,53 2,42 2,37 2,31 2,25 2,18 2,11 2,04
0,01 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36
0,001 14,59 9,77 7,94 6,95 6,32 5,88 5,56 5,31 5,11 4,95 4,81 4,70 4,44 4,17 4,03 3,88 3,74 3,58 3,42 3,26

0,05 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
22 0,025 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,50 2,39 2,33 2,27 2,21 2,14 2,08 2,00
0,01 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31
0,001 14,38 9,61 7,80 6,81 6,19 5,76 5,44 5,19 4,99 4,83 4,70 4,58 4,33 4,06 3,92 3,78 3,63 3,48 3,32 3,15

0,05 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
23 0,025 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,47 2,36 2,30 2,24 2,18 2,11 2,04 1,97
0,01 7,88 5,66 4,76 4,26 3,94 9,71 3,54 3,41 3,30 3,21 3,14 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26
0,001 14,19 9,47 7,67 6,69 6,08 5,65 5,33 5,09 4,89 4,73 4,60 4,48 4,23 3,96 3,82 3,68 3,53 3,38 3,22 3,05

0,05 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
24 0,025 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,44 2,33 2,27 2,21 2,15 2,08 2,01 1,94
0,01 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21
0,001 14,03 9,34 7,55 6,59 5,98 5,55 5,23 4,99 4,80 4,64 4,51 4,39 4,14 3,87 3,74 3,59 3,45 3,29 3,14 2,97

0,05 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
25 0,025 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,41 2,30 2,24 2,18 2,12 2,05 1,98 1,91
0,01 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,05 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,27 2,17
0,001 13,88 9,22 7,45 6,49 5,88 5,46 5,15 4,91 4,71 4,56 4,42 4,31 4,06 3,79 3,66 3,52 3,37 3,22 3,06 2,89

0,05 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
26 0,025 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,39 2,28 2,22 2,16 2,09 2,03 1,95 1,88
0,01 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,23 2,13
0,001 13,74 9,12 7,36 6,41 5,80 5,38 5,07 4,83 4,64 4,48 4,35 4,24 3,99 3,72 3,59 3,44 3,30 3,15 2,99 2,82
0,05 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,16 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
27 0,025 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,36 2,25 2,19 2,13 2,07 2,00 1,93 1,85
0,01 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,98 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,20 2,10
0,001 13,61 9,02 7,27 6,33 5,73 5,31 5,00 4,76 4,57 4,41 4,28 4,17 3,92 3,66 3,52 3,38 3,23 3,08 2,92 2,75


Continua
Piana, Machado e Selau Inferncia Estatstica


217

Continuao

2

1 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 60 120 Inf.


0,05 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
28 0,025 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,34 2,23 2,17 2,11 2,05 1,98 1,91 1,83
0,01 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,95 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,17 2,06
0,001 13,50 8,93 7,19 6,25 5,66 5,24 4,93 4,69 4,50 4,35 4,22 4,11 3,86 3,60 3,46 3,32 3,18 3,02 2,86 2,69

0,05 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
29 0,025 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,32 2,21 2,15 2,09 2,03 1,96 1,89 1,81
0,01 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,92 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,14 2,03
0,001 13,39 8,85 7,12 6,19 5,59 5,18 4,87 4,64 4,45 4,29 4,16 4,05 3,80 3,54 3,41 3,27 3,12 2,97 2,81 2,64

0,05 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,12 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
30 0,025 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,31 2,20 2,14 2,07 2,01 1,94 1,87 1,79
0,01 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,90 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01
0,001 13,29 8,77 7,05 6,12 5,53 5,12 4,82 4,58 4,39 4,24 4,11 4,00 3,75 3,49 3,36 3,22 3,07 2,92 2,76 2,59

0,05 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
40 0,025 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,18 2,07 2,01 1,94 1,88 1,80 1,72 1,64
0,01 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80
0,001 12,61 8,25 6,60 5,70 5,13 4,73 4,44 4,21 4,02 3,87 3,75 3,64 3,40 3,15 3,01 2,87 2,73 2,57 2,41 2,23

0,05 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
60 0,025 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 2,06 1,94 1,88 1,82 1,74 1,67 1,58 1,48
0,01 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60
0,001 11,97 7,76 6,17 5,31 4,76 4,37 4,09 3,87 3,69 3,54 3,42 3,31 3,08 2,83 2,69 2,55 2,41 2,25 2,08 1,89

0,05 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,86 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
120 0,025 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,94 1,82 1,76 1,69 1,61 1,53 1,43 1,31
0,01 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,40 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38
0,001 11,38 7,32 5,79 4,95 4,42 4,04 3,77 3,55 3,38 3,24 3,12 3,02 2,78 2,53 2,40 2,26 2,11 1,95 1,76 1,54

0,05 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
Inf. 0,025 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,83 1,71 1,64 1,57 1,48 1,39 1,27 1,00
0,01 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,24 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00
0,001 10,83 6,91 5,42 4,62 4,10 3,74 3,47 3,27 3,10 2,96 2,84 2,74 2,51 2,27 2,13 1,99 1,84 1,66 1,45 1,00


Fonte: Silva, 2000.

Piana, Machado e Selau Inferncia Estatstica


218
6. Lista de respostas dos exerccios propostos

Unidade II - Estatstica Descritiva

2.1
j Classe
j
F
j
F
j
f
j
f
1 0 20 20 0,50 0,50
2 1 7 27 0,18 0,68
3 2 7 34 0,18 0,85
4 3 3 37 0,08 0,93
5 4 2 39 0,05 0,98
6 5 0 39 0,00 0,98
7 6 0 39 0,00 0,98
8 7 1 40 0,03 1,00
Total 40 - 1 -

2.2. k = 7 i = 12,89

j Classe j
F
j
F
j
f
j
f
j
c
1 3,11| 16,00 8 8 0,16 0,16 9,555
2 16,00| 28,89 20 28 0,4 0,56 22,445
3 28,89| 41,78 6 34 0,12 0,68 35,335
4 41,78| 54,67 8 42 0,16 0,84 48,225
5 54,67| 67,56 3 45 0,06 0,9 61,115
6 67,56| 80,45 1 46 0,02 0,92 74,005
7 80,45||93,34 4 50 0,08 1 86,895
50 - 1 - -

2.3. Grfico

2.4. r = -0,7732

2.5. x = 9,75 Mo = 9 Md = 9,5 a
t
= 8 s
2
= 6,79 s = 2,61 CV = 26,72%

2.6. Q
1
= 58 Q
2
= 67 Q
3
= 70 a
q
= 12

2.7. x = 1,075 Mo = 0 Md = 0,5 s
2
= 1,87 s = 1,31 CV = 127,07%
m
2
= 1,819 m
3
= 2,815 m
4
= 11,419 a
3
= 1,147 a
4
= 3,45
Classificao: assimtrica positiva e leptocrtica.

2.8. x = 34,56 Mo = 16,00 |-- 28,89 Md = 16,00 |-- 28,89 s
2
= 491,06 s = 22,16
CV = 64,12% m
2
=481,24 m
3
=11011,7 m
4
=755077 a
3
=1,043 a
4
=3,260
Classificao: assimtrica positiva e leptocrtica.

2.9.
a) EI = 3,1 Q
1
= 19,27 Md = 27,86 Q
3
= 45,4 ES = 93,3
b) Os valores 85,76 ; 86,37 e 93,34 so considerados discrepantes
c) Grfico
d) Distribuio assimtrica negativa

2.10. Assimetria negativa
6| 32 55 75
7| 18 60 60 83 84
8| 26 31 34 39 42 54 65 65 66 86 88
9| 01 12 19 39 54 61
Piana, Machado e Selau Inferncia Estatstica


219
Unidade III - Elementos de probabilidade

3.1. 0,5303

3.2. 0,3801

3.3. a) 0,6 b) 0,4 c) 0,75 d) 0,25
e) 0,6 f) 0,4 g) 0,75 h) 0,25

3.4. P(A|D) = 0,3623 P(B|D) = 0,4058 P(C|D) = 0,2319

3.5. 0,66

3.6. a) 0,7283 b) 0,2092

3.7. a) 1,20 b) 0,90 c) 2,10 d) 0,30 e) 0,70 f) 0,72
g) 0,63 h) -0,36 i) 0,63 j) 2,07 k) -0,5345

3.8. 0,6836

3.9. 0,0758

3.10. 0,2242

3.11. a) E(X) = 15 V(X) = 8,33
b) 0,4190

3.12. P(X > 50) = 0,5488 P(X > 100) = 0,5488

3.13. R$ 0,25

3.14. a) 0,4582 b) 0,2090 c) 0,1587

3.15. a) 0,6078 b) 0,0912 c) 447,6

3.16. nota mnima para A = 73,83
nota mxima para R = 70,33


Unidade IV - Inferncia Estatstica

4.1. (59.606; 63.378)

4.2.

4.3. a)

b) (-0,785; -0,115)

4.4. (; )

4.5. (0,0695; 0,1465)

4.6. a) t
0,05
= 2,776 H
0
no rejeitada
b) t
0,025
= 3,495 H
0
no rejeitada
c) t
0,025
= 3,495 H
0
no rejeitada
d) A varivel em estudo tem distribuio normal
Piana, Machado e Selau Inferncia Estatstica


220
4.7. a) 5% = P (erro Tipo I)
b) 0,0975
c) 0,8063

4.8. a) 0,6513
b) 0,6126

4.9. t
0,025
=
t
c
= (teste bilateral)
No se rejeita H
0
.

4.10. t
0,005
=
z
c
= (teste bilateral)
No se rejeita H
0
.


4.11. f
0,05
=
f
c
= (teste bilateral)
No se rejeita H
0
.


4.12. z
0,05
= -1,645
z
c
= -0,5774 (teste unilateral)
No se rejeita H
0
.

Você também pode gostar