Escolar Documentos
Profissional Documentos
Cultura Documentos
Estat-Stica Completa PDF
Estat-Stica Completa PDF
ES TATSTICA
D E - UFSM
2003
Sum rio
1 Conceitos bsicos
1.1 Populao x Amostra
1.2 Censo x Amostragem
1.3 Dado x Varivel
1.4 Parmetros x estatsticas
1.5 Arredondamento de dados
1.6 Fases do mtodo estatstico
2 Representao tabular
2.1 Representao esquemtica
2.2 Elementos de uma tabela
2.3 Sries estatsticas
2.4 Distribuio de freqncia
3 Representao grfica
3.1 Grficos de Linhas
3.2 Grficos de colunas ou barras
3.3 Grficos circulares ou de Setores (Pie Charts)
3.4 Grfico Pictorial - Pictograma
3.5 Grfico Polar
3.6 Cartograma
3.7 Grficos utilizados para a anlise de uma distribuio de freqncia
4 Medidas descritivas
4.1 Medidas de posio
4.2 Medidas de variabilidade ou disperso
4.3 Medidas de disperso relativas
4.4 Momentos, assimetria e curtose
4.5 Exerccios
6 Distribuies de Probabilidade
6.1 Distribuies discretas de probabilidade
6.2 Exerccios
6.2 Distribuies contnuas de probabilidade
6.4 Exerccios
7 Amostragem
7.1 Conceitos em amostragem
7.2 Planos de amostragem
6.3 Tipos de amostragem
7.4 Amostragem com e sem reposio
7.5 Representao de uma distribuio amostral
7.6 Distribuies amostrais de probabilidade
7.7 Exerccios
7.8 Estatsticas amostrais
7.9 Tamanho da amostra
8 Estimao de parmetros
8.1 Estimao pontual
8.2 Estimao intervalar
8.3 Exerccios
9 Testes de hipteses
9.1 Principais conceitos
8.2 Teste de significncia
9.3 Exerccios
9.4 Testes do Qui-quadrado
9.5 Exerccios
10 Regresso e Correlao
10.1 Introduo
10.2 Definio
10.3 Modelo de Regresso
10.4 Mtodo para estimao dos parmetros e
10.5 Decomposio da varincia Total
10.6 Anlise de Varincia da Regresso
10.7 Coeficiente de Determinao (r)
10.8 Coeficiente de Correlao (r)
10.9 Exerccios
11 Referncias bibliogrficas
1 Conceitos B sicos
Uma populao pode, mediante processos operacionais, ser considerada infinita, pois a mesma ir depender
do tamanho da amostra. Se a freqncia relativa entre amostra e populao for menor do que 5% ela
considerada infinita, se a freqncia relativa for maior do 5% ela considerada finita.
Varivel: aquilo que se deseja observar para se tirar algum tipo de concluso, geralmente
as variveis para estudo so selecionadas por processos de amostragem. Os smbolos
utilizados para representar as variveis so as letras maisculas do alfabeto, tais como X, Y,
Z, ... que pode assumir qualquer valor de um conjunto de dados. As variveis podem ser
classificadas dos seguintes modos:
1
- Qualitativas (ou atributos): So caractersticas de uma populao que no pode ser
medidas.
Discretas: so aquelas variveis que pode assumir somente valores inteiros num
conjunto de valores. gerada pelo processo de contagem, como o nmero de
veculos que passa em um posto de gasolina, o nmero de estudantes nesta sala de aula.
Contnuas: so aquelas variveis que podem assumir um valor dentro de um intervalo
de valores. gerada pelo processo de medio. Neste caso serve como exemplo o
volume de gua em um reservatrio ou o peso de um pacote de cereal.
2
1.5 Arredondamento de Dados
3 a) Se o primeiro algarismo aps aquele que formos arredondar for 5, seguido apenas
de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se
ele for mpar, desprezando os seguintes.
Ex.: 6,2500 (para dcimos) 6,2
12,350 (para dcimos) 12,4
Se o 5 for seguido de outros algarismos dos quais, pelo menos um diferente de zero, aumentamos uma
unidade no algarismo e desprezamos os seguintes.
Ex.: 8,2502 (para dcimos) 8,3
8,4503 (para dcimos) 8,5
3
1.6 Fases do mtodo estatstico
a) Definio do Problema
Consiste na:
b) Planejamento
Determinar o procedimento necessrio para resolver o problema:
Os dados podem ser obtidos pela prpria pessoa (primrios) ou se baseia no registro
de terceiros (secundrios).
4
2 Repre se ntao tab ular
Ttulo
Cabealho
Corpo
Rodap
5
2.3 Sries Estatsticas
Anos Produo
1976 9 702
1977 9 332
1978 9 304
1979 9 608
1980 10 562
Fonte: Conjuntura Econmica (fev. 1983)
Regio Populao
Norte 3 037
Nordeste 17 568
Sudeste 42 810
Sul 11 878
Centro-Oeste 5 115
Total 80 408
Fonte: Anurio Estatstico (1984)
Localizao Populao
Urbana 80 408
Rural 38 566
Total 118 974
Fonte: Anurio Estatstico (1984)
6
Srie Mista ou Composta: A combinao entre duas ou mais sries constituem novas
sries denominadas compostas e apresentadas em tabelas de dupla entrada. O nome da
srie mista surge de acordo com a combinao de pelo menos dois elementos.
REGIES
Anos N NE SE S CO
1940 406 3 381 7 232 1 591 271
1950 581 4 745 10 721 2 313 424
1960 958 7 517 17 461 4 361 1 007
1970 1 624 11 753 28 965 7 303 2 437
1980 3 037 17 567 42 810 11 878 5 115
Fonte: Anurio Estatstico (1984)
Xi fi
6.3 2
8.4 3
5.3 2
9.5 3
6.5 5
15
Fonte: Departamento de Estatstica (1990)
7
b) Distribuio de Freqncias Intervalar: Na distribuio de freqncia, os intervalos
parciais devero ser apresentados de maneira a evitar dvidas quanto classe a que permanece
determinado elemento.
Altura (cm) Xi fi
150 |--- 158 154 18
158 |--- 166 162 25
166 |--- 174 170 20
174 |--- 182 178 52
182 |--- 190 186 30
190 |--- 198 194 15
---- 160
Fonte: Departamento de Estatstica (1990)
Para determinar o nmero de classes a partir dos dados no tabelados, podemos usar a
Frmula de Sturges, mas deve-se saber que existem outros mtodos de determina o do
nmero de classes em uma tabela de freqncia. O que se deseja fazer apenas comprimir um
conjunto de dados em uma tabela, para facilitar a visualizao e interpretao dos mesmos.
Alm da Regra de Sturges, existem outras frmulas empricas para resolver o problema para determinao
do nmero de classes [n(k)], h quem prefira n ( k) n . Entretanto, a verdade que essas frmulas no
nos levam a uma deciso final; esta vai depender na realidade de um julgamento pessoal, que dever estar
ligado a natureza dos dados, procurando, sempre que possvel, evitar classes com freqncias nulas ou
freqncias relativas exageradamente grandes.
8
Amplitude do intervalo de classe (h): a diferena entre dois limites inferiores ou
superiores consecutivos.
h = l n l n 1 ou h = L n L n 1
A amplitude do intervalo de classe deve ser constante em todo a distribuio de freqncias intervalar.
Amplitude total (H): a diferena entre o limite superior da ltima classe e o limite
inferior da 1 classe, ou a diferena entre ltimo e o primeiro elemento de um conjunto de
dados postos em ordem crescente.
H = L n l1
Ponto mdio de classe (X i): a mdia aritmtica simples do limite inferior com o limite
superior de uma mesma classe.
li + Li
Xi =
2
Quando substituirmos os intervalos de classes pelos pontos mdios (Xi), ter-se- uma distribuio de
freqncia pontual.
Freqncia Relativa (fr i): o quociente entre a freqncia absoluta da i-sima classe
com o somatrio das freqncias.
n
fri = n
fi
Obs.: fr i =1
f
i =1
i
i=1
9
3 Represen ta o gr fica
10500
10000
Produo
9500
9000
8500
1976 1977 1978 1979 1980
Anos
20000 S
CO
15000
10000
5000
0
1940 1950 1960 1970 1980
Fonte: Anurio Estatstico (1984)
10
3.2 Grficos de colunas ou barras
50000 42810
40000
30000
Pop. 17568
20000 11878
3037 5115
10000
0
N NE SE S CO
Regies
As larguras das barras que devero ser todas iguais podendo ser adotado qualquer dimenso, desde que seja
conveniente e desde que no se superponham. O nmero no topo de cada barra pode ou no omitido, se
forem conservados, a escala vertical pode ser omitida.
45000
40000
35000 N
30000 NE
25000 SE
20000 S
15000
CO
10000
5000
0
1940 1950 1960 1970 1980
11
b) Colunas Sobrepostas (grfico comparativo)
100000
80000 CO
S
60000 SE
40000 N
NE
20000
0
1940 1950 1960 1970 1980
As regras usadas para o grfico de barras so igua is as usadas para o grfico de colunas.
CO 5115
S 11878
Regies SE 42810
NE 17568
N 3037
Assim como os grficos de Colunas podem ser construdos grficos de barras comparativas.
12
Caractersticas:
- A rea do grfico equivale totalidade de casos (360o = 100%);
- Cada fatia representa a percentagem de cada categoria
32%
Urbana
Rural
68%
Tem por objetivo despertar a ateno do pblico em geral, muito desses grficos
apresentam grande dose de originalidade e de habilidade na arte de apresentao dos dados.
1500
1250
1000
750
500
250
0
1968 1974 1980 1986 1990 1994
13
3.4.1 Exemplos de pictogramas
3.631.647
1987
2.473.581
1985
1.277.107
1983
9.645
1979
Pinus
6,8%
Eucalipto
Madeira 24,4%
nativa
68,8%
14
3.5 Grfico Polar
o tipo de grfico ideal para representar sries temporais cclicas, ou seja, toda a srie
que apresenta uma determinada periodicidade.
4) Traa -se semi-retas a partir do ponto 0 (plo) passando pelos pontos de diviso;
Mdia = 237,31 mm
15
3.6 Cartograma
Exemplo:
Populao da Regio Sul do Brasil 1990 Densidade populacional da Regio Sul do Brasil 1990
Fonte: IBGE
Fonte: IBGE
16
3.7 Grficos utilizados para a anlise de uma distribuio de freqncia
3.7.1 Histograma
17
3.6.3 Ogivas
Caractersticas:
- Cada barra representa a freqncia do intervalo respectivo;
- Os intervalos devem ter a mesma amplitude;
- As barras devem estar todas juntas.
18
A simples observao da forma do Figura 4.1 Histograma
histograma permite algumas concluses.
Veja a figura 4.1. A medida dos dados est 60
no centro do desenho. As freqncias mais 50
altas tambm esto no centro da figura. 40
Nos processos industriais, esta a forma 30
desejvel. 20
10
0
19
Figura 4.4 Histograma em plateau
Freqncia Freqncia
60 60
50 50
40 40
30 30
20 20
10 10
0 0
20
3.7.6 Curva de freqncia curva polida
Quando for em fazer o uso da curva polida convm mostrar as freqncias absolutas, por meio de
um pequeno circulo, de modo que qualquer interessado possa julgar se esse ponto se o ponto
um dado original ou um dado polido.
21
Altura em centmetros de 40 alunas do Curso de Enfermagem da UFSM - 1996
a) Curva simtrica
Esta curva caracteriza-se por apresentar o valor mximo no ponto central e os pontos
eqidistantes desse ponto terem a mesma freqncia.
31
b) Curvas assimtricas
32
4 Medidas Descritivas
Mdia Aritmtica
Representativas - Mdias Mdia Geomtrica
Mdia Harmnica
Mediana
Separatrizes Quartis
Decis
Centis ou Percentis
Dados No Tabelados
n N
Xi X i
X= i =1
ou = i =1
n N
33
Dados Tabelados com Valores Ponderados
7.8 2 W i
i=1
8.3 3
8.2 2
5.8 3
10
Fonte: Dados Hipotticos
Distribuio de freqncias
- Mdia Aritmtica ( X )
Altura (cm) Xi fi Xi . fi X= i =1
n
1a) A Mdia Aritmtica Simples dever estar entre o menor e o maior valor observado,
Xmin. X Xmax.
d = ( x i ) = zero
i =1 i =1
34
3 a) Somando-se ou subtraindo-se todos os valores (Xi) da srie por uma constante "k"
(k 0), a nova mdia aritmtica ser igual a mdia original somada ou subtrada por
esta constante "k".
xi yi = x i k
X Y =Xk
A aplicao da mdia geomtrica deve ser feita, quando os valores do conjunto de dados
considerado se comportam segundo uma progresso geomtrica (P.G.)ou dela se aproximam.
Dados No Tabelados
n
Xg = n X i = n X 1.X 2 . ... .X n
i =1
Dados Tabelados
fi n fi
Xg = i =1
X
i=1
i
fi
= i =1 f f f
X1 1 .X2 2 . ....Xn n
f i .logXi
1 1
n
( f1. log X1+f2 . logX2 +...+f n. logX n ) n
fi fi i =1
Xg = 10i=1 = 10 i=1
35
c) Mdia Harmnica (Xh)
Dados No Tabelados
n n
X h = n
=
1 1 1 1
i =1 Xi X1
+
X2
+ ... +
Xn
Dados Tabelados
n
fi
f 1 + f 2 + .. . + f n
Xh = i =1
n
=
fi f1 f f
i= 1 Xi X1
+ 2 + . .. + n
X2 Xn
a) Dados no tabelados
i(n + 1)
Posio =
S
i =1 1 i 3
se for mediana se for quartis
S = 2 S=4
36
1 i 9 1 i 99
se for decis se for centis
S = 10 S = 100
Dados Tabelados
i.n
Fant .h
+
S
S i = l Si
f Si
onde:
Si = Md i = 1;
S i = Q i 1 i 3;
Si = Di 1 i 9 ;
Si = C i ou Pi 1 i 99
l Si limite inferior da classe que contm a separatriz;
i.n
posio da separatriz;
S
Fant freqncia acumulada da classe anterior a que contm a separatriz;
h amplitude do intervalo de classe;
fSi freqncia absoluta da classe que contm a separatriz;
37
a) Dados no tabelados
Ex.: 3 4 4 4 5 5 6 6 7 8 9 Mo = 4 (unimodal)
5 6 7 8 9 10 11 12 13 Mo = / (amodal)
1 1 2 2 3 3 3 4 5 5 5 Mo1 = 3 Mo 2 = 5 (bimodal)
5 5 6 6 7 7 8 8 Mo = / (amodal)
5 5 6 6 7 7 8 Mo1 = 5 Mo2 = 6 Mo3 = 7 (multimodal)
Acima de 3 modas usamos o termo multimodal.
Dados Tabelados
- Moda de Czuber (Mo c ): O processo para determinar a moda usado por Czuber leva
em considerao as freqncias anteriores e posteriores classe modal.
1 1 = f Mo f ant
Mo c = lMo + .h
1 + 2 2 = f Mo f pos
onde:
f pos
Mo k = l Mo + .h
f +f
pos ant
38
- Moda de Pearson (Mo p): O processo usado por Pearson pressupe que a
distribuio seja aproximadamente simtrica, na qual a mdia aritmtica e a mediana so
levadas em considerao.
Mop = 3 Md - 2 X
x = Md = Mo curva simtrica
x = Md = Mo
M od a
M e d ian a
M di a
Mo Md x x Md Mo
39
4.1.8 Exerccios
1)
3 7 8 10 12 13 15 17 18 21
4 6 8 11 13 14 17 18 19 22 25
2)
Alturas dos alunos da Turma X
no 1o sem. de 1994 - UFSM
Alturas fi
63 15
75 25
84 30
91 20
90
Fonte: Dados Hipotticos
3)
Alturas dos alunos da Turma Y
no 1 o sem. de 1994 UFSM
Alturas fi Fi
61 |--- 65 12 12
65 |--- 69 23 35
69 |--- 73 34 69
73 |--- 77 26 95
77 |--- 81 15 110
110 110
Fonte: Dados Hipotticos
40
Para estudarmos as medidas de variabilidade para dados no tabelados usaremos um
exemplo prtico. Supomos que uma empresa esteja querendo contratar um funcionrio, e no
final da concorrncia sobraram dois candidatos para uma nica vaga. Ento foi dado 4 tarefas
para cada um, onde as mesmas tiveram como registro o tempo (em minutos) de execuo.
TAREFAS 1 2 3 4
OPERRIO 1 (TEMPO) 55 45 52 48
OPERRIO 2 (TEMPO 30 70 40 60
- Anlise Grfica
H = Xmax Xmin
i =1
n
mdio X X = 0 , assim ficando:
i =1
i
X i X
X 1 X + X2 X +... + X n X
d= i =1
=
n n
41
(f )
n
Xi X
i =1
i f1 X 1 X + f 2 X 2 X + ... + f n X n X
d = n
= n
f i f i
i =1 i=1
(X X)
n
2
2= i =1
i
=
(X 1 X ) + ( X 2 X ) + ... + ( X n X )
2 2 2
n n
(X X)
n
2
S2 = i =1
i
=
(X 1 X ) + (X 2 X ) + ... + (X n X )
2 2 2
n 1 n 1
f (X X)
n
2
f1 ( X 1 X ) + f 2 (X 2 X ) + ... + f n (X n X )
i i 2 2 2
i =1
2 = n
= n
f i f i
i =1 i =1
f (X X)
n
2
f1 (X 1 X ) + f 2 ( X 2 X ) + ... + f n ( X n X )
i i 2 2 2
i =1
S2 = n
= n
f
i =1
i 1 f
i=1
i 1
42
- Desvio Padro: S (amostra) ou (populao)
(X X)
n
2
= i =1
i
=
(X 1 X ) + (X 2 X ) + ... + (X n X )
2 2 2
n n
(X X)
n
2
S= i =1
i
=
(X 1 X ) + ( X 2 X ) + ... + ( X n X )
2 2 2
n 1 n 1
f (X X)
n
2
f 1 (X 1 X ) + f 2 (X 2 X ) + ... + f n ( X n X )
i i 2 2 2
i =1
= n
= n
f i =1
i f
i =1
i
f (X X)
n
2
f1 ( X 1 X ) + f 2 ( X 2 X ) + ... + f n ( X n X )
i i 2 2 2
i =1
S= n
= n
f i
1 f i
1
i =1 i =1
(n - 1) usado como um fator de correo, onde devemos considerar a varincia amostral como uma
estimativa da varincia populacional.
- Propriedades da Varincia
1) Somando-se ou subtraindo-se uma constante k a cada valor observado a varincia no ser alterada;
2) Multiplicando-se ou dividindo-se por uma constante k cada valor observado a varincia ficar
multiplicada ou dividida pelo quadrado dessa constante.
R
=
d2
43
forma, essa relao entre a amplitude e o desvio padro de uma amostra que permite fazer
grficos de controle X R .
n 2 3 4 5 6 7 8 9 10 11 12 13 14
d2 1,128 1,693 2,059 2,326 2,534 2,704 2,847 2,970 3,078 3,173 3,258 3,336 3,407
n 15 16 17 18 19 20 21 22 234 24 25 --- ---
d2 0,347 3,532 3,532 3,640 3,689 3,735 3,778 3,819 3,858 3,391 3,391 --- ---
Fonte: Montgomery, D.C. Statical Quality Control. Nova York, Wyley. 1991.
- Varincia relativa
Relativa
- Coeficiente de Variao (Pearson)
- Varincia Relativa
2 S2
V. R .= ou
2 X2
S
C.V. = ou x 100
X
44
Para estudar as medidas de assimetria e curtose, necessrio o conhecimento de certas
quantidades, conhecidas como momentos.
4.4.1 Momentos
mr =
X r
i
, para dados no tabelados;
n
mr =
X f r
i i
, para dados tabelados.
f i
onde:
(X X) d
r r
Mr =
i
=
i
, para dados no-tabelados
n n
(X X) d
r r
fi fi
= = , para dados tabelados
i i
Mr
f i n
onde: M0 = 1;
M1 = 0;
M2 = varincia (s2).
45
- Momentos abstratos (r)
4.4.2 Assimetria
Uma distribuio de valores sempre poder ser representada por uma curva (grfico).
Essa curva, conforme a distribuio, pode apresentar vrias formas. Se considerarmos o valor
da moda da distribuio como ponto de referncia, vemos que esse ponto sempre corresponde
ao valor de ordenada mxima, dando-nos o ponto mais alto da curva representativa da
distribuio considerada, logo a curva ser analisada quanto sua assimetria.
X Mo Md
- Distribuio Assimtrica
46
Quando no tivermos condies de calcularmos o desvio padro podemos usar a
seguinte frmula:
Q 3 + Q 1 2 Md
As =
Q 3 Q1
M3
3 =
s3
- Intensidade da assimetria:
4.4.3 Curtose
- Curva Leptocrtica: uma curva mais alta do que a normal. Apresenta o topo
relativamente alto, significando que os valores se acham mais agrupados em torno da moda.
- Curva Platicrtica: uma curva mais baixa do que a normal. Apresenta o topo
achatado, significando que vrias classes apresentam freqncias quase iguais.
47
- Coeficiente de Curtose
Q 3 Q1
K=
2( P90 P10 )
Interpretao:
- Se 4 = 3 curva Mesocrtica;
4.5 Exerccios
Para os exerccios abaixo construa uma tabela de disperso o suficiente para determinar
as medidas de posio (mdia aritmtica, mediana e moda de czuber), disperso (desvio padro
e varincia, coeficiente de variao de Pearson), assimetria (coeficiente de assimetria, e
coeficiente de curtose). Faa um relatrio referente ao comportamento dos dados em funo
dos resultados obtidos.
4,0 4,2 4,3 4,4 4,5 4,5 4,6 5,0 5,1 5,2
5,3 5,3 5,5 5,7 5,8 6,0 6,1 6,3 6,4 6,5
6,6 6,7 6,8 6,9 7,0 7,2 7,5 7,6 7,7 7,9
8,0 8,3 8,5 8,6 8,8 8,9 9,0 9,1 9,2 9,3
9,3 9,4 9,4 9,5 9,5 9,6 9,7 9,8 9,9 10,0
48
2) Os dados a seguir refere-se a altura em centmetros de 70 alunos da PUCC, turma 6,
ano 2000.
153 154 155 156 158 160 160 161 161 161
162 162 163 163 164 164 165 166 167 167
168 168 169 169 170 170 170 171 171 172
172 173 173 174 174 175 175 176 177 178
179 179 180 182 183 184 185 186 186 187
188 188 189 189 190 191 192 192 192 192
193 194 194 195 197 197 199 200 201 205
50,00 52,50 53,50 54,00 54,20 55,50 56,30 56,50 57,00 58,10
58,50 59,00 60,30 61,50 62,00 62,90 63,50 64,00 64,30 65,00
66,00 66,25 67,50 68,00 68,70 69,50 70,00 72,00 75,00 76,50
77,00 78,00 80,00 81,50 82,50 83,50 85,00 87,30 88,00 89,10
90,00 91,35 92,10 93,20 94,00 95,25 96,00 97,00 98,00 99,80
100,10 100,20 101,00 102,00 103,40 104,30 105,00 107,00 108,00 109,10
49
5 P roba bilid ad e e Va ri veis Aleatria s
50
b - embora no se possa prever que resultados ocorrero, pode-se descrever o
conjunto de resultados possveis;
5.2.2.1 Finito
Nmero limitado de elementos;
Ex.: S = {1, 2, 3, 4, 5, 6}
5.2.2.2 Infinito
Nmero ilimitado de elementos, pode ser sub-dividido em:
a - Enumervel
Quando os possveis resultados puderem ser postos em concordncia biunvoca com
o conjunto dos nmeros naturais (N) (caso das variveis aleatrias discretas).
Ex.: N
b - No Enumervel
Quando os possveis resultados no puderem ser postos em concordncia biunvoca
com o conjunto dos nmeros naturais (caso das variveis aleatrias contnuas).
Ex.: R
5.2.4.1 A unio B
Smbolo utilizado "U ", o evento que ocorrer se, e somente se, A ou B ou ambos
ocorrerem;
51
S
A B
5.2.4.2 A interseo B
Smbolo utilizado "I ", o evento que ocorrer se, e somente se, A e B ocorrem
simultaneamente.
U
A B
A B
FIGURA 6.2 - Evento A interseo B
5.2.4.3 Complementar de A
_
Simbologia " A ", o evento que ocorrer se, e somente se A no ocorrer.
A
_
FIGURA 6.3 - Evento complementar de A (A )
52
5.2.5 Tipos de eventos
53
A I B , se A e B forem Quaisquer;
logo,
P (A I B) = P( A ) . P(B)
S = { 1, 2, 3, 4 } A = {1, 2 } B = { 2, 4 } A I B = { 2}
P(A I B ) = P( A ) . P(B)
P(A I B ) =
2 2 1
P (A ) = P( B) =
4 4 4
( B) = P(AP(B)
PA
I B)
( )
onde P(B) > 0. Se P(B) = 0, tem-se que P A B no definida.
54
AI BICID =
FIGURA 6.6 - Evento coletivamente exaustivos
55
a
P(E) = ,
a+b
onde os resultados devem ser verossmeis (possvel e verdadeiro) e permite a observao dos
valores da probabilidade antes de ser observado qualquer amostra do evento (E).
Seja () um experimento, seja (S) um espao amostral associado a (). A cada evento
(E) associa-se um nmero real representado por P(E) e denominaremos de probabilidade de E,
satisfazendo as seguintes propriedades:
a - 0 P(E) 1;
b - P(S) = 1;
c - Se A e B so eventos mutuamente excludentes, ento:
P(A U B) = P(A) + P(B).
P(A) = P(A U )
P(A) = P(A) + P()
56
P() = P(A) - P(A)
P() = 0.
_ _
Teorema 2 - Se o evento A for o evento complementar de A, ento P(A )=1-P(A).
_ _
Prova: A U A = S, mas A e A so mutuamente excludentes, ento:
_
P(A U A ) = P(S)
_ _
P(A U A ) = P(A) + P( A )
_
P(A) + P( A ) = 1
logo,
_
P(A ) = 1 - P(A).
_
(A U B) = A U (B I A )
57
e
_
B = (A I B) U (B I A )
_
P(A U B) = P[A U (B I A )]
_
P(A U B) = P(A) + P(B I A ) ( -)
e
_
P(B) = P[(A I B) U (B I A )]
_
P(B) = P(A I B) + P(B I A )
ou
_
P(B I A ) = P(B) - P(A I B) ( --)
Decorrncias do Teorema 3:
P(A U B U C) = P[(A U B) U C]
58
n n n
P(A 1 U A 2 U... U A n ) = P(A i ) P(A i I A j ) + P(A I A i j IAk ) +
i =1 i < j =2 i < j< k = 3
n
P(A I A i j I A k I A l ) + ... + ( 1) n 1 P(A1 I A 2 I... I A n ).
i < j <k <l = 4
RESUMO
59
5.4 Exerccios
3) Uma urna contm 5 bolas pretas, 3 vermelhas e 2 brancas. Trs bolas so retiradas.
Qual a probabilidade de retirar 2 pretas e 1 vermelha ?
a) sem reposio (1/4)
b) com reposio (9/40)
6) Faa o exerccio anterior considerando 0,5 a chance do homem estar vivo e 0,2 a
chance da mulher estar viva e compara os resultados.
60
9) Um conjunto de 80 pessoas tem as caractersticas abaixo:
11) Num ginsio de esportes, 26% dos frequentadores jogam vlei, 36% jogam basquete
e 12% praticam os dois esportes. Um dos frequentadores sorteado para ganhar uma
medalha. Sabendo-se que ele joga basquete, qual a probabilidade de que tambm
jogue vlei ?
61
5.5 Teorema de Bayes
A i , i = 1, 2, ..., k
UA i = S,
i =1
Ai I A j = , i j
B = (B I A 1 ) U (B I A 2 ) U...U (B I A k )
como
62
P(B I A i )
P A i = , ( ---)
B P(B)
P(A i ).P B
Ai
P i = k
A
, j = 1, 2, ..., k .
B
P(A j ).P
B
j =1
Aj
Exemplo:
Urna U1 U2 U3
Azul 3 4 3
Cores
Branca 1 3 3
Preta 5 2 3
Escolhe-se uma urna ao acaso e dela extrai-se uma bola ao acaso, verificando-se que
ela branca. Qual a probabilidade dela ter sado da urna:
U1 ? U2 ? U3 ?
63
FIGURA 1 - Representao de uma varivel aleatria
Uma varivel X ser discreta (V.A.D.) se o nmero de valores de x(s) for finito ou
infinito numervel. Caso encontrarmos x(s) em forma de intervalo ou um conjunto de
intervalos, teremos uma varivel aleatria contnua (V.A.C.).
A probabilidade de que uma varivel aleatria "X" assuma o valor "x" uma funo
de probabilidade, representada por P(X = x) ou P(x).
64
Para cada possvel resultado de x teremos:
0 P( X) 1;
P(X ) = 1
i =1
i
1 a) F(X) = P( x )
xi x
i
2 a) F() = 0
3 a) F(+ ) = 1
4 a) P(a < x b) = F(b) F(a)
5 a) P(a x b) = F(b) F(a) + P(X = a )
6 a) P( a < x < b) = F(b) F(a ) P( X = b)
Definio: Seja X uma V.A.D., com valores possveis x1, x2, ..., xn,... ; Seja P(xi) =
P(X = xi), i = 1, 2, ..., n, ... . Ento, o valor esperado de X (ou Esperana
Matemtica de X), denotado por E(X) definido como
65
E( X) = xi P(xi )
i =1
se a srie E( X) = xi P(xi ) convergir absolutamente, isto , se |x | P(x ) < ,
i i este
i =1 i =1
Definio: Seja X uma V.A.D. . Define-se a varincia de X, denotada por V(X) ou 2x,
da seguinte maneira:
V(X) = ( xi E(X)) .P(x i ) ou V(X) = E(X 2 ) E( X)
2 2
i =1
onde E (X 2 ) = x 2i P( xi ) e a raiz quadrada positiva de V(X) denominada o desvio-padro
i =1
de X, e denotado por x.
66
Pelo fato de que a rea representa probabilidade, e a mesma tem valores numricos
positivos, logo a funo precisa estar inteiramente acima do eixo das abscissas (x).
Definio: A funo f(x) uma Funo Densidade de Probabilidade (f.d.p.) para uma
V.A.C. X, definida nos reais quando
f (x) 0 ;
+
f(x) dx = 1 ;
b
P(a x b) = f(x) dx .
a
Definio: Seja X uma V.A.C. com f.d.p. f(x). O valor esperado de X definido como
+
E(X) = x.f(x) dx
-
+
Conseqentemente, diremos que E(X) existir se, e somente se,
| x | f(x) for
finita.
67
5.7.8 Varincia de uma V.A.C.
onde
+
E(X 2 ) = x2 f(x) dx
5.8 Exemplos
i) Representao grfica
0,6
0,5
0,4
0,3
0,2
0,1
0
0 1 2
68
ii) Representao grfica
F(x) = 0 se x<0
F(X) = 1 se x 2
iii)
1 1 3
a) P (0 < x < 2) = F ( 2) F (0) P ( X = 2) = 1 =
4 4 4
b) P(0 x 1) = F(1) F( 0) + P( X = 0) = 4 4 + 4 = 4
3 1 1 3
c) P(0 < x 2) = F( 2) F( 0) = 1 4 = 4
1 3
Varincia
1 2 2 1 6
E(X 2 ) = x 2i P( xi ) = 0 .
2
+1 . + 22 . =
4 4 4 4
i =1
6 4 2
V(X) = E(X 2 ) E( X) = 4 4 = 4 = 0.5
2
69
- Varivel Aleatria Contnua
i)
ii)
x
para x<0 F(X ) = 0 dx = 0
x
0
x
para 0 x < 1 F(X ) = 0 dx + 2x dx = 0 + x 2 [ ]x
0 = x2
para x 1
x
0 1
+
F (X ) = 0 dx + 2x dx + 0 dx = 0 + x 2 [ ] 1
0 +0 =1
70
Representao grfica
3 3
[ ]
2 2
1 3 3 1 8
iii) P x = 14 2 x dx = x2 41 = = = 0,5
4 4 4 4 16
4 4
[ ]
1 1 1
2 31 2
iv) E(X) = x f(x) dx = x 2x dx = 2 x2 f(x) dx = x =
0 0 0 3 0 3
[ ]
1 1 1
2 41 1
E(X2 ) = x2 f(x) dx = x 2 2x dx = 2x 3 f(x) dx = x =
0 0 0 4 0 2
logo,
2
1 2 9 8
V(X) = E(X 2 ) [E(X)] =
2 1
= =
2 3 18 18
5.9 Exerccios
1) Admita que a varivel X tome valore 1, 2 e 3 com probabilidades 1/3, 1/6 e 1/2
respectivamente.
71
X = nmero de pontos obtidos no 1o dado.
Y = nmero de pontos obtidos no 2o dado.
i) W = X - Y
ii) A = 2 Y
iii) Z = X . Y
i) P (-3 < W 3) v) P (Z = 3)
ii) P (0 W 4) vi) P (A 11)
iii) P (A > 6) vii) P (20 Z 35)
iv) P (Z 5.5) viii) P 3,5 < Z < 34)
P(X ) =
K
x para x = 1, 3, 5 e 7
a) calcule o valor de k b) Calcular P(X=5)
c) E(X) d) V(X)
72
5) Seja f (x ) = 2 (1 x ), 0 < x < 1 ,
3 2
0, caso contrrio
i) Ache a funo de repartio e esboce o grfico.
ii) Determine E(X) e V(X).
1
6) Seja f (x ) = 2 x, 0 x 2 ,
0, caso contrrio
i) Ache a funo de repartio e esboce o grfico.
ii) P(1< x < 1,5).
iii) E(X) e V(X).
6x (1 x ), 0 < x < 1
8) A funo de probabilidade de uma V.A.C. X f (x ) =
0, caso contrrio
a) Determine F(X) e represente graficamente.
1
b) Calcule P x 2
c) E(X) e V(X)
73
9) Uma varivel aleatria X tem a seguinte f.d.p.:
f(x) = 0 x<0
f(x) = Ax 0 x < 500
f(x) = A(100 - x) 500 x < 1000
f(x) = 0 x 1000
a) Determine o valor de A.
b) P (250 x 750).
1 1
a) Calcule: P 2 x 2 , b) P(X = 0)
74
6 Distrib uies de Proba bilid ade
ou ainda:
A, A, ..., A , A, A, ..., A
14 4244 3 14 4244 3
x sucessos n-x fracassos
P(A I A I...I A I A I A I ... I A) = P(A). P(A). ... . P(A ).P(A ). P(A). ... . P(A)
_
P(A).P(A). ... .P(A) . P(A). P(A). ... .P(A ) , onde P(A)= p e P(A ) = q,
1444 424444 3 1444 424444 3
x sucessos n- x fracassos
75
nessa condio a varivel aleatria X tem distribuio de Bernoulli, e sua funo de
probabilidade (f. p.) (funo de probabilidade) dada por:
P(X = x) = p x .q n x .
E( X) = xi P(xi )
i =1
E( X) = x1 P(x1 ) + x2 P(x 2 )
E(X) = 0. P(0) + 1. P(1)
E(X) = 0.q + 1.p
E (X) = p
V(X) = E(X 2 ) E( X)
2
onde
E (X 2 ) = x 2i P( xi )
i =1
E( X 2 ) = 0.q + 1.p = p
logo
V(X) = p p 2
V(X) = p.(1 - p )
V(X) = p . q
O termo "Binomial" utilizado quando uma varivel aleatria esta agrupada em duas
classes ou categorias. As categorias devem ser mutuamente excludentes, de modo a deixar bem
claro a qual categoria pertence determinada observao; e as classes devem ser coletivamente
exaustivas, de forma que nenhum outro resultado fora delas possvel
76
Sejam, "p" probabilidades de sucesso e "q" probabilidades de falha, ou seja p + q
= 1.
E( X) = xi P(xi )
i =1
n
E(X) = x. p x q n x
x
como P(X) segue uma Distribuio de Probabilidade, temos:
n
i =1
P(X = x i ) = 1 ou p x q n x = 1
x =1 x
0
logo,
n!
E (X) = x. p x q n x
x(x - 1)!(n - x)! x =1
(n -1)!
E (X) = n. p x q nx , ou seja para s = x - 1 e x = s + 1, temos
(x -1)!(n - x)! x =1
n - 1 s +1 n (s+1)
E(X) = n. p q
x =1 s
77
n - 1 s
E(X) = n. p .p q (n 1) s
x =1 s
n - 1 s (n1) s
E(X) = n.p p . q
x =1 s
14 4424443
1
E(X) = n . p
V(X) = E(X 2 ) E( X)
2
onde
E(X 2 ) = x 2i P( xi )
i =1
n!
E(X ) = x.x
2
E(X2 ) = n. p ( np p + 1
E( X 2 ) = n 2 p 2 np 2 + np
V(X) = n 2 p 2 np 2 + np - (np) 2
V(X) = n. p.(1 - p)
V( X) = n. p.q
78
6.1.2.3 Esperana Matemtica e Varincia para a Probabilidade de Sucesso (p)
de uma Distribuio Binomial
p.q
E(p) = p e V(p) =
n
6.1.3 Distribuio de Poisson
Quando numa distribuio binomial o tamanho "n" das observaes for muito
grande e a probabilidade "p" de sucesso for muito pequena, a probabilidade x de ocorrncia de
um determinado nmero de observaes segue uma Distribuio de Poisson.
n!
= n.( n 1).( n 2). ... .(n - x + 1) n x
(n x)!
logo,
n x x n x
P(x) = p q .
x!
Se p 0 e n >> x logo, q n x q n = (1 p)
n
assim,
(n. p) x (1 p) n
P (x) =
x!
(n.p)
x
n( n 1)
P(x) = 1 n.p + (p) 2 + ...
x! 2 .1
(n.p)
x
( n.p) 2
P(x) 1 n.p + + ...
x! 2!
79
(n. p) x e -n.p
P(x) =
x!
Substituindo o valor esperado n.p por e considerando-o como sendo o nmero
mdio de ocorrncia expresso em unidades de tempo, pode-se dizer que a taxa mdia de
falhas (falha / unid. tempo) e t o tempo, logo o nmero mdio de falhas ser t , assim,
xt . e-
P( x) =
x!
fornece a probabilidade de x falhas no perodo de tempo t.
E( X) = xi P(xi )
i =1
e - x
E (X) = x
x =1 x!
- x
e
E( X) = , substituindo s = x -1 e x = s + 1 temos:
x =1 (x - 1)!
e- s+1
E (X) =
x =1 s!
e - s
E(X) =
x =1 s!
1 424 3
1
E(x) =
V(X) = E(X 2 ) E( X)
2
onde
E (X 2 ) = x 2i P( xi )
i =1
e - x
E( X 2 ) = x. x , substituindo s = x - 1 e x = s + 1 temos:
x =1 x(x - 1)!
80
e - s+1
E (X 2 ) = (s + 1)
x =1 s!
e - s
E(X 2 ) = (s +1)
x =1 s!
e - s
e - s
E(X 2 ) = s +
1 x =1
424 s!3 1 1 2s!
x =4 43
E(X) 1
E(X) 2 = 2 +
V(X) = 2 + ( ) 2
V(X) =
6.2 Exerccios
2) Em 320 famlias com 4 crianas cada uma, quantas se esperaria que tivessem:
a) nenhuma menina; b) 3 meninos c) 4 meninos
81
6) Se 5% das lmpadas de certa marca so defeituosas, achar a probabilidade de que,
numa amostra de 100 lmpadas, escolhidas ao acaso, tenhamos:
a) nenhuma defeituosa (use binomial e poisson)
b) 3 defeituosas;
c) mais do que uma boa;
7) Uma fabrica de pneus verificou que ao testar seus pneus nas pistas, havia em mdia
um estouro de pneu a cada 5.000 km.
a) qual a probabilidade que num teste de 3.000 km haja no mximo um pneu
estourado ?
b) Qual a probabilidade de um carro andar 8.000 km sem estourar nenhum pneu ?
11) Suponha que haja em mdia 2 suicdios por ano numa populao de 50.000 hab.
Em uma cidade de 100.000 habitantes, encontre a probabilidade de que um dado
ano tenha havido: a) nenhum suicdio; b) 1 suicdio; c) 2 ou mais suicdios.
82
6.3 Distribuies Contnuas de Probabilidade
1
se a x b
f(x) = b a .
0 se x < a ou x > b
+
E(X) = x f(x) dx
1
b
E(X) = x dx
a b-a
b
1 x2
E(X) =
b - a 2 a
b2 a 2
E (X) =
2(b a)
( b - a) (b + a)
E(X) =
2(b a)
(b + a)
E( X) =
2
83
6.3.1.2 Varincia da Distribuio Uniforme
V(X) = E(X 2 ) E( X)
2
+
E(X 2 ) = x 2 f(x) dx
1
E(X 2 ) = x 2
b
dx
a b-a
1 b 2
b - a a
E(X 2 ) = x dx
b
1 x3
E(X ) =
2
b-a 3 a
b3 a 3
E(X ) =
2
3( b a)
(b - a)(b 2 + ab + a 2 )
E( X 2 ) =
3(b a)
b + ab + a 2
2
E( X ) =
2
3
b + ab + a 2 b + a
2 2
V(X) =
3 2
b2 + ab + a 2 b 2 ab + a 2
V(X) =
3 4
4b + 4ab + 4a 3b 2 6ab 3a 2
2 2
V(X) =
12
b2 2ab + a2
V(X) =
12
(b a) 2
V(X) =
12
Uma varivel aleatria X, que tome todos os valores reais - < x < + tem
distribuio normal quando sua funo densidade de probabilidade (f.d.p.) for da forma:
2
1 x
1
f(x) = e 2
, < x < +
2
84
Os parmetros e seguem as seguintes condies:
f(x) d(x) = 1
x
fazendo t = temos:
t
+ + 1
f(x) d(x) = 2 dt = I .
e 2
2
(t 2 +s 2 )
1 + +
I =
2 2
e dt ds
2 - -
introduzindo coordenadas polares para realizar o clculo dessa integral dupla, temos:
s = r cos e t = r sen
Como < s < + e < t < + , 0 < r < + e 0 < a < 2 , portanto
r2
1 2 +
2 0
I =
2
re 2
dr d
0
+
1 2 2
2
r
2 0
I =
2
e d
0
1 2
2 0
I2 = ( 0 1) d
1 2
I2 = 0
2
85
1
I2 = 2 = 1
2
I = 1 , logo I = 1 como queramos mostrar.
+
E(X) = x f(x) dx
2
1 x
+ 1
E(X) = x e 2
dx
2
x x
fazendo z = , z = e x = z +,
z
1 +
E(X) =
2
( z + ) e 2
dz
z z
1 + 1 +
E(X) = z e dz +
2
e dz
2
2 1 4243
124 42 443
zero
um
86
E(X) =
V(X) = E(X 2 ) E( X)
2
+
E(X 2 ) = x 2 f(x) dx
2
1 x
+ 1
E(X ) = x
2 2
e dx 2
2
x x
fazendo z = , z = e x = z +,
z
1 +
E(X ) =
2
( z + ) e 2 dz
2
2
z z z
1 + 1 + 1 +
E(X ) =2
2 z 2 e 2 dz + 2 z e 2 dz + 2 2 dz
e
2
2 1 4243
2
1442443
zero
um
z
1 +
E(X 2 ) = 2 z2 e 2
dz + 2
2
+
1
z
+
z
E(X ) = z e e dz +
2 2 2 2 2 2
2
z
1 +
E(X 2 ) = 0 + 2
4
e 2 dz + 2
124 424 44 3
um
E(X ) = +
2 2 2
logo,
V(X) =
87
6.3.2.4 Distribuio Normal Padronizada
x
Fazendo z = e z ~ N(0,1) temos que
2
1 + z2
f(z) = e ,
2
88
6.3.3 Distribuio t de Student
[ ] ( )
VAR t = 2 t =
2
, para > 2.
6.4 Exerccios
2) A durao de certo componente eletrnico tem mdia 850 dias e desvio padro 45
dias. Qual a probabilidade do componente durar:
a) entre 700 e 1000 dias b) menos que 750 dias c) mais que 850 dias
d) Qual deve ser o nmero de dias necessrios para que tenhamos de repor 5% dos
componentes. (R = 776 dias)
89
4) Em uma distribuio normal 28% dos elementos so superiores a 34 e 12%
inferiores a 19. Encontrar a mdia e a varincia da distribuio. (R =
X = 29. 03, S2 = 73. 44 )
10) Certa mquina de empacotar determinado produto oferece variaes de peso com
desvio padro de 20 g. Em quanto deve ser regulado o peso mdio do pacote para
que apenas 10% tenham menos que 400 g? Calcule a probabilidade de um pacote
sair com mais de 450 g. [R = a) = 425.6 b) 0.11123 )]
90
7 Amo st ra ge m
91
Aleatoria Simples
Sistematica
- Tipo de Amostragem
Estratificada
por Conglomerados
5 o ) Tamanho da Amostra
prpria um piso
Objetivo: Tipo de Residncia alugada dois pisos
emprestada tres ou mais pisos
aleatoria simples
Tipo de Amostragem: sistematica
estratificada
N
Ex.: N = 5000 n = 50, ento r = = 10, (P.A. de razo 10)
n
92
3 13 23 33 43 ......
a n = a1 + ( n 1). r
7.3.3 Amostragem Estratificada
Aps a determinao dos estratos, seleciona-se uma amostra aleatria de cada uma
subpopulao (estrato).
Tipos de variveis que podem ser usadas em estratificao: idade, classes sociais, sexo,
profisso, salrio, procedncia, etc.
Se o processo de retirada dos elementos for COM reposio (pop. infinita (f 5%) ),
o nmero de amostra s possveis ser:
no de amostras = N n
Se o processo de retirada de elementos for SEM reposio (pop. finita (f > 5%) ), o
nmero de amostras possveis ser:
93
N!
no de amostras = C N , n =
n! (N - n )!
Ex.: Supondo N = 8 e n = 4
N! 8!
sem reposio: no de amostras = C N ,n = = C8,4 = = 70
n ! ( N - n )! 4! 4!
- (com reposio)
N = { 1, 2, 3, 4} n=2 no de amostras = N n = 4 2 = 16
{11
,} {1,2} {1,3} {1,4}
{2,1} {2,2} {2,3} {2,4}
{3,1} {3,2} {3,3} {3,4}
{4,1} {4,2} {4,3} {4,4}
- (sem reposio)
4!
N = { 1, 2, 3, 4} n=2 no de amostras = C 4,2 = =6
2! 2!
{11
, } x = 1,0 {1,2} x = 1,5 {1,3} x = 2,0 {1,4} x = 2,5
{2,1} x = 15, {2,2} x = 2,0 {2,3} x = 2,5 {2,4} x = 3,0
{31, } x = 2,0 {3,2} x = 2,5 {3,3} x = 3,0 {3,4} x = 3,5
{4,1} x = 2,5 {4,2} x = 3,0 {4,3} x = 3,5 {4,4} x = 4,0
94
7.5 Representaes de uma Distribuio Amostral
- Tabela
xi P(X = xi )
1,0 1/16
1,5 2/16
2,0 3/16
2,5 4/16
3,0 3/16
3,5 2/16
4,0 1/16
16/16
- Grfico
- Esperana Matemtica
n
( x ) = E( x) =
40
x
i =1
i P(X = xi ) =
16
= 2,5
-Varincia
( )
ou VAR( x ) = E x 2 [ E ( x)]2
( ) x P( X = x )
n
onde E x 2 = 2
i i
i=1
95
7.7 TAMANHO DA AMOSTRA
7.7.1 Introduo
1 a) Dimensionamento da Amostra;
2 a) Composio da Amostra.
Z .
2
n=
d
96
onde: Z = abscissa da curva normal padro, fixado um nvel de confiana (1- )
Z = 1,65 (1 - ) = 90%
Z = 1,96 (1 - ) = 95%
Z = 2,0 (1 - ) = 95.5%
Z = 2,57 (1 - ) = 99%
Geralmente usa-se Z = 2
Especificaes Tcnicas
Resgatar o valor de estudos semelhantes
Fazer conjeturas sobre possveis valores
Z 2 . 2 . N
n=
d 2 ( N 1) + Z2 . 2
2 = varincia populacional
N = tamanho da populao
d = erro amostral
Z2 . p$ . q$
n=
d2
97
verdadeira proporo de grandes empresas do setor que est sendo estudado. p$
ser expresso em decimais ( p$ = 30% p$ = 0.30).
q$ = 1 p$
d = erro amostral, expresso em decimais. O erro amostral neste caso ser a mxima
diferena que o investigador admite suportar entre e p$ , isto : p$ < d , em que
a verdadeira proporo (freqncia relativa do evento a ser calculado a partir da
amostra.
Z2 . p$ . q$ . N
n=
d 2 ( N 1) + Z2 . p$ . q$
N = tamanho da populao
p$ = estimativa da proporo
q$ = 1 p$
d = erro amostral
- Se o investigador escolher mais de uma varivel, poder acontecer de ter que aplicar
mais de uma frmula, assim dever optar pelo maior valor de "n".
Quando no tivermos condies de prever o possvel valor para p$ , admita p$ = 0.50, pois, dessa forma,
voc ter o maior tamanho da amostra, admitindo-se constantes os demais elementos.
x (x )
( )
x ~ N (x); 2 (x) , onde z =
( x)
98
( x)
( x ) = (a mdia amostral igual a mdia populacional) e ( x ) = (Desvio
n
Padro Amostral)
2 ( x)
x ~ N ( x);
n
2 ( x) N - n N -n
x ~ N ( x); , onde o fator de correo
n N -1 N -1
Ex1 .: Uma populao muito grande tem mdia 20,0 e desvio padro 1,4 . Extrai -se
uma amostra de 49 observaes. Responda:
Ex2 .: Um processo de encher garrafas de coca-cola d em mdia 10% mal cheias com
desvio padro de 30%. Extrada uma amostra de 225 garrafas de uma sequncia
de produo de 625, qual a probabilidade amostral das garrafas mal cheias estar
entre 9% e 12%.
O exemplo n o 2 pode ser resolvido usando a distribuio amostral das propores, onde p = proporo
populacional, p = mdia da distribuio amostral das propores. Logo temos:
99
7.8.2 Distribuio amostral das propores
p(1 p ) N-n
p=p e p = . ,
n N -1
N -n
onde usado para populao finita.
N -1
Ex1: Uma mquina de recobrir cerejas com chocolate regulada para produzir um
revestimento de (3% em relao ao volume da cereja). Se o processo segue uma distribuio
normal, qual a probabilidade de extrair uma amostra de 25 cerejas de um lote de 169 e
encontrar uma mdia amostral superior a 3,4%. R = 0,44828.
7.9 Exerccios
1) Uma fabrica de baterias alega que eu artigo de primeira categoria tem uma vida
mdia de 50 meses, e desvio padro de 4 meses.
a) Que porcentagem de uma amostra de 36 observaes acusaria vida mdia no
intervalo de um ms em torno da mdia ?
b) Qual ser a resposta para uma amostra de 64 observaes?
c) Qual seria o percentual das mdias amostrais inferior a 49,8 meses com n =100?
4) Suponha que uma pesquisa recente tenha revelado que 60% de uma populao de
adultos do sexo masculino consistam de no-fumantes. Tomada uma amostra de
10 pessoas de uma populao muito grande, que percentagem esperamos nos
intervalos abaixo:
a) de 50% a 65% b) maior que 53% c) de 65% a 80%
100
8 Estimao de Parme tros
i) Estimao Pontual
a) Estatsticas
Seja (X1, X2, ..., Xn) uma amostra aleatria e (x1 ,x2, ..., xn) os valores tomados pela
amostra; ento y = H(x1 ,x2, ..., xn ) uma estatstica.
Principais estatsticas:
- Mdia Amostral
- Proporo Amostral
- Varincia Amostral
(n > 30 Z)
(
Seja X ~ N , 2 )
101
Como j vimos anteriormente, x (mdia amostral) tem distribuio normal de mdia
e desvio padro ,ou seja:
n
2
X ~ N ;
n
X
Portanto, z = tem distribuio N (0,1)
n
Ento,
( )
P z 2 z + z 2 = 1
x
P z 2 +z 2 = 1
n
P z 2 X + z 2 X = 1
n n
P X z 2 X + z 2 = 1 (Pop. Infinita)
n n
N-n N-n
P X + Z 2 Z2 = 1 (Pop. Finita)
n N -1 n N -1
1 = 90 % z 2 = 1, 64
1 = 95% z 2 = 1, 96 1 = 85% z 2 =
1 = 99 % z 2 = 2,58
102
Ex.: Seja X a durao da vida de uma pea de equipamento tal que = 5 horas.
Admita que 100 peas foram ensaiadas fornecendo uma durao de vida mdia de 500 horas e
que se deseja obter um intervalo de 95% para a verdadeira mdia populacional. R = P (499,02
500,98) = 95%.
Obs.: Podemos dizer que 95% das vezes, o intervalo acima contm a verdadeira
mdia populacional. Isto no o mesmo que afirmar que 95% a probabilidade do
parmetro cair dentro do intervalo, o que constituir um erro, pois um parmetro
(nmero) e ele est ou no no intervalo.
( n 30)
Neste caso precisa-se calcular a estimativa S (desvio padro amostral) a partir dos
dados, lembrando que:
(x x)
2
i
S2 = i =1
onde n -1 = graus de liberdade
n 1
2
X ~ N ;
n
X
Portanto, t = tem distribuio N (0,1)
S n
X z N ( 0,1)
t= . = =
S n S S S
103
O grfico da funo densidade da varivel "t" simtrico e tem a forma da normal,
porm menos "achatada" sua mdia vale 0 e a varincia em que o grau de liberdade
2
( > 2)
X
t , 2 =
S n
Ento,
( )
P t , 2 t + t , 2 = 1
s s
P X t , 2 X + t , 2 = 1 (Pop. Infinita)
n n
S Nn S N n
P X t , / 2 X + t , / 2 = 1 (Pop. Finita)
N 1 N 1
n n
Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao
aproximadamente normal. Construir um intervalo de confiana para com um nvel de 95%.
n n
xi (x x)
2
i
X= i =1
= 8,7 S2 = i =1
4 S 2
n n 1
= 10 -1 = 9 = 5%
t , 2 = t 9 , 2.5% = 2,262
104
p$ . q$
p$ ~ N p$ ; (pop. infinita)
n
p$ . q$ N - n
p$ ~ N p$ ; (pop. finita)
n N - 1
p.q
p$ p =
logo Z = onde n
p$ p = =
X caracters tica
n nmero de elementos da amostra
P (p Z 2 p p + Z 2 p ) = 1 (Pop. Infinita)
N n N n
P p$ Z 2 $p p$ + Z 2 $p = 1 (Pop. Finita)
N 1 N 1
S2
X 2n1 ~ Z ,
2
logo o intervalo ser:
105
2inf = 2 2sup = 2
1 ; ;
2 2
Assim temos:
( n 1)S2 ( n 1)S2
P 2
2
= 1
Xsup X2inf
Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao
aproximadamente normal. Construir um intervalo de confiana para 2 com um nvel de 95%.
1 2
X1 X 2
a) Varincias Conhecidas
1 2 = (X 1 X 2 ) Z .(Erro Padro)
2
Erro Padro?
12 22
= +
n1 n2
106
21 22
logo o erro padro = +
n1 n2
21 22 12 22
P( X1 X2 ) Z 2 + ( 1 2 ) ( X1 X2 ) + Z 2 + = 1
n1 n 2 n1 n 2
1 1
Erro Padro: +
n1 n 2
b) Varincias Desconhecidas
S2 S2
P( X1 X2 ) t 2 1 + 2 1 2 ( X1 X 2 ) + t 2 1 + 2 onde = n1 + n2 2
S2 S2
n1 n2 n1 n 2
1 1
Erro Padro: SC + onde Sc o desvio padro conjunto
n1 n2
SC =
( n1 1)S12 + ( n2 1)S22
n1 + n2 2
Ex1 .: De uma turma (1) foi extrada uma amostra de 6 alunos com as seguintes
alturas: 150, 152, 153, 160, 161, 163. De uma segunda turma foi extrada uma amostra de 8
alunos com as seguintes alturas: 165, 166, 167, 172, 178, 180, 182, 190. Contruir um intervalo
de 95% de confiana para a verdadeira diferena entre as mdias populacionais.
107
Ex2 .: De uma mquina foi extrada uma amostra de 8 peas, com os seguintes
dimetros: 54, 56, 58, 60, 60, 62, 63, 65. De uma segunda mquina foi extrada uma amostra
de 10 peas, com os seguintes dimetros: 75, 75, 76, 77, 78, 78, 79, 80, 80, 82. Construir um
intervalo de 99% de confiana para a diferena entre as mdias populacionais, supondo que as
mquinas foram construdas pelo mesmo fabricante .
p$ q$ p$ q$ p$ q$ p$ q$
P (p$ 1 p$ 2 ) Z 2 1 1 + 2 2 1 2 ( p$ 1 p$ 2 ) + Z 2 1 1 + 2 2 = 1
n1 n2 n1 n2
Ex.: Em uma pesquisa realizada pelo Instituto Gallup constatou que 500 estudantes
entrevistados com menos de 18 anos, 50% acreditam na possibilidade de se verificar uma
modificao na Amrica, e que dos 100 estudantes com mais de 24 anos, 69% acreditam nessa
modificao. Construir um intervalo de confiana para a diferena entre as propores destas
subpopulaes usando =5%. R=(LI=0,0893, LS=0,2905)
8.3 Exerccios
Mdia Tamanho da
Amostral Amostra
a) 16,0 2,0 16
b) 37,5 3,0 36
c) 2,1 0,5 25
d) 0,6 0,1 100
108
5) Solicitou-se a 100 estudantes de um colgio que anotasse suas despesas com
alimentao e bebidas no perodo de uma semana. H 500 estudantes no colgio. O
resultado foi uma despesa de $40,00 com um desvio padro de $10,00. Construa um
intervalo de 95% de confiana para a verdadeira mdia.
10 11 11 11 12 12 12 12 13 13
13 13 13 13 13 13 13 13 13 13
14 14 14 14 14 15 15 15 16 16
a) 2 3 4 5 5 6 6 7 8 8 9 n = 11
b) 12 12 15 15 16 16 17 18 20 22 22 23 n = 12
c) 25 25 27 28 30 33 34 35 36 n=9
109
11) Sendo X uma populao tal que X ~ N(; 2 ) em que e so desconhecidos.
Uma amostra de tamanho 15 forneceu os seguintes valores X i = 8, 7 , e
X2i = 27,3 . Determinar um intervalo de confiana de 95% para e , supondo:
X2i n i
2
X
X=
X i
e S2 =
n n1
13) O tempo de reao a uma injeo intravenosa em mdia de 2.1 min., com desvio
padro de 0.1 min., para grupos de 20 pacientes. Construa um intervalo de confiana
de 90 % para o tempo mdio para toda a populao dos pacientes submetidos ao
tratamento.
14) Uma firma esta convertendo as mquinas que aluga para uma verso mais moderna.
At agora foram convertidas 40 mquinas. O tempo mdio de convers o foi de 24
horas com desvio padro de 3 horas. a) Determine um intervalo de confiana de 99
% para o tempo mdio de converso. b) Para uma amostra de 60 mquinas, como
ficaria o intervalo de confiana de 99 % para o tempo mdio de converso
15) Seis dentre 48 terminais telefnicos do respostas de ocupado. Uma firma possui
800 terminais. Construir um intervalo de confiana de 95 % para a proporo dos
terminas da firma que apresentam sinal de ocupado. R LI = 3.4%, LS = 21.6%
16) Uma amostra de 50 bicicletas de um estoque de 400 bicicletas, acusou 7 com pneus
vazios. a) Estime o nmero de bicicletas com pneus vazios: b) Construa um intervalo
de 99 % confiana para a populao das bicicletas com pneus vazios.
R a) 56; b) LI = 0.021 LS = 0.258
17) A mdia salarial semanal para uma amostra de n = 30 empregados em uma grande
firma X = 180,00 com desvio padro S = 14,00. Construa um intervalo de
confiana de 99 % para a mdia salarial dos funcionrios.
18) Uma empresa de pesquisa de mercado faz contato com uma amostra de 100 homens
em uma grande comunidade e verifica que uma proporo de 0.40 na amostra
prefere lminas de barbear fabricadas por seu cliente em vez de qualquer outra marca.
Determinar o intervalo de confiana de 95 % para a proporo de todos os homens
na comunidade que preferem a lmina do cliente.
110
19) Uma pequena fbrica comprou um lote de 200 pequenas peas eletrnicas de um
saldo de estoque de uma grande firma. Para uma amostra aleatria de 50 peas,
constatou-se que 5 eram defeituosas. Estimar a proporo de todas as peas que so
defeituosas no carregamento utilizando um intervalo de confiana de 99 %.
20) Duas amostras de plantas foram cultivadas com dois fertilizantes diferentes. A
primeira amostra oriunda de 200 sementes, acusou altura mdia de 10,9 cm e desvio
padro 2,0 cm. A segunda amostra, de 100 sementes, acusou uma altura mdia de
10,5 cm com desvio padro de 5,0 cm. Construir um intervalo de confiana entre as
alturas mdias das populaes ao nvel de 95% de confiana.
21) Uma amostra aleatria de 120 trabalhadores de uma grande fbrica leva em mdia
22,0 min. para executar determinado servio, com S2 de 4 min2. Em uma segunda
fbrica, para executar a mesma tarefa, uma amostra aleatria de 120 operrios, gasta
em mdia 19,0 min com S2 de 10 min2. Construir um intervalo de 99% de confiana
entre as mdias das populaes.
Branco 8 18 10 10 14
Preto 9 12 5 10 14 12 6
23) Em uma amostra aleatria de cinco pessoas, foi medida a capacidade torxica antes e
aps determinado tratamento, obtendo-se os dados a seguir. Construir um intervalo
de 95% de confiana para a diferena entre as mdias antes e depois do tratamento.
Capacidade Torxica
Pessoa Antes (X) Aps (Y)
A 2750 2850
B 2360 2380
C 2950 2930
D 2830 2860
E 2250 2320
111
24) Extrada duas amostras de professores homens e mulheres, obteve-se os seguintes
resultados quantos aos salrios em milhares de dlares: Construir um intervalo de
95% de confiana para:
Homens Mulheres
n1 = 25 n2 = 5
X1 = 16,0 X 2 = 11,0
S12 = 16 S 22 = 10
25) Em uma pesquisa efetuada em com 1650 americanos foram consultados sobre o
seguinte tema: "A mulher grvida pode procurar um mdico e interromper a gravidez,
a qualquer momento durante os trs primeiros meses. a favor ou contra esta
deciso?" Uma semana mais tarde foram consultados 1650 americanos foram
consultados sobre o mesmo assunto , exceto que a pergunta "a favor do aborto, ao
invs de "interromper a gravidez". As respostas foram as seguintes:
Resposta
Pergunta A favor Contra Sem opinio
"Interromper a gravidez" 46% 39% 15%
"A favor do aborto" 41% 49% 10%
26) Numa pesquisa sobre inteno do comprador brasileiro. 30 famlias de uma amostra
aleatria de 150 declararam ser uma inteno comprar um carro novo dentro de um
ano. Uma outra amostra de 160 famlias 25 declararam a mesma inteno. Construir
um intervalo de 99% de confiana para as diferenas entre as propores.
R = LI = 0.0727, LS = 0.1527
112
9 Teste de Hip te ses
Trata-se de uma tcnica para se fazer inferncia estatstica. Ou seja, a partir de um teste de
hipteses, realizado com os dados amostrais, pode-se inferir sobre a populao.
uma regra de deciso para aceitar ou rejeitar uma hipteses estatstica com base nos
elementos amostrais.
Designa-se por Ho, chamada hiptese nula, a hipteses estatstica a ser testada, e por
H1 a hiptese alternativa. A hiptese nula expressa uma igualdade, enquanto que a hiptese
alternativa dada por uma desigualdade ( , < , >).
113
Exemplos:
H 0: = 0
Teste Bicaudal ou Bilateral
H 1: 0
H 0: = 0
Teste Unilateral Direito
H 1: > 0
H 0 : = 0
Teste Unilateral Esquerdo
H 1: < 0
H dois tipos de erro ao testar uma hiptese estatstica. Pode-se rejeitar uma
hipteses quando ela , de fato verdadeira, ou aceitar uma hipteses quando ela , de fato,
falsa. A rejeio de uma hiptese verdadeira chamada "erro tipo I". A aceitao de uma
hiptese falsa constitui um "erro tipo II".
Realidade
H o verdadeira H o falsa
Aceitar H o Deciso correta (1 - ) Erro Tipo II ( )
Deciso
Rejeitar Ho Erro Tipo I ( ) Deciso Correta (1 - )
Observe que o erro tipo I s poder acontecer se for rejeitado Ho e o erro tipo II
quando for aceito Ho .
114
9.2 Teste de significncia
1 o ) Enunciar as hipteses H 0 e H 1;
2 o ) fixar o limite do erro , e identificar a varivel do teste;
3 o ) com o auxlio das tabelas estatsticas, considerando e a varivel do teste,
determinar as RR (regio de rejeio) e RA (regio de aceitao) para Ho;
4 o ) com os elementos amostrais, calcular o valor da varivel do teste;
5 o ) concluir pela aceitao ou rejeio do H0 pela comparao do valor calculado no
4o passo com RA e RR.
1. Enunciar as hipteses:
0 (a)
H 0 : = 0 H1 : > 0 (b)
< (c)
0
2. Fixar . Admitindo:
115
4. Calcular o valor da varivel:
X 0 X 0
Z cal = t cal =
S
n n
- Se Zcal < Z ou Zcal > +Z ou t cal < t ou t cal > + t , rejeita-se Ho.
2 2 2 2
Ex.: Os dois registros dos ltimos anos de um colgio, atestam para os calouros
admitidos uma nota mdia de 115 pontos (teste vocacional). Para testar a
hiptese de que a mdia de uma nova turma a mesma, tirou-se, ao acaso, uma
amostra de 20 notas, obtendo-se mdia 118 e desvio padro 20. Admitir = 5%,
para efetuar o teste. (R = aceita-se Ho )
1. Enunciar as hipteses:
p 0 (a)
Ho : = po H1 : > p 0 (b)
< p (c)
0
116
(a) (b) (c)
f p0 onde f =
X
Z cal =
p0 . q0 n
n
1. Enunciar as hipteses:
2 20 (a)
Ho : 2 = 20 H1 : 2 > 20 (b)
2 < 2 (c)
0
117
3. Com o auxlio da tabela " 2 " determinar as regies RA e RR;
( n 1)S 2
2cal =
20
Ex.: Para testar a hiptese de que a varincia de uma populao 25, tirou-se uma
amostra de 25 elementos obtendo-se S2 = 18,3. Admitindo-se = 5%, efetuar o
teste de significncia unicaudal a esquerda. (R = aceita-se H o)
1. Enunciar as hipteses:
1 2
Ho : 1 = 2 ou 1 - 2 = d H1 :
1 2 d
118
onde d a diferena admitida entre as duas mdias.
Zcal =
(X
1 X2 ) d
21 22
+
n1 n2
5. Concluso:
Ex.: Um fabricante de pneus faz dois tipos. Para o tipo A, = 2500 Km, e para o
tipo B, = 3000 Km. Um taxi testou 50 pneus do tipo A e 40 pneus do tipo B,
obtendo 24000 Km e 26000 Km de durao mdia dos respectivos tipos.
Adotando um risco de 4% e que existe uma diferena admitida de 200 Km entre
as marcas, testar a hiptese de que a vida mdia dos dois tipos a mesma.
(R = rejeita-se Ho )
a) As estimativas diferentes
1. Enunciar as hipteses:
1 2
Ho : 1 = 2 ou 1 - 2 = d H1:
1 2 d
119
t cal =
(X1 X2 ) d
S21 S22
+
n1 n2
5. Concluses:
Ex.: Dois tipos de pneus foram testados sob as mesmas condies meteorolgicas. O
tipo A fabricado pela fabrica A, registrou uma mdia de 80.000 km rodados com
desvio padro de 5.000 km. em 6 carros amostradas. O tipo B fabricado pela
fbrica B, registrou uma mdia de 88.000 km com desvio padro de 6.500 km em
12 carros amostradas. Adotando = 5% testar a hiptese da igualdade das
mdias.
b) As estimativas iguais
1. Enunciar as hipteses:
1 2
Ho : 1 = 2 ou 1 - 2 = d H1:
1 2 d
t cal =
(X 1 X2 ) d ( n1 1)S21 + ( n2 1)S22
onde S C =
1 1 n1 + n 2 2
S c. +
n1 n 2
5. Concluses:
Ex.: Dois tipos de tintas foram testados sob as mesmas condies meteorolgicas. O
tipo A registrou uma mdia de 80 min para secagem com desvio padro de 5
min. em cinco partes amostradas. O tipo B, uma mdia de 83 min com desvio
padro de 4 min. em 6 partes amostradas. Adotando = 5% testar a hiptese da
igualdade das mdias. (R = aceita-se Ho )
120
9.2.5 Teste de significncia para igualdade de duas propores
1. Enunciar as hipteses:
H o : 1 = 2 H 1: 1 2
p$ 1 p$ 2 X1 X X + X2
Z cal = onde p$ 1 = , p$ 2 = 2 , p$ 12 = 1
p$ 12 .q$ 12 n1 n2 n1 + n 2
n
5. Concluses:
Homens Mulheres
X1 = 70 X2 = 50
n1 = 200 n2 = 200
1. Enunciar as hipteses:
H 0 : 12 = 22 H 1: 21 22
Fsup = F ( 1, 2 )
1
Finf = F1 ( 1 , 2 ) =
F ( 2 , 1 )
121
4. Calcular o valor da varivel:
S21
Fcal =
S22
5. Concluses:
9.3 Exerccios
122
4.9 5.1 4.9 5.5 5.0 4.7
Estes dados so evidncia para afirmar que o contedo de oxignio menor que 5
partes por milho? Teste considerando = 5% e = 1%.
3) A Debug Company vende um repelente de insetos que alega ser eficiente pelo
prazo de 400 horas no mnimo. Uma anlise de 90 itens aleatoriamente
inspecionados acusou uma mdia de eficincia de 380 horas.
a) Supondo que o ganho de peso mdio dessas pessoas de 45 g, teste a hiptese para
= 5%, se esse valor o mesmo (bilateral)
b) Supondo que a varincia dessas pessoas de 1.8 g2, teste a hiptese para = 5%,
se esse valor o mesmo (bilateral).
5) Uma pesquisa feita alega que 15% dos pessoas de uma determinada regio sofrem
de cegueira aos 70 anos. Numa amostra aleatria de 60 pessoas acima de 70 anos
constatou-se que 12 pessoas eram cegas. Teste a alegao para = 5% contra p >
15%.
Droga A Droga B
Sexo muscular intravenosa muscular Total
Masculino 21 10 22 53
Feminino 20 12 25 57
Total 41 22 47 110
123
processo, usando uma amostra de 25 arames obteve-se uma mdia de 285 psi. Use
um nvel de significncia de 5%. Suponha normal a populao das resistncias.
8) A DeBug Company vende um repelente para insetos que alega ser eficiente pelo
prazo de 400 horas no mnimo. Uma anlise de 9 itens escolhidos aleatoriamente
acusou uma mdia de eficincia de 380 horas. a) Teste a alegao da companhia,
contra a alternativa que a durao inferior a 400 horas no mnimo ao nvel de
1%, e o desvio padro amostral de 60 horas. b) Repitas o item (a) sabendo que o
desvio padro populacional de 90 horas.
10) Uma experincia tem mostrado que 40% dos estudantes de uma Universidade
reprovam em pelo menos 5 disciplinas cursada na faculdade. Se 40 de 90
estudantes fossem reprovados em mais de 5 disciplinas, poderamos concluir
quanto a proporo populacional, usando = 1%.
11) Para verificar a eficcia de uma nova droga foram injetados doses em 72 ratos,
obtendo-se a seguinte tabela:
12) Sendo
Amostra 1 n1 = 60 X 1 = 5.71 12 = 43
Amostra 2 n2 = 35 X 2 = 4.12 22 = 28
124
13) Na tabela abaixo esto registrados os ndices de vendas em 6 supermecados para
os produtos concorrentes da marca A e marca B. Testar a hiptese de que a
diferena das mdias no ndice de vendas entre as marcas zero, usando = 5%.
a) Testar ao nvel de 10% a hiptese de que a diferena entre a renda mdia dos
homens e das mulheres valha $ 5000.
16) Esto em teste dois processos para fechar latas de comestveis. Numa seqncia
de 1000 latas, o processo 1 gera 50 rejeies, enquanto o processo 2 acusa 200
rejeies. Pode ao nvel de 5%, concluir que os dois processos sejam diferentes?
125
- Teste de adequao do ajustamento
- Teste de Aderncia
- Teste de Independncia (Tabela de Contingncia)
6 o) Concluso:
Se 2cal tab aceita -se Ho
2
126
9.4.2 Teste de adequao do ajustamento
Suponhamos uma amostra de tamanho n. Sejam E1, E2, ..., Ek, um conjunto de
eventos possveis da amostra.
Resoluo:
127
Dia da Semana Dom Seg Ter Qua Qui Sex Sab k=7
No de Acidentes 33 26 21 22 17 20 36 175
pi 1/7 1/7 1/7 1/7 1/7 1/7 1/7 ---
Fe = n . p i 25 25 25 25 25 25 25 ---
2calc =
(33 25)2 + (26 25)2 + ... +
(36 25) 2 = 12
25 25 25
2cal = 12 2tab = 25%, 6 = 12. 5
Concluso: Como o 2cal < 2tab, aceita-se Ho, ou seja, para = 5%, as freqncias
podem ser iguais.
Ex2.: O nmero de livros emprestados por uma biblioteca durante certa semana est
a seguir. Teste a hiptese que o nmero de livros emprestados no dependem do dia da
semana, com = 1%.
No de Defeitos 0 1 2 3 4 5 6 7
No de Aparelhos 25 35 18 13 4 2 2 1
Resoluo:
128
No de Defeitos 0 1 2 3 4 5 6 7 n
No de Aparelhos 25 35 18 13 4 2 2 1 100
pi 0.212 0.329 0.255 0.132 0.051 0.016 0.004 0.001 1.000
Fe = n . pi 21.2 32.9 25.5 13.2 5.1 1.6* 0.4* 0.1* 100
e i
Para calcular pi, temos: pi = (Distribuio de Poisson)
i!
n
X .f i i
=X= i =1
= 1.55
n
e 1. 55 (1.55) e 1 .55 (1.55)
0 4
p0 = = 0.212 p4 = = 0.051
0! 4!
p1 = = 0.329 p5 = = 0.016
1! 5!
p2 = = 0.255 p6 = = 0.004
2! 6!
p3 = = 0.132 p7 = = 0.001
3! 6!
2calc =
(25 21.2 )2 + (35 32.9) 2 + ... +
(9 7.2 )2 = 3.474
21.2 32.9 1472
.243
4 5 6 7
2tab = 25%, 3 = 7. 81
Concluso: Como o 2cal 2tab , aceita-se Ho, ou seja, para = 5%, a distribuio do
nmero de defeitos/unidade pode seguir uma Distribuio de Poisson.
129
Ex2.: Verificar se os dados das distribuio das alturas de 100 estudantes do sexo
feminino se aproxima de uma distribuio normal, com = 5%.
Resoluo:
x
Para calcular pi, temos: Zi = (Distribuio Normal Padro)
S
f .(X X)
n n
X i . fi i =1
i i
=X= i =1
= 168 .96 S= = 6.67
n n1
168 168.96
Z3 = = 0.14
6. 67
2tab = 25%,1 = 3. 84
Concluso: Como o 2cal 2tab , aceita-se Ho, ou seja, para = 5%, a distribuio da
altura das estudantes do sexo feminino normal.
130
9.4.4 Tabelas de contingncia Teste de independncia
Uma importante aplicao do teste 2 ocorre quando se quer estudar a relao entre
duas ou mais variveis de classificao. A representao das freqncias observadas, nesse
caso, pode ser feita por meio de uma tabela de contingncia.
k
(Fo Fe )
2
(soma da linha i )(soma da coluna j)
2cal = Feij =
i =1 Fe total de observaes
Obs.: Em tabelas 2 x 2 temos 1 grau de liberdade, por isso utiliza -se a correo de
Yates, onde para n 50 pode ser omitida.
Ho : As variveis so independentes
H1 : As variveis so dependentes
A B C D Total ( l )
X 28 42 30 24 124
Y 44 78 78 76 276
Total (c) 72 120 108 100 400
131
124x120 276x120
Fe12 = = 37. 2 Fe22 = = 82. 8
400 400
124x108 276x108
Fe13 = = 33. 48 Fe23 = = 74. 52
400 400
124x100 276x100
Fe14 = = 31.0 Fe24 = = 69
400 400
2
=
(28 22,.32)
2
+
(42 37, 2)
2
+ ... +
(76 69)
2
= 5,81
calc
22,32 37,2 69
Concluso: Como o 2cal 2tab , aceita-se Ho, ou seja, para = 1%, as variveis so
independentes.
2cal
C=
2cal + n
9.5 Exerccios
No de Acidentes 0 1 2 3 4 5
No de Dias 25 19 10 9 4 3
132
3) Determine o valor do coeficiente de contingncia considerando os dados: = 1%.
Sexo Partido
A B
Masculino 50 72 C = 4%
Feminino 29 35
No de Acidentes No de Firmas
1.5 --- 1.7 3
1.8 --- 2.0 12
2.1 --- 2.3 14
2.4 --- 2.6 9 R = Aceita Ho
2.7 --- 2.9 7
3.0 --- 3.2 5
Total 50
133
10 REGRESS O E C ORRELAO
10.1 Introduo
10.2 Definio
Constitui uma tentativa de estabelecer uma equao matemtica linear que descreva o
relacionamento entre duas variveis (uma dependente e outra independente).
A equao de regresso tem por finalidade ESTIMAR valores de uma varivel, com
base em valores conhecidos da outra.
yi = xi + + i
y i valor estimado (varivel dependente);
x i varivel independente;
coeficiente de regresso (coeficiente angular);
coeficiente linear;
i resduo.
134
10.3.1 Pressuposies
Obs. 1 2 3 4 5 6 7 8
Vendas 201 225 305 380 560 600 685 735
Lucro 17 20 21 23 25 24 27 27
28
26
24
Lucro
22
20
18
16
150 250 350 450 550 650 750 850
Vendas
Pelo grfico podemos observar que a possvel reta de regresso ter um coeficiente de
regresso (coeficiente linear) positivo.
135
10.4 Mtodo para estimao dos parmetros e
O mtodo mais usado para ajustar uma linha ret a para um conjunto de pontos
(x1 , y1 ), ..., (x n ,y n ) o Mtodo de Mnimos Quadrados:
10.4.1 Caractersticas
n n n
n xy x y
Sxy
a= i=1 i =1 i =1
2
= b = y a x
n
n Sxx
n x x
2
i=1 i =1
e i = y i yi = yi ( a + bx i )
Vendas Lucro
Obs. Xi Yi X 2i Yi2 X i .Yi
1 201 17 40401 289 3417
2 225 20 50625 400 4500
3 305 21 93025 441 6405
4 380 23 144400 529 8740
5 560 25 313600 625 14000
6 600 24 360000 576 14400
7 685 27 469225 729 18495
8 735 27 540225 729 19845
3691 184 2011501 4318 89802
136
n n n
n x i yi x i y i
8(89802) (3691)(184)
a= i =1 i =1 i =1
= = 0,0159
8(2011501) (3691)
2 2
n
n
n x 2i x i
i =1 i =1
b = y a x = 23 - (0,159)(461,38) = 15,66
y = 0,0159 x + 15,66
Sada do Statistica
28
26
24
y = 15,66 + 0,0159 x
Lucro
22
20
18
16
150 250 350 450 550 650 750 850
Vendas
Partindo da reta de regresso podemos afirmar que para uma venda de 400 mil
podemos obter um lucro de y$ = ( 0. 0159 ) (400.000) + 15.66 = 22 mil .
Sadas do Statistica
Obs.: Para qualquer tipo de equao de regresso devemos ter muito cuidado para
no extrapolar valores para fora do mbito dos dados. O perigo da extrapolao para fora dos
dados amostrais, que a mesma relao possa no mais ser verificada.
137
10.5 Decomposio da varincia Total
A disperso da variao aleatria y pode ser medida atravs da soma dos quadrados
dos desvios em relao a sua mdia y . Essa soma de quadrados ser denominada Soma de
Quadrados Total (SQTotal).
n
SQTotal = (y i y)
2
i =1
n n n
( yi y) = (y i y) + ( yi yi )
2 2 2
i =1 i =1 i =1
Essa relao mostra que a variao dos valores de Y em torno de sua mdia pode ser
n n
dividida em duas partes: uma ( yi y) que explicada pela regresso e outra (y yi ) ,
2 2
i
i =1 i =1
devido ao fato de que nem todos os pontos esto sobre a reta de regresso, que a parte no
explicada pela regresso ou variao residual.
Assim:
SQRegress ~ao
A estatstica definida por r 2 = , e denominada coeficiente de
SQTotal
determinao, indica a proporo ou percentagem da variao de Y que explicada pela
regresso.
Note que 0 r2 1.
2
n
n n
SQTotal = ( yi y) = n y yi ,
2 2
i
i =1 i =1 i =1
n
n n n
SQ Regresso = ( y i y) = b n x i yi x i y i ,
2
i =1 i =1 i =1 i =1
138
10.6 Anlise de Varincia da Regresso
Anlise de Varincia
onde QM representa Quadrado Mdio e obtido pela diviso da Soma de Quadrados pelos
respectivos graus de liberdade.
139
Para o exemplo anterior:
Vendas Lucro
Obs. Xi Yi X 2i Yi2 X i .Yi
1 201 17 40401 289 3417
2 225 20 50625 400 4500
3 305 21 93025 441 6405
4 380 23 144400 529 8740
5 560 25 313600 625 14000
6 600 24 360000 576 14400
7 685 27 469225 729 18495
8 735 27 540225 729 19845
3691 184 2011501 4318 89802
yi = 0,0159x i + 15,66
n n n
a o = a n x i y i x i y i
SQRegress ~
i =1 i =1 i =1
2
n
n
SQTotal = n y 2i y i
i =1 i=1
H0: = 0 e H1: 0
140
Sadas do Statistica
2
n
n n
VT = SQTotal = ( yi y) = n y yi ,
2 2
i
i =1 i =1 i =1
(y yi )
2
VE = i
i =1
2
n n n
n xy x y
i=1 i =1 i =1
COVxy
r2 = =
n 2 n 2 n 2 n 2 Sxx. Syy
n x x n y y
i=1 i =1 i=1 i =1
r2 =
[8(89802) - (3691)(184)]2 = 0.908
[8(2011501) - (3691) ][8(4318) - (184) ]
2 2
141
Sadas do Statistica
Tem como objetivo encontrar o grau de relao entre duas variveis, ou seja, um
coeficiente de correlao.
10.8.1 Caractersticas do r
- Pode assumir valores positivos (+) como negativos (-), semelhante ao coeficiente
de regresso de uma reta ajustada num diagrama de disperso;
valor de r
-0,5 0 +0,5
-1 +1
Negativa Negativa Negativa Positiva Positiva Positiva
forte moderada fraca fraca moderada forte
142
10.8.2 Medidas de Correlao
O valor de "r" pode ser enganoso, na realidade, uma estatstica mais significante o r
(coeficiente de determinao), que d o valor percentual da variao de uma varivel explicativa
em relao a outra varivel.
n n n
n xy x y
r= i =1 i =1 i =1
=
Sxy
n 2 n n 2 n S xx .Syy
n x x n y y
i =1 i =1 i =1 i =1
Logo podemos observar que o coeficiente de determinao nos d uma base intuitiva
para a anlise de correlao.
Sada do Statistica
26
24
Lucro
22
20
18
16 Regression
150 250 350 450 550 650 750 850 95% confid.
Vendas
143
10.9 Exerccios
X = 1o Exame e Y = 2 o Exame
Aluno 1 2 3 4 5 6 7 8 9 10
Exame 1 82 84 86 83 88 87 85 83 86 85
Exame 2 92 91 90 92 87 86 89 90 92 90
R = y$ = 0. 79 x +157. 25 ; r = 53.29%; r = -0.73
Aluno 1 2 3 4 5 6 7 8
Horas 2 4 5 5 6 8 9 10
Nota 1 3 6 6 8 7 8 10
R = y$ = 0. 98 x + 0.12 ; r = 82.99%; r = +0.911
Indivduo 1 2 3 4 5 6 7 8
Seguro 20 16 34 23 27 32 18 22
Renda 64 61 84 70 88 92 72 77
R = y$ = 1. 50 x + 40.08 ; r = 74.3%; r = +0.86
Indivduo 1 2 3 4 5 6 7 8 9 10
Peso Pai 65 63 67 64 68 62 70 66 68 67
Peso Filho 68 66 68 65 69 66 68 65 71 67
R = y$ = 0. 48 x + 35.48; r = 40.58%; r = +0.637
144
1 1 Re fe r ncia s Bib liogrf ica s
FONSECA, J.S.; MARTINS, G.A. (1993). Curso de estatstica. 4a ed. So Paulo: Atlas.
SNEDECOR, G. W.; COCHRAM, W. G. (1989). Statistical Methods. 8rd ed. Iowa: Iowa
State University Press, 1989.
145