Escolar Documentos
Profissional Documentos
Cultura Documentos
Apostila de Estatistica
Apostila de Estatistica
Apostila de Estatistica
ESTATSTICA BSICA
1. CONCEITOS BSICOS
Obs. A amostra sempre finita. Quanto maior for a amostra mais significativa o estudo.
2. ARREDONDAMENTO DE DADOS
Quando o primeiro algarismo aps aquele que vai ser arredondado for 0, 1, 2, 3 e 4 despreza-se este
algarismo e conserva-se o anterior.
78,846970 = 78,8.
Quando o primeiro algarismo aps aquele que vai ser arredondado for 5, 6, 7, 8 e 9 aumentamos
uma unidade no algarismo anterior.
78,886970 = 78,9.
3. DIVISO DA ESTATSTICA
Estatstica Descritiva parte da Estatstica que tem por objetivo descrever os dados
observados e na sua funo dos dados, tem as seguintes atribuies.
i. A obteno ou coleta de dados normalmente feita atravs de um questionrio ou de
observao direta de uma populao ou amostra.
ii. A organizao dos dados consiste na ordenao e crtica quanto correo dos valores
observados, falhas humanas, omisses, abandono de dados duvidosos.
iii. A representao dos dados os dados estatsticos podem ser mais facilmente
compreendidos quando apresentados atravs de tabelas e grficos, que permite uma
visualizao instantnea de todos os dados.
Estatstica Indutiva parte da Estatstica que tem por objetivo obter e generalizar concluses
para a populao a partir de uma amostra, atravs do clculo de probabilidade. A tais concluses
esto sempre associados a um grau de incerteza e conseqentemente, a uma probabilidade de
erro.
4. VARIVEIS
Uma varivel qualquer caracterstica de um elemento observado (pessoa, objeto ou animal).
Algumas variveis, como sexo e designao de emprego, simplesmente enquadram os indivduos em
categorias. Outras, como altura e renda anual, tomam valores numricos com os quais podemos fazer clculos.
Os exemplos acima nos dizem que uma varivel pode ser:
a Qualitativa: quando seus valores so expressos por atributos: sexo (masculino feminino), cor da
pele (branca, preta, amarela, vermelha);
b Quantitativa: quando seus valores so expressos em nmeros (salrios dos operrios, idade dos
alunos de uma escola, nmero de filhos, etc.). Uma varivel quantitativa que pode assumir, teoricamente,
qualquer valor entre dois limites recebe o nome de varivel contnua (altura, peso, etc.); uma varivel que s
pode assumir valores pertencentes a um conjunto enumervel recebe o nome de varivel discreta (nmero de
filhos, nmero de vitrias).
Exerccios
1. Classifique as variveis abaixo:
3
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
(k)
Componentes Bsicos
Em termos genricos, uma tabela se compe dos seguintes elementos bsicos:
4
Ttulo
Cabealho
Indicadora
de
Coluna
Casa
C
o
l
u
n
a
Linha
Rodap
Exemplo:
Brasil - Estimativa de Populao
1970 76
Ano
Populao
(1000 habitantes)
1970
93.139
1971
95.993
1972
98.690
1973
101.433
1974
104.243
1975
107.145
1976
110.124
Fonte: Anurio Estatstico do Brasil
5
a. Da poca;
b. Do local;
c. Da espcie.
Esses elementos determinam o surgimento de quatro tipos fundamentais de sries estatsticas:
Sries Temporais ou Cronolgicas: so aquelas nas quais os dados so reunidos segundo o tempo
que varia, permanecendo fixos o local e a espcie.
Exemplo:
Produo de petrleo bruto Brasil
1966 1970.
Anos Quantidade (cm)
1966
6.748.889
1967
8.508.848
1968
9.509.639
1969
10.169.531
1970
9.685.641
Fonte Brasil em dados.
Sries Geogrficas: so aquelas nas quais os dados so reunidos segundo o local que varia
permanecendo fixos o tempo e a espcie.
Exemplo:
Rebanhos bovinos Brasil
1970.
Regies
Bovinos (1000)
Norte
2.132
Nordeste
20.194
Sudeste
35.212
Sul
18.702
Centro-oeste
15.652
Fonte Brasil em dados.
Sries Especficas: so aquelas nas quais os dados so reunidos segundo o espcie que varia
permanecendo fixos o tempo e o local.
Exemplo:
Produo pesqueira (mar) Brasil
1969.
Itens
Produo (ton.)
Peixes
314
Crustceos
62
Moluscos
3
Mamferos
12
Fonte Brasil em dados.
Sries Composta ou Mista: a combinao de dois ou mais fundamentais de sries estatsticas.
Exemplo: Geogrfica Temporal.
Evoluo do transporte de carga martima nas 4 principais bacias brasileiras
Brasil -1968 1970.
Anos
Bacias
1968
1969
1970
6
Amaznica
Nordeste
Prata
So Francisco
233.768*
16.873
177.705
53.142
324.350
20.272
203.966
48.667
316.557
20.246
201.464
57.948
Exerccio 6: Muitos sistemas escolares fornecem o acesso a Internet para seus estudantes hoje em dia. Desde
1996, o acesso Internet foi facilitado a 21.733 escolas elementares, 7.286 escolas do nvel mdio e 10.682
escolas de nvel superior (Statistical Abstract of United States, 1997). Existe nos Estados Unidos um total de
51.745 escolas elementares, 14.012 escolas do nvel mdio e 17.229 escolas do nvel superior.
Exerccio 7: A chance de uma campanha publicitria atingir sucesso a ponto de ser comentada nas ruas e at
incorporada ao vocabulrio da populao muito baixa. De acordo com estudos essa probabilidade se altera de
acordo com o meio de comunicao utilizado. Numa amostra de 30.000 campanhas publicitrias de Rdio (8mil),
TV (10mil) e Rdio+TV (12mil), verificou-se que, das 2800 que atingiram tal sucesso, 1200 foram veiculadas no
rdio e na TV e 500 apenas no rdio.
7
o tipo de srie estatstica na qual permanece constante o fato, o local e a poca. Os dados so
colocados em classes pr-estabelecidas, registrando freqncia.
Divide-se em duas partes:
Distribuio de Freqncia Intervalar (Var. Contnua)
Distribuio de Freqncia Pontual (Var. Discreta)
Amplitude das classes (h) a relao entre a amplitude total e o nmero de classes, conforme
mostra a expresso a seguir:
Mx(rol ) Mn.( rol )
h
, onde n o nmero de intervalos de classe.
n
8
f) Freqncia relativa (fri) - freqncia relativa de uma classe de ordem i, o quociente da freqncia absoluta
dessa classe (fi), pelo total, ou seja,
fi
fri
Total
Obs: a soma de todas as freqncias absolutas igual ao total.
g) Freqncia acumulada (Fi) - freqncia acumulada de uma classe de ordem i, a soma das freqncias at a
classe de ordem i.
h) Freqncia relativa acumulada (Fri) - freqncia relativa acumulada de uma classe de ordem i, a soma das
freqncias relativas at a classe de ordem i.
ORGANIZAO DE UMA DISTRIBUIO DE FREQUNCIA:
Para organizar um conjunto de dados quantitativos em distribuio de freqncias, aconselha-se seguir a
seguinte orientao:
1o Organizar o rol colocar os dados em ordem crescente ou ordem decrescente.
2o Calcular (ou adotar) o nmero conveniente de classes o nmero de classe deve ser escolhido pelo
pesquisador, em geral, convm estabelecer de 5 a 15 classes. Existem algumas frmulas para estabelecer
quantas classes devem ser construdas. Nos usaremos,
n N
onde N a quantidade total de observaes.
3o Calcular (ou adotar) a amplitude do intervalo de classes conveniente - a amplitude do intervalo de classes
deve ser o mesmo para todas as classes.
Mx(rol ) Mn.(rol )
h
onde n o nmero de intervalos de classe.
n
4o Obter os limites das classes Usualmente as classes so intervalos abertos direita. Os limites so obtidos
fazendo-se.
Limite inferior da 1a classe igual ao mnimo do rol, isto ,
l1 = Min.(rol)
Encontram-se os limites das classes, adicionando-se sucessivamente a amplitude do intervalo de classes aos
limites da 1a classe.
5o Obter as f i - contar o nmero de elementos do rol, que pertencem a cada classe.
6o Apresentar a distribuio construir uma tabela com ttulo, subttulo, ...
Exerccios
1) Abaixo so relacionados os salrios semanais (em Reais) de 60 operrios de uma fbrica de sapatos.
110
110
115
115
117
117
120
120
120
120
120
123
125
125
130
130
130
135
136
140
140
140
140
142
145
145
145
147
150
150
150
155
158
158
160
163
165
165
168
168
170
170
172
172
175
175
175
178
180
180
180
180
180
185
185
190
190
195
195
198
b)
Salrios
xi
fi
Fi
600
800
...
...
1.400
...
1.800
8
20
...
5
...
1
...
44
8
...
35
40
...
43
...
10
GRFICOS ESTATSTICOS
O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo objetivo o de produzir,
no investigador ou no pblico em geral, uma impresso mais rpida e viva do fenmeno em estudo, j que os
grficos falam mais rpido compreenso que as sries.
A representao grfica de um fenmeno deve obedecer a certos requisitos fundamentais para ser
realmente til:
a) Simplicidade o grfico deve ser destitudo de detalhes de importncia secundria, assim como de
traos desnecessrios que possam levar o observador a uma anlise com erros.
b) Clareza o grfico deve possibilitar uma correta interpretao dos valores representativos do
fenmeno em estudo.
c) Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.
Tipos de grficos
Histograma, Polgono de Freqncia e Ogiva: So utilizados para representar a distribuio de
freqncia.
Histograma e Polgono de Freqncia:
Exemplo:
Notas obtidas na disciplina de
Programao I
Notas
fi
5 |-- 6
18
6 |-- 7
15
7 |-- 8
12
8 |-- 9
03
9 |--10
02
FONTE: Dados hipotticos.
Ogiva ou polgono de freqncia acumulada:
Exemplo:
Grfico em linha: um dos mais importantes grficos; representa observaes feitas ao longo do tempo. Tais
conjuntos de dados constituem as chamadas sries histricas ou temporais.
11
NDICES
EVOLUO DO DESEMPREGO NA
GRANDE PORTO ALEGRE
20
10
0
1992
1994
1996
1998
2000
ANOS
Grfico em setores: um grfico construdo no crculo, que dividido em setores correspondentes aos
termos da srie e proporcionais aos valores numricos dos termos da srie. mais utilizado para sries
especficas ou geogrficas com pequeno nmero de termos e quando se quer salientar a proporo de cada
termo em relao ao todo.
Exemplo:
ESPECIALIDADES MDICAS QUE MAIS SOFREM
PROCESSOS POR ERROS CIRRGICOS
ANUALMENTE
Ginecologia e Obstetrcia
Cirurgia Plstica
Oftalmologia
Cirurgia Geral
Ortopedia
Pediatria
Outros
Grficos em Barras (ou em colunas). a representao de uma srie por meio de retngulos, dispostos
horizontalmente (em barras) ou verticalmente (em colunas).
Quando em barras, os retngulos tm a mesma altura e os comprimentos so proporcionais aos
respectivos dados.
GRUPOS GACHOS MAIS LEMBRADOS
Tch Guri
Engenheiros do Hawai
Tch Barbaridade
Os Serranos
Tch Garotos
10
15
NDIC E
12
OS DEZ ESTA DOS EM QUE A C OLETA DE LIXO UR B A NO
M A IS P R EC R IA - EM % DA P OP ULA O A TENDIDA
80
70
60
50
40
30
20
48
51,5
55
PA
TO
62
66,5
68
71
AC
CE
AM
75
76
RR
BA
26,5
10
0
MA
PI
AP
ESTA DOS
Pictograma.
Constitui um dos processos grficos que melhor fala ao pblico, pela sua forma ao mesmo tempo atraente e
sugestiva. A representao grfica consta de figuras.
Ex.: Populao Urbana do Brasil em 1980 (x 10)
13
b.
O estado das florestas do planeta e o que
foi devastado
pela ocupao humana - em milhes de km
CONTINENTE
REA
REA ATUAL DE
DESMATADA
FLORESTAS
OCEANIA
0.5
0.9
SIA
10.8
4.3
FRICA
4.5
2.3
EUROPA
6.8
9.6
AMRICA DO
2.9
6.8
SUL
AMRICA DO
3.2
9.4
NORTE E
CENTRAL
FONTE: World Resources Institute
c.
d.
COMRCIO EXTERIOR
BRASIL - 1988/1993
QUANTIDADE (1000 t)
ANOS
EXPORTAO
IMPORTAO
1988
169666
58085
1989
177033
57293
1990
168095
57184
1991
165974
63278
1992
1993
167295
182561
68059
77813
14
NOVO HAMBURGO
110844
PORTO ALEGRE
615317
RIO GRANDE
84997
SANTA MARIA
107701
________________________________________
FONTE: Minstrio da Sade.
MEDIDAS ESTATSTICAS
Estudaremos dois tipos fundamentais de medidas estatsticas: medidas de tendncia
central e medidas de disperso.
As medidas de tendncia central mostram o valor representativo em torno do qual os
dados tendem a agrupar-se, com maior ou menor freqncia. So utilizadas para sintetizar
em um nico nmero o conjunto de dados observados.
As medidas de disperso mostram o grau de afastamento dos valores observados em
relao quele valor representativo.
MEDIDAS DE TENDNCIA CENTRAL
A mdia aritmtica simples
A mdia aritmtica simples de um conjunto de valores o valor obtido somando-se
todos eles e dividindo-se o total pelo nmero de valores. denotada por x (leia-se x
barra)
x
x .f
f
i
Exerccios:
OBSERVAES:
MEDIDAS DE DISPERSO
Servem para verificarmos a representatividade das medidas de posio, pois muito
comum encontrarmos sries que, apesar de terem a mesma mdia, so compostas de
maneira distinta.
Assim, para as sries:
a) 25, 28, 31, 34, 37
b) 17, 23, 30, 39, 46
temos x a xb 31 .
Nota-se que os valores da srie a esto mais concentrados em torno da mdia 31,
do que a srie b. Precisamos medir a disperso dos dados em torno da mdia, para isto
utilizaremos as medidas de disperso:
Desvio Padro
Coeficiente de Variao
Desvio Padro:
a raiz quadrada positiva da mdia aritmtica dos quadrados das diferenas entre cada
valor e a mdia aritmtica do conjunto e denotada por . Assim,
(x
x) 2
(x x)
f
i
fi
Exemplo 1:
Encontre o desvio padro para os dados das sries a), e b) acima.
Exemplo 2:
Salrios semanais para 100 operrios no especializados
Salrios
fi
xi
(xi- x )2 (xi- x )2fi
semanais
140 |-- 160
7
160 |-- 1
20
80
180 |-- 200
33
200 |-- 220
25
220 |-- 240
11
240 |-- 260
4
100
C v .100
x
Exemplo 4:
Para duas emisses de aes ordinrias da indstria eletrnica, o preo mdio dirio,
no fechamento dos negcios, durante um perodo de um ms, para as aes A, foi de R$
150,00 com um desvio padro de R$ 5,00. Para as aes B, o preo mdio foi de R$ 50,00
com um desvio padro de R$ 3,00. Em relao ao nvel do preo, qual dos tipos de aes
mais varivel?
Exerccios.
1) Uma amostra de 20 operrios de uma companhia apresentou os seguintes salrios
recebidos durante uma certa semana, arredondados para o valor mais prximo e
apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155,
165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Calcular (a) a mdia, (b) a
mediana, (c) a moda, (d) o desvio padro, (e) o coeficiente de variao, para este
grupo de salrios. R: a) 170,5; d) 33,12.
2) O nmero de carros vendidos por cada um dos vendedores de um negcio de
automveis durante um ms particular, em ordem crescente: 2, 4, 7, 10, 10, 10, 12,
12, 14, 15. Determinar (a) a mdia, (b) a mediana, (c) a moda, (d) o desvio padro
R: a) 9,6; d) 3,95.
3) Em conjunto com uma auditoria anual, uma firma de contabilidade pblica anota o
tempo necessrio para realizar a auditoria de 50 balanos contbeis. Calcular (a) a
mdia, (b) o desvio padro, para o tempo de auditoria necessrio para esta amostra
de registro. R: a) 43,2; b)12,28.
Tempo necessrio para a auditoria de balanos contbeis.
Tempo de auditoria. N de balanos.
(min.)
(fi)
10 |-- 20
3
20 |-- 30
5
30 |-- 40
10
40 |-- 50
12
50 |-- 60
20
Total
50
4) Os salrios semanais de 50 funcionrios de um hospital, em reais, foram os seguintes:
100
104
116
120
122
126
128
128
130
134
138
140
140
146
150
150
152
156
156
156
160
160
162
162
164
170
170
176
176
176
178
180
180
184
186
186
188
190
190
192
192
194
196
196
200 216
200 218
200
210
a) Construa uma distribuio de freqncias, com h = 20 e limite inferior para a primeira classe
igual a 100.
b) Quantos funcionrios tem um salrio semanal situado entre R$ 120,00 (inclusive) e R$ 160,00
(exclusive)? 17 funcionrios
c) Que porcentagem de funcionrios tem um salrio semanal situado entre R$ 180,00 (inclusive) e
R$ 200,00 (exclusive)?26%
d) Qual o salrio mdio semanal destes funcionrios utilizando o item a)?166,4
e) Determine o desvio padro e o coeficiente de variao da distribuio. 28,76; 17,28%
5) A distribuio das alturas de um grupo de pessoas apresentou uma altura mdia de 182
cm e um desvio padro de 15 cm, enquanto que a distribuio dos pesos, apresentou um peso mdio
de 78 kg, com um desvio padro de 8 kg. Qual das duas distribuies apresentou maior disperso?
Por qu?
CORRELAO E REGRESSO
Introduo:
J trabalhamos com a descrio de valores de uma nica varivel. Quando, porm,
consideramos observaes de duas ou mais variveis surge um novo problema: as relaes
que podem existir entre as variveis estudadas.
Assim, quando consideramos variveis como peso e estatura de um grupo de
pessoas, uso do cigarro e incidncia do cncer, procuramos verificar se existe alguma
relao entre as variveis de cada um dos pares e qual dessa relao.
Uma vez caracterizada a relao, procuramos descrev-la atravs de uma funo
matemtica. A regresso o instrumento adequado para determinao dos parmetros
dessa funo. Se todos os valores das variveis satisfazem exatamente uma equao, diz-se
que elas esto perfeitamente correlacionadas ou que h correlao perfeita entre elas.
Quando esto em jogo somente duas variveis, fala-se em correlao e regresso
simples. Quando se trata de mais de duas variveis, fala-se em correlao e regresso
mltipla.
Diagrama de Disperso
Para desenhar um diagrama de disperso, primeiro traa-se o sistema de eixos
cartesianos. Depois se representa uma das variveis no eixo x e a outra no eixo y
Colocam-se, ento os valores das variveis sobre os respectivos eixos e marca-se um ponto
para cada par de valores. Consideremos uma amostra aleatria, formada por dez dos 98
alunos de uma classe da Universidade A e pelas notas obtidas por eles em Matemtica e
Estatstica:
01
02
03
04
05
06
07
08
09
10
Notas
Matemtica
Estatstica
(X)
(Y)
5,0
6,0
8,0
9,0
7,0
8,0
10,0
10,0
6,0
5,0
7,0
7,0
9,0
8,0
3,0
4,0
8,0
6,0
2,0
2,0
No
8
6
4
2
0
-3
7
Matem tica
12
Dizemos que duas ou mais variveis expressam a relao de causa e efeito ou se elas
variam concomitantemente, so variveis consideradas correlacionadas.
O grau de relacionamento para dados amostrais dado pela seguinte expresso:
n
n n
n X i Yi X i Yi
i 1
i 1 i 1
r
n 2 n 2 n 2 n 2
n X X n Y Y
i 1 i i 1 i i 1 i i 1 i
(Y)
6
9
8
10
5
7
8
4
6
2
65
XY
30
72
56
100
30
49
72
12
48
4
473
X2
25
64
49
100
36
49
81
9
64
4
481
10.473 65.65
10.481 652 10.475 652
Y2
36
81
64
100
25
49
64
16
36
4
475
505
0,911
585 525
ANLISE DE REGRESSO
Muitas vezes de interesse estudar-se um elemento em relao a dois ou mais
atributos ou variveis simultaneamente.
Nesses casos presume-se que pelo menos duas observaes so feitas sobre cada
elemento da amostra. A amostra consistir, ento, de pares de valores, um valor para cada
uma das variveis, designadas, X e Y. Um indivduo i qualquer apresenta o par de valores
(Xi; Yi). O objetivo visado quando se registra pares de valores (observaes) em uma
amostra, o estudo das relaes entre as variveis X e Y.
Para a anlise de regresso interessam principalmente os casos em que a variao de
um atributo sensivelmente dependente do outro atributo.
5
8
7
10
6
7
9
3
8
2
6
9
8
10
5
7
8
4
6
2
12
10
8
Y
(X)
Y previsto
4
2
0
0
10
Varivel X
Obtemos ento: y i ax i b
Para cada par de valores (xi, yi) podemos estabelecer o desvio: ei yi yi = yi-( axi + b)
ei
i 1
= [yi - ax i - b]2
i 1
S = f(a, b)
Essa soma, funo de a e de b, ter mnimo quando suas derivadas parciais em
relao a a e b forem nulas.
n
i 1
z
b 2 yi ax i b 1 0
z 2 y ax b x 0
i
a i i
yi ax i b 0
yi ax i b x i 0
yi a x i nb 0
x i yi a x i b x i 0
y a x
i
x i yi b x i a x i 0
2
n x i yi x i yi
n x i2 x i
e a partir da 1 equao b y ax
X.Y
30
72
56
100
30
49
72
12
48
4
473
X2
25
64
49
100
36
49
81
9
64
4
481
0,8632
10.481 652
585
65
65
0,8632.
0,8892
10
10
Y2
36
81
64
100
25
49
64
16
36
4
475
12
10
8
Y
No exemplo:
(X)
(Y)
5
6
8
9
7
8
10
10
6
5
7
7
9
8
3
4
8
6
2
2
65
65
6
4
2
0
0
10
Varivel X
y i 0,8632 x i 0,8892
EXERCCIOS
y
c) Para x = 4, ache , o valor predito de y.
3. Os dados emparelhados que se seguem consistem no permetro torcico (em polegadas) e
dos pesos (em libras) de uma amostra de ursos machos.
X Trax 26 45
54
49
41
49
44 19
Y Peso 90 344 416 348 262 360 332 34
c) Para um urso com permetro torcico de 52 in, ache y , o peso predito.
4. Os dados da tabela abaixo consistem nos pesos (em libras) de plstico descartado e
tamanhos de residncias.
Plstico (lb.)
0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05
Tam. da residncia 2
3
3
6
4
2
1
5
c) Ache o tamanho predito de uma residncia que descarta 2,50 lb. de plstico.
5. A tabela abaixo apresenta os pesos totais (em libras) de lixo descartado e tamanhos de
residncias.
Peso total
10,76 19,96 27,6 38,11 27,9 21,9 21,83 49,27 33,27 35,54
Tam da
2
3
3
6
4
2
1
5
6
4
Residncia
c) Ache o tamanho predito de uma residncia que descarta 20,0 lb. de lixo.
6. Os dados seguintes foram obtidos da altura (polegadas) e do peso (libras) de mulheres
nadadoras.
Altura
68
64
62
65
66
Peso
132 108 102 115 128
c) Estimar o peso de uma mulher, que possui 67 polegadas.
7. Os dados seguintes mostram o gasto com mdia (milhes de dlares) e as vendas de
caixas (milhes) para sete grandes marcas de refrigerantes.
Marca
Gastos com mdia (US$) Vendas de caixas
Coca-Cola
131,3
1929,2
Pepsi-Cola
92,4
1384,6
Coca-Cola Light
60,4
811,4
Sprite
55,7
541,5
Dr. Pepper
40,2
536,9
Mountain Dew
29,0
535,6
7- Up
11,6
219,5
Fonte: Superbrands 98, 20 de outubro de 1997
c) Estimar as vendas, sabendo que foi gasto US$ 80,0 com mdia.
1
2
3
4
5
6
7
8
9
10
1
3
4
4
6
8
10
10
11
13
80
97
92
102
103
111
119
123
117
136
PROBABILIDADE
1.1.
INTRODUO
Encontramos na natureza dois tipos de fenmenos: determinsticos e aleatrios.
Os fenmenos determinsticos so aqueles em que os resultados so sempre os mesmos,
qualquer que seja o nmero de ocorrncias.
Nos fenmenos aleatrios, os resultados no sero previsveis, mesmo que haja um grande
nmero de repeties do mesmo fenmeno.
1.4.
OPERAES COM EVENTOS ALEATRIOS
Consideremos um espao amostral finito . Sejam A e B dois eventos de . As seguintes
operaes so definidas.
a) UNIO
O evento unio de A e B equivale ocorrncia de A, ou de B, ou de ambos. Contm os
elementos do espao amostral em que esto em pelo menos um dos dois conjuntos. Denota-se por
AB. A rea hachurada da figura abaixo ilustra a situao.
EXEMPLO: Se, na jogada de um dado, o evento A consiste no aparecimento de face par, seu
complementar dado por: A
REGRAS BSICAS
Se A e B so dois eventos do espao amostral , ento valem as seguintes regras bsicas:
0 P(A) 1
P(A) = 0 o evento impossvel e P(A) = 1 o evento certo.
P() = 1
Se A e B so eventos mutuamente excludentes, AB = , ento: P(AB) = P(A) +
P(B).
Se AB , ento: P(AB) = P(A) + P(B) P(AB).
P(A) = 1- P(A).
Se o vazio, ento P() =0.
EXERCCIO: Consideremos os alunos matriculados na disciplina de Estatstica. Temos _____
homens com mais de 25 anos, _____ homens com menos de 25 anos, ____ mulheres com mais de
25 anos, ____ mulheres com menos de 25 anos. Uma pessoa escolhida ao acaso dentre os ____. Os
seguintes eventos so definidos:
A: a pessoa tem mais de 25 anos;
C: a pessoa um homem;
B: a pessoa tem menos de 25 anos;
D: a pessoa uma mulher.
Calcular: P(BD) e P(AC).
EXERCCIOS
1. Quais dos valores abaixo no podem ser probabilidades?
0;
que 430 chegaram no horrio (com base em dados do Ministrio dos transportes).
Qual a probabilidade de um vo da American Airlines chegar no horrio?
3. Em uma pesquisa entre estudantes de uma faculdade, 1162 afirmaram que colaram nos
exames, enquanto 2468 afirmaram no colar. Selecionado aleatoriamente um desses
estudantes, determine a probabilidade de ele ou ela ter colado em um exame.
4. A MasterCard International efetuou um estudo de fraudes em cartes de crditos; os
resultados esto agrupados na tabela a seguir.
Tipo de fraude
Carto roubado
Carto falsificado
Pedidos por correio/telefone
Outros
N de cartes
243
85
52
46
Selecionado aleatoriamente uma caso de fraude nos casos resumidos na tabela, qual a
probabilidade de a fraude resultar de um carto falsificado? . R: 0,2.
5. Se IP (A)= 2/5, determine IP(A) .
6. Com base em dados do Centro Nacional de Estatstica de Sade dos EUA, a probabilidade
de uma criana ser menino 0,513. Determine a probabilidade de uma criana ser menina.
7. Determine IP(A) , dado que IP (A)= 0,228.
8. Com base em dados do Centro Nacional de Examinadores Forenses, se escolhermos
aleatoriamente uma pessoa que se submete ao exame para exerccio da advocacia, a
probabilidade de obter algum que seja aprovado 0,57. Ache a probabilidade de algum
que seja reprovado.
9. Os pesquisadores esto preocupados com declnio do nvel de cooperao por parte dos
entrevistados em pesquisas. A tabela mostra o resultado de uma pesquisa feita com 359
pessoas.
a)
b)
c)
d)
Faixa etria
Respondem
No respondem
Total
18-21
73
11
84
22-29
255
20
275
Total
328
31
359
Qual probabilidade de obter algum que no queira responder? R: 0,086.
Qual probabilidade de obter algum na faixa etria 22-29? R: 0,766.
Determine a probabilidade de obter algum na faixa etria 18-21 ou algum que recuse
responder. R: 0,29.
Determine a probabilidade de obter algum na faixa etria 18-21 que no recuse
responder. R: 0,203.
Testes de Hipteses
Nesta seo, vamos admitir um valor hipottico para o parmetro desconhecido - as
hipteses estatsticas - e, depois utilizar a informao da amostra para aceitar ou rejeitar
esse valor hipottico.
Por exemplo, com base na produtividade de uma hortalia cultivada em uma rea, onde
for usado um novo fertilizante, e em outra rea onde se utiliza o fertilizante padro, temos
de decidir se o novo fertilizante , ou no, melhor. A dificuldade aqui - e da a necessidade
de dados estatsticos - que a produtividade varia de planta para planta.
Os testes de hipteses permitem-nos tomar decises em presena da variabilidade, ou
seja, verificar se estamos diante de uma diferena real (significativa) ou de uma diferena
devida simplesmente flutuao aleatria inerente ao processo.
Na realizao de um teste, so feitas duas hipteses: a hiptese nula (H0), que ser
testada, e a hiptese alternativa (H1), que ser aceita caso nosso teste indique a rejeio da
hiptese nula.
Exemplos :
1- Indique as hipteses nula e alternativa para cada uma das situaes:
Correto
Erro tipo I
H0 falsa
Erro tipo II
Correto
5%
1%
de
Tipo de teste
unilateral bilateral
+1,65 ou
1,96
-1,65
+2,33 ou
2,58
-2,33
0 (a )
H : 0 (b )
( c)
0
4) Calcular:
X 0
Z
5) Concluses:
a) Se Z > z rejeita-se H0 (para um teste bicaudal)
b) Se Z > z rejeita-se H0 (para um teste unicaudal a direita).
c) Se Z < -z rejeita-se H0 (para um teste unicaudal a esquerda).
Exemplo 2: Uma mquina automtica de encher pacotes de erva mate, enche-os
segundo uma distribuio normal com mdia e desvio padro de 20g. A mquina foi
regulada para =500g. Desejamos verificar se a produo esta sob controle, para isto
analisamos uma amostra de 30 pacotes. Se uma amostra apresentar mdia X =492g, voc
pararia ou no a produo para verificar se a mquina deve ser regulada? Use =1%.
1o Passo:
2o Passo:
3o Passo:
4o Passo:
5o Passo:
2o Passo:
3o Passo:
4o Passo:
5o Passo:
1)
EXERCCIOS
Uma amostra aleatria de 40 elementos retirados de uma populao normal com desvio
padro = 3 apresentou um valor mdio igual a 60. Teste, ao nvel de significncia de
5%, a hiptese de que a mdia populacional seja igual a 59, supondo a hiptese
alternativa > 59.
2)
Uma amostra aleatria de 100 mortes naturais, no Rio Grande do Sul, deu uma mdia
de X =71,8 anos, com um desvio padro de 8,9 anos. Isto indica que o tempo mdio de
vida no RS, atualmente, maior do que 70 anos? (= 5%)
3)
4)
A resistncia dos cabos fabricados por determinada companhia acusa mdia de 1800
libras e desvio padro de 100 libras. Adotando-se uma nova tcnica de fabricao,
espera-se aumentar esta resistncia. Para testar tal hiptese, toma-se uma amostra de 50
cabos fabricados pelo novo processo, obtendo-se uma resistncia mdia de 1850 libras.
Pode-se aceitar a hiptese ao nvel de significncia de 0,01?
5)
Amostras Dependentes.
Neste caso usaremos a distribuio tde Student. Logo no 4o e 5o passo teremos:
4) Calcular:
onde: d = valor mdio das diferenas d para os
d d
dados
T
Sd
amostrais emparelhados( dependentes)
d = mdia das diferenas d para a
n
populao de dados emparelhados.
Sd = desvio padro das diferenas d para os
dados amostrais emparelhados
n = nmero de pares de dados.
Graus de liberdade = n-1.
5) Concluses:
c) Se T > t rejeita-se H0 (para um teste bicaudal)
b) Se T > t rejeita-se H0 (para um teste unicaudal a direita).
c) Se T < -t rejeita-se H0 (para um teste unicaudal a esquerda).
A
191
224
-33
B
97
171
-74
C
116
191
-75
D
165
207
-42
E
116
196
-80
F
129
165
-36
G
171
177
-6
H
155
165
-10
I
112
140
-28
J
102
188
-86
K
188
155
33
L
158
219
-61
M
121
177
-56
N
133
174
-41
1o Passo:
2o Passo:
3o Passo:
4o Passo:
5o Passo:
Amostras Grandes e Independentes.
Neste caso usaremos a distribuio Normal. Logo no 4o e 5o passo teremos:
4) Calcular:
( x x 2 ) (1 2 )
Z 1
12 22
n1 n 2
OBS: Se no conhecemos os valores de 1 e 2, podemos substitu-los por s1 e s2, desde
que ambas as amostras sejam grandes.
5) Concluses:
d) Se Z > z rejeita-se H0 (para um teste bicaudal)
b) Se Z > z rejeita-se H0 (para um teste unicaudal a direita).
c) Se Z < -z rejeita-se H0 (para um teste unicaudal a esquerda).
Exemplo:
2o Passo:
3o Passo:
4o Passo:
5o Passo:
Amostras Pequenas e Independentes.
Neste caso usaremos a distribuio Normal. Logo no 4o e 5o passo teremos:
4) Calcular:
( x x 2 ) (1 2 )
T 1
s 2p s 2p
n1 n 2
(n 1 1)s12 (n 2 1)s 22
e o grau de liberdade gl = n1+n2-2.
(n 1 1) (n 2 1)
5) Concluses:
e) Se Z > z rejeita-se H0 (para um teste bicaudal)
b) Se Z > z rejeita-se H0 (para um teste unicaudal a direita).
c) Se Z < -z rejeita-se H0 (para um teste unicaudal a esquerda).
2
Onde s p
Exemplo:
Os dados amostrais a seguir apresentam os nveis de concentrao de lcool no sangue por
ocasio da priso de criminosos selecionados aleatoriamente, e que foram condenados por
dirigirem embriagados. Os dados so categorizados por tipo de bebida consumida.
Cerveja
0,129
0,146
0,148
0,154
0,155
0,164
0,187
0,19
0,203
Usque
0,185
0,19
0,22
0,224
0,225
0,226
0,227
0,241
0,247
0,253
0,257
1o Passo:
2o Passo:
3o Passo:
4o Passo:
5o Passo:
Exerccios:
1. Costuma-se avaliar a inteligncia das crianas dando-lhes blocos e pedindo-lhes que
construam uma torre to alta quanto possvel. Repetiu-se um ms depois o mesmo
experimento, com os tempos (em segundos) dados na tabela a seguir. No nvel de
0,01 de significncia, teste a afirmao de que no h diferena entre os dois
tempos.
Criana
A B C D E
F
G H I
J
K L
M N O
1 tentativa 30 19 19 23 29 178 42 20 12 39 14 81 17 31 52
2 tentativa 30 6
14 8
14 52 14 22 17 8
11 30 14 17 15
2. Utilize o nvel de significncia de 0,05 para testar a alegao de que as duas
amostras provm de populaes com a mesma mdia. As amostras so
independentes.
Elementos Tratados Elementos No-Tratados
n1 = 60
n2 = 75
x 1 8,75
x 2 9,66
S1 = 2,05
S2 = 2,88
3. O estresse afeta a capacidade de memorizao de testemunhas oculares? Este
problema foi estudado em um experimento que testou a memria visual de uma
testemunha uma semana aps o interrogatrio normal de um suspeito que
cooperava, e um interrogatrio exaustivo de um suspeito que no cooperava. Os
nmeros de detalhes lembrados uma semana aps o incidente esto resumidos aqui.
11,5
11,5
12
12,5
13
13
7
7
7,5
8
8
8,5
8,5
9
9
9
10,5
11
11
12
0,344
0,407
0,455
0,463
Grupo de controle
0,334
0,349
0,402
0,413
0,429
0,445
0,46
0,476
0,483
0,501
0,519
0,594
= proporo amostral
onde: p
p p0
Z
p0 = valor da hiptese nula
p (1 p )
n = tamanho da amostra
n
Exemplo: Uma estao de televiso afirma que 60% dos televisores estavam ligados no seu
programa especial do ltimo sbado. Uma rede competidora deseja contestar essa
afirmao e decide, para isso, usar uma amostra de 200 famlias. Destas 200 famlias 104
responderam afirmativamente. Ao nvel de 5% de significncia qual a sua concluso?
1o Passo:
2o Passo:
3o Passo:
4o Passo:
5o Passo:
Teste para duas propores
Devemos calcular:
x1
(proporo amostral)
(p p 2 ) (p1 p 2 )
n1
Z 1
p.q p.q
p1 = proporo populacional
n1 = tamanho da amostra
n1
n2
x x2
p 1
e q 1 p.
n1 n 2
Exemplo: Pesquisadores fizeram um estudo de empregadas da IBM que estavam grvidas.
De 30 empregadas que lidavam com ter-glicol, 10 (ou 33,33%) tiveram aborto
(espontneo), mas, de 750 que no estavam expostas ao ter-glicol, apenas 120 (ou 16%)
abortaram. No nvel de 0,01 de significncia, teste a afirmao de que as mulheres expostas
ao ter-glicol apresentam maior taxa de aborto.
1o Passo:
1 =
onde: p
2o Passo:
3o Passo:
4o Passo:
5o Passo:
1) A preocupao com ambiente entra freqentemente em conflito com a tecnologia
moderna, como no caso dos pssaros que representam perigo para a aviao durante a
decolagem. Um grupo ambiental afirma que tais acidentes com pssaros so to raros
que no se justifica mat-los. Um grupo de pilotos alega que entre as decolagens
interrompidas que levam um avio a ultrapassar o final da pista, 10% so devidas a
coliso com pssaros. Teste esta afirmao ao nvel de 0,05. os dados consistem em 74
decolagens interrompidas, destas 5 foram devidos coliso com pssaros.
2) Um relatrio do Ministrio da Justia dos EUA inclui a afirmao de que em casos de
318 maridos acusados, e 155 condenaes entre 222 esposas acusadas. Tese a afirmao
feita com nvel de 0,01 de significncia.
3) Uma questo de teste considerada boa se permite discriminar entre estudantes