Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
ESTATÍSTICA
Ensino a Distância — E a D
Revisão 09/2008
LISTA DE FIGURAS
SUMÁRIO
APRESENTAÇÃO 1
1. INTRODUÇÃO 2
2. NOÇÕES BÁSICAS 3
2.1. Arredondamento de Dados 3
2.2. População e Amostra 4
2.2.1. População 4
2.2.2. Amostra 4
2.2.3. A Escolha da Amostra 4
3. ORGANIZAÇÃO DE DADOS 7
3.1. Tipos de Variáveis 8
3.1.1. Variáveis Qualitativas 8
3.1.1.1. Variável Qualitativa Nominal 8
4.3. Histograma 17
4.4. Polígono de Freqüências 17
4.5. 1ª Lista de Exercícios 18
5. MEDIDAS 23
5.1. Medidas de Posição 23
6.1. Definições 37
7.1.1. Gráfico 41
8. ESTIMAÇÃO 45
9. CORRELAÇÃO 54
REFERÊNCIAS 67 74
1
APRESENTAÇÃO
1. INTRODUÇÃO
A palavra “estatística”, de origem latina, significou por muito tempo “ciência dos
negócios do Estado”. Os que governavam, sentindo necessidade de informações,
organizavam departamentos que tinham a responsabilidade de fazer essas investigações.
As sociedades modernas acumulam grande quantidade de dados numéricos relativos a
eventos sociais, econômicos, científicos, esportivos etc.
Desse modo notamos que o uso da pesquisa é bastante comum nas várias atividades
humanas.
Exemplos:
2. NOÇÕES BÁSICAS
Exemplos:
1º) Queremos obter informações sobre a audiência de certo programa de TV, na Grande São
Paulo.
População: é o conjunto de todos os domicílios da Grande São Paulo que possuem TV.
Amostra: é o conjunto dos domicílios que serão visitados.
2º) Estudar a procedência dos candidatos a uma certa universidade.
População: conjunto de todos os candidatos à referida universidade.
Amostra: conjunto dos candidatos que serão entrevistados.
3º) Queremos fazer um estudo sobre a idade dos alunos do curso de Publicidade e Propaganda
de uma determinada universidade.
População: todos os alunos do curso de Publicidade e Propaganda.
Amostra: uma classe do primeiro ano do curso de Publicidade e Propaganda.
Quando são obtidos dados de toda uma população, dizemos que foi feito um
recenseamento, e a este conjunto de dados damos o nome de censo.
Quando os dados são obtidos de parte da população, foi feita uma amostragem.
Exemplo 2: Na escola Sapequinha, quer fazer-se um estudo sobre o peso dos alunos de 7 anos
de idade. Existem 120 crianças na faixa de 7 anos de idade distribuídas em cinco classes, do
seguinte modo: a primeira série A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem
35, a D, 30 e a E tem 20. Vamos escolher uma amostra com no mínimo 12 crianças (10% de
120), selecionadas através de:
3. ORGANIZAÇÃO DE DADOS
Exemplos: sexo, turma, estado civil, grau de instrução, hábito de fumar etc.
Exemplos: tamanho (P, M, G); classe social (baixa, média, alta); grau de instrução (1º grau,
2º grau, grau superior); estado civil.
Exemplos: número de filhos, idade (em anos), cine (número de vezes que vai ao cinema por
semana).
ESQUEMA
Variável
Qualitativa Quantitativa
Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine OpCine TV OpTV
1 A F 17 1,60 60,5 2 Não P 0 1 B 16 R
2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R
3 A M 18 1,85 72,8 2 Não P 5 2 M 15 R
4 A M 25 1,85 80,9 2 Não P 5 2 B 20 R
5 A F 19 1,58 55,0 1 Não M 2 2 B 5 R
6 A M 19 1,76 60,0 3 Não M 2 1 B 2 R
7 A F 20 1,60 58,0 1 Não P 3 1 B 7 R
8 A F 18 1,64 47,0 1 Sim I 2 2 M 10 R
9 A F 18 1,62 57,8 3 Não M 3 3 M 12 R
10 A F 17 1,64 58,0 2 Não M 2 2 M 10 R
11 A F 18 1,72 70,0 1 Sim I 10 2 B 8 N
12 A F 18 1,66 54,0 3 Não M 0 2 B 0 R
13 A F 21 1,70 58,0 2 Não M 6 1 M 30 R
14 A M 19 1,78 68,5 1 Sim I 5 1 M 2 N
15 A F 18 1,65 63,5 1 Não I 4 1 B 10 R
16 A F 19 1,63 47,4 3 Não P 0 1 B 18 R
17 A F 17 1,82 66,0 1 Não P 3 1 B 10 N
18 A M 18 1,80 85,2 2 Não P 3 4 B 10 R
19 A F 20 1,60 54,5 1 Não P 3 2 B 5 R
20 A F 18 1,68 52,5 3 Não M 7 2 B 14 M
21 A F 21 1,70 60,0 2 Não P 8 2 B 5 R
22 A F 18 1,65 58,5 1 Não M 0 3 B 5 R
23 A F 18 1,57 49,2 1 Sim I 5 4 B 10 R
24 A F 20 1,55 48,0 1 Sim I 0 1 M 28 R
25 A F 20 1,69 51,6 2 Não P 8 5 M 4 N
26 A F 19 1,54 57,0 2 Não I 6 2 B 5 R
27 B F 23 1,62 63,0 2 Não M 8 2 M 5 R
28 B F 18 1,62 52,0 1 Não P 1 1 M 10 R
29 B F 18 1,57 49,0 2 Não P 3 1 B 12 R
30 B F 25 1,65 59,0 4 Não M 1 2 M 2 R
31 B F 18 1,61 52,0 1 Não P 2 2 M 6 N
32 B M 17 1,71 73,0 1 Não P 1 1 B 20 R
33 B F 17 1,65 56,0 3 Não M 2 1 B 14 R
34 B F 17 1,67 58,0 1 Não M 4 2 B 10 R
35 B M 18 1,73 87,0 1 Não M 7 1 B 25 B
36 B F 18 1,60 47,0 1 Não P 5 1 M 14 R
37 B M 17 1,70 95,0 1 Não P 10 2 M 12 N
38 B M 21 1,85 84,0 1 Sim I 6 4 B 10 R
39 B F 18 1,70 60,0 1 Não P 5 2 B 12 R
40 B M 18 1,73 73,0 1 Não M 4 1 B 2 R
41 B F 17 1,70 55,0 1 Não I 5 4 B 10 B
42 B F 23 1,45 44,0 2 Não M 2 2 B 25 R
43 B M 24 1,76 75,0 2 Não I 7 0 M 14 N
44 B F 18 1,68 55,0 1 Não P 5 1 B 8 R
45 B F 18 1,55 49,0 1 Não M 0 1 M 10 R
46 B F 19 1,70 50,0 7 Não M 0 1 B 8 R
47 B F 19 1,55 54,5 2 Não M 4 3 B 3 R
48 B F 18 1,60 50,0 1 Não P 2 1 B 5 R
49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R
50 B M 18 1,83 86,0 1 Não P 7 0 M 20 B
A partir da tabela de dados brutos (Tabela 1), vamos construir uma nova tabela com
as informações resumidas, para cada variável, denominada tabela de freqüência, que conterá
os valores da variável e suas respectivas contagens, as quais são denominadas freqüências
absolutas ou simplesmente, freqüências.
n → freqüência total = ∑ n i
3.2.1. Exemplos:
F 37 0,74 74
M 13 0,26 26
Note que, para variáveis cujos valores possuem ordenação natural (qualitativas
ordinais e quantitativas em geral), incluímos na tabela de freqüência uma coluna contendo as
freqüências acumuladas (fac) (quando o número de valores i for maior do que 2). A
freqüência acumulada até um certo valor é obtida pela soma das freqüências de todos os
valores da variável, menores ou iguais ao valor considerado.
12
Toler ni fac n fi ⋅ 100 (%) fac (%) Toler: variável qualitativa ordinal.
fi = i
n
I 10 10 0,20 20 20
P 21 31 0,42 42 62
M 19 50 0,38 38 100
19 7 38 0,14 14 76
20 4 42 0,08 8 84
21 3 45 0,06 6 90
22 0 45 0,00 0 90
23 2 47 0,04 4 94
24 1 48 0,02 2 96
25 2 50 0,04 4 100
A variável Peso, classificada como quantitativa contínua, apresenta valores que podem
ser qualquer número real num certo intervalo.
13
Pela Tabela 1, verificamos que os valores variam entre 44,0 kg e 95,0 kg e como
existe um grande número de valores diferentes, vamos construir faixas ou classes de valores
e contar o número de ocorrências em cada faixa.
Não existe uma regra formal para determinar o número de faixas ou classes a serem
utilizadas. Entretanto, deve-se observar que com um pequeno número de classes, perde-se
informação, e com um número grande de classes, o objetivo de resumir os dados fica
prejudicado. No geral, é conveniente trabalharmos com 5 a 8 faixas de mesma amplitude,
devendo ressaltar que faixas de tamanho desigual podem ser convenientes para representar
valores nas extremidades da tabela.
Para a variável Peso, usaremos faixas de amplitude 10 e iniciaremos com 40,0 kg.
Observe pela fac que 76% dos alunos pesam menos que 70,0 kg e 100 – 88 = 12%
têm peso maior ou igual a 80,0 kg.
li + ls 40 + 50 90
Limite inferior (li): 40,0 Ponto Médio (PM) = ( = = 45 )
2 2 2
14
O símbolo ├─ : indica que o intervalo é fechado à esquerda e aberto à direita (40,0 faz parte
dessa classe, mas 50,0 não; 50,0 está na 2ª classe).
0 ├─ 6 14 14 0,28 28 28 contínua.
Tabela 6: Variável TV
Portanto, o valor 30, e não tendo assim, que abrir mais uma classe por causa de um único
valor. Outra sugestão seria usar uma amplitude maior nessa última classe, por exemplo,
24 ├─ 36 que inclui o valor 30.
15
4. GRÁFICOS ESTATÍSTICOS
Muitas vezes, a informação contida nas tabelas pode ser mais facilmente visualizada
através de gráficos. Vamos definir quatro tipos básicos de gráficos: setores ou pizza, colunas
ou barras, histograma e polígono de freqüências.
Adapta-se muito bem às variáveis qualitativas, mas também pode ser usado para as
variáveis quantitativas discretas.
100% → 360°⎫
⎬ ⇒ 100 ⋅ x = 20 ⋅ 360
20% → x ⎭
20 ⋅ 360
x= ⇒ x = 72°
100
I
20%
M
38%
P
42%
Gráfico 1: Setores
30
20
ni
10 22
9 7
0 4 3 0 2 1 2
Idade
Gráfico 2: Colunas
17
4.3. HISTOGRAMA
25 22
20
15
ni
10 8 8
6 5
5
1
0
40,0 50,0 60,0 70,0 80,0 90,0 100,0
Peso
Gráfico 3: Histograma
segmentos de retas, sendo que o primeiro e o último deles são ligados ao eixo das abscissas,
na metade de classes hipotéticas, imediatamente anterior à primeira e posterior à última.
20
15
ni
10 (75,0; 6) (85,0; 5)
(45,0; 8) (65,0; 8) (95,0; 1)
5
0
40,0 50,0 50,0 60,0 60,0 70,0 70,0 80,0 80,0 90,0 90,0 100,0
Pe so
Escola População
A 500
B 250
C 440
D 360
Total 1550
Tabela 7
4) Em uma cidade com 30.000 habitantes deseja-se fazer uma pesquisa sobre a preferência
por tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
b) Supondo que na cidade haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma
amostra com 1.200 pessoas.
5) Em uma fábrica foram testadas 400 lâmpadas; a duração delas aparece na distribuição por
freqüência da Tabela 8:
20
Duração Número de
300 ├─ 400 14
400 ├─ 500 46
500 ├─ 600 58
600 ├─ 700 76
700 ├─ 800 68
800 ├─ 900 62
900 ├─ 1000 48
1000 ├─ 1100 22
1100 ├─ 1200 6
Total 400
Tabela 8
6) Com relação às variáveis: Turma, Alt, Filhos, Fuma, Exerc, Cine, Op Cine, Op TV, da
(Tabela 1)
c) A variável Exerc, poderia ser tratada de forma diferente com relação à sua classificação?
Justifique sua resposta e em caso afirmativo, construa a nova distribuição de freqüência.
21
d) Construa os gráficos que melhor se adaptam a cada uma das variáveis acima.
Pacientes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Fisioterapia 7 8 5 6 4 5 7 7 6 8 6 5 5 4 5
Seqüelas S S N N N S S N N S S N S N N
Cirurgia A M A M M B A M B M B B M M A
Tabela 9
b) Para cada variável, construa a tabela de freqüência e faça uma representação gráfica.
c) Para o grupo de pacientes que não ficaram com seqüelas, faça um gráfico de barras para a
variável Fisioterapia. Você acha que essa variável se comporta de modo diferente nesse
grupo?
10,1 7,3 8,5 5,0 4,2 3,1 2,2 9,0 9,4 6,1
3,3 10,7 1,5 8,2 10,0 4,7 3,5 6,5 8,9 6,1
Tabela 10
b) Construa o histograma.
Nota Freqüência
0 ├─ 2 14
2 ├─ 4 28
4 ├─ 6 27
6 ├─ 8 11
8 ├─ 10 4
Tabela 11
a) Construa o histograma.
5. MEDIDAS
x1 + x 2 + L + x n
∑ xi ∑ ( n i⋅ x i )
i =1
x= = (dados não agrupados); x= (dados agrupados)
n n n
9 + 12 + 8 + 6 + 14 + 11 + 5 65
x= = = 9,29
7 7
É o valor da variável que ocupa a posição central dos dados ordenados. Temos duas
considerações a fazer:
a) O número de observações (n) é ímpar: a mediana será o valor da variável que ocupa a
n +1
posição de ordem .
2
5, 6, 8, 9, 11, 12, 14
n +1 8
n = 7 (ímpar) ∴ = = 4 ∴ a mediana é o 4º elemento da seqüência ⇒ md = 9
2 2
b) O número de observações (n) é par: não existe portanto um valor que ocupe o centro;
convencionou-se que a mediana será a média aritmética dos valores que ocupam as posições
n n
de ordem e +1.
2 2
n n
n = 6 (par) ∴ =3 e + 1 = 4 ∴ a mediana será dada pela média aritmética entre o
2 2
9 + 11 20
3º e 4º elementos da seqüência ⇒ md = = = 10
2 2
Para calcularmos a mediana quando os dados estão agrupados em classes, não levamos
em consideração se n é par ou ímpar e procedemos do seguinte modo:
25
n
1º) Calcula-se .
2
n
− fac ) ⋅ h
(
3º) Aplica-se a fórmula: md = limd + 2 , onde:
ni md
Exemplo: Calcular a moda para o seguinte conjunto de dados: 65, 87, 49, 58, 65, 65, 67, 83,
87, 79, 87.
Δ1
2º) Aplica-se a fórmula: mo = li mo + ⋅ h , onde:
Δ1 + Δ 2
Exemplos
1) Calcule média, mediana e moda para a variável Idade. (Tabela 12) (Ver Tabela 4):
Idade ( x i ) ni fac ni ⋅ xi
x=
∑ (n i⋅x i ) = 945 = 18,9 (média)
n 50
17 9 9 153
n = 50 é par, portanto, a mediana será a
18 22 31 396
média aritmética dos dois valores
19 7 38 133 n n
centrais = 25 e + 1 = 26 . Pela
2 2
20 4 42 80
fac observamos que o valor da
21 3 45 63
freqüência acumulada até 18 é igual a
22 0 45 0 31, e portanto o 25º elemento é igual
25 2 50 50 18 + 18
∴ md = = 18 (mediana)
2
Total n = 50 ∑ (n i ⋅ x i ) = 945
Tabela 12
Para o cálculo de mo, olhamos a maior freqüência (22) que corresponde à idade de 18anos.
∴ mo = 18 (moda)
2) Calcule média, mediana e moda para a variável Peso. (Tabela 13) (Ver Tabela 5)
27
Total n = 50 ∑ (n i ⋅ x i ) = 3060,0
Tabela 13
x=
∑ ( n i ⋅ x i ) = 3060,0 = 61,2 (média)
n 50
n 50
= = 25 . Pela fac (30), a 2ª classe contém a mediana, isto é, o intervalo 50,0 ├─ 60,0.
2 2
n 50
− fac ) ⋅ h
( ( − 8 ) ⋅ 10
(25 − 8 ) ⋅ 10
md = li md + 2 = 50,0 + 2 = 50,0 + =
ni md 22 22
170
50,0 + = 57,73 (mediana)
22
n i = 22 ⇒ classe mod al : 2 ª
Δ1
mo = li mo + ⋅h
Δ1 + Δ 2
22 − 8 14
mo = 50,0 + ⋅ 10 = 50,0 + ⋅ 10 = 50,0 + 5 = 55,0 (moda)
(22 − 8) + (22 − 8) 2.14
Observação
As medidas de posição podem ser utilizadas em conjunto para auxiliar a análise dos dados,
mas existem situações em que uma pode ser mais conveniente do que a outra. Por exemplo,
28
quando existe um ou mais valores muito discrepantes, a média é muito influenciada por este
valor e se torna inadequada para representar o conjunto de dados, sendo melhor trabalhar com
a mediana. Por outro lado, para conjuntos de dados muito numerosos, a ordenação é custosa e
a mediana se torna difícil de calcular.
Um bairro nobre da capital paulista inclui uma das maiores favelas de São Paulo. O
que podemos dizer da renda média do bairro? Certamente, os altos rendimentos de alguns
residentes serão suficientes para fazer a média atingir um patamar comparável às melhores
economias do mundo, porém a discrepância entre os diversos valores deve ser muito grande.
O que podemos estar esquecendo é a variabilidade dos valores da variável e isto não é captado
pela média e sim pelas medidas de dispersão.
A: 10, 10, 11, 12, 12, 13, 14, 14, 14, 15 com x = 12,5 e md = 12,5
Observamos que essas séries não são homogêneas apesar de ambas terem o mesmo
valor para a média e mediana. É preciso, pois, calcular as constantes de dispersão que medem
os afastamentos dos valores dessas séries em torno do valor central.
R = x máx. − x mín.
Exemplos:
Para a série A: R = 15 – 10 = 5
Para a série B: R = 23 – 7 = 16
Para medir a dispersão dos valores de uma variável em torno da média, é interessante
estudar o comportamento dos desvios de cada valor em relação à média, isto é, d i = x i − x .
Na determinação de cada desvio d i , estaremos medindo a dispersão entre cada x i e a média
n n
x . Porém se somarmos todos os desvios, teremos ∑ di = ∑ ( x i − x ) = 0 . Para contornar o
i =1 i =1
N N
∑ ( xi − μ ) 2 ∑ di2
i =1 i =1
σ2= = (dados não agrupados) Para uma população,
N N
onde μ é a média da
N N população e N é o
∑ ( xi − μ ) 2 ⋅ ni ∑ di2 ⋅ n i tamanho da população
i =1 i =1
σ2= = (dados agrupados)
N N
n
∑ ( xi − x ) 2
i =1
S2= (dados não agrupados) Para uma amostra,
n
onde x é a média da
amostra e n é o
tamanho da amostra
30
n
∑ ( xi − x ) 2 ⋅ ni
i =1
S2= (dados agrupados)
n
A seguir estão outras fórmulas que podem ser usadas para facilitar o cálculo da
variância populacional e amostral.
1 N 2 2 1
n
σ = ∑ x i − μ (dados não agrupados) S = ∑ x i2 − ( x ) 2 (dados não agrupados)
2 2
N i =1 n i =1
1 N 1 n
σ2= ∑
N i =1
( n i ⋅ x i2 ) − μ 2 (dados agrupados) S 2 = ∑ ( n i ⋅ x i2 ) − ( x ) 2 (dados agrupados)
n i =1
Exemplos:
1 n 2 1
Para a série A: S 2 = ∑
n i =1
x i − ( x ) 2 = ⋅ 1591 − 156,25 = 159,1 − 156,25 = 2,85
10
1 n 2 1
Para a série B: S 2 = ∑
n i =1
x i − ( x ) 2 = ⋅1799 − 156,25 = 179,9 − 156,25 = 23,65
10
É assim definido para que a unidade original da variável, se houver, seja mantida, pois,
pela fórmula do cálculo da variância, a unidade é elevada ao quadrado.
Exemplos:
σ S
CV = ⋅100% (para população) CV = ⋅100% (para amostra)
μ x
Exemplos:
1,69
Para a série A: CV = ⋅100% = 13,52 %
12,5
4,86
Para a série B: CV = ⋅100% = 38,88 %
12,5
Vemos, portanto, que há maior variação na série B do que na A, pois o CV na série B é bem
maior que na série A.
Exemplos
1) Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável
Idade. (Tabela14) (Ver Tabela 12):
32
Idade ( x i ) ni fac ni ⋅ xi n i ⋅ x i2
17 9 9 153 2601
18 22 31 396 7128
19 7 38 133 2527
20 4 42 80 1600
21 3 45 63 1323
22 0 45 0 0
23 2 47 46 1058
24 1 48 24 576
25 2 50 50 1250
Tabela 14
R = 25 – 17 = 8 (amplitude total)
1 n
S 2= ∑ ( n i ⋅ x i2 ) − ( x )2
n i =1
Já foi calculado em 5.1.1. (Exemplo1): x = 18,9
1
S 2= ⋅18063 − (18,9 ) 2 = 361,26 − 357,21 = 4,05 (variância)
50
S 2,01
CV = ⋅100% = ⋅100% = 10,63% (coeficiente de variação)
x 18,9
2) Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável
Peso. (Tabela 15) (Ver Tabela 13):
33
Tabela 15
1 n
S 2= ∑
n i =1
( n i ⋅ x i2 ) − ( x ) 2 Já foi calculado em 5.1.1. (Exemplo2): x = 61,2kg
1
S 2= ⋅195450,0 − ( 61,2 ) 2 = 3909,0 − 3745,44 = 163,56kg 2 (variância)
50
S 12,79
CV = ⋅100% = ⋅100% = 20,90% (coeficiente de variação)
x 61,2
2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.
2) Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso avaliado
no fim de um mês. Os dados referentes ao ganho de peso (em quilogramas) foram os
seguintes:
1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2.
b) Organize uma tabela de freqüência com faixas de amplitude 0,2 a partir de 1,5.
c) Calcule, a partir da tabela de freqüência e com o ponto médio como representante de cada
faixa, as medidas de posição e de dispersão. Comente as diferenças encontradas com o item
(a).
d) Se ao invés de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente: o de
(a) ou o de (c) ?Justifique.
4) Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo
tiveram o seu consumo observado durante 1000 quilômetros. A informação obtida é
apresentada na Tabela 16 em km/litro.
Faixas Freqüência
7 ├─ 8 27
8 ├─ 9 29
9 ├─ 10 46
10 ├─ 11 43
11 ├─ 12 55
Tabela 16
35
5) Se a média das alturas de um grupo de pessoas é 175 cm e o desvio padrão é 20 cm, uma
pessoa com estatura de 150 cm está dentro da normalidade? Por quê?
Turma A: x = 45 , S = 10
Turma B: x = 45 , S = 3,5
Responda:
Pontos ni
5├─ 10 2
10├─ 15 4
15├─ 20 10
20├─ 25 15
25├─ 30 9
30├─ 35 5
Tabela 17
Responda:
d) Uma criança que obteve 28 pontos é considerada com motricidade normal? Por quê?
38 40 45 42 45 40 43 38
36
45 45 40 41 41 38 46 32
48 46 42 43 44 50 38 40
Nesse grupo de crianças, um menino com 35 kg seria considerado com peso normal? Por quê?
37
6. PROBABILIDADES
Neste capítulo não existe a pretensão de um estudo completo sobre a teoria das
probabilidades, mas sim do conhecimento de alguns conceitos que serão aplicados
posteriormente.
6.1. DEFINIÇÕES
Exemplo: se um corpo percorre uma distância de 120 km, com velocidade média de 60 km/h,
podemos determinar, pelas leis da Física, que ele gastará 2 horas para percorrer o referido
espaço, e isto sempre ocorrerá, desde que sejam mantidas as mesmas condições.
É aquele cujo resultado não pode ser previsto com certeza, ainda que mantidas as
mesmas condições de realização.
Exemplo: no lançamento de um dado, não podemos dizer, com certeza, qual será o resultado.
Só podemos saber que é provável que ocorra o resultado 1, ou 2, ou 3, ou 4, ou 5, ou 6.
Veremos que modelos podem ser estabelecidos para quantificar as incertezas das
diversas ocorrências.
38
Exemplo: lançamos uma moeda duas vezes. Se C indica cara e R, coroa, temos:
S = {(C, C); (C, R); (R, C); (R, R)} (Espaço Amostral)
Seja o evento “obtenção de faces iguais”. Temos: E = {(C, C); (R, R)} (Evento)
Seja o evento “obtenção de cara no 1º lançamento”. Temos: E = {(C, C); (C, R)} (Evento)
Exemplo: um experimento consiste em retirar uma lâmpada de um lote e medir seu tempo de
vida antes de se queimar. Um espaço amostral conveniente é: S = {t: t ≥ 0}, isto é, o conjunto
de todos os números reais não negativos. Seja o evento “o tempo de vida da lâmpada é
inferior a 20 horas”. Temos: E = {t: 0 ≤ t < 20}. Este é um exemplo de espaço amostral
contínuo, enquanto os outros anteriores são discretos.
6.1.5. Probabilidade
2 1
No caso dos dois eventos acima, P(E) = = .
4 2
39
6.2. PROPRIEDADES
• Como toda freqüência relativa é um número entre 0 e 1, temos que: 0 ≤ P(E) ≤ 1, para
qualquer evento E.
Notação: p ( x i ) = P ( X = x i ) = pi , i = 1, 2, 3, K ou ainda
X x1 x2 x3 K
pi p1 p2 p3 K
Exemplos: renda, salário, tempo de uso de um equipamento, área atingida por certa praga
agrícola.
Dizemos que uma variável aleatória contínua X tem distribuição normal com
parâmetros μ e σ2, respectivamente a média e a variância da distribuição,
1 2 2
f ( X) = ⋅ e− ( X −μ) / 2 ⋅ σ , para −∞ < X < +∞ .
σ 2π
7.1.1. Gráfico
f(X)
0 μ-σ μ μ+σ X
b) f ( X ) → 0 quando X → ±∞ .
e) Var ( X ) = σ 2 ( variância)
f(X)
Como calcular P ( a ≤ X ≤ b)?
0 μ a b X
Gráfico 6: Probabilidade
X−μ
Desse modo, se X ~ N( μ , σ 2 ) , definimos uma nova variável Z = , para qual
σ
demonstra-se que μ ( Z ) = 0 e σ 2 ( Z ) = 1.
f(Z)
-1 0 1 Z
a −μ b−μ
P ( a ≤ X ≤ b) = P ( ≤Z≤ ) , onde X ~ N( μ , σ 2 ) .
σ σ
Exemplo
1) As alturas de 10.000 alunos têm distribuição aproximadamente normal, com média 170 cm
e desvio padrão 5 cm. Qual a probabilidade de termos:
Resolução
a −μ b−μ
P ( a ≤ X ≤ b) = P ( ≤Z≤ )
σ σ
= P (- 0,4 < Z < 0 ) + P ( 0 < Z < 3 ) = P ( 0 < Z < 0,4 ) + P ( 0 < Z < 3 ) (Tabela da Normal
Reduzida) = 0,1554 + 0,4987 = 0,6541 ∴ P ( 168 < X < 185 ) = 65,41%
160 − 170
d) P ( X < 160 ) = P ( Z < ) = P ( Z < - 2 ) = P ( Z > 2 ) (pela simetria da Normal)
5
P ( Z > 2 ) = 0,5 – P ( 0 < Z < 2 ) = 0,5 – 0,4772 = 0,0228 ∴ P ( X < 160 ) =2,28%
180 − 170
e) P ( X > 180 ) = P ( Z > ) = P ( Z > 2 ) = 0,5 – P ( 0 < Z < 2 ) = 0,5 – 0,4772 =
5
0,0228
P ( Z < 1 ) = 0,5 + P ( 0 < Z < 1 ) = 0,5 + 0,3413 = 0,8413 ∴ P ( X > 165 ) = 84,13%.
Como são 10.000 alunos, teremos: 10.000 . 0,8413 = 8.413 alunos é o número esperado de
alunos com altura superior a 165 cm.
45
8. ESTIMAÇÃO
A estimação faz parte da Inferência Estatística que tem por objetivo fazer
generalizações sobre uma população com base em dados de uma amostra.
Na estimação por ponto é proposto um único valor para substituir o parâmetro (dado
da população). Assim, o estimador por ponto da média aritmética populacional μ é a média
aritmética amostral x ; o estimador por ponto da variância populacional σ 2 é a variância
amostral S2 .
A estimação por ponto não permite julgar qual a possível magnitude do erro que
estamos cometendo ao substituir o parâmetro por um único valor. Daí surge a idéia de
construir intervalos de confiança, que são baseados na distribuição amostral do estimador
pontual, incorporando à estimativa pontual do parâmetro informações a respeito de sua
variabilidade.
Um intervalo de confiança é determinado por dois valores que são os seus limites,
chamados “limites de confiança”, que com certa probabilidade incluam o verdadeiro valor do
parâmetro da população.
Logo, a estimação por intervalo consiste na fixação de dois valores tais que γ seja a
probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do
parâmetro.
σ2
tamanho n, com valores X1 , X 2 , K, X n , temos que X ~ N ( μ , ) , onde X é a média
n
amostral.
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com
coeficiente de confiança γ, como:
⎡ ⎤
IC (μ , γ ) = ⎢X − z γ . σ X ; X + z γ . σ X ⎥ = X − z γ . σ X ≤ μ ≤ X + z γ . σX , onde:
⎢⎣ 2 2 ⎥⎦ 2 2
X é a média amostral.
γ
z γ é obtido da tabela da Normal Padrão, localizando o valor de no corpo da tabela e
2
2
σ
σX = é o desvio padrão da média amostral.
n
Exemplo
Suponha que os comprimentos de jacarés adultos de uma certa raça siga o modelo Normal
com média μ desconhecida e variância igual a 0,01 m 2 . Uma amostra de dez animais foi
sorteada e forneceu média 1,69 m. Desejamos uma estimativa para o parâmetro desconhecido
μ, com coeficiente de confiança de 95%.
σ2
X ~ N (μ , )
n
95 γ
γ = 95% ⇒ γ = ⇒ γ = 0,95 ∴ = 0,475 ( localizamos este valor no corpo da tabela da
100 2
Normal Padrão e encontramos o valor de z γ = 1,96 ).
2
σ 0,1
σX = =
n 10
IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ]
2 2
0,1 0,1
IC (μ , 95% ) = [1,69 − 1,96 ⋅ ; 1,69 + 1,96 ⋅ ]
10 10
Observações:
Exemplo
σ N−n
X ~ N (μ, σ 2X ) , com σ X = .
n N −1
5 γ
1 – γ = 5% ⇒ 1 − γ = = 0,05 ⇒ γ = 1 − 0,05 = 0,95 ∴ = 0,475 (localizamos este valor
100 2
no corpo da tabela da Normal Padrão e encontramos o valor de z γ = 1,96)
2
σ N − n 20 1000 − 25 975
σX = . = . = 4. = 3,95
n N −1 5 1000 − 1 999
IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ]
2 2
População
X amostra n
σ
( μ , σ2 ) x1 ± 1,96
n
amostra n
σ
x 2 ± 1,96
n
amostra
M
σ
x k ± 1,96
n
σ μ σ
μ − 1,96 μ + 1,96
n n
x1
x2
xk
pq
Quando o tamanho da amostra ( n ) for grande, temos: p̂ ~ N (p, ) , onde p̂ é a
n
proporção amostral e q = 1 – p. Consideramos uma amostra grande quando n > 30.
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para p, com
coeficiente de confiança γ, como:
IC (p , γ ) = [ p̂ − z γ . σ p̂ ; p̂ + z γ . σ p̂ ] = p̂ − z γ . σ p̂ ≤ p ≤ p̂ + z γ . σ p̂ , onde:
2 2 2 2
p̂ é a proporção amostral.
γ
z γ é obtido da tabela da Normal Padrão, localizando o valor de no corpo da tabela e
2
2
p̂ . q̂
σ p̂ = é o desvio padrão da proporção amostral, com q̂ = 1 − p̂ .
n
Exemplo
80
Identificando os dados do problema, temos: p̂ = = 0,2 ⇒ q̂ = 1 − p̂ = 1 − 0,2 = 0,8 ;
400
n = 400; γ = 90%
pq
pˆ ~ N ( p , )
n
90 γ
γ = 90% ⇒ γ = ⇒ γ = 0,90 ∴ = 0,45 ( localizamos este valor no corpo da tabela da
100 2
Normal Padrão e encontramos o valor de z γ = 1,64).
2
IC (p , γ ) = [ p̂ − z γ . σ p̂ ; p̂ + z γ . σ p̂ ]
2 2
Observação:
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com
coeficiente de confiança γ, como:
IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ] , onde:
2 2
X é a média amostral.
γ
z γ é obtido da tabela da Normal Padrão, localizando o valor de no corpo da tabela e
2
2
S
σX = é o desvio padrão da média amostral, com
n
n
( ∑ x i )2
1 n 2 i =1 1 n 2 2
S = S2 e S2 = {∑ xi − } ou S2 = {∑ xi − n X }
n − 1 i =1 n n − 1 i =1
52
Exemplos
γ
1 – γ = 0,10 ⇒ γ = 0,90 ⇒ = 0,45 (localizamos este valor no corpo da tabela da Normal
2
Padrão e encontramos o valor de z γ = 1,64 )
2
S 11 11
σX = = = = 1,1
n 100 10
IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ]
2 2
2) A altura dos homens de uma cidade apresenta distribuição normal. Para estimar a altura
média dessa população, levantou-se uma amostra de 150 indivíduos obtendo-se
150 150
2 2
∑ x i = 25800 cm e ∑ x i = 4440075 cm . Ao nível de 2%, determinar um IC para a altura
i =1 i =1
n 150
∑ xi ∑ xi 25800
i =1 i =1
X= = = = 172 cm
n 150 150
n 150
( ∑ x i )2 ( ∑ x i )2
2 1 n
i =1 1 150
i =1 1 (25800) 2
S = { ∑ x i2 − }= 2
{ ∑ xi − }= {4440075 − } = 16,61
n − 1 i =1 n 150 − 1 i −1 150 14 9 150
∴ S = S2 = 16,61 = 4,08 cm
53
γ
1 – γ = 2% = 0,02 ⇒ γ = 0,98 ⇒ = 0,49 (localizamos este valor no corpo da tabela da
2
Normal Padrão e encontramos o valor de z γ = 2,32 )
2
S 4,08
σX = = = 0,33
n 150
IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ]
2 2
Logo, podemos afirmar com uma certeza de 98% que, apesar dos parâmetros populacionais
serem desconhecidos, a altura média dos homens dessa cidade está compreendida entre 1,71m
e 1,73 m.
54
9. CORRELAÇÃO
É o estudo da existência e do grau de relação entre variáveis, tendo por objetivo medir
e avaliar o grau de relação existente entre duas variáveis aleatórias. Por exemplo, o peso pode
estar relacionado com a idade das pessoas; o consumo das famílias pode estar relacionado
com sua renda; as vendas de uma empresa e os gastos promocionais podem relacionar-se;
bem como a demanda de um determinado produto e seu preço.
∑ XY − ∑ n ∑
( X) ( Y)
rXY = , onde n = número de observações e
⎡
⎢∑ X −
2 (∑ X) ⎤ ⎡
2
⎥ ⎢∑ Y −
2 (∑ Y) ⎤
2
⎥
⎢
⎣
n ⎥⎢
⎦⎣
n ⎥
⎦
− 1 ≤ rXY ≤ 1 .
55
0 X
0 X
A correlação será nula quando não houver relação entre as variáveis X e Y, ou seja,
quando as variações de X e Y ocorrerem independentemente não existe correlação entre
elas.
0 X
Gráfico 10: Correlação Nula ( rXY = 0 )
A correlação será tanto mais forte quanto mais próximo estiver o resultado de + 1 ou
de – 1 e será tanto mais fraca quanto mais próximo o resultado estiver de zero.
Exemplos
Observação: para maior facilidade, construiremos uma tabela, onde a partir dos valores de X
e Y, determinaremos todas as somas necessárias (Tabela 19)
Y 10 8 6 10 12
X 2 4 6 8 10
Tabela 18
57
∑ XY − ∑ n ∑
( X) ( Y) Y X X2 Y2 XY
rXY =
⎡
⎢∑ X −
2 (∑ X) ⎤ ⎡
2
⎥ ⎢∑ Y −
2 (∑ Y) ⎤
2
⎥ 10 2 4 100 20
⎢
⎣
n ⎥⎢
⎦⎣
n ⎥
⎦
8 4 16 64 32
30 ⋅ 46
288 −
5 12
rXY = = = 0,42 6 6 36 36 36
⎡ 30 ⎤ ⎡
2
462 ⎤ 40 ⋅ 20,8
⎢220 − ⎥ ⎢444 − ⎥
⎣ 5 ⎦⎣ 5 ⎦
10 8 64 100 80
Tabela 19
A 1000,00 4000,00 8 3
B 1500,00 7000,00 6 4
C 1200,00 5000,00 5 5
D 7000,00 20000,00 1 12
E 8000,00 20000,00 2 16
F 10000,00 30000,00 2 18
G 2000,00 8000,00 3 8
H 3000,00 8000,00 2 8
I 1000,00 3000,00 6 4
J 6000,00 15000,00 1 8
Tabela 20
Calcular o coeficiente de correlação linear entre Poupança e Número de Filhos das dez
famílias.
∑ XY − ∑ n ∑
( X) ( Y)
rXY =
⎡
⎢∑ X −
2 (∑ X) ⎤ ⎡
2
⎥ ⎢∑ Y −
2 (∑ Y) ⎤
2
⎥
⎢
⎣
n ⎥⎢
⎦⎣
n ⎥
⎦
59
Tabela 21
∑ XY − ∑ n ∑
( X) ( Y)
rXY =
⎡
⎢∑ X −
2 (∑ X) ⎤ ⎡
2
⎥ ⎢∑ Y −
2 (∑ Y) ⎤
2
⎥
⎢
⎣
n ⎥⎢
⎦⎣
n ⎥
⎦
60
120000 ⋅ 36
292000 −
10 − 140000
rXY = = = −0,71
⎡ 14400000000 ⎤ ⎡ 1296 ⎤ 712000000 ⋅ 54,4
⎢2152000000 − 10 ⎥ ⋅ ⎢184 − 10 ⎥
⎣ ⎦ ⎣ ⎦
A correlação linear entre as variáveis X e Y é forte e negativa, isto é, famílias com poupança
alta têm menor número de filhos.
a) P (X ≤ 4)
b) P (4 < X < 5)
c) P (2 ≤ X < 5)
d) P (5 ≤ X ≤ 7)
e) P (X ≤ 1)
f) P (0 ≤ X ≤ 2)
a) P (X ≤ 115)
b) P (X ≥ 80)
c) P (X ≤ 75)
d) P (-10 ≤ X – 90 ≤ 10)
4) Uma clínica de emagrecimento recebe pacientes adultos com peso seguindo uma
distribuição Normal de média 130 kg e desvio padrão 20 kg. Para efeito de determinar o
tratamento mais adequado, os 25% pacientes de menor peso são classificados de “magros”,
enquanto os 25% de maior peso de “obesos”. Determine os valores que delimitam cada uma
dessas classificações.
5) Por analogia a produtos similares, o tempo de reação de um novo medicamento pode ser
considerado como tendo distribuição Normal com desvio padrão igual a 2 minutos (a média é
desconhecida). Vinte pacientes foram sorteados, receberam o medicamento e tiveram seu
tempo de reação anotado. Os dados foram os seguintes (em minutos): 2,9; 3,4; 3,5; 4,1; 4,6;
4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7; 5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de
confiança para o tempo médio de reação. Use γ = 96%.
6) Uma amostra aleatória de 625 donas-de-casa revela que 70% delas preferem a marca X de
detergente. Construir um intervalo de confiança para p = proporção das donas-de-casa que
preferem X com coeficiente de confiança γ = 90%.
7) Um fabricante afirma que seus cigarros contêm não mais que 30 mg de nicotina. Uma
amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg. Construa um
intervalo de confiança para a média populacional μ com coeficiente de confiança γ = 95%.
8) Deseja-se fazer uma pesquisa para saber a aceitação de um novo produto no mercado. Qual
é o número de pessoas que deve ser entrevistado com 7% de erro e 95% de segurança?
9) Deseja-se fazer uma pesquisa junto a uma empresa para saber o interesse dos funcionários
em realizar cursos no exterior. Existem 3 mil funcionários, sendo 1,8 mil com mais de dez
anos de empresa e 1,2 mil com menos. Qual deve ser o tamanho da amostra probabilística
estratificada sabendo-se que em cursos semelhantes 5% dos funcionários acima de dez anos e
10% dos com menos de dez anos de empresa participaram. Considerar 2% de erro e 95,5% de
segurança.
c) O coeficiente de correlação linear entre Média dos Anos de Estudo e Número de Filhos.
d) O coeficiente de correlação linear entre Renda Familiar e Média dos Anos de Estudo.
11) A Tabela 22 mostra o volume de vendas (em 1000 unidades) e os gastos promocionais
(em 100000 reais). Calcular a correlação entre as duas variáveis.
Promoção 2 4 5 6 8 8 10 10 12 15
Tabela 22
12) Querendo se estimar a média de uma população X com distribuição normal, levantou-se
uma amostra de 100 observações obtendo-se X = 30 e S = 4. Ao nível de 90%, determinar o
limite de confiança para a verdadeira média da população.
13) Um pesquisador deseja estabelecer o peso médio dos jovens entre 14 e 20 anos. Apesar de
desconhecer a média e o desvio padrão populacional, sabe por literatura da área que a
distribuição dos pesos é aproximadamente normal. Retira-se uma amostra casual simples de
60 jovens obtendo peso médio de 67 kg e desvio padrão de 9 kg.
b) Qual o tamanho da amostra que o pesquisador deveria tomar para ter uma probabilidade de
95% de certeza de cometer um erro de 1,5 kg?
63
5) a) PM: 350; 450; 550; 650; 750; 850; 950; 1050; 1150
fac: 14; 60; 118; 194; 262; 324; 372; 394; 400
c) Sim, como quantitativa contínua, pois existe um número grande de valores diferentes.
Sugestão: iniciar em 0 com amplitude de classe igual a 2.
65
c) Gráfico de colunas
9) b) 34%
c) Média: 1,93; Mediana: 1,8; Moda: 1,6 e 1,8; As diferenças não foram grandes. A solução
(a) é mais exata.
d) O de (c), pois sem o computador é praticamente impossível organizar 500 dados brutos.
3) Média: 86,20 bat / min; Variância: 16,36 ( bat / min)2 ; Desvio Padrão: 4,04 bat / min.
3) a) 0,3289; b) 0,5286
6) [ 0,677; 0,732 ]
8) 196
9) 377; 515
11) 0,9817
REFERÊNCIAS
BUSSAB, W. O. & MORETTIN, P. A., Estatística Básica 4 ed. – São Paulo: Atual, 1987.
TOLEDO, G. L. & OVALLE, I. I., Estatística Básica 2 ed. – São Paulo: Atlas, 1985.
MORETTIN, L. G., Estatística Básica – Vol. 2 – Inferência – São Paulo: Pearson Makron
Books, 2000.