Escolar Documentos
Profissional Documentos
Cultura Documentos
BASICA
Curso: Fisioterapia
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG / ALFENAS
2016/1
SUMARIO
1
1.1
1.2
1.3
1.4
1.5
2
3
3.1
3.1.1
3.1.2
3.1.3
3.2
3.3
3.4
3.5
3.6
3.7
3.8
4
4.1
4.2
4.3
4.3.1
4.3.2
4.4
5
5.1
5.1.1
5.1.2
5.1.3
5.1.4
5.1.5
5.1.6
5.2
5.2.1
5.2.2
5.2.3
5.2.4
5.2.5
5.2.6
6
6.1
6.1.1
6.1.2
6.1.3
6.1.4
6.1.5
6.2
6.2.1
6.2.2
6.2.3
6.3
6.3.1
6.4
6.5
SOMATORIO
. . . . . . . . . . . . . . . . . . . . . .
Indices ou notac
ao por ndices . . . . . . . . . . . . .
Notac
ao de somat
orio . . . . . . . . . . . . . . . . . .
Propriedades . . . . . . . . . . . . . . . . . . . . . . .
Somat
orios mais usados na Estatstica . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
INTRODUC
AO
ALGUMAS DEFINIC
OES
. . . . . . . . . . . . . . .
Vari
avel . . . . . . . . . . . . . . . . . . . . . . . . .
Vari
aveis qualitativas . . . . . . . . . . . . . . . . . .
Vari
aveis quantitativas . . . . . . . . . . . . . . . . .
Vari
aveis independentes e dependentes . . . . . . . .
Dados . . . . . . . . . . . . . . . . . . . . . . . . . . .
Populac
ao . . . . . . . . . . . . . . . . . . . . . . . .
Amostra . . . . . . . . . . . . . . . . . . . . . . . . .
Par
ametro . . . . . . . . . . . . . . . . . . . . . . . .
Estimador . . . . . . . . . . . . . . . . . . . . . . . .
Estimativa . . . . . . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
AMOSTRAGEM . . . . . . . . . . . . . . . . . . . .
Import
ancia . . . . . . . . . . . . . . . . . . . . . . .
N
umeros aleat
orios . . . . . . . . . . . . . . . . . . .
Tipos de amostragem . . . . . . . . . . . . . . . . . .
Amostragem n
ao probabilstica . . . . . . . . . . . .
Amostragem probabilstica . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
ESTATISTICA DESCRITIVA . . . . . . . . . . . . .
Apresentac
ao dos dados . . . . . . . . . . . . . . . . .
Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . .
Construc
ao de tabelas de distribuicao de frequencias
Tipos de distribuic
ao de frequencias . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
Gr
aficos . . . . . . . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
Medidas Estatsticas . . . . . . . . . . . . . . . . . .
Medidas de Tendencia Central . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
Medidas Separatrizes . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
Medidas de Variabilidade (Dispers
ao) . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
PROBABILIDADE . . . . . . . . . . . . . . . . . . .
Definic
oes . . . . . . . . . . . . . . . . . . . . . . . .
Experimento . . . . . . . . . . . . . . . . . . . . . . .
Experimento determinstico . . . . . . . . . . . . . .
Experimento aleat
orio . . . . . . . . . . . . . . . . . .
Espaco amostral . . . . . . . . . . . . . . . . . . . . .
Evento . . . . . . . . . . . . . . . . . . . . . . . . . .
Probabilidade . . . . . . . . . . . . . . . . . . . . . .
Probabilidade a priori . . . . . . . . . . . . . . . . . .
Probabilidade a posteriori . . . . . . . . . . . . . . .
Importante saber! . . . . . . . . . . . . . . . . . . . .
Probabilidade condicional . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . .
Regra do produto e independencia de eventos . . . .
Independencia de tres ou mais eventos . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
1
2
2
3
3
3
4
4
4
5
5
5
5
5
6
6
7
8
8
9
9
10
15
17
17
17
19
23
24
24
29
29
29
35
36
39
40
44
45
45
45
45
46
46
46
47
47
48
49
49
50
51
53
6.6
6.6.1
6.6.2
7
7.1
7.2
7.2.1
7.2.2
7.2.3
7.2.4
7.2.5
7.2.6
7.3
7.3.1
7.3.2
7.3.3
7.3.4
7.3.5
7.3.6
8
8.1
8.2
8.2.1
8.2.2
8.2.3
8.2.4
8.3
8.4
8.4.1
Ensaios de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exerccios extras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
DE PROBABILIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . .
DISTRIBUIC
AO
Vari
avel aleat
oria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuic
ao de probabilidade ou funcao de probabilidade . . . . . . . . . . . . . . . . . . .
Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Media e vari
ancia de uma vari
avel aleatoria discreta . . . . . . . . . . . . . . . . . . . . . .
Distribuic
ao binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuic
ao Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exerccios Extras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuic
ao normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C
alculo de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Condic
oes para que uma func
ao seja funcao densidade de probabilidade . . . . . . . . . . .
A distribuic
ao normal: informac
oes adicionais . . . . . . . . . . . . . . . . . . . . . . . . .
C
alculo de probabilidades de vari
aveis normais . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuic
ao normal padronizada ou distribuicao normal padrao . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
TEORIA DA ESTIMAC
AO
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuic
ao de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuic
ao amostral das medias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuic
ao amostral das proporc
oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estimac
ao pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estimac
ao intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Intervalo de confianca para a media de uma populacao normal com variancia populacional
2 conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.2 Intervalo de confianca para a media de uma populacao normal com variancia populacional
2 desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.3 Intervalo de confianca para uma proporcao . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.4 Determinac
ao do tamanho amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
TEORIA DA DECISAO
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1
Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2
Erros envolvidos num teste de hip
otese . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3
Mec
anica operacional dos testes de hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4
Teste de hip
oteses para uma media de uma populacao normal quando a variancia populacional for desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5
Teste de hip
oteses para proporc
oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.6
Teste de hip
oteses para comparacao das variancias de duas populacoes normais . . . . . .
9.7
Teste de hip
oteses para duas medias de populacoes normais com variancias populacionais
desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.7.1 Testes de hip
oteses para duas medias, sendo 12 = 22 = 2 . . . . . . . . . . . . . . . . . .
9.7.2 Testes de hip
oteses para duas medias, sendo 12 6= 22 . . . . . . . . . . . . . . . . . . . . .
9.7.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
TESTES QUI-QUADRADO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.1
Teste de Aderencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2
Teste de Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3
Teste de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
LINEAR E REGRESSAO
LINEAR SIMPLES . . . . . . . . . . . . . . .
11
CORRELAC
AO
11.1
Diagrama de dispers
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2
Coeficiente de Correlac
ao Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
55
56
57
57
58
59
59
60
61
62
63
63
64
64
64
65
65
67
68
68
69
69
70
71
72
72
72
73
75
77
77
79
80
80
81
81
81
83
84
85
85
86
86
87
89
89
90
91
93
95
96
96
97
11.3
Coeficiente de determinac
ao . . . . . . .
11.3.1 Exerccios . . . . . . . . . . . . . . . . .
11.4
Regress
ao Linear Simples . . . . . . . . .
11.4.1 Exerccios . . . . . . . . . . . . . . . . .
12
Tabelas de distribuic
oes de probabilidade
REFERENCIAS
BIBLIOGRAFICAS
. . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
teoricas
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
98
99
100
103
105
111
1 SOMATORIO
Estatstica B
asica
SOMATORIO
1
1.1
Indices ou nota
c
ao por ndices
Nota
c
ao de somat
orio
O smbolo
n
X
i=1
i = n, ou seja:
n
X
xi = x1 + x2 + + xn
i=1
i=1
5
X
!2
xi
i=1
c)
d)
e)
f)
5
X
x2i = x21 + x22 + x23 + x24 + x25 = (1)2 + (0)2 + (1)2 + (2)2 + (1)2 = 7
i=1
3
X
i=1
5
X
xi = x1 + x2 + x3 = 1 + 0 + (1) = 0
xi = x3 + x4 + x5 = 1 + 2 + 1 = 2
i=3
5
X
xi = x1 + x2 + x5 = 1 + 0 + 1 = 2
i=1
i6=3, 4
1.3
Propriedades
Sejam: a, b e k constantes; X e Y variaveis e xi e yi os valores que as variaveis X e Y assumem,
ent
ao:
(P1) Somat
orio de uma constante vezes uma variavel e igual `a constante vezes o somatorio da variavel:
n
n
X
X
xi
axi = ax1 + ax2 + ax3 + ... + axn = a
i=1
i=1
(P2) Somat
orio de uma constante e igual ao n
umero de termos vezes a constante:
n
X
k = k + k + k + ... + k + k = n k
{z
}
|
i=1
n
X
i=a
(n1+1 ) vezes
k = k + k + k + . . . + k + k = (n a + 1) k
|
{z
}
(na+1 ) vezes
(P3) Somat
orio de uma soma e igual `
a soma dos somatorios:
n
n
n
X
X
X
(axi byi ) = a
xi b
yi
i=1
i=1
i=1
(P4) Somat
orios de um produto de vari
aveis e igual ao produto dos somatorios destas variaveis:
n X
m
n
m
X
X
X
xi yj =
xi
yj
i=1 j=1
UNIFAL-MG/Alfenas
i=1
j=1
Profs. Fl
avio Bittencourt/Adriana Dias
1 SOMATORIO
Estatstica B
asica
xi yi 6=
i=1
n
X
xi
i=1
n
X
n
X
yi
i=1
i=1
xi
yi
6=
i=1
n
X
xi
n
X
i=1
yi
!2
xi
6=
n
X
x2i
i=1
i=1
1.4
Somat
orios mais usados na Estatstica
n
X
i. Soma simples:
xi = x1 + x2 + ... + xn
i=1
n
X
i=1
n
X
!2
xi
= (x1 + x2 + ... + xn )
i=1
n
X
xi yi = x1 y1 + x2 y2 + ... + xn yn
i=1
v. Produto da soma:
n
X
i=1
xi
n
X
i=1
Observa
c
ao: algumas vezes omite-se os limites do somatorio, quando isso acontecer deve-se
considerar a soma de todos os elementos, desde i = 1 ate i = n:
n
X
X
x=
xi
i=1
1.5
Exerccios
6
X
i=1
4
X
xi
(yi 3)2
c)
d)
N
X
i=1
n
X
a
b
e)
f)
i=a
i=1
5
X
k=1
3
X
fk xk
(xj a)
j=1
3. As vari
aveis, X e Y , assumem os valores: x1 = 2; x2 = 4; x3 = 5; x4 = 8 e y1 = 3; y2 = 8;
y3 = 10; y4 = 6, respectivamente. Calcular:
P
P
P
a) P x
d) P x2
g) P xy 2
b) P y
e) P y 2P
h)
(x + y)(x y)
c)
xy
f)
x y
4. Dados os valores das vari
aveis: X = {2, 4, 4, 3, 2}, Y = {1, 2, 3, 6, 7}, obtenha:
a)
b)
4
X
i=1
5
X
i=1
xi
yi
c)
d)
5
X
i=1
5
X
4x2i
xi yi
e)
f)
i=1
Profs. Fl
avio Bittencourt/Adriana Dias
5
X
i=1
4
X
i=2
(3xi + 2yi )
xi yi +
5
X
yi2
i=1
UNIFAL-MG/Alfenas
2 INTRODUC
AO
Estatstica B
asica
i=1
i=1
x2i
de somat
orios por: x
=
e s2 =
n
n 1 i=1
n
INTRODUC
AO
A Estatstica como ciencia somente se estruturou no seculo passado, sendo uma ferramenta
indispens
avel na vida moderna. Hoje, cada vez mais pessoas encontram-se expostas a ela em maior ou
definida como a ciencia que se ocupa da coleta, da organizacao, da descricao, da
menor intensidade. E
an
alise e da interpretac
ao de dados:
a) no plural (estatsticas), indica qualquer colecao consistente de dados numericos reunidos com a finalidade de fornecer informac
oes acerca de uma atividade qualquer. Por exemplo, estatsticas demograficas
referem-se a dados numericos sobre nascimentos, falecimentos, matrimonios, desquites etc.
b) no singular (estatstica), indica um corpo de tecnicas, ou ainda uma metodologia desenvolvida para
a coleta, a classificac
ao, a apresentac
ao, a analise, a interpretacao de dados e a utilizacao desses dados
para a tomada de decis
oes.
3
3.1
ALGUMAS DEFINIC
OES
Vari
avel
Profs. Fl
avio Bittencourt/Adriana Dias
3 ALGUMAS DEFINIC
OES
Estatstica B
asica
Em relac
ao ao nvel de manipulacao as variaveis sao independentes e dependentes conforme
ilustra a Figura 2.
Vari
aveis qualitativas
Vari
aveis quantitativas
S
ao aquelas cujas realizac
oes s
ao n
umeros resultantes de contagem ou mensuracao, como n
umero
de filhos, n
umero de visitantes, velocidade em km/h, peso, altura etc. As variaveis quantitativas s
ao
discretas ou contnuas. As vari
aveis quantitativas discretas sao aquelas que podem assumir apenas alguns
valores numericos que geralmente podem ser listados (n
umero de filhos, n
umero de acidentes). As variaveis
quantitativas contnuas s
ao aquelas que podem assumir qualquer valor em um intervalo (velocidade, peso,
altura).
Muitos pesquisadores preferem as variaveis quantitativas por acharem que estas contem mais
informac
oes do que as qualitativas. Observe os seguintes exemplos: quando a variavel distancia de uma
localidade e descrita em termos de longe e perto, sabe-se que longe e mais distante que perto, mas
n
ao se tem ideia de qu
ao mais distante; se, contudo, descreve-se a distancia de forma numerica, medida
em metros, e uma localidade dista de um ponto de referencia 600 metros e outra dista 400, nao so se sabe
que a segunda e mais perto do que a primeira, mas sao 200 metros mais perto.
importante ressaltar que a forma como a variavel esta sendo medida definira o seu nvel de
E
mensurac
ao. Por exemplo, a vari
avel velocidade de um carro; se definirmos velocidade como resultado de
uma medic
ao por meio de radar resultando em um valor em km/h, trata-se de uma variavel quantitativa
contnua; se, porem, definirmos a velocidade como resultado de uma medicao em que alguem declara a
velocidade como baixa, media ou alta, ela passa ser qualitativa ordinal.
3.1.3
Vari
aveis independentes e dependentes
As vari
avies independentes s
ao aquelas que sao manipuladas, enquanto que as dependentes s
ao
apenas medidas ou registradas (como manipulacao das variaveis independentes). Esta distincao confunde
muitas pessoas que dizem que todas as variaveis dependem de alguma coisa. Entretanto, uma vez que
se esteja acostumado a esta distinc
ao ela se torna indispensavel.
As vari
aveis independentes s
ao aquelas que podem influenciar os valores das variaveis dependentes. Somente a realizac
ao do estudo vai permitir verificar se ha realmente tal influencia e, somente,
poderemos afirmar que a vari
avel independente e a causa da variavel dependente assumir determinado
resultado se o estudo for um experimento (pesquisa experimental).
4
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
3 ALGUMAS DEFINIC
OES
Estatstica B
asica
Os termos vari
avel dependente e independente aplicam-se principalmente `a pesquisa experimental, onde algumas vari
aveis s
ao manipuladas, e neste sentido sao independentes dos padroes de reac
ao
inicial, intenc
oes e caractersticas das unidades experimentais. Espera-se que outras variaveis sejam dependentes da manipulac
ao ou das condic
oes experimentais. Ou seja, elas dependem do que as unidades
experimentais far
ao em resposta.
Exemplo: Quando voce vai ao restaurante o valor a ser pago e dependente da quantidade de
comida. Voce pode controlar a quantidade de comida no prato, mas o valor dependera desta quantidade.
Ao se estudar o n
umero de suicdios ocorridos durante os anos 2007 a 2012 numa determinada cidade,
voce manipula a vari
avel ano (2007 a 2012), mas o n
umero de suicdios sera registrado conforme o ano.
3.2
Dados
S
ao os valores ou fen
omenos obtidos na mensuracao ou observacoes de alguma variavel em
estudo. Logo, os dados podem ser qualitativos (nominais ou ordinais) ou quantitativos (discretos ou
contnuos) e independentes ou dependentes. Por exemplo, se a variavel estudada for sexo de indivduos
que visitam um santu
ario, os dados s
ao, masculino, masculino, feminino, feminino etc.
Considerando que a vari
avel estudada seja n
umero de filhos de um grupo de 20 casais, as
respostas obtidas, 0, 2, 3, 1, 2, 0, ... s
ao os dados, e neste caso, os dados sao discretos. Ao se estudar
a altura dos estudantes de uma sala de aula, os dados obtidos sao denominados contnuos, pois alguns
valores podem ser: 1,59m, 1,75m, 1,80m etc.
3.3
Popula
c
ao
Os dados s
ao coletados para estudar uma ou mais caractersticas de uma populacao de interesse. Populac
ao e o conjunto de medidas da(s) caracterstica(s) de interesse em todos os elementos
que a(s) apresenta(m). Se, por exemplo, estamos avaliando as opinioes de eleitores sobre os candidatos a
presidente, a populac
ao da pesquisa seria constituda pelas opinioes declaradas pelos eleitores em questao.
3.4
Amostra
Par
ametro
uma constante que caracteriza uma populacao. Sao exemplos de parametros:
E
: media populacional
2 : vari
ancia populacional
: desvio padr
ao populacional
p: proporc
ao populacional
etc.
3.6
Estimador
uma express
E
ao algebrica (f
ormula) utilizada para obter um valor aproximado de um parametro. S
ao exemplos de estimadores:
n
X
xi
x
=
i=1
: media amostral
n
1
X 2
s =
x
n 1 i=1 i
UNIFAL-MG/Alfenas
n
X
!2
xi
i=1
: variancia amostral
Profs. Fl
avio Bittencourt/Adriana Dias
3 ALGUMAS DEFINIC
OES
Estatstica B
asica
s=
p =
s2 : desvio padr
ao amostral
y
: proporc
ao amostral, sendo y o n
umero de sucessos observados em uma amostra de tamanho n
n
etc.
3.7
Estimativa
Exerccios
1. A altura de um estudante (em cm) e a sua naturalidade sao as variaveis estudadas por um pesquisador.
Estas duas vari
aveis s
ao:
a) ambas contnuas
b) ambas discretas
c) quantitativas contnuas
d) qualitativas nominais
e) quantitativa e qualitativa, respectivamente
2. Logo ao nascer, os filhotes s
ao pesados e medidos, para saber se estao dentro da faixa ideal para a
especie. Estas duas vari
aveis s
ao:
a) qualitativas
b) ambas discretas
c) contnua e discreta, respectivamente
d) discreta e contnua respectivamente
e) ambas contnuas
3. Relacione a segunda coluna de acordo com a primeira.
(1)
Vari
avel qualitativa nominal
N
umero de filhotes por camundongas nascidos hoje
(2)
Vari
avel qualitativa ordinal
(3)
Vari
avel quantitativa discreta
(4)
Vari
avel quantitativa cont-
nua
(1)
N
umero de filhotes por camundongas nascidos hoje
(2)
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
4 AMOSTRAGEM
(3)
(4)
5. Classifique as vari
aveis em vari
avel independente (VI) e variavel dependente (VD).
a) Avaliac
ao se diferentes nveis de estresse ( ) afetam a frequencia cardaca em humanos ( ).
b) Uma pesquisa avalia o efeito do nvel da escolaridade ( ) sobre a renda anual da famlia ( ).
c) Nota obtida na prova de Estatstica ( ) de acordo com o tempo semanal de estudo ( ).
d) Na pesquisa frequencia do aluno na monitoria ( ) e a aprovacao na disciplina de Estatstica ( )
foram avaliados 50 alunos.
e) Uma pesquisa avalia as func
oes exercidas em uma empresa de produtos qumicos ( ) de acordo com
o sexo do funcion
ario ( ).
f) Uma pesquisa avalia em uma empresa os salarios atuais ( ) em funcao do sexo do funcionario ( ).
g) Um pesquisador gostaria de estudar como estao os salarios atuais ( ) em funcao dos anos de educac
ao
do funcion
ario ( ) na empresa que ele trabalha.
6. Qual das declarac
oes e verdadeira?
a) Par
ametros descrevem amostras e estimativas descrevem populacoes.
b) Estimativas descrevem amostras e populacoes.
c) Par
ametros descrevem populac
oes e estimativas descrevem amostras.
d) Par
ametros descrevem amostras e populacoes.
4
AMOSTRAGEM
a parte da estatstica que estuda os diversos processos de obtencao de amostras com o objetivo
E
de que elas sejam representativas da populacao em estudo. Amostras representativas sao aquelas que
guardam ou reproduzem as mesmas caractersticas da populacao.
Experiencia com amostragem e fato no nosso cotidiano. Quando voce verifica o tempero de um
prato, n
ao ser
a necess
ario comer tudo o que tem na panela. Quando voce verifica a temperatura do seu
corpo, n
ao precisa colocar o term
ometro em todas as suas partes. Ao verificar a calibragem do pneu do
seu carro, voce se baseia em apenas um ponto. Ao realizar um exame de sangue o laboratorio retira 40
mL, pois e suficiente para os exames de rotina.
De acordo com estas situac
oes, a amostragem torna-se necessaria, entretanto, o uso inadequado
de um procedimento de amostragem pode induzir a um vies de interpretacao, como, por exemplo, n
ao
mexer a sopa antes de tirar uma colher para verificar a temperatura do prato todo.
Considerando-se uma populac
ao a ser estudada, por meio de tecnicas de amostragem, obtem-se
uma amostra (ou v
arias amostras), posteriormente calcula-se as estatsticas de interesse para a realizac
ao
de inferencias (aproximar ou concluir) sobre as caractersticas da populacao (parametros). A Figura 3
esquematiza a obtenc
ao de uma amostra e o uso de alguns estimadores para o calculo das estimativas
que ser
ao u
teis para a realizac
ao de inferencia de um ou mais parametros de interesse.
Profs. Fl
avio Bittencourt/Adriana Dias
Estatstica B
asica
4 AMOSTRAGEM
Import
ancia
N
umeros aleat
orios
Antes de se estudar cada tipo de amostragem, deve-se procurar uma ferramenta que seja viavel
para a selecao (ou sorteio) dos indivduos da populacao em estudo. Procedimentos como papeizinhos
enumerados, palitinho, bingo entre outros s
ao u
teis, mas em alguns casos nao sao funcionais. A ferramenta
utilizada pela estatstica e a t
abua de n
umeros aleatorios, ou n
umeros aleatorios gerados por programas
computacionais, ou ate mesmo gerados pela sua calculadora (funcao random).
Nas planilhas eletr
onicas (Excel, LibreOffice Calc) basta digitar em uma celula qualquer o
comando = aleat
orio() e teclar Enter. Na sua calculadora cientfica existe a tecla RAN# que gera um
n
umero aleat
orio entre 0 e 0,999. Se voce multiplicar RAN# pelo tamanho da sua populacao, a calculadora
gerar
a um n
umero compreendido entre 0 e o tamanho N da sua populacao.
Para usar qualquer tipo de dispositivo aleatorio deve-se considerar o tamanho N da populac
ao
da qual se quer selecionar indivduos e quantos algarismos sao necessarios para identificar um indivduo.
Por exemplo: se a sua populac
ao tiver 10 indivduos, voce podera identifica-los pelos n
umeros de 0 a 9,
ou por 01, 02, , 10; na primeira situac
ao foi utilizado um algarismo para identificar cada indivduo, na
segunda, dois; se tiver 100 indivduos, voce podera usar dois algarismos (00, 01, 02, , 99) ou tres (001,
002, 003, , 100); se tiver 932 indivduos, tres algarismos serao necessarios.
Existem diversos modelos de t
abuas de n
umeros aleatorios e diversas formas de gerar n
umeros
aleat
orios. O uso de t
abuas de n
umeros aleatorios ou a funcao random da calculadora e bastante simples.
importante saber quantos algarismos s
E
ao necessarios para se identificar um indivduo da populacao.
Exemplo: Numa populac
ao2 de tamanho N = 300 indivduos, por algum motivo, sera obtida
uma amostra de tamanho n = 10. Como devera ser realizada a selecao destes 10 indivduos? E quais
ser
ao sorteados?
Resoluc
ao:
+ Primeiramente deve-se enumerar os indivduos, por exemplo de 001 a 300.
+ Considerando a Tabela 3 como uma tabela de n
umeros aleatorios obtida em um livro (ou
por um programa de computador) e necessario:
- Decidir qual parte do n
umero aleatorio sera adotada, por exemplo, na Tabela 3 cada
n
umero possui 5 dgitos, a populac
ao est
a identificada por 3 dgitos; desses 5 dgitos, quais serao adotados? Os tres primeiros? Os tres internos? Os tres finais? Etc. Adontado uma situacao ela deve ser
seguida para quaisquer outros n
umeros obtidos da tabela;
- Escolher `
as cegas um n
umero;
1
Fonte: http://rogeriocarpi.wordpress.com/2010/02/10/6-respostas-persuasivas-para-quem-nao-acredita-em-amostragem/.
Acesso em: 06 nov. 2014 2 N ser
a sempre usado para representar o tamanho da populaca
o e n sempre se referir
a ao
tamanho da amostra.
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
4 AMOSTRAGEM
- Obter outros n
umeros sistematicamente, na linha tal qual se le um livro (da esquerda
para a direita), como se le uma lista de classificacao (de cima para baixo) ou de outra forma;
- Considerar apenas os n
umeros que fizerem parte do intervalo de valores que identificam os indivduos da populac
ao, os demais n
umeros fora do intervalo deverao ser descartados;
- Selecionar tantos indivduos quanto for o tamanho da amostra.
+ Da Tabela 3 `
as cegas foi escolhido o n
umero 67824 e que serao considerados somente os 3
primeiros dgitos de cada n
umero aleat
orio obtido da leitura realizada da esquerda para `a direita. Como
678 n
ao e um n
umero que est
a no intervalo de 001 a 300 ele sera descartado e sera, entao, observado o
pr
oximo n
umero, 52681, do qual 526 dever
a ser adotado, mas que da mesma forma que o n
umero anterior,
dever
a ser descartado. O mesmo acontece com os n
umeros 31148 e 83761. Depois, o proximo n
umero da
tabela e o n
umero 07236 que indentifica o indivduo de n
umero 072, pois 072 e um n
umero do intervalo de
001 a 300. Outros n
umeros aleat
orios da sequencia sao 66537, 70834, 33260, 72583, 31768, 30247, 90313,
77538 que dever
ao ser, tambem, descartados pelo mesmo motivo. Portanto, seguindo o procedimento, os
n
umeros aproveit
aveis da tabela s
ao: 05367, 21768, 09324, 29734, 09525, 29448, 05783, 13143, 05070 os
quais identificam os indivduos 053, 217, 093, 297, 095, 294, 057, 131 e 050. Juntamente com 072 estes
n
umeros identificam os n = 10 indivduos que comporao a amostra.
Tabela 3 Tabua de n
umeros aleatorios
00071
11404
10478
24317
60312
25164
12446
62689
86770
65621
95574
93724
49741
65251
11256
01222
43287
93998
73709
00325
78627
36815
87116
94800
07386
22667
52883
05673
74698
64385
12125
06233
16458
33362
67824
52681
31148
83761
07236
66537
70834
33260
72583
31768
30247
90313
77538
05367
54121
21768
09324
79572
29734
68417
97521
56698
09525
76354
93561
63399
84743
39751
29448
31790
95267
75464
05783
98523
48585
66947
30541
64728
90400
93614
13143
58366
05070
37304
48277
34132
73045
41818
07465
32104
56402
53973
20565
54873
65401
27959
64237
63240
53541
13547
33938
61258
12452
33456
66657
01233
09002
87756
07654
56799
54333
22333
43321
43338
00032
09993
23233
50032
98772
98876
55532
32185
23875
44542
75500
04403
43554
76539
00672
11144
15655
30033
74421
23793
Nota: tabela resumida
Caso use a calculadora ou uma planilha eletronica, a ideia e a mesma. Entretanto, a tecnologia
permite selecionar somente indivduos dentro do intervalo, facilitando o trabalho do pesquisador.
4.3
Tipos de amostragem
Amostragem n
ao probabilstica
Profs. Fl
avio Bittencourt/Adriana Dias
Estatstica B
asica
4 AMOSTRAGEM
i) Amostragem a esmo - e utilizada quando ha inacessibilidade a toda populacao, quando nao e possvel
enumerar todos os indivduos da populacao ou quando a populacao e formada por material contnuo.
Exemplos:
a) Num lote com 20.000 ampolas de certo medicamento selecionar aleatoriamente 100 ampolas
seria muito trabalhoso, ent
ao, simplesmente seleciona-se algumas a esmo.
b) Numa f
abrica em que se produz um certo produto em serie, nao e possvel enumerar todos
os indivduos e nem ter acesso a todos, entao, neste caso, seleciona-se os que estao sendo produzidos
no momento.
c) Estudo sobre a qualidade do ar, estudo sobre a qualidade da agua, estudo sobre a qualidade
do solo, estudo sobre nvel de glicose no sangue etc, sao exemplos em que a populacao alvo e formada
por material contnuo.
ii) Amostragem intencional - o pesquisador escolhe deliberadamente certos elementos para formar a
um tipo de amostragem muito usado em estudos qualiamostra baseado num pre-julgamento. E
tativos. O risco de se obter uma amostra viciada e muito grande por se basear na preferencia do
pesquisador. Exemplo: Ao experimentar os efeitos de uma nova droga para o tratamento da AIDS
o pesquisador escolhe n = 20 pacientes terminais entre todos os pacientes com a doenca.
iii) Amostragem por cotas - e semelhante a uma amostragem estratificada proporcional3 , diferenciando
por n
ao empregar sorteio na selec
ao dos elementos a serem amostrados. Muito empregada nas
pesquisas eleitorais em que a populacao e dividida em subgrupos, segundo informacoes do IBGE,
dos quais seleciona-se uma cota proporcional ao seu tamanho. Os indivduos que farao parte da
amostra s
ao selecionados pelos entrevistadores e nao de forma aleatoria (probabilstica).
4.3.2
Amostragem probabilstica
Uma amostragem probabilstica considera que todos os elementos da populacao tem probabilidade conhecida e n
ao nula de pertencer `
a amostra. Ela e aplicavel sempre que for possvel enumerar a
populac
ao de modo que cada indivduo tenha a mesma chance de compor uma amostra.
A amostragem probabstica pode ser:
Amostragem simples ao acaso (ASA)
usada quando a populac
E
ao e homogenea, podendo ser com ou sem reposicao. Sendo com
reposic
ao, um indivduo poder
a fazer parte da amostra mais de uma vez. E se for sem reposicao, um
indviduo s
o tem oportunidade de aparecer na amostra apenas uma u
nica vez.
Suponha uma populac
ao composta pelas caractersticas de interesse de 3 indivduos A, B e C, da
qual se deseja obter uma amostra de tamanho 2. Tem-se, entao, N = 3 e n = 2. Portanto, se amostragem
for com reposic
ao e possvel obter N n amostras diferentes, ou seja, N n = 32 = 9 amostras diferentes:
AA, AB, AC, BA, BB, BC, CA, CB ou CC. Se a amostragem for sem reposicao e possvel formar CN, n
amostras distintas4 . Por exemplo, na populacao descrita anteriormente obtem-se CN, n = C3, 2 = 3
amostras diferentes: AB, AC ou BC.
Para executar uma amostragem simples ao acaso (ASA), deve-se:
Enumerar todos indivduos da populacao;
Realizar o sorteio;
Coletar as informac
oes dos indivduos amostrados.
Exemplo: Uma sala de aula possui 30 alunos. Pretende-se conhecer a idade media da turma.
Suponha que a idade (em anos) de cada um seja: 25, 20, 35, 21, 22, 24, 25, 30, 38, 24, 20, 20, 25, 20,
19, 25, 23, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27, 25, 23. Extraia uma amostra aleatoria simples de
tamanho n = 10 desta populac
ao.
Soluc
ao;
O primeiramente enumera-se os indivduos. Os n
umeros entre parenteses indentificam os alunos, assim:
25(01) , 20(02) , 35(03) , 21(04) , 22(05) , 24(06) , 25(07) , 30(08) , 38(09) , 24(10) , 20(11) , 20(12) , 25(13) , 20(14) , 19(15) ,
25(16) , 23(17) , 24(18) , 28(19) , 24(20) , 24(21) , 22(22) , 28(23) , 26(24) , 23(25) , 25(26) , 22(27) , 27(28) , 25(29) , 23(30) .
Agora, e realizar o sorteio. Usando a func
ao random da calculadora os n = 10 alunos selecionados foram:
3
10
CN, n =
N!
n!(N n)!
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
4 AMOSTRAGEM
80
N
=
=8
n
10
Sorteia-se um n
umero entre 1 e k = 8 para determinar o incio casual. Suponha que foi sorteado
o n
umero 1, ent
ao os elementos amostrados sao:
5
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
11
Estatstica B
asica
4 AMOSTRAGEM
i=1
i+k =1+8=9
i + 2k = 1 + 2 8 = 17
i + 3k = 1 + 3 8 = 25
i + 4k = 1 + 4 8 = 33
i + 5k
i + 6k
i + 7k
i + 8k
i + 9k
= 1 + 5 8 = 41
= 1 + 6 8 = 49
= 1 + 7 8 = 57
= 1 + 8 8 = 65
= 1 + 9 8 = 73
Ser
a considerado, para simplificar, que no conglomerado sorteado todos os seus elementos ser
ao estudados
12
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
4 AMOSTRAGEM
Tem por objetivo: melhorar a representatividade da amostra quando os elementos da populacao sao heterogeneos, porem, podem ser agrupados em subpopulacoes (estratos) contendo elementos homogeneos.
Os estratos podem ser: sexo, idade, nvel socioeconomico, regiao etc.
Para realizar uma amostragem estratificada e importante seguir os procedimentos:
Dividir a populac
ao em k estratos (homogeneos dentro e heterogeneos entre si);
Enumerar os indivduos dentro de cada estrato;
Obter de cada estrato de tamanho Ni , com i = 1, 2, . . . , k, amostras de tamanho ni das quais os
indivduos ser
ao sorteados por meio de uma ASA;
Coletar as informac
oes dos indivduos selecionados de cada amostra.
Na Figura 7 est
a representada uma populacao dividida em k estratos da qual se observa que em
cada estrato de tamanho Ni foram obtidas, respectivamente, amostras de tamanho ni . Alem disso nota-se
que a soma dos tamanhos de cada estrato e igual ao tamanho da populacao e que a soma dos tamanhos
de cada amostra obtida do seu respectivo estrato e igual ao tamanho da amostra a ser pesquisada.
k: e o n
umero de estratos desta populac
ao.
Exemplo: No hospital HS est
ao em observacao 500 pessoas de 0 a 40 anos. Por algum motivo
dividiu-se a populac
ao em k = 5 estratos, ou seja, 5 categorias de idades. Posteriormente, contou-se
quantas pessoas faziam parte de cada estrato (idade). Foi definido7 que o tamanho da amostra n a ser
obtida e igual a 50. A divis
ao dos estratos e o n
umero de pessoas por estrato e apresentado na Tabela 4.
7
O c
alculo para determinar o tamanho da amostra ser
a apresentado na Sec
ao 8.4.4
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
13
Estatstica B
asica
4 AMOSTRAGEM
Tabela 4 Estratificac
ao das 500 pessoas em observacao no hospital HS
Estratos (Idades)
00 ` 02
02 ` 05
05 ` 10
10 ` 20
20 ` 40
Total
N
umero de indivduos
100
98
104
102
96
500
Deve-se observar que a soma dos tamanhos de cada estrato e igual ao tamanho da populac
ao
em estudo e que a soma das amostras obtidas de cada estrato e igual ao tamanho da amostra de interesse.
Amostragem estratificada proporcional
Nesta amostragem estratificada, do estrato i deve-se obter uma quantidade (amostra) ni de
elementos que e proporcional ao tamanho Ni de cada estrato da populacao de tamanho N . O tamanho
ni de cada estrato e determinado por:
Ni
ni =
n
N
Em que:
ni : e o tamanho da amostra a ser obtida no estrato i
Ni : e o tamanho do estrato i;
N : e o tamanho da populac
ao;
n: e o tamanho da amostra.
Exemplo: Em um hospital est
ao em observacao 1000 pessoas de 0 a 40 anos. Por algum motivo
dividiu-se a populac
ao em k = 5 estratos, ou seja, 5 categorias de idades. Posteriormente, contou-se
quantas pessoas faziam parte de cada estrato (idade). Foi definido que o tamanho da amostra n a ser
obtida e igual a 50. A divis
ao dos estratos e o n
umero de pessoas por estrato podem ser observados na
Tabela 6.
Tabela 6 Estratificac
ao das 1000 pessoas em observacao no hospital HS
Estratos (Idades)
00 ` 02
02 ` 05
05 ` 10
10 ` 20
20 ` 40
Total
N
umero de indivduos
500
320
100
50
30
1000
Determine o tamanho das amostras a serem obtidas em cada estrato da populacao em estudo.
Soluc
ao:
Para obter o tamanho das amostras a serem retiradas de cada estrato deve-se calcular:
14
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
4 AMOSTRAGEM
Para o estrato 1: n1 =
N1
500
n=
50 = 25
N
1000
Para o estrato 2: n2 =
N2
320
n=
50 = 16
N
1000
Para o estrato 3: n3 =
N3
100
n=
50 = 5
N
1000
Para o estrato 4: n4 =
N4
50
n=
50 = 2,5
N
1000
Para o estrato 5: n5 =
N5
30
n=
50 = 1,5
N
1000
Organizando os resultados obtidos na Tabela 7, observa-se que foi arredondado para cima o
tamanho da amostra do estrato 4 e que foi truncado o valor obtido para o tamanho da amostra do estrato
5. Tal operac
ao foi realizada a fim de que a soma dos tamanhos das amostras retiradas dos estratos fosse
igual a n = 50.
Tabela 7 Estratificac
ao das 1000 pessoas em observacao no hospital
HS e os respectivos tamanhos dos estratos e tamanhos de amostras
Estratos (Idades)
N
umero de indivduos
Tamanho da amostra
00 ` 02
500
25
02 ` 05
320
16
05 ` 10
100
05
10 ` 20
50
03
20 ` 40
30
01
Total
1000
50
Novamente, nota-se que a soma dos tamanhos de cada estrato e igual ao tamanho da populac
ao
e que a soma dos tamanhos das amostras obtidas dos estratos e igual ao tamanho da amostra a ser
estudada.
Amostragem estratificada
otima
Em uma amostragem estratificada otima alem do tamanho de cada estrato e considerada,
tambem, a variabilidade dos dados do estrato para determinar o tamanho da amostra a ser obtida nos
mesmos. Com isso consegue-se otimizar a obtencao de informacoes sobre a populacao, pois naquele
estrato em que houver menor variac
ao ela podera influenciar na obtencao de uma menor quantidade de
elementos amostrados.
Assim, o tamanho de cada amostra a ser retirada do seu respectivo estrato e calculado por:
Ni i n
ni =
k
P
Ni i
i=1
Sendo:
ni : e o tamanho da amostra a ser obtida no estrato i
Ni : e o tamanho do estrato i;
n: e o tamanho da amostra;
k: e o n
umero de estratos;
i : e o desvio padr
ao populacional do estrato i.
Crtica:
Necessidade de conhecer o desvio padr
ao populacional em cada estrato para a variavel estratificadora, o
que em geral n
ao possvel. Usa-se, ent
ao, estima-lo por meio de uma amostra piloto encontrando, assim,
o desvio padr
ao amostral8 que e usado para estimar o desvio padrao populacional.
Quando a vari
avel em estudo e qualitativa nao existe o desvio padrao populacional.
4.4
Exerccios
O c
alculo do desvio padr
ao amostral ser
a visto na Sec
ao 5.2.5
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
15
Estatstica B
asica
4 AMOSTRAGEM
2. Um cientista pretende observar o comportamento dos 67 primatas de uma reserva, para isso ele quer
estudar 10 deles. Ent
ao, ele cria uma estrutura amostral atribuindo a esses primatas os n
umeros 01, 02,
. . ., 67, e obtem a seguinte sequencia de n
umeros gerada por computador:
39126
49648
81754
09284
10219
23109
31157
00890
12782
16922
74448
63933
69134
38845
77315
13332
25819
91862
19203
12864
20783
68735
09460
63677
52029
Se ele utiliza os dois primeiros n
umeros de cada n
umero aleatorio (comecando, assim, com 39, 49, 81, 09,
. . .), quais primatas ser
ao selecionados?
3. Os 35 alunos de uma determinada sala de aula possuem as seguintes idades em anos: 25, 20, 35, 21,
22, 22, 24, 25, 30, 38, 24, 20, 20, 25, 20, 19, 25, 23, 20, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27, 25, 23,
28, 27, 22. Com o objetivo de estimar a idade media, como voce extrairia uma amostra simples ao acaso,
de tamanho n = 10 desta populac
ao? Determine a idade media da turma. De todos os detalhes.
4. Os 60 pacientes de um medico apresentam os nveis de glicose em jejum em mg/dL:
62 58 62 69 58 70 66 78 77 64 68 78
59 54 77 73 78 80 74 71 60 79 78 73
77 60 81 75 64 66 63 66 62 84 81 78
78 77 78 76 75 71 75 74 68 87 78 76
79 67 66 77 76 72 80 78 76 64 75 79
Sorteie 10 pacientes, sem reposic
ao, desse conjunto. Use a tabua de n
umeros aleatorios abaixo, adote
pares de n
umeros, como se le um livro, comecando por 70, 89, 18, 88, 21, 97, 45, ...
70891 88821 97452 20353 06361 70990 18735 56086
26943 40213 23032 58781 27620 97239 15102 86483
01587 05547 41280 00572 18550 32127 48564 58748
19827 45549 06723 64692 55592 31574 11217 32794
63345 61088 01293 93914 32518 61105 56574 50105
11601 04533 53473 74240 32640 16851 23814 38439
03748 67555 03404 91598 66248 13918 92221 19450
11166 20498 99753 86323 46310 05831 65045 77398
a) Quais foram os pacientes sorteados?
b) Quais s
ao os valores de glicemia de cada indivduo amostrado?
5. Se os 35 alunos do exerccio 3 estivessem organizados em 5 filas de 7 alunos cada, qual seria a tecnica
de amostragem mais indicada? Selecione uma amostra de tamanho n = 10 e determine a idade media da
turma dando todos os detalhes.
6. Uma empresa tem 3.414 empregados repartidos nos seguintes setores:
Setores
No de funcionarios
Administrativo
314
Transporte
948
Oper
arios
1.451
Outros
701
Deseja-se selecionar uma amostra de tamanho n = 50 de funcionarios para uma entrevista. Qual o tipo
de amostragem e recomendado para esta situacao? Justifique e apresente todos os passos para selecionar
os 50 funcion
arios.
7. Uma ind
ustria de cosmesticos possui 100 funcionarios dos quais 70 trabalham exclusivamente dentro
da f
abrica e 30 ora trabalham dentro, ora trabalham fora. As idades dos 100 funcionarios sao apresentadas
na ordem de como foram coletadas (le-se segundo as linhas, tal como se le um livro) de modo que as
setenta primeiras idades s
ao dos funcion
arios que trabalham exclusivamente dentro da ind
ustria e as
trinta u
ltimas daqueles que trabalham ora dentro, ora fora da ind
ustria.
33
35
35
34
34
33
36
39
40
39
16
38
34
33
35
34
32
36
40
41
40
34
30
33
34
36
34
33
40
45
41
34
37
34
33
35
35
34
42
41
40
34
36
31
31
34
37
33
39
40
40
31
33
32
35
33
35
32
38
39
42
36
34
36
35
32
35
31
40
41
39
35
34
33
35
38
30
37
40
41
39
Profs. Fl
avio Bittencourt/Adriana Dias
32
32
29
37
34
35
35
40
40
38
37
39
36
32
33
34
34
40
42
40
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
a) Qual e a populac
ao em estudo?
b) Qual e a vari
avel em estudo e sua classificacao?
c) Uma amostra, de dez indivduos foi retirada da populacao de cem, com auxlio dos n
umeros aleatorios.
A seguir, foi calculada a idade media da amostra das dez idades. Que valor voce acha que foi obtido para
essa media?
d) Suponha agora que se pensasse em fazer amostragem estratificada. Em sua opiniao, seria razoavel, no
caso? Caso afirmativo, indique como voce procederia, ainda utilizando os n
umeros aleatorios. Suponha
que o tamanho da amostra continue sendo igual a dez.
e) Suponha agora que tivesse sido utilizada amostragem estratificada uniforme, num total ainda de dez
idades, e que tivessem sido obtidos, no primeiro e no segundo estratos, respectivamente, x
1 = 33,8 e
x
2 = 40,2. Em quanto voce estimaria a idade media da populacao de cem idades?
8. A Reitoria da UNIFAL-MG quer aplicar um questionario `a comunidade academica (servidores, alunos
e professores) para avaliar a opini
ao sobre a modificacao do calendario academico durante a Copa. Disp
oe
de um cadastro com 107 servidores, 525 alunos e 214 professores. Deseja-se amostrar 100 pessoas. Qual
o tipo de amostragem voce utilizaria e quantos indivduos de cada categoria seriam avaliados?
9. Deseja-se selecionar uma amostra de domiclios da cidade de Alfenas. Um total de 5 ruas com caractersticas pr
oximas compor
ao as subdivis
oes da populacao em estudo. No quadro abaixo, A1 representa
o primeiro domiclio da Rua A, A2 o segundo, e assim por diante.
Ruas
A
B
C
D
E
Domiclios
A1 A2 A3 A4 A5 A6 . . . A56
B1 B2 B3 B4 B5 B6 . . . B85
C1 C2 C3 C4 C5 C6 . . . C48
D1 D2 D3 D4 D5 D6 . . . D108
E1 E2 E3 E4 E5 E6 E7 E8 . . . E209
Inicialmente foram sorteadas duas ruas (B e D) e depois foram selecionados todos os domiclios de cada
rua. Identifique o tipo de amostragem realizada.
ESTAT
ISTICA DESCRITIVA
A estatstica descritiva e a
area da estatstica que aplica varias tecnicas para a organizacao,
a apresentac
ao e a descric
ao de um conjunto de dados. O objetivo e a descricao dos dados ao inves de
usar os dados em aprendizado sobre a populacao. As principais caractersticas do conjunto de dados e
apresentada por meio de tabelas, de gr
aficos e de metodos numericos.
Neste captulo ser
ao vistos alguns exemplos de tabelas e de graficos que poderao representar, objetivamente, as informac
oes e caractersticas de uma variavel e, posteriormente, os metodos numericos que
podem representar uma amostra: medidas de posicao, medidas separatrizes e medidas de variabilidade.
5.1
5.1.1
Apresenta
c
ao dos dados
Tabelas
Profs. Fl
avio Bittencourt/Adriana Dias
17
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
O corpo e representado por colunas e subcolunas dentro das quais serao registrados os dados
e/ou informac
oes.
O rodape e um espaco na parte inferior da tabela utilizado para inserir notas e/ou fonte dos
dados. Em muitos casos e dispens
avel.
Embora existam diversas classificacoes para as tabelas, neste material as tabelas serao consideradas como distribui
c
ao de frequ
encias. Uma distribuicao de frequencia e um agrupamento dos dados
em classes de modo a contabilizar o n
umero de ocorrencias em cada classe. O n
umero de ocorrencias de
cada classe recebe o nome de frequencia absoluta. O objetivo da tabela de distribuicao de frequencias
usada, tambem para discriminar a
e fornecer uma boa visualizac
ao do comportamento dos dados. E
distribuic
ao de probabilidade de uma amostra (ou populacao). Alguns exemplos serao apresentados a
seguir.
S
erie temporal
a serie em que
Tambem conhecida como serie cronologica, serie evolutiva ou serie historica. E
os dados s
ao observados de acordo com o tempo em que ocorrem, permanecendo constantes o local e o
fen
omeno.
Tabela 9 N
umero de notificacoes de obitos ao SIM, por doencas
end
ocrinas nutricionais e metab
olicas. Brasil, 2005 a 2011
Ano
N
umero de o
bitos
2005
53.983
2006
58.904
2007
61.860
2008
64.631
2009
66.984
2010
70.276
2011
73.929
Fonte: SIM-CGIAE/SVS/MS. Disponvel em: http://www.datasus.gov.br
S
erie geogr
afica
a serie em que os
Tambem chamada de serie de localizacao, serie regional ou serie territorial. E
dados s
ao observados de acordo com a localidade em que ocorreram, permanecendo constantes a epoca e
o fen
omeno. Exemplo:
Tabela 10 Internac
oes por acidente de transito segundo a Unidade
de Federaca
o, faixa et
aria de 25 a 29 anos, nov-2013
Regi
ao
N
umero de internaco
es
Sudeste
144
Nordeste
94
Centro-Oeste
10
Sul
9
Norte
4
Fonte: Minist
erio da Sa
ude. Disponvel em: http://www.datasus.gov.br
S
erie especfica ou categ
orica
a serie em que os dados s
E
ao agrupados de acordo com categorias ou especies, permanecendo
constantes a epoca e o local. Exemplo:
Tabela 11 Notificacoes de obitos ao SIM. Brasil, 2011*
Causa
Algumas doencas infecciosas e parasit
arias
Neoplasias (tumores)
Doencas do sangue
Doencas end
ocrinas nutricionais e metab
olicas
Transtornos mentais e comportamentais
Doencas do sistema nervoso
Doencas do olho e anexos
Doencas do ouvido e da ap
ofise mast
oide
N
umero de o
bitos
49.175
184.384
6.344
73.929
13.725
26.948
23
150
18
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
S
erie de dupla entrada ou tabela de contig
encia
a serie que e constituda da conjugacao ou juncao de uma ou mais series. E
u
E
til para
mostrar dois ou mais tipos de vari
aveis em relacao a um item. Deve ser lida na vertical e na horizontal
simultaneamente para que as linhas e as colunas sejam relacionadas.
Tabela 12 Notificac
oes de obitos ao SIM. Brasil, 2007 a 2011*
Causa
Algumas doencas infecciosas e parasit
arias
Neoplasias (tumores)
Doencas do sangue
Doencas end
ocrinas nutricionais e metab
olicas
Transtornos mentais e comportamentais
Doencas do sistema nervoso
Doencas do olho e anexos
Doencas do ouvido e da ap
ofise mast
oide
2007
45.945
161.491
5.719
61.860
10.948
20.413
26
118
Ano
2009
47.010
172.256
6.011
66.984
11.861
23.018
23
125
2008
47.295
167.677
5.825
64.631
11.852
21.609
39
125
2010
48.823
178.990
6.284
70.276
12.759
25.303
31
125
2011
49.175
184.384
6.344
73.929
13.725
26.948
23
150
5.1.2
Constru
c
ao de tabelas de distribui
c
ao de frequ
encias
Quando a vari
avel for qualitativa
A construc
ao consiste na organizacao dos dados com as suas respectivas frequencias absolutas.
A primeira coluna da tabela conter
a informacoes a respeito da variavel (os dados observados) e na segunda
coluna ser
a apresentada as frequencias com que aparecem os dados.
Exemplo: O Congresso de Homeopatia, realizado na cidade de Alfenas-MG em 2014, usou um
question
ario para perguntar aos participantes como eles avaliam a organizacao, a recepcao, os temas das
palestras, o coffee break, os minicursos e os anais. Cada variavel foi avaliada de acordo com uma escala
que varia de excelente (E),
otimo (O), bom (B), medio (M) e fraco (F). Confeccione uma tabela para
representar as respostas dos dados coletados sobre a organizacao de 30 participantes que participaram da
pesquisa:
B
O
E
B
F
F
O
B
B
E
O
M
M
E
F
M
O
B
F
M
M
F
M
O
O
B
E
B
B
B
Otimo
Bom
Medio
Fraco
Total
N
umero de Participantes
4
6
9
6
5
30
Quando a vari
avel for quantitativa discreta
A distribuic
ao de frequencia para dados discretos e uma serie que possui uma coluna para as
classes e outra coluna para as frequencias. As classes (1a coluna da tabela) sao formadas por n
umeros
inteiros, n
ao possuem divis
oes, representam o valor observado na variavel estudada. As frequencias
representam o n
umero de vezes que o valor da classe aparece no conjunto de dados. Porem, quando se
tem uma vari
avel quantitativa discreta que apresenta muitas observacoes, levando a um n
umero grande
de classes, e mais racional realizar o agrupamento dos valores em varios intervalos de classe.
Exemplo: Numa fila de um PSF da cidade Gama foram entrevistados 50 casais durante os
meses abril e maio de 2010 (dados fictcios). O objetivo da pesquisa era descobrir o n
umero de filhos
por casal. O resultado da pesquisa est
a apresentado abaixo, sendo os dados dispostos conforme foram
coletados (dados brutos), da esquerda para `a direira, seguindo-se pelas linhas como se le um texto.
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
19
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
2
6
1
3
3
3
1
4
1
0
0
1
1
3
4
2
4
3
5
1
1
0
1
7
2
1
1
7
1
2
1
5
6
3
1
3
6
2
1
2
2
0
0
1
3
5
2
1
0
2
Os dados como s
ao apresentados anteriormente sao denominados de dados brutos, ou seja,
s
ao aqueles que n
ao foram numericamente organizados, estao na forma como foram coletados.
Para iniciar a tabulac
ao e necess
ario ordenar os dados, em ordem crescente ou decrescente. Os
dados ordenados s
ao chamados de rol. Assim, para os dados anteriores:
0
1
1
2
4
0
1
1
3
4
0
1
2
3
5
0
1
2
3
5
0
1
2
3
5
0
1
2
3
6
1
1
2
3
6
1
1
2
3
6
1
1
2
3
7
1
1
2
4
7
Quando a vari
avel for quantitativa contnua
Numa distribuic
ao de frequencia para dados contnuos as classes (1a coluna da tabela) s
ao
formadas por intervalos de valores agrupados definidos de alguma forma. As frequencias representam o
n
umero de valores que est
ao compreendidos em cada intervalo (classe). A construcao desta tabela nao e
padronizada, a maioria das vezes fica mais a cargo do pesquisador (pela experiencia) do que por meio de
algoritmos.
Tambem pode acontecer de a variavel estudada ser discreta, mas o n
umero de valores observados
ser muito grande ou estes valores apresentarem muito diversos. Para este caso as classes formadas por
intervalos evitar
a tabelas com grande extensao, a nao interpretacao dos valores do fenomeno e, tambem,
classes com valores nulos.
N
ao existe uma regra u
nica para construcao da tabela de distribuicao de frequencia, mas e
importante que a distribuic
ao conte com um n
umero adequado de classes. Se o n
umero de classes for
excessivamente pequeno acarretar
a perda de detalhe e pouca informacao se podera extrair da tabela.
Por outro lado, se for utilizado um n
umero excessivo de classes, havera alguma classe com frequencia
nula ou muito pequena, n
ao atingindo o objetivo da classificacao que e tornar o conjunto de dados
supervision
aveis.
Procedimentos que ser
ao adotados para construcao de uma tabela de distribuicao de frequencias
para vari
aveis quantitaticas contnuas9 :
Ordenar os valores
Determinar o n
umero de classes10 k:
a) k entre
5 e 20 classes, conforme a familiaridade do pesquisador com os dados;
b) k = n quando n 100 e k = 5 log n quando n > 100, sendo n o n
umero de dados11 .
9 E tamb
em para a quantitativa discreta quando apresentar muitos valores ou valores dispersos 10 N
ao existe um consenso
sobre como determinar o n
umero de classes e o intervalo das classes 11 Esta ser
a a f
ormula adotada em todas as situaco
es
20
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
A
k1
Em que:
c: e o intervalo ou amplitude da classe;
A: amplitude total, dada pela diferenca entre a maior e menor observacoes;
k: n
umero de classes.
Determinar o limite inferior da primeira classe LI1 :
c
LI1 = menor observacao
2
Determinar o limite superior da primeira classe LS1 :
LS1 = LI1 + c
Determinar os demais limites inferiores e superiores das outras classes ate a classe k:
LI2 = LS1
LS2 = LI2 + c
LI3 = LS2
LI4 = LS3
..
.
LS3 = LI3 + c
LS4 = LI4 + c
..
.
LIk = LSk1
LSk = LIk + c
As frequencias representam os valores contidos nos intervalos determinados pelos limites inferiores e superiores de cada classe de modo que sejam LIi e < LSi . Nesse material as classes ser
ao
definidas por LIi ` LSi .
Exemplo: Considere a vari
avel quantitativa discreta N
umero de pacientes atendidos na Clnica
RX de segunda a sexta, durante 94 dias, jan-mai, 2010. Observe que a variavel e discreta, mas por
conter valores diversos as classes ser
ao compostas por intervalos de valores.
8 24 46 13 38 54 44 20 17 14
18 15 30 24 20 8 24 18 9 10
38 79 15 62 23 13 62 18 8 22
11 17 9 35 23 22 37 36 8 13
10 6 92 16 15 23 37 36 8 13
44 17 9 30 26 18 37 43 14 9
28 41 42 35 35 42 71 50 52 17
19 7 28 23 29 29 58 77 72 34
12 40 25 7 32 34 22 7 44 15
9 16 31 30
Os dados anteriores s
ao brutos. Portanto, e necessario ordena-los (rol) de alguma forma. Assim:
6
6
7
7
7
8
8
8
8
9
9
9
9
9 10 10 11 12 13 13
13 13 14 14 14 15 15 15 15 16
16 17 17 17 17 18 18 18 18 19
20 20 22 22 22 23 23 23 23 24
24 24 25 26 28 28 29 29 30 30
30 31 32 34 34 34 35 35 35 36
37 37 38 38 40 41 42 42 43 44
44 44 46 50 52 54 58 62 62 71
72 77 79 92
Agora, calcula-se o n
umero de classes:
k = 94 = 9,69 10
Como k representa o n
umero de classes, logo tem que ser um valor inteiro, assim sera adotado
k = 10, mas poderia ser k = 9. Como k = 10 sabe-se que a tabela de distribuicao de frequencias tera 10
classes, ou seja, 10 intervalos de valores.
O tamanho de cada intervalo, amplitiude da classe, e dado por c, assim:
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
21
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
A
92 6
=
= 9,56
k1
10 1
Como os valores (dados) s
ao n
umeros inteiros nao justifica trabalhar com casas decimais, podendo ser adotado c = 10 desde de que ao final da construcao da tabela se observe que todos os valores
foram agrupados nas k = 10 classes.
O pr
oximo c
alculo e a determinacao dos limites de cada classe. O limite inferior da primeira
classe LI1 e determinado por:
c
LI1 = menor observacao
2
Logo,
10
LI1 = 6
=1
2
O limite superior da primeira classe LS1 e calculado por:
c=
LS1 = LI1 + c
LS1 = 1 + 10 = 11
a
3a
4a
5a
6a
7a
8a
9a
10a
Limite inferior
LI2 = LS1
LI2 = 11
LI3 = LS2
LI3 = 21
LI4 = LS3
LI4 = 31
LI5 = LS4
LI5 = 41
LI6 = LS5
LI6 = 51
LI7 = LS6
LI7 = 61
LI8 = LS7
LI8 = 71
LI9 = LS8
LI9 = 81
LI9 = LS8
LI9 = 91
Limite superior
LS2 = LI2 + c
LS2 = 11 + 10 = 21
LS3 = LI3 + c
LS3 = 21 + 10 = 31
LS4 = LI4 + c
LS4 = 31 + 10 = 41
LS5 = LI5 + c
LS5 = 41 + 10 = 51
LS6 = LI6 + c
LS6 = 51 + 10 = 61
LS7 = LI7 + c
LS7 = 61 + 10 = 71
LS8 = LI8 + c
LS8 = 71 + 10 = 81
LS9 = LI9 + c
LS9 = 81 + 10 = 91
LS9 = LI9 + c
LS9 = 91 + 10 = 101
Ap
os realizar todas as operac
oes, monta-se a tabela de distribuicao de frequencias sendo a
primeira coluna composta pelas classes e a segunda coluna composta pelas frequencias (n
umero de valores
contidos no intervalo determinado nas classes). O resultado de toda esta operacao e apresentado na
Tabela 16.
Tabela 16 N
umero de pacientes atendidos na Clnica RX de
segunda a sexta, durante 94 dias, jan-mai, 2010
N
umero de atendimentos
N
umero de dias
1 ` 11
16
11 ` 21
26
21 ` 31
19
31 ` 41
14
41 ` 51
09
51 ` 61
03
61 ` 71
02
71 ` 81
04
81 ` 91
00
91 ` 101
01
Total
94
Fonte: Dados fictcios
22
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
5.1.3
Tipos de distribui
c
ao de frequ
encias
A tabela de distribuic
ao de frequencias construda anteriormente e denominada de tabela de
distribuic
ao de frequencias simples absolutas. Alem dessa classificacao, as tabelas de distribuicao de
frequencias, podem ser:
Absolutas
Simples
Relativas
Absolutas
Tipos de frequencias
Crescentes
Relativas
Acumuladas
Absolutas
Decrescentes
Relativas
Distribui
c
ao de frequ
encias simples
a) Frequ
encia simples absoluta: e o n
umero de repeticoes de um valor individual ou de
uma classe de valores da vari
avel estudada. Exemplo: Na Tabela 16 cada frequencia f i, i = 1, . . . , 9,
representa o n
umero de valores que est
ao em cada classe.
b) Frequ
encia simples relativa: representa a proporcao de observacoes de um valor individual ou de uma classe em relac
ao ao n
umero total de observacoes. Para calcular a frequencia relativa
16
94
26
94
19
94
14
94
09
94
= 0,1702
= 0,2767
= 0,2021
= 0,1489
= 0,0957
03
= 0,0319
94
02
f r7 =
= 0,0213
94
04
f r8 =
= 0,0426
94
00
f r9 =
= 0,0000
94
01
f r10 =
= 0,0106
94
f r6 =
Para expressar os resultados em termos percentuais, multiplica-se o quociente obtido por 100:
f pi = f ri 100%
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
23
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
Exerccios
1,71
1,71
1,71
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,73
1,73
1,73
1,73
1,73
1,73
1,73
1,73
1,73
1,74
1,74
1,74
1,74
1,74
1,74
1,74
1,74
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,76
1,76
1,76
1,76
1,76
1,76
1,76
1,76
1,77
1,77
1,77
1,77
1,77
1,77
1,78
1,78
1,78
1,78
1,78
1,78
1,78
1,78
1,78
1,78
1,78
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,80
1,82
1,82
1,82
1,82
1,83
1,83
1,83
1,83
1,83
1,83
1,83
1,84
1,84
1,84
1,85
1,85
1,85
1,85
1,85
1,85
1,85
1,86
1,87
1,90
1,90
1,90
1,90
1,90
1,95
2,00
Gr
aficos
A representac
ao gr
afica e outro recurso que tem por objetivo dar uma ideia, a mais imediata
possvel, do comportamento dos dados, proporcionando maior facilidade na compreensao, para chegar a
conclus
oes sobre o comportamento do fen
omeno em estudo.
24
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
Um gr
afico deve ter, dentre outras, as seguintes caractersticas:
. Clareza: possibilita a leitura e interpretacoes correta dos valores do fenomeno;
/ Simplicidade: possibilita a an
alise r
apida do fenomeno observado. Evita-se perder com particularidades
sem import
ancia;
0 Veracidade: indispens
avel, pois, se o gr
afico nao representar uma realidade, perde sua finalidade.
Classificac
ao quanto `
a forma:
a) Diagramas: gr
aficos geometricos dispostos em duas dimensoes. Sao mais usados na representacao de
series estatsticas.
b) Cartogramas: e a representac
ao sobre uma carta geografica, sendo muito usado na Geografia, Historia
e Demografia.
c) Estereogramas: representam volumes e sao apresentados em tres dimensoes.
d) Pictogramas: a representac
ao gr
afica que consta de figuras representativas do fenomeno. Desperta
logo a atencao do p
ublico.
Classificac
ao quanto ao objetivo:
a) Gr
aficos de informac
ao - o objetivo e proporcionar uma visualizacao rapida e clara da intensidade das
categorias ou dos valores relativos ao fen
omeno. Sao graficos tipicamente expositivos, devendo ser o mais
completo possvel, dispensando coment
arios explicativos.
Caractersticas:
- deve conter ttulo;
- as legendas podem ser omitidas, desde que as informacoes presentes possibilitem a interpretacao do
gr
afico.
b) Gr
aficos de an
alise - estes gr
aficos fornecem informacoes importantes na fase de analise dos dados,
sendo tambem informativos. Os gr
aficos de analise, geralmente, vem acompanhados de uma tabela e um
texto onde se destacam os pontos principais revelados pelo grafico ou pela tabela.
S
ao v
arias as opc
oes de representacao grafica, dentre as quais pode-se citar: os graficos de
colunas, de linhas, de barras etc.
Gr
afico em linha
Os gr
aficos lineares s
ao usados frequentemente para a representacao de series temporais. Para
constru-lo, basta marcar os pontos e uni-los por meio de segmentos de reta, formando uma poligonal.
Considerando os dados apresentados na Tabela 9, pode-se representa-los graficamente segundo a Figura 8:
80000
Nmero de bitos
75000
70000
65000
60000
55000
50000
2005
2006
2007
2008
2009
2010
2011
Anos
Figura 8 Numero de notificacoes de obitos ao SIM, por doencas endocrinas nutricionais e metabolicas. Brasil,
2005 a 2011
Gr
afico em colunas
Os gr
aficos em colunas tornam possveis as comparacoes das grandezas, representando-as por
meio de ret
angulos de mesma base e alturas proporcionais `as respectivas grandezas. Estes graficos s
ao
mais utilizados, quando as inscric
oes a serem inseridas sob os retangulos forem curtas.
As orientac
oes para construc
ao de um grafico em colunas sao:
a) os ret
angulos s
o diferem no comprimento, e nao na base, a qual e atribuda;
b) os ret
angulos devem ser separados por espacos, um dos outros, sendo estes todos iguais, mas n
ao
devem ser menores do que a metade da base dos retangulos;
c) os ret
angulos devem ser desenhados, observando-se a ordem de grandeza, para facilitar a leitura e
a an
alise comparativa dos valores. Entretanto, se a serie representada for temporal, os dados a serem
dispostos no eixo horizontal devem ser colocados em ordem crescente de tempo.
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
25
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
Observa
c
ao: O espaco entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da
coluna.
As informac
oes apresentadas na Tabela 10 podem ser visulizadas na Figura 9:
160
Nmero de internaes
140
120
100
80
60
40
20
0
Sudeste
Nordeste
Centro-Oeste
Sul
Norte
Regies
Figura 9 Internacoes por acidente de transito segundo a Unidade de Federacao, faixa etaria de 25 a 29 anos,
nov-2013
Gr
afico em barras
Os gr
aficos em barras tem a mesma finalidade que os graficos em colunas, sendo preferveis estes,
quando as inscric
oes a serem inseridas forem longas. Sao mais usados para representar series especficas,
com uma u
nica diferenca que e a posic
ao em que estao dispostos os retangulos, na horizontal. As alturas
dos ret
angulos s
ao iguais e arbitr
arias e os comprimentos sao proporcionais aos respectivos dados.
As barras devem ser separadas uma das outras pelo mesmo espaco de forma que as inscricoes
identifiquem as diferentes barras. O espaco entre as barras pode ser a metade (1/2) ou dois tercos (2/3)
de suas larguras.
As barras devem ser colocadas em ordem de grandeza de forma decrescente para facilitar a
comparac
ao dos valores. A categoria outros (quando existir) e representada na barra inferior, mesmo
que o seu comprimento exceda o de alguma outra.
Os dados da Tabela 11 s
ao apresentados graficamente como pode ser visualizado na Figura 10:
Neoplasias (tumores)
Doenas endcrinas nutricionais e metablicas
Algumas doenas infecciosas e parasitrias
Doenas do sistema nervoso
Transtornos mentais e comportamentais
Doenas do sangue
Doenas do ouvido e da apfise mastide
Doenas do olho e anexos
0
40000
80000
120000
160000
200000
Nmero de bitos
Gr
afico em colunas compostas
Este tipo de gr
afico e apropriado para comparar diversas quantidades agrupadas. Este grafico
consiste em colunas duplas ou superpostas e dispostas sem espaco entre si. Ele proporciona economia de
espaco, sendo mais indicado quando a serie apresenta um n
umero significativo de categorias.
Para exemplificar, ser
a construdo um grafico com os dados apresentados pela Tabela 12, apresentado na Figura 11
26
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
a est
ao dividida em setores proporcionais aos valores da serie. Essa divisao se faz por
meio de uma regra de tres simples. Com o auxlio de um transferidor, efetua-se a marcacao dos angulos
correspondentes a cada divis
ao.
utilizado quando se pretende comparar cada valor da serie com o total. O grafico em setores
E
representa valores absolutos ou porcentagens complementares. As series geograficas, especficas e as
categorias em nvel nominal s
ao mais representadas em graficos de setores, desde que nao apresentem
muitas parcelas (no m
aximo sete).
Os dados da Tabela 10 tambem podem ser representados por meio do grafico de setores (Figura 12):
10; 4%
9; 3%
4; 2%
94; 36%
Sudeste
Nordeste
Centro-Oeste
Sul
Norte
144; 55%
Figura 12 Internacoes por acidente de transito segundo a Unidade de Federacao, faixa etaria de 25 a 29 anos,
nov-2013
Profs. Fl
avio Bittencourt/Adriana Dias
27
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
Figura 13 Numero de pacientes atendidos na Clnica RX de segunda a sexta, durante 94 dias, jan-mai, 2010
POLIGONO DE FREQUENCIAS
E o gr
afico obtido ao se ligar, por meio de segmentos de retas, os pontos correspondentes aos
pontos medios das classes com suas respectivas frequencias. No incio e no fim do grafico ligamos os
pontos nas extremidades dos ret
angulos para o grafico nao ficar voando.
Exemplo: O histograma apresentado na Figura 13 e o respectivo polgono de frequencias pode
ser visualizado na Figura 14:
Figura 14 Numero de pacientes atendidos na Clnica RX de segunda a sexta, durante 94 dias, jan-mai, 2010
Tipos de curvas de frequ
encias
Curvas de frequencia aparecem, na pratica, sob diversas formas caractersticas, como as indicadas na Figura 15:
a) Curvas de frequencia simetrica ou em forma de sino: caracterizam-se pelo fato das observacoes equidistantes do ponto central m
aximo ter a mesma frequencia. Um exemplo importante e a curva normal,
Figura 15a.
b) Curvas assimetricas: nestas a cauda da curva de um lado da ordenada maxima e mais longa do que
do outro. Se o ramo mais alongado fica a` direita, a curva e dita assimetrica `a direita, ou assimetrica
positiva, exemplo a Figura 15b1. Enquanto que, se ocorre o inverso, diz-se que a curva e assimetrica `
a
esquerda, ou assimetrica negativa, Figura 15b2.
c) Curva em forma de J, ou em J invertido: o ponto de ordenada maxima ocorre em uma das extremidades, Figuras 15c1 e c2, respectivamente.
d) Curva em forma de U: a curva possui ordenadas maximas em ambas as extremidades: Figura 15d.
28
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
b1
b2
c1
c2
Exerccios
1. Para dos dados dos dez alunos do exerccio da secao 5.1.4 construa o histograma e o polgono de
frequencia para os dados percentuais.
2. Para os dados de altura dos estudantes do sexo masculino (em metros) da Faculdade X, 2010, apresentados no exerccio da sec
ao 5.1.4, confeccione:
a) histograma
b) polgono de frequencia
3. Construa para os dados de consumo de frutas em uma residencia: laranjas (18), bananas (17), mac
as
(11), goiabas (4), lim
oes (2), os gr
aficos:
a) colunas;
b) barras;
c) setores.
4. Construa para os dados de cotac
ao do dolar (media mensal)12 durante os seis primeiros meses do ano
de 2015 um gr
afico de linha: 2,638(jan), 2,817(fev), 3,140(mar), 3,044(abr), 3,064(mai), 3,111(jun).
5. Construa para os dados de cotac
ao do dolar (media mensal)13 durante os seis primeiros meses do ano
de 2014 e 2015 um gr
afico de linhas: 2,382(jan), 2,384(fev), 2,326(mar), 2,233(abr), 2,221(mai), 2,236(jun)
em 2014 e 2,638(jan), 2,817(fev), 3,140(mar), 3,044(abr), 3,064(mai), 3,111(jun) em 2015.
6. Represente os dados abaixo de duas formas usando o grafico em colunas compostas.
Tabela 18 Populac
ao residente por regiao segundo o ano, Brasil, 2009-2012
Ano
2012
2011
2010
2009
Norte
16.347.807
16.095.187
15.864.454
15.359.645
Nordeste
53.907.144
53.501.859
53.081.950
53.591.299
Regi
oes
Sudeste
81.565.983
80.975.616
80.364.410
80.915.637
Sul
27.731.644
27.562.433
27.386.891
27.718.997
Centro-Oeste
14.423.952
14.244.192
14.058.094
13.895.467
Fonte: <www2.datasus.gov.br/>
5.2
Medidas Estatsticas
5.2.1
Medidas de Tend
encia Central
As estatsticas que caracterizam os valores medios sao chamados de medidas de tendencia central. Entre as principais medidas de tendencia central destacam-se a media aritmetica, a moda e a
mediana.
M
edia
um conceito, sem d
A mais importante medida de locacao e a media aritmetica. E
uvida,
bastante familiar. Por exemplo, a altura media de um grupo de estudantes, a temperatura media em
uma cidade em determinado dia, a nota media de uma turma de 30 alunos.
12
13
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
29
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
A media aritmetica pode ser considerada como uma media ponderada em que os pesos sao todos
iguais a 1.
Exemplo 1: Considere 5 provas aplicadas as quais possuem os seguintes pesos, respectivamente:
1, 2, 3, 4 e 5. Um determinado aluno conseguiu as seguintes notas ordenadas: 40, 50, 80, 90 e 20. A sua
media e calculada por:
5
P
pi xi
p1 x1 + p2 x2 + p3 x3 + p4 x4 + p5 x5
1 40 + 2 50 + 3 80 + 4 90 + 5 20
i=1
x
p = 5
=
= 56 pontos
=
P
p1 + p2 + p3 + p4 + p5
1+2+3+4+5
pi
i=1
Exemplo 2: A nota final do sistema academico e calculada por meio de uma media ponderada
dada por:
n
X
N otai
Mf inal =
i=1
M axi
n
X
P esoi
10
P esoi
i=1
Em que:
Mf inal : e a media final do aluno na disciplina;
N otai : e a nota atribuda para cada avaliacao i da disciplina;
M axi : e o valor m
aximo da avaliac
ao i;
P esoi : e a ponderac
ao (peso) da nota da avaliacao i.
Considere um professor de certa disciplina, ele aplica 3 provas de valores 30, 40 e 40, cujos pesos
s
ao 1, 2 e 2, respectivamente. Um aluno obteve 12 (em 30), 19 (em 40) e 37 (em 40). Qual e a media
final calculada pelo sistema academico?
Resoluc
ao:
3
X
N otai
Mf inal
i=1
M axi
3
X
P esoi
12
19
37
1+
2+
2
40
40
10 = 30
10
1+2+2
P esoi
i=1
Mf inal
30
2 19 37
8 + 19 + 37
64
16
+
+
5 20 20 10 =
20
20
10 =
10 = 5 10 = 0,64 10 = 6,4
5
5
5
5
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
M
edia para dados agrupados
Em alguma situac
ao os dados podem estar agrupados em tabelas de distribuicao de frequencias.
Se as classes forem formadas por apenas um valor, este valor funciona como xi e as frequencias funcionam
como pi .
Suponha que se queira determinar a media de n
umero de filhos por casal dos dados apresentados
na Tabela 14.
8
P
pi xi
6 0 + 16 1 + 9 2 + 8 3 + 3 4 + 3 5 + 3 6 + 2 7
i=1
=
= 2,34 filhos
x
p = 8
P
6 + 16 + 9 + 8 + 3 + 3 + 3 + 2
pi
i=1
Para calcular a media quando os dados estiverem agrupados (tabela de distribuicao de frequencias) e se as classes forem formadas por intervalos, e necessario calcular o ponto medio Xi de cada
LIi + LSi
classe. Lembre-se que o ponto medio e calculado por Xi =
. As frequencias fi funcionam como
2
pesos e os pontos medios Xi s representam os valores que a variavel assume (hipotese tabular basica).
Considere um experimento em que durante 60 dias anotou-se o n
umero de cartas entregues,
diariamente, em um edifcio residencial. Os resultados sao os apresentados a seguir. Calcule a media de
cartas entregues por dia no condomnio.
Tabela 19 N
umero de cartas entregues, diariamente,
em um edifcio residencial, durante 60 dias
N
umero de cartas entregues por dia N
umero de dias
20 ` 30
05
30 ` 40
09
40 ` 50
20
50 ` 60
18
60 ` 70
08
Total
60
A Tabela 20 ir
a apresentar mais uma coluna referente aos pontos medios das classes para facilitar
os c
alculos:
Tabela 20 N
umero de cartas entregues, diariamente, em um edifcio residencial, durante 60 dias e o ponto
medio das classes
N
umero de cartas entregues por dia Ponto medio Xi das classes N
umero de dias fi
20 ` 30
25
05
30 ` 40
35
09
40 ` 50
45
20
50 ` 60
55
18
60 ` 70
65
08
Total
60
Assim, o n
umero medio de cartas entregues diariamente e dado por:
k
X
i=1
k
X
i=1
5
X
fi Xi
=
fi
fi Xi
i=1
5
X
f1 X1 + f2 X2 + f3 X3 + f4 X4 + f5 X5
f1 + f2 + f3 + f4 + f5
fi
i=1
25 5 + 35 9 + 45 20 + 55 18 + 65 8
= 47,5 cartas
5 + 9 + 20 + 18 + 8
Propriedades da m
edia (dentre outras)
A soma algebrica dos desvios de um conjunto de valores em relacao `a media aritmetica e zero:
n
X
(xi x
) = 0
i=1
A soma algebrica dos quadrados dos desvios de um conjunto de valores em relacao `a media aritmetica
n
e mnima:
X
2
D=
(xi x
)
i=1
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
31
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
Vantagens do emprego da m
edia
Como se faz uso de todos os dados para o seu calculo e determinada com precisao matematica;
determinada quando somente o valor total e o n
E
umero de elementos forem conhecidos.
Desvantagens do emprego da m
edia
N
ao pode ser empregada para dados qualitativos;
influenciada por valores extremos, podendo, em alguns casos, nao representar a serie;
E
Em distribuic
oes de frequencias em que o limite inferior da primeira classe e/ou o limite superior
da u
ltima classe n
ao forem definidos, a media nao podera ser calculada.
Moda
Como o pr
oprio nome indica, e o valor que ocorre com maior frequencia em um conjunto de
valores. Em outras palavras, e o valor que esta na moda.
As distribuic
oes de frequencias que apresentam uma u
nica moda sao chamadas de unimodais;
quando apresentam duas modas, bimodais e mais de duas modas, multimodais. Existem ainda distribuic
oes que n
ao apresentam nenhuma moda: sao chamadas de amodais.
Exemplo: Calcule a moda dos seguintes conjuntos de dados:
a) 39; 52; 40; 45; 46; 55; 48; 40; 43; 47; 44
mo = 40
b) 24; 12; 14; 24; 11; 18; 19; 14; 18; 32; 24; 22; 24; 18; 36; 18; 12; 24; 20; 34
mo = 24
c) 1, 1, 2, 2, 3, 3
mo = @ (n
ao tem moda)
d) 100, 121, 202, 1022, 1500
mo = @ (n
ao tem moda)
Moda para dados agrupados
Quando os dados est
ao agrupados em distribuicoes de frequencias em que as classes nao s
ao
formadas por intervalos, n
ao existe uma formula matematica para o calculo da moda, ficando pois, a
cargo do pesquisador identificar o elemento que apresentar o maior n
umero de ocorrencias. Esse valor
ser
a o valor modal. Por exemplo, na Tabela 13 a moda e Bom e na Tabela 14 a moda e 1 filho.
Para dados agrupados em distribuicao de frequencias cujas classes sao formadas por intervalos,
o metodo mais empregado para o c
alculo da moda e o metodo de Czuber, cuja formula e definida por:
1
Cmo
mo = LImo +
1 + 2
Em que:
LImo : limite inferior da classe modal;
1 : diferenca entre a frequencia absoluta da classe modal e a classe anterior;
2 : diferenca entre a frequencia absoluta da classe modal e a classe posterior;
Cmo : amplitude da classe modal.
Exemplo: Durante 60 dias anotou-se o n
umero de cartas entregues, diariamente, em um edifcio
residencial. Os resultados foram apresentados na Tabela 19. Calcule o valor mais frequente, ou seja, o
n
umero modal de cartas entregues.
Soluc
ao:
A classe de maior frequencia e a 3a classe.
O limite inferior da classe modal e igual 40
A diferenca entre a frequencia absoluta da classe modal e a classe anterior e: 20 9 = 11
A diferenca entre a frequencia absoluta da classe modal e a classe posterior e: 20 18 = 2
A amplitude da classe modal e: 50 40 = 10
Substituindo estes valores na f
ormula abaixo,
11
1
Cmo = 40 +
10 = 48,46 cartas
mo = LImo +
1 + 2
11 + 2
Vantagens do emprego da moda
de uso pr
E
atico. Exemplificando: os empregados geralmente adotam a referencia modal de salario,
ou seja, o sal
ario recebido por muitos outros empregados. Tambem, carros e roupas sao produzidos
tomando como referencia o tamanho modal;
32
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
A moda geralmente e um valor verdadeiro e, por conseguinte, pode mostrar-se mais real e coerente.
Desvantagens do emprego da moda
N
ao inclui todos os valores de uma distribuicao;
Mostra-se ineficiente quando a distribuicao e largamente dispersa.
Mediana
Sejam x1 x2 . . . xn os n valores ordenados de uma variavel qualquer. A mediana
e o valor que centra a distribuic
ao do conjunto de valores, ou seja, que divide este conjunto de valores
ordenados em duas partes de quantidades iguais.
Ap
os ordenados os dados, para encontrar a mediana, primeiro determina a sua posicao, depois
busca-se o valor correspondente.
Para dados n
ao agrupados, a mediana e calculada por:
N
umero mpar de dados : x( n+1 )
md =
x( n ) + x( n +1)
2
2
N
umero par de dados :
2
Em que:
x( n+1 ) : e o elemento (valor) que ocupa a n+1
esima posicao no conjunto ordenado dos dados;
2 -
2
x( n ) : e o elemento (valor) que ocupa a n2 -esima posicao no conjunto ordenado dos dados;
2
x( n +1) : e o elemento (valor) que ocupa a n2 + 1 -esima posicao no conjunto ordenado dos dados.
2
Exemplo: Calcule a mediana dos seguintes conjuntos de dados:
a) 39; 52; 40; 45; 46; 55; 48; 40; 43; 47; 44
1o ) Ordene os dados: 39; 40; 40; 43; 44; 45; 46; 47; 48; 52; 55
2o ) Como h
a n
umero mpar de dados, a mediana corresponde ao valor:
x( n+1 ) = x( 11+1 ) = x(6)
2
2
O n
umero correspondente a x6 e o 45. Logo a md = 45.
b) 2,4; 1,2; 1,4; 2,4; 1,1; 1,8; 1,9; 1,4; 1,8; 3,2; 2,4; 2,2; 2,4; 1,8; 3,6; 1,8; 1,2; 2,4; 2,0; 3,4
1o ) Ordene os dados: 1,1; 1,2; 1,2; 1,4; 1,4; 1,8; 1,8; 1,8; 1,8; 1,9; 2,0; 2,2; 2,4; 2,4; 2,4; 2,4; 2,4; 3,2; 3,4; 3,6
2o ) Como h
a n
umero par de dados, a mediana corresponde ao valor da media entre os valores centrais:
x( n ) + x( n +1)
x( 20 ) + x( 20 +1)
x(10) + x(11)
1,9 + 2,0
2
2
2
2
=
=
=
= 1,95
2
2
2
2
Logo a md = 1,95.
Mediana para dados agrupados
Quando os dados est
ao agrupados em distribuicoes de frequencias em que as classes nao s
ao
formadas por intervalos, a maneira de encontrar a mediana identica `a realizada para dados nao agrupados.
Lembre-se que n e a soma das freq
uencias e que a mediana esta na coluna das classes. Na Tabela 14 a
mediana e 2 filhos.
Para dados agrupados numa tabela de distribuicao de frequencias em que as classes sao formadas
por intervalos, a mediana e calculada por:
n
2 FA
Cmd
md = LImd +
Fmd
Em que:
LImd : limite inferior da classe mediana;
FA : frequencia acumulada das classes anteriores `a classe mediana;
Fmd : frequencia absoluta da classe mediana;
Cmd : amplitude da classe mediana.
Para localizar a classe mediana faz-se a conta14 n 0,50, independentemente de n ser par ou
mpar. Depois, compara-se o valor de n 0,50 com os valores da frequencia absoluta acumulada crescente
(f ac) ate a classe em que a frequencia acumulada seja maior ou igual a n 0,50, quando isto acontecer,
14
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
33
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
esta e a classe mediana. A f ac e calculada em cada classe acumulando-se as frequencias anteriores ate
chegar a u
ltima classe.
Exemplo: Considerando os dados apresentados na Tabela 19, calcule a mediana.
Soluc
ao:
k=5
P
n = 60, pois
fi = 60
i=1
Na terceira classe a resposta foi sim, logo esta e classe mediana cujo limite inferior e 40.
A frequencia absoluta da classe mediana e: 20
A frequencia acumulada das classes anteriores `a classe mediana (1a e 2a classes) e: 5 + 9 = 14.
A amplitude da classe mediana e: 50 40 = 10.
Substituindo estes valores na f
ormula abaixo,
n
60
2 FA
2 14
md = LImd +
Cmd = 40 +
10 = 48 cartas
Fmd
20
Vantagens do emprego da mediana
N
ao depende de todos os valores do conjunto de dados, podendo mesmo nao se alterar com a
modificac
ao;
N
ao e influenciada por valores extremos do conjunto de dados;
utilizada nos casos de distribuic
E
oes assimetricas.
Desvantagens do emprego da mediana
Quando h
a valores repetidos, a interpretacao do valor mediano nao e tao simples.
Inadequacidade da sua express
ao para o manejo matematico.
Propriedades da m
edia, moda e mediana
Sejam X e Y duas vari
aveis e k uma constante qualquer.
Se X = Y k, ent
ao:
x
= y k
mo(x) = mo(y) k
md(x) = md(y) k
mo(x) = mo(y) k
md(x) = md(y) k
Se X = Y k, ent
ao:
x
= y k
Rela
c
ao entre m
edia, moda e mediana
A melhor medida de tendencia central de um conjunto de dados depende frequentemente do
modo pelo qual os valores est
ao distribudos.
Se s
ao simetricos e unimodais: a media, a mediana e a moda deveriam ser aproximadamente
as mesmas (Figura 16a).
34
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
Se s
ao simetricos e bimodais: a media e a mediana seriam, mais uma vez, aproximadamente
as mesmas. Nesse caso a media e a mediana estariam entre os dois picos e seria, portanto, uma medida
menos prov
avel de ocorrer. Indica que os seus dados possuem dois subgrupos distintos que diferem na
caracterstica medida; nessa situac
ao seria melhor adotar as duas modas ou tratar os dois subgrupos
separadamente. Exemplo: Figura 15e.
Se n
ao s
ao simetricos: a mediana, frequentemente, e a melhor medida de tendencia central
(Figuras 16b e 16c).
Exerccios
1. O desvio em relac
ao `
a media e dado pela diferenca da observacao i pela media artimetica das obser calculado por: di = xi x
vac
oes. E
. O desvio em relacao `a media nao e o mesmo que desvio padrao.
Ele indica o quanto o valor est
a afastado da media dos dados.
Considere o peso em kg de 6 pessoas obesas: 184; 193; 204; 204; 196; 207.
a) Calcule a media.
b) Qual foi o desvio da 2a pessoa em relac
ao `a media?
n
P
c) Mostre que a soma dos desvios em relacao `a media e nula, ou seja,
(xi x
) = 0.
i=1
d) Transforme os dados em libras (1 kg = 2,2 lb). Encontre a media em libras, qual e a relacao com a
media do item a?
e) Adicione 20 kg a cada dado e encontre a media. Qual e a relacao com a media do item a?
2. Por engano, um professor omitiu uma nota no conjunto de notas de 10 alunos. Se as nove notas
restantes s
ao 48, 71, 79, 95, 45, 57, 75, 83, 97 e a media das 10 notas e 72, qual o valor da nota omitida?
3. Determine a moda dos seguintes conjuntos de dados:
a) 5 5 5 3 1 5 1 4 3 5
b) 1 2 2 2 3 4 5 6 6 6 7 9
c) 1 2 3 6 7 8 9 10
d) 5 5 6 6 9 9 10 10
4. Calcule a mediana dos tempos de sobrevivencia (em anos apos a posse) dos cinco primeiros presidentes
americanos: 10, 26, 29, 28, 15.
5. Os valores a seguir s
ao os pagamentos (em dolares) feitos aos executantes de um concerto de rock:
500, 600, 800, 50.000, 1.000, 500. Calcule a mediana.
6. Calcule a mediana dos dados:
8,80
9,12
9,78
9,90
10,11
10,16
10,33
10,50
11,46
8,13
8,23
8,97
9,30
9,80
9,95
10,13
10,23
10,40
11,14
12,05
9,05
9,35
9,86
10,00
10,15
10,31
10,46
11,29
12,14
8,60
7. Considere os dados da Tabela 14, reapresentados abaixo:
No de filhos 0 1 2 3 4
No de casais 7 10 9 8 6
Calcule a media, a moda e a mediana.
8. Um professor mediu o tempo (em minutos) gasto
pelos estudantes de sua disciplina para conclurem
um trabalho no laborat
orio. Com os dados obtidos
construiu-se o histograma ao lado:
a) Que porcentagem de alunos fica entre meia hora
e uma hora e meia no laborat
orio?
b) Qual e a media, a moda e a mediana do tempo
gasto no laborat
orio?
c) Localize no gr
afico as medidas: media, moda e
mediana.
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
35
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
9. Considere os conjuntos de dados a seguir. Calcule as medidas de tendencia central e indique justificando
qual e a mais apropriada.
a) 1; 23; 25; 26; 27; 23; 29; 30
b) 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 3; 3; 4; 50
c) 1; 1; 2; 3; 4; 1; 2; 6; 5; 8; 3; 4; 5; 6; 7
d) 1; 101; 104; 106; 111; 108; 109; 200
5.2.3
Medidas Separatrizes
Ao calcular a mediana viu-se que e possvel determinar um ponto na escala de medida abaixo do
qual est
a localizada a metade (ou 50%) ou acima do qual esta localizada a outra metade das observacoes.
Outras medidas, assim como a mediana, que dividem o conjunto de observacoes em partes iguais s
ao
denominadas de medidas separatrizes: quartil, decil e percentil. O quartil divide o conjunto de observacoes
em quatro partes iguais; o decil em dez partes e o percentil em cem partes iguais. Uma relacao entre
estas quatro medidas separatrizes pode ser visualizada na Figura 17.
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
2,45;
1o ,
2,785;
2o (mediana) e
3,19
3o quartis, respectivamente.
C
alculo das medidas separatrizes para dados agrupados
Para dados agrupados em tabelas de distribuicao de frequencias, o calculo das medidas separatrizes pode ser realizado por:
Ir FAr
Pr = LIr +
Cr
Fr
Em que:
r: ordem do percentil;
Pr : valor do percentil de ordem r;
r
k
P
fi
Ir : posic
ao do percentil de ordem r dado por: Ir = i=1
100
k: n
umero de classes;
fi : frequencia absoluta das classes i = 1, 2, . . . , k;
LIr : limite inferior da classe percentil de ordem r;
FAr : frequencia absoluta acumulada imediatamente anterior `a classe percentil de ordem r;
Fr : frequencia simples da classe percentil de ordem r;
Cr : amplitude da classe percentil de ordem r.
Exemplo: Considere os dados apresentados na Tabela 19, determinar a mediana, o 1o quartil,
o
o 3 quartil do n
umero de cartas.
Soluc
ao:
A mediana corresponde ao 50o percentil e pode ser calculada por:
I50 FA50
P50 = LI50 +
C50
F50
Em que:
P50 : ?;
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
37
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
50
I50 : posic
ao do percentil de ordem 50: I50 =
5
P
fi
i=1
100
50 (5 + 9 + 20 + 18 + 8)
= 30a posicao
100
Localizada a posic
ao do percentil, adota-se o mesmo procedimento efetuado para encontrar a
mediana. Como I50 est
a na 30a posic
ao, na tabela calcula-se a f ac e vai-se comparando:
Tabela 22 C
alculos auxiliares: localizacao da classe do P50
N
umero de cartas N
umero de Frequencia absoluta acuComparacao I50
entregues por dia
dias fi
mulada crescente f ac
e f ac
20 ` 30
05
05
5 e maior ou igual a 30? Nao!
30 ` 40
09
14
14 e maior ou igual a 30? Nao!
40 ` 50
20
34
34 e maior ou igual a 30? Sim!
50 ` 60
18
52
60 ` 70
08
60
Total
60
Portanto, LI50 = 40, porque o valor que ocupa a 30a posicao esta na 3a classe;
FA50 = 14;
F50 = 20;
C50 = 10;
30 14
10 = 48 cartas.
fazendo as devidas substituic
oes, chega-se a: P50 = 40 +
20
H
5
P
fi
25 (5 + 9 + 20 + 18 + 8)
= 15a posicao.
100
100
Localizada a posic
ao do percentil, adota-se o mesmo procedimento efetuado para encontrar a
mediana. Como I25 est
a na 15a posic
ao, na tabela calcula-se a f ac e vai-se comparando:
I25 : posic
ao do percentil de ordem 25: I25 =
i=1
Tabela 23 C
alculos auxiliares: localizacao da classe do P25
N
umero de cartas N
umero de Frequencia absoluta acuComparacao I50
entregues por dia
dias fi
mulada crescente f ac
e f ac
20 ` 30
05
05
5 e maior ou igual a 15? Nao!
30 ` 40
09
14
14 e maior ou igual a 15? Nao!
40 ` 50
20
34
34 e maior ou igual a 15? Sim!
50 ` 60
18
52
60 ` 70
08
60
Total
60
Portanto, LI25 = 40, porque o valor que ocupa a 15a posicao esta na 3a classe;
FA25 = 14;
F25 = 20;
C25 = 10;
15 14
fazendo as devidas substituic
oes, chega-se a: P25 = 40 +
10 = 40,5 cartas.
20
H
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
Em que:
P75 : ?;
75
5
P
fi
75 (5 + 9 + 20 + 18 + 8)
I75 : posic
ao do percentil de ordem 75: I75 =
=
= 45a posicao.
100
100
Localizada a posic
ao do percentil, adota-se o mesmo procedimento efetuado para encontrar a
mediana. Como I75 est
a na 45a posic
ao, na tabela calcula-se a f ac e vai-se comparando:
i=1
Tabela 24 C
alculos auxiliares: localizacao da classe do P75
N
umero de cartas N
umero de Frequencia absoluta acuComparacao I50
entregues por dia
dias fi
mulada crescente f ac
e f ac
20 ` 30
05
05
5 e maior ou igual a 45? Nao!
30 ` 40
09
14
14 e maior ou igual a 45? Nao!
40 ` 50
20
34
34 e maior ou igual a 45? Nao!
50 ` 60
18
52
52 e maior ou igual a 45? Sim!
60 ` 70
08
60
Total
60
Portanto, LI75 = 50, porque o valor que ocupa a 45a posicao esta na 4a classe;
FA75 = 34;
F75 = 18;
C75 = 10;
45 34
10 = 56,1 cartas.
fazendo as devidas substituic
oes, chega-se a: P75 = 50 +
18
H
5.2.4
Exerccios
13 26,2
25
(50 1) + 1 = 13,25
P25 =
100
1 0,1
Sabe-se que o 1o quartil est
a entre o 13o e 14o dados.
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
39
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
13,25 x
0,75 26,3 x
5.2.5
0,1
26,3 x
As medidas de tendencia central fornecem informacoes valiosas mas, em geral, nao sao suficientes
para descrever e discriminar diferentes conjuntos de dados. As medidas de variabilidade (ou dispersao)
permitem visualizar a maneira como os dados se comportam (ou se concentram) em torno do valor central.
A variabilidade pode ser medida pelas estatsticas: amplitude total, distancia interquartlica, variancia,
desvio padr
ao e coeficiente de variac
ao.
Amplitude total
A amplitude total, A, de um conjunto de valores e a diferenca entre o maior e o menor valor
da vari
avel:
A = maior valor menor valor
Como depende apenas dos valores extremos seu uso se torna muito limitado, mas e bastante
empregada em controle estatstico da qualidade.
Intervalo interquartil
uma medida que n
E
ao e influenciada por servacoes (valores discrepantes) que estao acima de
a diferenca entre o terceiro e o Q3 +1,5IQR ou abaixo Q1 1,5IQR, denominadas
valores extremos. E
primeiro quartil de um conjunto de dados:
de pontos extremos (outliers).
Um Boxplot com as descricoes e as localiIQR = Q3 Q1
zacoes de cada item que o compoe e apresentado na
Figura 19. Lembre-se que este e um exemplo para
Em que:
ilustracao de modo que na pratica pode-se enconIQR: e o intervalo interquartil;
trar variacoes.
Q3 : e o 3o quartil;
Q1 : e o 1o quartil.
Na maioria das situac
oes o IQR e apresentado em um gr
afico, juntamente com a mediana.
O gr
afico e denominado diagrama de caixa e bigodes (Box and Whisker Plot) ou, simplesmente Boxplot, neste s
ao representadas cinco medidas (estatsticas): mnimo (menor valor), quartil inferior (1o
quartil), mediana, quartil superior (3o quartil), maximo (maior valor). Pode-se visualizar neste grafico
informac
oes sobre a distribuic
ao dos dados: posicao,
dispers
ao, assimetria, caudas e valores discrepantes
(outliers).
A posic
ao central dos valores e dada pela
mediana e a dispers
ao pela amplitude interquartlica. As posic
oes relativas da mediana e dos quartis
e o formato dos bigodes d
ao uma noc
ao da simetria e do tamanho das caudas da distribuicao. Sao
dois bigodes e eles correspondem `
a maior observac
ao menor que Q3 + 1,5 IQR e `
a menor observacao
maior que Q1 1,5 IQR. Dependendo da disperFigura 18 Boxplot: modelo e nomes das partes
s
ao dos dados, neste gr
afico, podem aparecer obPara confeccionar o Boxplot e necessario calcular algumas estatsticas (estatsticas de ordem),
como: primeiro quartil, segundo quartil (mediana), terceiro quartil, limite da cerca inferior e limite da
cerca superior. Siga os passos:
40
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
O box plot tambem pode ser confeccionado na posicao horizontal, tambem, pode ser utilizado
uma
na comparac
ao de dois ou mais conjuntos de dados e na comparacao com outras ferramentas. E
ferramenta explorat
oria de an
alise de dados, sendo u
til quando se trabalha com conjuntos limitados
de dados em que outras ferramentas como o histograma, por exemplo, pode nao ser adequadamente
empregado.
Exemplo: Duas amostras A e B foram obtidas de uma populacao cuja variavel de interesse e:
n
umero de filhos por casal. A amostra A forneceu os seguintes valores: 0, 0, 1, 1, 2, 3, 3, 3, 4, 7, 9. A
amostra B: 0, 0, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 7, 9. Algumas estatsticas das duas amostras e o Boxplot dos
dados (Figura 20):
AB = 9
nA = 11
AA = 9
nB = 14
Q1A = 1
x
B = 3
Q1B = 2
x
A = 3
mdB = 3
Q3B = 3
Q3A = 4
mdA = 3
IQRB = 1
moB = 3
moA = 3
IQRA = 3
minB = 0
minA = 0
maxB = 9
maxA = 9
Profs. Fl
avio Bittencourt/Adriana Dias
41
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
Embora as medidas de tendencia central das duas amostras sejam iguais e a amplitude tambem,
pode-se visualizar que os dados obtidos nas duas amostras apresentam dispersao, assimetria, caudas e
valores discrepantes diferentes, conforme pode ser visualizado na Figura 20.
Vari
ancia amostral
uma medida que expressa o desvio quadratico medio do conjunto de dados amostrais, e o
E
resultado e o quadrado da unidade de medida dos dados:
n
P
s2 =
(xi x
)
i=1
n1
Mede a variabilidade absoluta de um conjunto de observacoes. A variancia compara a variabilidade entre conjuntos numericos, que possuam a mesma m
edia e a mesma unidade de medida.
A pr
oxima vers
ao e mais f
acil de ser calculada, portanto e a mais usada:
n 2
P
xi
n
X
1
x2i i=1
s2 =
n 1 i=1
n
!2
k
X
fi Xi
k
X
1
2
i=1
2
s = k
fi Xi
X
X
i=1
f 1
f
i
i=1
i=1
Em que:
k
X
fi = n
i=1
fi : e a frequencia da classe i = 1, 2, , k;
Xi : e o ponto medio da classe i.
Desvio padr
ao amostral
Como medida de dispers
ao, a variancia tem a desvantagem de apresentar o resultado igual ao
quadrado da unidade de medida dos dados. Por exemplo, se os dados estao em metros, a variancia e dada
em metros ao quadrado.
O desvio padr
ao definido como a raiz quadrada positiva da variancia tem as mesmas aplicacoes
da vari
ancia e tem a mesma unidade de medida dos dados:
s = s2
Coeficiente de varia
c
ao amostral
Trata-se de uma medida relativa de dispersao, u
til para a comparacao do grau de concentrac
ao
em torno da media de dados distintos. Sua formula matematica e definida por:
cv =
s
100%
x
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
n 2
P
xi
n
X
1
i=1
2
2
x
s =
n 1 i=1 i
n
Organizando os dados e realizando calculos preliminares, ou seja, as somas das notas e a soma
dos quadrados das notas, obtem-se:
Jo
ao
xi
5
5
5
P 5
xi = 20
s2 =
1
41
Jose
x2i
25
25
25
P 225
xi = 100
ao
Jo
100
202
4
=0
s2 =
1
41
Jose
2
150
Maria
x2i
100
25
25
P 20
xi = 150
xi
10
5
5
P 0
xi = 20
20
4
= 16,6667
x2i
100
100
0
P 20
xi = 200
xi
10
10
0
P 0
xi = 20
s2 =
1
41
Maria2
200 204 = 33,3333
As vari
ancias amostrais das notas do Joao, do Jose e da Maria sao, respectivamente, 0; 16,6667
e 33,3333 pontos2 .
Como o interesse e verificar a variabilidade dos dados, e conveniente usar uma medida estatstica
na mesma unidade de medida dos dados. Para situacoes aplicadas como essa a melhor medida e o desvio
padr
ao amostral:
Jo
ao
s= 0=0
s=
Jose
16,6667 = 4,08
s=
Maria
33,3333 = 5,77
O desvio padr
ao amostral e uma medida que esta na mesma unidade de medida dos dados
e, consequentemente, da media. O desvio padrao ao lado da media exerce um papel importante nas
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
43
5 ESTAT
ISTICA DESCRITIVA
Estatstica B
asica
inferencias feitas sobre a media populacional. A variancia amostral desempenha um papel importante
nos metodos estatsticos usados para chegar a inferencias sobre a variancia populacional. Em geral a
vari
ancia e considerada mais na teoria inferencial, enquanto o desvio padrao amostral e mais usado em
aplicac
oes.
Por u
ltimo, o coeficiente de variacao para as notas dos alunos:
Jo
ao
0
cv = 100 = 0%
5
Jose
4,08
cv =
100 = 81,6%
5
Maria
5,77
cv =
100 = 115,4%
5
Em termos relativos diz-se que a dispersao das notas de Joao foi de 0%, as de Jose de 81,6% e
as da Maria foi de 115,4% em torno da media.
Exemplo 2: Adotando os dados da Tabela 19, n
umero de cartas entregues, diariamente, em um
edifcio residencial, durante 60 dias, calcule a variancia.
Os c
alculos preliminares s
ao apresentados a seguir. Assim como para calcular a media, para a
vari
ancia tambem e necess
ario calcular o ponto medio das classes e mais alguns calculos complementares:
Tabela 26 N
umero de cartas entregues, diariamente, em um edifcio residencial, durante 60 dias e calculos
preliminares
2
2
No de cartas/dia
Xi
Xi
No de dias, fi
fi Xi
fi Xi
20 ` 30
25
625
05
125
3125
30 ` 40
35
1225
09
315
11025
40 ` 50
45
2025
20
900
40500
50 ` 60
55
3025
18
990
54450
60 ` 70
65
4225
08
520
33800
Total
60
2850
142900
Assim, fazendo
as respectivas substituic
oes nos somatorios, obtem-se:
!2
k
X
k
"
#
fi Xi
2
X
1
1
(2850)
2
i=1
2
s = k
fi Xi
142900
= 127,5424 cartas2 .
=
k
60 1
60
X
X
i=1
f 1
f
i
i=1
i=1
Como pode ser de interesse uma medida de variabilidade na mesma unidade de medida dos
dados,
ao e:
o desvio
padr
s = s2 = 127,5424 = 11,2935 cartas.
Para calcular o coeficiente de variacao, basta realizar a operacao:
s
11,2635
cv = 100% =
100% = 23,71%
x
47,5
Propriedades da vari
ancia - V () e do desvio padr
ao - DP ()
Sejam X e Y duas vari
aveis e k uma constante qualquer.
Se X = Y k, ent
ao:
V (X) = V (Y )
DP (X) = DP (Y )
Se X = Y k, ent
ao:
V (X) = V (Y ) k 2
5.2.6
DP (X) = DP (Y ) k
Exerccios
1. Os dados apresentados a seguir referem-se `as variacoes de pesos corporais (em kg) de uma amostra de
20 alunos:
18,77 17,76 17,44 17,19 18,47 19,17 17,90 17,51 18,62 16,99 18,47 21,65 21,71
17,93 19,14 18,40 19,38 17,37 19,37 18,30.
a) Calcule a vari
ancia, o desvio padr
ao e coeficiente de variacao dos dados acima.
44
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
6 PROBABILIDADE
Dias de licenca
2
9
1
0
5
4
6
N
umero
da
enfermeira
8
9
10
11
12
13
14
Dias de licenca
7
8
8
3
6
7
8
N
umero
da
enfermeira
15
16
17
18
19
20
21
Dias de licenca
9
2
8
9
6
8
5
i=1
i=11
i=1
b) Suponha que cada enfermeira usasse exatamente dois dias a mais do que aparece na tabela. Use a
notac
ao de somat
orio para expressar novamente a soma em (a) iv de modo a refletir os dois dias de
licenca adicionais usados por cada enfermeira.
c) Use os dados de licenca por ano das enfermeiras para calcular:
i) a media, a moda e mediana
ii) a vari
ancia, o desvio padr
ao e coeficiente de variacao.
3. Um pesquisador mediu, durante 10 dias, `as 9:00, a temperatura em graus Celsius do freezer de seu
laborat
orio encontrando os seguintes valores: 10, 2, 0, 1, 3, 2, 0, 3, 1 e 1. Calcule a media, a
vari
ancia e o desvio padr
ao, apresentando a unidade de medida.
6
PROBABILIDADE
Anteriormente foi estudado como as estatsticas descritivas podem ser usadas para organizar,
descrever e apresentar um conjunto de dados. Entretanto, pode-se querer investigar como a informac
ao
contida na amostra pode ser usada para inferir sobre alguma caracterstica da populacao da qual foi
obtida. Antes de se fazer isto, e necess
ario a exposicao de alguns conceitos basicos e o estudo sobre
probabilidades.
6.1
Defini
c
oes
6.1.1
Experimento
qualquer processo que permite ao pesquisador fazer observacoes. Pode ser determinstico e
E
aleat
orio (probabilstico).
6.1.2
Experimento determinstico
um tipo de experimento que permite, sob determinadas condicoes, conhecer o resultado sem
E
mesmo ter que realiz
a-lo. Preservando todas condicoes impostas em um experimento, se o repetir chega-se
ao mesmo resultado (ou conclus
ao) n
ao importando o n
umero de vezes que seja reproduzido.
Exemplos: observar um corpo em queda livre, realizar uma reacao qumica, observar o movimento de um m
ovel, observar a temperatura de ebulicao da agua etc.
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
45
Estatstica B
asica
6 PROBABILIDADE
6.1.3
Experimento aleat
orio
Espa
co amostral
O espaco amostral e definido como o conjunto de todos os resultados possveis de um ensaio (experimento) aleat
orio, ser
a utilizada a letra grega omega () para identifica-lo. O smbolo n() representa
o n
umero de elementos deste conjunto.
Exemplos:
1. Um experimento consiste em lancar uma moeda e observar a face voltada para cima
Considerando K para o resultado cara e C para coroa, entao:
1 = {K, C} = n (1 ) = 2
2. Seja um experimento em que e lancado um dado comum. Considerando cada face: 1, 2, 3, 4, 5 e 6
como um possvel resultado, ent
ao:
2 = {1, 2, 3, 4, 5, 6} = n (2 ) = 6
3. Uma pessoa deseja sortear uma bola de uma urna que contem 10 bolas enumeradas, entao:
3 = {b1 , b2 , . . . , b10 } = n (3 ) = 10
4. Ao lancar dois dados simultaneamente, considerando o par ordenado (a, b) sendo a e b as faces do
1o e 2o dado, respectivamente, o espaco amostral e:
Evento
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
6 PROBABILIDADE
ocorrer n
umero par, A2 = {2, 4, 6} = n(A2 ) = 3;
ocorrer um n
umero menor do que 7, A3 = {1, 2, 3, 4, 5, 6} = n (A3 ) = 6 = n () = A3 = ;
ocorrer um n
umero maior ou igual a 7, A4 = = n (A4 ) = 0;
Observa
c
ao: Note que se n() = n, ent
ao tera 2n subconjuntos (tambem denominado de conjunto
n
das partes) e, portanto, 2 eventos. Entre eles estao o (evento impossvel) e o proprio (evento certo).
Opera
c
oes sobre eventos
Como na teoria de conjuntos, diversas operacoes podem ser aplicadas aos eventos. Estas operac
oes permitem que se combine eventos para formar novos eventos, como a intersec
c
ao, a uni
ao e o
complemento de evento(s).
A intersecc
ao de dois eventos A e B, representada por A B, e definida como o evento tanto A
como B, ou seja A e B ocorrem simultaneamente. Se A B = , os eventos sao chamados mutuamente
exclusivos ou disjuntos.
A uni
ao de dois eventos A e B, representada por A B, e o evento ou A ou B ou ambos A e
B.
e o evento nao A. Este evento
O complementar de um evento A, indicado por AC ou A,
ocorrer
a se, e somente se, A n
ao ocorrer.
Exemplo: Considere um experimento aleatorio em que uma moeda e lancada duas vezes e as
faces voltadas para cima s
ao observadas. O espaco amostral e:
= {(K,K) , (K,C) , (C,K) , (C,C)}
Considere os eventos:
A: ocorrencia de cara no primeiro lancamento e coroa no segundo: A = {(K,C)};
B: ocorrencia de duas caras: B = {(K,K)}. Entao:
A intersecc
ao de A e B e a ocorrencia de duas caras e a ocorrencia de cara no primeiro lance e coroa no
segundo.
AB =
A uni
ao de A e B e a ocorrencia de duas caras ou a ocorrencia de cara no primeiro lance e coroa no
segundo.
A B = {(K,K) , (K,C)}
O complemento de A e a n
ao ocorrencia de cara no primeiro lance e coroa no segundo.
AC = {(K,K) , (C,K) , (C,C)}
O complementar de B e a n
ao ocorrencia de duas caras.
B C = {(K,C) , (C,K) , (C,C)}
6.2
Probabilidade
um valor associado a cada resultado (evento) possvel. Pode ser uma probabilidade a priori
E
ou a posteriori.
6.2.1
Probabilidade a priori
dada pela raz
E
ao entre o n
umero de maneiras que um determinado evento ocorre e o n
umero
de eventos simples diferentes (n
umero de elementos) do espaco amostral. A probabilidade de um evento
A qualquer ocorrer no espaco amostral e denotada por:
P (A) =
n(A)
n()
Profs. Fl
avio Bittencourt/Adriana Dias
47
Estatstica B
asica
6 PROBABILIDADE
Soluc
ao:
Considerando as faces do dado, o espaco amostral e = {1, 2, 3, 4, 5, 6} e tem 6 elementos, ou seja,
n () = 6.
a) Seja o evento A1 ocorrer o n
umero 5, entao: A1 = {5} = n (A1 ) = 1. Logo, a probabilidade de A1 e:
P (A1 ) =
1
n(A1 )
=
n()
6
n(A3 )
6
= =1
n()
6
Probabilidade a posteriori
ai A
Se uma pessoa com diabetes foi escolhida ao acaso, qual a probabilidade de que ela seja do sexo
masculino? Seja A o evento a pessoa com diabetes e do sexo masculino, entao:
P (A) = fi =
48
ni
2.878
=
= 0,3667 = 36,67%
N
7.848
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
6.2.3
6 PROBABILIDADE
Importante saber!
3. P () = 0
4. Se AC e o evento complementar de A, entao P AC = 1 P (A).
5. Se A1 , A2 , . . . , An s
ao eventos
pertencentes a , isto e, tem intersecao nula, Ai Aj = ,
! disjuntos
n
n
[
X
com i 6= j, ent
ao P
Ai =
P (Ai ) = P (A1 ) + P (A2 ) + . . . + P (An ).
i=1
i=1
6. Se A e B s
ao dois eventos de um espaco amostral e nao sao eventos disjuntos, ou seja, a intersec
ao
n
ao e o conjunto vazio, A B 6= , entao, ao se calcular a probabilidade da uniao e necessario
considerar a intersec
ao, ou seja, P (A B) = P (A) + P (B) P (A B).
7. 0 P (A) 1, a probabilidade de ocorrer o evento A e um n
umero entre 0 e 1.
6.3
Probabilidade condicional
Recebe o nome de probabilidade condicional aquela que envolve pelo menos dois eventos e que
a ocorrencia de um depende da ocorrencia do outro. Geralmente diz-se probabilidade de A dado B ou
seja, a probabilidade de ocorrer o evento A sabendo que o evento B tenha ocorrido. Esta probabilidade
e calculada por:
n(A B)
P (A B)
=
, P (B) > 0
P (A|B) =
P (B)
n(B)
importante destacar que P (A|B) 6= P (B|A). Pois, P (B|A) = P (A B) .
E
P (A)
Exemplo 1: Um grupo de mocas e classificado de acordo com a cor dos olhos e dos cabelos de
cada moca, segundo a tabela a seguir:
Cor dos olhos
Azuis Castanhos
Loiro
18
8
Castanho
9
9
Ruivo
4
2
Suponha que voce esteja em um programa de televisao e que o apresentador lhe peca para sortear uma
dessas mocas para conversar com voce. Determine:
a) Supondo que o apresentador do programa lhe diga que a moca sorteada tem cabelos castanhos, ent
ao
qual e probabilidade de que ela tenha olhos castanhos?
Soluc
ao: foi dada uma condic
ao. Em outras palavras, voce ja sabe que aconteceu de a moca sorteada ter
cabelos castanhos. Neste caso pode-se considerar os eventos: B: o evento a moca sorteada tem cabelos
castanhos e A: o evento a moca sorteada ter olhos castanhos. Sabe-se que o espaco amostral e composto
por todas as mocas, totalizando 50 mocas. Assim, o evento B tem 18erm mocas e o evento A tem 19
mocas. A probabilidade procurada e uma probabilidade condicional de A ocorrer dado que B ja tenha
ocorrido. Pelos dados n(A B), que representa o n
umero de mocas que tem cabelos castanhos e olhos
castanhos, e igual a 9. Portanto,
Cor dos cabelos
P (A|B) =
P (A B)
n(A B)
9
1
=
=
=
P (B)
n(B)
18
2
b) Agora, o apresentador lhe disse que a garota que voce sorteou tem cabelos ruivos. Qual a probabilidade
de que ela tenha olhos azuis?
Soluc
ao: Sabe-se que a moca sorteada tem cabelos ruivos. Considerando B o evento a moca sorteada ter
cabelos ruivos e A o evento a moca sorteada ter olhos azuis. O espaco amostral e composto por todas
as 50 mocas. Assim, o evento B tem 6 mocas e o evento A tem 31 mocas. A probabilidade procurada e
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
49
Estatstica B
asica
6 PROBABILIDADE
uma probabilidade condicional de A ocorrer dado que B ja tenha ocorrido. O evento n(A B) n
umero
de mocas que tem cabelos ruivos e olhos azuis tem 4 elementos. Portanto,
P (A|B) =
n(A B)
4
2
P (A B)
=
= =
P (B)
n(B)
6
3
P (A B)
3/20
1
=
= .
P (B)
12/20
4
P (A B)
3/20
3
=
= .
P (A)
4/20
4
Exerccios
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
6 PROBABILIDADE
um menino. Em um pas foram registrados 4.065.014 nascimentos, dos quais 2.081.287 foram meninos e
1.983.727 foram meninas. Ent
ao a probabilidade de que uma mulher aleatoriamente selecionada desse a
luz a um menino e?
8. Selecionado aleatoriamente um estudante da UNIFAL-MG, considere os seguintes eventos:
A: o aluno possui cart
ao de credito Visa;
B: o aluno possui cart
ao de credito MasterCard.
Suponha que P (A) = 0,5, P (B) = 0,4 e P (A B) = 0,25.
a) Calcule a probabilidade de que o indivduo selecionado tenha pelo menos um dos dois tipos de cart
ao
(ou seja, a probabilidade do evento A B)?
b) Qual e probabilidade do indivduo selecionado nao possuir nenhum dos dois tipos de cartao?
9. Suponha que P (A|B) = 0,8, P (A) = 0,5 e P (B) = 0,2. Determine P (B|A).
10. Suponha o cruzamento de duas cobaias heterozigotas, Cc Cc. Suponha que o gene C e dominante
para a cor de pelo branca e que seja letal quando o indivduo resulta homozigoto. Ainda, a cor preta e
determinada pelo alelo c. Considere, adicionalmente, os seguintes eventos:
B: o indivduo e branco; P : o indivduo e preto; V : o indivduo nasce vivo; M : o indivduo nasce morto.
Calcule as probabilidades e descreva o seu significado:
f) P (V |B)
g) P (P |V )
h) P (B|M )
i) P (V |P )
j) P (P |M )
a) P (P )
b) P (B)
c) P (P V )
d) P (P M )
e) P (B|V )
6.4
A regra do produto pode ser utilizada quando o experimento envolve repeticoes. Assim, podese tratar cada repetic
ao como um evento e portanto, ao inves de trabalhar com analise combinatoria,
importante observar a
calcula-se a probabilidade de cada evento e posteriormente efetua-se o produto. E
dependencia entre os eventos, o que ser
a discutido a seguir.
Uma consequencia da probabilidade condicional e a seguinte:
P (A|B) =
P (A B)
= P (A B) = P (B) P (A|B)
P (B)
P (B|A) =
P (A B)
= P (A B) = P (A) P (B|A)
P (A)
ou
Profs. Fl
avio Bittencourt/Adriana Dias
51
Estatstica B
asica
6 PROBABILIDADE
outro lado, considerando, uma urna contendo cinco bolas vermelhas e duas azuis, em que sao retiradas
duas bolas, sem reposi
c
ao, o resultado obtido na segunda extracao dependera do resultado observado
na primeira extrac
ao; adotando cada extracao como um evento, nota-se que os eventos sao dependentes.
Exemplo 2: Uma firma produz um lote de 50 agulhas, das quais 6 sao defeituosas. Escolheramse aleatoriamente e testaram-se duas agulhas do lote. Determine a probabilidade de ambas serem boas,
se as agulhas foram selecionadas: a) com reposicao e b) sem reposicao.
Soluc
ao:
Como neste experimento h
a repetic
ao, pois retira-se uma agulha e em seguida outra pode-se considerar
que cada retirada representa um evento. Assim, seja A o evento sair uma agulha boa na primeira retirada
e seja B o evento sair uma agulha boa na segunda retirada.
a) Considerando um experimento em que uma agulha e selecionada e recolocada antes de fazer a segunda
selec
ao, tem-se um experimento com reposicao. Neste caso a probabilidade de que ambas as agulhas
sejam boas pode ser calculada por:
P (A B) = P (A) P (B) =
44 44
= 0,774
50 50
Pois os eventos s
ao independentes, uma vez que os eventos A e B ocorrem de forma independente.
b) Considerando um experimento em que uma agulha e selecionada e nao e recolocada antes de fazer
a segunda selec
ao, tem-se um experimento sem reposicao. Neste caso a probabilidade de que ambas as
agulhas sejam boas pode ser calculada por:
P (A B) = P (A) P (B|A) =
44 43
= 0,772
50 49
Pois os eventos s
ao dependentes, uma vez que o evento B depende do acontecimento de A.
Exemplo 3: Considere um baralho com 52 cartas. Um experimento consiste em retirar duas
cartas ao acaso e sem reposic
ao. Qual e a probabilidade:
a) das duas cartas extradas serem ouros?
Soluc
ao: O baralho comum possui 52 cartas, as quais sao divididas em 4 naipes com 13 cartas. Ou seja,
, , , (ouros, copas, paus, espadas, respectivamente) que possuem as cartas: A, 2, 3, 4, 5, 6, 7, 8,
9, 10, J, Q, K.
Portanto, considerando cada retirada com um evento, tem-se:
A = {sair uma carta de ouros na primeira retirada}
B = {sair uma carta de ouros na segunda retirada}
Portanto, a probabilidade de qua as duas cartas sejam de ouros e dada por:
P (A B) = P (A) P (B|A) =
13 12
1
=
52 51
17
=
P (A B) = P (A) P (B|A) =
52 51
663
c) de uma ser dama e a outra ser rei?
Considerando os eventos:
A = {sair uma dama}
B = {sair um rei}
Note que agora a ordem n
ao importa, portanto pode sair uma dama na primeira retirada e o rei na
segunda ou um rei na primeira retirada e a dama na segunda. Como ha dois resultados de interesse, e
necess
ario somar as suas probabilidades. Assim,
52
P (A B) = P (A) P (B|A) =
4
4 4
=
52 51
663
P (B A) = P (B) P (A|B) =
4 4
4
=
52 51
663
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
6 PROBABILIDADE
Independ
encia de tr
es ou mais eventos
n
\
i=1
!
Ai
n
Y
i=1
Ensaios de Bernoulli
Anteriormente foi apresentado que quando dois ou mais eventos sao independentes, calcula-se
a probabilidade de ocorrerem estes eventos pelo produto das probabilidades de cada qual. Entretanto, e
necess
ario considerar a ordem do acontecimento desses eventos.
Em alguns casos o objetivo poderia ser o de calcular a probabilidade em que o evento de interesse
aconteca a qualquer momento em n tentativas. Portanto, ha necessidade de considerar todas as formas
de acontecer este evento nas n tentativas.
Se for considerado um experimento em que para cada tentativa (repeticao) ha duas respostas
possveis, as quais ser
ao denominadas por sucesso e fracasso, e independ
encia, este experimento recebe
o nome de ensaios de Bernoulli.
O sucesso e fracasso s
o servem para designar os resultados, nao tem o mesmo significado que
na linguagem cotidiana. A probabilidade do sucesso sera identificada por p e a do fracasso por q. Como
ocorre o evento (sucesso) com probabilidade p ou o seu complementar (fracasso) com probabilidade q,
ent
ao q = 1 p.
Exemplo 1: Uma moeda e lancada 5 vezes. Cada lancamento (repeticao independente) e um
ensaio, em que dois resultados podem ocorrer: cara ou coroa. Pode-se chamar de sucesso o resultado cara
1
1
e de fracasso o resultado coroa. Em cada ensaio, p = e q = .
2
2
Exemplo 2: Uma urna contem 4 bolas vermelhas e 6 brancas. Uma bola e extrada, observada
sua cor e reposta na urna; este procedimento e repetido 8 vezes. Cada extracao (repeticao independente)
e um ensaio, em que dois resultados podem ocorrer: bola vermelha ou bola branca (nao vermelha). O
sucesso corresponde ao resultado bola vermelha e fracasso o resultado bola branca (complementar). Em
4
2
6
3
cada caso p =
= eq=
= .
10
5
10
5
Exemplo 3: Uma urna contem 4 bolas vermelhas, 6 brancas e 2 azuis. Uma bola e extrada,
observada sua cor e reposta na urna; este procedimento e repetido 10 vezes. Cada extracao e um ensaio,
em que dois resultados podem ocorrer, se relacionar o sucesso ao resultado bola vermelha, o fracasso ser
a
4
1
8
2
o resultado n
ao bola vermelha. Em cada caso p =
= eq=
= .
12
3
12
3
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
53
Estatstica B
asica
6 PROBABILIDADE
Considere os eventos do experimento citado no exemplo 1 em que uma moeda e lancada 5 vezes:
1
A1 : ocorre cara no 1o lancamento, P (A1 ) = ;
2
1
o
A2 : ocorre cara no 2 lancamento, P (A2 ) = ;
2
1
o
A3 : ocorre cara no 3 lancamento, P (A3 ) = ;
2
1
A4 : ocorre cara no 4o lancamento, P (A4 ) = ;
2
1
A5 : ocorre cara no 5o lancamento, P (A5 ) = .
2
Ent
ao o evento A1 A2 . . . A5 corresponde ao evento sair cara nos 5 lancamentos. Como os eventos
s
ao independentes,
P (A1 A2 A3 A4 A5 ) = p p p p p = p5 q 0 =
1 1 1 1 1
=
2 2 2 2 2
5
1
1
=
.
2
32
Se o interesse e calcular a probabilidade de obterem duas caras e em seguida tres coroas (nesta
C
C
C
ordem), ent
ao o evento de interesse corresponde a: A1 A2 AC
3 A4 A5 . Sendo que Ai corresponde
ao evento complementar de Ai . Logo, a probabilidade de ocorrer este evento e:
C
C
P A1 A2 AC
= p p q q q = p2 q 3
3 A4 A5
1 1 1 1 1
=
2 2 2 2 2
2 3
1
1
1
.
=
=
2
2
32
Neste experimento em qualquer quntupla ordenada a probabilidade sempre sera
H
1
.
32
Agora, supondo que o interesse seja o de calcular a probabilidade de obter duas caras nos 5
lancamentos, h
a 10 diferentes maneiras de acontecer este resultado, pois o sucesso e obter duas caras
nestes 5 lancamentos, n
ao importando em qual momento ocorrera. Portanto, as maneiras de acontecerem
duas caras em cinco lancamentos e apresentada a seguir, considerando que Ai , com i = 1, 2, 3, 4, 5, o
evento sair cara no lancamento i e AC
i o seu complementar:
C
C
A 1 A 2 AC
3 A4 A5 ;
C
C
AC
1 A 2 A3 A 4 A5 ;
C
C
A 1 AC
2 A 3 A4 A5 ;
C
C
AC
1 A 2 A3 A4 A 5 ;
C
C
A 1 AC
2 A3 A 4 A5 ;
C
C
AC
1 A2 A3 A4 A5 ;
C
C
A 1 AC
2 A3 A4 A 5 ;
C
C
AC
1 A2 A 3 A4 A 5 ;
C
C
AC
1 A 2 A 3 A4 A5 ;
C
C
AC
1 A2 A3 A 4 A 5 .
1
e sendo
32
1
10
5
=
=
32
32
16
Com conhecimento b
asico em an
alise combinatoria nao e necessario discriminar as maneiras de
ocorrer os sucessos, ou seja, descrever todas as diferentes formas como feito anteriormente, pois o que se
interessa e calcular o n
umero de maneiras que ocorre duas caras nos 5 lancamentos. Para esta situac
ao
54
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
6 PROBABILIDADE
5!
= 10
2! 3!
(nx) vezes
pois, qualquer enupla ordenada deste tipo e a intersecao de x sucesso(s) e de n x fracasso(s), ou seja,
C
x
nx
P (A1 A2 . . . Ax AC
.
x+1 . . . An ) = p q
Portanto, se o interesse e calcular a probabilidade de ocorrer(em) x sucesso(s) em n tentativas
de uma en
upla ordenada basta realizar o calculo:
P (x) = Cn,x px q nx
Em que:
x: representa o n
umero de sucessos de interesse;
n: representa o n
umero de repetic
oes do experimento;
p: representa a probabilidade de ocorrer um sucesso (ou seja, o evento);
q: representa a probabilidade de ocorrer um fracasso ou q = 1 p (nao ocorrer o evento).
6.6.1
Exerccios
1. Considere um baralho com 52 cartas numeradas, 13 para cada um dos naipes (ouros, copas, espadas
e paus). Seja o experimento em que se retira uma carta aleatoriamente, observando seu naipe, n
umero
e/ou cor (vermelha ou preta). Considere os seguintes eventos e calcule o que se pede:
A = {a carta retirada e
as};
V = {a carta retirada e vermelha} e
E = {a carta retirada e de espada}.
a) P (A), P (V ) e P (E).
P (V ) e P (E).
b) P (A),
c) P (A V ), P (A E) e P (V E).
c) P (A V ), P (A E) e P (V E).
d) P (A|V ) . Os eventos A e V s
ao independentes?
e) P (V |E). Os eventos V e E s
ao independentes?
2. Suponha que estamos interessados em determinar a probabilidade de uma mulher que engravidou ter
um menino. Em um pas foram registrados 4.065.014 nascimentos, dos quais 2.081.287 foram meninos e
1.983.727 foram meninas. Se desta populacao escolhermos 3 mulheres e supormos que haja independencia
entre o sexo das criancas nascidas, qual e a probabilidade de que as tres criancas sejam meninas?
3. Suponha que voce retire de um baralho, aleatoriamente, duas cartas do seguinte modo: retira uma,
observa seu naipe, n
umero e cor, e a coloca de volta. Em seguida, retira a segunda carta, observa seu
naipe, n
umero e cor, e a coloca de volta. Sejam os eventos:
A1 = {a primeira carta retirada e um
as} e A2 = {a segunda carta retirada e um as}.
a) Sem fazer c
alculos, voce acha que os eventos A1 e A2 sao independentes? Ou seja, voce acha que o
fato da primeira carta retirada ter sido um as altera a probabilidade de que a segunda carta seja um as?
b) Ent
ao, qual e o valor de P (A2 |A1 )?
c) Qual e a probabilidade das duas cartas retiradas serem ases? Ou seja, calcule P (A1 A2 ).
4. Numa determinada cidade a probabilidade de nascer um menino, P (M ), e igual a duas vezes a
probabilidade de nascer uma menina, P (F ). Considerando cinco maes gravidas nesta cidade, determinar
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
55
Estatstica B
asica
6 PROBABILIDADE
a probabilidade:
a) de que n
ao nasca menina.
b) de que nascam 1, 2 ou 3 meninas.
c) de que nascam mais de duas meninas.
5. Suponha que foram selecionados cinco indivduos da populacao de pacientes picados com agulha
infectada com hepatite B. Sabendo que a probabilidade de que um indivduo desenvolva a doenca e 30%,
calcule:
a) A probabilidade de que pelo menos tres indivduos desenvolvam a hepatite B.
b) A probabilidade de que no m
aximo um paciente desenvolva a doenca.
6.6.2
Exerccios extras
1. Lancamos dois dados honestos. Qual a probabilidade de se obter uma soma de pontos nao inferior
a 10?
2. Dois dados, um verde e um vermelho sao lancados. Seja o conjunto dos pares (a, b) em que a
representa o n
umero do dado verde e b do dado vermelho. Descreva os eventos:
a) A: ocorre 3 no dado verde;
b) B: ocorrem n
umeros iguais nos dois dados;
c) C: ocorre n
umero 2 em ao menos um dado;
d) D: ocorrem n
umeros cuja soma e 7;
e) E: ocorrem n
umeros cuja soma e menor que 7.
3. Um n
umero e escolhido ao acaso entre os 20 inteiros. De 1 a 20. Qual a probabilidade de o n
umero
escolhido:
a) ser par;
b) ser mpar;
c) ser primo;
d) quadrado perfeito.
4. Sejam A, B e C tres eventos:
A = {1,2,3,4,5}; B = {4,5,6,7}; C = {5,9} e = {1,2,3,4,5,6,7,8,9,10}
Calcule as probabilidade para os eventos A, B e C.
a) nenhum dos tres eventos ocorre
b) pelo menos um dos tres ocorre
c) somente A ocorre (B e C n
ao ocorrem)
d) exatamente um dos eventos ocorre
e) A e B ocorrem, mas C n
ao ocorre
f) os tres eventos ocorrem
g) exatamente dois dos eventos ocorrem
h) pelo menos dois eventos ocorrem
i) no m
aximo dois eventos ocorrem
j) no m
aximo um evento ocorre
5. Uma urna contem 3 bolas brancas, 2 vermelhas e 5 azuis. Uma bola e escolhida ao acaso na urna.
Qual a probabilidade de a bola escolhida ser:
a) branca
b) vermelha
c) azul.
6. Considere dois eventos A: u
lcera peptica e B: estresse constante. Qual o significado de P (A|B)?
Explique claramente a diferenca entre P (A|B) e P (B|A).
7. Um dado e lancado e o n
umero da face de cima e observado.
a) se o resultado obtido for par, qual a probabilidade de ele ser maior ou igual a 5?
b) se o resultado obtido for maior ou igual a 5, qual a probabilidade de ele ser par?
c) se o resultado obtido for mpar, qual a probabilidade de ele ser menor que 3?
d) se o resultado obtido for menor que 3, qual a probabilidade de ele ser mpar?
8. Considere dois eventos, A ={atirador A acerta o alvo} e B ={atirador B acerta o alvo}. Se os
atiradores A e B atiram simultaneamente em um alvo, com P (A) = 0,51 e P (B) = 0,32, pede-se:
a) Qual e a probabilidade do alvo ser atingido quando os eventos A e B sao independentes?
b) Qual e a probabilidade do alvo ser atingido quando os eventos A e B sao mutuamente exclusivos?
9. Um pesquisador querendo testar a germinacao das ervilhas (amarelas e verdes) plantou 500 sementes
obtendo os resultados apresentados a seguir:
56
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
Cor
Total
Amarela Verde
Sim
25
40
65
N
ao
225
210
435
Total
250
250
500
Sejam os eventos: A: a ervilha plantada germina; B: a ervilha e amarela e C: a ervilha e verde.
Pede-se descrever e determinar as probabilidades:
Germinac
ao
e) P (A C)
f) P (A|B)
g) P (C|A)
h) P (C|B)
a) P (A)
b) P (B)
c) P (C)
d) P (A B)
10. Uma experiencia consiste em retirar, sucessivamente, 3 cartas de um baralho comum bem embaralhado. Sejam A a ocorrencia de um rei na primeira retirada; B a ocorrencia de um rei na segunda e
C a de um rei na terceira. Exponha em palavras, o significado de cada um dos seguintes smbolos:
;
a) P (A B);
d) P C|(A B)
B
e C;
b) P (A B);
e) A,
C).
f) P (A B B
c) A + B;
11. Um dado ser
a lancado 5 vezes.
a) Qual a probabilidade que saia a face 1 nos 5 lancamentos?
b) Qual a probabilidade que a mesma face (qualquer uma) apareca nos 5 lancamentos?
12. No cruzamento de ervilhas amarelas homozigotas (AA) com ervilhas verdes homozigotas (aa) ocorrem
ervilhas amarelas heterozigotas (Aa). Se estas ervilhas forem cruzadas entre si, ocorrem ervilhas amarelas
e verdes, na proporc
ao de tres para uma. Suponha que foram pegas, ao acaso, tres ervilhas resultantes
do cruzamento de ervilhas amarelas heterozigotas. Qual a probabilidade de as tres serem verdes?
13. No cruzamento de pais hemoflicos (aa) com pais nao hemoflicos (AA) ocorrem filhos nao hemoflicos
(Aa). Se estes filhos forem cruzados com outros filhos (Aa), ocorrem netos hemoflicos e nao hemoflicos.
Suponha que foram pegos, ao acaso, tres netos resultantes destes cruzamentos. Qual a probabilidade de:
(nota: os hemoflicos s
ao do tipo aa)
a) os tres serem hemoflicos
b) os tres serem n
ao hemoflicos
c) o primeiro ser hemoflico e os outros dois nao
d) nenhum ser hemoflico.
1
14. A probabilidade de que um certo aluno resolva um problema e P (A) = a de que outro aluno resolva
2
1
1
e P (B) = e de que um terceiro resolva e P (C) = . Supondo independencia, qual e a probabilidade
3
4
de que:
a) os tres resolvam o problema;
b) ao menos um resolva o problema;
c) o primeiro aluno resolva e os demais n
ao.
15. Um produtor de sementes vende pacotes com 20 sementes cada. Os pacotes que apresentarem mais
de uma semente sem germinar s
ao indenizados. A probabilidade de uma semente germinar e 0,98.
a) Qual e a probabilidade de que um pacote nao seja indenizado?
b) Se o produtor vender 1.000 pacotes, em quantos pacotes se espera indenizar?
7
7.1
DE PROBABILIDADE
DISTRIBUIC
AO
Vari
avel aleat
oria
Uma vari
avel aleat
oria (va) e uma variavel qualquer que associa a cada evento do espaco amostral um n
umero real (ou uma serie de n
umeros). Como cada evento de um espaco amostral esta associado
a uma probabilidade, cada um dos possveis valores da variavel aleatoria tambem estara.
O conjunto de valores que pode assumir uma variavel aleatoria e denominada domnio da
vari
avel aleat
oria. As vari
aveis aleat
o
rias serao representadas por letras mai
usculas: X, Y, Z e os valores
x1 , x2 , x3 , . . .
y1 , y2 , y3 , . . .
que assumem por letras min
usculas:
z1 , z2 , z3 , . . .
Alguns smbolos ser
ao usados para representar a probabilidade de uma variavel aleatoria:
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
57
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
Distribui
c
ao de probabilidade ou fun
c
ao de probabilidade
Uma distribuic
ao de probabilidade e uma funcao que relaciona os valores que assume uma
vari
avel aleat
oria discreta e suas respectivas probabilidades de ocorrencia.
f : x P (X = x)
A distribuic
ao de probabilidade pode ser representada na forma de uma tabela, na forma de
uma func
ao (f
ormula matem
atica), ou na forma de um grafico e esta relacionada a uma variavel aleatoria
discreta.
15
58
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
2 3
3
=
;
5 4
10
P (V, V ) =
3 2
3
=
.
5 4
10
0
1
2
3
3
1
P (X = x)
10 5 10
Exemplo 2: Considerando o exemplo 2 anterior, na variavel Y : n
umero de bebes do sexo feminino, observou-se que Y = {0, 1, 2, 3}. Naquele espaco amostral a cada evento a probabilidade de
1
ocorrencia era igual a . Entranto, e necessario observar que para Y = 0 ha um evento, para Y = 1 h
a
8
tres eventos, para Y = 2 h
a tres eventos e para Y = 3 ha um evento. Considerando isto, a distribuic
ao
de probabilidade da vari
avel aleat
oria Y e:
X
Y
P (Y = y)
7.2.1
0
1
8
1
3
8
2
3
8
3
1
8
Propriedades
1. P (X = xi ) 0;
2.
n
X
P (X = xi ) = 1
i=1
7.2.2
M
edia e vari
ancia de uma vari
avel aleat
oria discreta
n
X
1. Media de uma v. a. discreta X: X =
xi P (X = xi );
i=1
2
2. Vari
ancia de uma v. a. discreta X: X
=
n
X
2
xi P (X = xi ) 2X .
i=1
n
X
yi P (Y = yi ) = y1 P (Y = y1 ) + y2 P (Y = y2 ) + y3 P (Y = y3 )
i=1
=
Y2
i=1
2
y1 P (Y = y1 ) + y22 P (Y = y2 ) + y32 P (Y = y3 ) 2Y
= 02 1/8 + 12 3/8 + 22 3/8 + 32 1/8 (1,5)2 = 3/4 = 0,75 (bebe do sexo feminino)2
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
59
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
7.2.3
Distribui
c
ao binomial
E a distribuic
ao de probabilidade relacionada aos ensaios de Bernoulli. Lembre-se que para ser
um ensaio de Bernoulli um experimento tem que possuir as seguintes caractersticas:
Acontecer n repetic
oes independentes;
Apresentar apenas dois resultados possveis (sucesso e fracasso) em cada repeticao.
Por se tratar de uma distribuicao de probabilidade teorica pode-se representa-la por meio de
uma tabela e, o mais comum, por meio de uma formula denominada funcao de probabilidade:
P (X = x) = Cn,x px q nx
Em que:
x = 0, 1, . . . , n;
Cn,x =
n!
;
x!(n x)!
n: e o n
umero de repetic
oes no experimento;
x: e o n
umero de sucessos de interesse;
p: e a probabilidade de ocorrer um sucesso;
q: e a probabilidade de ocorrer o fracasso - q = 1 p.
A vari
avel aleat
oria X: n
umero de sucessos em n repetic
oes de um experimento de Bernoulli
possui distribuic
ao binomial, cuja notac
ao e X Bin(n, p) e apresenta:
media: X = n p;
2
= n p q.
vari
ancia: X
d) P (X 2)
1 P (X < 1)
1 P (X = 0)
P (X = 0) + P (X = 1) + P (X = 2)
= P (X = 0) + P (X = 1) + P (X = 2)
=
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
7.2.4
Distribui
c
ao Poisson
x e
, x = 0, 1, 2, 3 . . .
x!
Em que:
: e n
umero medio de elementos que ocorrem no intervalo (ou superfcie ou volume);
e = 2,718281 . . . (n
umero neperiano);
x: n
umero de ocorrencia ou sucessos.
A vari
avel aleat
oria X: n
umero de elementos (ou indivduos) que ocorrem em um intervalo de
tempo, ou em uma superfcie, ou em volume determinado possui:
media: X = n p = ;
2
vari
ancia: X
= .
4
X
2,75x e2,75
x!
x=0
2,750 e2,75
2,751 e2,75
2,752 e2,75
2,753 e2,75
2,754 e2,75
P (X 4) =
+
+
+
+
0!
1!
2!
3!
4!
P (X 4) = 00639 + 0,1758 + 0,2417 + 0,2216 + 0,1523 = 0,8554
c) P (X 6) = 1
5
X
2,75x e2,75
x!
x=0
P (X 6) = 1 [P (X 4) + P (X = 5)]
2,755 e2,75
P (X 6) = 1 0,8554 +
5!
P (X 6) = 1 [0,8554 + 0,0838] = 1 0,9392 = 0,0608
Exemplo 2: Seja X uma vari
avel aleatoria que representa o n
umero de bebes em um grupo de
2.000 que morre antes de atingir o primeiro aniversario. Nos EUA, esta probabilidade e 0,0085.
a) Qual e o n
umero medio de bebes que morre em um grupo desse tamanho?
b) Qual a probabilidade de que no m
aximo cinco bebes dentre 2.000 morram em seus primeiros anos de
vida?
Soluc
ao:
a) O n
umero medio e representado por = = n p = 2.000 0,0085 = 17
b) P (X 5) =
5
X
17x e17
x=0
UNIFAL-MG/Alfenas
x!
Profs. Fl
avio Bittencourt/Adriana Dias
61
Estatstica B
asica
P (X 5) =
DE PROBABILIDADE
7 DISTRIBUIC
AO
170 e17
171 e17
172 e17
173 e17
174 e17
175 e17
+
+
+
+
+
0!
1!
2!
3!
4!
5!
P (X 5) = 4,1 1008 + 7,0 1007 + 5,9 1006 + 3,3 1005 + 0,0001 + 0,0004 = 0,0006
7.2.5
Exerccios
0) Determine para cada experimento a variavel de interesse e os valores que a variavel pode assumir:
a) Uma urna contem 12 bolas, sendo 3 vermelhas, 4 brancas e 5 azuis. Retira-se duas bolas aleatoriamente
desta urna sem reposic
ao.
Soluc
ao: Uma vari
avel de interesse pode ser X: n
umero de bolas vermelhas extradas sem reposic
ao de
uma urna contendo 12 bolas
Os valores que a vari
avel X assume: 0, 1, 2, ou seja, X = {0, 1, 2}.
b) Uma urna contem 12 bolas, sendo 3 vermelhas, 4 brancas e 5 azuis. Retira-se tres bolas aleatoriamente
desta urna sem reposic
ao.
c) Uma urna contem 12 bolas, sendo 3 vermelhas, 4 brancas e 5 azuis. Retira-se duas bolas aleatoriamente
desta urna com reposic
ao.
d) Em uma maternidade h
a 4 m
aes em trabalho de parto e observa-se o sexo dos nascidos.
1) Considerando tres m
aes em trabalho de parto e que um pesquisador nao conhece o sexo dos bebes:
a) Determinar a distribuic
ao de probabilidades do n
umero X de meninos nascidos.
b) P (1 X 3).
c) P (X > 2).
n
X
d) Mostre que
P (X = x) = 1.
x=0
2) Numa determinada cidade a probabilidade de nascer um menino, P (M ), e igual a duas vezes a probabilidade de nascer uma menina, P (F ). Considerando cinco maes gravidas nesta cidade:
a) Determinar a distribuic
ao de probabilidades do n
umero X de meninas nascidas.
b) P (1 X 3).
c) P (X > 2).
n
X
d) Mostre que
P (X = x) = 1.
x=0
3) Determinar a probabilidade de, em dois lances de um par de dados honestos, obter-se um total de 11
pontos: a) uma vez; b) duas vezes. (R: a)17/162; b)1/324.)
4) Suponha que haja em media 2 suicdios por ano numa populacao de 50 000. Em uma cidade de 100.000
habitantes, encontre a probabilidade de que em um dado ano tenha havido: a) 0; b) 1; c) 2; d) 2 ou mais
suicdios. (R: a)0,0183; b)0,0732; c)0,1464; d)0,9085.)
5) O n
umero de casos de tetano registrado nos Estados Unidos durante um u
nico mes, em 1989, tem
uma distribuic
ao de Poisson com par
ametro = 4,5.
a) Qual e a probabilidade de que exatamente um caso de tetano seja registrado durante um determinado
mes?
b) Qual o n
umero medio de casos de tetano registrado no perodo de um mes? Qual e o desvio padrao?
6) Num teste de 5 quest
oes do tipo classificar a sentenca como verdadeira ou falsa qual a probabilidade
de um candidato que responde a todas ao acaso: a) acertar somente a primeira questao? b) acertar
somente uma das quest
oes? c) acertar todas as questoes?
7) A media do n
umero de acidentes por mes em certa intersecao e tres. Qual e a probabilidade de que,
em qualquer mes dado, (a) quatro acidentes ocorram nessa intersecao? e (b) Qual e a probabilidade de
que mais de quatro acidentes ocorram em um dado mes na intersecao?
8) Seja X uma vari
avel aleat
oria que representa o n
umero de bebes em um grupo de 2000 que morre
antes de atingir o primeiro anivers
ario. Nos Estados Unidos, a probabilidade de que uma crianca morra
durante o primeiro ano de vida e 0,0085.
a) Qual e o n
umero medio de bebes que morre em um grupo desse tamanho?
b) Qual a probabilidade de que no m
aximo cinco bebes dentre 2000 morram em seus primeiros anos de
vida?
c) Qual a probabilidade de que entre 15 e 20 bebes morram em seus primeiros anos de vida?
9) A sndrome de Aspen afeta 1 em cada 1.000 indivduos. Numa populacao de 2.500 indivduos, determine a probabilidade de encontrar:
a) menos de 2 indivduos com a sndrome.
b) mais de um indivduo com a sndrome.
62
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
7.2.6
Exerccios Extras
1) Um vendedor de ap
olice de seguros vende a 5 homens, todos da mesma idade e de boa sa
ude. De
acordo com as tabelas atuariais, a probabilidade de um homem, dessa idade particular, estar vivo daqui
a 30 anos e de 2/3. Determinar a probabilidade de estarem ainda vivos daqui a 30 anos: a) todos os 5
homens; b) apenas 2; c) pelo menos 1 homem. (R: a)32/243; b)40/243; c)242/243.)
2) Suponha que a media do n
umero de peixes que rompem uma barreira seja de 5 por minuto. Qual e a
probabilidade de que 10 peixes ultrapassam a barreira durante o primeiro minuto?
3) Uma prova e composta por 10 testes de m
ultipla escolha. Cada teste contem 5 alternativas, das quais
uma, e apenas uma, e correta. Qual a probabilidade de que um candidato, respondendo todas ao acaso,
acerte apenas uma quest
ao?
4) Ana vai de
onibus onde trabalha todos os dias. Ela sabe que, em media, passam 3 onibus para la no
intervalo de meia hora. Hoje e dia de uma cirurgia e ela nao pode se atrasar. Sabendo que a variavel
X e o n
umero de
onibus que vai para o seu trabalho no intervalo de meia hora e que segue distribuic
ao
Poisson, encontre a probabilidade:
a) de Ana n
ao chegar a tempo.
b) de Ana chegar a tempo.
5) Suponha que foram selecionados cinco indivduos da populacao de pacientes picados com agulha
infectada com hepatite B. Sabendo que a probabilidade de que um indivduo desenvolva a doenca e 30%,
calcule:
a) A probabilidade de que pelo menos tres indivduos desenvolvam a hepatite B.
b) A probabilidade de que no m
aximo um paciente desenvolva a doenca.
6) A probabilidade de Jo
aozinho ganhar um jogo de xadrez contra Mariazinha e 1/3. Qual a probabilidade
de Jo
aozinho ganhar ao menos 1 jogo em um total de 3 jogos?
7) Quais s
ao as probabilidades de obterem-se 9 pontos, em seis lances de um par de dados: a) duas vezes;
b) pelo menos 2 vezes. (R: a)61.440/531.441; b)72.689/531.441.)
7.3
Distribui
c
ao normal
Na sec
ao sobre probabilidade p
ode-se notar que os experimentos estudados estao relacionados
` vari
a
aveis qualitativas e vari
aveis quantitativas discretas. Por exemplo, no lancamento de um dado os
valores observados s
ao discretos; no lancamento de uma moeda os resultados observados sao qualitativos
nominais (cara ou coroa); na extrac
ao de bolas de uma urna, a variavel e qualitativa nominal e assim por
diante.
Nas situac
oes anteriores bastava associar o n
umero de elementos de interesse com o n
umero de
elementos do espaco amostral para encontrar a probabilidade procurada. Por outro lado, quando a caracterstica a ser observada (evento de interesse) se tratar de uma variavel contnua (dados antropometricos,
por exemplo) para calcular as probabilidades desejadas e necessario adotar um modelo matematico para
estimar as soluc
oes.
A curva normal, tambem denominada de distribuicao normal, e uma funcao matematica muito
utilizada porque a maioria dos experimentos pode ser modelado por esta funcao. A sua formula e dada
por:
(x)2
1
< x < +
f (x) = e 22 ,
2
Em que:
representa a media da distribuic
ao;
representa o desvio padr
ao da distribuicao;
e e s
ao constantes irracionais, sendo = 3,1415 . . . e e = 2,7182 . . .;
x e o valor assumido pela vari
avel X.
Na Figura 21 est
ao representadas curvas normais com diferentes valores de e nas quais
pode-se observar: (a) curvas normais com diferentes valores de e valores iguais de ; (b) curvas normais
com mesmo valor de e diferentes valores de e (c) diferentes e .
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
63
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
Figura 21 Distribuic
oes normais com diferentes valores para e
7.3.1
C
alculo de probabilidades
Por se tratar de
areas, n
ao h
a sentido calcular a area formada por f (a), ou seja x = a, pois
neste ponto forma-se apenas uma semirreta de x = a ate f (x), por definicao uma semirreta nao tem
espessura, s
o comprimento, logo P (X = a) = 0.
Considerando a e b, sendo a < b , valores de uma variavel X, tem-se:
Z b
P (a X b) = P (a < X < b) = P (a X < b) = P (a < X b) =
f (x) dx representa a
a
a, ou a
area sob a curva limitada por a e +;
Z a
P (X a) = P (x < a) =
f (x) dx representa a probabilidade de x ser um valor menor do a,
ou a
area sob a curva limitada por e a.
Condi
c
oes para que uma fun
c
ao seja fun
c
ao densidade de probabilidade
1. f (x) 0;
Z +
2.
f (x) dx = 1.
7.3.3
A distribui
c
ao normal: informa
c
oes adicionais
A distribuic
ao normal e a mais importante distribuicao de probabilidade contnua. Quando uma
vari
avel se distribui segundo uma distribuicao normal usa-se expressar em smbolos como X N (, ),
cuja leitura e: X segue distribuic
ao normal com media e desvio padrao .
64
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
A distribuic
ao normal apresenta algumas
caractersticas (MUITO IMPORTANTE ISSO!)
que devem ser lembradas constantemente:
a curva possui a forma de sino;
e uma curva simetrica em ;
a
area sob a curva e igual a 1.
7.3.4
C
alculo de probabilidades de vari
aveis normais
7.3.5
Distribui
c
ao normal padronizada ou distribui
c
ao normal padr
ao
E uma distribuic
ao de probabilidade que apresenta as mesmas caractersticas de uma distribuic
ao normal qualquer, sendo a caracterstica mais importante a de apresentar media = 0 e desvio padr
ao
= 1. Qualquer distribuic
ao normal com media e desvio padrao conhecidos pode ser transformada
em uma distribuic
ao normal padronizada. A vantagem e que com isto a probabilidade pode ser consultada
em uma tabela ao inves de se ter que calcular manualmente.
A transformac
ao da vari
avel X N (, ), em uma variavel Z, Z N ( = 0, = 1), sendo Z
denominada de vari
avel normal padronizada com media zero e desvio padrao 1, e dada por:
x
;
Z N (0,1)
z=
Sendo:
z: valor da vari
avel Z;
x: valor da vari
avel X a ser padronizado;
: media da vari
avel normal X;
: desvio padr
ao da vari
avel X.
Voltando ao problema de calcular a probabilidade de P (X > 190), sendo X N ( = 170, = 10),
basta realizar o c
alculo:
z=
x
190 170
=
=2
10
Figura 25 P (Z > 2)
Profs. Fl
avio Bittencourt/Adriana Dias
65
Estatstica B
asica
DE PROBABILIDADE
7 DISTRIBUIC
AO
Figura 26 Valor tabelado para P (Z > 2): area sob a curva para Z > 2
Portanto, P (Z > 2) = 0,0228 ou 2,28%
Exemplo 1: Continuando com os mesmos dados: X N (170,10), obtenha: P (154 < X < 171).
Soluc
ao:
Primeiramente e necess
ario padronizar os valores da vari
avel X:
171 170
154 170
z1 =
= 1,6 e z2 =
= 0,1
10
10
Logo,
P (154 < X < 171) = P (1,6 < Z < 0,1).
Portanto,
P (1,6 < Z < 0,1) = 0,5 P (Z < 1,6) + 0,5 P (Z > 0,1)
P (1,6 < Z < 0,1) = 1 [P (Z > 1,6) + P (Z > 0,1)]
P (1,6 < Z < 0,1) = 1 [0,0548 + 0,4602]
P (1,6 < Z < 0,1) = 0,4850
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
DE PROBABILIDADE
7 DISTRIBUIC
AO
Estatstica B
asica
Logo,
P (X > 330) = P (Z > 0,2) Portanto, P (Z > 0,2) = 0,4207 ou 42,07%.
b) inferior a 370 mL: P (X < 370)
370 320
= 1,0
Soluc
ao: z =
50
Assim:
P (X < 370) = P (Z < 1,0)
Portanto, P (Z < 1,0) = 1 P (Z > 1) = 1 0,1587 = 0,8413 ou 84,13%
c) entre 240 e 330 mL: P (240 < X < 330).
330 320
240 320
= 1,6 e z2 =
= 0,2
Soluc
ao: z1 =
50
50
Assim:
P (240 < X < 330) = P (1,6 < Z < 0,2)
P (1,6 < Z < 0,2) = 0,5 P (Z < 1,6) + 0,5 P (Z > 0,2)
P (1,6 < Z < 0,2) = 1 [P (Z > 1,6) + P (Z > 0,2)]
P (1,6 < Z < 0,2) = 1 [0,0548 + 0,4207] = 0,5245 ou 52,45%
d) entre 320 e 380 mL: P (320 < X < 380)
380 320
320 320
= 0 e z2 =
= 1,2
Soluc
ao: z1 =
50
50
Assim:
P (320 < X < 380) = P (0 < Z < 1,2)
Logo, P (0 < Z < 1,2) = [P (Z > 0) P (Z > 1,2)]
P (0 < Z < 1,2) = [0,50 0,1151] = 0,3849 ou 38,49%
a) P (Z > 0,2)
b) P (Z > 1,0)
7.3.6
Exerccios
0) Observando a vari
avel relacione assinalando com um X a sua classificacao.
Classificacao
Qualitativa
Quantitativa
Nominal Ordinal Discreta Contnua
Vari
avel
Cor da pele
Idade em anos
Grau de desnutric
ao
Peso de recem-nascidos
N
umero de leitos no hospital
Classe social (A, B, C, ...)
Sexo
N
umero de casos de c
ancer de mama
N
umero de homens com enfisema pulmonar
Tipagem sangunea
Nome de vacinas
N
umero de partos num determinado municpio
Altura de um grupo de pessoas
Temperatura corporal
Dist
ancia percorrida por um maratonista
N
umero de bacterias numa placa de petri
N
umero de c
aries
Circunferencia cef
alica
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
67
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
1) Suponha que X seja distribuda, normalmente, com uma media de 10 e um desvio padrao de 2.
Determine o seguinte:
a) P (X < 13)
b) P (X > 9)
c) P (6 < X < 14)
d) P (2 < X < 4)
2) Dentre as mulheres dos Estados Unidos de 18 a 74 anos, a pressao sangunea diastolica e normalmente
distribuda com media = 77 mm Hg e desvio padrao = 11,6 mm Hg.
a) Qual e a probabilidade de que uma mulher selecionada aleatoriamente tenha pressao sangunea diast
olica menor que 60 mm Hg?
b) Qual a probabilidade de que ela tenha pressao sangunea diastolica maior do que 90 mm Hg?
c) Qual a probabilidade de que ela tenha pressao sangunea diastolica entre 60 e 90 mm Hg?
3) Suponha que o tempo de coagulac
ao em seres humanos seja uma variavel aleatoria com distribuic
ao
normal, sendo a media igual a 7 minutos e desvio padrao 1 minuto. Em um exame hematologico qualquer,
determine a probabilidade de que um indivduo apresente tempo de coagulacao:
a) entre 8 e 9 minutos.
b) mais de 7 minutos e 45 segundos.
4) A quantidade de
agua destilada produzida por certa maquina tem distribuicao normal com valor
medio de 64 oncas e desvio padr
ao de 0,78 onca. Qual o volume x do recipiente que assegurara que ocorra
transbordamento em apenas 0,5% das vezes? Ou seja, qual o valor de x tal que P (X > x) = 0,005?
5) A vida u
til de centrfugas e de 1,5 ano, com desvio padrao de 0,3 ano. Se os defeitos distribuemse normalmente, que percentagem das centrfugas vendidas necessitara de conserto antes de expirar o
perodo de garantia de um ano, ou seja P (X < 1)?
6) Determine o valor de z nas situac
oes seguintes:
a) P (Z > z) = 0,004
b) P (Z > z) = 0,025
c) P (Z > z) = 0,03
d) P (Z > z) = 0,04
e) P (Z > z) = 0,05
f) P (Z > z) = 0,15
7) Determinar a
area limitada pela curva normal em cada um dos casos.
a) Entre z = 0 e z = 1,2
b) Entre z = 0,68 e z = 0
c) Entre z = 0,46 e z = 2,21
d) Entre z = 0,81 e z = 1,94
` esquerda de z = 0,6
e) A
`
f) A direita de z = 1,28
` direita de z = 2,05 e `
g) A
a esquerda de z = 1,44
8) Determinar os valores de z, os quais se referem `as areas limitadas pela curva normal, em cada um dos
casos: a) a
area entre 0 e z e 0,3770; b) a
area `a esquerda de z e 0,8621; c) a area entre 1,5 e z e 0,0217.
(Resp: a)1,16; b)1,09; c)1,35)
9) Considere uma vari
avel aleat
oria X N (40,15). Encontre as probabilidades:
a) P (X < 43)
b) P (X > 46)
c) P (38 X 42)
d) P (X < 30)
e) Qual e o valor de X que tem 80% de
area acima dele?
8
8.1
TEORIA DA ESTIMAC
AO
Introdu
c
ao
Ao estudar tecnicas de amostragem foi possvel notar que de uma populacao de tamanho N
pode-se obter amostras de tamanho n com diferentes elementos.
Exemplo: Considere uma populacao composta por N = 6 indivduos: A, B, C, D, E e F cujos
valores da vari
avel de interesse X s
ao: 2, 3, 6, 8, 11 e 18, respectivamente. Suponha que serao realizados
2 sorteios de tamanho n = 2 por diferentes pesquisadores. Um pesquisador podera sortear os indivduos
A e E, cujos valores s
ao: 2 e 11. O outro podera sortear C e E, com valores 6 e 11.
Como p
ode ser observado, mesmo que as amostras possuam o mesmo tamanho, n = 2, os
elementos de uma amostra n
ao s
ao necessariamente iguais aos da outra amostra, de tal maneira que as
estimativas da media, vari
ancia, proporc
ao etc obtidas em cada uma das amostras podem ser diferentes
entre elas e em relac
ao aos par
ametros da populacao.
68
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
Mas por que trabalhar com amostras? O principal objetivo e extrair informacoes sobre os
par
ametros desconhecidos da populac
ao. Suponha, por exemplo, que se quer chegar a uma conclusao sobre
a proporc
ao de eleitores que votar
ao em um candidato para a reitor. Seria inadequado e impossvel coletar
informac
oes de todos os eleitores para calcular o parametro p que representa a proporcao populacional;
ao inves disso, uma amostra aleat
oria de eleitores e selecionada e a proporcao p de eleitores que votar
ao
no candidato e calculada; esse valor p e usado para fazer uma inferencia relacionada com a verdadeira
proporc
ao p.
8.2
Distribui
c
ao de amostragem
Considerando todas as amostras possveis de tamanho n (com ou sem reposicao) que podem ser
extradas de uma populac
ao de tamanho N , para cada uma destas amostras pode-se calcular a media, o
desvio padr
ao, a proporc
ao etc, que ir
a variar (ou nao) de amostra para amostra. Desse modo, obtem-se
uma distribuic
ao da grandeza que e denominada de distribuicao amostral ou distribuicao de amostragem.
Se, por exemplo, a grandeza estatstica particular adotada for a media da amostra, a distribuic
ao
e denominada distribuic
ao amostral das medias. Por conseguinte, pode-se ter a distribuicao das variancias,
das proporc
oes etc.
Dessas distribuic
oes amostrais, pode-se obter a media, a variancia, a proporcao etc. Em consequencia disso, pode-se falar em desvio padrao ou media da distribuicao amostral, seja ela das medias,
ou das vari
ancias, ou das proporc
oes etc.
Mas qual e o objetivo de se obter a distribuicao de amostragem de uma populacao? A distribuic
ao amostral faz a ligac
ao entre a estatstica descritiva e a inferencia estatstica. Conhecendo-se a
distribuic
ao amostral de um par
ametro (seja media, desvio padrao, proporcao etc) e usando a inferencia
estatstica pode-se obter conclus
oes sobre o parametro populacional desconhecido usando as informacoes
da amostra.
A distribuic
ao amostral de uma estatstica (media, desvio padrao, proporcao etc) e feita considerando-se todas as amostras possveis de tamanho n obtidas de uma populacao e as estimativas da estatstica adotada. Portanto, s
ao v
arias as distribuicoes amostrais, sendo que serao abordadas apenas a das
medias e a das proporc
oes.
8.2.1
Distribui
c
ao amostral das m
edias
1
2 =
N
N
X
x2i
i=1
N
X
!2
xi
i=1
3
1 X
x2i
=
3
i=1
3
X
!2
xi
i=1
1
62
2
14
=
=
3
3
3
Obs.: Ser
ao usados e 2 pois os dados s
ao oriundos de uma populacao, sao parametros populacionais.
b) Confecione o gr
afico dos valores populacionais X = {1, 2, 3}.
Profs. Fl
avio Bittencourt/Adriana Dias
69
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
c) Apresente todas as amostras de tamanho n = 2 que podem ser obtidas com reposicao, determine a
media de cada valor da vari
avel em cada amostra.
Amostra
(A, A)
(A, B)
(A, C)
(B, A)
(B, B)
Media
2,5
2,0
2,5
3,0
d) Faca o gr
afico da distribuic
ao das medias.
e) Verifique que X = e X = para (c), ou seja que a medias das medias e igual `a media populacional
n
e que o erro padr
ao da media e igual `
a raz
ao entre o desvio padrao populacional e a raiz do tamanho da
amostra.
e denominada distribuic
X
ao amostral da media e para este caso NX = 9.
Para verificar que X = e necess
ario calcular a media das medias da tabela anterior. A media das
medias, X , e:
9
X
Xi
1,0 + 1,5 2 + 2,0 3 + 2,5 2 + 3,0
X = i=1
=
= 2 que e igual a = 2
9
9
2
A vari
ancia das medias X e dada por:
!2
NX
X
N
Xi
X
X
1
1
182
1
2
i=1
2
X =
Xi
39
=
=
9
NX i=1
NX
9
3
2
1
3
Assim, X
=
3
2
Como p
ode ser observado, X = e X = . Esta relacao nos remete ao Teorema do Limite
n
Central.
= =
n
8.2.2
O desvio padr
ao da distribuic
ao amostral das medias X e igual `a . Essa estatstica e conhecida
n
como erro padr
ao da media.
70
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
Com a condic
ao de que n seja suficientemente grande, a forma da distribuicao amostral e aproximadamente normal.
` medida que n aumenta, o histograma da distribuicao das medias amostrais vai se tornando
A
mais concentrado em torno da media populacional. Tambem, quando n for suficientemente grande a
distribuic
ao das medias vai se aproximando da distribuicao normal independente da distribuicao original
da populac
ao. Essa situac
ao e conhecida como teorema do limite central. Note que, `a medida que o
tamanho da amostra aumenta, a distribuicao das medias amostrais tende para uma distribuicao normal
X
e aproximadamente
com media e desvio padr
ao . Assim, a distribuicao de Z dada por Z =
n
n
normal com media 0 e vari
ancia 1.
Este resultado e extremamente importante, pois implica que muitas distribuicoes amostrais
podem ser modeladas pela curva normal, mesmo quando a populacao de origem nao e de forma alguma
normal. Qual e o tamanho n da amostra para que a curva normal seja um modelo apto para determinada
distribuic
ao amostral? Como sugere a Figura 31 em geral o teorema do limite central produz distribuicoes
mesmo quando os tamanhos amostrais sejam modestos.
aproximadamente normais para X
Uma ilustrac
ao do teorema do limite central pode ser visualizada na Figura 31 em que s
ao
consideradas 3 populac
oes com diferentes distribuicoes de probabilidades das quais foram obtidas todas
as amostras de tamanho n = 5, 10 e 30.
Figura 31 Distribuic
ao de probabilidade da populacao e distribuicoes amostrais para diferentes n
8.2.3
Distribui
c
ao amostral das propor
c
oes
Profs. Fl
avio Bittencourt/Adriana Dias
71
Estatstica B
asica
8 TEORIA DA ESTIMAC
AO
Fazendo a distribuic
ao de p tem-se a distribuicao amostral das proporcoes, cuja media e erro
padr
ao de p s
ao:
r
p(1 p)
p = p
e
p =
n
8.2.4
Exerccios
n
4) Seja X N ( = 80, 2 = 26). Dessa populacao retiramos uma amostra de n = 25. Calcular:
> 83)
a) P (X
82)
b) P (X
2X X
+ 2X
c) P X
5) Sabe-se que o peso de adultos possui media de 65 kg e desvio padrao de 10 kg. Num elevador est
a
escrito que ele suporta uma carga m
axima de 560 kg ou 8 pessoas. Qual e a probabilidade de que o
elevador tenha o seu limite ultrapassado por esse n
umero de pessoas? A especificacao do n
umero de
pessoas est
a correta?
6) Considere uma populac
ao de respostas de tres indivduos a respeito de uma pesquisa do tipo dicotomica,
cujos valores s
ao 0, 1 e 0. Apresente todas as amostras de tamanho n = 2 que podemrser obtidas com
p(1 p)
reposic
ao, determine o estimador p de cada amostra. Verifique que p = p e que p =
.
n
8.3
Estima
c
ao pontual
Estima
c
ao intervalar
A estimac
ao intervalar ou estimacao por intervalo fornece um intervalo de valores razoavel no
qual se presume que contenha o par
ametro de interesse com certo grau de confianca.
72
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
8.4.1
Intervalo de confian
ca para a m
edia de uma popula
c
ao normal com vari
ancia populacional 2 conhecida
.
Pelo teorema do limite central a` medida que o tamanho da amostra aumenta, a distribuic
ao
das medias amostrais tende para uma distribuicao normal com media e desvio padrao , ou seja,
n
.
Para uma vari
avel aleat
oria normal padronizada, 95% das observacoes se encontram entre 1,96
e 1,96. Ou seja, a probabilidade de que Z assuma um valor entre 1,96 e 1,96 e:
P (1,96 < Z < 1,96) = 0,95
A probabilidade acima pode ser representada na Figura 32, sendo mostradas, tambem, as areas
das caudas da curva.
Figura 32 Probabilidade da
area compreendida entre 1,96 e 1,96 e das caudas
Substituindo Z por
X
pode-se escrever:
Na express
ao acima, pode-se manipular a desigualdade dentro dos parenteses sem alterar a
afirmac
ao da probabilidade. Assim, multiplicando, os tres termos da desigualdade por , que e o erro
n
padr
ao da media, tem-se:
< 1,96
P 1,96 < X
= 0,95
n
n
obtem-se:
E por conseguinte subtraindo cada termo por X,
Profs. Fl
avio Bittencourt/Adriana Dias
73
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
est
a mais no centro da desigualdade e portanto a afirmacao da probabilidade se refere a . As quantidades
1,96 e 1,96 s
ao denominados limites de confianca de 95% para a media da populacao.
n
n
Se x
e a media de uma amostra aleatoria de tamanho n de uma populacao com variancia
conhecida 2 , um intervalo de confianca (IC) de 95% para e dado por:
IC95% () = x
1,96 , x
+ 1,96
n
n
Genericamente um intervalo de confianca para pode ser representado por:
IC1 () = x
z/2 , x
+ z/2
n
n
Em que:
1 e o nvel de confianca ou grau de confianca ou coeficiente de confianca;
e o nvel de signific
ancia;
z/2 e o valor de z que limita uma area de /2 na extremidade superior da distribuicao normal
padr
ao e z/2 e o valor de z que limita uma area de /2 na extremidade inferior da distribuicao16 .
Este intervalo significa que se forem retiradas muitas amostras de tamanho n de uma populacao,
1 intervalos de confianca ir
ao incluir o valor do parametro . Por exemplo, se observar 100 amostras
de tamanho n, se 1 = 0,95 e para cada uma dessas 100 amostras for calculado o intervalo de confianca,
aproximadamente 95 intervalos incluir
ao .
Exemplo: As distribuic
oes das pressoes sanguneas sistolicas e diastolicas para mulheres diabeticas entre 30 e 34 anos tem medias desconhecidas. Entretanto, seus desvios padrao sao s = 11,8 mmg Hg
e d = 9,1 mmg Hg, respectivamente.
a) Uma amostra aleat
oria de dez mulheres e selecionada dessa populacao. A pressao sangunea sistolica
media para a amostra e x
= 130 mmg Hg. Calcule um intervalo de confianca de 95% para s , a verdadeira
press
ao sangunea sist
olica media.
Resoluc
ao:
IC1 () = x
z/2 , x
+ z/2
n
n
11,8
11,8
, 130 + 1,96
IC95% () = 130 1,96
10
10
IC95% () = [122,69, 137,31]
H
c) A press
ao sangunea diast
olica media para a amostra de tamanho 10 e x
= 84 mmg Hg. Encontre um
intervalo de confianca de 90% para d , a verdadeira pressao sangunea diastolica media da populacao.
Resoluc
ao:
IC1 () = x
z/2 , x
+ z/2
n
n
9,1
9,1
IC90% () = 84 1,64 , 84 + 1,64
10
10
IC90% () = [79,28, 88,72]
16 z
/2 corresponde a um valor de z de modo que P (Z > z/2 ) = /2 e z/2 corresponde a um valor de z tal que
P (Z < z/2 ) = /2. Dado /2 busca-se na tabela o valor de z, ou seja de z/2 .
74
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
IC1 () = x
z/2 , x
+ z/2
n
n
9,1
9,1
IC99% () = 84 2,57 , 84 + 2,57
10
10
IC99% () = [76,60, 91,40]
H
8.4.2
Intervalo de confian
ca para a m
edia de uma popula
c
ao normal com vari
ancia populacional 2 desconhecida
x
A vari
avel Z = tem distribuicao normal. Quando a variancia populacional 2 nao e
n
x
2
conhecida, deve-se usar s , estimador de 2 . Consequentemente deve-se adotar a variavel T = s
n
para substituir a vari
avel Z.
A vari
avel T possui distribuic
ao t de Student com nvel de significancia e com (n 1) graus
de liberdade:
X
T =
t(, n1)
s
n
Quando n e grande, s2 se aproxima bastante de 2 , fazendo com que a variavel T se aproxime
da vari
avel Z. Por outro lado, quando n e pequeno, isso nao ocorre.
Tal qual a normal padronizada a distribuicao t de Student e unimodal, simetrica em zero, tem a
forma de sino e
area sob a curva e igual a 1. A distribuicao t tem uma propriedade denominada graus de
liberdade que medem o volume de informacao disponvel nos dados que podem ser usados para estimar
2 , por este motivo medem a confiabilidade de s2 como um estimador de 2 . Portanto, para cada possvel
valor de graus de liberdade h
a uma diferente distribuicao t.
Por exemplo, considerando os casos abaixo, pode-se observar que em cada situacao, t(, n1)
apresenta um valor diferente de t tabelado.
a) t(0,01; 20) = 2,528
b) t(0,025; 20) = 2,086
c) t(0,05; 20) = 1,725
d) t(0,01; 14) = 2,624
e) t(0,025; 14) = 2,145
f) t(0,05; 14) = 1,761
Semelhantemente, a probabilidade de que esteja contida num intervalo com 1 de confianca
quando a vari
ancia populacional e desconhecida e dado por:
s
s
P x
t(/2, n1)
<<x
+ t(/2, n1)
=1
n
n
Sendo adotada a seguinte notac
ao em forma de intervalo de confianca:
s
s
IC1 () = x
t(/2, n1) , x
+ t(/2, n1)
n
n
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
75
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
Em que:
1 e o nvel de confianca ou grau de confianca ou coeficiente de confianca;
e o nvel de signific
ancia;
t(/2, n1) e o valor que limita uma
area de /2 na extremidade superior da distribuicao t de Student
e t(/2, n1) e o valor que limita uma area de /2 na extremidade inferior da distribuicao;
(n 1) representa os graus de liberdade da distribuicao t.
Exemplo: As distribuic
oes das pressoes sanguneas sistolicas e diastolicas para mulheres diabeticas entre 30 e 34 anos tem medias desconhecidas.
a) Uma amostra aleat
oria de dez mulheres e selecionada dessa populacao. A pressao sangunea sistolica
media para a amostra e x
= 130 mmg Hg com desvio padrao s = 11,8 mmg Hg. Calcule um intervalo de
confianca de 95% para s , a verdadeira pressao sangunea sistolica media.
Resoluc
ao:
s
s
+ t(/2, n1)
IC1 () = x
t(/2, n1) , x
n
n
11,8
11,8
IC95% () = 130 2,262 , 130 + 2,262
10
10
IC95% () = [121,56, 138,44]
H
c) A press
ao sangunea diast
olica media para a amostra de tamanho 10 e x
= 84 mmg Hg apresentando
desvio padr
ao s = 9,1 mmg Hg. Encontre um intervalo de confianca de 90% para d , a verdadeira press
ao
sangunea diast
olica media da populac
ao.
Resoluc
ao:
s
s
IC1 () = x
t(/2, n1) , x
+ t(/2, n1)
n
n
9,1
9,1
IC90% () = 84 1,833 , 84 + 1,833
10
10
IC90% () = [78,73, 89,27]
H
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
8.4.3
Intervalo de confian
ca para uma propor
c
ao
r
p(1 p)
Anteriormente foi visto que p = p e p =
. Considere
n
P (z/2 < Z < z/2 ) = 1
onde:
Z=r
P p
p(1 p)
n
P P z/2
=1
< p < P + z/2
n
n
p =
Como o par
ametro p e desconhecido, considerando n grande, substitui-se o p sob o radical por
y
, podendo escrever:
n
!
r
r
p(1 p)
p(1 p)
P P z/2
< p < P + z/2
1
n
n
0,3012(1 0,3012)
; 0,3012 + 2,57
664
0,3012(1 0,3012)
664
Determina
c
ao do tamanho amostral
Em muitos casos antes de se fazer uma pesquisa nao se tem ideia de qual e o tamanho da
amostra necess
ario para estimar uma media, uma proporcao etc que lhe assegurara trabalhar com uma
certa margem de erro de estimac
ao.
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
77
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
Para calcular o tamanho amostral17 define-se qual e o erro de estimacao E e o nvel de confianca
(1) que se quer trabalhar. O nvel de confianca e a probabilidade de que o valor estimado do parametro
esteja correto. O erro de estimac
ao corresponde `a diferenca entre a media amostral e a verdadeira media da
populac
ao (ou entre a proporc
ao amostral e proporcao verdadeira). Os intervalos de confianca estudados
s
ao centrados em suas respectivas estimativas, sendo os limites inferior e superior definidos por diferenca
e soma entre a estimativa e o erro de estimacao. A esquematizacao dos intervalos de confianca est
a
apresentada na Figura 33.
n=
- quando o objetivo e determinar o tamanho da amostra para calcular o intervalo de
E2
confianca para media quando a vari
ancia populacional e conhecida;
t2(/2; n0 1) s20
- quando o objetivo e determinar o tamanho da amostra para calcular o intervalo
n=
E2
de confianca para media quando a variancia populacional e desconhecida;
2
z/2
p(1 p)
n=
- quando o objetivo e determinar o tamanho da amostra para calcular o intervalo
E2
de confianca para proporc
ao. Neste caso se tem a ideia de p obtida por meio de uma amostra piloto
ou observada em uma pesquisa similar. Quando nao se tem conhecimento de p adota-se p = 0,5
que fornece n m
aximo, pois p(1 p) 0,25.
Em que:
E: erro desejado definido pelo pesquisador; z/2 : valor tabelado da normal; 2 : variancia populacional;
s20 : vari
ancia da amostra piloto; n0 1: graus de liberdade da amostra piloto e p: proporcao amostral.
Pode-se ver que E e inversamente proporcional a n. Logo, quanto maior o tamanho da amostra
importante
menor ser
a o valor de E (largura menor) e, portanto, maior sera a precisao na estimacao. E
destacar que precis
ao e diferente de confianca.
Exemplo 1: De uma pesquisa passada sabe-se que o desvio padrao da altura de criancas da 5a
serie (6o ano) e de 5 cm. Que tamanho deve ter uma amostra para que o intervalo 150 0,98 cm tenha
95% de confianca?
Resoluc
ao:
Tem-se: E = 0,98 e z/2 = z0,025 = 1,96, assim:
2
z/2
2
1,962 52
n=
=
= 100 criancas.
2
E
0,982
H I H
Exemplo 2: Em um estudo para a determinacao do perfil dos veteranos de um colegio a caracterstica de maior interesse tem s0 = 0,3, obtida em uma amostra piloto de tamanho n0 = 20. Qual deve
ser o tamanho da amostra para que se tenha 95% de confianca de que o erro E = x
da estimativa de
17
78
H
a v
arias maneiras para calcular o tamanho de uma amostra.
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
8 TEORIA DA ESTIMAC
AO
Estatstica B
asica
Exerccios
Profs. Fl
avio Bittencourt/Adriana Dias
79
9 TEORIA DA DECISAO
Estatstica B
asica
TEORIA DA DECISAO
Introdu
c
ao
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
9 TEORIA DA DECISAO
Estatstica B
asica
9.2
H0 verdadeira
Erro tipo I
Decisao correta
H0 Falsa
Decisao correta
Erro tipo II
Mec
anica operacional dos testes de hip
oteses
Para a execuc
ao de um teste de hipoteses seguir os passos abaixo:
1. Formular as hip
oteses H0 e H1 segundo a natureza do problema em estudo;
2. Especificar o nvel de signific
ancia;
3. Estabelecer a estatstica (z, t, 2 ou F ) e calcular o seu valor que definira a decisao considerando
H0 verdadeira;
4. Fazer o desenho da distribuic
ao de probabilidade do teste, estabelecer a regiao crtica e concluir,
observando se o valor da estatstica pertence ou nao `a regiao crtica.
9.4
Teste de hip
oteses para uma m
edia de uma popula
c
ao normal quando a vari
ancia
populacional for desconhecida
Profs. Fl
avio Bittencourt/Adriana Dias
81
9 TEORIA DA DECISAO
Estatstica B
asica
n
amostra e 0 , considerando tc t com = n 1 graus de liberdade (gl) sob H0 .
O quarto e u
ltimo passo e a conclusao de acordo com o(s) valor(es) da regiao(oes) crtica(s). Se
o valor da estatstica pertencer `
a regi
ao crtica, rejeita-se H0 no nvel de significancia especificado, caso
contr
ario, n
ao se rejeita H0 .
Conforme a hip
otese formulada obtem-se as seguintes regioes crticas:
O terceiro passo e a obtenc
ao do valor da estatstica tc =
Figura 34 Regi
oes crticas conforme H1 : 6= 0 ; H1 : > 0 e H1 : < 0
Sendo que o ttab quando H1 : 6= 0 deve ser consultado na tabela da distribuicao t considerando ttab = t( 2 ; n1) e ttab = t( 2 ; n1) .
Enquanto que para H1 : > 0 e H1 : < 0 , ttab sera t(; n1) e t(; n1) , respectivamente.
Exemplo: Doze frascos de medicamento de certa marca acusam os seguintes conte
udos medios
em decilitros:
10,2 9,7 10,1 10,3 10,1 9,8 9,9 10,4 10,3 9,8 10,4 10,2
O fabricante afirma que o conteudo medio dos frascos e de 10 dL. Admitindo normalidade na distribuic
ao
dos conte
udos, teste a hip
otese do fabricante ao nvel de 5% de significancia.
Soluc
ao:
Dados:
0 = 10
12
X
xi
10,2 + . . . + 10,2
= 10,1
12
12
!
2
12
X
12
xi
1
X 2
i=1
2
s =
xi
= 0,06
12 1 i=1
12
x
=
s = 0,2449
n = 12
= 0,05 = = 0,025
2
ttab = t( 2 ; n1) = t0,025; 11) = 2,201 e ttab =
t(0,025; 11) = 2,201
1
ao das hip
oteses:
- Formulac
H0 : = 10
H1 : 6= 10
2 - Especificar :
= 0,05
3 - Calcular o valor da estatstica:
x
0
10,1 10
= 1,4145
tc =
=
s
0,2449
n
12
4 - Conclus
ao:
82
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
9 TEORIA DA DECISAO
Estatstica B
asica
Exerccios
1. Um fabricante de term
ometro garante que a vida u
til media de certo tipo de termometro e de no
mnimo 10 anos.
a) Determine a hip
otese nula e a alternativa.
b) Determine quando um erro tipo I ou II ocorre para um teste de hipotese da afirmacao.
c) Determine se o teste de hip
otese e unicaudal `a esquerda, `a direita ou bicaudal. Explique.
d) Como voce deve interpretar uma decis
ao que rejeita a hipotese nula?
e) Como voce deve interpretar uma decis
ao que nao rejeita a hipotese nula?
2. Um fabricante de sucos de caixinha afirma que a quantidade media de sodio em seus produtos e
menor do que 9,0 mg.
a) Determine a hip
otese nula e a alternativa.
b) Determine quando um erro tipo I ou II ocorre para um teste de hipotese da afirmacao.
c) Determine se o teste de hip
otese e unicaudal `a esquerda, `a direita ou bicaudal. Explique.
d) Como voce deve interpretar uma decis
ao que rejeita a hipotese nula?
e) Como voce deve interpretar uma decis
ao que nao rejeita a hipotese nula?
3. Uma f
abrica anuncia que o ndice de nicotina dos cigarros da marca Charuto apresenta-se abaixo de
26 mg por cigarro. Um laborat
orio realiza 10 analises do ndice obtendo: 26, 24, 23, 22, 28, 25, 27, 26, 28,
24. Sabe-se que o ndice de nicotina dos cigarros desta marca se distribui normalmente. Pode-se aceitar
a afirmac
ao do fabricante, ao nvel de 5%?
4. Um certo tipo de rato apresenta, nos tres primeiros meses de vida, um ganho medio de peso de 58 g.
Uma amostra de 10 ratos foi alimentada desde o nascimento ate a idade de 3 meses com uma rac
ao
especial, e o ganho de peso de cada rato foi: 55, 58, 60, 62, 65, 67, 54, 64, 62 e 68. Ha razoes para
crer, ao nvel de 5%, que a rac
ao especial aumenta o peso nos 3 primeiros meses de vida?
5. Suponha que um estudo em determinada regiao mostra que a ingestao diaria media de calorias em
adultos e de 2.400 kcal. Considere que um grupo de 25 adultos desta populacao apresentou um consumo
medio de 3.000 kcal, com um desvio padr
ao de 1.250 kcal. Para testar se o consumo calorico deste grupo
e diferente do padr
ao de consumo da populacao, use = 5% e conclua.
6. Considere o conjunto de dados formado pelas notas de 60 alunos que estudaram estatstica basica:
23
45
77
87
98
12
54
60
77
67
90
87
88
86
65
90
99
97
76
77
32
45
64
75
77
70
60
66
71
72
29
34
33
45
90
88
71
56
44
78
89
87
62
66
56
54
88
94
87
54
68
88
81
78
45
28
73
77
86
79
88821
40213
05547
45549
61088
04533
67555
20498
97452
23032
41280
06723
01293
53473
03404
99753
20353
58781
00572
64692
93914
74240
91598
86323
06361
27620
18550
55592
32518
32640
66248
46310
70990
97239
32127
31574
61105
16851
13918
05831
18735
15102
48564
11217
56574
23814
92221
65045
56086
86483
58748
32794
50105
38439
19450
77398
Profs. Fl
avio Bittencourt/Adriana Dias
83
9 TEORIA DA DECISAO
Estatstica B
asica
f) O professor da disciplina afirmou que a nota media dos seus alunos e superior a 68,25. Teste com base
na media encontrada da amostra e ao nvel de 2,5% de significancia a afirmacao do professor e conclua.
9.5
Teste de hip
oteses para propor
c
oes
Em alguns casos o interesse e testar uma proporcao populacional p igual a uma proporcao p0 .
Os passos a serem seguidos para a realizacao deste teste de hipoteses sao:
Primeiro passo:
Formular as hipoteses
segundo a natureza do problema. Elas podem ser do
H0 : p = p0
H0 : p = p0
H0 : p = p0
tipo:
,
e
H1 : p 6= p0
H1 : p > p0
H1 : p < p0
Segundo passo: Especificar que geralmente e informado no enunciado.
p p0
, que sob H0 , zc N (0, 1).
Terceiro passo: Calcular o valor da estatstica zc = r
p0 (1 p0 )
n
Quarto passo: Concluir de acordo com o(s) valor(es) da regiao(oes) crtica(s). Se o valor da
estatstica pertencer `
a regi
ao crtica, rejeita-se H0 no nvel de significancia especificado, caso contrario,
n
ao se rejeita H0 .
Conforme a hip
otese formulada obtem-se as seguintes regioes crticas:
Figura 35 Regi
oes crticas conforme H1 : p 6= p0 ; H1 : p > p0 e H1 : p < p0
Sendo que ztab quando H1 : p 6= p0 dever ser consultado na tabela da distribuicao normal
padronizada Z considerando ztab = z/2 e ztab = z/2 .
Para as outras hip
oteses, H1 : p > p0 e H1 : p < p0 , os valores de ztab sao respectivamente, z
e z .
Exemplo: Um comprador, ao receber de um fornecedor um grande lote de pecas, decidiu inspecionar 200 delas. Decidiu, tambem, que o lote sera rejeitado se ficar convencido, ao nvel de 5% de
signific
ancia, de que a proporc
ao de pecas defeituosas no lote for superior a 4%. Qual sera sua decis
ao
(rejeitar ou n
ao o lote) se na amostra foram encontradas onze pecas defeituosas?
Soluc
ao:
Dados:
n = 200
= 0,05
ztab = z = z0,05 = 1,65
p0 = 4% = 0,04
y
11
p = =
= 0,055
n
200
1
ao das hip
oteses:
- Formulac
H0 : p = 0,04
H1 : p > 0,04
2 - Especificar :
= 0,05
3 - Calcular o valor da estatstica:
0,055 0,04
p p0
=r
= 1,0825
zc = r
p0 (1 p0 )
0,04 (1 0,04)
n
200
4 - Conclus
ao:
Conforme o desenho, nota-se que o valor
da estatstica zc = 1,0825 pertence `
a regi
ao de nao
rejeic
ao de H0 .
Portanto, conclui-se que n
ao se rejeita H0
ao nvel de 5% de signific
ancia ou seja, n
ao ha motivos para rejeitar o lote de pecas.
84
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
9 TEORIA DA DECISAO
Estatstica B
asica
9.5.1
Exerccios
1. Suponha que um alergista deseja testar a hipotese de que pelo menos 30% das pessoas sao alergicas a
medicamentos `
a base de sulfa. Explique como o alergista poderia cometer:
a) um erro tipo I.
b) um erro tipo II.
2. A reitoria de uma universidade acredita que a proporcao de alunos que ocasional ou frequentemente
chegam atrasados `
as aulas e de 55%.
a) Determine a hip
otese nula e a alternativa.
b) Determine quando um erro tipo I ou II ocorre para um teste de hipotese da afirmacao.
c) Determine se o teste de hip
otese e unicaudal `a esquerda, `a direita ou bicaudal. Explique.
d) Como voce deve interpretar uma decis
ao que rejeita a hipotese nula?
e) Como voce deve interpretar uma decis
ao que nao rejeita a hipotese nula?
3. Sabe-se por experiencia que 5% da producao de um determinado artigo e defeituosa. Um novo
empregado e contratado. Ele produz 600 pecas do artigo com 82 defeituosas. Ao nvel de 15%, verificar
se o novo empregado produz pecas com maior ndice de defeitos que o existente.
4. Em uma experiencia sobre percepc
ao extrassensorial (PES), um indivduo A, em uma sala isolada,
e solicitado a declarar a cor vermelha ou preta (em n
umeros iguais) de cartas tiradas ao acaso de um
baralho de 50 cartas, por outro indivduo B, posicionado em outra sala. Se A identifica corretamente 32
cartas, esse resultado e significativo ao nvel de 5% para indicar que A tem PES?
5. Um candidato a deputado estadual afirma que tera 60% dos votos dos eleitores de uma cidade. Um
instituto de pesquisa colhe uma amostra de 300 eleitores dessa cidade, encontrando 160 que votarao no
candidato. Esse resultado mostra que a afirmacao do candidato e verdadeira, ao nvel de 5%?
6. Um fabricante de droga medicinal afirma que ela e 90% eficaz na cura de uma alergia, em determinado
perodo. Em uma amostra de 200 pacientes, a droga curou 150 pessoas. Testar ao nvel de 1% se a
pretens
ao do fabricante e legtima.
7. Um levantamento efetuado em um bairro de uma cidade mostrou que 25 indivduos adultos de um
total de 80 eram tabagistas habituais. Considerando que a prevalencia de tabagismo na populacao adulta
seja de 20%, teste a hip
otese de que a prevalencia de tabagismo neste bairro seja diferente da prevalencia
da populac
ao em geral, a um nvel de 5%.
9.6
Teste de hip
oteses para compara
c
ao das vari
ancias de duas popula
c
oes normais
2
2
Figura 36 Regi
ao crtica conforme H1 : M
> m
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
85
9 TEORIA DA DECISAO
Estatstica B
asica
Sendo que o Ftab = F(; nM 1; nm 1) e obtido na tabela da distribuicao F com graus de liberdade
nM 1 = 1 e nm 1 = 2 representando os graus de liberdade do numerador e do denominador,
respectivamente.
Exemplo: Dadas duas amostras extradas de populacoes normais independentes:
n1 = 10; x
1 = 73; s1 = 5,9
n2 = 13; x
2 = 57; s2 = 5,0
Testar a homogeneidade de vari
ancias no nvel de 5% de significancia.
Soluc
ao:
1
c
ao das hip
oteses:
- Formula
2
2
H0 : M
= m
2
2
H1 : M
> m
2 - Especificar :
= 0,05
3 - Calcular o valor da estatstica:
s2m
s2M
(5,9)2
s2
2
2
=
=
= 1,3924, pois sob H0 tem-se M
= m
.
Fc = M
2
2
M
m
s2m
(5,0)2
4 - Conclus
ao:
Conforme o desenho, nota-se que o valor
da estatstica Fc = 1,3924 pertence `
a regi
ao de nao
rejeic
ao de H0 . O valor Ftab = F(; nM 1; nm 1) =
F(0,05; 101; 131) = F(0,05; 9; 12) = 2,80 e obtido na
tabela F considerando = 0,05 e o n
umero obtido
na intersec
ao dos graus de liberdade do numerador
da frac
ao e o n
umero dos graus de liberdade do denominador, ou seja, 9 e 12 gl.
Portanto, conclui-se que n
ao se rejeita H0
ao nvel de 5% de signific
ancia ou seja, as variancias
podem ser consideradas homogeneas.
9.7
Teste de hip
oteses para duas m
edias de popula
c
oes normais com vari
ancias populacionais desconhecidas
Testes de hip
oteses para duas m
edias, sendo 12 = 22 = 2
1)
s
+
(n
1)
s
1
2
2
1
sendo s2p =
, em que sob H0 , tc t com = n1 + n2 2 gl.
n1 + n2 2
Quarto passo: Concluir de acordo com o valor da regiao crtica. Se o valor da estatstica
pertencer `
a regi
ao crtica, rejeita-se H0 no nvel de significancia especificado, caso contrario, nao se
rejeita H0 .
Conforme a hip
otese formulada obtem-se a seguinte regiao crtica:
86
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
9 TEORIA DA DECISAO
Estatstica B
asica
Figura 37 Regi
ao crtica conforme H1 : 1 2 6= 0
Onde os valores ttab e ttab devem ser consultados na tabela da distribuicao t, sendo considerados ttab = t(/2; n1 +n2 2) e ttab = t(/2; n1 +n2 2) .
Exemplo: Considere um experimento em que dois grupos de ratos (femeas) foram alimentados
com dietas apresentando alto e baixo conte
udos de protena. Os dados abaixo apresentam os dois grupos,
dando o peso em gramas para cada rato entre o 28o e o 84o dia de vida.
Alto
123
104
161
113
cont. protena
134
146
119
124
107
83
129
97
n1 = 12
x1 = 120
s21 = 457,4545
n2 = 7
x2 = 101
s22 = 425,3333
= 0,05
1
ao das hip
oteses:
- Formulac
H0 : 1 2 = 0
H1 : 1 2 6= 0
2 - Especificar :
= 0,05
3 - Calcular o valor da estatstica:
x
1 x
2 0
120 101 0
tc = s
=s
= 1,891
1
1
1
1
s2p
+
446,1176
+
n1
n2
12 7
4 - Conclus
ao:
Conforme o desenho, nota-se que o valor
da estatstica tc = 1,891 pertence `
a regi
ao de nao
rejeic
ao de H0 .
Conclui-se que n
ao se rejeita H0 ao nvel
de 5% de signific
ancia ou seja, as medias nao sao
estatisticamente diferentes.
9.7.2
Testes de hip
oteses para duas m
edias, sendo 12 6= 22
Como anteriormente, somente a situacao em que
1 2 6= 0 sera considerada.
H0 : 1 2 = 0
O primeiro passo e a formulac
ao da hipotese:
.
H1 : 1 2 6= 0
O segundo passo: e especificar o nvel de significancia , normalmente fornecido no enunciado.
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
87
9 TEORIA DA DECISAO
Estatstica B
asica
x
1 x
2 0
Terceiro passo: Calcular o valor da estatstica tc = s
, em que sob H0 , tc t com
2
s1
s22
+
n1
n2
2
2 2
s1
s
+ 2
n1
n2
gl. Sendo = 2
2 2 .
s21
s2
n1
n2
+
n1 1
n2 1
Quarto passo: Concluir de acordo com o valor da regiao crtica. Se o valor da estatstica
pertencer `
a regi
ao crtica, rejeita-se H0 no nvel de significancia especificado, caso contrario, nao se
rejeita H0 .
Conforme a hip
otese formulada obtem-se a seguinte regiao crtica:
Figura 38 Regi
ao crtica conforme H1 : 1 2 6= 0
Onde os valores ttab e ttab devem ser consultados na tabela da distribuicao t, sendo considerados ttab = t(/2; ) e ttab = t(/2; ) .
Exemplo: Os dados abaixo se referem aos pesos, em gramas, de ratos machos da raca Wistar
com 15 dias de idade, segundo a condic
ao normal e submetidos `a extirpacao do timo (timectomizacao)
aos 4 dias de idade. Verificar se nas duas situacoes o ganho medio de peso destes animais e igual, usando
= 5% (h
a heterocedasticidade).
Condic
ao normal
Timectomizado
40,3
20,9
41,0
21,3
39,6
23,6
33,0
22,2
31,0
21,9
Soluc
ao:
Dados:
Adotando o ndice 1 para os ratos que est
ao na condicao normal e 2 para os ratos que foram timectomizados, tem-se:
n1 = 5
x1 = 36,98
s21 = 21,412
n2 = 5
x2 = 21,98
s22 = 1,077
= 0,05
2
s21
s22
+
n1
n2
= 2
2 2
2
s2
s1
n1
n2
+
n1 1
n2 1
2
21,412 1,077
+
5
5
=
2
2
1,077
21,412
5
5
+
51
51
= 4,40 4 gl
ttab = t(/2; ) = t(0,025; 4)
t(0,025; 4)=2,776
t(0,025; 4)=2,776
1
ao das hip
oteses:
- Formulac
H0 : 1 2 = 0
H1 : 1 2 6= 0
2 - Especificar :
= 0,05
3 - Calcular o valor da estatstica:
x
1 x
2 0
36,98 21,98 0
tc = s
= 7,073
= s
2
2
21,412 1,077
s1
s2
+
+
5
5
n1
n2
4 - Conclus
ao:
88
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Introduc
ao `
a Bioestatstica
10 TESTES QUI-QUADRADO
Conforme o desenho, nota-se que o valor dos apresentando maior media de peso o primeiro
da estatstica tc = 7,073 pertence `
a regi
ao de rejei- grupo.
c
ao de H0 .
Conclui-se que rejeita-se H0 ao nvel de
5% de signific
ancia ou seja, as medias sao estatisticamente diferentes. Assim, o peso medios dos
ratos em condic
ao normal difere dos timectomiza9.7.3
Exerccios
Deve-se realizar o teste de homogeneidade de variancias em todos os casos.
1. Em um teste de hip
otese de que mulheres sorriem para outras mais do que os homens o fazem entre
si, mulheres e homens foram filmados enquanto conversavam, anotando-se o n
umero de sorrisos de cada
sexo. Com os seguintes n
umeros de sorrisos em cinco minutos de conversa, teste a hipotese nula de que
n
ao h
a diferenca entre os sexos quanto ao n
umero de sorrisos ( = 0,05).
Homens
8
11
13
4
2
Mulheres
15
19
13
11
18
2. No nvel de 5% de signific
ancia, teste a afirmacao de que a quantidade media de alcatrao em cigarros
com filtro e a mesma que a quantidade media de alcatrao em cigarros sem filtro. (Todas as medidas s
ao
em miligramas e os dados s
ao da Federal Trade Commission.)
Quantidade de alcatrao (mg)
Com filtro
Sem filtro
n1 = 21
n2 = 8
x
1 = 13,3
x
2 = 24,0
s1 = 3,7
s2 = 1,7
3. De duas populac
oes X
normais X1 e X
ao os apresentados a seguir:
2 foram retiradas amostras e os dados s
X
2
Populac
ao 1: n1 = 6;
xi = 36,3;
xi = 223,55
X
X
Populac
ao 2: n2 = 9;
xi = 76,9;
x2i = 665,81
Testar ao nvel de 2,0% de signific
ancia que a media da primeira populacao e igual `a segunda.
4. Para verificar a eficencia de um cartaz na estimulacao `a compra de determinado produto, 7 pares de
lojas foram formados, cada par tendo as mesmas caractersticas quanto `a localizacao, ao tamanho e ao
volume geral das vendas. Isso feito, o cartaz foi colocado numa das lojas do par, nao o sendo em sua
correspondente, tendo o processo sido repetido para os 7 pares. Abaixo aparecem as vendas semanais do
produto durante a experimentac
ao, expressas em media de observacao conduzida por dois meses. Analise
os dados e conclua, a 5%, sobre o potencial do cartaz na inducao `a compra do produto.
Par
Com cartaz
Sem cartaz
1
16
13
2
24
18
3
18
14
4
14
16
5
26
19
6
17
12
7
29
18
5. As amostras aleat
orias seguintes, s
ao medidas da capacidade de gerar calor (em milhoes de calorias
por tonelada) de amostras de carv
ao de duas minas. Ao nvel de 5% de significancia, teste se a diferenca
entre as medias das duas populac
oes e significativa.
Mina 1
Mina 2
10
9.400
7.510
8.230
7.690
8.380
7.720
7.860
8.070
7.930
7.660
TESTES QUI-QUADRADO
Os tres testes que envolvem a distribuicao Qui-quadrado que serao estudados neste material
s
ao:
l Teste de ader
encia;
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
89
Introduc
ao `
a Bioestatstica
l
l
10 TESTES QUI-QUADRADO
Teste de independencia;
Teste de homogeneidade.
Em todos os testes Qui-quadrado o que muda e so a hipotese envolvida no problema, basicamente, para os tres tipos de testes de hip
oteses, a estatstica e:
2c =
n
X
(Oi Ei )2
i=1
Ei
Teste de Ader
encia
Testa a hip
otese da amostra ser proveniente de uma distribuicao de probabilidade definida em
H0 . Ou seja, testa a hip
otese de que uma distribuicao de frequencias observadas se ajusta (ou adere) a
uma determinada distribuic
ao de probabilidade definida em H0 . Como ja estudado anteriormente o teste
de hip
oteses deve passar por quatro etapas.
A primeira e a formulac
ao das hipoteses:
H0 : Ajusta `
a distribuic
ao de probabilidade definida
.
H1 : N
ao ajusta `
a distribuic
ao de probabilidade definida
A segunda e a especificac
ao de .
A terceira e a obtenc
ao do valor da estatstica do teste:
2c =
k
X
(Oi Ei )2
i=1
Ei
0
18
1
56
2
110
3
88
4
40
Profs. Fl
avio Bittencourt/Adriana Dias
5
8
UNIFAL-MG/Alfenas
Introduc
ao `
a Bioestatstica
10 TESTES QUI-QUADRADO
Soluc
ao:
Considerando X: a vari
avel aleat
oria nascimento de meninas, que segue a distribuicao binomial com
par
ametros n1 = 5 e p = 0,5, a distribuic
ao das frequencias esperadas para X e:
X
pi = P (X = x)
0
0,03125
1
0,15625
2
0,3125
3
0,3125
4
0,15625
5
0,03125
0
18
10
1
56
50
2
110
100
3
88
100
4
40
50
5
8
10
As hip
oteses em teste s
ao:
H0 : Igualdade de nascimentos = Ajusta `a distribuicao binomial
.
H1 : N
ao igualdade de nascimentos = Nao se ajusta a` distribuicao binomial
O nvel de signific
ancia e = 5%.
A estatstica do teste e:
k
6
2
X
X
(O
(Oi Ei )2
i Ei )
2
c =
=
Ei
Ei
i=1
i=1
2c =
(18 10)2
(56 50)2
(110 100)2
(88 100)2
(40 50)2
(8 10)2
+
+
+
+
+
= 11,96
10
50
100
100
50
10
O valor do Qui-quadrado tabelado foi encontrado baseando-se em 2(; k1) = 2(5%; 61) =
2(5%; 5) = 11,070. Conforme o desenho, nota-se que
o valor da estatstica 2c = 11,96 pertence `a regiao
de rejeic
ao de H0 .
Conclui-se que se rejeita H0 ao nvel de
5% de signific
ancia ou seja, h
a motivos para afirmar que a distribuic
ao observada n
ao se adere `a
distribuic
ao binomial.
10.2
Teste de Independ
encia
Ao estudar probabilidade foi visto que se dois eventos sao independentes a ocorrencia de um
evento n
ao afeta a ocorrencia do outro. Por exemplo, o lancamento de dados e moedas sao independentes,
ou experimentos com repetic
ao e reposic
ao.
Este teste de hip
oteses testa se a distribuicao conjunta e o produto das distribuicoes marginais,
o que s
o ocorre quando existe independencia entre as variaveis aleatorias.
Neste caso as duas vari
aveis aleatorias (de uma mesma populacao) sao organizadas numa tabela
de dupla entrada (tabela de contingencia). Os valores esperados sao obtidos pela razao do produto dos
valores marginais e o tamanho da amostra.
As quatro etapas para a realizacao do teste e:
As
hip
o
teses
em teste s
ao:
H0 : H
a independencia entre as vari
aveis
.
H1 : N
ao h
a independencia entre as variaveis
Especificar .
Obter a estatstica do teste e:
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
91
Introduc
ao `
a Bioestatstica
10 TESTES QUI-QUADRADO
2c =
rc
X
(Oi Ei )2
i=1
Ei
0n<5
75
29
15
119
Estatstica
5 n < 7 7 n 10
35
13
120
32
70
46
225
91
Total
123
181
131
435
Soluc
ao:
Inicialmente, calcula-se as frequencias esperadas, sendo:
(Soma da linha r) (Soma da coluna c)
Er,c =
Tamanho da amostra
(123) (119)
(181) (91)
E1,1 =
= 33,6483
E2,3 =
= 37,8644
435
435
(123) (225)
(131) (119)
E1,2 =
= 63,6207
E3,1 =
= 35,8368
435
435
(123) (91)
(131) (225)
E1,3 =
= 25,7310
E3,2 =
= 67,7586
435
435
(181) (119)
(131) (91)
E2,1 =
= 49,5149
E3,3 =
= 27,4046
435
435
(181) (225)
E2,2 =
= 93,6207
435
Assim,
C
alculo I
0n<5
5n<7
7 n 10
Total
92
0n<5
75(33,6483)
29(49,5149)
15(35,8368)
119
Estatstica
5n<7
35(63,6207)
120(93,6207)
70(67,7586)
225
7 n 10
13(25,7310)
32(37,8644)
46(27,4046)
91
Profs. Fl
avio Bittencourt/Adriana Dias
Total
123
181
131
435
UNIFAL-MG/Alfenas
Introduc
ao `
a Bioestatstica
10 TESTES QUI-QUADRADO
As hip
oteses em teste s
ao:
H0 : As vari
aveis s
ao independentes
.
H1 : As vari
aveis s
ao n
ao independentes
O nvel de signific
ancia e = 2,5%.
A estatstica do teste e:
9
rc
2
X
X
(Oi Ei )2
(O
i Ei )
=
2c =
Ei
Ei
i=1
i=1
(75 33,6483)2
(35 63,6207)2
(46 27,4046)2
+
+ +
= 111,6413
33,6483
63,6207
27,4046
O valor do Qui-quadrado tabelado obtido e:
2c =
10.3
Teste de Homogeneidade
Este teste e usado pada determinar se varias proporcoes sao iguais quando amostras sao tiradas
de populac
oes diferentes. Embora o teste seja semelhante ao teste de independencia, aqui o interesse
e o de verificar as proporc
oes, ou seja, se o comportamento de cada celula e o mesmo. Nao se est
a
verificando as vari
aveis (teste de independencia) e sim as proporcoes (valores das celulas).
Conforme anteriormente descrito, as etapas para a realizacao do teste e semelhante `as demais:
As
hip
o
teses
em teste s
ao:
H0 : As proporc
oes s
ao iguais
.
H1 : No mnimo uma das proporc
oes e diferente das outras
Especificar .
Obter a estatstica do teste e:
2c =
rc
X
(Oi Ei )2
i=1
Ei
Profs. Fl
avio Bittencourt/Adriana Dias
93
Introduc
ao `
a Bioestatstica
10 TESTES QUI-QUADRADO
Exemplo: O sexo de um pesquisador tem influencia nas respostas dadas por homens a uma
pesquisa, ao nvel de 5% de signific
ancia? Os dados a seguir foram coletados considerando uma amostra
de 1.200 homens.
Categorias
Homens que concordam
Homens que discordam
Total
Sexo do entrevistador
Homem
Mulher
560
308
240
92
800
400
Total
868
332
1200
Soluc
ao:
Inicialmente, calcula-se as frequencias esperadas, sendo:
(Soma da linha r) (Soma da coluna c)
Er,c =
Tamanho da amostra
(868) (800)
(332) (800)
= 578,6667
= 221,3333
E1,1 =
E2,1 =
1200
1200
(868) (400)
(332) (400)
E1,2 =
E2,2 =
= 289,3333
= 110,6667
1200
1200
Assim,
Categorias
Homens que concordam
Homens que discordam
Total
Sexo do entrevistador
Homem
Mulher
560(578,6667) 308(289,3333)
240(221,3333) 92(110,6667)
800
400
Total
868
332
1200
As hip
oteses em teste s
ao:
2c =
94
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Introduc
ao `
a Bioestatstica
10 TESTES QUI-QUADRADO
Exerccios
1. Para verificar se um dado e honesto lancou-se-o 1200 vezes anotando quantas vezes cada face ocorreu:
Face
Ocorrencia
1
180
2
207
3
191
4
203
5
210
6
209
Total
1200
0
55
1
40
2
17
3
5
4
2
5
1
a) Estime o n
umero medio de ocorrencias/ano.
b) Calcule para cada valor da vari
avel aleatoria X, as probabilidades associadas. Suponha que X possua
distribuic
ao de Poisson e que a media amostral e o estimador do parametro da distribuicao Poisson.
c) Calcule a frequencia esperada (em n
umero de anos) para cada valor de X.
d) Compare os resultados esperados com os observados. Com base nesta comparacao, voce pode afirmar
que a distribuic
ao de Poisson e adequada para explicar a ocorrencia desta doenca na regiao de estudo?
Justifique, usando = 5%.
3. Muitas pessoas acreditam que, quando um cavalo inicia uma corrida, tem mais chance de ganhar se sua
posic
ao na linha de partida est
a mais pr
oxima do limite interno da pista. A posicao 1 esta mais proxima
do limite interno, seguida pela posic
ao 2, e assim por diante. Os dados a seguir relaciona o n
umero
de vit
orias de cavalos nas diferentes posic
oes de partida. Teste a afirmacao de que as probabilidades de
vit
oria n
ao s
ao as mesmas para as diferentes posicoes de partida ao nvel de 5% de significancia. Considere
P (X = x) = 18 , ou seja, em cada posic
ao a probabilidade de ganhar e a mesma.
N
umero de vit
orias
1
29
2
19
Posicao de partida
3
4
5
6
7
18 25 17 10 15
8
11
4. Os dados seguintes vem de um estudo concebido para investigar problemas de bebida entre os estudantes universit
arios. Em 1983, foi perguntado a um grupo quem ja dirigiu um automovel depois de
beber. Em 1987, depois de atingida a idade legal para o consumo de bebidas alcoolicas, foi feito o mesmo
questionamento a outro grupo universit
ario.
Dirigia enquanto bebia
Sim
N
ao
Total
Ano
1983 1987
1.250
991
1.387 1.666
2.637 2.657
Total
2.241
3.053
5.294
Profs. Fl
avio Bittencourt/Adriana Dias
95
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
Estatstica B
asica
Raz
oes para a nao-conformidade
Rachadura Localizacao Faltando
65
17
21
52
25
19
28
16
14
145
58
54
Mancha
34
23
32
89
Outros
13
6
10
29
Tamanho da
amostra
150
125
100
375
N
umero de frutas maduras
141
28
25
24
20
N
umero de frutas abortadas
206
69
73
78
82
11
11.1
LINEAR E REGRESSAO
LINEAR SIMPLES
CORRELAC
AO
Diagrama de dispers
ao
um gr
E
afico u
til para examinar o relacionamento entre duas variaveis quantitativas, sendo formado por pontos (pares ordenados) observados nas variaveis quantitativas X (abscissas) e Y (ordenadas)
em um plano coordenado.
Exemplo: O diagrama de dispersao apresentado na Figura 42 foi confeccionado a partir de
um conjunto de dados obtido de 50 amostras das
tres especies de ris18 (Iris setosa, Iris virginica e
Iris versicolor), resultante de uma pesquisa realizada por Edgar Anderson na qual Ronald Fisher
desenvolveu um modelo discriminante linear para
distinguir cada especie.
Figura 42 Conjunto de dados de Iris de Fisher
Com base no diagrama de dispersao acima apresentado, pode-se observar que conforme o comprimento da petala aumenta, a largura tende a aumentar.
18
96
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
Estatstica B
asica
Este gr
afico e importante tambem para se observar o comportamento das variaveis X e Y , por
exemplo, se existe ou n
ao um comportamento aproximadamente linear, quadratico, c
ubico, exponencial,
logstico etc.
11.2
Coeficiente de Correla
c
ao Linear
Conforme o diagrama dispers
ao dos pares de pontos das variaveis X e Y , a correlacao se classifica
em:
a) correla
c
ao positiva
b) correla
ca
o fortemente positiva
c) correla
ca
o negativa
d) correla
ca
o fortemente negativa
e) correla
ca
o nula
f) correla
ca
o nula
r = v
u
u
u
u n
uX 2
u
xi
u
u i=1
t
xi yi
xi
i=1
n
X
yi
i=1
i=1
(1)
n
X
!2
xi
i=1
n
X
yi2
i=1
n
X
!2
yi
i=1
Conforme o valor obtido no intervalo [1, 1], a correlacao r e classificada como [4]:
fraca quando 0 |r| 0,5;
forte se 0,8 |r| 1;
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
97
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
Estatstica B
asica
Perfeita
+1
0,9
+0,9
0,8
Forte
+0,8
0,7
+0,7
0,6
+0,6
0,5
Moderada
+0,5
0,4
+0,4
0,3
+0,3
0,2
Fraca
+0,2
0,1
Zero (nula)
+0,1
0
Coeficiente de determina
c
ao
Em an
alise de regress
ao usa-se elevar o r de Pearson ao quadrado para se ter uma medida da
vari
ancia explicada, expressa em porcentagem, o que e valido somente em modelo de regressao linear
simples. O r2 varia de 0 a 1, quanto maior o seu valor, mais explicativo e o modelo, ou seja, melhor ele
se ajusta aos valores observados. Por exemplo, se o r2 de um modelo e 0,8932, significa que 89,32% da
variac
ao da vari
avel dependente consegue ser explicada pelo modelo ajustado.
Exemplo 1: Em um estudo conduzido na Italia, 10 pacientes com hipertrigliceridemia foram
colocados sob dieta de baixas gorduras e altos carboidratos. Antes de inicia-la, as medidas de colesterol
e de triglicerdeos foram registradas para cada indivduo.
Paciente
1
2
3
4
5
6
7
8
9
10
Nvel de Colesterol
(mmol/L)
5,12
6,18
6,77
6,65
6,36
5,90
5,48
6,02
10,34
8,51
Nvel de Triglicerdeos
(mmol/L)
2,30
2,54
2,95
3,77
4,18
5,31
5,53
8,83
9,48
14,20
a) Construa um gr
afico de dispers
ao para esses dados.
b) H
a alguma evidencia de uma relac
ao linear entre os nveis de colesterol e de triglicerdeos antes da
dieta?
c) Calcule o coeficiente de correlac
ao r.
Soluc
ao:
a)
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
Estatstica B
asica
1
2
3
4
5
6
7
8
9
10
Somas
5,12
6,18
6,77
6,65
6,36
5,90
5,48
6,02
10,34
8,51
10
X
2,30
2,54
2,95
3,77
4,18
5,31
5,53
8,83
9,48
14,20
10
X
xi = 76,33
i=1
i=1
n
X
n
X
r = v
u
u
u
u n
uX 2
u
xi
u
ui=1
t
yi = 59,09
xi yi
xi
i=1
i=1
xi = 475,3283
10
X
yi = 480,3857
i=1
10
X
xi yi = 432,7552
i=1
yi
i=1
!2
xi
5,2900
6,4516
8,7025
14,2129
17,4724
28,1961
30,5809
77,9689
89,8704
201,6400
i=1
i=1
n
X
n
X
10
X
xi yi
11,7760
15,6972
19,9715
25,0705
26,5848
31,3290
30,3044
53,1566
98,0232
120,8420
26,2144
38,1924
45,8329
44,2225
40,4496
34,8100
30,0304
36,2404
106,9156
72,4201
n
X
2
yi
i=1
76,33 59,09
432,7552
10
=
v
!
! = 0,6497
!2
u
n
2
2
u
X
76,33
(59,09)
t 475,3283
480,3857
yi
10
10
i=1
De posse do valor obtido, r = 0,6497, e observando a classificacao de [4] e [6], conclue-se que
h
a uma correlac
ao moderada.
Exemplo 2: O diagrama de dispersao mostra que as variaveis possuem uma correlac
ao de:
a)+1,00
b)1,00
c)+0,70
//
d)0,70
e) n
ao tem correlac
ao
11.3.1
Exerccios
1. O n
umero de horas que 12 estudantes passam on-line durante o fim de semana e a nota de cada
estudante na prova de estatstica na segunda-feira seguinte sao:
Horas gastas on-line
Nota
0
96
1
85
2
82
3
74
3
95
5
68
5
76
5
84
6
58
7
65
7
75
10
50
13,2
14,8
19,3
21,5
18,5
16,4
20,1
23,5
14,8
13,5
14,0
17,8
19,5
18,9
Profs. Fl
avio Bittencourt/Adriana Dias
99
Estatstica B
asica
11.4
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
Regress
ao Linear Simples
Muitas vezes ao observar um diagrama de dispersao tem-se uma ideia de que as variaveis X e Y
possuem um comportamento conhecido, podendo ser linear, quadratico, c
ubico, exponencial, logartmico,
logstico etc.
Em uma situac
ao de modelagem tpica, um cientista deseja obter uma relacao matematica entre
duas vari
aveis X e Y usando um conjunto de n pares ordenados de medicoes
(x1 ,y1 ), (x2 ,y2 ), (x3 ,y3 ), (xn ,yn )
(2)
a) Diagrama de dispers
ao
b) Polin
omio de grau dez ajustado
c) Reta de regress
ao ajustada
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
entre os pontos do diagrama e os pontos da curva do modelo matematico, em geral, sejam as menores
possveis. Resumindo: com este metodo a soma de quadrados das distancias entre os pontos do diagrama
e dos respectivos pontos na curva da equacao estimada e minimizada, obtendo-se, desta forma, uma
relac
ao funcional entre X e Y , para o modelo escolhido, com um mnimo de erro possvel.
O erro (tambem denominado resduo) ei corresponde `a diferenca entre um valor observado yi
e o valor estimado yi obtido a partir da equacao estimada: ei = yi yi . Para uma melhor compreens
ao
observe a Figura 46.
(3)
Em que:
yi : e o valor observado para a vari
avel dependente Y no i-esimo nvel da variavel independente X;
0 : e a constante de regress
ao. Representa o intercepto da reta com o eixo-y;
1 : coeficiente de regress
ao. Representa a variacao de Y em funcao da variacao de uma unidade da
vari
avel X;
xi : e o i-esimo nvel da vari
avel independente, i = 1,2,3, ,n;
ei : e o erro associado `
a dist
ancia entre o valor observado yi e o correspondente ponto na curva do
modelo proposto para o mesmo nvel i de X.
Este modelo e denominado modelo estatstico por considerar um erro associado a cada observac
ao, diferentemente do modelo matem
atico.
A regress
ao linear simples tem por objetivo encontrar valores (estimativas 0 e 1 ) dos par
ametros do Modelo (3) os quais minimizam a distancia entre os pontos (valores observados) do diagrama
de dispers
ao e a curva a ser ajustada. Por meio do metodo dos mnimos quadrados, as estimativas dos
par
ametros do modelo linear e obtido por:
0 = y 1 x
n
P
1 =
yi xi
n
P
xi
i=1
n
i=1
x2i
yi
i=1
i=1
n
P
n
P
(4)
n
P
2
xi
SP Dxy
SQDx
(5)
i=1
Na pr
atica, determina-se 1 em primeiro lugar e depois 0 . A estimativa do coeficiente de
regress
ao 1 mede o quanto muda na variavel dependente Y por uma mudanca unitaria na variavel
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
101
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
Estatstica B
asica
independente X. Os valores (estimativas dos parametros) obtidos pelo metodo dos mnimos quadrados
s
ao os melhores valores que podem ser usados para descrever a relacao entre as duas variaveis.
Exemplo 1: Sejam os dados a seguir:
x
y
4
10
7
16
10
20
12
24
17
30
n = 5;
5
P
xi = 50;
i=1
i=1
5
P
5
P
1 =
xi yi
xi
i=1
i=1
yi = 100;
i=1
5
P
i=1
yi2 = 2232;
5
P
xi yi = 1150
i=1
yi
n
x2i
5
P
5
P
i=1
i=1
5
P
x2i = 598;
5
P
2
150
= 1,5306
98
100
50
0 = y 1 x
=
1,5306
= 4,6940
5
5
xi
i=1
Assim, a equac
ao obtida e: yi = 4,6940 + 1,5306xi
O gr
afico e o apresentado a seguir:
102
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
Ano Calend
ario
Ano
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1
2
3
4
5
6
7
8
9
10
11
12
Taxa de fatalidade
por 1000 empregados
2,419
1,732
1,361
1,108
0,996
0,952
0,904
0,792
0,701
0,890
0,799
1,084
a) Construa um gr
afico de dispers
ao da taxa de fatalidade versus o tempo. O que este grafico sugere
sobre a relacao entre as vari
aveis?
b) Para modelar a tendencia nas taxas de fatalidade, ajuste a linha de regressao de mnimos quadrados
Y = 0 + 1 X, onde X representa o tempo (ano).
c) Transforme a vari
avel explicativa X para ln X. Crie um grafico de dispersao da taxa de fatalidade
versus o logaritmo natural do tempo (ano).
d) Ajuste o modelo de mnimos quadrados Y = 0 + 1 ln X
e) Calcule o quadrado do coeficiente de correlacao (r2 ), tambem denominado de coeficiente de determinac
ao, e sugira qual modelo e mais indicado para descrever as variaveis.
Soluc
ao:
Os gr
aficos referentes a cada situac
ao se encontram na Figura 48. Em: (a) nao se observa tendencia
linear; (b) o modelo ajustado e y = 1,8056 0,1017x; (d) o modelo ajustado e y = 2,1352 0,5946x , em
que x = ln(x); (e) O coeficiente de determinacao para o modelo da letra (b) e 55,90% e para o modelo
(d) e 59,64%, logo o u
ltimo modelo e o mais indicado. O valor do seu r2 significa que 59,64% da variac
ao
da vari
avel dependente (Ano) consegue ser explicada pelo modelo ajustado.
a) Diagrama de dispers
ao: Ano versus Taxa de
fatalidade
c) Diagrama de dispers
ao: Ano versus logaritmo da
Taxa de fatalidade
Exerccios
1. Ajustar a equac
ao de regress
ao linear aos dados amostrais apresentados abaixo e confeccionar o
diagrama de dispers
ao com gr
afico da equacao ajustada.
Temperatura (C )
Comprimento (mm)
10
1003
15
1005
20
1010
25
1011
30
1014
Profs. Fl
avio Bittencourt/Adriana Dias
103
LINEAR E REGRESSAO
LINEAR SIMPLES
11 CORRELAC
AO
Estatstica B
asica
x
y
2
10,3
4
18,2
6
25,1
8
35,6
10
43,0
12
50,0
14
59,1
16
67,8
18
75,2
20
85,0
3. Frutos de pepino s
ao utilizados para a producao de pickles e estes sao preservados em uma soluc
ao
salina com 2 a 3% de s
odio. Os dados abaixo mostram a reducao na firmeza (variavel Y medida em
libras) de pickles estocados por um perodo de 0 a 52 semanas (X) em solucao salina.
Semanas (X)
Firmeza (Y )
0
19,8
4
16,5
14
12,8
32
8,1
32
7,5
104
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
12 Tabelas de distribui
c
oes de probabilidade te
oricas
12
Tabelas de distribui
c
oes de probabilidade te
oricas
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,5
4,0
5,0
0
0,5000
0,4602
0,4207
0,3821
0,3446
0,3085
0,2743
0,2420
0,2119
0,1841
0,1587
0,1357
0,1151
0,0968
0,0808
0,0668
0,0548
0,0446
0,0359
0,0287
0,0228
0,0179
0,0139
0,0107
0,0082
0,0062
0,0047
0,0035
0,0026
0,0019
0,0013
0,0002
0,0000
0,0000
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
9
0,4641
0,4247
0,3859
0,3483
0,3121
0,2776
0,2451
0,2148
0,1867
0,1611
0,1379
0,1170
0,0985
0,0823
0,0681
0,0559
0,0455
0,0367
0,0294
0,0233
0,0183
0,0143
0,0110
0,0084
0,0064
0,0048
0,0036
0,0026
0,0019
0,0014
0,0010
0,0002
0,0000
0,0000
105
Estatstica B
asica
12 Tabelas de distribui
c
oes de probabilidade te
oricas
gl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
106
Area
na cauda superior ()
0,25
0,10
0,05
0,025
0,01
0,005
0,0025
0,001
0,0005
1,000
3,078
6,314
12,71
31,82
63,66
127,3
318,3
636,6
0,816
1,886
2,920
4,303
6,965
9,925
14,09
22,33
31,60
0,765
1,638
2,353
3,182
4,541
5,841
7,453
10,21
12,92
0,741
1,533
2,132
2,776
3,747
4,604
5,598
7,173
8,610
0,727
1,476
2,015
2,571
3,365
4,032
4,773
5,893
6,869
0,718
1,440
1,943
2,447
3,143
3,707
4,317
5,208
5,959
0,711
1,415
1,895
2,365
2,998
3,499
4,029
4,785
5,408
0,706
1,397
1,860
2,306
2,896
3,355
3,833
4,501
5,041
0,703
1,383
1,833
2,262
2,821
3,250
3,690
4,297
4,781
0,700
1,372
1,812
2,228
2,764
3,169
3,581
4,144
4,587
0,697
1,363
1,796
2,201
2,718
3,106
3,497
4,025
4,437
0,695
1,356
1,782
2,179
2,681
3,055
3,428
3,930
4,318
0,694
1,350
1,771
2,160
2,650
3,012
3,372
3,852
4,221
0,692
1,345
1,761
2,145
2,624
2,977
3,326
3,787
4,140
0,691
1,341
1,753
2,131
2,602
2,947
3,286
3,733
4,073
0,690
1,337
1,746
2,120
2,583
2,921
3,252
3,686
4,015
0,689
1,333
1,740
2,110
2,567
2,898
3,222
3,646
3,965
0,688
1,330
1,734
2,101
2,552
2,878
3,197
3,610
3,922
0,688
1,328
1,729
2,093
2,539
2,861
3,174
3,579
3,883
0,687
1,325
1,725
2,086
2,528
2,845
3,153
3,552
3,850
0,686
1,323
1,721
2,080
2,518
2,831
3,135
3,527
3,819
0,686
1,321
1,717
2,074
2,508
2,819
3,119
3,505
3,792
0,685
1,319
1,714
2,069
2,500
2,807
3,104
3,485
3,768
0,685
1,318
1,711
2,064
2,492
2,797
3,091
3,467
3,745
0,684
1,316
1,708
2,060
2,485
2,787
3,078
3,450
3,725
0,684
1,315
1,706
2,056
2,479
2,779
3,067
3,435
3,707
0,684
1,314
1,703
2,052
2,473
2,771
3,057
3,421
3,690
0,683
1,313
1,701
2,048
2,467
2,763
3,047
3,408
3,674
0,683
1,311
1,699
2,045
2,462
2,756
3,038
3,396
3,659
0,683
1,310
1,697
2,042
2,457
2,750
3,030
3,385
3,646
0,682
1,306
1,690
2,030
2,438
2,724
2,996
3,340
3,591
0,681
1,303
1,684
2,021
2,423
2,704
2,971
3,307
3,551
0,680
1,301
1,679
2,014
2,412
2,690
2,952
3,281
3,520
0,679
1,299
1,676
2,009
2,403
2,678
2,937
3,261
3,496
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
Estatstica B
asica
12 Tabelas de distribui
c
oes de probabilidade te
oricas
Area
na cauda superior ()
gl
0,5
0,25
0,1
0,05
0,025
1
0,455
1,323
2,706
3,841
5,024
1,386
2,773
4,605
5,991
7,378
2
3
2,366
4,108
6,251
7,815
9,348
3,357
5,385
7,779
9,488
11,143
4
5
4,351
6,626
9,236
11,070
12,833
5,348
7,841
10,645
12,592
14,449
6
7
6,346
9,037
12,017
14,067
16,013
7,344
10,219
13,362
15,507
17,535
8
9
8,343
11,389
14,684
16,919
19,023
10
9,342
12,549
15,987
18,307
20,483
11
10,341
13,701
17,275
19,675
21,920
12
11,340
14,845
18,549
21,026
23,337
13
12,340
15,984
19,812
22,362
24,736
14
13,339
17,117
21,064
23,685
26,119
15
14,339
18,245
22,307
24,996
27,488
16
15,338
19,369
23,542
26,296
28,845
17
16,338
20,489
24,769
27,587
30,191
18
17,338
21,605
25,989
28,869
31,526
19
18,338
22,718
27,204
30,144
32,852
20
19,337
23,828
28,412
31,410
34,170
21
20,337
24,935
29,615
32,671
35,479
22
21,337
26,039
30,813
33,924
36,781
23
22,337
27,141
32,007
35,172
38,076
24
23,337
28,241
33,196
36,415
39,364
25
24,337
29,339
34,382
37,652
40,646
26
25,336
30,435
35,563
38,885
41,923
27
26,336
31,528
36,741
40,113
43,195
28
27,336
32,620
37,916
41,337
44,461
29
28,336
33,711
39,087
42,557
45,722
30
29,336
34,800
40,256
43,773
46,979
40
39,335
45,616
51,805
55,758
59,342
50
49,335
56,334
63,167
67,505
71,420
60
59,335
66,981
74,397
79,082
83,298
120
119,334
130,055
140,233
146,567
152,211
240
239,334
254,392
268,471
277,138
284,802
480
479,334
500,519
520,111
532,075
542,599
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
e probabilidades
0,01
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
63,691
76,154
88,379
158,950
293,888
555,006
0,005
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,300
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,559
46,928
48,290
49,645
50,993
52,336
53,672
66,766
79,490
91,952
163,648
300,182
563,561
107
Estatstica B
asica
12 Tabelas de distribui
c
oes de probabilidade te
oricas
Tabela 34 Valores do quantil F segundo os graus de liberdade do numerador (v1 ) e graus de liberdade do
denominador (v2 ) e probabilidade 5%
v1
v2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
120
240
480
960
108
1
161,448
18,513
10,128
7,709
6,608
5,987
5,591
5,318
5,117
4,965
4,844
4,747
4,667
4,600
4,543
4,494
4,451
4,414
4,381
4,351
4,325
4,301
4,279
4,260
4,242
4,225
4,210
4,196
4,183
4,171
4,085
4,034
4,001
3,920
3,880
3,861
3,851
2
199,500
19,000
9,552
6,944
5,786
5,143
4,737
4,459
4,256
4,103
3,982
3,885
3,806
3,739
3,682
3,634
3,592
3,555
3,522
3,493
3,467
3,443
3,422
3,403
3,385
3,369
3,354
3,340
3,328
3,316
3,232
3,183
3,150
3,072
3,033
3,015
3,005
3
215,707
19,164
9,277
6,591
5,409
4,757
4,347
4,066
3,863
3,708
3,587
3,490
3,411
3,344
3,287
3,239
3,197
3,160
3,127
3,098
3,072
3,049
3,028
3,009
2,991
2,975
2,960
2,947
2,934
2,922
2,839
2,790
2,758
2,680
2,642
2,623
2,614
4
224,583
19,247
9,117
6,388
5,192
4,534
4,120
3,838
3,633
3,478
3,357
3,259
3,179
3,112
3,056
3,007
2,965
2,928
2,895
2,866
2,840
2,817
2,796
2,776
2,759
2,743
2,728
2,714
2,701
2,690
2,606
2,557
2,525
2,447
2,409
2,391
2,381
5
230,162
19,296
9,013
6,256
5,050
4,387
3,972
3,687
3,482
3,326
3,204
3,106
3,025
2,958
2,901
2,852
2,810
2,773
2,740
2,711
2,685
2,661
2,640
2,621
2,603
2,587
2,572
2,558
2,545
2,534
2,449
2,400
2,368
2,290
2,252
2,233
2,223
6
233,986
19,330
8,941
6,163
4,950
4,284
3,866
3,581
3,374
3,217
3,095
2,996
2,915
2,848
2,790
2,741
2,699
2,661
2,628
2,599
2,573
2,549
2,528
2,508
2,490
2,474
2,459
2,445
2,432
2,421
2,336
2,286
2,254
2,175
2,136
2,117
2,108
7
236,768
19,353
8,887
6,094
4,876
4,207
3,787
3,500
3,293
3,135
3,012
2,913
2,832
2,764
2,707
2,657
2,614
2,577
2,544
2,514
2,488
2,464
2,442
2,423
2,405
2,388
2,373
2,359
2,346
2,334
2,249
2,199
2,167
2,087
2,048
2,029
2,019
Profs. Fl
avio Bittencourt/Adriana Dias
8
238,883
19,371
8,845
6,041
4,818
4,147
3,726
3,438
3,230
3,072
2,948
2,849
2,767
2,699
2,641
2,591
2,548
2,510
2,477
2,447
2,420
2,397
2,375
2,355
2,337
2,321
2,305
2,291
2,278
2,266
2,180
2,130
2,097
2,016
1,977
1,958
1,948
9
240,543
19,385
8,812
5,999
4,772
4,099
3,677
3,388
3,179
3,020
2,896
2,796
2,714
2,646
2,588
2,538
2,494
2,456
2,423
2,393
2,366
2,342
2,320
2,300
2,282
2,265
2,250
2,236
2,223
2,211
2,124
2,073
2,040
1,959
1,919
1,899
1,890
10
241,882
19,396
8,786
5,964
4,735
4,060
3,637
3,347
3,137
2,978
2,854
2,753
2,671
2,602
2,544
2,494
2,450
2,412
2,378
2,348
2,321
2,297
2,275
2,255
2,236
2,220
2,204
2,190
2,177
2,165
2,077
2,026
1,993
1,910
1,870
1,850
1,841
Continua...
UNIFAL-MG/Alfenas
Estatstica B
asica
12 Tabelas de distribui
c
oes de probabilidade te
oricas
... continuac
ao
v1
v2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
120
240
480
960
11
242,983
19,405
8,763
5,936
4,704
4,027
3,603
3,313
3,102
2,943
2,818
2,717
2,635
2,565
2,507
2,456
2,413
2,374
2,340
2,310
2,283
2,259
2,236
2,216
2,198
2,181
2,166
2,151
2,138
2,126
2,038
1,986
1,952
1,869
1,829
1,809
1,799
12
243,906
19,413
8,745
5,912
4,678
4,000
3,575
3,284
3,073
2,913
2,788
2,687
2,604
2,534
2,475
2,425
2,381
2,342
2,308
2,278
2,250
2,226
2,204
2,183
2,165
2,148
2,132
2,118
2,104
2,092
2,003
1,952
1,917
1,834
1,793
1,772
1,762
UNIFAL-MG/Alfenas
13
244,690
19,419
8,729
5,891
4,655
3,976
3,550
3,259
3,048
2,887
2,761
2,660
2,577
2,507
2,448
2,397
2,353
2,314
2,280
2,250
2,222
2,198
2,175
2,155
2,136
2,119
2,103
2,089
2,075
2,063
1,974
1,921
1,887
1,803
1,761
1,741
1,730
14
245,364
19,424
8,715
5,873
4,636
3,956
3,529
3,237
3,025
2,865
2,739
2,637
2,554
2,484
2,424
2,373
2,329
2,290
2,256
2,225
2,197
2,173
2,150
2,130
2,111
2,094
2,078
2,064
2,050
2,037
1,948
1,895
1,860
1,775
1,733
1,712
1,702
15
245,950
19,429
8,703
5,858
4,619
3,938
3,511
3,218
3,006
2,845
2,719
2,617
2,533
2,463
2,403
2,352
2,308
2,269
2,234
2,203
2,176
2,151
2,128
2,108
2,089
2,072
2,056
2,041
2,027
2,015
1,924
1,871
1,836
1,750
1,708
1,687
1,677
20
248,013
19,446
8,660
5,803
4,558
3,874
3,445
3,150
2,936
2,774
2,646
2,544
2,459
2,388
2,328
2,276
2,230
2,191
2,155
2,124
2,096
2,071
2,048
2,027
2,007
1,990
1,974
1,959
1,945
1,932
1,839
1,784
1,748
1,659
1,614
1,592
1,581
30
250,095
19,462
8,617
5,746
4,496
3,808
3,376
3,079
2,864
2,700
2,570
2,466
2,380
2,308
2,247
2,194
2,148
2,107
2,071
2,039
2,010
1,984
1,961
1,939
1,919
1,901
1,884
1,869
1,854
1,841
1,744
1,687
1,649
1,554
1,507
1,483
1,471
Profs. Fl
avio Bittencourt/Adriana Dias
40
251,143
19,471
8,594
5,717
4,464
3,774
3,340
3,043
2,826
2,661
2,531
2,426
2,339
2,266
2,204
2,151
2,104
2,063
2,026
1,994
1,965
1,938
1,914
1,892
1,872
1,853
1,836
1,820
1,806
1,792
1,693
1,634
1,594
1,495
1,445
1,420
1,407
60
252,196
19,479
8,572
5,688
4,431
3,740
3,304
3,005
2,787
2,621
2,490
2,384
2,297
2,223
2,160
2,106
2,058
2,017
1,980
1,946
1,916
1,889
1,865
1,842
1,822
1,803
1,785
1,769
1,754
1,740
1,637
1,576
1,534
1,429
1,375
1,347
1,332
120
253,253
19,487
8,549
5,658
4,398
3,705
3,267
2,967
2,748
2,580
2,448
2,341
2,252
2,178
2,114
2,059
2,011
1,968
1,930
1,896
1,866
1,838
1,813
1,790
1,768
1,749
1,731
1,714
1,698
1,683
1,577
1,511
1,467
1,352
1,290
1,256
1,239
109
Estatstica B
asica
110
12 Tabelas de distribui
c
oes de probabilidade te
oricas
Profs. Fl
avio Bittencourt/Adriana Dias
UNIFAL-MG/Alfenas
REFERENCIAS
BIBLIOGRAFICAS
[1] GONCALVES,
M. E. Ger
encia de sa
ude: estatstica aplicada. Rio de Janeiro, RJ: Fundac
ao
CECIERJ, 2010. 168 p.
[2]
PAGANO, M.; GAUVREAU, K. Bioestatstica. Sao Paulo, SP: Cengage Learning, 2012.
DEVORE, J. L. Estatstica Aplicada. Sao Paulo, SP: Pearson Prentice Hall, 2010.
[5] LARSON, R.; FARBER, B. Probabilidade e Estatstica. 4. ed. Sao Paulo, SP: Cengage Learning,
2012.
[6] DANCEY, C. P.; REIDY, J. Estatstica sem Matem
atica para Psicologia: Usando SPSS para
windows. 3. ed. Porto Alegre, RS: Artmed, 2006. 608 p.
UNIFAL-MG/Alfenas
Profs. Fl
avio Bittencourt/Adriana Dias
111