Escolar Documentos
Profissional Documentos
Cultura Documentos
2011
SUMRIO
1 Introduo
1.1 Amostragem . . . . . . . . . . .
1.1.1 Amostragem Simples . . .
1.1.2 Amostragem Sistemtica .
1.1.3 Amostragem Estratificada
1.2 Mtodo Estatstico . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Estatstica Descritiva
2.1 Tipo de Variveis . . . . . . . . . . . . . . . . . .
2.2 Variveis Qualitativas . . . . . . . . . . . . . . . .
2.3 Variveis Quantitativas . . . . . . . . . . . . . . .
2.4 Medidas de Posio . . . . . . . . . . . . . . . . .
2.4.1 Mdia Aritmtica . . . . . . . . . . . . . . .
2.4.1.1 Propriedades da mdia . . . . . . . .
2.4.2 Mediana . . . . . . . . . . . . . . . . . . . .
2.4.3 Moda . . . . . . . . . . . . . . . . . . . . . .
2.4.4 Comparao entre Mdia, Mediana e Moda .
2.4.5 Simetria . . . . . . . . . . . . . . . . . . . .
2.4.6 Separatrizes . . . . . . . . . . . . . . . . . .
2.4.6.1 Quartis . . . . . . . . . . . . . . . . .
2.4.6.2 Percentis ou Centis . . . . . . . . . .
2.4.7 Dados agrupados . . . . . . . . . . . . . . .
2.4.7.1 Mdia . . . . . . . . . . . . . . . . . .
2.4.7.2 Mediana . . . . . . . . . . . . . . . .
2.4.7.3 Moda . . . . . . . . . . . . . . . . . .
2.4.7.4 Quartil . . . . . . . . . . . . . . . . .
2.4.7.5 Percentil . . . . . . . . . . . . . . . .
2.4.7.6 Exemplo . . . . . . . . . . . . . . . .
2.5 Boxplot . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Medidas de disperso . . . . . . . . . . . . . . . .
2.6.1 Amplitude Total . . . . . . . . . . . . . . .
2.6.2 Varincia e Desvio Padro . . . . . . . . . .
2.6.2.1 Propriedades da Varincia . . . . . .
2.6.2.2 Propriedades do Desvio Padro . . .
2.6.3 Coeficiente de Variao . . . . . . . . . . . .
2.6.4 Erro Padro da Mdia . . . . . . . . . . . .
2.7 Exemplos . . . . . . . . . . . . . . . . . . . . . . .
2.7.1 Dados Agrupados . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Noes de Probabilidade
3.1 Espao Amostral e Eventos . . . . . . . . . . . . . .
3.1.1 Operao com eventos . . . . . . . . . . . . .
3.2 Probabilidade . . . . . . . . . . . . . . . . . . . . .
3.2.1 Probabilidade Condicional e Independncia de
3.2.2 rvores de probabilidade . . . . . . . . . . . .
3.3 Varivel Aleatria . . . . . . . . . . . . . . . . . . .
3.3.1 Funo de Probabilidade Discreta . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
5
6
6
7
7
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
9
9
12
17
17
17
19
20
20
21
21
21
22
23
23
23
24
24
25
25
26
29
29
29
31
32
32
33
33
33
. . . . .
. . . . .
. . . . .
Eventos
. . . . .
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
36
37
38
39
40
41
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
42
43
45
46
46
46
47
47
47
49
50
51
51
52
52
53
54
54
56
56
57
57
60
63
63
63
64
66
67
67
67
74
75
75
75
75
76
78
79
80
80
80
82
84
84
86
INTRODUO
Estatstica um conjunto de conceitos e mtodos cientficos para coleta, organizao, descrio, anlise e interpretao de dados experimentais, que permitem concluses vlidas e tomadas
de decises razoveis.
Classificao: Usualmente, a estatstica se divide em:
Estatstica descritiva - a parte que tem por objetivo organizar, apresentar e sintetizar
dados observados de determinada populao, sem pretenes de tirar concluses de carter
extensivo.
Teoria de probabilidade - objetiva descrever e prever as caractersticas de populaes infinitas
Inferncia Estatstica a parte que, baseando-se em estudos realizados sobre os dados de
uma amostra, procura inferir, induzir ou verificar leis de comportamento da populao da
qual a amostra foi retirada. A estatstica inferencial tem sua estrutura fundamentada na
teoria matemtica das probabilidades. , tambm definida como um conjunto de mtodos
para a tomada de decises.
No estudo da estatstica alguns conceitos so importantes:
Populao (N) - Conjunto de todos os elementos relativos a um determinado fenmeno que
possuem pelo menos uma caracterstica em comum, a populao o conjunto Universo.
Exemplos:
Todos os clientes de uma determinada empresa;
Todos os produtos fabricados em uma determinada empresa;
Amostra (n) - um subconjunto da populao e dever ser considerada finita, a amostra deve
ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente
todas as caractersticas da populao como se fosse uma fotografia desta.
Pesquisa Estatstica: qualquer informao retirada de uma populao ou amostra, podendo ser atravs de Censo ou Amostragem
Censo - atividade de inspecionar (observar) todos os elementos de uma populao, objetivando conhecer, com certeza suas caractersticas;
Introduo
Dados estatsticos: qualquer caracterstica que possa ser observada ou medida de alguma
maneira. As matrias-primas da estatstica so os dados observveis.
Varivel: aquilo que se deseja observar para se tirar algum tipo de concluso, geralmente
as variveis para estudo so selecionadas por processos de amostragem. Os smbolos utilizados para representar as variveis so as letras maisculas do alfabeto, tais como X, Y,
Z, ... que pode assumir qualquer valor de um conjunto de dados. As variveis podem ser
classificadas dos seguintes modos:
1.1
AMOSTRAGEM
Introduo
Amostragem Simples
Amostragem Sistemtica
Introduo
Amostragem Estratificada
1.2
MTODO ESTATSTICO
O Mtodo Estatstico pode ser descrito pelas etapas a seguir:
Introduo
CARGO
Chefes de seo
Operrios especializados
Operrios no especializados
TOTAL
8
POPULAO
5000
15000
30000
50000
5%
5(5000)/100 = 250
5(15000)/100 = 750
5(30000)/100 = 1500
5(50000)/100 = 2500
AMOSTRA
250
750
1500
2500
ESTATSTICA DESCRITIVA
A estatstica descritiva parte da estatstica que lida com a organizao, resumo e apresentao
2.1
TIPO DE VARIVEIS
As variveis podem ter valores numricos ou no numricos.
Variveis Qualitativas (ou categricas) - so as caractersticas que no possuem valores
quantitativos, mas, ao contrrio, so definidas por vrias categorias, ou seja, representam
uma classificao dos indivduos
Variveis nominais: no existe ordenao dentre as categorias.
Exemplos: sexo, cor dos olhos, fumante/no fumante, doente/sadio.
Variveis ordinais: existe uma ordenao entre as categorias.
Exemplos: escolaridade (1o , 2o , 3o graus), estgio da doena (inicial, intermedirio,
terminal), ms de observao (janeiro, fevereiro,..., dezembro).
Variveis Quantitativas - so as caractersticas que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numricos
Variveis discretas: so aquelas variveis que pode assumir somente valores inteiros
num conjunto de valores. gerada pelo processo de contagem
Exemplos: nmero de filhos, nmero de empregados, nmero de processos.
Variveis contnuas: so aquelas variveis que podem assumir um valor dentro de um
intervalo de valores. gerada pelo processo de medio
Exemplos: presso arterial, idade, salrio, atraso de transmisso de bytes por uma
rede de internet.
2.2
VARIVEIS QUALITATIVAS
Para resumir dados qualitativos, utiliza-se contagens, propores, porcentagens, taxas por
1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Por exemplo, se encontrar-
Estatstica Descritiva
10
mos que 7 empresas com faturamento mensal acima de R$20.000,00 em uma amostra de 500
propriedades, poderamos expressar isto como uma proporo (0,014) ou percentual (1,4%).
Freqentemente o primeiro passo da descrio de dados criar uma tabela de freqncias.
Antes de montar a tabela de distribuio de freqncias temos algumas definies:
Freqncia - medida que quantifica a ocorrncia dos valores de uma varivel a um dado
conjunto de dados. As freqncias podem ser:
Absoluta (fa) - contagem das observaes de uma varivel;
Relativa (fr) - diviso da freqncia absoluta pelo total de observaes
fr =
fa
n
Estatstica Descritiva
11
Estatstica Descritiva
12
O grfico de barras, com barras justapostas de acordo com categorias diferentes, pode ser
usado para apresentar a relao entre duas variveis qualitativas.
2.3
VARIVEIS QUANTITATIVAS
Da mesma forma que as variveis qualitativas, podemos resumir dados quantitativos por
meio de tabelas de freqncias, entretanto a distino entre as variveis quantitativas discretas
e contnuas na forma de preparao destas tabelas.
A tabela de distribuio de freqncias de uma varivel discreta , em geral bastante semelhante das variveis qualitativas ordinais, pois os valores inteiros que a varivel assume podem
ser considerados como "categorias", ou "classes naturais".
Exemplo: Sejam dados referentes a um levantamento onde observou-se o numero de peas
defeituosas em 25 maquinas de uma empresas.
Tabela 2.5: Nmero de peas defeituosas em 25 maquinas de uma empresa
3 5 7 1 3
6 5 5 5 3
8 5 2 6 2
4 4 4 3 5
6 2 2 4 5
Observa-se que a disposio da varivel nmero de de peas defeituosas semelhante a de
uma varivel qualitativa ordinal com 8 categorias e sua distribuio de freqncia pode ser vista
na tabela 2.6. A representao grfica pode ser feita por meio de um grfico de barras conforme
figura 2.4.
Estatstica Descritiva
13
1
4
4
4
7
3
1
1
25
0,04
0,16
0,16
0,16
0,28
0,12
0,04
0,04
1
4%
16%
16%
16%
28%
12%
4%
4%
100%
1
5
9
13
20
23
24
25
25 maquinas de uma
Freqncia
Percentual
Acumulada
(FP)
4%
20%
36%
52%
80%
92%
96%
100%
Estatstica Descritiva
14
Decidir sobre o numero de classes k, entre 5 e 20. Para que a deciso no seja totalmente
arbitrria pode-se usar a raiz quadrada do total de valores como o nmero de classes, ou
seja, k
= n
Determinar a amplitude dos dados: A = Max - Min.
Determinar a amplitude de classe c:
c=
A
k1
c
2
Tabela 2.7: Dados ordenados, relativos ao tempo em segundos para carga de um aplicativo num
sistema compartilhado (30 observaes).
6,94
7,27
7,46
7,97
8,03
8,37
8,56
8,66
8,88
8,95
9,30
9,33
9,55
9,76
9,80
9,82
9,98
9,99
10,14 10,19 10,42 10,44 10,66 10,88
10,88 11,16 11,80 11,88 12,25 12,34
k =
30 = 5, 47 5
A = M ax M in = 12, 34 6, 94 = 5, 40
A
5, 40
c =
=
= 1, 35
k1
4
c
1, 35
= 6, 94 0, 67 = 6, 27
LI1 = M in = 6, 94
2
2
Uma forma de representar graficamente distribuio de freqncia das variveis contnuas
por meio do histograma e do polgono de freqncia . Para elaborao deste grfico comum
Estatstica Descritiva
15
fr
c
Figura 2.4: Histograma e Polgono de freqncias do relativa ao tempo em segundos para carga
de um aplicativo num sistema compartilhado
Muitas vezes, a anlise da distribuio de freqncias acumuladas mais interessante do que
a de freqncias simples, representada pelo histograma. O grfico usado na representao grfica
da distribuio de freqncias acumuladas de uma varivel contnua a ogiva, apresentada na
Figura 2.5. Para a construo da ogiva, so usadas as freqncias acumuladas (absolutas ou
percentuais) no eixo vertical e os limites superiores de classe no eixo horizontal.
Estatstica Descritiva
16
O primeiro ponto da ogiva formado pelo limite inferior da primeira classe e o valor zero,
indicando que abaixo do limite inferior da primeira classe no existem observaes. Da por
diante, so usados os limites superiores das classes e suas respectivas freqncias acumuladas,
at a ltima classe, que acumula todas as observaes. Assim, uma ogiva deve comear no valor
zero e, se for construda com as freqncias relativas acumuladas, terminar com o valor 100.
Figura 2.5: Ogiva para o tempo em segundos para carga de um aplicativo num sistema compartilhado
Estatstica Descritiva
2.4
17
MEDIDAS DE POSIO
Mdia Aritmtica
xi
i=1
X=
xi
i=1
X=
2.4.1.1
i=1
xi
=
Propriedades da mdia
Estatstica Descritiva
18
i=1
n
n
X
i=1
i=1
n
n
X
n
X
Xi +
n
X
Xi
i=1
i=1
nk
= X+
n
= X +k
X =
4749
614 + 985 + 625 + 885 + 668 + 972
=
= 791, 5
6
6
Utilizando a propriedade,
X = X + k = 789, 5 + 2 = 791, 5
2. Multiplicao ou diviso por uma constante
Seja (X1 , X2 , X3 , ..., Xn ) uma amostra aleatria de tamanho n, k uma constante e X a
mdia da amostra. Se multiplicarmos ou dividirmos todos os valores de uma varivel X
pela constante k, o valor de X MDIA fica multiplicada ou dividida pela constante.
n
X
kxi
i=1
= k
n
n
X
xi
i=1
= kX
Se no exemplo das lmpadas multiplicarmos a constante 2 a cada um dos valores da varivel
temos 1224, 1966, 1246, 1766, 1332, 1940.
X =
Estatstica Descritiva
19
Utilizando a propriedade,
X = kX = 2 789, 5 = 1579
3. Soma dos desvios
Seja (X1 , X2 , X3 , ..., Xn ) uma amostra aleatria de tamanho n e X a mdia da amostra.
Se subtrairmos cada valor da varivel X pelar mdia obtemos os desvios. A soma algbrica
dos desvios igual a zero
n
X
Xi X
n
X
i=1
i=1
n
X
i=1
n
n
X
Xi
n
X
Xi
i=1
i=1
nX
= X
n
= X X =0
No exemplo da lampda, temos:
Amostra
612
983
623
883
666
970
2.4.2
X
789,5
789,5
789,5
789,5
789,5
789,5
soma dos desvios
Desvio
-177,5
193,5
-166,5
93,5
-123,5
180,5
0
Mediana
Num conjunto de dados ordenados, a mediana (Md ) o valor que deixa metade da freqncia
abaixo dele. A mediana, como a mdia, possui a mesma unidade de cada observao.
A mediana pode ser obtida por meio da expresso:
Md =
X n+1
X n2 +X n+2
2
2
se n for mpar
se n for par
Estatstica Descritiva
20
Logo a Mediana igual ao elemento que est na quarta posio do conjunto de dados, assim
Md = 9
Exemplo: Considere o conjunto de dados: 1, 3, 8, 6, 2, 4.
Primeiro necessrio ordenar os dados: 1, 2, 3, 4, 6, 8. Como se de uma conjunto com n = 6
(par), ento
X n2 + X n+2
X 6 + X 6+2
X3 + X4
2
2
Md =
= 2
=
2
2
2
Logo para obter a mediana necessrio obter os elementos que esto na terceira e quarta
posio do conjunto de dados, assim:
Md =
2.4.3
3+4
= 3, 5
2
Moda
Mdia
Definio: Soma de todos os valores dividido pelo total de elementos do conjunto.
Vantagens: Reflete cada valor;Possui propriedades matemticas atraentes.
Limitaes: influenciada porvalores externos.
Quando usar:
1. Deseja-se obter a medida de posio que possui a maior estabilidade;
2. Houver necessidade de um tratamento algbrico posterior.
Mediana
Definio: Valor que divide o conjunto em duas partes iguais.
Vantagens: Menos sensvel a valores extremos que a mdia.
Limitaes: Difcil de determinar para grande quantidade de dados
Quando usar:
1. Deseja-se obter o ponto que divide o conjunto em partes iguais;
2. H valores extremos que afetam de maneira acentuada a mdia;
Moda
Estatstica Descritiva
21
Simetria
A determinao das medidas de posio permite discutir sobre a simetria da distribuio dos
dados.
Distribuio simtrica - X = Md = Mo
Distribuio assimtrica - ocorrem diferenas entre os valores da mdia, mediana e moda.
A assimetria pode ser:
direita - X > Md > Mo
esquerda - X < Md < Mo
2.4.6
Separatrizes
Alm das medidas de posio que estudamos, h outras que, consideradas individualmente,
no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores. Essas
medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo
nome genrico de separatrizes.
2.4.6.1
Quartis
Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais.
Estatstica Descritiva
22
Q1 =
2o quartil
EQ2 =
27
= 3, 5
4
Logo o quartil 2 est entre o 3o e o 4o elemento (3o antecede 3,5o e 4o posterior a ele.). Assim,
o 2o quartil ser dado pela mdia entre os 3o e o 4o elemento.
Q2 =
6+9
= 10, 5
2
3o quartil
EQ3 =
37
= 5, 25
4
Logo o quartil 3 est entre o 5o e o 6o elemento (5o antecede 5,25o e 6o posterior a ele.). Assim,
o 3o quartil ser dado pela mdia entre os 5o e o 6o elemento.
Q2 =
2.4.6.2
10 + 13
= 16, 5
2
Percentis ou Centis
O elemento que definir a ordem do percentil ser encontrado pelo emprego da expresso:
EP i =
em que:
i = nmero identificador do percentil;
n = nmero total de observaes;
in
100
Estatstica Descritiva
23
P90 =
2.4.7
2.4.7.1
Dados agrupados
Mdia
X=
f ai xi
i=1
n
X
f ai
i=1
em que
para variveis contnuas xi o ponto mdio da classe
f ai o freqncia absoluta de xi
A mdia calculada dos dados originais e dados agrupados podem ser diferentes, devido ao
erro de agrupamento. O erro de agrupamento obtido fazendo a diferena entre o valor obtido
pelos dados originais e o valor obtido pelos dados agrupados.
2.4.7.2
Mediana
EMd =
n+1
n
2
se n for mpar
se n for par
Estatstica Descritiva
24
n1
c
n2
em que:
LIi o limite inferior da classe mediana
c a amplitude da classe mediana
n1 a diferena entre a Posio da mediana e a freqncia acumulada da classe anterior a
classe mediana
n2 a freqncia absoluta da classe mediana
2.4.7.3
Moda
1
c
1 + 2
Quartil
in
4
n1
c
n2
Estatstica Descritiva
25
Percentil
in
100
n1
c
n2
em que:
LIi o limite inferior da classe percentlica
c a amplitude da classe percentlica
n1 a diferena entre a Posio do percentlica e a freqncia acumulada da classe anterior
a classe percentlica
n2 a freqncia absoluta da classe percentlica
2.4.7.6
Exemplo
Tabela 2.9: Dados ordenados, relativos ao tempo em segundos para carga de um aplicativo num
sistema compartilhado (30 observaes).
6,94
7,27
7,46
7,97
8,03
8,37
8,56
8,66
8,88
8,95
9,30
9,33
9,55
9,76
9,80
9,82
9,98
9,99
10,14 10,19 10,42 10,44 10,66 10,88
10,88 11,16 11,80 11,88 12,25 12,34
Assim,
n
X
X=
f ai xi
i=1
n
X
=
f ai
290, 55
= 9, 685
= 9, 68
30
i=1
Estatstica Descritiva
26
n1
5
c = 8, 97 + 1, 35 = 8, 97 + 0, 67 = 9, 64
n2
10
1
c
1 + 2
LIi = 8, 97;
c = 1, 35;
1 = 10 7 = 3;
2 = 10 6 = 4
Mo = LIi +
2.5
1
3
c = 8, 97 +
1, 35 = 8, 97 + 0, 58 = 9, 55
1 + 2
3+4
BOXPLOT
O grfico Boxplot (ou desenho esquemtico) uma anlise grfica que oferece a ideia da
posio, disperso, assimetria, caudas e dados discrepantes. Para constru-lo, desenhamos uma
"caixa"com o nvel superior dado pelo terceiro quartil (Q3 ) e o nvel inferior pelo primeiro quartil
Estatstica Descritiva
27
(Q1 ). A mediana (Q2 ) representada por um trao no interior da caixa e segmentos de reta so
colocados da caixa at dos limites inferior (LI) e superior (LS), dados por
LI = Q1 1.5dq
LS = Q3 + 1.5dq
em que dq = Q3 Q1 denominando diferena quartilica.
Para traarmos o boxplot utilizamos as seguintes etapas:
Contruir um retngulo de tal maneira que suas bases tm alturas correspondentes aos
primeiro e terceiro quartis da distribuio.
Cortar o retngulo por um segmento paralelo s bases, na altura correspondente mediana;
Traar um segmento paralelo ao eixo, partindo do ponto mdio da base superior do retngulo at o maior valor observado que NO supere LS;
Traar um segmento paralelo ao eixo, partindo do ponto mdio da base inferior do retngulo, at o menor valor que NO menor LI;
Case tenha valores que superior a LS ou inferior a LI, marcar os pontos, este valores so
considerados observaes discrepantes.
Podemos opcionalmente marca o valor da mdia;
Para o conjunto de dados do tempo de carga de um aplicativo temos:
M d = 9, 81
Q1 = 8, 71
Q3 = 10, 61
dq = 10, 61 8, 71 = 1, 9
LI = 8, 71 1, 5 1, 9 = 5, 86
LS = 10, 61 + 1, 5 1, 9 = 13, 46
Estatstica Descritiva
28
Figura 2.6: Boxplot para o tempo em segundos para carga de um aplicativo num sistema compartilhado
Estatstica Descritiva
2.6
29
MEDIDAS DE DISPERSO
Amplitude Total
Amplitude Total (A) a diferena entre o maior e o menor valor da amostra. Essa medida
bastante simples, e obtida pela expresso:
A = M ax M in
Para dados agrupados a amplitude total a diferena entre o ponto mdio da ltima e da
primeira classe.
Para expressar variabilidade a amplitude total no muito usada, pois baseia-se em apenas
dois dados.
2.6.2
A varincia baseada pela quadrado dos desvios dos dados em relao mdia. Esta medida
expressa na unidade dos dados ao quadrado.
Para a populao a varincia representada por
N
X
2 =
(xi )2
i=1
S2 =
xi X
i=1
n1
2
Estatstica Descritiva
30
2 =
(xi )2 f ai
i=1
k
X
f ai
i=1
S2 =
xi X
2
f ai
i=1
k
X
f ai 1
i=1
O desvio padro a raz quadrada positiva da varincia. Esta medida expressa na mesma
unidade dos dados.
Para a populao o desvio padro representada por
S=
S2
Estatstica Descritiva
2.6.2.1
31
Propriedades da Varincia
A varincia apresenta um conjunto vasto de propriedades, todas elas, sem dvida, de grande
utilidade no clculo do seu valor.
1. A varincia de uma constante k nula;
n
X
S2
2
i=1
n1
n
X
kX
(k k)2
i=1
n1
n
X
(0)2
i=1
n1
= 0
2. Somando-se ou subtraindo-se uma constante k a todos os dados a varincia no se altera.
Xi = Xi + k
S2
= X +k
n
X
2
Xi X
=
i=1
n1
n
X
i=1
n1
n
X
Xi + k X k
i=1
n
X
2
Xi + k (X + k)
n1
2
Xi X
i=1
= S2
n1
2
Estatstica Descritiva
32
3. Multiplicando-se todos os dados por uma constante k, a varincia fica multiplicada por k 2 .
Xi = kXi
= kX
n
X
S2
Xi X
2
i=1
n1
n
X
kXi kX
2
i=1
n1
n
X
k Xi X
2
i=1
n1
n
X
k 2 Xi X
2
i=1
n1
2 2
= k S
2.6.2.2
S2
= S2
S2
S =
2. Multiplicando-se todos os dados por uma constante k, a varincia fica multiplicada por k 2 .
Xi = kXi
S2
= k2 S 2
S =
k 2 S 2 = kS
2.6.3
Coeficiente de Variao
O coeficiente de variao (CV ) uma medida de disperso que expressa o desvio padro em
termos da mdia de forma percentual
CV = 100
S
X
Se as amostras tiverem unidade diferentes ou mdias diferentes o CV pode ser utilizado para
comparar a variabilidade entre duas amostras.
Estatstica Descritiva
2.6.4
33
O erro padro da mdia uma medida de disperso que d a preciso com que a mdia
populacional est sendo estimada. obtido pela frmula
S
S(X) =
n
em que:
S o desvio padro da amostra;
n o tamanho da amostra.
2.7
EXEMPLOS
S2 =
xi X
i=1
n1
2
(1 4)2 + (2 4)2 + ... + (8 4)2
=
= 3, 041666667
= 3, 04
25 1
O desvio padro
S=
S2 =
p
3, 04 = 1, 7435595
=2
O coeficiente de variao
CV = 100
S
2
= 100 = 50%
4
X
Dados Agrupados
Estatstica Descritiva
34
Tabela 2.12: Resumo da distribuio de freqncias, relativa ao tempo em segundos para carga
de um aplicativo num sistema compartilhado (30 observaes)
Classes
x
Frequencia x X (x X)f a
Absoluta
(fa)
6,27 ` 7,62
6,94
3
7,5076
22,5228
7,62 ` 8,97
8,29
7
1,9321
13,5247
8,97 ` 10,32 9,64
10
0,0016
0,016
10,32 ` 11,67 10,99
6
1,7161
10,2966
11,67 ` 13,02 12,34
4
7,0756
28,3024
Total
30
74,6625
Temos que a mdia X = 9, 68 e como se trata de uma amostra temos:
n
X
xi X
2
f ai
i=1
k
X
f ai 1
i=1
74, 6625
29
= 2, 5745689
= 2, 5746
=
O desvio padro
S=
S2 =
p
2, 5746 = 1, 604556
= 1, 60
O coeficiente de variao
CV = 100
S
1, 60
= 100
= 16, 53%
9, 68
X
NOES DE PROBABILIDADE
J vimos que para se obter informaes sobre alguma caracterstica da populao, podemos
utilizar uma amostra. Estudaremos agora a probabilidade, que uma ferramenta usada e necessria para se fazer ligaes entre a amostra e a populao, de modo que a partir de informaes
da amostra se possa fazer afirmaes sobre caractersticas da populao.
As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado evento.
O estudo das probabilidades importante pois elas so a base para o estudo estatstico
A teoria de probabilidades tem por objetivo o estudo de fenmenos aleatrios. Um fenmeno
chamado de aleatrio se ele tem a seguinte propriedade: quando observado repetidamente sob
as mesmas condies ele produz resultados diferentes. Mesmo que a chance da ocorrncia seja
alta, os resultados no so conhecidos antes de ocorrer, mas de certa forma, mantm uma certa
regularidade, o que permite determinar a chance de ocorrncia; a Probabilidade.
Exemplos:
Jogar uma moeda repetidamente e observar o resultado da face de cima;
Jogar um dado e observar o nmero mostrado na face superior;
Nmero de filhos de um casal;
Observao: quando a possibilidade de repetir o fenmeno est na mo do experimentador,
este fenmeno aleatrio chamado de experimento aleatrio.
3.1
Noes de Probabilidade
36
Noes de Probabilidade
3.2
37
PROBABILIDADE
3
1
n
= = = 0, 5 = 50%
N
6
2
P () = 0
5
= 0, 83 = 83%
6
3 4 2
5
+ = = 0, 83 = 83%
6 6 6
6
em que A B = {4, 6}
Probabilidade complementar
P (Ac ) = 1 P (A)
No exemplo do lanamento de um dado seja o evento A = {3, 4, 5, 6}, ento Ac = {1, 2},
logo
4
2
P (A) =
e P (Ac ) =
6
6
utilizando a regra da probabilidade complementar teriamos:
P (Ac ) = 1 P (A) = 1
4
64
2
=
=
6
6
6
Noes de Probabilidade
3.2.1
38
P (A B)
,
P (B)
P (B) 6= 0.
Isso significa que a probabilidade de A ocorrer, dado que B ocorreu, igual probabilidade
de ocorrncia simultnea de A e B dividida pela probabilidade de ocorrncia de B.
Exemplo: Na tabela a seguir temos dados referentes a alunos matriculados em trs cursos de
uma universidade em dado ano.
Tabela 3.1: Dados referentes a alunos de uma dada universidade.
Cursos
Sexo
Total
Feminino Masculino
Administrao
70
40
110
Psicologia
10
20
30
Geologia
20
15
35
Total
100
75
175
Qual a probabilidade de escolhermos um aluno ao acaso e ele ser:
Homem (H) e da Administrao (Adm)?
P (H Adm) =
40
= 0, 2285
175
=
= 0, 8285
175 175 175
175
Psicologia (P si) ou Geologia (Geo)?
P (P si Geo) = P (P si) + P (Geo) P (P si Geo)
30
35
65
=
+
0=
= 0, 3714
175 175
175
Noes de Probabilidade
39
P (P si M )
P (M )
10
175
100
175
10 175
10
=
= 0, 10
175 100
100
Das expresses acima resulta a regra do produto, que se refere ao clculo da probabilidade
do evento interseo,
P (A B) = P (A|B).P (B)
A ordem do condicionamento pode ser invertida. Para trs eventos, por exemplo, pode-se
escrever:
P (A B C) = P (A).P (B|A).P (C|A B)
(3.1)
rvores de probabilidade
A contruo de uma rvore de probabilidade fornece uma ferramenta muito til para a
soluo de problemas envolvendo duas ou mais etapas. A rvore consiste em uma representao
grfica na qual diversas possibilidades so representadas, juntamente com as respectivas probabilidades condicionadas a cada situao. Isso permite, pela utilizao direta da regra do produto
das probabilidades, associar a cada n terminal da rvore a respectiva probabilidade.
O uso das rvores de probabilidade ajudam e simplificam o entendimento da aplicao de
dois teoremas que sero apresentados a seguir, conforme ser visto no exemplo.
Exemplo: Em certo colgio, 5% dos homens e 2% das mulheres tm mais de 1,80m de altura.
Por outro lado, 40% dos estudantes so homens. Sorteando-se um estudante aleatoriamente,
qual a probabilidade de:
Ser mulher (M ) e ter mais de 1,80m?
P (M > 1, 80) = 0, 60 0, 02 = 0, 012
Ter mais de 1,80m?
P (> 1, 80) = P (M > 1, 80) + P (H > 1, 80)
P (H > 1, 80) = 0, 40 0, 05 = 0, 02
P (> 1, 80) = 0, 012 + 0, 02 = 0, 032
Noes de Probabilidade
40
3.3
0, 012
P (M > 1, 80)
=
= 0, 375
P (> 1, 80)
0, 032
VARIVEL ALEATRIA
Varivel Aleatria - varivel descritora de populaes, cujos valores so associados a probabilidades de ocorrncia.
Exemplo: Um estudante submetido a trs questes de mltipla escolha, em cada questo
tinha cinco alternativas. Logo a chance de acerta uma questo no chute 20%
Correto (C) - P (C) = 20% =
Errado (E) - P (E) = 80% =
1
5
4
5
Noes de Probabilidade
41
111
555
114
555
141
555
144
555
411
555
414
555
441
555
444
555
=
=
=
=
=
=
=
=
1
125
4
125
4
125
16
125
4
125
16
125
16
125
64
125
Pode-se construir uma tabela, em que X o nmero de questes corretas e f(x) a probabilidade de ocorrer o resultado X.
x
f(x)
0
64/125
1
48/125
2
12/125
3
1/125
uma funo f (x) que associa a cada valor x da varivel aleatria a sua respectiva probabilidade. Esta funo deve atender duas condies:
1. f (x) 0;
X
2.
f (x) = 1
Noes de Probabilidade
42
x
f(x)
0
64/125
1
48/125
2
12/125
3
1/125
f (x) =
64
48
12
1
125
+
+
+
=
=1
125 125 125 125
125
n
X
P (X = xi )
i=1
0
64/125
1
48/125
2
12/125
3
1/125
0
64/125
1
112/125
2
124/125
3
125/125
Definio: Seja X uma V.A.D., com valores possveis x1, x2, ..., xn; Seja P (xi ) = P (X =
xi ), i = 1, 2, ..., n. Ento, o valor esperado de X (ou Esperana Matemtica de X), denotado por
E(X) definido como
X
E(X) =
xi P (xi )
i=1
Noes de Probabilidade
43
2 , da
Definio: Seja X uma V.A.D. . Define-se a varincia de X, denotada por V (X) ou X
seguinte maneira:
V (X) =
i=1
V (x) =
4
X
i=1
4
X
xi P (xi ) = 0
48
12
1
48
24
3
64
+1
+2
+3
=0+
+
+
= 0, 60
125
125
125
125
125 125 125
i=1
48
12
1
64
+ (1 0, 60)2
+ (2 0, 60)2
+ (3 0, 60)2
125
125
125
125
64
48
12
1
+ 0, 16
+ 1, 96
+ 5, 76
125
125
125
125
23, 04 7, 68 23, 52 5, 76
60
=
+
+
+
=
= 0, 48
125
125
125
125
125
V (X) = E(X 2 ) (E(X))2
4
X
48
12
1
64
48
12
1
64
E(X 2 ) =
x2i P (xi ) = 02
+ 12
+ 22
+ 32
=0
+1
+4
+9
125
125
125
125
125
125
125
125
= 0, 36
i=1
48
48
9
105
+
+
=
= 0, 84
125 125 125
125
V (X) = 0, 84 (0, 60)2 = 0, 84 0, 36 = 0, 48
= 0+
3.3.2
Noes de Probabilidade
44
f (x)dx
P (a < x < b) =
a
No casa das variveis contnuas a funo de distribuio acumulada, que definida por
Z
F (x) = P (X x) =
f (x)dx
Ex.: O tempo gasto, em minutos, por um estudante para responder a uma questo de um
teste uma varivel aleatria contnua com funo dada por
(
f (x) =
x
4
para 1 x 3
0 para outros valores
2.
R
f (x)dx =
x
dx =
4
Z
1
x
1
dx =
4
4
Z
1
1 x2
xdx =
4 2
3
1
1
=
4
32 12
2
2
1
=
4
9 1
2 2
=
18
=1
42
Noes de Probabilidade
45
x
dx
4
Z
P (2 < x < 3) =
2
=
=
=
=
=
3.3.2.1
1
4
xdx
2
3
x2
1
4 2 2
1 32 22
4 2
2
1 9 4
4 2 2
15
5
= = 0, 625
42
8
Definio: Seja X uma V.A. continua, com fdp f (x). Ento, o valor esperado de X (ou
Esperana Matemtica de X), denotado por E(X) definido como
Z
E(X) =
xf (x)dx
V (X) =
em que
Z
E(X ) =
x2 f (x)dx
x
x dx = 2, 17
4
1
Z
Z 3
x
2
V (X) =
(x E(X)) f (x)dx =
(x 2, 17)2 dx = 0, 30
4
1
Z
Z 3
x
E(X 2 ) =
x2 f (x)dx =
x2 dx = 5, 00
4
1
E(X) =
xf (x)dx =
Noes de Probabilidade
3.4
46
A distribuio discreta descreve quantidades aleatrias (dados de interesse) que podem assumir valores particulares e os valores so finitos. Por exemplo, uma varivel aleatria discreta
pode assumir somente os valores 0 e 1, ou qualquer inteiro no negativo, etc.
Exemplos
1. Lana-se uma moeda 10 vezes e anota-se o nmero de caras. Este nmero pode ser 0, 1, 2
...10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um
determinado produto. O nmero de pessoas que compram o produto varia de 0 a 200.
3. Conta-se o nmero de acidentes que ocorrem em uma rodovia num feriado prolongado. O
nmero de acidentes em questo pode ser: 0, 1, 2... Como no temos um valor que limite
esse nmero, supomos que o nmero de acidentes qualquer inteiro no negativo.
4. Nmero de chamadas telefnicas que chegam a uma central em um intervalo de tempo.
Existem vrias distribuies discretas ou modelos probabilsticos discretos que podem ser
usados em diversas situaes prticas. O problema determinar qual modelo mais adequado
para a situao em estudo, e como aplic-lo adequadamente.
3.4.1
a mais simples das distribuies discretas e recebe o nome de uniforme porque todos os
valores da varivel aleatria so assumidos com a mesma probabilidade.
Exemplo o lanamento de um dado no viciado, definindo como X, a varivel aleatria que
representa a face voltada para cima, X assume os valores x = 1, 2, 3, 4, 5, 6 com a mesma probabilidade 1/6.
A distribuio uniforme neste caso dada por
f (x) =
1
para x = 1, 2, 3, 4, 5, 6
6
1
para x = x1 , x2 , x3 , ..., xk
k
k numero de termos.
Verifica-se ento que f (x) depende de k.
3.4.1.1
1. Mdia = k+1
2
No exemplo dos dados =
6+1
2
= 3, 5
2. Varincia 2 = k 121
No exemplo dos alrgicos sigma2 ==
62 1
12
= 2, 92 s
Noes de Probabilidade
3.4.2
47
Distribuio Bernoulli
Na prtica existem muitos experimentos que admitem apenas dois resultados. Exemplos:
1. Uma pea classificada como boa ou defeituosa;
2. Um entrevistado concorda ou no com a afirmao feita;
3. Um servidor de internet est ativo ou no;
4. Numa linha de produo observa-se se um item defeituoso ou no.
Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas
do tipo sucesso-fracasso.
Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma varivel aleatria com distribuio Bernoulli. Neste caso, consideramos uma experincia com dois possveis
resultados
Sucesso P (sucesso) = p;
Fracasso P (f racasso) = q.
Temos que:
= {Sucesso, F racasso} P () = 1
p+q =1 q =1p
3.4.2.1
1. Mdia = p
No exemplo dos dados =
6+1
2
= 3, 5
2. Varincia 2 = pq
No exemplo dos alrgicos sigma2 ==
3.4.3
62 1
12
= 2, 92 s
Distribuio Binomial
Na maior parte das vezes, so realizados n ensaios de Bernoulli. O interesse est no nmero
X de ocorrncias de sucessos.
Exemplos:
1. lanar uma moeda cinco vezes e observar o nmero de caras;
2. numa linha de produo, observar dez itens, e verificar quantos so defeituosos;
3. verificar, num dado instante, o nmero de processadores ativos, num sistema com multiprocessadores;
Uma experimento binomial dado da seguinte forma:
1. consiste em n ensaios de Bernoulli;
Noes de Probabilidade
48
n
n!
=
=
x! (n x)!
x
x = 0, 1, 2, 4, 5
0 5
5!
1
1
0! (5 0)! 2
2
1
= 0, 0313 ou 3, 13%
32
2. x = 2 homens
f (x) = C25 p2 q 52
=
=
2 3
1
1
5!
2! (5 2)! 2
2
20 1 1
10
=
= 0, 3125 ou 31, 25%
2 48
32
Exemplo: Lanada oito moedas (ou uma moeda oito vezes), qual a chance de obter
Trs caras?
no mximo trs caras?
no mnimo quatro caras?
Noes de Probabilidade
49
A varivel aleatria x neste caso o nmero de caras obtidos no lanamento, logo neste caso
o sucesso sair cara nas moedas lanadas. Assim temos:
n = 8, p =
1
= 0, 5 q = 1 q = 1 0, 5 = 0, 5
2
A funo de probabilidade
f (x) = Cxn px q nx
Probabilidade de sair trs caras
P [X = 3] = C38 p3 q 83
8!
=
(0, 5)3 (0, 5)5
3! (8 3)!
= 56 0, 125 0, 03125 = 0, 2187 ou 21, 87%
Probabilidade de sair no mximo trs caras
P [X 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]
P [X = 0] = C08 p0 q 80 = 0, 0039
P [X = 1] = C18 p1 q 81 = 0, 0313
P [X = 2] = C28 p2 q 82 = 0, 1094
P [X = 3] = 0, 2187
P [X 3] = 0, 0039 + 0, 0313 + 0, 1094 + 0, 2187 = 0, 3633 ou 36, 33%
Probabilidade de sair no mnimo quatro caras
P [X 4] = P [X = 4] + P [X = 5] + P [X = 6] + P [X = 7] + P [X = 8]
ou
P [X 4] = 1 P [X < 4] = 1 (P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3])
= 1 0, 3633 = 0, 6367 ou 63, 67%
3.4.3.1
1. Mdia = np
2. Varincia 2 = npq
3. Desvio Padro =
npq
Noes de Probabilidade
50
2. Varincia 2 = 8 0, 5 0, 5 = 2
3. Desvio Padro =
3.4.4
npq =
2 = 1, 41
Distribuio Hipergeomtrica
f (x) =
Cxk C(nx) ,
CnN
x = 0, 1, 2, 3, ....
em que:
x uma varivel aleatria discreta;
N quantidade de itens;
n tamanho da amostra;
k numero de sucessos;
Exemplo: Pequenos motores eltricos so expedidos em lotes de 50 unidades. Antes que
uma remessa seja aprovada, um inspetor escolhe 5 desses motores e os inspeciona. Se nenhum
dos motores inspecionados for defeituoso, o lote aprovado. Se um ou mais forem verificados
defeituosos, todos os motores da remessa so inspecionados. Suponha que existam, de fato,
trs motores defeituosos no lote. Qual a probabilidade de que a inspeo de todo o lote seja
necessria?
Se fizermos igual a X o numero de motores defeituosos encontrados, inspeo de todo o lote
seja necessria se X 1
Noes de Probabilidade
51
P [X = x] =
Cxk C(nx) ,
CnN
P [X 1] = 1 P [X < 1] = 1 P [X = 0])
(503)
C03 C(50) ,
C03 C547 ,
= 0, 7239
C550
C550
P [X 1] = 1 0, 7239 = 0, 2761
P [X = 0] = =
n
Quando se tem N
< 0, 1, pode-se utilizar a distribuio binomial para aproximar a distribuio hipergeomtrica.
3.4.4.1
1. Considerando p =
k
e q =1p
N
2. Mdia = np
3. Varincia 2 = npq
3.4.5
N n
N 1
Distribuio Geomtrica
Noes de Probabilidade
52
3.4.6
q
p2
Distribuio de Poisson
x
, x = 0, 1, 2, 3, ....
x!
em que:
x uma varivel aleatria discreta;
e base dos logaritmos neperianos (2,718...)
- mdia da distribuio (p)
Noes de Probabilidade
53
Exemplo: O nmero mdio de dias por ano que ocorrem chuvas acima de 50mm.h1 em uma
determinada regio 1,5. Qual a probabilidade de haver mais de dois dias com chuvas acima
dessa intensidade.
x
x!
1 P [X 2] = 1 (P [X = 0] + P [X = 1] + P [X = 2])
1, 50
= e1,5
= 0, 2231
0!
1, 51
= e1,5
= 0, 3347
1!
1, 52
= e1,5
= 0, 2510
2!
1 (0, 2231 + 0, 3347 + 2510) = 1 0, 8088 = 0, 1912 ou 19, 12%
P [X = x] = e
P [X > 2] =
P [X = 0] =
P [X = 1] =
P [X = 2] =
P [X > 2] =
A distribuio de Poisson tambm conhecida na prtica com lei dos eventos raros. Evento
raro pode ser considerado quando n 50 e p 0, 10.Nestes casos podemos utilizar a distribuio
de Poisson para probabilidades de situaes que seriam utilizadas uma distribuio binomial.
Exemplo: A probabilidade de que um indivduo apresente reao alrgica aps a aplicao
de um soro de 0,002. Esse mesmo soro foi aplicado a um grupo de 1800 pessoas, qual a
probabilidade de que duas pessoas apresentem reao alrgica? n=1800 p=0,002
= 1800 0, 002 = 3, 6 alrgicos
P [X = x] = e
x
x!
P [X = 2] = = e3,6
3.4.6.1
3, 62
0, 1770ou 17, 70%
2!
1. Mdia =
No exemplo dos alrgicos = 3, 6
2. Varincia 2 =
No exemplo dos alrgicos 2 = 3, 6 s
3. Desvio Padro =
No exemplo da sementes = 3, 6 = 1, 9
Noes de Probabilidade
3.5
54
P (X a) = F (a) =
f (x)dx
Z
P (a X b) = F (b) F (a) =
f (x)dx
a
P (X > a) = 1 F (a)
P (X = a) = 0, para todo o valor de a
3.5.1
Distribuio Uniforme
Noes de Probabilidade
55
1
ba
para x (a, b)
para x 6 (a, b)
em que:
a o menor valor assumido por x;
b o maior valor assumido por x;
A representao grfica de f (x) a seguinte:
F (x) =
0
xa
ba
se x < a
se a x b
se x > b
rea de um retngulo
A = B.h
= (b a)
1
ba
A = 1
Outra forma de ver a rea:
Z
A =
=
=
=
1
dx
a ba
Z b
1
dx
ba a
b
1
x
ba a
1
(b a) = 1
ba
Noes de Probabilidade
56
Exemplo. Se uma VAC assume qualquer valor no intervalo (2, 3) com a mesma probabilidade, a distribuio uniforme tem a seguinte funo de densidade:
(
f (x) =
1
3(2)
1
5
para x (2, 3)
para x 6 (2, 3)
3.5.1.1
a+b
2
2 + 3
No exemplo =
= 0, 5
2
1. Mdia =
(b a)2
12
(3 (2))2
25
2
No exemplo =
=
= 2, 08
12
12
2. Varincia 2 =
ba
3. Desvio Padro =
12
3 (2)
5
No exemplo =
= = 1, 44
12
12
3.5.2
Distribuio Exponencial
x0
Noes de Probabilidade
57
x0
Exemplo: Suponha que uma mquina falhe em mdia uma vez a cada dois anos. Calcule a
probabilidade da mquina falhar durante o prximo ano. Tempos = 12 = 0, 5, e X tempo para
falhar, temos P (X 1)
P (X 1) = F (1) = 1 e0,5 = 0, 3935
3.5.2.1
1. Mdia =
2. Varincia 2 =
3.5.3
1
2
Distribuio Normal
(x )2
exp
, < x <
2 2
2 2
1
Noes de Probabilidade
58
(x )2
exp
dx
2 2
2 2
1
Devido a dificuldade de resoluo dessa integral, procurou-se mtodos alternativos para obteno das probabilidades. Uma das formas mais utilizadas por meio de tabela de probabilidades
de uma distribuio Normal padro (Z).
Uma propriedade interessante de uma varivel aleatria X que segue qualquer distribuio
Normal a de que ela pode ser transformada em uma varivel normal padro Z, por meio da
expresso
x
z=
P (X > 11000), primeiro vamos padronizar esta varivel, sendo = 2 = 1000000 = 1000
Primeiro vamos padronizar esta varivel
z=
x
11000 10000
=
= 1, 0
1000
Assim,
P (X > 11000) = (Z > 1, 0)
Noes de Probabilidade
59
Como a tabela me fornece apenas o valor de que est entre 0 e z, ento temos
P (X > 11000) = P (Z > 1, 0) = 0, 5 P (0 < Z < 1, 0) = 0, 5 0, 3413 = 0, 1587
Assim a probabilidade da empresa pagar o bonus de 0,1587.
Um membro da direo da fbrica diz que se a empresa tiver produo mdia diria entre
9000 e 9500 gales em um ms anterior, no tem como pagar o bnus mesmo que o funcionrios
tenha excedido os 11000gales. Nesse caso Qual a probabilidade no pagar o bnus.
Quero saber P (9000 < x < 9500), primeiro vamos padronizar esta varivel
z1 =
x1
9000 10000
x2
9500 10000
=
= 1 z2 =
=
= 0, 5
1000
1000
Ento
P (9000 < x < 9500) = P (1 < z < 0, 5)
Como na tabela tem apenas valores positivos e a distribuio normal simtrica temos que
P (1 < z < 0, 5) = P (0, 5 < z < 1, 0)
Noes de Probabilidade
60
Qual a probabilidade da empresa produzir entre 9500 e 11000 gales por dia. Utilizando as
padronizaes j realizadas temos que
P (9000 < x < 11000) = P (0, 5 < z < 1, 0)
Assim,
P (0, 5 < z < 1, 0) = P (0 < z < 1, 0) + P (0 < z < 0, 5) = 0, 3413 + 0, 1915 = 0, 5328
3.5.3.1
A distribuio normal pode ser utilizada como uma aproximao das distribuies Binomial e
de Poisson. Esta aproximao se torna cada vez melhor quando o tamanho da amostra n cresce.
Recomenda-se usar a aproximao normal, quando:
Distribuio Binomial - se np e nq 5
Distribuio Poisson - se np 5
No uso da aproximao normal deve-se lembrar que as distribuies Binomial e de Poisson
so de variveis aleatrias discretas (s existe probabilidade para valores inteiros). Nestes casos
recomenda-se utilizar a correo de continuidade x 0, 5 e x + 0, 5.
Exemplo: Sabe-se que o poder germinativo das sementes de uma certa variedade de milho
de 30%. Semeando 30 destas sementes, qual a probabilidade de germinar mais de cinco semente.
Temos n = 30 e p = 0, 30 e q = 0, 7
A mdia = np = 30 0, 30 = 9 e a varincia 2 = npq = 100 0, 30 0, 70 = 6, 3
Noes de Probabilidade
61
Queremos P (X > 5), utilizando a correo de continuidade P (X > 5, 5). Vamos padronizar
z=
x
5, 5 9
=
= 1, 39
6, 3
Assim,
P (X > 5, 5) = P (Z > 1, 39) = 0, 5 + P (0 < Z < 1, 39) = 0, 5 + 0, 4177 = 0, 9177
Exemplo: Numa lmina verificou-se que existiam em mdia 27,6 bactrias/cm2. Qual a
probabilidade de se encontrar mais de 35 bactrias por centmetro quadrado?
Temos = 27, 6
Queremos P (X > 35), utilizando a correo de continuidade P (X > 35, 5). Vamos padronizar
35, 5 27, 6
x
=
= 1, 50
z=
27, 6
Assim,
P (X > 35, 5) = P (Z > 1, 50) = 0, 5 P (0 < Z < 1, 50) = 0, 5 0, 4332 = 0, 0668
Noes de Probabilidade
62
Tabela 3.2: Distribuio Normal - probabilidade do valor de z padronizado estar entre 0 e o valor
tabulado nas margens
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0,00
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,4991
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,4991
0,4994
0,4995
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,03
0,0120
0,0517
0,0910
0,1293
0,1664
0,2019
0,2357
0,2673
0,2967
0,3238
0,3485
0,3708
0,3907
0,4082
0,4236
0,4370
0,4484
0,4582
0,4664
0,4732
0,4788
0,4834
0,4871
0,4901
0,4925
0,4943
0,4957
0,4968
0,4977
0,4983
0,4988
0,4991
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,04
0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2704
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495
0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,05
0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505
0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,06
0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,07
0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,4992
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,08
0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,4993
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,09
0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,4999
0,5000
Noes de Probabilidade
3.6
63
DISTRIBUIES AMOSTRAIS
Ao retirarmos uma amostra aleatria de uma populao e calcularmos a partir desta amostra
qualquer quantidade, encontramos a estatstica, ou seja, chamaremos os valores calculados em
funo dos elementos da amostra de estatsticas.
3.6.1
Se considerarmos o processo de seleo de uma amostra aleatria simples como um experimento, a mdia da amostra X a descrio numrica do resultado do experimento. Assim, a
mdia da amostra X uma varivel aleatria. Como resultado, tal como outras variveis aleatrias, X tem uma mdia ou um valor esperado, uma varincia e uma distribuio de probabilidade.
Como os valores possveis de X so os resultados de diferentes amostras aleatrias simples, a
distribuio da probabilidade de X chamada de distribuio amostral. Pode-se assim dizer que
a mdia aleatria X o valor esperado de , isto , E(X) = , em que a mdia da populao.
2 a varincia da distribuio de amostragem de X; por propriedade da varincia est
Seja X
2
2 =
sera X
n
3.6.1.1
Noes de Probabilidade
64
Exemplo: Uma industria eltrica fabrica lmpadas que tm vida til distribuda com mdia
de 800horas e varincia igual 1600(horas)2 . Qual a probabilidade de uma amostra aleatria de
tamanho n = 64 ter vida til superio a 806, 65horas
2 = 1600 ,
Temos que = 800 e 2 = 1600 e = 40, ento X = 800 e X
64
Queremos P (X > 10, 0), primeiro vamos padronizar
z=
806, 65 800
40
64
6, 65
40
8
= 1, 33
Ento:
P (X > 806, 65) = P (z > 1, 33) = 0, 5 P (0 < z < 1, 33) = 0, 5 0, 4082 = 0, 0918
3.6.1.2
Distribuio t de student
t=
S/ n
segue uma distribuio t de Student com = n 1 graus de liberdade, e a funo de densidade
dada por
( +1
)
2
( +1
)
t2
2
f (t) =
1
+
,
( 2 )
Grau de liberdade pode ser entendido como nmero de termos independentes (dimenso da
amostra) a serem avaliados na populao.
Algumas caractersticas da distribuio t de student:
Noes de Probabilidade
65
Exemplo: Seja uma amostra n = 15. Qual o valor de t acima do qual tem-se 5% de
probabilidade. = 0, 05, = 15 1 = 14, pela tabela temos que t=1,761
Noes de Probabilidade
3.6.2
66
Considere que uma populao a proporo de elementos que portadores de certa caracterstica
p . Definindo uma varivel aleatria, da seguinte maneira
(
X=
Y
p =
=
n
xi
i=1
E[p] = E
1
1
E[Y ] = np = p
n
n
1
1
pq
E[Y ] = 2 npq =
2
n
n
n
Assim, pelo Teorema Limite Central, quando n grande (n > 30), a proporo amostral p de
sucessos em n ensaios de Bernoulli tem distribuio aproximadamente normal com mdia = p
e varincia 2 = pq
n , e assim podemos utilizar a padronizao:
z=
p
p p
= q
pq
exemplo:
Noes de Probabilidade
3.6.3
3.6.3.1
67
H casos em que se est mais interessado na varincia do que na mdia da amostra. Por
exemplo, em filas de espera. Mesmo conhecendo-se o tempo mdio de espera, a informao do
grau de variabilidade deste tempo importante. A distribuio usada neste caso conhecida
como Distribuio Qui-Quadrado, definida como:
2 =
(n 1)S 2
2
1
2/2 (/2)
Da mesma forma que a distribuio t, existe uma curva para distribuio Qui-quadrado para
cada tamanho de amostra (n) e o valor = n 1 (nmero de graus de liberdade) usado para
obteno de valores na tabela.
Exemplo: Uma amostra com n = 15. Qual o valor que deixa sua direita 5% da rea?
= 0, 05, = 15 1 = 14, pela tabela temos que t=1,761
3.6.3.2
Distribuio F
A distribuio F est entre aquela distribuies de probabilidade mais importantes na estatstica, tem maior destaque na rea de experimentao agrcola. Essa distribuio definida pela
Noes de Probabilidade
68
S12 12
S22 22
f (x) =
1
2
1 +2
2
1 21
2
2
1+
1
1
2
1 x
2
1 +2
2
Para se obter valores tabelados da distribuio F, necessrio observar dois graus de liberadade 1 = n1 1 e 2 = n2 1, o primeiro associado varincia amostral do numerador, e o
segundo associado varincia amostral do denominador.
A tabela de F informa o valor acima do qual se encontra a area e existe uma tabela para
cada valor e diferentes combinaes de 1 e 2 .
Noes de Probabilidade
69
0,250
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,681
0,679
0,679
0,678
0,677
0,677
0,676
0,675
0,675
0,675
0,200
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,851
0,849
0,848
0,846
0,845
0,845
0,843
0,842
0,842
0,842
0,150
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,050
1,047
1,045
1,043
1,042
1,041
1,039
1,038
1,037
1,037
0,100
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,299
1,296
1,292
1,290
1,289
1,285
1,283
1,283
1,282
0,050
0,025
6,314 12,706
2,920
4,303
2,353
3,182
2,132
2,776
2,015
2,571
1,943
2,447
1,895
2,365
1,860
2,306
1,833
2,262
1,812
2,228
1,796
2,201
1,782
2,179
1,771
2,160
1,761
2,145
1,753
2,131
1,746
2,120
1,740
2,110
1,734
2,101
1,729
2,093
1,725
2,086
1,721
2,080
1,717
2,074
1,714
2,069
1,711
2,064
1,708
2,060
1,706
2,056
1,703
2,052
1,701
2,048
1,699
2,045
1,697
2,042
1,684
2,021
1,676
2,009
1,671
2,000
1,664
1,990
1,660
1,984
1,658
1,980
1,651
1,970
1,648
1,965
1,647
1,963
1,646
1,962
0,010
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,403
2,390
2,374
2,364
2,358
2,342
2,334
2,332
2,330
0,005
63,656
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,678
2,660
2,639
2,626
2,617
2,596
2,586
2,583
2,581
0,001
318,289
22,328
10,214
7,173
5,894
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,307
3,261
3,232
3,195
3,174
3,160
3,125
3,107
3,102
3,098
Noes de Probabilidade
70
0,995
3,93E-05
0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461
13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328
0,990
1,57E-04
0,020
0,115
0,297
0,554
0,872
1,239
1,647
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,878
13,565
14,256
14,953
22,164
29,707
37,485
45,442
53,540
61,754
70,065
0,975
0,001
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791
24,433
32,357
40,482
48,758
57,153
65,647
74,222
0,950
0,004
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188
51,739
60,391
69,126
77,929
0,900
0,016
0,211
0,584
1,064
1,610
2,204
2,833
3,490
4,168
4,865
5,578
6,304
7,041
7,790
8,547
9,312
10,085
10,865
11,651
12,443
13,240
14,041
14,848
15,659
16,473
17,292
18,114
18,939
19,768
20,599
29,051
37,689
46,459
55,329
64,278
73,291
82,358
0,750
0,102
0,575
1,213
1,923
2,675
3,455
4,255
5,071
5,899
6,737
7,584
8,438
9,299
10,165
11,037
11,912
12,792
13,675
14,562
15,452
16,344
17,240
18,137
19,037
19,939
20,843
21,749
22,657
23,567
24,478
33,660
42,942
52,294
61,698
71,145
80,625
90,133
0,500
0,455
1,386
2,366
3,357
4,351
5,348
6,346
7,344
8,343
9,342
10,341
11,340
12,340
13,339
14,339
15,338
16,338
17,338
18,338
19,337
20,337
21,337
22,337
23,337
24,337
25,336
26,336
27,336
28,336
29,336
39,335
49,335
59,335
69,334
79,334
89,334
99,334
0,250
1,323
2,773
4,108
5,385
6,626
7,841
9,037
10,219
11,389
12,549
13,701
14,845
15,984
17,117
18,245
19,369
20,489
21,605
22,718
23,828
24,935
26,039
27,141
28,241
29,339
30,435
31,528
32,620
33,711
34,800
45,616
56,334
66,981
77,577
88,130
98,650
109,141
0,100
2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256
51,805
63,167
74,397
85,527
96,578
107,565
118,498
0,050
3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773
55,758
67,505
79,082
90,531
101,879
113,145
124,342
0,025
5,024
7,378
9,348
11,143
12,832
14,449
16,013
17,535
19,023
20,483
21,920
23,337
24,736
26,119
27,488
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,195
44,461
45,722
46,979
59,342
71,420
83,298
95,023
106,629
118,136
129,561
0,010
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
63,691
76,154
88,379
100,425
112,329
124,116
135,807
0,005
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,300
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,558
46,928
48,290
49,645
50,994
52,335
53,672
66,766
79,490
91,952
104,215
116,321
128,299
140,170
Noes de Probabilidade
71
Tabela 3.5: Limites unilaterais de F ao nvel de 10% de probabilidade com os graus de liberdade
1 e 2
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240
1
39,863
8,526
5,538
4,545
4,060
3,776
3,589
3,458
3,360
3,285
3,225
3,177
3,136
3,102
3,073
2,975
2,881
2,835
2,809
2,791
2,748
2,727
2
49,500
9,000
5,462
4,325
3,780
3,463
3,257
3,113
3,006
2,924
2,860
2,807
2,763
2,726
2,695
2,589
2,489
2,440
2,412
2,393
2,347
2,325
3
53,593
9,162
5,391
4,191
3,619
3,289
3,074
2,924
2,813
2,728
2,660
2,606
2,560
2,522
2,490
2,380
2,276
2,226
2,197
2,177
2,130
2,107
4
55,833
9,243
5,343
4,107
3,520
3,181
2,961
2,806
2,693
2,605
2,536
2,480
2,434
2,395
2,361
2,249
2,142
2,091
2,061
2,041
1,992
1,968
5
57,240
9,293
5,309
4,051
3,453
3,108
2,883
2,726
2,611
2,522
2,451
2,394
2,347
2,307
2,273
2,158
2,049
1,997
1,966
1,946
1,896
1,871
12
60,705
9,408
5,216
3,896
3,268
2,905
2,668
2,502
2,379
2,284
2,209
2,147
2,097
2,054
2,017
1,892
1,773
1,715
1,680
1,657
1,601
1,573
13
60,903
9,415
5,210
3,886
3,257
2,892
2,654
2,488
2,364
2,269
2,193
2,131
2,080
2,037
2,000
1,875
1,754
1,695
1,660
1,637
1,580
1,552
14
61,073
9,420
5,205
3,878
3,247
2,881
2,643
2,475
2,351
2,255
2,179
2,117
2,066
2,022
1,985
1,859
1,737
1,678
1,643
1,619
1,562
1,533
15
61,220
9,425
5,200
3,870
3,238
2,871
2,632
2,464
2,340
2,244
2,167
2,105
2,053
2,010
1,972
1,845
1,722
1,662
1,627
1,603
1,545
1,516
20
61,740
9,441
5,184
3,844
3,207
2,836
2,595
2,425
2,298
2,201
2,123
2,060
2,007
1,962
1,924
1,794
1,667
1,605
1,568
1,543
1,482
1,451
1
6
58,204
9,326
5,285
4,010
3,405
3,055
2,827
2,668
2,551
2,461
2,389
2,331
2,283
2,243
2,208
2,091
1,980
1,927
1,895
1,875
1,824
1,799
1
30
62,265
9,458
5,168
3,817
3,174
2,800
2,555
2,383
2,255
2,155
2,076
2,011
1,958
1,912
1,873
1,738
1,606
1,541
1,502
1,476
1,409
1,376
7
58,906
9,349
5,266
3,979
3,368
3,014
2,785
2,624
2,505
2,414
2,342
2,283
2,234
2,193
2,158
2,040
1,927
1,873
1,840
1,819
1,767
1,742
8
59,439
9,367
5,252
3,955
3,339
2,983
2,752
2,589
2,469
2,377
2,304
2,245
2,195
2,154
2,119
1,999
1,884
1,829
1,796
1,775
1,722
1,696
9
59,858
9,381
5,240
3,936
3,316
2,958
2,725
2,561
2,440
2,347
2,274
2,214
2,164
2,122
2,086
1,965
1,849
1,793
1,760
1,738
1,684
1,658
10
60,195
9,392
5,230
3,920
3,297
2,937
2,703
2,538
2,416
2,323
2,248
2,188
2,138
2,095
2,059
1,937
1,819
1,763
1,729
1,707
1,652
1,625
11
60,473
9,401
5,222
3,907
3,282
2,920
2,684
2,519
2,396
2,302
2,227
2,166
2,116
2,073
2,037
1,913
1,794
1,737
1,703
1,680
1,625
1,598
40
62,529
9,466
5,160
3,804
3,157
2,781
2,535
2,361
2,232
2,132
2,052
1,986
1,931
1,885
1,845
1,708
1,573
1,506
1,465
1,437
1,368
1,332
50
62,688
9,471
5,155
3,795
3,147
2,770
2,523
2,348
2,218
2,117
2,036
1,970
1,915
1,869
1,828
1,690
1,552
1,483
1,441
1,413
1,340
1,302
60
62,794
9,475
5,151
3,790
3,140
2,762
2,514
2,339
2,208
2,107
2,026
1,960
1,904
1,857
1,817
1,677
1,538
1,467
1,424
1,395
1,320
1,281
120
63,061
9,483
5,143
3,775
3,123
2,742
2,493
2,316
2,184
2,082
2,000
1,932
1,876
1,828
1,787
1,643
1,499
1,425
1,379
1,348
1,265
1,219
240
63,194
9,487
5,138
3,768
3,114
2,732
2,482
2,304
2,172
2,069
1,986
1,918
1,861
1,813
1,771
1,626
1,478
1,402
1,354
1,321
1,232
1,180
Noes de Probabilidade
72
1
161,448
18,513
10,128
7,709
6,608
5,987
5,591
5,318
5,117
4,965
4,844
4,747
4,667
4,600
4,543
4,351
4,171
4,085
4,034
4,001
3,920
3,880
2
199,500
19,000
9,552
6,944
5,786
5,143
4,737
4,459
4,256
4,103
3,982
3,885
3,806
3,739
3,682
3,493
3,316
3,232
3,183
3,150
3,072
3,033
3
215,707
19,164
9,277
6,591
5,409
4,757
4,347
4,066
3,863
3,708
3,587
3,490
3,411
3,344
3,287
3,098
2,922
2,839
2,790
2,758
2,680
2,642
4
224,583
19,247
9,117
6,388
5,192
4,534
4,120
3,838
3,633
3,478
3,357
3,259
3,179
3,112
3,056
2,866
2,690
2,606
2,557
2,525
2,447
2,409
5
230,162
19,296
9,013
6,256
5,050
4,387
3,972
3,687
3,482
3,326
3,204
3,106
3,025
2,958
2,901
2,711
2,534
2,449
2,400
2,368
2,290
2,252
12
243,906
19,413
8,745
5,912
4,678
4,000
3,575
3,284
3,073
2,913
2,788
2,687
2,604
2,534
2,475
2,278
2,092
2,003
1,952
1,917
1,834
1,793
13
244,690
19,419
8,729
5,891
4,655
3,976
3,550
3,259
3,048
2,887
2,761
2,660
2,577
2,507
2,448
2,250
2,063
1,974
1,921
1,887
1,803
1,761
14
245,364
19,424
8,715
5,873
4,636
3,956
3,529
3,237
3,025
2,865
2,739
2,637
2,554
2,484
2,424
2,225
2,037
1,948
1,895
1,860
1,775
1,733
15
245,950
19,429
8,703
5,858
4,619
3,938
3,511
3,218
3,006
2,845
2,719
2,617
2,533
2,463
2,403
2,203
2,015
1,924
1,871
1,836
1,750
1,708
20
248,013
19,446
8,660
5,803
4,558
3,874
3,445
3,150
2,936
2,774
2,646
2,544
2,459
2,388
2,328
2,124
1,932
1,839
1,784
1,748
1,659
1,614
1
6
233,986
19,330
8,941
6,163
4,950
4,284
3,866
3,581
3,374
3,217
3,095
2,996
2,915
2,848
2,790
2,599
2,421
2,336
2,286
2,254
2,175
2,136
1
30
250,095
19,462
8,617
5,746
4,496
3,808
3,376
3,079
2,864
2,700
2,570
2,466
2,380
2,308
2,247
2,039
1,841
1,744
1,687
1,649
1,554
1,507
7
236,768
19,353
8,887
6,094
4,876
4,207
3,787
3,500
3,293
3,135
3,012
2,913
2,832
2,764
2,707
2,514
2,334
2,249
2,199
2,167
2,087
2,048
8
238,883
19,371
8,845
6,041
4,818
4,147
3,726
3,438
3,230
3,072
2,948
2,849
2,767
2,699
2,641
2,447
2,266
2,180
2,130
2,097
2,016
1,977
9
240,543
19,385
8,812
5,999
4,772
4,099
3,677
3,388
3,179
3,020
2,896
2,796
2,714
2,646
2,588
2,393
2,211
2,124
2,073
2,040
1,959
1,919
10
241,882
19,396
8,786
5,964
4,735
4,060
3,637
3,347
3,137
2,978
2,854
2,753
2,671
2,602
2,544
2,348
2,165
2,077
2,026
1,993
1,910
1,870
11
242,983
19,405
8,763
5,936
4,704
4,027
3,603
3,313
3,102
2,943
2,818
2,717
2,635
2,565
2,507
2,310
2,126
2,038
1,986
1,952
1,869
1,829
40
251,143
19,471
8,594
5,717
4,464
3,774
3,340
3,043
2,826
2,661
2,531
2,426
2,339
2,266
2,204
1,994
1,792
1,693
1,634
1,594
1,495
1,445
50
251,774
19,476
8,581
5,699
4,444
3,754
3,319
3,020
2,803
2,637
2,507
2,401
2,314
2,241
2,178
1,966
1,761
1,660
1,599
1,559
1,457
1,404
60
252,196
19,479
8,572
5,688
4,431
3,740
3,304
3,005
2,787
2,621
2,490
2,384
2,297
2,223
2,160
1,946
1,740
1,637
1,576
1,534
1,429
1,375
120
253,253
19,487
8,549
5,658
4,398
3,705
3,267
2,967
2,748
2,580
2,448
2,341
2,252
2,178
2,114
1,896
1,683
1,577
1,511
1,467
1,352
1,290
240
253,783
19,492
8,538
5,643
4,382
3,687
3,249
2,947
2,727
2,559
2,426
2,319
2,230
2,155
2,090
1,870
1,654
1,544
1,476
1,430
1,307
1,237
Noes de Probabilidade
73
Tabela 3.7: Limites unilaterais de F ao nvel de 2,5% de probabilidade com os graus de liberdade
1 e 2
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240
1
647,789
38,506
17,443
12,218
10,007
8,813
8,073
7,571
7,209
6,937
6,724
6,554
6,414
6,298
6,200
5,871
5,568
5,424
5,340
5,286
5,152
5,088
2
799,500
39,000
16,044
10,649
8,434
7,260
6,542
6,059
5,715
5,456
5,256
5,096
4,965
4,857
4,765
4,461
4,182
4,051
3,975
3,925
3,805
3,746
3
864,163
39,165
15,439
9,979
7,764
6,599
5,890
5,416
5,078
4,826
4,630
4,474
4,347
4,242
4,153
3,859
3,589
3,463
3,390
3,343
3,227
3,171
4
899,583
39,248
15,101
9,605
7,388
6,227
5,523
5,053
4,718
4,468
4,275
4,121
3,996
3,892
3,804
3,515
3,250
3,126
3,054
3,008
2,894
2,839
5
921,848
39,298
14,885
9,364
7,146
5,988
5,285
4,817
4,484
4,236
4,044
3,891
3,767
3,663
3,576
3,289
3,026
2,904
2,833
2,786
2,674
2,620
12
976,708
39,415
14,337
8,751
6,525
5,366
4,666
4,200
3,868
3,621
3,430
3,277
3,153
3,050
2,963
2,676
2,412
2,288
2,216
2,169
2,055
1,999
13
979,837
39,421
14,304
8,715
6,488
5,329
4,628
4,162
3,831
3,583
3,392
3,239
3,115
3,012
2,925
2,637
2,372
2,248
2,176
2,129
2,014
1,958
14
982,528
39,427
14,277
8,684
6,456
5,297
4,596
4,130
3,798
3,550
3,359
3,206
3,082
2,979
2,891
2,603
2,338
2,213
2,140
2,093
1,977
1,921
15
984,867
39,431
14,253
8,657
6,428
5,269
4,568
4,101
3,769
3,522
3,330
3,177
3,053
2,949
2,862
2,573
2,307
2,182
2,109
2,061
1,945
1,888
20
993,103
39,448
14,167
8,560
6,329
5,168
4,467
3,999
3,667
3,419
3,226
3,073
2,948
2,844
2,756
2,464
2,195
2,068
1,993
1,944
1,825
1,766
1
6
7
8
9
10
11
937,111 948,217 956,656 963,285 968,627 973,025
39,331
39,355
39,373
39,387
39,398
39,407
14,735
14,624
14,540
14,473
14,419
14,374
9,197
9,074
8,980
8,905
8,844
8,794
6,978
6,853
6,757
6,681
6,619
6,568
5,820
5,695
5,600
5,523
5,461
5,410
5,119
4,995
4,899
4,823
4,761
4,709
4,652
4,529
4,433
4,357
4,295
4,243
4,320
4,197
4,102
4,026
3,964
3,912
4,072
3,950
3,855
3,779
3,717
3,665
3,881
3,759
3,664
3,588
3,526
3,474
3,728
3,607
3,512
3,436
3,374
3,321
3,604
3,483
3,388
3,312
3,250
3,197
3,501
3,380
3,285
3,209
3,147
3,095
3,415
3,293
3,199
3,123
3,060
3,008
3,128
3,007
2,913
2,837
2,774
2,721
2,867
2,746
2,651
2,575
2,511
2,458
2,744
2,624
2,529
2,452
2,388
2,334
2,674
2,553
2,458
2,381
2,317
2,263
2,627
2,507
2,412
2,334
2,270
2,216
2,515
2,395
2,299
2,222
2,157
2,102
2,461
2,341
2,245
2,167
2,102
2,047
1
30
40
50
60
120
24
1001,414 1005,598 1008,117 1009,800 1014,020 1016,
39,465
39,473
39,478
39,481
39,490
39,4
14,081
14,037
14,010
13,992
13,947
13,9
8,461
8,411
8,381
8,360
8,309
8,28
6,227
6,175
6,144
6,123
6,069
6,04
5,065
5,012
4,980
4,959
4,904
4,87
4,362
4,309
4,276
4,254
4,199
4,17
3,894
3,840
3,807
3,784
3,728
3,69
3,560
3,505
3,472
3,449
3,392
3,36
3,311
3,255
3,221
3,198
3,140
3,11
3,118
3,061
3,027
3,004
2,944
2,91
2,963
2,906
2,871
2,848
2,787
2,75
2,837
2,780
2,744
2,720
2,659
2,62
2,732
2,674
2,638
2,614
2,552
2,52
2,644
2,585
2,549
2,524
2,461
2,42
2,349
2,287
2,249
2,223
2,156
2,12
2,074
2,009
1,968
1,940
1,866
1,82
1,943
1,875
1,832
1,803
1,724
1,68
1,866
1,796
1,752
1,721
1,639
1,59
1,815
1,744
1,699
1,667
1,581
1,53
1,690
1,614
1,565
1,530
1,433
1,37
1,628
1,549
1,497
1,460
1,354
1,28
INFERNCIA ESTATSTICA
Vrios tipos de estudos tem o objetivo de obter concluses (fazer inferncias) a respeito de
parmetros de uma populao. A impossibilidade de avaliar toda a populao faz com que a
partir de amostras possamos obter estimativas daqueles parmetros. A generalizao da amostra para a populao feita com o auxlio de um modelo estatstico para a situao em estudo,
estas generalizaes esto sempre associadas um grau de incerteza e, consequentemente, uma
probabilidade de erro. A teoria da estimao preocupa-se com a obteno do respectivo de um
estimador para um determinado parmetro, com intuito de descrever o seu comportamento com
o menor erro possvel.
Parmetro: uma constante (um nmero) que caracteriza uma populao. Exemplo: mdia
populacional , varincia populacional 2 , etc. Em geral, os parmetros so desconhecidos.
Estimador: uma expresso algbrica utilizada para obter um valor aproximado de um
parmetro. Exemplo:
n
X
xi
X=
i=1
.
Estimativa: o valor numrico de um estimador. determinada usando os dados amostrais.
Exemplo: Mediante uma pesquisa queremos conhecer o tamanho mdio dos estudantes universitrios do Brasil.
Populao: Todas os estudantes universitrios do Brasil;
Amostra: por exemplo, 500 estudantes;
Parmetro: Mdia das alturas .
Estimador:
n
X
X=
xi
i=1
.
Estimativa: X = 1, 7m (valor aproximado para ) .
Inferncia Estatstica
4.1
75
ESTIMAO
um processo de induo, na qual usamos dados extrados de uma amostra para produzir
inferncia sobre a populao. Esta inferncia s ser vlida se a amostra for significativa.
Tipos de Estimaes de Parmetros
1. Estimao Pontual;
2. Estimao Intervalar
4.1.1
Estimao Pontual
usada quando a partir da amostra procura-se obter um nico valor de certo parmetro
populacional, ou seja, obter estimativas a partir dos valores amostrais.
A estimativas so os valores amostrais obtidos para a mdia, varincia, proporo, etc. Os
valores de X, S 2 , S estimam, respectivamente , 2 e .
4.1.2
Estimao Intervalar
Consideremos uma populao cujos elementos podem ser classificados em dois tipos: Sucesso
e Insucesso. Pretende-se estimar a proporo p de sucessos na populao.
Dada uma amostra de tamanho n, uma estimativa pontual de p da proporo de sucessos
dada por
x
p =
n
.
Pelo teorema do limite cental, quando n for suficientemente grande p tem distribuio aproximadamente normal, com mdia p = p e varincia a p2 = pq
n , em que:
p p
z= q
pq
n
Inferncia Estatstica
76
Fixando uma probabilidade de confiana (1) , o intervalo de confiana para uma proporo
pode ser obtido da seguinte forma:
r
P
p z 2
pq
p p + z 2
n
pq
n
!
=1
pq
a margem de erro da proporo e z 2 o valor da curva normal padro acima
n
do qual encontramos uma rea de 2 .
Exemplo: Uma empresa de pesquisa de mercado faz contato com 30 pessoas para saber a
satisfao a uma determinada marca de refrigerante, 12 delas respondem que gosta da referida
marca. Obtenha o intervalo de confiana de 95% para proporo de pessoas que gostam da
marca.
Nesse caso o sucesso o gosto pela marca de refrigerante
onde:z
p =
12
x
=
= 0, 40
n
30
0, 05
=
= 0, 025
2
2
P
P
P (0, 40 0, 08 p 0, 40 + 0, 80) = 0, 95
P (0, 32 p 0, 48) = 0, 95
Assim,
IC95% () = [0, 32; 0, 48]
4.1.2.2
P X Z 2 X + Z 2
=1
n
n
Exemplo: Um pesquisador obteve a partir de uma amostra uma mdia X = 180cm para altura
de uma determinado grupo de pessoas utilizando uma amostra n=40, sabe-se que a varincia
Inferncia Estatstica
77
0, 10
=
= 0, 05
2
2
Assim, temos que procurar na tabela qual o valor de Z que deixa 0, 05 de probabilidade acima
dele.
Olhando na tabela o valor em que P (0 < Z < z) = 0, 45, temos que z = 1, 65, logo o valor
Z 2 = 1, 65
P
P
X Z 2 X + Z 2
=1
n
n
!
200
200
180 1, 65
180 + 1, 65
= 0, 90
40
40
0, 05
=
= 0, 025
2
2
X Z 2 X + Z 2
=1
n
n
!
200
200
180 1, 96
180 + 1, 96
= 0, 95
40
40
Inferncia Estatstica
78
Assim,
IC95% () = [178, 61; 187, 38]
Observa-se que aumentando o nvel de confiana, tambm temos o aumento do intervalo de
confiana.
4.1.2.3
S
S
X t 2 X + t 2
n
n
=1
Exemplo: Em uma determinada industria para verificar a qualidade dos rolamentos esfricos
produzidos foi tomado uma amostra ao acaso um lote de 15 peas, fornecendo um dimetro
mdio de 240cm com desvio padro de 15cm . Encontre um intervalo de confiana de 95% para
o dimetro.
Primeiramente temos que obter o valor tabelado de t, como queremos o intervalo de confiana
a 95%, temos que:
1 = 0, 95 = 1 0, 95 = 0, 05
0, 05
=
= 0, 025
2
2
Olhando na tabela o valor que deixa 0,025 de rea acima com = 15 1 = 14, temos
t = 2, 145
S
S
P X t X + t2
=1
n
n
15
15
= 0, 95
P 240 2, 145 180 + 2, 145
15
15
P (231, 69 248, 31) = 0, 95
Assim,
IC95% () = [231, 69; 248, 31]
Inferncia Estatstica
4.1.2.4
79
Quando a populao da qual foi amostra foi coletada for Normal, pode-se obter um intervalo
de confiana para a varincia 2 dada por:
(n 1)S 2
(n 1)S 2
2
2
(1 )
2
!
=1
(n 1)S 2
2
2
(n 1)S 2
=1
(1 )
1)S
(n 1)S 2
= 0, 95
2
P
2
(1 )
2
14 144
14
144
2
P
= 0, 95
26, 119
5, 629
P 77, 18 2 358, 14 = 0, 95
p
p
77, 18 358, 14 = 0, 95
Assim,
IC95% ( 2 ) = [77, 18; 358, 14] IC95% () = [8, 78; 18, 92]
Inferncia Estatstica
4.2
80
4.2.1
Teste de Hiptese
uma metodologia estatstica que permite tomar deciso sobre uma ou mais populaes
baseando no conhecimento de informaes da amostra.
Ao tentarmos a fixao de decises, conveniente a formulao de suposies ou de conjeturas
acerca das populaes de interesse, que, em geral, consistem em consideraes sobre parmetros
das mesmas. Essas suposies, que podem ser ou no verdadeiras, so denominadas de Hipteses
Estatsticas, que podem ser:
HIPTESE NULA - aquela Hiptese Estatstica, prefixada, formulada sobre o parmetro
populacional estudado, e sempre uma afirmativa. representada por H0 .
HIPTESE ALTERNATIVA - So quaisquer hipteses que difiram da Hiptese Nula. Pode
ser representada por H1 ou Ha
Os processos que habilitam a decidir se aceitam ou rejeitam as hipteses formuladas, ou
determinar se a amostra observada difere, de modo significativo, dos resultados esperados, so
denominados de Testes de Hipteses ou Testes de Significncia.
Tabela 4.1: Erros possveis de se cometer no processo de tomada de deciso
Decises possveis
Estados possveis
Ho verdadeira
Ho falsa
Aceitao de Ho Deciso correta Erro do tipo II
Rejeio de Ho
Erro do tipo I Deciso correta
Ao testar uma hiptese estabelecida, a probabilidade mxima com a qual se sujeitaria a correr
o risco de um erro do tipo I denominada de Nvel de Significncia do Teste e representada
por .
Estudaremos testes de hipteses com uma hiptese nula (H0 ) e uma hiptese alternativa
(Ha ). A partir da formulao de (H0 ) e (Ha ), podemos definir se teste de hiptese unilateral
ou bilateral.
Consideremos o parmetro estudado e 0 valor inicialmente suposto para. Podemos formular
as seguintes hipteses:
(
4.2.2
H0 : = 0
H1 : 6= 0
Teste Bilateral
H0 : = 0
H1 : > 0
Teste Unilateral
H0 : = 0
H1 : < 0
Teste Unilateral
Suponha que X uma varivel aleatria com mdia desconhecida e varincia 2 conhecida.
E queremos testar a hiptese de que a mdia igual a um certo valor especificado 0 . O teste
Inferncia Estatstica
81
H0 : = 0
H1 : 6= 0
Para testar a hiptese, toma-se uma amostra aleatria de n observaes e se calcula a estatstica
x 0
zc =
n
Como se trata de um teste bilateral temos duas alternativas para verificar se a hiptese H0
rejeitada
se |zc | > z 2 .
h
i
se 2P |zc z 2
H0 : = 0
H1 : > 0
H0 : = 0
H1 : < 0
Como se trata de testes unilaterais temos duas alternativas para verificar se a hiptese H0
rejeitada
se |zc | > z .
se P [|zc | > z ]
Exemplo: Uma industria eltrica fabrica lmpadas afirma que o tempo de vida mdio de
800horas. Tomaram-se o tempo de vida de 40 lmpadas e obteve-se uma mdia X = 750 e
Inferncia Estatstica
82
sabe-se que a varincia populacional 2 = 1600cm2 . Pode-se afirmar que a indstria estava
correta.
Utilizando um teste unilateral
(
H0 : = 800
H1 : < 800
Calculando o valor de zc
zc =
X 0
750 800
= 7, 90
=
40
40
n
Como no foi especificado o nvel de significncia, vamos assumir = 0, 05. Nesse caso,
trata-se de um teste unilateral, temos que observar o valor tabelado para z = z0,05 = 1, 65.
Concluso: Observando |zc | = 7, 90, temos que como 7, 90 > 1, 65, rejeita-se H0 , a um nvel
de significncia de 5%, ou seja, com 95% de probabilidade a empresa estava errada ao afirmar
que o tempo de vida mdio de 800horas.
4.2.3
Suponha que X uma varivel aleatria Normal com mdia desconhecida e varincia 2
desconhecida. E queremos testar a hiptese de que a mdia igual a um certo valor especificado
0 . O teste de hiptese pode ser formulado como segue:
(
H0 : = 0
H1 : 6= 0
H0 : = 0
H1 : < 0
H0 : = 0
H1 : > 0
Para testar a hiptese, toma-se uma amostra aleatria de n 30 observaes com varincia
desconhecida se calcula a estatstica
x 0
tc =
S
n
Rejeita-se H0
teste bilateral:
se |tc | > t 2 .
h
i
se 2P |tc | > t 2
teste unilateral:
se |tc | > t .
se P [|tc | > t ]
Para testar a hiptese, toma-se uma amostra aleatria de n > 30 observaes com varincia
desconhecida se calcula a estatstica
x 0
zc =
S
Inferncia Estatstica
83
Rejeita-se H0
teste bilateral:
se |zc | > z 2 .
h
i
se 2P |zc | > z 2
teste unilateral:
se |zc | > z .
se P [|zc | > z ]
Exemplo: Em uma determinada industria um determinado rolamento esfricos dito de
qualidade se o seu dimetro mdio for igual a 240cm. Para verificar se os dimetros mdios
esto atendendo as especificaes, foi tomado uma amostra ao acaso de 20 peas, fornecendo um
dimetro mdio de 236cm com desvio padro de 15cm.
Utilizando um teste bilateral
(
H0 : = 240
H1 : 6= 240
Calculando o valor de tc
tc =
236 240
x 0
=
= 1, 193
S
15
20
n
Como no foi especificado o nvel de significncia, vamos assumir = 0, 05. Nesse caso, tratase de um teste unilateral, temos que observar o valor tabelado para t 2 = t 0,05 = t0,025 = 2, 093.
2
Concluso: Observando |tc | = 1, 193, temos que como 1, 193 < 2, 093 no existe razo para
rejeitar H0 , logo os dimetros mdios esto atendendo as especificaes.
Exemplo: Uma amostra de 76 peixes pescados numa certa represa produziu um peso mdio
de 13,36g e desvio-padro 4,79g. Suspeita-se que a mdia de peso da populao desses peixes
nessa regio seja 12g. Teste essa hiptese com um nvel de significncia de 5%.
Utilizando um teste unilateral.
(
H0 : = 12, 0
H1 : > 12, 0
Calculando o valor de zc
zc =
x 0
13, 36 12, 0
=
= 2, 475
4, 79
S
n
76
Nesse caso, trata-se de um teste bilateral, temos que observar o valor tabelado para z 2 =
z 0,05 = z0,025 = 1, 960.
2
Concluso: Observando |zc | = 2, 475, temos que como 2, 475 > 1, 65 rejeita-se H0 ao nvel de
5% de significncia. Portanto, a mdia de peso da populao desses peixes superior a 12g.
Inferncia Estatstica
4.2.4
84
Assim como para a mdia, existem testes de hipteses associados a propores, estes testes
so a respeito do parmetro populacional p. Com os dados coletados de uma amostra de tamanho
n, pode-se verificar o numero de sucessos X, e estimar a proporo p.
Para testar as hipteses sobre propores pode-se utilizar a distribuio normal , nesse caso
se calcula a estatstica
p p0
zc = r
p 0 q0
n
Rejeita-se H0
teste bilateral se |zc | > z 2 .
teste unilateral se |zc | > z .
Para obter os valores de z tabelados, o mais prtico consultar a tabela de t, na ltima linha,
quando os graus de liberdades so suficientemente grandes.
Exemplo: Um centro de pesquisas afirma que 30% das pessoas so usurios de internet sem
fio em uma determinada regio. Em uma amostra aleatria de 30 pessoas, em 12 dizem ter rede
sem fio em casa. Teste a afimaro do centro de pesquisa utilizando a significncia = 0, 05.
Temos que p0 = 0, 30 q0 = 1 p0 = 1 0, 30 = 0, 70, nmero de sucessos X = 12, tamanho
da amostra n = 30, assim temos:
X
12
=
= 0, 40
p =
n
30
Utilizando um teste bilateral
H0 : p = 0, 30
H1 : p 6= 0, 30
Calculando o valor de zc
p p0
0, 40 0, 30
=r
= 1, 20
zc = r
p0 q0
0, 3 0, 7
n
30
Nesse caso, trata-se de um teste bilateral, temos que observar o valor tabelado para z 2 =
z 0,05 = z0,025 = 1, 960.
2
Concluso: Observando |zc | = 1, 20, temos que como 1, 20 < 1, 96 |zc | < z 2 no existe
evidncias para rejeitar H0 ao nvel de 5% de significncia, logo a proporo de pessoas que
utilizam a internet sem fio em de 30%.
4.2.5
Inferncia Estatstica
85
4. Usar o nvel de significncia para desenvolver regra de deciso que indica os valores
crticos da estatstica de teste que levar a rejeio de H0 .
5. Coletar os dados amostrais e calcular a estatstica de teste.
6. Comparar o valor da estatstica do teste com o(s) valor(es) crtico(s) especificado(s) na
regra de deciso para determinar se H0 deve ser rejeitado;
Inferncia Estatstica
4.3
86
REGRESSO E CORRELAO
Nas unidades anteriores, descrevemos a distribuio de valores de uma nica varivel, com
esse objetivo aprendemos a calcular medidas de tendncia central e variabilidade. Porm, se
considerarmos duas ou mais variveis surge um novo problema: as relaes que podem existir
entre as variveis estudadas.
Vamos verificar as relaes entre as seguintes variveis:
Altura e peso - espera-se que quanto mais alto mais pesado o individuo;
Quantidade de memria RAM e tempo de processamento - espera-se que com mais memria
RAM tenha-se um tempo menor de processamento;
Temperatura e Umidade do ar - no se pode associar a temperatura a uma menor ou maior
umidade do ar.
Para estudar a relao entre duas variveis quantitativas na utilizamos a anlise de regresso
e correlao destas variveis.
Correlao um nmero entre -1 e 1 que mede o grau relacionamento entre duas variveis
quantitativas
Regresso o estudo que busca ajustar uma equao a um conjunto de dados de forma que
a relao entre duas variveis quantitativas possa ser expressa matematicamente.
Definimos um conjunto de variveis (x, y), sendo x a varivel independente e y a varivel
dependente. A primeira forma de verificar a relao de duas variveis traar o grfico de
disperso do dados.
O grfico de disperso contm uma varivel independente representada no eixo horizontal e
a varivel dependente representada no eixo vertical.
O grfico de disperso da um idia da existncia de correlao, entretanto no apresenta qual
a magnitude da correlao. Para determinar a magnitude da correlao utilizamos o coeficiente
de correlao populacional (). Em geral trabalhamos com amostras, e para estimar o coeficiente
de correlao populacional pode-se utilizar o coeficiente de correlao amostral.
X
(xi x
)(yi y)
r = sXi
X
(xi x
)2
(yi y)2
i
sendo que:
r > 0 - correlao positiva;
r < 0 - correlao negativa;
r = 0 - ausncia de correlao.
O valor obtido para o coeficiente de correlao amostral tem como finalidade estimar o populacional, ou seja, verificar se na populao existe uma associao entre as variveis em estudo.
Inferncia Estatstica
87
H0 : = 0
H1 : 6= 0
1r2
n2
Inferncia Estatstica
x
y
88
10
11,8
12
10,2
14
12,1
16
13,2
18
15,1
20
15,4
22
15,6
n
X
x =
y =
r =
xi
n
n
X
i
112
= 16
7
yi
93, 4
=
= 13, 3
nX
7
(xi x
)(yi y)
sXi
X
(xi x
)2
(yi y)2
i
49, 6
= 0, 9148
112 26, 25
Verificou que o valor da correlao r=0,9148. Vamos testar a hiptese se este valor
diferente de zero.
(
H0 : = 0
H1 : 6= 0
10,91482
5
= 5, 06
Inferncia Estatstica
Observao
1
2
3
4
5
6
7
Total
89
(y y)2
2,25
9,61
1,44
0,01
3,24
4,41
5,29
26,25
i (xi
x
)2
Aps ajustar o modelo de regresso deve-se realizar um teste de hiptese para verificar se os
coeficientes so diferentes de zero:
(
H0 : a = 0
H0 : b = 0
H1 : a 6= 0
H1 : b =
6 0
Para testar os coeficientes de regresso pode-se utilizar as estatsticas:
ta =
A anlise de varincia uma tcnica utilizada para se testar o ajuste da equao como um
todo, ou seja, um teste para verificar se a equao de regresso obtida significativa ou no.
Inferncia Estatstica
90
Fc
QMRegresso/QMErro
X
(yi y)2
i
X
(xi x
)2
SQRegresso = b
H0 : a = 0 ou b = 0
H1 : a 6= 0 e b 6= 0
SQRegresso
SQTotal
0 < r2 < 1
ele representa a porcentagem da variao total que explicada pela equao de regresso, quanto
maior o seu valor melhor.
Aps ter verificado o ajuste da equao de regresso pode-se utiliza-la para fazer previses.
Exemplo: Utilizando o exemplo da renda bruta mensal (em salrios mnimos) e a porcentagem
da renda bruta anual gasta com assistncia mdica.
Vamos ajustar o modelo
y = a + bx
Utilizando os calculo da tabela 4.2
X
(xi x
)(yi y)
b =
i (xi
x
)2
49, 6
= 0, 44
112
a = y bx
=
= 6, 26
Inferncia Estatstica
91
!2
X
SQRegresso =
(xi x
)(yi y)
i (xi
x
)2
(49, 6)2
= 21, 97
112
SQErro = SQTotal SQRegresso
=
= 26, 25 21, 97 = 4, 28
Fc
25,55
F
6,60