Você está na página 1de 91

Universidade Federal de Mato Grosso

Instituto de Cincias Exatas e da Terra


Departamento de Estatstica

Notas de aula de Probabilidade e Estatstica

Anderson Castro Soares de Oliveira

2011

SUMRIO

1 Introduo
1.1 Amostragem . . . . . . . . . . .
1.1.1 Amostragem Simples . . .
1.1.2 Amostragem Sistemtica .
1.1.3 Amostragem Estratificada
1.2 Mtodo Estatstico . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

2 Estatstica Descritiva
2.1 Tipo de Variveis . . . . . . . . . . . . . . . . . .
2.2 Variveis Qualitativas . . . . . . . . . . . . . . . .
2.3 Variveis Quantitativas . . . . . . . . . . . . . . .
2.4 Medidas de Posio . . . . . . . . . . . . . . . . .
2.4.1 Mdia Aritmtica . . . . . . . . . . . . . . .
2.4.1.1 Propriedades da mdia . . . . . . . .
2.4.2 Mediana . . . . . . . . . . . . . . . . . . . .
2.4.3 Moda . . . . . . . . . . . . . . . . . . . . . .
2.4.4 Comparao entre Mdia, Mediana e Moda .
2.4.5 Simetria . . . . . . . . . . . . . . . . . . . .
2.4.6 Separatrizes . . . . . . . . . . . . . . . . . .
2.4.6.1 Quartis . . . . . . . . . . . . . . . . .
2.4.6.2 Percentis ou Centis . . . . . . . . . .
2.4.7 Dados agrupados . . . . . . . . . . . . . . .
2.4.7.1 Mdia . . . . . . . . . . . . . . . . . .
2.4.7.2 Mediana . . . . . . . . . . . . . . . .
2.4.7.3 Moda . . . . . . . . . . . . . . . . . .
2.4.7.4 Quartil . . . . . . . . . . . . . . . . .
2.4.7.5 Percentil . . . . . . . . . . . . . . . .
2.4.7.6 Exemplo . . . . . . . . . . . . . . . .
2.5 Boxplot . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Medidas de disperso . . . . . . . . . . . . . . . .
2.6.1 Amplitude Total . . . . . . . . . . . . . . .
2.6.2 Varincia e Desvio Padro . . . . . . . . . .
2.6.2.1 Propriedades da Varincia . . . . . .
2.6.2.2 Propriedades do Desvio Padro . . .
2.6.3 Coeficiente de Variao . . . . . . . . . . . .
2.6.4 Erro Padro da Mdia . . . . . . . . . . . .
2.7 Exemplos . . . . . . . . . . . . . . . . . . . . . . .
2.7.1 Dados Agrupados . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

3 Noes de Probabilidade
3.1 Espao Amostral e Eventos . . . . . . . . . . . . . .
3.1.1 Operao com eventos . . . . . . . . . . . . .
3.2 Probabilidade . . . . . . . . . . . . . . . . . . . . .
3.2.1 Probabilidade Condicional e Independncia de
3.2.2 rvores de probabilidade . . . . . . . . . . . .
3.3 Varivel Aleatria . . . . . . . . . . . . . . . . . . .
3.3.1 Funo de Probabilidade Discreta . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

4
5
6
6
7
7

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

9
9
9
12
17
17
17
19
20
20
21
21
21
22
23
23
23
24
24
25
25
26
29
29
29
31
32
32
33
33
33

. . . . .
. . . . .
. . . . .
Eventos
. . . . .
. . . . .
. . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

35
35
36
37
38
39
40
41

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

3.3.1.1 Esperana Matemtica e Varincia de uma VAD . . . . . . . . . . . .


3.3.2 Funo de probabilidade contnua ou funo de densidade de probabilidade
(fdp). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2.1 Esperana Matemtica e Varincia de uma fdp . . . . . . . . . . . . .
3.4 Distribuies Discretas de Probabilidade . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Distribuio Uniforme Discreta . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . .
3.4.2 Distribuio Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.2.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . .
3.4.3 Distribuio Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.3.1 Parmetros Caractersticos da Distribuio Binomial . . . . . . . . .
3.4.4 Distribuio Hipergeomtrica . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.4.1 Parmetros Caractersticos da Distribuio Hipergeomtrica . . . . .
3.4.5 Distribuio Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.5.1 Parmetros Caractersticos da Distribuio Geomtrica . . . . . . . .
3.4.6 Distribuio de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.6.1 Parmetros Caractersticos da Distribuio de Poisson . . . . . . . . .
3.5 Distribuies Contnuas de Probabilidade . . . . . . . . . . . . . . . . . . . . . . .
3.5.1 Distribuio Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5.1.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . .
3.5.2 Distribuio Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5.2.1 Parmetros Caractersticos da Distribuio Exponencial . . . . . . . .
3.5.3 Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5.3.1 Aproximao Normal das Distribuies Binomial e de Poisson . . . .
3.6 Distribuies Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.1 Distribuio Amostral da Mdia (X) . . . . . . . . . . . . . . . . . . . . . .
3.6.1.1 Teorema do Limite Central (TLC) . . . . . . . . . . . . . . . . . . . .
3.6.1.2 Distribuio t de student . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.2 Distribuio amostral para proporo . . . . . . . . . . . . . . . . . . . . . .
3.6.3 Distribuio Amostral da Varincia . . . . . . . . . . . . . . . . . . . . . . .
3.6.3.1 Distribuio Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . .
3.6.3.2 Distribuio F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Inferncia Estatstica
4.1 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Estimao Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.2 Estimao Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.2.1 Intervalo de Confiana para proporo p . . . . . . . . . . . . . . .
4.1.2.2 Intervalo de Confiana para mdia com varincia 2 conhecida . .
4.1.2.3 Intervalo de Confiana para mdia com varincia 2 desconhecida
4.1.2.4 Intervalo de Confiana para varincia 2 e para o desvio padro
4.2 Teoria da Deciso Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Teste de Hiptese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Teste para mdias, varincia conhecida . . . . . . . . . . . . . . . . . . . .
4.2.3 Teste para mdias, varincia desconhecida . . . . . . . . . . . . . . . . . .
4.2.4 Teste de hipteses para proporo . . . . . . . . . . . . . . . . . . . . . . .
4.2.5 Resumo das etapas aplicadas a qualquer teste de hipteses . . . . . . . .
4.3 Regresso e Correlao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

42
43
45
46
46
46
47
47
47
49
50
51
51
52
52
53
54
54
56
56
57
57
60
63
63
63
64
66
67
67
67
74
75
75
75
75
76
78
79
80
80
80
82
84
84
86

INTRODUO

Estatstica um conjunto de conceitos e mtodos cientficos para coleta, organizao, descrio, anlise e interpretao de dados experimentais, que permitem concluses vlidas e tomadas
de decises razoveis.
Classificao: Usualmente, a estatstica se divide em:
Estatstica descritiva - a parte que tem por objetivo organizar, apresentar e sintetizar
dados observados de determinada populao, sem pretenes de tirar concluses de carter
extensivo.
Teoria de probabilidade - objetiva descrever e prever as caractersticas de populaes infinitas
Inferncia Estatstica a parte que, baseando-se em estudos realizados sobre os dados de
uma amostra, procura inferir, induzir ou verificar leis de comportamento da populao da
qual a amostra foi retirada. A estatstica inferencial tem sua estrutura fundamentada na
teoria matemtica das probabilidades. , tambm definida como um conjunto de mtodos
para a tomada de decises.
No estudo da estatstica alguns conceitos so importantes:
Populao (N) - Conjunto de todos os elementos relativos a um determinado fenmeno que
possuem pelo menos uma caracterstica em comum, a populao o conjunto Universo.
Exemplos:
Todos os clientes de uma determinada empresa;
Todos os produtos fabricados em uma determinada empresa;
Amostra (n) - um subconjunto da populao e dever ser considerada finita, a amostra deve
ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente
todas as caractersticas da populao como se fosse uma fotografia desta.
Pesquisa Estatstica: qualquer informao retirada de uma populao ou amostra, podendo ser atravs de Censo ou Amostragem
Censo - atividade de inspecionar (observar) todos os elementos de uma populao, objetivando conhecer, com certeza suas caractersticas;

Introduo

Amostragem - o processo de retirada de informaes dos "n"elementos amostrais, no


qual deve seguir um mtodo criterioso e adequado (tipos de amostragem).

Figura 1.1: Representao de PopulaoAmostra

Dados estatsticos: qualquer caracterstica que possa ser observada ou medida de alguma
maneira. As matrias-primas da estatstica so os dados observveis.
Varivel: aquilo que se deseja observar para se tirar algum tipo de concluso, geralmente
as variveis para estudo so selecionadas por processos de amostragem. Os smbolos utilizados para representar as variveis so as letras maisculas do alfabeto, tais como X, Y,
Z, ... que pode assumir qualquer valor de um conjunto de dados. As variveis podem ser
classificadas dos seguintes modos:

1.1

AMOSTRAGEM

Na realizao de qualquer estudo quase nunca possvel examinar todos os elementos da


populao de interesse. Temos usualmente de trabalhar com uma amostra da populao. A
inferncia estatstica nos d elementos para generalizar, de maneira segura, as concluses obtidas
da amostra para a populao.
errneo pensar que, caso tivssemos acesso a todos os elementos da populao, seramos
mais preciosos. Os erros de coleta e manuseio de um grande nmero de dados so maiores do
que as imprecises a que estamos sujeitos quando generalizamos, via inferncia, as concluses de
uma amostra bem selecionada.
Em se tratando de amostra, a preocupao central que ela seja representativa. Assim que
decidimos obter informaes atravs de um levantamento amostral, temos imediatamente dois
problemas:
Definir cuidadosamente a populao de interesse
Selecionar a caracterstica que iremos pesquisar.

Introduo

H duas grandes divises no processo de amostragem: a probabilstica e a no-probabilstica.


A amostragem probabilstica tambm chamada de amostragem aleatria ou ao acaso. Este
tipo de amostragem submetida a tratamento estatstico que permite compensar erros amostrais.
Hoje, dificilmente se aceita uma amostragem no-probabilistica, exceto nos casos em que a
amostragem probabilstica no pode ser feita.
A amostragem no-probabilstica, por no fazer uso de forma aleatria de seleo, no aceita
diversas aplicaes estatsticas e, por isto, preterida.
Pontos importantes:
muito dispendioso entrevistar cada pessoa de toda uma populao; recorremos, ento,
as amostras;
Usa-se a proporo de pessoas em uma amostra, portadoras de determinada caracterstica,
para estimar a proporo, na populao das que tem essa caracterstica.
O melhor mtodo de escolha de uma amostra a escolha aleatria, isto , que toda amostra
possvel tenha a mesma chance de ser escolhida.
Antes de se proceder a observao de uma determinada populao surge a questo se a
amostragem ser com ou sem reposio. Se o tamanho da amostra insignificante em
relao populao o impacto da reposio ser desprezvel, porm, se a amostra for
grande ento a reposio ou no pode causar um impacto significativo no resultado da
probabilidade.
Como as caractersticas das populaes estatsticas variam, s vezes, necessrio se adequar
esta populao estatstica para submet-la a um critrio de seleo possvel, sem, contudo,
perder seu carter aleatrio.
1.1.1

Amostragem Simples

Objetivo: Obter uma amostra representativa quando os elementos da populao so todos


homogneos. Neste processo de amostragem todos os elementos da populao tm a mesma
probabilidade de serem amostrados. A caracterstica principal que todos os elementos da
populao tm igual probabilidade de pertencer amostra.
Procedimento: Na prtica a amostragem aleatria simples pode ser realizada numerando-se
a populao de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, k
nmeros dessa seqncia, os quais correspondero aos elementos pertencentes amostra.
Exemplo: Vamos obter uma amostra representativa, de 10% dos valores, para obtermos a
estatura mdia de noventa alunos de uma escola:
Numeramos os alunos de 01 a 90
Sorteamos os nmeros, de 01 a 90, um a um, nove nmeros que formaro a amostra.
1.1.2

Amostragem Sistemtica

Objetivo: Aumentar a representatividade da amostra dando maior cobertura populao.


usada quando todos os elementos so homogneos.

Introduo

Procedimento: Quando os elementos da populao j esto ordenados, no h necessidade


de construirmos um sistema de referncia, para selecionarmos a amostra. So exemplos os
pronturios mdicos de um hospital, os prdios de uma rua, uma linha de produo, os nomes
em uma lista telefnica, etc. Nestes casos a seleo dos elementos que constituiro a amostra pode
ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos de
sistemtica.
Exemplo: Consideremos uma populao, com elementos ordenados, de tamanho N e dela
tiramos uma amostra de tamanho n, atravs de uma amostragem sistemtica, da seguinte maneira:
Definimos F S como fator de sistematizao, dado por F S = N/n.
Sorteamos um nmero entre 1 e F S. Esse nmero simbolizado por m, que ser o primeiro
elemento da amostra.
O segundo elemento da amostra o de nmero F S + m.
O terceiro elemento da amostra o de nmero 2F S + m.
O k-simo elemento da amostra o nmero (k 1)F S + m
Exemplo: Uma rua contm 1000 prdios, dos quais desejamos obter uma amostra sistemtica
formada por 100 deles.
F S = 1000/100 = 10
m ser um nmero entre 1 e 10. Vamos supor que m = 7. Ento temos:
1o elemento da amostra = (1 1)10 + 7 = 7 > 7o elemento da populao.
.
..
100o elemento da amostra = (100 1)10 + 7 = 997 > 997o elemento da populao.
1.1.3

Amostragem Estratificada

Objetivo: Melhorar a representatividade da amostra quando os elementos da populao so


heterogneos, porm, podem ser agrupados em subpopulaes (ESTRATOS) contendo elementos
homogneos.
Procedimento: A populao dividida em grupos ou estratos contendo elementos homogneos
e as amostras so retiradas separadamente de cada um desses grupos.
Exemplo; Dada a populao de 50.000 operrios da indstria, selecionar uma amostra proporcional estratificada de 5% de operrios para estimar seu salrio mdio. Usando a varivel
critrio "cargo"para estratificar essa populao, e considerando amostras de 5% de cada estrato
obtido, chegamos ao seguinte quadro:

1.2

MTODO ESTATSTICO
O Mtodo Estatstico pode ser descrito pelas etapas a seguir:

Introduo
CARGO
Chefes de seo
Operrios especializados
Operrios no especializados
TOTAL

8
POPULAO
5000
15000
30000
50000

5%
5(5000)/100 = 250
5(15000)/100 = 750
5(30000)/100 = 1500
5(50000)/100 = 2500

AMOSTRA
250
750
1500
2500

Definio do problema - Consiste na:


formulao correta do problema;
examinar outros levantamentos realizados no mesmo campo (reviso da literatura);
saber exatamente o que se pretende pesquisar definindo o problema corretamente
(variveis, populao, hipteses, etc.)
Planejamento -Determinar o procedimento necessrio para resolver o problema:
Como levantar informaes;
Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).
Cronograma, Custos, etc.
Coleta da dados - Consiste na obteno dos dados referentes ao trabalho que desejamos
fazer.;
A coleta pode ser: Direta - diretamente da fonte ou Indireta - feita atravs de outras
fontes.
Os dados podem ser obtidos pela prpria pessoa (primrios) ou se baseia no registro
de terceiros (secundrios).
Apurao dos dados - Consiste em resumir os dados, atravs de uma contagem e agrupamento. um trabalho de coordenao e de tabulao.
Apresentao dos dados - a fase em que vamos mostrar os resultados obtidos na coleta e
na organizao. Esta apresentao pode ser:
Tabular (apresentao numrica)
Grfica (apresentao geomtrica)
Anlise e interpretao dos dados - a fase mais importante e tambm a mais delicada.
Tira concluses que auxiliam o pesquisador a resolver seu problema.

ESTATSTICA DESCRITIVA

A estatstica descritiva parte da estatstica que lida com a organizao, resumo e apresentao

de dados. Esta feita por meio de:


Tabelas;
Grficos;
Medidas Descritivas (mdia, varincia, entre outras).

2.1

TIPO DE VARIVEIS
As variveis podem ter valores numricos ou no numricos.
Variveis Qualitativas (ou categricas) - so as caractersticas que no possuem valores
quantitativos, mas, ao contrrio, so definidas por vrias categorias, ou seja, representam
uma classificao dos indivduos
Variveis nominais: no existe ordenao dentre as categorias.
Exemplos: sexo, cor dos olhos, fumante/no fumante, doente/sadio.
Variveis ordinais: existe uma ordenao entre as categorias.
Exemplos: escolaridade (1o , 2o , 3o graus), estgio da doena (inicial, intermedirio,
terminal), ms de observao (janeiro, fevereiro,..., dezembro).
Variveis Quantitativas - so as caractersticas que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numricos
Variveis discretas: so aquelas variveis que pode assumir somente valores inteiros
num conjunto de valores. gerada pelo processo de contagem
Exemplos: nmero de filhos, nmero de empregados, nmero de processos.
Variveis contnuas: so aquelas variveis que podem assumir um valor dentro de um
intervalo de valores. gerada pelo processo de medio
Exemplos: presso arterial, idade, salrio, atraso de transmisso de bytes por uma
rede de internet.

2.2

VARIVEIS QUALITATIVAS

Para resumir dados qualitativos, utiliza-se contagens, propores, porcentagens, taxas por
1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Por exemplo, se encontrar-

Estatstica Descritiva

10

mos que 7 empresas com faturamento mensal acima de R$20.000,00 em uma amostra de 500
propriedades, poderamos expressar isto como uma proporo (0,014) ou percentual (1,4%).
Freqentemente o primeiro passo da descrio de dados criar uma tabela de freqncias.
Antes de montar a tabela de distribuio de freqncias temos algumas definies:
Freqncia - medida que quantifica a ocorrncia dos valores de uma varivel a um dado
conjunto de dados. As freqncias podem ser:
Absoluta (fa) - contagem das observaes de uma varivel;
Relativa (fr) - diviso da freqncia absoluta pelo total de observaes
fr =

fa
n

Percentual (fp) - a freqncia relativa multiplicada por 100


f p = 100 f r
Exemplo: Para adequar os produtos s preferncias dos clientes, um provedor fez uma pesquisa sobre os provedores a qualidade dos servios prestados utilizando uma amostra de 20
clientes, obtendo as seguintes variveis:
Tabela
Amostra
1
2
3
4
5
6
7
8
9
10

2.1: Variveis observadas de 20 clientes de um provedor.


Sexo
Qualidade Amostra
Sexo
Qualidade
feminino
Boa
11
feminino
Ruim
feminino
Boa
12
feminino
Ruim
feminino
Boa
13
masculino
Boa
feminino
Boa
14
masculino
Boa
feminino
Boa
15
masculino
timo
feminino
timo
16
masculino
Regular
feminino
timo
17
masculino
Regular
feminino
Regular
18
masculino
Ruim
feminino
Regular
19
masculino
Ruim
feminino
Ruim
20
masculino
Ruim

Neste apresentado duas variveis qualitativas sendo:


Sexo - varivel qualitativa nominal;
Qualidade - varivel qualitativa ordinal;
Para resumir separadamente cada varivel podemos utilizar a tabelas simples, que so na
maioria das vezes suficientes para descrever dados qualitativos especialmente quando existem
poucas categorias.
Para a varivel sexo, podemos utilizar as freqncias apresentadas na tabela 2.2:
Para a varivel qualidade no atendimento, alm das freqncias utilizadas para a varivel
sexo, podemos utilizar mais duas freqncias:
Freqncia Acumulada (FA)- obtida pelo soma das freqncias absolutas;

Estatstica Descritiva

11

Tabela 2.2: Distribuio de freqncia do sexo de 20 clientes de um provedor.


Sexo
Freqncia Freqncia Freqncia
Absoluta
Relativa
Percentual
(fa)
(fr)
(fp)
feminino
12
0,60
60%
masculino
8
0,40
40%
20
1,00
100%
Freqncia Percentual Acumulada (FP) - obtida pela soma das freqncias percentuais.

Tabela 2.3: Distribuio de freqncia qualidade no atendimento de um provedor de acordo com


20 clientes
Qualidade no Freqncia Freqncia Freqncia Freqncia Freqncia
Atendimento
Absoluta
Relativa
Percentual Acumulada Percentual
(fa)
(fr)
(fp)
(FA)
Acumulada
(FP)
tima
3
0,15
15%
3
15%
Boa
7
0,35
35%
10
50%
Regular
4
0,20
20%
14
70%
Ruim
6
0,30
30%
20
100%
Total
20
1,00
100%
Dados qualitativos so usualmente bem ilustrados num simples grfico de barras onde a altura
da barra igual freqncia. O grfico na Figura 2.1 apresenta as freqncias percentuais da
Tabela 2.2.

Figura 2.1: Qualidade no atendimento de um provedor de acordo com 20 clientes


Em alguns casos podemos estar interessados em resumir duas variveis qualitativas ao mesmo
tempo, neste caso vamos estudar a relao entre duas variveis qualitativas que pode ser representada em uma tabulao cruzada. Nesta tabela conta-se quantos valores correspondem a cada
par de possveis resultados, para as duas variveis. O resultado pode ser apresentado como
freqncia absoluta ou relativa, em relao as colunas ou as linhas (nunca ambas).
Tabela 2.4: Distribuio de freqncia absoluta de 20 clientes de um provador de acordo com a
qualidade de atendimento e o sexo
Qualidade
Sexo
Total
Feminino Masculino
Boa
5
2
7
timo
2
1
3
Regular
2
2
4
Ruim
3
3
6
Total
12
8
20

Estatstica Descritiva

12

O grfico de barras, com barras justapostas de acordo com categorias diferentes, pode ser
usado para apresentar a relao entre duas variveis qualitativas.

Figura 2.2: Distribuio de freqncia absoluta de 20 clientes de um provador de acordo com a


qualidade de atendimento e o sexo

2.3

VARIVEIS QUANTITATIVAS

Da mesma forma que as variveis qualitativas, podemos resumir dados quantitativos por
meio de tabelas de freqncias, entretanto a distino entre as variveis quantitativas discretas
e contnuas na forma de preparao destas tabelas.
A tabela de distribuio de freqncias de uma varivel discreta , em geral bastante semelhante das variveis qualitativas ordinais, pois os valores inteiros que a varivel assume podem
ser considerados como "categorias", ou "classes naturais".
Exemplo: Sejam dados referentes a um levantamento onde observou-se o numero de peas
defeituosas em 25 maquinas de uma empresas.
Tabela 2.5: Nmero de peas defeituosas em 25 maquinas de uma empresa
3 5 7 1 3
6 5 5 5 3
8 5 2 6 2
4 4 4 3 5
6 2 2 4 5
Observa-se que a disposio da varivel nmero de de peas defeituosas semelhante a de
uma varivel qualitativa ordinal com 8 categorias e sua distribuio de freqncia pode ser vista
na tabela 2.6. A representao grfica pode ser feita por meio de um grfico de barras conforme
figura 2.4.

Estatstica Descritiva

13

Tabela 2.6: Distribuio de freqncias do nmero de peas defeituosas de


empresa
Nmero de Freqncia Freqncia Freqncia Freqncia
Minerais
Absoluta
Relativa
Percentual Acumulada
(fa)
(fr)
(fp)
(FA)
1
2
3
4
5
6
7
8
Total

1
4
4
4
7
3
1
1
25

0,04
0,16
0,16
0,16
0,28
0,12
0,04
0,04
1

4%
16%
16%
16%
28%
12%
4%
4%
100%

1
5
9
13
20
23
24
25

25 maquinas de uma
Freqncia
Percentual
Acumulada
(FP)
4%
20%
36%
52%
80%
92%
96%
100%

Figura 2.3: Nmero nmero de peas defeituosas de 25 maquinas de uma empresa


A construo de tabelas de distribuio de freqncias para variveis quantitativas contnuas
feita agrupando os dados em classes e obtendo as freqncias observadas em cada classe.
importante notar que ao resumir dados referentes a uma varivel contnua sempre se perde alguma
informao j que no temos idia de como se distribuem as observaes dentro de cada classe.
Para isso temos duas definies:
Amplitude (A) - corresponde a diferena enter o maior valor e o menor valor de um conjunto
de dados;
Amplitude da classe (c) - consiste na diferena entre o limite superior e o limite inferior de
uma classe em uma distribuio de freqncia.
O procedimento para construir tabelas de distribuio freqncias para variveis quantitativas
contnuas envolve os seguintes passos (algoritmo):

Estatstica Descritiva

14

Decidir sobre o numero de classes k, entre 5 e 20. Para que a deciso no seja totalmente
arbitrria pode-se usar a raiz quadrada do total de valores como o nmero de classes, ou

seja, k
= n
Determinar a amplitude dos dados: A = Max - Min.
Determinar a amplitude de classe c:
c=

A
k1

Determinar o limite inferior da primeira classe LI1 :


LI1 = M in

c
2

Determinar o limite superior da primeira classe LS1 :


LS1 = LI1 + c
sendo que o limite inferior da segunda classe LI2 igual ao LS1 , e assim
LS2 = LI2 + c
e assim, sucessivamente todas as classes vo sendo construdas.
Aps a construo das classes, so contados quantos dados esto contidos em cada classe
e se obtem as freqncias.

Tabela 2.7: Dados ordenados, relativos ao tempo em segundos para carga de um aplicativo num
sistema compartilhado (30 observaes).
6,94
7,27
7,46
7,97
8,03
8,37
8,56
8,66
8,88
8,95
9,30
9,33
9,55
9,76
9,80
9,82
9,98
9,99
10,14 10,19 10,42 10,44 10,66 10,88
10,88 11,16 11,80 11,88 12,25 12,34

k =

30 = 5, 47 5

A = M ax M in = 12, 34 6, 94 = 5, 40
A
5, 40
c =
=
= 1, 35
k1
4
c
1, 35
= 6, 94 0, 67 = 6, 27
LI1 = M in = 6, 94
2
2
Uma forma de representar graficamente distribuio de freqncia das variveis contnuas
por meio do histograma e do polgono de freqncia . Para elaborao deste grfico comum

Estatstica Descritiva

15

Tabela 2.8: Distribuio de freqncias, relativa ao ao tempo em segundos para carga de um


aplicativo num sistema compartilhado.
Classes
Freqncia Freqncia Freqncia Freqncia Freqncia
Absoluta
Relativa
Percentual Acumulada Percentual
(fa)
(fr)
(fp)
(FA)
Acumulada
(FP)
6,27 ` 7,62
3
0,10
10%
3
10%
7,62 ` 8,97
7
0,23
23%
10
33%
8,97 ` 10,32
10
0,33
33%
20
67%
10,32 ` 11,67
6
0,20
20%
26
87%
11,67 ` 13,02
4
0,13
13%
30
100%
30
1,00
100%
utilizar a chamada densidade de freqncia absoluta (dfa)
df a =

fr
c

O histograma semelhante ao grfico de barras verticais, no eixo vertical pode-se utilizar as


freqncias ou densidades de freqncias e no eixo horizontal as classes. O polgono de freqncias
um grfico de linhas em que no eixo vertical pode-se utilizar as freqncias ou densidades de
freqncias e no eixo horizontal o ponto mdio de cada classe.

Figura 2.4: Histograma e Polgono de freqncias do relativa ao tempo em segundos para carga
de um aplicativo num sistema compartilhado
Muitas vezes, a anlise da distribuio de freqncias acumuladas mais interessante do que
a de freqncias simples, representada pelo histograma. O grfico usado na representao grfica
da distribuio de freqncias acumuladas de uma varivel contnua a ogiva, apresentada na
Figura 2.5. Para a construo da ogiva, so usadas as freqncias acumuladas (absolutas ou
percentuais) no eixo vertical e os limites superiores de classe no eixo horizontal.

Estatstica Descritiva

16

O primeiro ponto da ogiva formado pelo limite inferior da primeira classe e o valor zero,
indicando que abaixo do limite inferior da primeira classe no existem observaes. Da por
diante, so usados os limites superiores das classes e suas respectivas freqncias acumuladas,
at a ltima classe, que acumula todas as observaes. Assim, uma ogiva deve comear no valor
zero e, se for construda com as freqncias relativas acumuladas, terminar com o valor 100.

Figura 2.5: Ogiva para o tempo em segundos para carga de um aplicativo num sistema compartilhado

Estatstica Descritiva
2.4

17

MEDIDAS DE POSIO

Medidas de Posio - So medidas de tendncia central, ou seja, representativas do valor


central, ao redor do qual se agrupam a maioria dos valores.
2.4.1

Mdia Aritmtica

A mdia de uma populao ou amostra a soma de todos os elementos da populao (amostra)


dividida pelo nmero de elementos. Esta medida apresenta a mesma unidade dos dados.
Para a populao a mdia representada por
N
X

xi

i=1

em que N o tamanho da populao


Para a amostra a mdia representada por
n
X

X=

xi

i=1

em que n o tamanho da amostra.


A mdia calculada dos dados originais e dados agrupados podem ser diferentes, devido ao
erro de agrupamento. O erro de agrupamento obtido fazendo a diferena entre o valor obtido
pelos dados originais e o valor obtido pelos dados agrupados.
Exemplo: O tempo de vida til (em horas) de uma amostra de 6 lmpadas incadescentes :
612, 983, 623, 883, 666 , 970. A mdia amostral do tempo de vida dado por:
n
X

X=
2.4.1.1

i=1

xi
=

612 + 983 + 623 + 883 + 666 + 970


4737
=
= 789, 5
6
6

Propriedades da mdia

A mdia aritmtica de uma amostra apresenta um conjunto vasto de propriedades, todas


elas, sem dvida, de grande utilidade no clculo do seu valor.
1. Adio ou Subtrao por uma constanteSeja (X1 , X2 , X3 , ..., Xn ) uma amostra aleatria de
tamanho n, k uma constante e X a mdia da amostra. Se somarmos ou subtrairmos todos
os valores de uma varivel X pela constante k, o valor de X MDIA fica multiplicada ou

Estatstica Descritiva

18

dividida pela constante.


n
X
(Xi + k)

i=1

n
n
X

i=1

i=1

n
n
X

n
X

Xi +

n
X

Xi

i=1

i=1

nk
= X+
n
= X +k

Se no exemplo das lmpadas somarmos a constante 2 a cada um dos valores da varivel


temos 614, 985, 625, 885, 667,972

X =

4749
614 + 985 + 625 + 885 + 668 + 972
=
= 791, 5
6
6

Utilizando a propriedade,

X = X + k = 789, 5 + 2 = 791, 5
2. Multiplicao ou diviso por uma constante
Seja (X1 , X2 , X3 , ..., Xn ) uma amostra aleatria de tamanho n, k uma constante e X a
mdia da amostra. Se multiplicarmos ou dividirmos todos os valores de uma varivel X
pela constante k, o valor de X MDIA fica multiplicada ou dividida pela constante.
n
X

kxi

i=1

= k

n
n
X

xi

i=1

= kX
Se no exemplo das lmpadas multiplicarmos a constante 2 a cada um dos valores da varivel
temos 1224, 1966, 1246, 1766, 1332, 1940.

X =

1224 + 1966 + 1246 + 1766 + 1332 + 1940


9474
=
= 1579
6
6

Estatstica Descritiva

19

Utilizando a propriedade,

X = kX = 2 789, 5 = 1579
3. Soma dos desvios
Seja (X1 , X2 , X3 , ..., Xn ) uma amostra aleatria de tamanho n e X a mdia da amostra.
Se subtrairmos cada valor da varivel X pelar mdia obtemos os desvios. A soma algbrica
dos desvios igual a zero
n
X

Xi X

n
X

i=1

i=1

n
X

i=1

n
n
X

Xi

n
X

Xi

i=1

i=1

nX
= X
n
= X X =0
No exemplo da lampda, temos:
Amostra
612
983
623
883
666
970

2.4.2

X
789,5
789,5
789,5
789,5
789,5
789,5
soma dos desvios

Desvio
-177,5
193,5
-166,5
93,5
-123,5
180,5
0

Mediana

Num conjunto de dados ordenados, a mediana (Md ) o valor que deixa metade da freqncia
abaixo dele. A mediana, como a mdia, possui a mesma unidade de cada observao.
A mediana pode ser obtida por meio da expresso:

Md =

X n+1

X n2 +X n+2
2
2

se n for mpar

se n for par

Exemplo: Considere o conjunto de dados: 5, 2, 6, 13, 9, 15, 10.


Primeiro necessrio ordenar os dados: 2, 5, 6, 9, 10, 13, 15. Como se de uma conjunto com
n = 7 (mpar), ento:
M d = X n+1 = X 7+1 = X4
2

Estatstica Descritiva

20

Logo a Mediana igual ao elemento que est na quarta posio do conjunto de dados, assim
Md = 9
Exemplo: Considere o conjunto de dados: 1, 3, 8, 6, 2, 4.
Primeiro necessrio ordenar os dados: 1, 2, 3, 4, 6, 8. Como se de uma conjunto com n = 6
(par), ento
X n2 + X n+2
X 6 + X 6+2
X3 + X4
2
2
Md =
= 2
=
2
2
2
Logo para obter a mediana necessrio obter os elementos que esto na terceira e quarta
posio do conjunto de dados, assim:
Md =
2.4.3

3+4
= 3, 5
2

Moda

A moda Mo de um conjunto de dados o valor mais freqente e tambm tem a mesma


unidade dos dados. Para obter a moda basta observar qual o dado que mais se repete.
Exemplo: No conjunto de dados 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 a moda igual a 10, pois
nico que se repete.
Exemplo: No conjunto de dados 3 , 5 , 8 , 10 , 12 no apresenta moda. O conjunto amodal
Exemplo: No conjunto de dados 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 temos duas modas:
4 e 7. O conjunto bimodal.
2.4.4

Comparao entre Mdia, Mediana e Moda

Mdia
Definio: Soma de todos os valores dividido pelo total de elementos do conjunto.
Vantagens: Reflete cada valor;Possui propriedades matemticas atraentes.
Limitaes: influenciada porvalores externos.
Quando usar:
1. Deseja-se obter a medida de posio que possui a maior estabilidade;
2. Houver necessidade de um tratamento algbrico posterior.
Mediana
Definio: Valor que divide o conjunto em duas partes iguais.
Vantagens: Menos sensvel a valores extremos que a mdia.
Limitaes: Difcil de determinar para grande quantidade de dados
Quando usar:
1. Deseja-se obter o ponto que divide o conjunto em partes iguais;
2. H valores extremos que afetam de maneira acentuada a mdia;
Moda

Estatstica Descritiva

21

Definio: Valor mais freqente.


Vantagens: Valor "tpico"; Maior quantidade de valores concentrados neste ponto
Limitaes: No se presta a anlise matemtica; Pode no haver moda para certos
conjuntos de dados
Quando usar:
1. Deseja-se obter uma medida rpida e aproximada da posio;
2. A medida de posio deve ser o valor mais tpico da distribuio.
2.4.5

Simetria

A determinao das medidas de posio permite discutir sobre a simetria da distribuio dos
dados.
Distribuio simtrica - X = Md = Mo
Distribuio assimtrica - ocorrem diferenas entre os valores da mdia, mediana e moda.
A assimetria pode ser:
direita - X > Md > Mo
esquerda - X < Md < Mo
2.4.6

Separatrizes

Alm das medidas de posio que estudamos, h outras que, consideradas individualmente,
no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores. Essas
medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo
nome genrico de separatrizes.
2.4.6.1

Quartis

Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais.

Q1: 1o quartil. Deixa 25% dos elementos antes do seu valor;


Q2: 2o quartil. Deixa 50% dos elementos antes do seu valor. Coincide com a mediana;
Q3: 3o quartil. Deixa 75% dos elementos antes do seu valor. (Consequentemente, 25% dos
elementos acima do seu valor.)
Genericamente, para determinar a ordem ou posio do quartil a ser calculado, usaremos a
seguinte expresso:
in
EQi =
4
em que

Estatstica Descritiva

22

i = nmero do quartil a ser calculado;


n = nmero de observaes;
Exemplo: Calcule os quartis do conjunto de dados 5, 2, 6, 9, 10, 13, 15
O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: 2, 5,
6, 9, 10, 13, 15
1o quartil
17
= 1, 75
EQ1 =
4
Logo o quartil 1 est entre o 1o e o 2o elemento (1o antecede 1,75o e 2o posterior a ele.). Assim,
o 1o quartil ser dado pela mdia entre os 1o e o 2o elemento.
2+5
= 4, 5
2

Q1 =
2o quartil

EQ2 =

27
= 3, 5
4

Logo o quartil 2 est entre o 3o e o 4o elemento (3o antecede 3,5o e 4o posterior a ele.). Assim,
o 2o quartil ser dado pela mdia entre os 3o e o 4o elemento.
Q2 =

6+9
= 10, 5
2

3o quartil
EQ3 =

37
= 5, 25
4

Logo o quartil 3 est entre o 5o e o 6o elemento (5o antecede 5,25o e 6o posterior a ele.). Assim,
o 3o quartil ser dado pela mdia entre os 5o e o 6o elemento.
Q2 =
2.4.6.2

10 + 13
= 16, 5
2

Percentis ou Centis

So as medidas que dividem a amostra em 100 partes iguais. Assim:

O elemento que definir a ordem do percentil ser encontrado pelo emprego da expresso:
EP i =
em que:
i = nmero identificador do percentil;
n = nmero total de observaes;

in
100

Estatstica Descritiva

23

Relao entre percentil, quuartil e mediana


P25 = Q1
P50 = Q2 = M d
P75 = Q3
Exemplo: Calcule os percentil 90 do conjunto de dados 1,4,2,4,7,9,2
O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: 1, 2, 2,
4, 4, 7, 9
Perdential 90
90 7
EP90 =
= 6, 3
100
Logo o percentil 90 est entre o 6o e o 7o elemento (6o antecede 6,3o e 7o posterior a ele.).
Assim, o 90o percentil ser dado pela mdia entre os 6o e o 7o elemento.
7+9
=8
2

P90 =
2.4.7
2.4.7.1

Dados agrupados
Mdia

Quando os dados so agrupados (Distribuio de freqncia) a mdia representada por


n
X

X=

f ai xi

i=1
n
X

f ai

i=1

em que
para variveis contnuas xi o ponto mdio da classe
f ai o freqncia absoluta de xi
A mdia calculada dos dados originais e dados agrupados podem ser diferentes, devido ao
erro de agrupamento. O erro de agrupamento obtido fazendo a diferena entre o valor obtido
pelos dados originais e o valor obtido pelos dados agrupados.
2.4.7.2

Mediana

Para calcular a mediana em dados agrupados necessrio observar a freqncia acumulada


para definir a classe mediana.
A posio da mediana EMd definida da seguinte forma

EMd =

n+1

n
2

se n for mpar
se n for par

Estatstica Descritiva

24

Definida a classe mediana utiliza-se a expresso abaixo para obter a mediana


Md = LIi +

n1
c
n2

em que:
LIi o limite inferior da classe mediana
c a amplitude da classe mediana
n1 a diferena entre a Posio da mediana e a freqncia acumulada da classe anterior a
classe mediana
n2 a freqncia absoluta da classe mediana
2.4.7.3

Moda

A moda Mo de um conjunto de dados o valor mais freqente e tambm tem a mesma


unidade dos dados. Para obter a moda basta observar qual o dado que mais se repete.
Para dados agrupados de variveis continuas a moda se localiza na classe de maior freqncia
(classe modal) e obtida por meio da expresso:
Mo = LIi +

1
c
1 + 2

LIi o limite inferior da classe modal;


c a amplitude da classe modal;
1 a diferena da freqncia da classe modal e a freqncia da classe imediatamente
anterior;
2 a diferena da freqncia da classe modal e a freqncia da classe imediatamente
posterior.
2.4.7.4

Quartil

Para calcular o quartil em dados agrupados necessrio observar a freqncia acumulada


para definir a classe quartlica.
A posio da mediana EQi definida da seguinte forma
EQi =

in
4

Definida a classe quartlica utiliza-se a expresso abaixo para obter o quartil


Qi = LIi +
em que:
LIi o limite inferior da classe quartlica

n1
c
n2

Estatstica Descritiva

25

c a amplitude da classe quartlica


n1 a diferena entre a Posio do quartil e a freqncia acumulada da classe anterior a
classe quartlica
n2 a freqncia absoluta da classe quartlica
2.4.7.5

Percentil

Para calcular o percentil em dados agrupados necessrio observar a freqncia acumulada


para definir a classe percentlica.
A posio da mediana EPi definida da seguinte forma
EPi =

in
100

Definida a classe percentlica utiliza-se a expresso abaixo para obter o percentil


Pi = LIi +

n1
c
n2

em que:
LIi o limite inferior da classe percentlica
c a amplitude da classe percentlica
n1 a diferena entre a Posio do percentlica e a freqncia acumulada da classe anterior
a classe percentlica
n2 a freqncia absoluta da classe percentlica
2.4.7.6

Exemplo

Tabela 2.9: Dados ordenados, relativos ao tempo em segundos para carga de um aplicativo num
sistema compartilhado (30 observaes).
6,94
7,27
7,46
7,97
8,03
8,37
8,56
8,66
8,88
8,95
9,30
9,33
9,55
9,76
9,80
9,82
9,98
9,99
10,14 10,19 10,42 10,44 10,66 10,88
10,88 11,16 11,80 11,88 12,25 12,34
Assim,

n
X

X=

f ai xi

i=1
n
X

=
f ai

290, 55
= 9, 685
= 9, 68
30

i=1

Para dados agrupados, primeiro vamos obter a classe mediana


n
30
=
= 15
2
2

Estatstica Descritiva

26

Tabela 2.10: Resumo da distribuio de freqncias, relativa ao ao tempo em segundos para


carga de um aplicativo num sistema compartilhado.
Classes
x
Frequencia f a x Frequencia
Absoluta
Acumulada
(fa)
(FA)
6,27 ` 7,62
6,94
3
20,82
3
7,62 ` 8,97
8,29
7
58,03
10
8,97 ` 10,32 9,64
10
96,4
20
10,32 ` 11,67 10,99
6
65,94
26
11,67 ` 13,02 12,34
4
49,36
30
Total
30
290,55
Assim a classe mediana a que contm a freqncia acumulada 15, ou seja a classe 8, 97 ` 10, 32.
Ento temos:
LIi = 8, 97
c=1,35
n1 = 15 10 = 5
n2 = 10
Substituindo nas formula, temos
Md = LIi +

n1
5
c = 8, 97 + 1, 35 = 8, 97 + 0, 67 = 9, 64
n2
10

Para obter a moda, primeiro vamos obter a classe modal.


A maior freqncia absoluta 10, assim a classe modal 8, 97 ` 10, 32. Assim, temos
Mo = LIi +

1
c
1 + 2

LIi = 8, 97;
c = 1, 35;
1 = 10 7 = 3;
2 = 10 6 = 4

Mo = LIi +

2.5

1
3
c = 8, 97 +
1, 35 = 8, 97 + 0, 58 = 9, 55
1 + 2
3+4

BOXPLOT

O grfico Boxplot (ou desenho esquemtico) uma anlise grfica que oferece a ideia da
posio, disperso, assimetria, caudas e dados discrepantes. Para constru-lo, desenhamos uma
"caixa"com o nvel superior dado pelo terceiro quartil (Q3 ) e o nvel inferior pelo primeiro quartil

Estatstica Descritiva

27

(Q1 ). A mediana (Q2 ) representada por um trao no interior da caixa e segmentos de reta so
colocados da caixa at dos limites inferior (LI) e superior (LS), dados por
LI = Q1 1.5dq
LS = Q3 + 1.5dq
em que dq = Q3 Q1 denominando diferena quartilica.
Para traarmos o boxplot utilizamos as seguintes etapas:
Contruir um retngulo de tal maneira que suas bases tm alturas correspondentes aos
primeiro e terceiro quartis da distribuio.
Cortar o retngulo por um segmento paralelo s bases, na altura correspondente mediana;
Traar um segmento paralelo ao eixo, partindo do ponto mdio da base superior do retngulo at o maior valor observado que NO supere LS;
Traar um segmento paralelo ao eixo, partindo do ponto mdio da base inferior do retngulo, at o menor valor que NO menor LI;
Case tenha valores que superior a LS ou inferior a LI, marcar os pontos, este valores so
considerados observaes discrepantes.
Podemos opcionalmente marca o valor da mdia;
Para o conjunto de dados do tempo de carga de um aplicativo temos:
M d = 9, 81
Q1 = 8, 71
Q3 = 10, 61
dq = 10, 61 8, 71 = 1, 9
LI = 8, 71 1, 5 1, 9 = 5, 86
LS = 10, 61 + 1, 5 1, 9 = 13, 46

Estatstica Descritiva

28

Figura 2.6: Boxplot para o tempo em segundos para carga de um aplicativo num sistema compartilhado

Estatstica Descritiva
2.6

29

MEDIDAS DE DISPERSO

As medidas de posio so importantes para caracterizar um conjunto de dados, mas no


so suficientes para caracterizar completamente a distribuio dos dados. Para isso necessrio
obter as medidas de disperso, que medem a variabilidade dos dados.
Por exemplo: Considere as amostras referentes a altura, em cm, de dois grupos de pessoas.
Grupo A: 185 185 185
Grupo B: 187 183 185
A mdia para os dois grupos a mesma X A = 185 e X B = 185.
Os 2 conjuntos no diferem entre si e consideramos somente a mdia, pois se basearmos
somente por essa medida os dois grupos so considerados como de mesma altura. Entretanto o
grupo A tem todas as observaes iguais a mdia. J no grupo B ocorre uma certa disperso nos
dados.
As medidas de variabilidade ou disperso possibilitam que faamos distino entre os conjuntos quanto sua homogeneidade, isto , o grau de concentrao em torno de uma medida de
tendncia central.
2.6.1

Amplitude Total

Amplitude Total (A) a diferena entre o maior e o menor valor da amostra. Essa medida
bastante simples, e obtida pela expresso:
A = M ax M in
Para dados agrupados a amplitude total a diferena entre o ponto mdio da ltima e da
primeira classe.
Para expressar variabilidade a amplitude total no muito usada, pois baseia-se em apenas
dois dados.
2.6.2

Varincia e Desvio Padro

A varincia baseada pela quadrado dos desvios dos dados em relao mdia. Esta medida
expressa na unidade dos dados ao quadrado.
Para a populao a varincia representada por
N
X

2 =

(xi )2

i=1

em que N o tamanho da populao


Para a amostra a varincia representada por
n
X

S2 =

xi X

i=1

n1

2

Estatstica Descritiva

30

em que n o tamanho da populao


Para dados agrupados, a varincia obtida por meio da expresso:
Para a populao a varincia representada por
k
X

2 =

(xi )2 f ai

i=1
k
X

f ai

i=1

Para a amostra a varincia representada por


n
X

S2 =

xi X

2

f ai

i=1
k
X

f ai 1

i=1

O desvio padro a raz quadrada positiva da varincia. Esta medida expressa na mesma
unidade dos dados.
Para a populao o desvio padro representada por

Para a amostra o desvio padro representada por

S=

S2

em que n o tamanho da populao


Nota:
O desvio padro e a varincia so medidas de disperso ou variabilidade, a opo do uso
de um ou outro, depende da finalidade da informao.
A varincia tem pouca utilidade na estatstica descritiva, porm muito importante na
inferncia estatstica e em combinaes de amostras.
O desvio padro muito usado na estatstica descritiva.
importante notar que, se os dados representarem uma amostra e no toda a populao,
a expresso matemtica da varincia deve ter (n 1) no denominador em substituio ao
fator n, esta mudana chamada de fator de correo de Bessel ou conforme os estatsticos,
nmero de graus de liberdade. Dessa forma temos a varincia da amostra.

Estatstica Descritiva
2.6.2.1

31

Propriedades da Varincia

A varincia apresenta um conjunto vasto de propriedades, todas elas, sem dvida, de grande
utilidade no clculo do seu valor.
1. A varincia de uma constante k nula;
n
X

S2

2

i=1

n1
n
X

kX

(k k)2

i=1

n1
n
X
(0)2
i=1

n1

= 0
2. Somando-se ou subtraindo-se uma constante k a todos os dados a varincia no se altera.
Xi = Xi + k

S2

= X +k
n 

X
2
Xi X
=

i=1

n1
n
X

i=1

n1
n
X

Xi + k X k

i=1
n
X

2
Xi + k (X + k)

n1
2
Xi X

i=1

= S2

n1

2

Estatstica Descritiva

32

3. Multiplicando-se todos os dados por uma constante k, a varincia fica multiplicada por k 2 .
Xi = kXi

= kX
n 
X

S2

Xi X


2

i=1

n1
n
X

kXi kX

2

i=1

n1
n
X

k Xi X

2

i=1

n1
n
X

k 2 Xi X

2

i=1

n1
2 2

= k S
2.6.2.2

Propriedades do Desvio Padro

1. Somando-se ou subtraindo-se uma constante k a todos os dados o desvio padro no se


altera.
Xi = Xi + k

S2

= S2

S2
S =

2. Multiplicando-se todos os dados por uma constante k, a varincia fica multiplicada por k 2 .
Xi = kXi

S2

= k2 S 2

S =
k 2 S 2 = kS

2.6.3

Coeficiente de Variao

O coeficiente de variao (CV ) uma medida de disperso que expressa o desvio padro em
termos da mdia de forma percentual
CV = 100

S
X

Se as amostras tiverem unidade diferentes ou mdias diferentes o CV pode ser utilizado para
comparar a variabilidade entre duas amostras.

Estatstica Descritiva
2.6.4

33

Erro Padro da Mdia

O erro padro da mdia uma medida de disperso que d a preciso com que a mdia
populacional est sendo estimada. obtido pela frmula
S
S(X) =
n
em que:
S o desvio padro da amostra;
n o tamanho da amostra.

2.7

EXEMPLOS

Sejam dados referentes a um levantamento onde observou-se o numero de peas defeituosas


em 25 maquinas de uma empresas.
Tabela 2.11: Nmero de peas defeituosas em 25 maquinas de uma empresa
1 3 4 5 6
2 3 4 5 6
2 3 4 5 6
2 3 5 5 7
2 4 5 5 8
A amplitude total
A = M ax M in = 8 1 = 7
Temos que a mdia X = 4 e como se trata de uma amostra temos:
n
X

S2 =

xi X

i=1

n1

2

(1 4)2 + (2 4)2 + ... + (8 4)2
=
= 3, 041666667
= 3, 04
25 1

O desvio padro

S=

S2 =

p
3, 04 = 1, 7435595
=2

O coeficiente de variao
CV = 100

S
2
= 100 = 50%
4
X

O erro padro da mdio


S
2
S(X) = = = 0, 4
n
25
2.7.1

Dados Agrupados

Assim, Amplitude total


A = M ax M in = 12, 34 6, 94 = 5, 40

Estatstica Descritiva

34

Tabela 2.12: Resumo da distribuio de freqncias, relativa ao tempo em segundos para carga
de um aplicativo num sistema compartilhado (30 observaes)
Classes
x
Frequencia x X (x X)f a
Absoluta
(fa)
6,27 ` 7,62
6,94
3
7,5076
22,5228
7,62 ` 8,97
8,29
7
1,9321
13,5247
8,97 ` 10,32 9,64
10
0,0016
0,016
10,32 ` 11,67 10,99
6
1,7161
10,2966
11,67 ` 13,02 12,34
4
7,0756
28,3024
Total
30
74,6625
Temos que a mdia X = 9, 68 e como se trata de uma amostra temos:
n
X

xi X

2

f ai

i=1
k
X

f ai 1

i=1

74, 6625
29
= 2, 5745689
= 2, 5746
=

O desvio padro

S=

S2 =

p
2, 5746 = 1, 604556
= 1, 60

O coeficiente de variao
CV = 100

S
1, 60
= 100
= 16, 53%
9, 68
X

O erro padro da mdia


S
1, 60
S(X) = = = 0, 29
n
30

NOES DE PROBABILIDADE

J vimos que para se obter informaes sobre alguma caracterstica da populao, podemos

utilizar uma amostra. Estudaremos agora a probabilidade, que uma ferramenta usada e necessria para se fazer ligaes entre a amostra e a populao, de modo que a partir de informaes
da amostra se possa fazer afirmaes sobre caractersticas da populao.
As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado evento.
O estudo das probabilidades importante pois elas so a base para o estudo estatstico
A teoria de probabilidades tem por objetivo o estudo de fenmenos aleatrios. Um fenmeno
chamado de aleatrio se ele tem a seguinte propriedade: quando observado repetidamente sob
as mesmas condies ele produz resultados diferentes. Mesmo que a chance da ocorrncia seja
alta, os resultados no so conhecidos antes de ocorrer, mas de certa forma, mantm uma certa
regularidade, o que permite determinar a chance de ocorrncia; a Probabilidade.
Exemplos:
Jogar uma moeda repetidamente e observar o resultado da face de cima;
Jogar um dado e observar o nmero mostrado na face superior;
Nmero de filhos de um casal;
Observao: quando a possibilidade de repetir o fenmeno est na mo do experimentador,
este fenmeno aleatrio chamado de experimento aleatrio.

3.1

ESPAO AMOSTRAL E EVENTOS


Espao amostral () - o conjunto de todos os possveis resultados de um experimento.
Um espao amostral
Exemplo:
Lanamento de um dado no viciado. Neste caso o espao amostral
= {1, 2, 3, 4, 5, 6}
Lanar uma moeda duas vezes e observar as faces obtidas
= {(Ca, Co), (Ca, Ca), (Co, Ca), (Co, Co)}

Noes de Probabilidade

36

No lanamento de um dado pode-se interessar, por exemplo, somente na ocorrncia de nmero


mpares. O subconjunto A = {1, 3, 5} do espao amostral representa o evento A definido pela
ocorrncia de nmeros mpares.
Evento - um subconjunto do espao amostral que representa um resultado definido.
Ponto amostral - apenas um elemento do espao amostral.
3.1.1

Operao com eventos

Sejam A e B dois eventos de um mesmo espao amostral O evento interseco de A e B,


denotado A B, e o evento em que A e B ocorrem simultaneamente.

Dois eventos A e B so mutuamente exclusivos ou disjuntos se eles no podem ocorrer simultaneamente A B = .

O evento Unio de A e B, denotado A B, e o evento em que A ocorre ou B ocorre (ou


ambos).

O evento complementar de A, denotado Ac , o evento em que A no ocorre.

Exemplo: Seja o espao amostral = {1, 2, 3, 4, 5, 6} e considere os eventos:


A = {1, 3, 5} B = {2, 4, 6} C = {3, 4, 5, 6}
Vamos fazer as seguintes operaes:
A B = Conjuntos mutuamente exclusivos ou disjunto
A C = {3, 5}
A B = {1, 2, 3, 4, 5, 6} =
A B c = {1, 3, 5} = A os elementos de que no esto no conjunto B B c {1, 3, 5}

Noes de Probabilidade
3.2

37

PROBABILIDADE

Probabilidade - freqncia relativa associada a um varivel descritora de uma populao.


Num espao amostral , a probabilidade de ocorrer um evento A, representado por P (A),
dado pela medida de A em nas seguintes condies: Exemplo: A probabilidade de ocorrer face
mpar no lanamento de um dado no viciado
P (A) =

3
1
n
= = = 0, 5 = 50%
N
6
2

Algumas propriedades de probabilidade:


A probabilidade de ocorrncia de vale 1, ou seja, P () = 1
Probabilidade de em evento certo e de um evento impossvel
P () = 1;

P () = 0

A probabilidade de ocorrncia do evento A no negativa, ou seja, P (A) 0


Domnio da Probabilidade
0 P (A) 1
Regra da Adio de probabilidades de dois eventos A e B:
P (A B) = P (A) + P (B) P (A B)
No exemplo do lanamento de um dado seja os eventos A = {2, 4, 6} e B = {3, 4, 5, 6}. A
unio entre os dois conjuntos daria {2, 3, 4, 5, 6}. Assim:
P (A B) =

5
= 0, 83 = 83%
6

Utilizando a regra da adio teriamos:


P (A B) = P (A) + P (B) P (A B) =

3 4 2
5
+ = = 0, 83 = 83%
6 6 6
6

em que A B = {4, 6}
Probabilidade complementar
P (Ac ) = 1 P (A)
No exemplo do lanamento de um dado seja o evento A = {3, 4, 5, 6}, ento Ac = {1, 2},
logo
4
2
P (A) =
e P (Ac ) =
6
6
utilizando a regra da probabilidade complementar teriamos:
P (Ac ) = 1 P (A) = 1

4
64
2
=
=
6
6
6

Noes de Probabilidade
3.2.1

38

Probabilidade Condicional e Independncia de Eventos

A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade


de um evento A ocorrer sabendo que um evento B j ocorreu.
Sejam A e B dois eventos associados a um mesmo espao amostral . Denota-se por P (A|B)
a probabilidade condicionada do evento A, quando o evento B tiver ocorrido.
Sempre que calculamos P (A|B), estamos essencialmente calculando P (A) em relao ao
espao amostral reduzido devido a B ter ocorrido, em lugar de faze-lo em relao ao espao
amostral original .
Dados dois eventos A e B , a probabilidade condicional de A dado que ocorreu B representada por P (A|B) e definida por
P (A|B) =

P (A B)
,
P (B)

P (B) 6= 0.

Isso significa que a probabilidade de A ocorrer, dado que B ocorreu, igual probabilidade
de ocorrncia simultnea de A e B dividida pela probabilidade de ocorrncia de B.
Exemplo: Na tabela a seguir temos dados referentes a alunos matriculados em trs cursos de
uma universidade em dado ano.
Tabela 3.1: Dados referentes a alunos de uma dada universidade.
Cursos
Sexo
Total
Feminino Masculino
Administrao
70
40
110
Psicologia
10
20
30
Geologia
20
15
35
Total
100
75
175
Qual a probabilidade de escolhermos um aluno ao acaso e ele ser:
Homem (H) e da Administrao (Adm)?
P (H Adm) =

40
= 0, 2285
175

b) Homem (H) ou da Administrao (Adm)?


P (H Adm) = P (H) + P (Adm) P (H Adm)
110
40
145
75
=
+

=
= 0, 8285
175 175 175
175
Psicologia (P si) ou Geologia (Geo)?
P (P si Geo) = P (P si) + P (Geo) P (P si Geo)
30
35
65
=
+
0=
= 0, 3714
175 175
175

Noes de Probabilidade

39

De ser um aluno da psicologia dado que mulher.


P (P si|M ) =
=

P (P si M )
P (M )
10
175
100
175

10 175
10
=
= 0, 10
175 100
100

Das expresses acima resulta a regra do produto, que se refere ao clculo da probabilidade
do evento interseo,
P (A B) = P (A|B).P (B)
A ordem do condicionamento pode ser invertida. Para trs eventos, por exemplo, pode-se
escrever:
P (A B C) = P (A).P (B|A).P (C|A B)

(3.1)

Dois eventos A e B so independentes se a ocorrncia de um no altera a probabilidade


de ocorrncia do outro, isto , P (A|B) = P (A) ou P (B|A) = P (B), ou ainda, a seguinte forma
equivalente:
P (A B) = P (A).P (B)
3.2.2

rvores de probabilidade

A contruo de uma rvore de probabilidade fornece uma ferramenta muito til para a
soluo de problemas envolvendo duas ou mais etapas. A rvore consiste em uma representao
grfica na qual diversas possibilidades so representadas, juntamente com as respectivas probabilidades condicionadas a cada situao. Isso permite, pela utilizao direta da regra do produto
das probabilidades, associar a cada n terminal da rvore a respectiva probabilidade.
O uso das rvores de probabilidade ajudam e simplificam o entendimento da aplicao de
dois teoremas que sero apresentados a seguir, conforme ser visto no exemplo.
Exemplo: Em certo colgio, 5% dos homens e 2% das mulheres tm mais de 1,80m de altura.
Por outro lado, 40% dos estudantes so homens. Sorteando-se um estudante aleatoriamente,
qual a probabilidade de:
Ser mulher (M ) e ter mais de 1,80m?
P (M > 1, 80) = 0, 60 0, 02 = 0, 012
Ter mais de 1,80m?
P (> 1, 80) = P (M > 1, 80) + P (H > 1, 80)
P (H > 1, 80) = 0, 40 0, 05 = 0, 02
P (> 1, 80) = 0, 012 + 0, 02 = 0, 032

Noes de Probabilidade

40

Um estudante escolhido ao acaso e tem mais de 1,80m. Qual a probabilidade de que o


estudante seja mulher?
P (M | > 1, 80) =

3.3

0, 012
P (M > 1, 80)
=
= 0, 375
P (> 1, 80)
0, 032

VARIVEL ALEATRIA

Varivel Aleatria - varivel descritora de populaes, cujos valores so associados a probabilidades de ocorrncia.
Exemplo: Um estudante submetido a trs questes de mltipla escolha, em cada questo
tinha cinco alternativas. Logo a chance de acerta uma questo no chute 20%
Correto (C) - P (C) = 20% =
Errado (E) - P (E) = 80% =

1
5
4
5

A questes e resultados possveis so:

Noes de Probabilidade

41

= {CCC, CCE, CEC, CEE, ECC, ECE, EEC, EEE}


Supondo que sua varivel aleatria acertar a questo, temos que o ocorrncia no espao
amostral pode ser:

=

CCC CCE CEC CEE ECC ECE EEC EEE


,
,
,
,
,
,
,
3
2
2
1
2
1
1
0

As probabilidade dos pontos amostrais so:


P (CCC) =
P (CCE) =
P (CEC) =
P (CEE) =
P (ECC) =
P (ECE) =
P (EEC) =
P (EEE) =

111
555
114
555
141
555
144
555
411
555
414
555
441
555
444
555

=
=
=
=
=
=
=
=

1
125
4
125
4
125
16
125
4
125
16
125
16
125
64
125

Pode-se construir uma tabela, em que X o nmero de questes corretas e f(x) a probabilidade de ocorrer o resultado X.
x
f(x)

0
64/125

1
48/125

2
12/125

3
1/125

Nesta tabela X assume os valores (X = 0, 1, 2, 3) que so valores numricos que descrevem


os resultados da experincia, logo os valores de X so de uma varivel aleatria.
Uma funo que transforma em resultados de um espao amostral em nmeros reais, chama-se
varivel aleatria.
X o nome da varivel aleatria definida. Ex. nmero de questes corretas;
x so os valores assumidos pela varivel. Ex. x = 0, 1, 2, 3.
3.3.1

Funo de Probabilidade Discreta

uma funo f (x) que associa a cada valor x da varivel aleatria a sua respectiva probabilidade. Esta funo deve atender duas condies:
1. f (x) 0;
X
2.
f (x) = 1

Noes de Probabilidade

42

x
f(x)

0
64/125

1
48/125

2
12/125

3
1/125

Ex.: Para a trs questes, considerando X nmero de acertos e x=(0,1,2,3)


Verificao da duas condies:
1. f (x) 0;
Para x < 0 f (x) = 0
Para 0 x 2 f (x) > 0
Para x > 2 f (x) = 0
2.

f (x) =

64
48
12
1
125
+
+
+
=
=1
125 125 125 125
125

Uma funo de probabilidade discreta pode ser representada por


f (x) ou P (x) ou P (X = x)
Outra forma de representar uma distribuio de probabilidade de uma varivel alearia por
meio de sua funo de distribuio acumulado, que definida por
F (x) = P (X x) =

n
X

P (X = xi )

i=1

Utilizando o exemplo das questes, temos que a funo de distribuio


x
f(x)

0
64/125

1
48/125

2
12/125

3
1/125

Assim a funo de distribuio acumulado dada por


x
F(x)

0
64/125

1
112/125

2
124/125

3
125/125

E sua representao grfica:


3.3.1.1

Esperana Matemtica e Varincia de uma VAD

Definio: Seja X uma V.A.D., com valores possveis x1, x2, ..., xn; Seja P (xi ) = P (X =
xi ), i = 1, 2, ..., n. Ento, o valor esperado de X (ou Esperana Matemtica de X), denotado por
E(X) definido como

X
E(X) =
xi P (xi )
i=1

esta expresso tambm denominado o valor mdio de X.

Noes de Probabilidade

43

2 , da
Definio: Seja X uma V.A.D. . Define-se a varincia de X, denotada por V (X) ou X
seguinte maneira:

V (X) =

(xi E(X))2 P (xi ) = ou V (X) = E(X 2 ) (E(X))2

i=1

e a raiz quadrada positiva de V(X) denominada o desvio-padro de X, e denotado por X .


No exemplo das questes
E(X) =

V (x) =

4
X
i=1
4
X

xi P (xi ) = 0

48
12
1
48
24
3
64
+1
+2
+3
=0+
+
+
= 0, 60
125
125
125
125
125 125 125

(xi E(X))2 P (xi ) = (0 0, 60)2

i=1

48
12
1
64
+ (1 0, 60)2
+ (2 0, 60)2
+ (3 0, 60)2
125
125
125
125

64
48
12
1
+ 0, 16
+ 1, 96
+ 5, 76
125
125
125
125
23, 04 7, 68 23, 52 5, 76
60
=
+
+
+
=
= 0, 48
125
125
125
125
125
V (X) = E(X 2 ) (E(X))2
4
X
48
12
1
64
48
12
1
64
E(X 2 ) =
x2i P (xi ) = 02
+ 12
+ 22
+ 32
=0
+1
+4
+9
125
125
125
125
125
125
125
125
= 0, 36

i=1

48
48
9
105
+
+
=
= 0, 84
125 125 125
125
V (X) = 0, 84 (0, 60)2 = 0, 84 0, 36 = 0, 48
= 0+

3.3.2

Funo de probabilidade contnua ou funo de densidade de probabilidade


(fdp).

Se a varivel aleatria contnua a sua funo de probabilidade uma funo contnua


conhecida por funo de densidade de probabilidade (fdp). Esta funo atende duas condies:
1. f (x) 0 x R
Z
2.
f (x)dx = 1
R

Noes de Probabilidade

44

Das duas condies verifica-se que


b

f (x)dx

P (a < x < b) =
a

No casa das variveis contnuas a funo de distribuio acumulada, que definida por
Z

F (x) = P (X x) =

f (x)dx

E sua representao grfica:

Ex.: O tempo gasto, em minutos, por um estudante para responder a uma questo de um
teste uma varivel aleatria contnua com funo dada por
(
f (x) =

x
4

para 1 x 3
0 para outros valores

Pela notao verifica-se que o estudante gasta um tempo entre 1 e 3 minutos.


Verificar as duas condies
1. f (x) 0 x R
Para x < 1 f (x) = 0
Para 1 x 3 f (x) > 0
Para x > 3 f (x) > 0
Z
f (x)dx = 1

2.
R

f (x)dx =

x
dx =
4

Z
1

x
1
dx =
4
4

Z
1

1 x2
xdx =
4 2

3
1

1
=
4

32 12

2
2

1
=
4

9 1

2 2


=

18
=1
42

Noes de Probabilidade

45

Para obter a probabilidade utiliza-se a integral, por exemplo,


3

x
dx
4

Z
P (2 < x < 3) =
2

=
=
=
=
=
3.3.2.1

1
4

xdx
2
3
x2

1
4 2 2


1 32 22

4 2
2


1 9 4

4 2 2
15
5
= = 0, 625
42
8

Esperana Matemtica e Varincia de uma fdp

Definio: Seja X uma V.A. continua, com fdp f (x). Ento, o valor esperado de X (ou
Esperana Matemtica de X), denotado por E(X) definido como
Z

E(X) =

xf (x)dx

esta expresso tambm denominado o valor mdio de X.


2 , da
Definio: Seja X uma V.A.D. . Define-se a varincia de X, denotada por V (X) ou X
seguinte maneira:
Z

(x E(X))2 f (x)dx ou V (X) = E(X 2 ) (E(X))2

V (X) =

em que
Z

E(X ) =

x2 f (x)dx

e a raiz quadrada positiva de V(X) denominada o desvio-padro de X, e denotado por X .


No exemplo da o tempo gasto, em minutos, por um estudante para responder a uma questo
de um teste, temos que:
Z

x
x dx = 2, 17
4

1
Z
Z 3
x
2
V (X) =
(x E(X)) f (x)dx =
(x 2, 17)2 dx = 0, 30
4

1
Z
Z 3
x
E(X 2 ) =
x2 f (x)dx =
x2 dx = 5, 00
4

1
E(X) =

xf (x)dx =

V (X) = E(X 2 ) (E(X))2 = 5 (2, 17)2 = 0, 30

Noes de Probabilidade
3.4

46

DISTRIBUIES DISCRETAS DE PROBABILIDADE

A distribuio discreta descreve quantidades aleatrias (dados de interesse) que podem assumir valores particulares e os valores so finitos. Por exemplo, uma varivel aleatria discreta
pode assumir somente os valores 0 e 1, ou qualquer inteiro no negativo, etc.
Exemplos
1. Lana-se uma moeda 10 vezes e anota-se o nmero de caras. Este nmero pode ser 0, 1, 2
...10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um
determinado produto. O nmero de pessoas que compram o produto varia de 0 a 200.
3. Conta-se o nmero de acidentes que ocorrem em uma rodovia num feriado prolongado. O
nmero de acidentes em questo pode ser: 0, 1, 2... Como no temos um valor que limite
esse nmero, supomos que o nmero de acidentes qualquer inteiro no negativo.
4. Nmero de chamadas telefnicas que chegam a uma central em um intervalo de tempo.
Existem vrias distribuies discretas ou modelos probabilsticos discretos que podem ser
usados em diversas situaes prticas. O problema determinar qual modelo mais adequado
para a situao em estudo, e como aplic-lo adequadamente.
3.4.1

Distribuio Uniforme Discreta

a mais simples das distribuies discretas e recebe o nome de uniforme porque todos os
valores da varivel aleatria so assumidos com a mesma probabilidade.
Exemplo o lanamento de um dado no viciado, definindo como X, a varivel aleatria que
representa a face voltada para cima, X assume os valores x = 1, 2, 3, 4, 5, 6 com a mesma probabilidade 1/6.
A distribuio uniforme neste caso dada por
f (x) =

1
para x = 1, 2, 3, 4, 5, 6
6

Generalizado obtm-se a funo de probabilidade


f (x) =

1
para x = x1 , x2 , x3 , ..., xk
k

k numero de termos.
Verifica-se ento que f (x) depende de k.
3.4.1.1

Parmetros Caractersticos da Distribuio Uniforme

1. Mdia = k+1
2
No exemplo dos dados =

6+1
2

= 3, 5

2. Varincia 2 = k 121
No exemplo dos alrgicos sigma2 ==

62 1
12

= 2, 92 s

Noes de Probabilidade
3.4.2

47

Distribuio Bernoulli

Na prtica existem muitos experimentos que admitem apenas dois resultados. Exemplos:
1. Uma pea classificada como boa ou defeituosa;
2. Um entrevistado concorda ou no com a afirmao feita;
3. Um servidor de internet est ativo ou no;
4. Numa linha de produo observa-se se um item defeituoso ou no.
Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas
do tipo sucesso-fracasso.
Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma varivel aleatria com distribuio Bernoulli. Neste caso, consideramos uma experincia com dois possveis
resultados
Sucesso P (sucesso) = p;
Fracasso P (f racasso) = q.
Temos que:
= {Sucesso, F racasso} P () = 1
p+q =1 q =1p
3.4.2.1

Parmetros Caractersticos da Distribuio Uniforme

1. Mdia = p
No exemplo dos dados =

6+1
2

= 3, 5

2. Varincia 2 = pq
No exemplo dos alrgicos sigma2 ==
3.4.3

62 1
12

= 2, 92 s

Distribuio Binomial

Na maior parte das vezes, so realizados n ensaios de Bernoulli. O interesse est no nmero
X de ocorrncias de sucessos.
Exemplos:
1. lanar uma moeda cinco vezes e observar o nmero de caras;
2. numa linha de produo, observar dez itens, e verificar quantos so defeituosos;
3. verificar, num dado instante, o nmero de processadores ativos, num sistema com multiprocessadores;
Uma experimento binomial dado da seguinte forma:
1. consiste em n ensaios de Bernoulli;

Noes de Probabilidade

48

2. cujos ensaios so independentes; e


3. para o qual a probabilidade de sucesso em cada ensaio sempre igual a p, 0 < p < 1
A varivel aleatria X, correspondente ao nmero de sucessos num experimento binomial,
tem distribuio binomial com parmetros n e p, com funo de probabilidade dada por
P (X = x) = Cxn px q nx
A frmula de clculo de uma combinao a seguinte:
Cxn

 
n
n!
=
=
x! (n x)!
x

A funo f (x) permite calcular a probabilidade de acontecer o resultado x (nmero de sucessos


da varivel aleatria), no importando a ordem de ocorrncia de x dentro da experincia.
Exemplo: Numa famlia com n = 5 filhos, qual a probabilidade de no haver homens? Qual
a probabilidade de haver dois homens? n = 5, p = 12 , q = 21
f (x) = Cx5 px q 5x ;

x = 0, 1, 2, 4, 5

A varivel aleatria representa o nmero de homens (filhos do sexo masculino) encontrado


em famlias de 5 filhos
1. x = 0 homem
f (x) = C05 p0 q 50
=
=

 0  5
5!
1
1
0! (5 0)! 2
2
1
= 0, 0313 ou 3, 13%
32

2. x = 2 homens
f (x) = C25 p2 q 52
=
=

 2  3
1
1
5!
2! (5 2)! 2
2
20 1 1
10
=
= 0, 3125 ou 31, 25%
2 48
32

Exemplo: Lanada oito moedas (ou uma moeda oito vezes), qual a chance de obter
Trs caras?
no mximo trs caras?
no mnimo quatro caras?

Noes de Probabilidade

49

A varivel aleatria x neste caso o nmero de caras obtidos no lanamento, logo neste caso
o sucesso sair cara nas moedas lanadas. Assim temos:
n = 8, p =

1
= 0, 5 q = 1 q = 1 0, 5 = 0, 5
2

A funo de probabilidade
f (x) = Cxn px q nx
Probabilidade de sair trs caras
P [X = 3] = C38 p3 q 83
8!
=
(0, 5)3 (0, 5)5
3! (8 3)!
= 56 0, 125 0, 03125 = 0, 2187 ou 21, 87%
Probabilidade de sair no mximo trs caras
P [X 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]
P [X = 0] = C08 p0 q 80 = 0, 0039
P [X = 1] = C18 p1 q 81 = 0, 0313
P [X = 2] = C28 p2 q 82 = 0, 1094
P [X = 3] = 0, 2187
P [X 3] = 0, 0039 + 0, 0313 + 0, 1094 + 0, 2187 = 0, 3633 ou 36, 33%
Probabilidade de sair no mnimo quatro caras
P [X 4] = P [X = 4] + P [X = 5] + P [X = 6] + P [X = 7] + P [X = 8]
ou
P [X 4] = 1 P [X < 4] = 1 (P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3])
= 1 0, 3633 = 0, 6367 ou 63, 67%
3.4.3.1

Parmetros Caractersticos da Distribuio Binomial

1. Mdia = np

2. Varincia 2 = npq

3. Desvio Padro =

npq

Utilizando o exemplo das moedas temos:


1. Mdia = np = 8 0, 5 = 4

Noes de Probabilidade

50

2. Varincia 2 = 8 0, 5 0, 5 = 2

3. Desvio Padro =

3.4.4

npq =

2 = 1, 41

Distribuio Hipergeomtrica

A distribuio hipergeomtrica intimamente relacionada distribuio binomial. Enquanto


a distribuio binomial o modelo aproximado de amostragem sem reposio de uma populao,
dicotmica finita, a distribuio hipergeomtrica o modelo de probabilidade para o nmero
de sucessos em uma amostra. As hipteses que levam distribuio hipergeomtrica so as
seguintes:
1. 1. A populao ou o conjunto de onde retirada a amostra consiste de N indivduos,
objetos ou elementos (populao finita).
2. Cada indivduo classificado como sucesso (p) ou fracassos (q) e h M sucessos na populao.
3. selecionada uma amostra sem reposio de n indivduos de forma que cada subconjunto
de tamanho n seja igualmente provvel de ser escolhido.
A distribuio hipergeomtrica tem a seguinte funo de probabilidade
(N k)

f (x) =

Cxk C(nx) ,
CnN

x = 0, 1, 2, 3, ....

em que:
x uma varivel aleatria discreta;
N quantidade de itens;
n tamanho da amostra;
k numero de sucessos;
Exemplo: Pequenos motores eltricos so expedidos em lotes de 50 unidades. Antes que
uma remessa seja aprovada, um inspetor escolhe 5 desses motores e os inspeciona. Se nenhum
dos motores inspecionados for defeituoso, o lote aprovado. Se um ou mais forem verificados
defeituosos, todos os motores da remessa so inspecionados. Suponha que existam, de fato,
trs motores defeituosos no lote. Qual a probabilidade de que a inspeo de todo o lote seja
necessria?
Se fizermos igual a X o numero de motores defeituosos encontrados, inspeo de todo o lote
seja necessria se X 1

Noes de Probabilidade

51

Neste caso temos k = 3 n = 5 N = 50;


(N k)

P [X = x] =

Cxk C(nx) ,

CnN
P [X 1] = 1 P [X < 1] = 1 P [X = 0])
(503)

C03 C(50) ,

C03 C547 ,
= 0, 7239
C550
C550
P [X 1] = 1 0, 7239 = 0, 2761

P [X = 0] = =

n
Quando se tem N
< 0, 1, pode-se utilizar a distribuio binomial para aproximar a distribuio hipergeomtrica.

3.4.4.1

Parmetros Caractersticos da Distribuio Hipergeomtrica

1. Considerando p =

k
e q =1p
N

2. Mdia = np
3. Varincia 2 = npq
3.4.5

N n
N 1

Distribuio Geomtrica

A distribuio geomtrica est tambm associada seqncia de uma prova de Bernoulli


excetuando-se que o nmero de provas no fixada, e, na verdade, a varivel aleatria de interesse
X definida como o nmero de provas necessrias para obter o primeiro sucesso.
Exemplos:
numero de vezes que uma pessoa estaciona num certo local proibido at apanhar uma
multa;
numero de tentativas at acertar no alvo (jogo de tiro ao alvo);
numero de lanamentos de uma moeda at sair cara;
A distribuio geomtrica tem a seguinte funo de probabilidade
f (x) = pq x x = 0, 1, 2, 3, ....
em que:
x uma varivel aleatria discreta;
p probabilidade de sucesso;
q probabilidade de fracasso.
Exemplo: Se 0, 05 a probabilidade de uma fbrica produzir uma pea defeituosa, qual
a probabilidade de pelo menos 2 peas boas sejam produzidas antes de se produzir a primeira
defeituosa.

Noes de Probabilidade

52

X o numero peas boas, ento pelo menos 2 peas boas X 2


Neste caso temos p = 0, 05 q = 0, 95;
P [X = x] = pq x
P [X 2] = 1 P [X < 2] = 1 (P [X = 0] + P [X = 1])
P [X = 0] = (0, 05)(0, 95)0 = 0, 05
P [X = 1] = (0, 05)(0, 95)1 = 0, 0475
P [X 2] = 1 (0, 05 + 0, 0475) = 1 0, 0975
3.4.5.1

Parmetros Caractersticos da Distribuio Geomtrica


q
1. Mdia =
p
2. Varincia 2 =

3.4.6

q
p2

Distribuio de Poisson

A distribuio de Poisson empregada em experimentos nos quais no se est interessado no


nmero de sucessos obtido em n tentativas, como ocorre no caso da distribuio binomial, mas
sim no nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um intervalo
de tempo, espao, comprimento, rea, ou volume. Alguns exemplos de variveis que podem ter
a distribuio de Poisson so:
1. nmero de defeitos por centmetro quadrado;
2. nmero de acidentes por dia;
3. nmero de clientes por hora;
4. nmero de chamadas telefnicas recebidas por minuto;
5. nmero de falhas de um computador num dia de operao;
6. nmero de relatrios de acidentes enviados a uma companhia de seguros numa semana.
A distribuio de Poisson tem a seguinte funo de probabilidade
f (x) = e

x
, x = 0, 1, 2, 3, ....
x!

em que:
x uma varivel aleatria discreta;
e base dos logaritmos neperianos (2,718...)
- mdia da distribuio (p)

Noes de Probabilidade

53

Exemplo: O nmero mdio de dias por ano que ocorrem chuvas acima de 50mm.h1 em uma
determinada regio 1,5. Qual a probabilidade de haver mais de dois dias com chuvas acima
dessa intensidade.
x
x!
1 P [X 2] = 1 (P [X = 0] + P [X = 1] + P [X = 2])
1, 50
= e1,5
= 0, 2231
0!
1, 51
= e1,5
= 0, 3347
1!
1, 52
= e1,5
= 0, 2510
2!
1 (0, 2231 + 0, 3347 + 2510) = 1 0, 8088 = 0, 1912 ou 19, 12%

P [X = x] = e
P [X > 2] =
P [X = 0] =
P [X = 1] =
P [X = 2] =
P [X > 2] =

A distribuio de Poisson tambm conhecida na prtica com lei dos eventos raros. Evento
raro pode ser considerado quando n 50 e p 0, 10.Nestes casos podemos utilizar a distribuio
de Poisson para probabilidades de situaes que seriam utilizadas uma distribuio binomial.
Exemplo: A probabilidade de que um indivduo apresente reao alrgica aps a aplicao
de um soro de 0,002. Esse mesmo soro foi aplicado a um grupo de 1800 pessoas, qual a
probabilidade de que duas pessoas apresentem reao alrgica? n=1800 p=0,002
= 1800 0, 002 = 3, 6 alrgicos
P [X = x] = e

x
x!

P [X = 2] = = e3,6

3.4.6.1

3, 62
0, 1770ou 17, 70%
2!

Parmetros Caractersticos da Distribuio de Poisson

1. Mdia =
No exemplo dos alrgicos = 3, 6
2. Varincia 2 =
No exemplo dos alrgicos 2 = 3, 6 s

3. Desvio Padro =

No exemplo da sementes = 3, 6 = 1, 9

Noes de Probabilidade
3.5

54

DISTRIBUIES CONTNUAS DE PROBABILIDADE

So distribuies de variveis aleatrias contnuas. Uma varivel aleatria contnua toma


um numero infinito no numervel de valores (intervalos de nmeros reais), os quais podem ser
associados com medidas numa escala contnua. Exemplos:
1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real.
Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar
qualquer numero real positivo.
2. Em um exame fsico para selecionar um jogador de futebol medido o peso de cada candidato; aqui tambm consideramos que o resultado pode ser qualquer nmero real positivo.
3. Em campanhas preventivas de hipertenso arterial comum de tempos em tempos medir-se
o nvel de colesterol. O valor de cada medida pode ser um nmero real no negativo.
4. Para pacientes que se apresentam num hospital a primeira atitude medir-se a temperatura;
o valor da temperatura um nmero real que se pode considerar compreendido entre 35o
e 42o C.
5. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete acendendoa; observa-se a mesma at que se queime. O tempo de durao da lmpada um numero
real no negativo.
As variveis continuas ficam completamente definidas por qualquer uma das seguintes funes
Funo densidade de probabilidade f (x) - definida para todo o x em que a varivel est
definida.
Funo Acumulada ou de distribuio F (x) - representa a probabilidade acumulada at x
F (x) = P (X x)
Calculo de probabilidades em variveis continuas
Z

P (X a) = F (a) =

f (x)dx

Z
P (a X b) = F (b) F (a) =

f (x)dx
a

P (X > a) = 1 F (a)
P (X = a) = 0, para todo o valor de a
3.5.1

Distribuio Uniforme

Se X uma V. A. C. assumindo qualquer valor num intervalo (a, b) pertencente a R, com a


mesma probabilidade, diz-se que X tem distribuio uniforme.

Noes de Probabilidade

55

A funo de densidade da distribuio uniforme dada por


(
f (x) =

1
ba

para x (a, b)
para x 6 (a, b)

em que:
a o menor valor assumido por x;
b o maior valor assumido por x;
A representao grfica de f (x) a seguinte:

A funo de distribuio dada por:

F (x) =

0
xa
ba

se x < a
se a x b
se x > b

rea de um retngulo
A = B.h

= (b a)

1
ba

A = 1
Outra forma de ver a rea:
Z
A =
=
=
=

1
dx
a ba
Z b
1
dx
ba a
b
1
x
ba a
1
(b a) = 1
ba

Realmente uma funo de densidade, pois a f (x) 0 e a rea igual a 1.

Noes de Probabilidade

56

Exemplo. Se uma VAC assume qualquer valor no intervalo (2, 3) com a mesma probabilidade, a distribuio uniforme tem a seguinte funo de densidade:
(
f (x) =

1
3(2)

1
5

para x (2, 3)
para x 6 (2, 3)

Qual a probabilidade de x estar entre 0 e 2?


1
2
P (0 x 2) = b.h = 2. = = 0, 4
5
5
P (0 x 2) = F (2) F (0)
2+2
4
F (2) =
=
5
5
0+2
2
F (0) =
=
5
5
4 2
2
P (0 x 2) =
= = 0, 4
5 5
5

3.5.1.1

Parmetros Caractersticos da Distribuio Uniforme

a+b
2
2 + 3
No exemplo =
= 0, 5
2

1. Mdia =

(b a)2
12
(3 (2))2
25
2
No exemplo =
=
= 2, 08
12
12

2. Varincia 2 =

ba
3. Desvio Padro =
12
3 (2)
5
No exemplo =
= = 1, 44
12
12
3.5.2

Distribuio Exponencial

A distribuio exponencial est ligada de Poisson; ela analisa inversamente o experimento:


um intervalo ou espao para ocorrncia de um evento.
Exemplos:
1. O tempo para carregar um caminho considerando que em mdia gasta-se 15 minutos para
realizar esta tarefa;
2. O tempo de espera em restaurantes, caixas de banco;
3. O tempo de vida de aparelhos eletrnicos.
A funo de densidade da distribuio exponencial dada por
f (x) = ex ,
em que:

x0

Noes de Probabilidade

57

taxa de falha no intervalo de tempo.


A representao grfica de f (x) a seguinte:

A funo de distribuio dada por:


F (x) = 1 ex ,

x0

Exemplo: Suponha que uma mquina falhe em mdia uma vez a cada dois anos. Calcule a
probabilidade da mquina falhar durante o prximo ano. Tempos = 12 = 0, 5, e X tempo para
falhar, temos P (X 1)
P (X 1) = F (1) = 1 e0,5 = 0, 3935
3.5.2.1

Parmetros Caractersticos da Distribuio Exponencial

1. Mdia =

2. Varincia 2 =

3.5.3

1
2

Distribuio Normal

A distribuio Normal corresponde a mais importante distribuio de variveis aleatrias


contnuas, em razo da sua enorme aplicao nos mais variados campos do conhecimento. Sua
funo de densidade de probabilidade dada por:
f (x) =



(x )2
exp
, < x <
2 2
2 2
1

em que os parmetros e 2 so respectivamente a mdia e a varincia da distribuio.


A distribuio normal apresenta a seguinte propriedades:
1. simtrica em relao a ;
2. O ponto mximo de f(x) ocorre em x = . Neste ponto as trs medidas de posio (mdia,
moda e mediana) se confundem;
3. A rea compreendida abaixo da curva normal e a acima do eixo x vale 1 ou 100%;

Noes de Probabilidade

58

A distribuio Normal com mdia = 0 e varincia 2 = 1 conhecida como distribuio


Normal reduzida ou padronizada. Uma varivel aleatria com essa distribuio geralmente
simbolizada pela letra Z.
O clculo de probabilidades de uma distribuio Normal feito pela integral definida no
intervalo da varivel objeto de estudo:
b



(x )2
exp
dx
2 2
2 2
1

Devido a dificuldade de resoluo dessa integral, procurou-se mtodos alternativos para obteno das probabilidades. Uma das formas mais utilizadas por meio de tabela de probabilidades
de uma distribuio Normal padro (Z).
Uma propriedade interessante de uma varivel aleatria X que segue qualquer distribuio
Normal a de que ela pode ser transformada em uma varivel normal padro Z, por meio da
expresso
x
z=

As reas referentes varivel Z so geralmente tabeladas do tipo


P (0 < Z < z)
Exemplo: A produo diria de uma fabricante de tintas uma varivel aleatria X com
distribuio normal com mdia = 10000gales e varincia 2 = 1000000gales2 . A direo
dessa fabrica quer criar um bnus de incentivo aos funcionrios, que ser pago se a produo
mdia diria exceder 11000gales. Qual a probabilidade da empresa pagar o bnus? Quero saber

P (X > 11000), primeiro vamos padronizar esta varivel, sendo = 2 = 1000000 = 1000
Primeiro vamos padronizar esta varivel
z=

x
11000 10000
=
= 1, 0

1000

Assim,
P (X > 11000) = (Z > 1, 0)

Noes de Probabilidade

59

Como a tabela me fornece apenas o valor de que est entre 0 e z, ento temos
P (X > 11000) = P (Z > 1, 0) = 0, 5 P (0 < Z < 1, 0) = 0, 5 0, 3413 = 0, 1587
Assim a probabilidade da empresa pagar o bonus de 0,1587.
Um membro da direo da fbrica diz que se a empresa tiver produo mdia diria entre
9000 e 9500 gales em um ms anterior, no tem como pagar o bnus mesmo que o funcionrios
tenha excedido os 11000gales. Nesse caso Qual a probabilidade no pagar o bnus.
Quero saber P (9000 < x < 9500), primeiro vamos padronizar esta varivel
z1 =

x1
9000 10000
x2
9500 10000
=
= 1 z2 =
=
= 0, 5

1000

1000

Ento
P (9000 < x < 9500) = P (1 < z < 0, 5)

Como na tabela tem apenas valores positivos e a distribuio normal simtrica temos que
P (1 < z < 0, 5) = P (0, 5 < z < 1, 0)

Utilizando a tabela temos que


P (0, 5 < z < 1, 0) = P (0 < z < 1, 0) P (0 < z < 0, 5) = 0, 3413 0, 1915 = 0, 1498
Assim, a probabilidade de P (9000 < x < 9500) = 0, 1498

Noes de Probabilidade

60

Qual a probabilidade da empresa produzir entre 9500 e 11000 gales por dia. Utilizando as
padronizaes j realizadas temos que
P (9000 < x < 11000) = P (0, 5 < z < 1, 0)

Assim,
P (0, 5 < z < 1, 0) = P (0 < z < 1, 0) + P (0 < z < 0, 5) = 0, 3413 + 0, 1915 = 0, 5328
3.5.3.1

Aproximao Normal das Distribuies Binomial e de Poisson

A distribuio normal pode ser utilizada como uma aproximao das distribuies Binomial e
de Poisson. Esta aproximao se torna cada vez melhor quando o tamanho da amostra n cresce.
Recomenda-se usar a aproximao normal, quando:
Distribuio Binomial - se np e nq 5
Distribuio Poisson - se np 5
No uso da aproximao normal deve-se lembrar que as distribuies Binomial e de Poisson
so de variveis aleatrias discretas (s existe probabilidade para valores inteiros). Nestes casos
recomenda-se utilizar a correo de continuidade x 0, 5 e x + 0, 5.
Exemplo: Sabe-se que o poder germinativo das sementes de uma certa variedade de milho
de 30%. Semeando 30 destas sementes, qual a probabilidade de germinar mais de cinco semente.
Temos n = 30 e p = 0, 30 e q = 0, 7
A mdia = np = 30 0, 30 = 9 e a varincia 2 = npq = 100 0, 30 0, 70 = 6, 3

Noes de Probabilidade

61

Queremos P (X > 5), utilizando a correo de continuidade P (X > 5, 5). Vamos padronizar
z=

x
5, 5 9
=
= 1, 39

6, 3

Assim,
P (X > 5, 5) = P (Z > 1, 39) = 0, 5 + P (0 < Z < 1, 39) = 0, 5 + 0, 4177 = 0, 9177

Exemplo: Numa lmina verificou-se que existiam em mdia 27,6 bactrias/cm2. Qual a
probabilidade de se encontrar mais de 35 bactrias por centmetro quadrado?
Temos = 27, 6
Queremos P (X > 35), utilizando a correo de continuidade P (X > 35, 5). Vamos padronizar
35, 5 27, 6
x

=
= 1, 50
z=

27, 6
Assim,
P (X > 35, 5) = P (Z > 1, 50) = 0, 5 P (0 < Z < 1, 50) = 0, 5 0, 4332 = 0, 0668

Noes de Probabilidade

62

Tabela 3.2: Distribuio Normal - probabilidade do valor de z padronizado estar entre 0 e o valor
tabulado nas margens
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9

0,00
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000

0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,4991
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000

0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,4991
0,4994
0,4995
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,03
0,0120
0,0517
0,0910
0,1293
0,1664
0,2019
0,2357
0,2673
0,2967
0,3238
0,3485
0,3708
0,3907
0,4082
0,4236
0,4370
0,4484
0,4582
0,4664
0,4732
0,4788
0,4834
0,4871
0,4901
0,4925
0,4943
0,4957
0,4968
0,4977
0,4983
0,4988
0,4991
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,04
0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2704
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495
0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,05
0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505
0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,06
0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,07
0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,4992
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,08
0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,4993
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,09
0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,4999
0,5000

Noes de Probabilidade
3.6

63

DISTRIBUIES AMOSTRAIS

Ao retirarmos uma amostra aleatria de uma populao e calcularmos a partir desta amostra
qualquer quantidade, encontramos a estatstica, ou seja, chamaremos os valores calculados em
funo dos elementos da amostra de estatsticas.
3.6.1

Distribuio Amostral da Mdia (X)

Se considerarmos o processo de seleo de uma amostra aleatria simples como um experimento, a mdia da amostra X a descrio numrica do resultado do experimento. Assim, a
mdia da amostra X uma varivel aleatria. Como resultado, tal como outras variveis aleatrias, X tem uma mdia ou um valor esperado, uma varincia e uma distribuio de probabilidade.
Como os valores possveis de X so os resultados de diferentes amostras aleatrias simples, a
distribuio da probabilidade de X chamada de distribuio amostral. Pode-se assim dizer que
a mdia aleatria X o valor esperado de , isto , E(X) = , em que a mdia da populao.
2 a varincia da distribuio de amostragem de X; por propriedade da varincia est
Seja X
2
2 =
sera X
n
3.6.1.1

Teorema do Limite Central (TLC)

Ao selecionar amostras aleatrias simples de tamanho n a partir de uma populao com


parmetros (, 2 ) a distribuio amostral da mdia das amostras X pode ser aproximada pela
distribuio normal de probabilidade medida que o tamanho de amostra se torna maior.Assim:
Se a populao tem distribuio normal, ento a mdia amostral ter uma distribuio
aproximadamente normal, independentemente da forma da distribuio de frequncias da
populao de onde foi retirada a amostra;
Se o tamanho n da amostra for suficientemente grande maior ou igual a 30 elementos),
ento a mdia de uma amostra aleatria retirada de uma populao ter uma distribuio
aproximadamente normal, independentemente da forma da distribuio de frequncias da
populao de onde foi retirada a amostra.
Portanto, a distribuio da mdia amostral aproximadamente normal e seus valores de
2
2 =
mdia e desvios padro esto relacionados com mdia X = e varincia X
n

Noes de Probabilidade

64

Como a distribuio da mdia amostral uma distribuio normal, podemos transforma-la


em uma varivel normal padro Z, por meio da expresso
z=

Exemplo: Uma industria eltrica fabrica lmpadas que tm vida til distribuda com mdia
de 800horas e varincia igual 1600(horas)2 . Qual a probabilidade de uma amostra aleatria de
tamanho n = 64 ter vida til superio a 806, 65horas
2 = 1600 ,
Temos que = 800 e 2 = 1600 e = 40, ento X = 800 e X
64
Queremos P (X > 10, 0), primeiro vamos padronizar
z=

806, 65 800
40
64

6, 65
40
8

= 1, 33

Ento:
P (X > 806, 65) = P (z > 1, 33) = 0, 5 P (0 < z < 1, 33) = 0, 5 0, 4082 = 0, 0918

3.6.1.2

Distribuio t de student

A distribuio t de Student aparece naturalmente no problema de se determinar a mdia de


uma populao (que segue a distribuio normal) a partir de uma amostra. Neste problema, no
se sabe qual a mdia ou o desvio padro da populao, mas ela deve ser normal.
A varivel aleatria T dada por:
X

t=
S/ n
segue uma distribuio t de Student com = n 1 graus de liberdade, e a funo de densidade
dada por

( +1
)
2
( +1
)
t2
2
f (t) =
1
+
,

( 2 )
Grau de liberdade pode ser entendido como nmero de termos independentes (dimenso da
amostra) a serem avaliados na populao.
Algumas caractersticas da distribuio t de student:

Noes de Probabilidade

65

simtrica em relao a zero;


Todas curvas tem mximo em t = 0;
Existe uma curva para cada tamanho de amostra (n) e o valor = n 1 (nmero de graus
de liberdade) usado para obteno de valores na tabela;
A medida que n cresce a distribuio t se aproxima da normal padro z;

Valores de probabilidade de t so obtidos em tabelas. A tabela de t informa o valor acima


do qual se encontra a area

Exemplo: Seja uma amostra n = 15. Qual o valor de t acima do qual tem-se 5% de
probabilidade. = 0, 05, = 15 1 = 14, pela tabela temos que t=1,761

Exemplo: Qual o valor de t acima do qual tem-se 90% de probabilidade = 0, 90; =


15 1 = 14, pela simetria da distribuio o valor que deixa 10% da rea sua esquerda com o
sinal negativo.
= 0, 10; = 15 1 = 14, ento t = 1, 345, pela simetria = 0, 90; = 15 1 = 14,
t = 1, 345

Noes de Probabilidade

3.6.2

66

Distribuio amostral para proporo

Considere que uma populao a proporo de elementos que portadores de certa caracterstica
p . Definindo uma varivel aleatria, da seguinte maneira
(
X=

1 se o indivduo for portador da caractristica


0 se o indivduo nofor portador da caractristica

Logo E(X) = p e V ar(X) = 2 .


Pn
Como os resultados individuais so 0 (fracasso) ou 1 (sucesso), temos que Y =
i=1 xi
o total de indivduos de resultados em n ensaios, que correspondem aos sucessos (indivduo
for portador da caracterstica), porque aos resultados que correspondem aos fracassos, esto
associados o valor zero.
Assim, Y tem distribuio binomial com parmetros n (tamanho da amostra) e p (proporo
de indivduos portadores da caracterstica), em que:
n
X

Y
p =
=
n

xi

i=1

ou seja,p igual mdia da varivel aleatria X


Como Y tem distribuio binomial b(n, p), com mdia = np e varincia 2 = npq. Consequentemente,

Y
=
n
 
Y
V ar[p] = E
=
n


E[p] = E

1
1
E[Y ] = np = p
n
n
1
1
pq
E[Y ] = 2 npq =
2
n
n
n

Assim, pelo Teorema Limite Central, quando n grande (n > 30), a proporo amostral p de
sucessos em n ensaios de Bernoulli tem distribuio aproximadamente normal com mdia = p
e varincia 2 = pq
n , e assim podemos utilizar a padronizao:
z=

p
p p
= q
pq

exemplo:

Noes de Probabilidade
3.6.3
3.6.3.1

67

Distribuio Amostral da Varincia


Distribuio Qui-Quadrado

H casos em que se est mais interessado na varincia do que na mdia da amostra. Por
exemplo, em filas de espera. Mesmo conhecendo-se o tempo mdio de espera, a informao do
grau de variabilidade deste tempo importante. A distribuio usada neste caso conhecida
como Distribuio Qui-Quadrado, definida como:
2 =

(n 1)S 2
2

e a funo de densidade dada por


f (x) =

1
2/2 (/2)

x/21 ex/2 I{x0} ,

Da mesma forma que a distribuio t, existe uma curva para distribuio Qui-quadrado para
cada tamanho de amostra (n) e o valor = n 1 (nmero de graus de liberdade) usado para
obteno de valores na tabela.

A tabela de 2 fornece o valor acima do qual encontra-se a rea

Exemplo: Uma amostra com n = 15. Qual o valor que deixa sua direita 5% da rea?
= 0, 05, = 15 1 = 14, pela tabela temos que t=1,761
3.6.3.2

Distribuio F

A distribuio F est entre aquela distribuies de probabilidade mais importantes na estatstica, tem maior destaque na rea de experimentao agrcola. Essa distribuio definida pela

Noes de Probabilidade

68

varivel resultante da razo duas varincias:


F =

S12 12
S22 22

e a funo de densidade dada por

f (x) =

1
2

1 +2
2

  1  21

2
2



1+

1
1
2

1 x
2

 1 +2
2

Para se obter valores tabelados da distribuio F, necessrio observar dois graus de liberadade 1 = n1 1 e 2 = n2 1, o primeiro associado varincia amostral do numerador, e o
segundo associado varincia amostral do denominador.
A tabela de F informa o valor acima do qual se encontra a area e existe uma tabela para
cada valor e diferentes combinaes de 1 e 2 .

Exemplo: Para duas amostras de F

Noes de Probabilidade

69

Tabela 3.3: Distribuio t de student - valores para P (t > tc ) = , considerando =


0, 250; 0, 200; 0, 150; 0, 100; 0, 050; 0, 025; 0, 010; 0, 005; 0, 001.
GL
=n1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
80
100
120
240
480
700
1000

0,250
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,681
0,679
0,679
0,678
0,677
0,677
0,676
0,675
0,675
0,675

0,200
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,851
0,849
0,848
0,846
0,845
0,845
0,843
0,842
0,842
0,842

0,150
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,050
1,047
1,045
1,043
1,042
1,041
1,039
1,038
1,037
1,037

0,100
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,299
1,296
1,292
1,290
1,289
1,285
1,283
1,283
1,282

0,050
0,025
6,314 12,706
2,920
4,303
2,353
3,182
2,132
2,776
2,015
2,571
1,943
2,447
1,895
2,365
1,860
2,306
1,833
2,262
1,812
2,228
1,796
2,201
1,782
2,179
1,771
2,160
1,761
2,145
1,753
2,131
1,746
2,120
1,740
2,110
1,734
2,101
1,729
2,093
1,725
2,086
1,721
2,080
1,717
2,074
1,714
2,069
1,711
2,064
1,708
2,060
1,706
2,056
1,703
2,052
1,701
2,048
1,699
2,045
1,697
2,042
1,684
2,021
1,676
2,009
1,671
2,000
1,664
1,990
1,660
1,984
1,658
1,980
1,651
1,970
1,648
1,965
1,647
1,963
1,646
1,962

0,010
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,403
2,390
2,374
2,364
2,358
2,342
2,334
2,332
2,330

0,005
63,656
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,678
2,660
2,639
2,626
2,617
2,596
2,586
2,583
2,581

0,001
318,289
22,328
10,214
7,173
5,894
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,307
3,261
3,232
3,195
3,174
3,160
3,125
3,107
3,102
3,098

Noes de Probabilidade

70

Tabela 3.4: Disitruio Qui-quadrado - Valores de 2 para P (2 > 2c com =


0, 995; 0, 9900, 975; 0, 950; 0, 900; 0, 750; 0, 500; 0, 250; 0, 100; 0, 050; 0, 025; 0, 010; 0, 005.
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100

0,995
3,93E-05
0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461
13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328

0,990
1,57E-04
0,020
0,115
0,297
0,554
0,872
1,239
1,647
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,878
13,565
14,256
14,953
22,164
29,707
37,485
45,442
53,540
61,754
70,065

0,975
0,001
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791
24,433
32,357
40,482
48,758
57,153
65,647
74,222

0,950
0,004
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188
51,739
60,391
69,126
77,929

0,900
0,016
0,211
0,584
1,064
1,610
2,204
2,833
3,490
4,168
4,865
5,578
6,304
7,041
7,790
8,547
9,312
10,085
10,865
11,651
12,443
13,240
14,041
14,848
15,659
16,473
17,292
18,114
18,939
19,768
20,599
29,051
37,689
46,459
55,329
64,278
73,291
82,358

0,750
0,102
0,575
1,213
1,923
2,675
3,455
4,255
5,071
5,899
6,737
7,584
8,438
9,299
10,165
11,037
11,912
12,792
13,675
14,562
15,452
16,344
17,240
18,137
19,037
19,939
20,843
21,749
22,657
23,567
24,478
33,660
42,942
52,294
61,698
71,145
80,625
90,133

0,500
0,455
1,386
2,366
3,357
4,351
5,348
6,346
7,344
8,343
9,342
10,341
11,340
12,340
13,339
14,339
15,338
16,338
17,338
18,338
19,337
20,337
21,337
22,337
23,337
24,337
25,336
26,336
27,336
28,336
29,336
39,335
49,335
59,335
69,334
79,334
89,334
99,334

0,250
1,323
2,773
4,108
5,385
6,626
7,841
9,037
10,219
11,389
12,549
13,701
14,845
15,984
17,117
18,245
19,369
20,489
21,605
22,718
23,828
24,935
26,039
27,141
28,241
29,339
30,435
31,528
32,620
33,711
34,800
45,616
56,334
66,981
77,577
88,130
98,650
109,141

0,100
2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256
51,805
63,167
74,397
85,527
96,578
107,565
118,498

0,050
3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773
55,758
67,505
79,082
90,531
101,879
113,145
124,342

0,025
5,024
7,378
9,348
11,143
12,832
14,449
16,013
17,535
19,023
20,483
21,920
23,337
24,736
26,119
27,488
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,195
44,461
45,722
46,979
59,342
71,420
83,298
95,023
106,629
118,136
129,561

0,010
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
63,691
76,154
88,379
100,425
112,329
124,116
135,807

0,005
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,300
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,558
46,928
48,290
49,645
50,994
52,335
53,672
66,766
79,490
91,952
104,215
116,321
128,299
140,170

Noes de Probabilidade

71

Tabela 3.5: Limites unilaterais de F ao nvel de 10% de probabilidade com os graus de liberdade
1 e 2
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240

1
39,863
8,526
5,538
4,545
4,060
3,776
3,589
3,458
3,360
3,285
3,225
3,177
3,136
3,102
3,073
2,975
2,881
2,835
2,809
2,791
2,748
2,727

2
49,500
9,000
5,462
4,325
3,780
3,463
3,257
3,113
3,006
2,924
2,860
2,807
2,763
2,726
2,695
2,589
2,489
2,440
2,412
2,393
2,347
2,325

3
53,593
9,162
5,391
4,191
3,619
3,289
3,074
2,924
2,813
2,728
2,660
2,606
2,560
2,522
2,490
2,380
2,276
2,226
2,197
2,177
2,130
2,107

4
55,833
9,243
5,343
4,107
3,520
3,181
2,961
2,806
2,693
2,605
2,536
2,480
2,434
2,395
2,361
2,249
2,142
2,091
2,061
2,041
1,992
1,968

5
57,240
9,293
5,309
4,051
3,453
3,108
2,883
2,726
2,611
2,522
2,451
2,394
2,347
2,307
2,273
2,158
2,049
1,997
1,966
1,946
1,896
1,871

12
60,705
9,408
5,216
3,896
3,268
2,905
2,668
2,502
2,379
2,284
2,209
2,147
2,097
2,054
2,017
1,892
1,773
1,715
1,680
1,657
1,601
1,573

13
60,903
9,415
5,210
3,886
3,257
2,892
2,654
2,488
2,364
2,269
2,193
2,131
2,080
2,037
2,000
1,875
1,754
1,695
1,660
1,637
1,580
1,552

14
61,073
9,420
5,205
3,878
3,247
2,881
2,643
2,475
2,351
2,255
2,179
2,117
2,066
2,022
1,985
1,859
1,737
1,678
1,643
1,619
1,562
1,533

15
61,220
9,425
5,200
3,870
3,238
2,871
2,632
2,464
2,340
2,244
2,167
2,105
2,053
2,010
1,972
1,845
1,722
1,662
1,627
1,603
1,545
1,516

20
61,740
9,441
5,184
3,844
3,207
2,836
2,595
2,425
2,298
2,201
2,123
2,060
2,007
1,962
1,924
1,794
1,667
1,605
1,568
1,543
1,482
1,451

1
6
58,204
9,326
5,285
4,010
3,405
3,055
2,827
2,668
2,551
2,461
2,389
2,331
2,283
2,243
2,208
2,091
1,980
1,927
1,895
1,875
1,824
1,799
1
30
62,265
9,458
5,168
3,817
3,174
2,800
2,555
2,383
2,255
2,155
2,076
2,011
1,958
1,912
1,873
1,738
1,606
1,541
1,502
1,476
1,409
1,376

7
58,906
9,349
5,266
3,979
3,368
3,014
2,785
2,624
2,505
2,414
2,342
2,283
2,234
2,193
2,158
2,040
1,927
1,873
1,840
1,819
1,767
1,742

8
59,439
9,367
5,252
3,955
3,339
2,983
2,752
2,589
2,469
2,377
2,304
2,245
2,195
2,154
2,119
1,999
1,884
1,829
1,796
1,775
1,722
1,696

9
59,858
9,381
5,240
3,936
3,316
2,958
2,725
2,561
2,440
2,347
2,274
2,214
2,164
2,122
2,086
1,965
1,849
1,793
1,760
1,738
1,684
1,658

10
60,195
9,392
5,230
3,920
3,297
2,937
2,703
2,538
2,416
2,323
2,248
2,188
2,138
2,095
2,059
1,937
1,819
1,763
1,729
1,707
1,652
1,625

11
60,473
9,401
5,222
3,907
3,282
2,920
2,684
2,519
2,396
2,302
2,227
2,166
2,116
2,073
2,037
1,913
1,794
1,737
1,703
1,680
1,625
1,598

40
62,529
9,466
5,160
3,804
3,157
2,781
2,535
2,361
2,232
2,132
2,052
1,986
1,931
1,885
1,845
1,708
1,573
1,506
1,465
1,437
1,368
1,332

50
62,688
9,471
5,155
3,795
3,147
2,770
2,523
2,348
2,218
2,117
2,036
1,970
1,915
1,869
1,828
1,690
1,552
1,483
1,441
1,413
1,340
1,302

60
62,794
9,475
5,151
3,790
3,140
2,762
2,514
2,339
2,208
2,107
2,026
1,960
1,904
1,857
1,817
1,677
1,538
1,467
1,424
1,395
1,320
1,281

120
63,061
9,483
5,143
3,775
3,123
2,742
2,493
2,316
2,184
2,082
2,000
1,932
1,876
1,828
1,787
1,643
1,499
1,425
1,379
1,348
1,265
1,219

240
63,194
9,487
5,138
3,768
3,114
2,732
2,482
2,304
2,172
2,069
1,986
1,918
1,861
1,813
1,771
1,626
1,478
1,402
1,354
1,321
1,232
1,180

Noes de Probabilidade

72

Tabela 3.6: Limites unilaterais de F ao nvel de 5% de probabilidade com os graus de liberdade


1 e 2
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240

1
161,448
18,513
10,128
7,709
6,608
5,987
5,591
5,318
5,117
4,965
4,844
4,747
4,667
4,600
4,543
4,351
4,171
4,085
4,034
4,001
3,920
3,880

2
199,500
19,000
9,552
6,944
5,786
5,143
4,737
4,459
4,256
4,103
3,982
3,885
3,806
3,739
3,682
3,493
3,316
3,232
3,183
3,150
3,072
3,033

3
215,707
19,164
9,277
6,591
5,409
4,757
4,347
4,066
3,863
3,708
3,587
3,490
3,411
3,344
3,287
3,098
2,922
2,839
2,790
2,758
2,680
2,642

4
224,583
19,247
9,117
6,388
5,192
4,534
4,120
3,838
3,633
3,478
3,357
3,259
3,179
3,112
3,056
2,866
2,690
2,606
2,557
2,525
2,447
2,409

5
230,162
19,296
9,013
6,256
5,050
4,387
3,972
3,687
3,482
3,326
3,204
3,106
3,025
2,958
2,901
2,711
2,534
2,449
2,400
2,368
2,290
2,252

12
243,906
19,413
8,745
5,912
4,678
4,000
3,575
3,284
3,073
2,913
2,788
2,687
2,604
2,534
2,475
2,278
2,092
2,003
1,952
1,917
1,834
1,793

13
244,690
19,419
8,729
5,891
4,655
3,976
3,550
3,259
3,048
2,887
2,761
2,660
2,577
2,507
2,448
2,250
2,063
1,974
1,921
1,887
1,803
1,761

14
245,364
19,424
8,715
5,873
4,636
3,956
3,529
3,237
3,025
2,865
2,739
2,637
2,554
2,484
2,424
2,225
2,037
1,948
1,895
1,860
1,775
1,733

15
245,950
19,429
8,703
5,858
4,619
3,938
3,511
3,218
3,006
2,845
2,719
2,617
2,533
2,463
2,403
2,203
2,015
1,924
1,871
1,836
1,750
1,708

20
248,013
19,446
8,660
5,803
4,558
3,874
3,445
3,150
2,936
2,774
2,646
2,544
2,459
2,388
2,328
2,124
1,932
1,839
1,784
1,748
1,659
1,614

1
6
233,986
19,330
8,941
6,163
4,950
4,284
3,866
3,581
3,374
3,217
3,095
2,996
2,915
2,848
2,790
2,599
2,421
2,336
2,286
2,254
2,175
2,136
1
30
250,095
19,462
8,617
5,746
4,496
3,808
3,376
3,079
2,864
2,700
2,570
2,466
2,380
2,308
2,247
2,039
1,841
1,744
1,687
1,649
1,554
1,507

7
236,768
19,353
8,887
6,094
4,876
4,207
3,787
3,500
3,293
3,135
3,012
2,913
2,832
2,764
2,707
2,514
2,334
2,249
2,199
2,167
2,087
2,048

8
238,883
19,371
8,845
6,041
4,818
4,147
3,726
3,438
3,230
3,072
2,948
2,849
2,767
2,699
2,641
2,447
2,266
2,180
2,130
2,097
2,016
1,977

9
240,543
19,385
8,812
5,999
4,772
4,099
3,677
3,388
3,179
3,020
2,896
2,796
2,714
2,646
2,588
2,393
2,211
2,124
2,073
2,040
1,959
1,919

10
241,882
19,396
8,786
5,964
4,735
4,060
3,637
3,347
3,137
2,978
2,854
2,753
2,671
2,602
2,544
2,348
2,165
2,077
2,026
1,993
1,910
1,870

11
242,983
19,405
8,763
5,936
4,704
4,027
3,603
3,313
3,102
2,943
2,818
2,717
2,635
2,565
2,507
2,310
2,126
2,038
1,986
1,952
1,869
1,829

40
251,143
19,471
8,594
5,717
4,464
3,774
3,340
3,043
2,826
2,661
2,531
2,426
2,339
2,266
2,204
1,994
1,792
1,693
1,634
1,594
1,495
1,445

50
251,774
19,476
8,581
5,699
4,444
3,754
3,319
3,020
2,803
2,637
2,507
2,401
2,314
2,241
2,178
1,966
1,761
1,660
1,599
1,559
1,457
1,404

60
252,196
19,479
8,572
5,688
4,431
3,740
3,304
3,005
2,787
2,621
2,490
2,384
2,297
2,223
2,160
1,946
1,740
1,637
1,576
1,534
1,429
1,375

120
253,253
19,487
8,549
5,658
4,398
3,705
3,267
2,967
2,748
2,580
2,448
2,341
2,252
2,178
2,114
1,896
1,683
1,577
1,511
1,467
1,352
1,290

240
253,783
19,492
8,538
5,643
4,382
3,687
3,249
2,947
2,727
2,559
2,426
2,319
2,230
2,155
2,090
1,870
1,654
1,544
1,476
1,430
1,307
1,237

Noes de Probabilidade

73

Tabela 3.7: Limites unilaterais de F ao nvel de 2,5% de probabilidade com os graus de liberdade
1 e 2
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
40
50
60
120
240

1
647,789
38,506
17,443
12,218
10,007
8,813
8,073
7,571
7,209
6,937
6,724
6,554
6,414
6,298
6,200
5,871
5,568
5,424
5,340
5,286
5,152
5,088

2
799,500
39,000
16,044
10,649
8,434
7,260
6,542
6,059
5,715
5,456
5,256
5,096
4,965
4,857
4,765
4,461
4,182
4,051
3,975
3,925
3,805
3,746

3
864,163
39,165
15,439
9,979
7,764
6,599
5,890
5,416
5,078
4,826
4,630
4,474
4,347
4,242
4,153
3,859
3,589
3,463
3,390
3,343
3,227
3,171

4
899,583
39,248
15,101
9,605
7,388
6,227
5,523
5,053
4,718
4,468
4,275
4,121
3,996
3,892
3,804
3,515
3,250
3,126
3,054
3,008
2,894
2,839

5
921,848
39,298
14,885
9,364
7,146
5,988
5,285
4,817
4,484
4,236
4,044
3,891
3,767
3,663
3,576
3,289
3,026
2,904
2,833
2,786
2,674
2,620

12
976,708
39,415
14,337
8,751
6,525
5,366
4,666
4,200
3,868
3,621
3,430
3,277
3,153
3,050
2,963
2,676
2,412
2,288
2,216
2,169
2,055
1,999

13
979,837
39,421
14,304
8,715
6,488
5,329
4,628
4,162
3,831
3,583
3,392
3,239
3,115
3,012
2,925
2,637
2,372
2,248
2,176
2,129
2,014
1,958

14
982,528
39,427
14,277
8,684
6,456
5,297
4,596
4,130
3,798
3,550
3,359
3,206
3,082
2,979
2,891
2,603
2,338
2,213
2,140
2,093
1,977
1,921

15
984,867
39,431
14,253
8,657
6,428
5,269
4,568
4,101
3,769
3,522
3,330
3,177
3,053
2,949
2,862
2,573
2,307
2,182
2,109
2,061
1,945
1,888

20
993,103
39,448
14,167
8,560
6,329
5,168
4,467
3,999
3,667
3,419
3,226
3,073
2,948
2,844
2,756
2,464
2,195
2,068
1,993
1,944
1,825
1,766

1
6
7
8
9
10
11
937,111 948,217 956,656 963,285 968,627 973,025
39,331
39,355
39,373
39,387
39,398
39,407
14,735
14,624
14,540
14,473
14,419
14,374
9,197
9,074
8,980
8,905
8,844
8,794
6,978
6,853
6,757
6,681
6,619
6,568
5,820
5,695
5,600
5,523
5,461
5,410
5,119
4,995
4,899
4,823
4,761
4,709
4,652
4,529
4,433
4,357
4,295
4,243
4,320
4,197
4,102
4,026
3,964
3,912
4,072
3,950
3,855
3,779
3,717
3,665
3,881
3,759
3,664
3,588
3,526
3,474
3,728
3,607
3,512
3,436
3,374
3,321
3,604
3,483
3,388
3,312
3,250
3,197
3,501
3,380
3,285
3,209
3,147
3,095
3,415
3,293
3,199
3,123
3,060
3,008
3,128
3,007
2,913
2,837
2,774
2,721
2,867
2,746
2,651
2,575
2,511
2,458
2,744
2,624
2,529
2,452
2,388
2,334
2,674
2,553
2,458
2,381
2,317
2,263
2,627
2,507
2,412
2,334
2,270
2,216
2,515
2,395
2,299
2,222
2,157
2,102
2,461
2,341
2,245
2,167
2,102
2,047
1
30
40
50
60
120
24
1001,414 1005,598 1008,117 1009,800 1014,020 1016,
39,465
39,473
39,478
39,481
39,490
39,4
14,081
14,037
14,010
13,992
13,947
13,9
8,461
8,411
8,381
8,360
8,309
8,28
6,227
6,175
6,144
6,123
6,069
6,04
5,065
5,012
4,980
4,959
4,904
4,87
4,362
4,309
4,276
4,254
4,199
4,17
3,894
3,840
3,807
3,784
3,728
3,69
3,560
3,505
3,472
3,449
3,392
3,36
3,311
3,255
3,221
3,198
3,140
3,11
3,118
3,061
3,027
3,004
2,944
2,91
2,963
2,906
2,871
2,848
2,787
2,75
2,837
2,780
2,744
2,720
2,659
2,62
2,732
2,674
2,638
2,614
2,552
2,52
2,644
2,585
2,549
2,524
2,461
2,42
2,349
2,287
2,249
2,223
2,156
2,12
2,074
2,009
1,968
1,940
1,866
1,82
1,943
1,875
1,832
1,803
1,724
1,68
1,866
1,796
1,752
1,721
1,639
1,59
1,815
1,744
1,699
1,667
1,581
1,53
1,690
1,614
1,565
1,530
1,433
1,37
1,628
1,549
1,497
1,460
1,354
1,28

INFERNCIA ESTATSTICA

Vrios tipos de estudos tem o objetivo de obter concluses (fazer inferncias) a respeito de

parmetros de uma populao. A impossibilidade de avaliar toda a populao faz com que a
partir de amostras possamos obter estimativas daqueles parmetros. A generalizao da amostra para a populao feita com o auxlio de um modelo estatstico para a situao em estudo,
estas generalizaes esto sempre associadas um grau de incerteza e, consequentemente, uma
probabilidade de erro. A teoria da estimao preocupa-se com a obteno do respectivo de um
estimador para um determinado parmetro, com intuito de descrever o seu comportamento com
o menor erro possvel.
Parmetro: uma constante (um nmero) que caracteriza uma populao. Exemplo: mdia
populacional , varincia populacional 2 , etc. Em geral, os parmetros so desconhecidos.
Estimador: uma expresso algbrica utilizada para obter um valor aproximado de um
parmetro. Exemplo:
n
X
xi
X=

i=1

.
Estimativa: o valor numrico de um estimador. determinada usando os dados amostrais.
Exemplo: Mediante uma pesquisa queremos conhecer o tamanho mdio dos estudantes universitrios do Brasil.
Populao: Todas os estudantes universitrios do Brasil;
Amostra: por exemplo, 500 estudantes;
Parmetro: Mdia das alturas .
Estimador:

n
X

X=

xi

i=1

.
Estimativa: X = 1, 7m (valor aproximado para ) .

Inferncia Estatstica
4.1

75

ESTIMAO

um processo de induo, na qual usamos dados extrados de uma amostra para produzir
inferncia sobre a populao. Esta inferncia s ser vlida se a amostra for significativa.
Tipos de Estimaes de Parmetros
1. Estimao Pontual;
2. Estimao Intervalar
4.1.1

Estimao Pontual

usada quando a partir da amostra procura-se obter um nico valor de certo parmetro
populacional, ou seja, obter estimativas a partir dos valores amostrais.
A estimativas so os valores amostrais obtidos para a mdia, varincia, proporo, etc. Os
valores de X, S 2 , S estimam, respectivamente , 2 e .
4.1.2

Estimao Intervalar

Uma outra maneira de se calcular um estimativa de um parmetro desconhecido, construir


um intervalo de confiana [a, b] para esse parmetro com uma probabilidade de 1 (nvel
de confiana) de que o intervalo contenha o verdadeiro parmetro, usando as distribuies de
amostragem podemos obter expresses do tipo:
P (a b) = 1
Dessa maneira ser o nvel de significncia, isto , o erro que se estar cometendo ao afirmar
que o parmetro est entre o limite inferior e o superior calculado.
4.1.2.1

Intervalo de Confiana para proporo p

Consideremos uma populao cujos elementos podem ser classificados em dois tipos: Sucesso
e Insucesso. Pretende-se estimar a proporo p de sucessos na populao.
Dada uma amostra de tamanho n, uma estimativa pontual de p da proporo de sucessos
dada por
x
p =
n
.
Pelo teorema do limite cental, quando n for suficientemente grande p tem distribuio aproximadamente normal, com mdia p = p e varincia a p2 = pq
n , em que:
p p
z= q
pq
n

Inferncia Estatstica

76

Fixando uma probabilidade de confiana (1) , o intervalo de confiana para uma proporo
pode ser obtido da seguinte forma:
r
P

p z 2

pq
p p + z 2
n

pq
n

!
=1

pq
a margem de erro da proporo e z 2 o valor da curva normal padro acima
n
do qual encontramos uma rea de 2 .
Exemplo: Uma empresa de pesquisa de mercado faz contato com 30 pessoas para saber a
satisfao a uma determinada marca de refrigerante, 12 delas respondem que gosta da referida
marca. Obtenha o intervalo de confiana de 95% para proporo de pessoas que gostam da
marca.
Nesse caso o sucesso o gosto pela marca de refrigerante
onde:z

p =

12
x
=
= 0, 40
n
30

Como p = 0, 40, temos que q = 1 p = 1 0, 40 = 0, 60


Como queremos o intervalo de confiana a 95%, temos que:
1 = 0, 95 = 1 0, 95 = 0, 05

0, 05

=
= 0, 025
2
2

Assim, temos que o valor tabelado de z 2 = 1, 96


r !
pq
pq
p z 2
p p + z 2
= 0, 95
n
n
!
r
r
0, 40 0, 60
0, 40 0, 60
0, 40 1, 96
p 0, 40 + 1, 96
= 0, 95
30
30
r

P
P

P (0, 40 0, 08 p 0, 40 + 0, 80) = 0, 95
P (0, 32 p 0, 48) = 0, 95
Assim,
IC95% () = [0, 32; 0, 48]
4.1.2.2

Intervalo de Confiana para mdia com varincia 2 conhecida

Como j vimos anteriormente, X (mdia amostral) tem distribuio normal de mdia e


2
varincia n , assim um intervalo de (1 ) de confiana para ser dado por:



P X Z 2 X + Z 2
=1
n
n
Exemplo: Um pesquisador obteve a partir de uma amostra uma mdia X = 180cm para altura
de uma determinado grupo de pessoas utilizando uma amostra n=40, sabe-se que a varincia

Inferncia Estatstica

77

populacional da altura de 2 = 100cm2 . Qual o intervalo de confiana a 90% e 95% para a


mdia populacional.
Primeiramente temos que obter o valor tabelado de Z, como queremos o intervalo de confiana
a 90%, temos que:
1 = 0, 90 = 1 0, 90 = 0, 10

0, 10

=
= 0, 05
2
2

Assim, temos que procurar na tabela qual o valor de Z que deixa 0, 05 de probabilidade acima
dele.

Olhando na tabela o valor em que P (0 < Z < z) = 0, 45, temos que z = 1, 65, logo o valor
Z 2 = 1, 65

P
P

X Z 2 X + Z 2
=1
n
n
!

200
200
180 1, 65
180 + 1, 65
= 0, 90
40
40

P (176, 31 183, 69) = 0, 90


ou seja, o intervalo de confiana a 90% para a mdia
IC90% () = [176, 31; 183, 69]
Fazendo o mesmo processo temos que a95%:
1 = 0, 95 = 1 0, 95 = 0, 05

0, 05

=
= 0, 025
2
2

Ento Z0,025 = 1, 96, assim



P
P

X Z 2 X + Z 2
=1
n
n
!

200
200
180 1, 96
180 + 1, 96
= 0, 95
40
40

P (178, 61 187, 38) = 0, 95

Inferncia Estatstica

78

Assim,
IC95% () = [178, 61; 187, 38]
Observa-se que aumentando o nvel de confiana, tambm temos o aumento do intervalo de
confiana.
4.1.2.3

Intervalo de Confiana para mdia com varincia 2 desconhecida

Na prtica quando no se conhece a mdia X tambm no se conhece a varincia, nesse caso


utilizamos o intervalo de confiana:

P

S
S
X t 2 X + t 2
n
n


=1

Exemplo: Em uma determinada industria para verificar a qualidade dos rolamentos esfricos
produzidos foi tomado uma amostra ao acaso um lote de 15 peas, fornecendo um dimetro
mdio de 240cm com desvio padro de 15cm . Encontre um intervalo de confiana de 95% para
o dimetro.
Primeiramente temos que obter o valor tabelado de t, como queremos o intervalo de confiana
a 95%, temos que:
1 = 0, 95 = 1 0, 95 = 0, 05

0, 05
=
= 0, 025
2
2

Olhando na tabela o valor que deixa 0,025 de rea acima com = 15 1 = 14, temos
t = 2, 145


S
S

P X t X + t2
=1
n
n


15
15
= 0, 95
P 240 2, 145 180 + 2, 145
15
15
P (231, 69 248, 31) = 0, 95

Assim,
IC95% () = [231, 69; 248, 31]

Inferncia Estatstica
4.1.2.4

79

Intervalo de Confiana para varincia 2 e para o desvio padro

Quando a populao da qual foi amostra foi coletada for Normal, pode-se obter um intervalo
de confiana para a varincia 2 dada por:
(n 1)S 2
(n 1)S 2
2
2
(1 )
2

!
=1

e IC para o desvio padro dado por


s
P

(n 1)S 2
2
2

(n 1)S 2
=1
(1 )

Exemplo: No exemplo dos 15 peas de rolamentos esfricos, obter o intervalo de confiana de


95% para a varincia e para o desvio padro do maior eixo.
Temos que 0,05
2 = 0, 025, nesse caso precisamos obter na tabela Qui-Quadrado o valores 0,025
e 10,025 = 0,975 , com = 14 graus de liberdade, ento
0,025 = 26, 119 0,975 = 5, 629
Nesse exemplo foi fornecido a varincia amostral S 2 = 144.
!
2
(n

1)S
(n 1)S 2
= 0, 95
2
P
2
(1 )
2


14 144
14

144
2
P

= 0, 95
26, 119
5, 629

P 77, 18 2 358, 14 = 0, 95

A partir do intervalo da varincia obtemo o IC do desvio padro


P


p
p
77, 18 358, 14 = 0, 95

P (8, 78 18, 92) = 0, 95

Assim,
IC95% ( 2 ) = [77, 18; 358, 14] IC95% () = [8, 78; 18, 92]

Inferncia Estatstica
4.2

80

TEORIA DA DECISO ESTATSTICA

4.2.1

Teste de Hiptese

uma metodologia estatstica que permite tomar deciso sobre uma ou mais populaes
baseando no conhecimento de informaes da amostra.
Ao tentarmos a fixao de decises, conveniente a formulao de suposies ou de conjeturas
acerca das populaes de interesse, que, em geral, consistem em consideraes sobre parmetros
das mesmas. Essas suposies, que podem ser ou no verdadeiras, so denominadas de Hipteses
Estatsticas, que podem ser:
HIPTESE NULA - aquela Hiptese Estatstica, prefixada, formulada sobre o parmetro
populacional estudado, e sempre uma afirmativa. representada por H0 .
HIPTESE ALTERNATIVA - So quaisquer hipteses que difiram da Hiptese Nula. Pode
ser representada por H1 ou Ha
Os processos que habilitam a decidir se aceitam ou rejeitam as hipteses formuladas, ou
determinar se a amostra observada difere, de modo significativo, dos resultados esperados, so
denominados de Testes de Hipteses ou Testes de Significncia.
Tabela 4.1: Erros possveis de se cometer no processo de tomada de deciso
Decises possveis
Estados possveis
Ho verdadeira
Ho falsa
Aceitao de Ho Deciso correta Erro do tipo II
Rejeio de Ho
Erro do tipo I Deciso correta
Ao testar uma hiptese estabelecida, a probabilidade mxima com a qual se sujeitaria a correr
o risco de um erro do tipo I denominada de Nvel de Significncia do Teste e representada
por .
Estudaremos testes de hipteses com uma hiptese nula (H0 ) e uma hiptese alternativa
(Ha ). A partir da formulao de (H0 ) e (Ha ), podemos definir se teste de hiptese unilateral
ou bilateral.
Consideremos o parmetro estudado e 0 valor inicialmente suposto para. Podemos formular
as seguintes hipteses:
(

4.2.2

H0 : = 0
H1 : 6= 0

Teste Bilateral

H0 : = 0
H1 : > 0

Teste Unilateral

H0 : = 0
H1 : < 0

Teste Unilateral

Teste para mdias, varincia conhecida

Suponha que X uma varivel aleatria com mdia desconhecida e varincia 2 conhecida.
E queremos testar a hiptese de que a mdia igual a um certo valor especificado 0 . O teste

Inferncia Estatstica

81

de hiptese pode ser formulado como segue:


(

H0 : = 0
H1 : 6= 0

Para testar a hiptese, toma-se uma amostra aleatria de n observaes e se calcula a estatstica
x 0
zc =

n
Como se trata de um teste bilateral temos duas alternativas para verificar se a hiptese H0
rejeitada
se |zc | > z 2 .
h
i
se 2P |zc z 2

Se a hiptese formulada fosse


(

H0 : = 0
H1 : > 0

H0 : = 0
H1 : < 0

Como se trata de testes unilaterais temos duas alternativas para verificar se a hiptese H0
rejeitada
se |zc | > z .
se P [|zc | > z ]

Exemplo: Uma industria eltrica fabrica lmpadas afirma que o tempo de vida mdio de
800horas. Tomaram-se o tempo de vida de 40 lmpadas e obteve-se uma mdia X = 750 e

Inferncia Estatstica

82

sabe-se que a varincia populacional 2 = 1600cm2 . Pode-se afirmar que a indstria estava
correta.
Utilizando um teste unilateral
(
H0 : = 800
H1 : < 800
Calculando o valor de zc
zc =

X 0
750 800
= 7, 90
=

40

40
n

Como no foi especificado o nvel de significncia, vamos assumir = 0, 05. Nesse caso,
trata-se de um teste unilateral, temos que observar o valor tabelado para z = z0,05 = 1, 65.
Concluso: Observando |zc | = 7, 90, temos que como 7, 90 > 1, 65, rejeita-se H0 , a um nvel
de significncia de 5%, ou seja, com 95% de probabilidade a empresa estava errada ao afirmar
que o tempo de vida mdio de 800horas.
4.2.3

Teste para mdias, varincia desconhecida

Suponha que X uma varivel aleatria Normal com mdia desconhecida e varincia 2
desconhecida. E queremos testar a hiptese de que a mdia igual a um certo valor especificado
0 . O teste de hiptese pode ser formulado como segue:
(

H0 : = 0
H1 : 6= 0

H0 : = 0
H1 : < 0

H0 : = 0
H1 : > 0

Para testar a hiptese, toma-se uma amostra aleatria de n 30 observaes com varincia
desconhecida se calcula a estatstica
x 0
tc =
S

n
Rejeita-se H0
teste bilateral:
se |tc | > t 2 .
h
i
se 2P |tc | > t 2
teste unilateral:
se |tc | > t .
se P [|tc | > t ]
Para testar a hiptese, toma-se uma amostra aleatria de n > 30 observaes com varincia
desconhecida se calcula a estatstica
x 0
zc =
S

Inferncia Estatstica

83

Rejeita-se H0
teste bilateral:
se |zc | > z 2 .
h
i
se 2P |zc | > z 2
teste unilateral:
se |zc | > z .
se P [|zc | > z ]
Exemplo: Em uma determinada industria um determinado rolamento esfricos dito de
qualidade se o seu dimetro mdio for igual a 240cm. Para verificar se os dimetros mdios
esto atendendo as especificaes, foi tomado uma amostra ao acaso de 20 peas, fornecendo um
dimetro mdio de 236cm com desvio padro de 15cm.
Utilizando um teste bilateral
(
H0 : = 240
H1 : 6= 240
Calculando o valor de tc
tc =

236 240
x 0
=
= 1, 193
S
15

20
n

Como no foi especificado o nvel de significncia, vamos assumir = 0, 05. Nesse caso, tratase de um teste unilateral, temos que observar o valor tabelado para t 2 = t 0,05 = t0,025 = 2, 093.
2
Concluso: Observando |tc | = 1, 193, temos que como 1, 193 < 2, 093 no existe razo para
rejeitar H0 , logo os dimetros mdios esto atendendo as especificaes.
Exemplo: Uma amostra de 76 peixes pescados numa certa represa produziu um peso mdio
de 13,36g e desvio-padro 4,79g. Suspeita-se que a mdia de peso da populao desses peixes
nessa regio seja 12g. Teste essa hiptese com um nvel de significncia de 5%.
Utilizando um teste unilateral.
(
H0 : = 12, 0
H1 : > 12, 0
Calculando o valor de zc
zc =

x 0
13, 36 12, 0
=
= 2, 475
4, 79
S

n
76

Nesse caso, trata-se de um teste bilateral, temos que observar o valor tabelado para z 2 =
z 0,05 = z0,025 = 1, 960.
2
Concluso: Observando |zc | = 2, 475, temos que como 2, 475 > 1, 65 rejeita-se H0 ao nvel de
5% de significncia. Portanto, a mdia de peso da populao desses peixes superior a 12g.

Inferncia Estatstica
4.2.4

84

Teste de hipteses para proporo

Assim como para a mdia, existem testes de hipteses associados a propores, estes testes
so a respeito do parmetro populacional p. Com os dados coletados de uma amostra de tamanho
n, pode-se verificar o numero de sucessos X, e estimar a proporo p.
Para testar as hipteses sobre propores pode-se utilizar a distribuio normal , nesse caso
se calcula a estatstica
p p0
zc = r
p 0 q0
n
Rejeita-se H0
teste bilateral se |zc | > z 2 .
teste unilateral se |zc | > z .
Para obter os valores de z tabelados, o mais prtico consultar a tabela de t, na ltima linha,
quando os graus de liberdades so suficientemente grandes.
Exemplo: Um centro de pesquisas afirma que 30% das pessoas so usurios de internet sem
fio em uma determinada regio. Em uma amostra aleatria de 30 pessoas, em 12 dizem ter rede
sem fio em casa. Teste a afimaro do centro de pesquisa utilizando a significncia = 0, 05.
Temos que p0 = 0, 30 q0 = 1 p0 = 1 0, 30 = 0, 70, nmero de sucessos X = 12, tamanho
da amostra n = 30, assim temos:
X
12
=
= 0, 40
p =
n
30
Utilizando um teste bilateral

H0 : p = 0, 30
H1 : p 6= 0, 30

Calculando o valor de zc
p p0
0, 40 0, 30
=r
= 1, 20
zc = r
p0 q0
0, 3 0, 7
n
30
Nesse caso, trata-se de um teste bilateral, temos que observar o valor tabelado para z 2 =
z 0,05 = z0,025 = 1, 960.
2
Concluso: Observando |zc | = 1, 20, temos que como 1, 20 < 1, 96 |zc | < z 2 no existe
evidncias para rejeitar H0 ao nvel de 5% de significncia, logo a proporo de pessoas que
utilizam a internet sem fio em de 30%.
4.2.5

Resumo das etapas aplicadas a qualquer teste de hipteses

1. Determinar as hipteses nula e alternativa.


2. Selecionar a estatstica de teste que ser usada para decidir rejeitar ou no a hiptese nula.
3. Especificar o nvel de significncia para o teste.

Inferncia Estatstica

85

4. Usar o nvel de significncia para desenvolver regra de deciso que indica os valores
crticos da estatstica de teste que levar a rejeio de H0 .
5. Coletar os dados amostrais e calcular a estatstica de teste.
6. Comparar o valor da estatstica do teste com o(s) valor(es) crtico(s) especificado(s) na
regra de deciso para determinar se H0 deve ser rejeitado;

Inferncia Estatstica
4.3

86

REGRESSO E CORRELAO

Nas unidades anteriores, descrevemos a distribuio de valores de uma nica varivel, com
esse objetivo aprendemos a calcular medidas de tendncia central e variabilidade. Porm, se
considerarmos duas ou mais variveis surge um novo problema: as relaes que podem existir
entre as variveis estudadas.
Vamos verificar as relaes entre as seguintes variveis:
Altura e peso - espera-se que quanto mais alto mais pesado o individuo;
Quantidade de memria RAM e tempo de processamento - espera-se que com mais memria
RAM tenha-se um tempo menor de processamento;
Temperatura e Umidade do ar - no se pode associar a temperatura a uma menor ou maior
umidade do ar.
Para estudar a relao entre duas variveis quantitativas na utilizamos a anlise de regresso
e correlao destas variveis.
Correlao um nmero entre -1 e 1 que mede o grau relacionamento entre duas variveis
quantitativas
Regresso o estudo que busca ajustar uma equao a um conjunto de dados de forma que
a relao entre duas variveis quantitativas possa ser expressa matematicamente.
Definimos um conjunto de variveis (x, y), sendo x a varivel independente e y a varivel
dependente. A primeira forma de verificar a relao de duas variveis traar o grfico de
disperso do dados.
O grfico de disperso contm uma varivel independente representada no eixo horizontal e
a varivel dependente representada no eixo vertical.
O grfico de disperso da um idia da existncia de correlao, entretanto no apresenta qual
a magnitude da correlao. Para determinar a magnitude da correlao utilizamos o coeficiente
de correlao populacional (). Em geral trabalhamos com amostras, e para estimar o coeficiente
de correlao populacional pode-se utilizar o coeficiente de correlao amostral.
X
(xi x
)(yi y)
r = sXi
X
(xi x
)2
(yi y)2
i

sendo que:
r > 0 - correlao positiva;
r < 0 - correlao negativa;
r = 0 - ausncia de correlao.
O valor obtido para o coeficiente de correlao amostral tem como finalidade estimar o populacional, ou seja, verificar se na populao existe uma associao entre as variveis em estudo.

Inferncia Estatstica

87

Figura 4.1: indcios de correlao positiva, aumentando x, y tambm aumenta

Figura 4.2: indcios de correlao negativa, aumentando x, y diminui

Figura 4.3: indcios de ausncia correlao


Desta forma, deve ser realizado um teste de hiptese sobre o coeficiente populacional, com
base no resultado obtido na amostra, que pode ser definido da seguinte maneira:
(

H0 : = 0
H1 : 6= 0

Rejeita-se H0 se |tc | > t 2 , em que


r0
tc = q

1r2
n2

nesse caso v = n 2 graus de liberdade


Exemplo: Numa pesquisa feita com 7 famlias com renda bruta mensal entre 10 e 25 salrios
mnimos mediram-se:
X: renda bruta mensal (em salrios mnimos)
Y: porcentagem da renda bruta anual gasta com assistncia mdica

Inferncia Estatstica
x
y

88
10
11,8

12
10,2

14
12,1

16
13,2

18
15,1

20
15,4

22
15,6

Figura 4.4: Grfico de disperso

n
X

x =

y =

r =

xi

n
n
X
i

112
= 16
7

yi

93, 4
=
= 13, 3
nX
7
(xi x
)(yi y)

sXi
X
(xi x
)2
(yi y)2
i

49, 6
= 0, 9148
112 26, 25

Verificou que o valor da correlao r=0,9148. Vamos testar a hiptese se este valor
diferente de zero.
(

H0 : = 0
H1 : 6= 0

Temos v = n 2 = 7 2 = 5 graus de liberdade


r0
0, 9148
tc = q
=q
1r2
n2

10,91482
5

= 5, 06

Tomando-se = 0, 05, temos t0,025;5 = 2, 571.


Como |tc | > t 2 , rejeita-se H0 ao nvel de 5% de significncia. Logo a correlao diferente
de zero e igual a 0,9148.
Pelo diagrama de disperso e pelo coeficiente de correlao, verificamos que existe uma relao
linear entre as variveis X e Y , podemos determinar uma funo que exprima esse relacionamento.

Inferncia Estatstica

Observao
1
2
3
4
5
6
7
Total

89

Tabela 4.2: Tabela auxiliar para o calculo da correlao


x
y
(x x) (y y) (x x)(y y) (x x)2
10 11,8
-6
-1,5
9
36
12 10,2
-4
-3,1
12,4
16
14 12,1
-2
-1,2
2,4
4
16 13,2
0
-0,1
0
0
18 15,1
2
1,8
3,6
4
20 15,4
4
2,1
8,4
16
22 15,6
6
2,3
13,8
36
112 93,4
49,6
112

(y y)2
2,25
9,61
1,44
0,01
3,24
4,41
5,29
26,25

A funo que expressa a relao linear entre X e Y dada por


y = a + bx + 
em que:
a coeficiente linear, interpretado como o valor da varivel de dependente quando a varivel
inpendente igual a 0;
b coeficiente de regresso, interpretado como acrscimo na varivel dependente para a
variao de uma unidade na varivel.
 so os erros aleatrios de uma populao normal, com mdia 0 e varincia constante.
Os estimadores para os coeficientes so:
X
(xi x
)(yi y)
a = y bx b =

i (xi

x
)2

Aps ajustar o modelo de regresso deve-se realizar um teste de hiptese para verificar se os
coeficientes so diferentes de zero:
(
H0 : a = 0
H0 : b = 0
H1 : a 6= 0
H1 : b =
6 0
Para testar os coeficientes de regresso pode-se utilizar as estatsticas:
ta =
A anlise de varincia uma tcnica utilizada para se testar o ajuste da equao como um
todo, ou seja, um teste para verificar se a equao de regresso obtida significativa ou no.

Inferncia Estatstica

90

Tabela 4.3: Anlise de Varincia para Regresso Linear Simples


Fontes de Variao GL Soma de Quadrados (SQ) Quadrado Mdio (QM)
Regresso
1
SQRegresso
QMRegresso
Erro
n-2
SQErro
QMErro
Total
n-1
SQTotal
SQTotal =

Fc
QMRegresso/QMErro

X
(yi y)2
i

X
(xi x
)2

SQRegresso = b

SQErro = SQTotal SQRegresso


QMRegresso = SQRegresso
SQErro
QMErro =
n2
(

H0 : a = 0 ou b = 0
H1 : a 6= 0 e b 6= 0

O teste de hiptese para avaliar se o modelo de regresso significativo feito da seguinte


forma:
Estabelecer o nvel de significncia ;
Obter o valor tabelado F ;
Rejeita-se a hiptese H0 , se Fc > F .
O coeficiente de determinao r2 , definido por:
r2 =

SQRegresso
SQTotal

0 < r2 < 1

ele representa a porcentagem da variao total que explicada pela equao de regresso, quanto
maior o seu valor melhor.
Aps ter verificado o ajuste da equao de regresso pode-se utiliza-la para fazer previses.
Exemplo: Utilizando o exemplo da renda bruta mensal (em salrios mnimos) e a porcentagem
da renda bruta anual gasta com assistncia mdica.
Vamos ajustar o modelo
y = a + bx
Utilizando os calculo da tabela 4.2
X
(xi x
)(yi y)
b =

i (xi

x
)2

49, 6
= 0, 44
112
a = y bx
=

= 6, 26

Inferncia Estatstica

91

Assim a equao de regresso igual a


y = 6, 26 + 0, 44x
Vamos verificar se a regresso significativa
SQTotal =

(yi y)2 = 26, 25

!2
X
SQRegresso =

(xi x
)(yi y)

i (xi

x
)2

(49, 6)2
= 21, 97
112
SQErro = SQTotal SQRegresso
=

= 26, 25 21, 97 = 4, 28

Tabela 4.4: Anlise de Varincia para Regresso Linear Simples


Fontes de Variao GL Soma de Quadrados (SQ) Quadrado Mdio (QM)
Regresso
1
21,97
21,97
Erro
5
4,28
0,86
Total
6
26,25

Fc
25,55

F
6,60

Como o Fc > F , rejeita-se H0 , logo o modelo de regresso linear significativo.


Obtendo o r2
21, 97
SQRegresso
=
= 0, 8370 = 83, 70%
r2 =
SQTotal
26, 25
Assim verifica-se que a renda bruta explica 83, 70% da variao do gasto com assistncia
mdica.

Você também pode gostar