Você está na página 1de 117

Reviso estatstica e

probabilidade
Prof. Anderson Almeida Ferreira

Populao
Populao o conjunto de elementos (indivduos, objetos,
etc.) que formam o universo de nosso estudo e que so
passveis de serem observados, sob as mesmas condies.
Num processo de inspeo da qualidade, a populao pode
ser considerada como o conjunto de todos os itens que saem
da linha de produo.
Numa pesquisa de mercado, a
populao o conjunto de possveis
consumidores.

Amostragem
Grande parte das pesquisas cientficas ou de resolues de
problemas de engenharia so feitos por amostragem, ou seja,
observamos apenas um subconjunto de elementos da
populao.
A amostragem particularmente interessante quando:
a populao grande ou infinita.
as observaes ou mensuraes tm alto custo.
as medidas exigem testes
POPULAO: todos os
destrutivos.
possveis consumidores
necessidade de rapidez, etc.

amostragem

Amostra: um subconjunto dos


consumidores

inferncia

Populao e Amostra
Populao (ou universo): todos os N membros de
uma classe ou grupo.
Ex.: todos os processos executados numa mquina
durante o perodo que esteve ativa.

Amostra uma parte da populao, denotada


por n.
Ex.: todos processos executados pela mquina em
18/03/2006

Variveis
Normalmente, estamos interessados em certas
caractersticas dos objetos de uma populao.
Por exemplo:

Nmero de falhas;
Espessura de cada parede;
Sexo de um formando;
Idade com que um indivduo se formou

Uma caracterstica pode ser categorizada, como


sexo ou tipo de defeito, ou pode ser de natureza
numrica.

Variveis
Uma varivel qualquer caracterstica que cujo valor pode
mudar de um objeto para outro da populao.
Ou seja, uma varivel, o nome que se d a um fenmeno
que pode ser medido e que varia conforme a medio.
Se no variasse seria uma constante e no teria maior
interesse para a pesquisa.
Normalmente, identificamos as variveis com letras
minsculas do final do alfabeto. Exemplo:
x = marca da calculadora de um estudante
y = nmero de defeitos graves em um automvel recentemente
fabricado
z = distncia de frenagem de um automvel sob condies
especficas

Variveis
Os dados resultam da observao de uma, ou de duas ou
mais variveis simultaneamente.
Univariados observaes sobre uma nica varivel.
Exemplos:
Tipo de transmisso (A, M) de cada um dentre 10 automveis
recentemente comprados
Vida til (horas) de baterias da marca D colocadas em
determinado uso

Bivariados observaes feitas em cada uma de duas


variveis. Exemplo:
O par (altura, peso) de cada jogador de basquete de um time.

Multivariados quando so feitas observaes sobre mais


de duas variveis

Pesquisa Observacional e Experimental


Numa pesquisa observacional (ou de levantamento) as
caractersticas de uma populao so levantadas (observadas ou
medidas), mas sem manipulao.
o caso de um censo demogrfico, pesquisas eleitorais, pesquisas de
mercado, inspeo da qualidade, etc.
Em todos esses casos, se quer ter idia de uma certa populao tal qual ela
na natureza ou no processo.

Nas pesquisas experimentais, grupos de indivduos (ou animais, ou


objetos) so manipulados para se avaliar o efeito de diferentes
tratamentos.
o caso de se verificar o rendimento de um processo qumico para diferentes
temperaturas de reao, as quais so manipuladas de acordo com o interesse
prtico.

Os mtodos no so os mesmos

Estatstica Descritiva
utilizada quando se deseja simplesmente resumir e
descrever caractersticas importantes de dados coletados
Envolve:
Coletar dados
Apresentar dados
Caracterizar dados

Finalidade:
Descrever dados

Estatstica Inferencial
utilizada quando um investigador usa as informaes da
amostra para tirar algum tipo de concluso sobre a populao
Envolve:
Estimativas
Testes de Hiptese

Finalidade:
Tomar decises sobre caractersticas da populao de uma coleta

Terminologia

Varivel Aleatria
Uma varivel aleatria (VA) x em um espao amostral
S uma funo x: S que atribui um nmero real a
cada ponto amostral em S
Ou seja, uma varivel aleatria uma varivel que
recebe um valor numrico como resultado de um
experimento.
Ex. Atrasos numa rede, tempo de resposta de um servidor,
tempo entre chegadas de clientes em um servidor, nmero
de tweets recebidos por uma conta experimental do Twitter

Mdia
A mdia amostral
Para um conjunto de nmeros x1, x2, x3, ...xn,
n

x
i 1

n
Para informar a mdia amostral recomenda-se o uso
de preciso decimal de um dgito a mais do que a
preciso dos xi.

Mdia da populao
= (soma dos N valores da populao)/N

Mas cuidado com Mdia

Varincia
Considere-se as trs sries de valores abaixo:
<10, 12, 14, 9>
<1, 20, 2, 22>
<11, 11, 11, 12>

possvel notar certa semelhana entre elas?


Aparentemente so conjuntos bem diferentes.
Mas todos tm a mesma mdia: 11,25.

Varincia
Essa observao do distanciamento dos
elementos em relao mdia chamada de
varincia.
Ento, alm da mdia, o pesquisador deve
ficar atento tambm varincia do conjunto
de valores, j que esta complementa a
caracterizao do conjunto.

Clculo da varincia
Para cada elemento, subtraia a mdia do
conjunto deste elemento:
<10-11,25, 12-11,25, 14-11,25, 9-11,25> = <-1,25, 0,75, 2,75, -2,25>
<1-11,25, 20-11,25, 2-11,25, 22-11,25> = <-10,25, 8,75, -9,25, 10,75>
<11-11,25, 11-11,25, 11-11,25, 12-11,25> = <-0,25, -0,25, -0,25, 0,75>

Agora, cada valor representa a distncia do elemento para a mdia do


conjunto

Eleve os valores resultantes ao quadrado:


<-1,252, 0,752, 2,752, -2,252> = <1,5625, 0,5625, 7,5625, 5,0625>
<-10,252, 8,752, -9,252, 10,752> = <105,0625, 76,5625, 85,5625, 115,5625>
<-0,252, -0,252, -0,252, 0,752> = <0,0625, 0,0625, 0,0625, 0,5625>

Isso faz com que todas as distncias fiquem positivas e aumenta a influncia de
elementos mais distantes da mdia.

Some os resultados:
1,5625+0,5625+7,5625+5,0625
= 14,75
105,0625+76,5625+85,5625+115,5625 = 382,75
0,0625+0,0625+0,0625+0,5625
= 0,75
Isso gera um valor absoluto da varincia acumulada

Divida pelo nmero de elementos do conjunto


menos 1:
14,75/3 = 4,9166...
382,75/3 = 127,5833...
0,75/3
= 0,25
Isso gera a distncia mdia, ou seja, independente do
nmero de elementos no conjunto.
Poderia ser n ao invs de n-1, mas a varincia de um
conjunto com apenas 1 elemento deve ser
indeterminada.

Frmula da Varincia

a varincia do conjunto X
representa cada um dos elementos do conjunto X
a mdia do conjunto X
o nmero de elementos do conjunto X

Desvio-Padro
O desvio-padro uma medida tambm
bastante utilizada para analisar conjuntos e
definido simplesmente como a raiz quadrada
da varincia

Indices de Disperso
Medem qual a variao de conjunto de dados
Intervalo (minmo e mximo)
Variancia da amostra

1 n
2
s
x

x
i

n 1 i 1
2

E os derivados da varincia da amostra:


Desvio Padro, S
COV = Razo da mdia da amostra e o desvio padro s / x
Percentis
Especificao de quantas observaes caem nos intervalos

Sumarizao de Dados
Dado uma amostra {x1, x2,..., xn} de no
observaes. No caso da mediana,
x(i) o i-esimo elemento da lista
ordenada

x(( n 1/ 2) se impar

0.5( x( n / 2) x(( n 1) / 2) ) se par

4.

Mediana

5.

Moda: observao com maior


frequncia

6.

Varincia da amostra

n
1
2
s2
(
x

x
)

i
n 1 i 1

Sumarizao de Dados
Dado uma amostra {x1, x2,..., xn} de no
observaes.

7.

Desvio Padro

8.

Coeficiente de Variao =

1 n
2
s
( xi x )

n 1 i 1

s/ x

Mediana
Mediana amostral:
Valor ~
x tal que 50% dos pontos esto abaixo dele
Ordene as observaes em ordem crescente
~
x = ao (n+1)/2 esimo valor se n impar
x = mdia do (n/2)-esimo e do (n/2+1)-esimo
~
valores, se n par
Divide as observaes em duas partes

Quartis e Percentis
Quartis:
Divide as observaes em 4 partes
O 2 quartil a mediana

Percentis:
Divide as observaes em 100 partes
99-esimo percentil separa as 1% maiores observaes
do restante

Exerccio
O artigo The Pedaling Technique of Elite Endurance
Cyclists (Int. J. of Sport Biomechanics, 1991, p.29-53)
relatou os dados a seguir sobre a potncia de uma nica
perna de um ciclista em alta carga de trabalho:
244 191 160 187 180 176 174 205 211 183 211 180 194 200
Calcule a mdia e a mediana amostral.
Suponha que a primeira observao tenha sido 204 em vez de
244. Como a mdia e a mediana seriam afetadas?
Calcule uma mdia aparada, eliminando a maior e a menor
observao da amostra
O artigo tambm relatou valores sobre a potncia uma nica
perna para uma carga de trabalho baixa. A mdia amostral
para 13 observaes foi 119,8 e a 14 observao foi 159.
Qual o valor da mdia para a amostra toda?

Exerccio
O artigo Oxygen Consumption During Fire
Suppression: Error of Heart Rate Estimation
(Ergonomics, 1991, p. 1469-1474) informou os
dados a seguir sobre consumo de oxignio
(mL/kg/min) para uma amostra de 10 bombeiros
em uma simulao de supresso de incndio:
29,5 49,3 30,6 28,2 28,0 26,3 33,9 29,4 23,5 31,6
Calcule:
A amplitude amostral
A varincia amostral
O desvio padro

Exerccio
Em uma amostra foram observados os seguintes
valores para uma caracterstica: 116,4 115,9
114,6 115,2 115,8
Calcule a mdia amostral e os desvios em relao a
mdia
Use os desvios calculados para obter a varincia
amostral e o desvio padro amostral
Subtraia 100 de cada observao para obter uma nova
amostra de valores transformados. Calcule a varincia
amostral desses valores e a compare a varincia dos
dados originais.

Probabilidade
Probabilidade se refere ao estudo da
aleatoriedade e da incerteza
A teoria da probabilidade oferece mtodos de
quantificao das chances ou possibilidades
de ocorrncia associadas aos diversos
resultados
Experimento qualquer ao ou processo
cujo resultado est sujeito a incerteza.

Espao Amostral
O espao amostral de um experimento,
representado por S, o conjunto de todos os
resultados possveis desse experimento.
Exemplos:
Examinar um fusvel para verificar se funciona
S={N, D} N representa sem defeito e D com defeito

Examinar trs fusveis em sequncia


S={NNN, NND, NDN, NDD, DNN, DND, DDN, DDD}

Exemplo
Dois postos de gasolina esto localizados em
uma determinada interseo. Cada um possui
seis bombas. Considere o experimento em
que o nmero de bombas em uso em
determinada hora do dia determinado para
cada posto.

Exemplo
Se uma bateria de lanterna nova, tipo D, tiver
uma voltagem fora de certos limites, ser
classificada como falha (F); se a voltagem
estiver dentro dos limites especificados, ser
classificada como sucesso (S). Suponha que
um experimento consista em testar cada
bateria quando sai de uma da linha de
montagem at que seja observado um
sucesso.

Evento
Evento qualquer grupo (subconjunto) de
resultados contidos no espao amostral S.
Simples se possui um nico resultado
Composto se possui mais de um resultado

Quando um experimento realizado,


determinado evento A ocorre se o resultado
experimental estiver contido em A.

Exemplo
Considere um experimento em que cada um
de trs veculos que trafeguem em uma
determinada estrada siga ela sada esquerda
(E) ou direita (D) no final da rampa de sada.
Alguns eventos compostos:
O evento em que exatamente um dos trs veculos vira
direita
O evento em que no mximo um dos veculos vira
direita
O evento em que os trs veculos viram na mesma
direo

Exemplo
Para o exemplo das bombas em uso em cada
um de dois postos
Exemplos de eventos compostos
O evento em que o nmero de bombas em uso o
mesmo nos dois postos;
O evento em que o nmero total de bombas em uso
4;
O evento em que no mximo uma bomba est em uso
em cada posto.

lgebra de Eventos

lgebra de Eventos

lgebra de Eventos

lgebra de Eventos

Trs axiomas da probabilidade


Dado um experimento e um espao amostral S, o objetivos da
probabilidade atribuir a cada evento A um nmero P(A),
denominado probabilidade do evento A, que fornecer uma
medida precisa da chance de ocorrncia de A.
Para assegura que as atribuies de probabilidades sejam
consistentes, todas as atribuies devem satisfazer os axiomas
a seguir:
Para qualquer evento A, P(A) >= 0
P(S) = 1 (Normalizao)
Se A e B so mutuamente exclusivos
P (A + B) = P(A) + P(B)

Exemplo
Representando os seis eventos simples
associados ao lanamento de um dado de seis
lados por E1, E2, E3, E4 E5 e E6.

Se o dado for construdo de tal forma que


qualquer um dos trs resultados pares tenha o
dobro de probabilidade de ocorrer em relao aos
mpares, como seria uma atribuio apropriada de
probabilidades a cada evento simples?
Qual seria a probabilidade do evento A =
resultado par?

Tcnicas de contagem
Quando os diversos resultados so igualmente
provveis, a tarefa de calcular probabilidades
se reduz a contagem. Em particular se N for a
quantidade de resultados de um espao
amostral e N(A) for a quantidade de
resultados contidos em um evento A, ento
P(A) = N(A)/N

Tcnicas de Contagem
Regra do produto
Se o primeiro elemento ou objeto de um par
ordenado puder ser selecionado de n1 formas e para
cada uma das n1 formas, o segundo elemento do par
pode se selecionado de n2 formas, o nmero de pares
n1n2.
Exemplo: Uma famlia se mudou para uma cidade e
precisa dos servios de um obstetra e de um pediatra.
H duas clnicas de fcil acesso e cada uma tem dois
obstetras e trs pediatras. De quantas formas a famlia
pode escolher os dois especialistas na mesma clnica.

Exemplo
H 10 professores disponveis para correo
de provas de um determinado curso. O
primeiro exame consiste em quatro questes
e deseja-se selecionar um professor diferente
para corrigir cada uma (apenas um por
questo). De quantas formas diferentes os
professores podem ser escolhidos para a
correo?

Combinao
Definio
Dado um conjunto de n objetos diferentes,
qualquer subconjunto no-ordenado de tamanho
k denominado combinao. O nmero de
combinaes de tamanho k que podem ser
formadas a partir de n objetos representado
por n
k

n Pk ,n
n!

k k! k!(n k )!

Exemplo
Um depsito de uma universidade recebeu
uma entrega de 25 impressoras, das quais 10
so impressoras a laser e 15 so a jato de
tinta. Se 6 das 25 forem selecionadas
aleatoriamente para serem verificadas por um
tcnico, qual ser a probabilidade de que
exatamente 3 delas sejam a laser?
E a probabilidade de ao menos 3 impressoras
a jato de tinta serem selecionadas?

Probabilidade Condicional
Exemplo
Componentes complexos so montados em uma fbrica
que usa duas linhas de montagem diferentes: A e A. A linha
A usa equipamentos mais antigos que A, de forma que
mais lenta e um pouco menos confivel. Suponha que em
determinado dia, a linha A tenha montado 8 componentes,
dos quais 2 foram identificados como defeituosos e 6 no
defeituosos, ao passo que a linha A produziu 1 defeituoso e
9 no defeituosos.
O gerente de vendas seleciona aleatoriamente 1 dos 18
componentes para uma demonstrao.
Antes da demonstrao, qual a probabilidade do componente
selecionado ser na linha A?
Se o componente tiver defeito, qual a probabilidade do
componente selecionado ser na linha A?

Probabilidade condicional

A probabilidade condicional trata da probabilidade de ocorrer um evento A, tendo


ocorrido um evento B, ambos do espao amostral S, ou seja, ela calculada sobre o
evento B e no em funo o espao amostral S.

Probabilidade condicional
Exemplo

Uma
pesquisa
realizada
entre
1000
consumidores,registrou que 650 deles trabalham
com cartes de crdito da bandeira MasterCard,
que 550 trabalham com cartes de crdito da
bandeira VISA e que 200 trabalham com cartes
de crdito de ambas as bandeiras. Qual a
probabilidade de ao escolhermos deste grupo
uma pessoa que utiliza a bandeira VISA, ser
tambm um dos consumidores que utilizam
cartes de crdito da bandeira MasterCard?

Probabilidade condicional

Exerccio
Suponha que, de todos os indivduos que
compram uma determinada cmera digital,
60% incluem um carto de memria opcional
na compra, 40% incluem uma pilha extra e
30% incluem um carto e uma pilha. Dado que
o indivduo selecionado comprou uma pilha
extra, qual a probabilidade de compra de
um carto opcional?

Variveis Aleatrias
Def.: Para um dado espao amostral S de um
experimento, uma varivel aleatria (va) qualquer
regra que associe um valor a cada resultado de S. Em
termos matemticos, uma varivel aleatria uma
funo cujo domnio o espao amostral e o
contradomnio um conjunto de nmeros reais.
Exemplo: Quando um estudante tenta acessar um
computador em um sistema de compartilhamento de
tempo, toda as portas esto ocupadas (F), caso em que
o aluno no ter sucesso, ou haver ao menos uma
porta livre (S), caso em que o estudante conseguir
acessar o sistema. Com S= {S, F}, defina uma va X
X(S) = 1

X(F)=0

Variveis aleatrias
Varivel aleatria de Bernoulli
Qualquer varivel aleatria cujos nicos valores possveis
so 0 e 1.

Variveis aleatrias discretas, quando os valores


possveis constituem um conjunto finito ou podem ser
relacionados em uma sequncia infinita na qual haja
um primeiro elemento, segundo elemento e assim por
diante.
Variveis aleatrias contnuas, quando o seu conjunto
de valores possveis consiste em um intervalo completo
da reta de nmeros (Reta real).

Distribuio de probabilidade para


variveis aleatrias discretas
Exemplo:
Seis lotes de componentes esto prontos para
embarque em um fornecedor. O nmero de
componentes com defeito em cada lote mostrado a
seguir:
Lote

Nmero de peas com defeito

Seja X o nmero de peas com defeito no lote


selecionado. Sendo os eventos igualmente provveis
p(0) = P( X=0 ) =
p(1) = P( X=1 ) =
p(2) = P( X=2 ) =

Funo de massa de probabilidade


Def.: A funo distribuio de probabilidade ou
funo de massa de probabilidade (fmp ou pmf)
de uma va discreta definida para cada nmero x
por p(x) = P(X=x)=P(todos os sS: X(s)=x).
Exemplo 1: Suponha que visitemos uma loja
durante uma semana e observemos se a prxima
pessoa a comprar um computador comprar um
laptop ou um desktop.
Se 20% de todos os computadores durante
aquela semana selecionaram um laptop, a fmp de
X ser:

Exemplo 2: Considere um grupo de cinco


doadores de sangue potenciais: A, B, C, D e E.
Desses apenas A e B possuem O+. Cinco
amostras de sangue, uma de cada indivduo,
sero testadas em ordem aleatria at que
seja identificado um indivduo O+. Seja va
Y=nmero de testes necessrios para
identificar um indivduo O+. Ento a fmp de Y
:

PDF (probability distribution function) ou pmf

p(x)

Seja X o nmero de visitas que cada requisio


faz ao disco
p(X): p(0) = 0.25 p(1) = 0.5 p(2) = 0.25

0.6
0.5
0.4
0.3
0.2
0.1
0

Funo de Probabilidade de Massa

1
# visitas ao disco

Histograma
Outra representao grfica equivalente
Plota o nmero de vezes que a sada de um experimento
aleatrio foi igual a cada ponto amostral
Ex: se total de requisies ao servidor = 1000

# Requisies

Histograma
600
500
400
300
200
100
0
0

1
# visitas ao disco

Zipf()

Distribuies Discretas

Comumente usada quando a distribuio altamente


concentrada em poucos valores
Popularidade de arquivos em servidores Web/multimdia
90% dos acessos so para 10% dos arquivos
Popularidade de palavras na lngua inglesa

Seja i, o elemento que ocupa a i-esima posio no ranking


de concentrao

C
P( X i )
i

i 1,2,...

C a constante de normalizao
Zipf: lei das Potncias

Distribuio Zipf

Modela popularidade dos remetentes de e-mails

Parmetro de uma distribuio de


probabilidade
No exemplo 1, tnhamos p(0)=0,8 e p(1)=0,2.
Em outra loja temos p(0)=0,9 e p(1) = 0,1. De
forma geral, a fmp de qualquer va Bernoulli
pode ser expressa na forma
x0
1 se

p( x; ) se
x 1
0 caso contrrio

aqui um parmetro

Funo de distribuio acumulada


(FDA ou CDF)
A FDA F(x) de uma va discreta X com fmp p(x)
definida para cada valor de x po
F ( x) P( X x)

p( y )

y: y x

Para qualquer valor x, F(x) a probabilidade


de o valor X observado ser no mximo x.

Exemplo: Para a fmp


y

P(y)

0,4

0,3

0,2

0,1

F(y) para cada valor de {1,2,3,4} :


F(2,7)=
F(3,9999)=

Valor Esperado
Seja X uma va discreta com conjunto de
valores possveis D e fmp p(x). O valor
esperado ou valor mdio de X denotado por
E(X) ou x E( X ) x p( x)
x

xD

Qual o valor esperado de uma va Bernoulli X?

Distribuio de probabilidade binomial


H diversos experimentos que satisfazem exatamente ou
aproximadamente a seguinte lista de requisitos:
O experimento consiste em uma sequncia de n experimentos
menores denominados tentativas, onde n estabelecido antes do
experimento.
Cada tentativa pode resultar em um de dois resultados possveis,
chamados de sucesso (S) ou falha (F).
As tentativas so independentes, de forma que o resultado de
qualquer tentativa particular no influencia o resultado de qualquer
outra tentativa.
A probabilidade de sucesso constante de uma tentativa para a outra.
Denominamos essa probabilidade p.

Um experimento para o qual essas condies so satisfeitas


denominado experimento binomial.
Exemplo: A mesma moeda lanada sucessiva e
independentemente n vezes.

Exerccio
Calcule usando a frmula
b(3; 8, 0,6)=
b(5; 8, 0,6)=
P(3 X 5) quando n=8 e p=0,6
P(1 X) quando n=12 e p=0,1

Exerccio
Seja X o nmero de falhas na superfcie de
uma caldeira de um determinado tipo
selecionada aleatoriamente, com distribuio
de Poisson de parmetro =5. Calcule
P(X8)=
P(X=8)=
P(X9)=
P(5 X 8)=
P(5<X<8)=
x

10

F(x;) 0,007 0,040 0,125 0,265 0,440 0,616 0,762 0,867 0,932 0,968 0,986

Exemplo

A probabilidade de X ter um valor no intervalo


[a, b] a rea contida entre o intervalo e
abaixo da curva da funo de densidade. O
grfico de f(x) normalmente denominado
curva de densidade.

Funo de distribuio acumulada e


valores esperados
A funo de distribuio acumulada F(x) de uma va
contnua X definida para cada nmero x por
x

F ( x) P( X x)

f ( y)dy

a rea abaixo da curva de densidade esquerda de x.


O valor mdio ou esperado de uma va contnua X com

fdp f(x)
x E ( X ) x f ( x)dx

A varincia de uma va contnua X com fdp f(x) e mdia

2
2
2
X V ( X ) ( x ) f ( x)dx E[( x ) ]

Exemplo
Suponha que o tempo de resposta X em um terminal
de computador on-line especfico tenha distribuio
exponencial com tempo de resposta esperado igual a 5
segundos. Qual a probabilidade de o tempo de
resposta ser no mximo 10 segundos?
E( X )

5, 0,2

P( X 10) F (10;0,2) 1 e ( 0, 2)(10) 1 e 2 1 0,135 0,865

A probabilidade de o tempo de resposta estar entre 5 e


10
P(5 X 10) F (10;0,2) F (5;0,2)

(1 e 2 ) (1 e 1 ) 0,233

Intervalos de confiana
Estimando a Populao a Partir das Amostras
Quo alto so os humanos?
Medir todos nesta sala (amostra)
Calcular a mdia da amostra x
Assumir que a mdia da populao igual da amostra x.

Uma estimativa pontual no diz nada sobre o


quanto pode estar prxima de
Uma alternativa para apresentar um nico valor
sensato para o parmetro que est sendo
estimado calcular e relatar um intervalo
completo de valores plausveis.

Intervalos de confiana
Valor da mdia da amostra apenas uma
estimativa da verdadeira mdia da distribuio.
Os limite c1 e c2 tais que existe uma alta
probabilidade, 1-, que a mdia da populao
est no intervalo (c1,c2):
Pr{ c1 < m < c2} =1-

Pr[ x c1 ] Pr[ x c2 ]

onde o nvel de significncia e


100(1- ) o nvel de confiana

Intervalos de Confiana
Quo alto Jos?
Suponha que a mdia da altura humana seja 1,70 m
Jos mede 1,70 m
certo?

Suponha que 90% dos humanos esto entre 1,55 e 1,90 m


Jos est entre 1,55 e 1,90 m

Ento estamos 90% confiantes que Jos est entre 1,55 e


1,90 cm

Estimando os Intervalos de
Confiana
Duas frmulas para intervalo de confiana
Acima de 30 amostras de qualquer
distribuio: distribuio-z
Pequenas amostras de populaes
normalmente distribudas: distribuio-t

Distribuio Z
O intervalo de confiana 100(1-)% da mdia
de uma populao normal, quando o valor
de e conhecido, dado por

x z1 / 2 / n
Teorema do limite central: A mdia amostral
de observaes distribudas identicamente e
independentes: x ~ N (; / n )

Distribuio-z
Intervalo em cada lado da mdia:

xx
z
/ n

x z1
2 n

O nvel de significncia pequeno para nveis maiores do intervalo de


confiana.
Existem tabelas para a varivel z!

z10.1 1.645
2

z10.05 1.960
2

Exemplo da Distribuio z
35 amostras: 10 16 47 48 74 30 81 42 57 67 7 13 56 44 54 17 60 32 45 28
33 60 36 59 73 46 10 40 35 65 34 25 18 48 63

x z1
2 n

Mdia da amostra x= 42,1


Desvio padro s = 20,1 n = 35

z10.1 1.645
2

z10.05 1.960
2

Calcule o intervalo com 90% de confiana


42.1 (1.645)

20.1
(36.5, 47.7)
35

Definindo o tamanho da amostra


Quantas observaes n para obter uma
acurcia de r% e um nvel de confiana
100(1-)%?

s
xz
n
r% de acurcia implica em
CI =

( x (1 r / 100), x (1 r / 100))

Distribuio t
Frmula quase a mesma:

x t 1 ; n 1
2 n
Usvel para populaes normalmente distribudas!
Mas funciona para pequenas amostras
n-1 indica o grau de liberdade

Exemplo da Distribuio t
10 amostras de chegada de transaes: 148 166 170 191 187 114 168
180 177 204
Mdia da amostra x= 170.5.
Desvio padro s = 25.1, n = 10
Calcule o intervalo de confiana de 90%:

x t 1 ; n 1
2 n

Quanto

t10.1

;101

Exemplo da Distribuio t

25.1
170.5 (1.833)
(156.0, 185.0)
10

Exemplo da Distribuio t
10 amostras de chegada de transaes: 148 166 170 191 187 114 168
180 177 204
Mdia da amostrax = 170.5.
Desvio padro s = 25.1, n = 10
Calcule o intervalo de confiana de 90%:

x t 1 ; n 1
2 n
25.1
170.5 (1.833)
(156.0, 185.0)
10
Calcule agora o intervalo de 99% de confiana

Exemplo da Distribuio t

25.1
170.5 (1.833)
(156.0, 185.0)
10

Exemplo da Distribuio t
10 amostras de chegada de transaes: 148 166 170 191 187 114 168
180 177 204
Mdia da amostrax = 170.5.
Desvio padro s = 25.1, n = 10
Calcule o intervalo de confiana de 90%:

x t 1 ; n 1
2 n

25.1
170.5 (3.250)
(144.7, 196.3)
10

Tomando decises sobre os dados


experimentais
Por que usamos intervalos de confiana?
Sumarizar o erro na mdia da amostra
Prover elementos para saber se a amostra significativa
Permitir comparaes luz dos erros

Referncias
Raj Jain. The Art of Computer System
Performance Analysis: Techniques for
Experimental Design, Measurement, Simulation
and Modeling, John Wiley & Sons, Inc., 1991.
Jay L. Devore, PROBABILIDADE E ESTATSTICA
PARA ENGENHARIA E CINCIAS. Cengage
Learning, 2006.
Material didtico do prof. Fabrcio Benevenuto.
Material didtico da profa. Jussara Almeida
DCC/UFMG.

Você também pode gostar