Escolar Documentos
Profissional Documentos
Cultura Documentos
Conceitos básicos
1.1 Objectivos da Estatística
Definição de Estatística
Estatística é a ciência que recolhe, descreve e interpreta dados, ou seja, é um conjunto de ferramentas
básico para a pesquisa empírica.
Estatística Descritiva
Estatística Descritiva engloba ferramentas destinadas a organizar e apresentar dados de uma maneira
acessível, que não ultrapasse os limites sensoriais da mente humana. A descrição estatística ajuda na
formação de intuição a respeito da ocorrência de fenómenos isolados e de suas respectivas relações entre
si. A Estatística dedica-se ao estudo das variações nas características de diferentes objectos. Mas a
variabilidade pode ter uma natureza determinística (controlada) ou aleatória. A Física, por exemplo, se
preocupa principalmente com a formulação matemática de relações exactas, não deixando espaço para
flutuações aleatórias. Tais flutuações aleatórias são modeladas na estatística. Relações estatísticas são,
portanto, relações que consideram uma certa proporção de variabilidade estocástica.
Estatística Indutiva
As relações empíricas observadas nas ciências naturais, sociologia, psicologia e outras são estatísticas. O
trabalho empírico nestas áreas é tipicamente baseado em acontecimentos e pesquisas sobre amostras. Em
qualquer um dos casos a população total não pode, por motivos práticos ou económicos, ser observada.
Realizar inferências sobre características de uma população baseadas em uma amostra limitada de
objectos desta população é o objectivo da inferência ou estatística indutiva. Aqui, variabilidade é o
resultado da variação da amostra e do processo amostral.
Portanto, a Estatística é aplicada a todos os estágios do processo científico, sempre que fenómenos
quantificáveis são envolvidos.
População
Ao Universo de elementos estatísticos abrangidos por um conjunto particular de especificações é
chamado população.
Os valores reais das variáveis estatísticas são chamados de observações, medidas ou dados.
O conjunto de valores possíveis que uma variável pode assumir é chamado espaço amostral.
Variáveis são representadas por letras maiúscula (X,Y,…) enquanto as suas realizações são representadas
por letras minúsculas (x1,x2,…,y1,y2). Os índices representam os elementos estatísticos pertencentes à
amostra.
Variável Observação
Variáveis acabam por ser as características a serem estudadas num determinado conjunto.Vejamos os
exemplos que se seguem:
Renda mensal
Uma medição é uma atribuição numérica a uma observação. Algumas medidas parecem mais naturais que
outras. Por exemplo, na altura de uma pessoa, pode-se usar um critério que garanta comparabilidade entre
diferentes observações com bastante precisão, independentemente da unidade de medida (metros ou
centímetros). Por outro lado, a nota de um exame representa uma forma de classificação menos robusta,
indicando um determinado ranking, sendo possível colocar vários estudantes na mesma categoria. Os
valores designados para estados qualitativos como "muito bom", "regular" etc. são arbitrários, porém é
um modo prático para avaliação dos estudantes. Como não há uma razão conceptual em que se baseia a
escala de notas de exames, não se deve tentar interpretar "distâncias" entre as notas.
Claramente, as medidas de altura nos dão mais informação que as notas dos exames. Afirmações tais
como: "José é duas vezes mais alto que Tonico" ou "Manuela é 35 centímetros mais baixa que seu
marido" são permitidas.
Como já referido nas aulas de Estatística II, as variáveis podem ter quatro escalas de medida, a saber:
As distâncias entre diferentes valores não podem ser interpretadas. Uma variável medida em uma escala
ordinal é, de certa maneira, não-quantitativa. Por exemplo, notas escolares reflectem diferentes níveis de
realização. Entretanto, normalmente não existe razão para considerar um trabalho avaliado com uma nota
"5"1 duas vezes melhor que outro avaliado com uma nota "2"2.
Existe uma grande quantidade de exemplos para variáveis que se encontram em uma escala ordinal. Por
exemplo: Variáveis que tentam medir conceitos relativos ao "status social", "inteligência", "nível de
satisfação", etc.
Escala de Intervalos
Se distâncias entre medições podem ser interpretadas de forma significativa, a variável é medida em uma
escala de intervalos. Ao contrário da escala de razão, proporções de medições não têm um significado
substancial. Nesta escala não existe um zero absoluto. Por exemplo, temperaturas medidas em graus
centígrados podem ser interpretadas em ordem de maior ou menor nível, no entanto se pensarmos na
conversão destas temperaturas em Fahrenheit, constata-se a mudança do ponto zero.
Escala de Razão
Valores de variáveis medidos numa escala de razão podem ser interpretados tanto em termos de
distâncias como em termos de proporções.
O fenómeno medido numa escala de razão possui um zero absoluto. Exemplos são as medidas em peso,
altura, idade, etc.
Variáveis Discretas
Uma variável métrica que pode assumir um conjunto de valores finitos ou infinitamente contáveis é
denominada discreta.
Variáveis Contínuas
Uma variável métrica é denominada contínua se assumir um número incontável de valores num dado
intervalo.
1
Muito bom
2
Razoável
“São objecto de estudo na teoria das probabilidades os fenómenos aleatórios, ou seja, acontecimentos
influenciados pelo acaso. Na base desta teoria, está o conceito de experiência aleatória, isto é, o processo
de observação ou acção cujos resultados, embora podendo ser descritos no seu conjunto, não são
determináveis à priori, antes de realizada a experiência. Uma experiência aleatória tem como
características:
Exemplo:
O espaço amostral referente ao duplo lançamento de uma moeda corresponde a:
Ω={(C,C);(F;F),(C,F);(F,C)}. São acontecimentos elementares: {(C,C)};{(F;F)},{(C,F)};{(F,C)}. Tal
descrição também é válida se as duas moedas forem lançadas simultaneamente uma única vez. Nota:
F=Face, C=Cara.
Por oposição, podemos definir acontecimento composto aquele cuja realização implica a ocorrência de
um resultado da experiência aleatória, qualquer um de entre os vários possíveis para aquele
acontecimento.
3
Retirado do livro presente na bibliografia “Estatística Aplicada Vol. 1”
Subconjuntos e Complementos
O conjunto A como um subconjunto de B (contido em B) é representado por A ⊂ B. Assim, se o
acontecimento A ocorre, B também ocorre.
A união de conjuntos pode ser expandida para n conjuntos e consequentemente para n acontecimentos
n
A1,A2,A3,….,An. Neste caso A1 ∪ A2 ∪ ..... ∪ An = ∪ Ai
i =1
Resultados gerais:
o A∪A = A.
o A ∪ Ω = Ω , onde Ω é o espaço amostral.
o
A∪ Ø = A, onde Ø é o conjunto vazio (não possui nenhum elemento).
o A ∪A = Ω
Intersecção de Conjuntos
O conjunto dos elementos comuns aos conjuntos A e B é denominado intersecção de A e B, e representa-
se por: A ∩ B .
Então A ∩ B ={2}.
Resultados gerais:
o A∩A = A.
o A ∩ Ω = A , onde Ω é o espaço amostral.
o
A∩ Ø = Ø, onde Ø é o conjunto vazio (não possui nenhum elemento).
o A ∩A = Ø.
o Ø ∩ Ω = Ø.
Acontecimentos Disjuntos
⇒ A ∩ B = A ∩ A = Ø.
Diferença de Conjuntos
O conjunto C é a diferença lógica dos acontecimentos A e B. Representa-se por C=A – B, e lê-se:
‘elementos de A que não pertencem a B’.
A-B=A ∩ B
• Ai ≠ Ø (i=1,2,…,n)
• Ai ∩ A k = Ø (i ≠ k;i,k=1,2,…,n)
• A1 ∪ A2 ∪ ..... ∪ An = Ω
Tal decomposição pode ser interpretada como uma partição do espaço amostral na qual cada resultado
elementar pertence a exactamente um conjunto ou um acontecimento. Repartir um bolo de aniversário
com alguém, resulta em uma decomposição (partição) disjunta do bolo.
Prova: A1 ∩ A = Ø, A ∩ A = Ø, A ∩ A = Ø, A ∩ A = Ø, A ∩ A = Ø, A ∩ A = Ø e
2 1 5 1 6 2 5 2 6 5 6
A1 ∪ A2 ∪ A5 ∪ A6 = Ω .
A ∪B = A ∩ B
A ∩B A ∪ B
Lei associativa :
( A ∩ B) ∩ C = A ∩ ( B ∩ C )
( A ∪ B) ∪ C = A ∪ ( B ∪ C )
Lei distributiva:
A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C )
A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C )
Resumo
Verbal Técnico Algébrico
Se A ocorre, então B também ocorre A é um subconjunto de B A⊂B
A=
A ocorre se e somente se todos Ai ocorrem A é a intersecção de todos os Ai’s A i
i
3. Conceitos de Probabilidade
Propriedades:
• 0 ≤ P ( A) ≤1
• P (Ø) = 0
P(A)=3/6
hn ( A)
fn =
n
P ( A) = l im f n ( A)
n →∞
n hn ( A) f n ( A)
10 7 0.700
20 11 0.550
40 17 0.425
80 34 0.425
100 47 0.470
200 92 0.460
P(. ) é uma medida de probabilidade. É uma função que associa um número P(A) a cada acontecimento
A do espaço amostral Ω.
Axioma 1
P(A) ≥0
Axioma 2
P (Ω ) =1
Axioma 3
Se dois acontecimentos A e B são mutuamente exclusivos ( A ∩ B = Ø ), então P ( A ∪ B ) =P(A)+P(B)
3.4 Propriedades
Sejam A,B,A1,A2,…
⊂Ω
acontecimentos e P(
acima, seguem as seguintes propriedades:
. ) uma medida de probabilidade. Dos três axiomas
1. P ( A) ≤1
2. P ( A ) =1 −P ( A)
3. P (Ø) =1 − P (Ω) = 0
4. A ∩ B = Ø ⇒ P( A ∩ B ) = P (Ø) = 0
5. Se A ⊂ B , então P ( A) ≤ P ( B )
6. Se Ai ∩ A j = Ø para i ≠ j , então P ( A1 ∪ A2 ∪ ...) = P ( A1 ) + P ( A2 ) + ...
P ( A ∪ B ∪C ) = P ( A) + P ( B ) + P (C ) − P ( A ∩ B ) − P ( A ∩C ) − P ( B ∩C ) + P ( A ∩ B ∩C ).
P( A ∩ B)
P( A | B) = , para P(B)>0
P( B)
P( A ∩ B)
P ( B | A) = , para P(A)>0
P( A)
Regra da Multiplicação
Ao manipularmos a definição de probabilidade condicional podemos extrair uma expressão para a
probabilidade da ocorrência de A e B:
P ( A ∩ B ) = P ( A) • P ( B | A) = P ( B ) • P ( A | B )
E analogamente:
P( A1 ∩ A2 ∩ A3 ) = P( A1 ) • P( A2 | A1 ) • P ( A3 | A1 ∩ A2 )
Acontecimentos Independentes
A ideia que está por detrás do conceito de probabilidade condicional é de que a existência de informação
a respeito da ocorrência de certos acontecimentos em geral influencia a probabilidade da ocorrência de
outros acontecimentos. (Por exemplo: se existe informação de que a pessoa é fumador, a essa pessoa será
associada uma maior probabilidade de contracção de um tumor nos pulmões). Em geral, seria esperado
P ( A) ≠ P ( A | B )
P ( A1 ∩... ∩ An ) = P ( A1 ) • ... • P ( An )
Curiosidade:Tabulação Cruzada
Em muitos casos o investigador está interessado em associações entre variáveis categóricas. O caso mais
simples é a observação de duas variáveis binárias, ou seja, existem duas variáveis, cada uma com dois
resultados possíveis. Por exemplo, suponha que para um indivíduo seleccionado aleatoriamente foi
verificado se ele é ou não fumador e se tem ou não algum tumor. Seja A o resultado de que o indivíduo é
fumador e B o resultado de que tem um tumor. Pode-se construir espaços amostrais separados { A, A} e
{B, B} para cada uma das duas variáveis. Alternativamente pode-se construir o espaço amostral de
pares ordenados: Ω={( A, B ), ( A, B ), ( A, B ), ( A, B )} .
Ao colocar este tipo de dados numa tabela, ter-se-ia apenas que contar o número de indivíduos
correspondentes a cada um dos quatro resultados possíveis. Nenhuma informação é perdida com respeito
às duas variáveis porque é sempre possível obter frequências para ambas as categorias de cada variável
através da soma das duas categorias da outra variável. Por exemplo, para calcular o número de indivíduos
que têm tumor, somam-se todos aqueles que fumam e têm tumor ( A, B ) com todos aqueles que não
fumam e têm tumor ( A, B ) .
Se a informação for disposta numa matriz, onde cada linha e cada coluna tenham presentes as categorias
de cada variável , podemos chamar a essa matriz uma tabela cruzada
Total
Total
A estrutura desta tabela é particularmente útil para verificar a independência entre acontecimentos.
Recorde-se que a probabilidade conjunta de dois acontecimentos independentes pode ser calculada como
o produto das probabilidades de dois acontecimentos individuais. Neste caso, se quisermos verificar se a
probabilidade conjunta na parte principal da tabela é igual ao produto das probabilidades marginais,
conseguimos verificar a independência dos acontecimentos.
• Ai ≠ Ø (i=1,2,…,n)
• Ai ∩ A k = 0 (i ≠ k;i,k=1,2,…,n)
• A1 ∪ A2 ∪ ..... ∪ An = Ω
Seja A1 , A2 ,..., An uma decomposição disjunta. Então, para qualquer acontecimento B ⊂ Ω com
P(B)>0:
P( B ) = P( B ∩ A1 ) + P( B ∩ A2 ) + ... + P( B ∩ An )
= P ( B | A1 ) • P ( A1 ) + P ( B | A2 ) • P ( A2 ) + ... + P ( B | An ) • P ( An )
n
= ∑ P( B | Ai ) • P ( Ai )
i =1
Fórmula de Bayes
Seja A1,A2,A3,….,An uma decomposição disjunta. Então, para qualquer acontecimento B ⊂ Ω com
P(B)>0 e probabilidades condicionais dadas P ( B | A1 ), P ( B | A2 ),..., P ( B | An )
P( B | A j ) • P( A j )
P( A j | B) = n
, ∀j = 1,..., n
∑ P( B | A ) • P( A )
i =1
i i
4. Variável Aleatória
4.1 Definição
Definição:
Uma variável aleatória é uma função que associa números reais a resultados de uma experiência aleatória.
Cada resultado possível da experiência ocorre com determinada probabilidade. Tomemos a seguinte
notação:
X: variável aleatória
xi , (i =1,..., n) resultado da n-ésima experiência aleatória (são os valores da variável aleatória X)
Aj → X → X ( Aj )
No lançamento de uma moeda, os dois resultados possíveis são: cara (F) ou coroa (C).
Consideremos três lançamentos de uma moeda, e examinemos o número de faces obtidas.
Uma variável aleatória associa um número real (0,1,2,3) a cada elemento de Ωbaseado no número de
faces resultantes dos lançamentos.
Por exemplo:
Tal definição implica que os valores possíveis que a variável aleatória X pode assumir correspondem a
um dos quatro possíveis: x1 = 0; x2 = 1; x3 = 2; x4 = 3 .
Função Densidade4
Definição:
A função densidade f calcula a probabilidade da variável aleatória X ser igual a xi. A probabilidade de xi
é f(xi). Esta função deverá verificar as seguintes propriedades:
o P ( X = xi ) = f ( xi ); (i =1,2,...)
o f ( xi ) ≥ 0 ,
o ∑ f ( x ) =1 .
i
i
Função de Distribuição
Definição:
A função de distribuição F de uma variável aleatória X, calculada a cada realização de x é definida como
a probabilidade do valor da variável aleatória X não ser superior ou igual a x.
F ( x ) = P ( X ≤ x) = ∑ f ( xi )
xi ≤x
A função de distribuição de uma variável aleatória discreta é uma função crescente em forma de escada,
cujos acréscimos ocorrem somente nos incrementos de xi. Tal função é, portanto, constante entre os
pontos xi e xi+1.
o P ( a < X ≤ b) = F (b) − F ( a )
o P( X > a) =1 − F (a) .
Exemplo: Contagem do número de faces (F) resultantes de três lançamentos de uma moeda.
4
A função densidade nas variáveis aleatórias discretas também é chamada de função probabilidade.
F(1)=f(0)+f(1)=0.125+0.375=0.5
Função de distribuição:
0, x < 0
0.1 2 5;0 ≤ x < 1 Função de distribuição de uma variável aleatória discreta:
F ( x) = 0.5 0 0;1 ≤ x < 2
0.8 7 5;2 ≤ x < 3
1; x ≥ 3
b
o P (a < X ≤ b) = ∫ f ( x )dx ; a ≤ b
a
o f ( x) ≥ 0
+∞
o ∫ f (x) =1
−∞
Função Distribuição:
A função distribuição pode ser obtida a partir da função densidade:
x
F ( x ) = P (−∞ < X ≤ x ) = ∫ f (t )dt .
−∞
A função distribuição F(x) é equivalente à área sob a função densidade f(u) para −∞ <u ≤ x.
A função densidade, se existente, pode ser calculada como a primeira derivada da função distribuição :
∂F ( x)
= F ' ( x ) = f ( x) .
∂x
Exemplo:
Consideremos a função:
∞ 4 6
4 6
x2 x2
∫
−∞
f ( x) dx = ∫ (0.25 x − 0.5)dx +∫ ( −0.25 x +1.25 )dx =0.25
2 4 2
− 0.5 x + − 0.25
2 2
+1.5 x = 1
4
Isso indica que f(x) é uma função densidade. Em particular, é a densidade da distribuição triangular
(assim chamada devido à forma da função densidade, como se pode ver na figura abaixo).
4.5 Parâmetros
Uma variável aleatória é caracterizada completamente por sua densidade e função distribuição. Porém,
aspectos importantes da distribuição podem ser determinados a partir dos parâmetros de localização e
dispersão.
Valor Esperado
O valor esperado de uma variável aleatória X, E(X) ou µ ,corresponde à média aritmética de uma
distribuição de frequências empírica. O valor esperado é o “valor que se espera”, em média, como
resultado de uma experiência. Ao se repetir uma experiência várias vezes, o valor esperado E(X) será a
média de todos os resultados obtidos.
Definição:
Definição:
Numa variável aleatória contínua X, com função densidade f(x), o valor esperado é definido como
∞
E( X ) = µ = ∫ xf ( x)dx .
−∞
Sejam X e Y duas variáveis aleatórias com valor esperado E(X) e E(Y). Portanto:
• Se Z=X+Y, E(Z)=E(X+Y)=E/X)+E(Y)
Variância
Definição:
Variância, simbolizada por Var(X) ou σ 2 é definida como o valor esperado do quadrado da diferença
entre uma variável aleatória e seu valor esperado:
Var ( X ) = E[( X − E ( X )) 2 ] = E ( X 2 ) −[ E ( X )] 2
Var ( X ) = σ 2 = ∑[ xi − E ( X )] 2 f ( xi ) = ∑xi f ( xi ) −[ E ( X )] 2
2
i i
Propriedades da variância:
Var(Z)=Var(X)+Var(Y)
σ Z = σ X +Y = σ X2 + σ Y2
Desvio Padrão
O desvio padrão σ é definido como a raiz quadrada da variância e caracteriza a dispersão de uma
distribuição.
Estandardização (Padronização)
Por vezes, é útil transformar uma variável aleatória para se obter uma distribuição que não dependa de
nenhum parâmetro desconhecido. A variável aleatória padronizada
X − E( X )
Z =
σX
Desigualdade de Chebyshev
A desigualdade de Chebyshev fornece uma fronteira para a probabilidade de que uma variável aleatória
assuma valores em certo intervalo na vizinhança do valor esperado. A desigualdade somente requer o
conhecimento do valor esperado e da variância; a distribuição da variável aleatória não precisa ser
conhecida. A desigualdade se baseia no intervalo [ µ − kσ ; µ + kσ ] centrado em µ .
Definição:
Considere a variável aleatória X com valor esperado µ e variância σ . Para qualquer K>0,
1
P( µ − kσ ≤ X ≤ µ + kσ ) ≥ 1 −
k2
Para kσ = a , obtém-se
σ2
P( µ − a ≤ X ≤ µ + a) ≥ 1 − .
k2
σ2
P( X − µ > a ) < .
a2
Uma variável aleatória discreta que contém um certo número de sucessos A após n repetições desta
experiência, tem uma distribuição binomial com parâmetros n e p. Sua função densidade de probabilidade
será:
o , r e s t av n a t leo s r e s
Denota-se: X~B(n,p)
E(X)= n.p
Var(X)=np(1-p)
A distribuição binomial encontra-se tabelada no nosso livro de trabalho para valores de n ≤20 e p ≤ 0,5
(sendo que os valores de p iniciam em 0,05, sofrendo acréscimos de 0,05 até ao valor de p=0,5).
Conforme se tem verificado nas aulas, estas tabelas minimizam bastante o cálculo da probabilidade, no
entanto apresentam algumas limitações.
Exemplo 1:
Existem 10 bolas em uma caixa, onde 3 são brancas e 7 são vermelhas. Considere os acontecimentos:
P(A)=0.3 e P( A )=0.7. Após cada extracção, a bola é reposta na caixa. São seleccionadas 5 bolas no total
(n=5).
• As probabilidades associadas a cada resultado são constantes porque há reposição das bolas.
Queremos calcular a probabilidade de seleccionar duas bolas brancas, ou seja, P(X = 2).
Usando cinco repetições, obtemos a seguinte variável aleatória: X1,X2,X3,X4,X5, onde X= {nº de bolas
brancas em cinco extracções}.
X = ∑ X i . Então X~B(n;p)=B(5;0.3).
i
A tabela seguinte contém a densidade e a função de distribuição da distribuição binomial para esta
experiência:
x f ( x;5;0.3)F ( x;5;0.3)
0 0.1681 0.1681
1 0.3601 0.5282
2 0.3087 0.8369
3 0.1323 0.9692
4 0.0284 0.9976
5 0.0024 1.0000
Exemplo 2:
Foi dirigido um questionário aos estudantes de uma universidade do nosso país relativamente ao trabalho
em part-time. Sessenta e cinco por cento dos estudantes responderam ter um part time. Qual a
probabilidade de que pelo menos 4 em cada 8 estudantes desta universidade escolhidos aleatoriamente
tenham um emprego de part time?
O resultado desta experiência é a variável aleatória X ={número de estudantes com emprego de part
time}. Esta variável aleatória tem uma distribuição binomial: X~B(n;p)=B(8;0.65).
x f ( x;8;0.65 )f ( x;8;0.35 )
0 0.0002 0.0319
1 0.0036 0.1691
2 0.0253 0.4278
3 0.1061 0.7064
4 0.2936 0.8939
5 0.5722 0.9747
6 0.8309 0.9964
7 0.9681 0.9998
8 1.0000 1.0000
5.2Distribuição Hipergeométrica
A distribuição hipergeométrica é baseada numa experiência aleatória com as seguintes características:
• Dos N elementos, M possuem uma dada característica e N-M não possuem essa característica.
Ou seja, apenas são possíveis dois acontecimentos: A e A .
No entanto, a probabilidade P(A) não é constante de prova para prova e os acontecimentos não são
independentes. (essas alterações devem-se à não reposição dos elementos).
M N − M
x
n − x , p a r xa = m a x [n0- (, N- M ) ] , m.. . i, n [Mn ,]
f ( x; N ; M ; n) = N
n
0 , r e s t a n vt easl o r e s
M M M N −n
E( X ) = n ; Var ( X ) = n 1 −
N N N N −1
Exemplo 1:
Um estudante é avaliado num teste constituído por 10 questões. Sabe-se que das 10 questões existentes, 4
são de fácil resposta, enquanto que as restantes apresentam um nível de dificuldade bastante elevado. É
proposto ao estudante que apenas responda a três questões seleccionadas aleatoriamente. Qual é a
probabilidade do estudante seleccionar apenas questões fáceis?
N = 10 questões
M = 4 questões fáceis
N-M= 6 questões difíceis.
4 10 − 4
3
3 −3
f (3;10 ;4;3) = = 4.1 = 1
P(X=3)=
10 120 30
3
Qual é a probabilidade de que o estudante escolha pelo menos uma questão fácil?
P ( X ≥ 1) = 1 − P ( X < 1) = 1 − P ( X = 0) .
4 10 − 4
0
3 −0 1.20
= 1
P ( X = 0) = f (0;10 ;4;3) = =
10 120 6
3
Segue-se que:
P ( X ≥ 1) = 1 − P ( X < 1) = 1 − P ( X = 0) =1-1/6=5/6.
Exemplo 2:
Um agente de seguros sabe por experiência que 70% de seus 20 clientes renovam seus contractos. Foram
seleccionados aleatoriamente 4 clientes. Qual é a probabilidade de que, pelo menos metade dos clientes
seleccionados, venham a renovar os seus contratos?
Destes clientes, 14 (M) renovam suas apólices e N-M clientes não renovam. Assim, a experiência tem
apenas dois resultados possíveis. Como foram escolhidos 4 clientes aleatoriamente, não faz de todo
sentido modelar a variável aleatória recorrendo à reposição dos clientes.
A variável aleatória X é definida como ''número de clientes, dos 4 seleccionados aleatoriamente, que
renovam os seus contractos”.
14 20 −14
2
4 −2 91 .15
P ( X = 2) = f (2;20 ;14 ;4) = = = 0.2817
20 4845
4
14 20 −14
4
4 −4 1001 .1
P ( X = 4) = f ( 4;20 ;14 ;4) = = = 0.2066
20 4845
4
A probabilidade de que pelo menos metade dos quatro clientes seleccionados decida renovar suas
apólices é de 0.9391.
O Processo de Poisson
Suponha que se observa a ocorrência de certo acontecimento num determinado espaço contínuo, por
exemplo num intervalo de tempo:
Se estas condições (hipóteses) se verificarem para determinado fenómeno, então pode-se dizer que tal
fenómeno se adequa a uma distribuição de Poisson e poderá ser descrito através desta distribuição.”5
5
Retirado do livro adoptado, págs 206 e 207.
λ xe− λ
f ( x, λ ) = x! para x = 0,1,2,..., λ > 0
0 res tan tes valores
.
x λ xe− λ
∑ ; k ≥ 0; λ > 0
F ( x, λ ) = k = 0 x!
0; k < 0
O valor esperado e a variância da distribuição Poisson são respectivamente:
E ( X ) = Var ( X ) = λ
Exemplo:
Uma cidade tem 20.000 habitantes que precisam ser vacinados. A probabilidade de que a vacina
provoque uma reacção adversa em uma pessoa inoculada é de 0,0001.
Para obter as probabilidades de reacções adversas, a distribuição binomial pode ser usada. Entretanto, a
pequena probabilidade associada a um resultado e o grande número de tentativas sugerem que uma
distribuição Poisson poderia ser utilizada como uma aproximação, uma vez que n>30 e p ≤ 0,05 .
λ = np = 20000 * 0.0001 = 2 .Este é o número esperado de casos com reacções adversas. A função
densidade de probabilidade de X~ P (λ = 2) é representada abaixo:
A probabilidade de que ninguém sofra reacções adversas é P(X = 0) = P(X ≤0) = F(0) = 0.1353
A probabilidade de que uma pessoa tenha uma reacção ruim à vacinação é:
P(X =1) = P(X ≤ 1) - P(X ≤0) = F(1) - F(0) = 0.2707. A probabilidade de que mais de 4 pessoas
tenham efeitos adversos é: P(X > 4) = 1 - F(4)
Exemplo:
Suponha numa linha fabril, que uma determinada máquina reporta 2 defeitos, em média, por semana. Seja
t = número de intervalos com comprimento fixo (em semanas).
( 4) 0 −4
P (Y2 = 0) = f ( y 2 , λ) = e = 0.0183
0!
Em geral, a probabilidade de que nenhum defeito seja reportado em t semanas é dada por:
E(Y) = λt Y ~P( λt )
P (Y = 0) = e −λt
λ e− λ x p a xr≥ 0a λ ; > 0
f (x; λ ) = .
0 p a xr< a0
Simboliza-se por X~Exp (λ) . A sua função de distribuição é dada por:
1 − e − λ x p a xr≥ 0a λ ; > 0
F (x; λ ) =
0 p a xr< a0
O valor esperado e a variância de uma variável com distribuição exponencial é dada por:
1 1
E( X ) = ; Var(X) = .
λ λ2