Você está na página 1de 10

UNIVERSIDADE POLITÉCNICA

APOLITECNICA
Escola Superior de Gestão, Ciências e Tecnologias
Tema 2: Variáveis Aleatórias e Distribuições de Probabilidade
Probabilidade e Estatística Resumo teórico 2º Semestre de 2020

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS

Distribuição normal

Introdução

As variáveis com que trabalhamos até agora eram todas discretas e finitas mas, em muitos estudos estatísticos,
surgem variáveis contínuas: alturas ou pesos de uma população, rendimentos familiares num distrito, etc. Na prática,
para elaborar um estudo deste tipo agrupam-se os dados em classes e toma-se o valor central para representante da
classe. Em diferentes tipos de estudo é comum aparecer um histograma em que a curva que limita as classes assume
a forma de um “sino” a que se dá o nome de Curva Normal ou Curva de Gauss em honra ao matemático alemão Karl
Friedrich Gauss.

Características da Curva de Gauss:


a) É simétrica em relação ao seu valor médio;
b) A área compreendida entre a curva e o eixo das abcissa é igual a 1;
c) Tem dois pontos de inflexão;
d) É tanto mais achatada quanto maior for o desvio padrão.

É considerada a mais importante distribuição de probabilidade, sendo aplicada em inúmeros fenômenos e é utilizada
para o desenvolvimento teórico da estatística.

É também conhecida como distribuição de Gauss., Laplace ou Gauss-Laplace e possui a forma de um sino com a boca
voltada para baixo.

Dizemos que uma Variável Aleatória Contínua X tem uma distribuição Normal, se sua função de distribuição de
probabilidade ou de densidade for dada por:

1  x  2
1  . 
 
f ( x)  e 2 ,    x   . Onde:
 2
 = média da distribuição ;
 = desvio padrão da distribuição
 = 3,14159 .... e
e = 2,71828 ....

1
Gráfico da Função de Densidade de Probabilidade

ponto de máximo
  + 

3 2 1  1 2 3

Principais Características da Distribuição Normal

a) o ponto de máximo de f(x) é o ponto x = ;


b) os pontos de inflexão da função são x =   ;
c) a curva é simétrica em relação à x = ;
d) E (X) = e V (X) =2
1  x 2
  1  . 

 f ( x)    
Se f (x) é uma f.d.p.. então e 2 dx  1
   2

Calculando Probabilidades

Para calcular a probabilidade indicada na figura abaixo, devemos proceder:

a b X
1  x  2
1  . 
P ( a  X  b)  
b
 
.e 2  dx
a
 2
O que apresentaria grandes dificuldades, pois surgem dois grandes problemas:

1 – Para a integração de f (x) é necessário o desenvolvimento em séries de Fourrier;

2- Seria necessário a elaboração de uma tabela de probabilidades, pois f (x) depende de dois parâmetros, facto este
que acarretaria um enorme trabalho para tabelar essas probabilidades, considerando-se as várias combinações de  e
2.

Distribuição Normal Padrão

Dada às dificuldades matemáticas para o cálculo das probabilidades, lançamos mão da distribuição Normal Reduzida,
Distribuição Normal Padrão ou Normal (0,1) Seja X: N ( , 2)
2
Vamos definir uma variável aleatória Z, tal que: Z  f (X ) , ou seja X  e demonstra-se que: E (Z) =
Z 

0 V (Z) = 1. Portanto, Se X: N (, 2  Z~N ( 0,1).

Vejamos:
X 
E ( X   )  E ( X )  E (  )  (    )  0 
1 1 1
E (Z )  E  E (Z) = 0
     
 
  2 V ( X   )  2 V ( X )  V (  )  2   0   1 
 X  1 1 1 V (Z) = 1
V (Z )  V  2

     

2
z
1 
Logo a f.d.p. de Z será dada por f ( z)  e 2
2

Uma forma prática de apresentar a solução para esta equação é usar tabelas. A literatura apresenta uma tabela
contendo as probabilidades de uma distribuição normal específica, chamada de distribuição normal padrão. Esta
distribuição caracteriza uma variável aleatória normal padrão, chamada Z, representada por uma curva normal com
=0 e =1. Conseqüentemente,
z z2
1 
P( Z  z ) 

 2
e 2 dz

Valores tabelados da integral acima são dados em anexo. Por exemplo, a probabilidade de Z ser menor ou igual a 1.5
é igual a: P(Z  1.5)  (1.5)  0.9332

A probabilidade de Z<15 é também igual a 0.9332, uma vez que Z é uma variável contínua e a probabilidade de um
simples ponto é igual a zero neste caso. Assim, P(Z=1.5)=0.

A probabilidade de Z > 2 é: P(Z  2.0)  1  (2.0)  1  0.9772  0.0228

Gráfico de Z
φ (z)

0

Propriedades de Z

a) f (x) é simétrica em relação à x =  f (z) é simétrica em relação à z = 0


f (x) f (z)

50% 50% 50% 50%


x=μ z =0

3
b) f (x) possui um máximo para x =  e f (z) para z = 0
c) f (x) tende a “0” quando x tende para   ou  
d) f (x) tem dois pontos de inflexão cujas abscissas valem    ou f(z) possui dois
pontos de inflexão cujas abscissas valem  1.
f (X) f (z)

    X 1 0 +1 Z

Uso da Tabela

A tabela de faixa central é o tipo mais freqüentemente utilizado e fornece a área sob a curva normal padrão entre -∞
e qualquer valor de z.
A simetria em torno de z = 0, Ver figura abaixo que fornece a P(-∞  z  Z).

0 Z Z
Exemplos

1. Seja X~ N (100, 25). Calcular:


a) P (100  X  106) = P (0  Z  1,2) = ф(1,2) - ф(0) = 0,8849 – 0,5 = 0,3849

X 
 = 100 e  = 5  e Z . Logo,

Z1 = X1   / = X1  100 /5 = 100  100 /5 = 0  Z1= 0


Z2 = (X2   / = X2  106 /5 = 106  100 /5 =1,2  Z2 = 1,2

100 106 X 0 1,2 Z

b) P (89  X  106 = P2,2  Z  1,2 = ф(1,2) - ф(-2,2) = 0,8849 - 0,0139 =0,8710

Z1 = 89  100 5 =  2,2 e Z2 = 106  100 5 = 1,2


4
89 100 107 X  2,2 0 1,2 Z

c) P (112  X  116) = P ((112  100 5  Z  116100 /5) = P(2,4  Z  3,2) = ф(3,2) - ф(2,4)
P (112  X  116) = 1 - 0,9918 = 0,0018
d) P (X  108) = P (Z  1,6) = 1`- ф(1,6) = 1 – 0,9452 = 0,0548
2. Sendo X: N (50, 16) Determinar X  tal que:

a) P(X  X ) = 0,05  Dados   50 e  = 4

 = 0,05  = 0,05

50 X X 0 Z Z

Procurando 0,95 = (1 – 0,05) no corpo da tabela , encontramos Z  = 1,645.

X   X   50
Como Z    1,645 X   1,645 4  50  56,58
 4

b) P (X  X  = 0,99
0,99 0,99

0,01 0,01

50 X X 0 Z Z

Procurando na tabela a abscissa que corresponde á probabilidade de 0,99 (1 – 0,01), encontramos 2,33 ; ou seja Z
= 2,33.
X   X   50
Z     2,33 X   2,33  4  50  59,32
 4

Antes de resolver os exercícios da ficha abaixo, assista os vídeos dos links abaixos:

5
DISTRIBUIÇÕES AMOSTRAIS

Introdução

Considerem-se todas as amostras possíveis de tamanho “n’ que podem ser retiradas de uma população de tamanho
‘N” (com ou sem reposição). Para cada amostra pode-se calcular uma grandeza estatística, como a média, o desvio
padrão etc., que varia de amostra para amostra. Com os valores obtidos para determinada grandeza, podemos
construir uma distribuição de probabilidades, que será denominada de distribuição amostral. Para cada distribuição
amostral é possível calcular a sua esperança matemática, o seu desvio padrão, etc.

Distribuição amostral das médias

Queremos determinar qual é a distribuição amostral da média aritmética. Sabemos que a média aritmética
amostral é um estimador da média aritmética populacional. Como a média amostral é uma variável aleatória,
busca-se conhecer sua distribuição de probabilidade.

População: N elementos
X: Variável quantitativa
Amostra
Parâmetros:
(x1,x2,x3,..., xn)
 = V(X)
2
μ = E(X)

Estatísticas
x
 xi
X pode ser vista como uma variável aleatória,
se considerarmos a distribuição de frequências n
da população como uma distribuição de
s2 
 i  x)2
( x
probabilidades, a distribuição da população n 1

Parâmetro é uma medida usada para descrever uma característica da população.

Parâmetros são funções de valores populacionais, enquanto que estatísticas são funções de valores amostrais. Os símbolos mais comuns são:

Estatística População

Média X E(X) = 
Variância s2 2
Nº de elementos n N
Proporção p̂ P
_____________________________________

Se os valores da média e do desvio padrão de uma população, de tamanho N, forem respectivamente  e , e desta
população são retiradas todas as possíveis amostras de tamanho n, sem reposição, os valores esperados e do desvio
padrão da distribuição amostral das médias correspondente serão:
 N n
  
_
E ( x)   x
N 1
n
Se a população for infinita, ou se amostragem for tomada com reposição, os valores acima ficarão:

_
E ( x)  
6
 x

n
Teorema: Se (X,X
1 2,,X
n)for uma amostra aleatória simples da população X que tem distribuição normal

com média  e variância  finita. Então,


2
X~N(
2
, ).
n

Teorema Central do Limite: Para uma população não-normal com média  e variância  , a distribuição da média
2

amostral X para amostras de tamanho n suficientemente grande é aproximadamente normal com média  e
X 
variância  , isto é: Z 
2
~ N (0, 1)
n / n

Distribuição amostral das proporções

Se o valor da proporção de ocorrência de em evento em uma população, de tamanho N, for P, e desta população são
retiradas todas as possíveis amostras de tamanho n, sem reposição, os valores da expectância e do desvio padrão da
distribuição amostral das proporções correspondente serão:
P(1  P) N n
E ( pˆ )  P  p

n

N 1
Se a população for infinita, ou se amostragem for tomada com reposição, os valores acima ficarão:

E ( pˆ )  P P(1  P)
 pˆ

n
ERRO PADRÃO

O desvio padrão da distribuição amostral de uma grandeza estatística é freqüentemente denominado de seu erro
padrão

Então temos que:  x é chamado de erro padrão da média, e  p̂ é chamado de erro padrão da proporção.
Teorema limite central (ou teorema central do limite)

Em uma amostra aleatória simples com reposição de uma população arbitrária, com média  e variância  2 , a distribuição
de X , quando n é grande, é aproximadamente normal, com média  e variância  . Em outras palavras,
2

n
X 
Z é aproximadamente N (0,1)

n
Na prática, a aproximação é usada quando n  30, indiferente da forma da população amostrada.

Aplicação do teorema limite central


O teorema limite central tem muitos aspectos práticos úteis: se X é a média amostral, podemos calcular:
 
 
   
P ( a  X  b )  P 
a b
Z 
   
 
 n n 

7
Aproximadamente, usando tabelas da distribuição N (0,1), qualquer que seja a distribuição de X.

As distribuições de outras estatísticas, por exemplo, da proporção amostral p̂ (veja item 3.2), também podem ser
aproximadas pela distribuição normal, assumindo n grande.

Exemplo 1: Seja uma máquina de empacotamento de um determinado sal mineral, cujos pesos (em kg) seguem uma
distribuição N (50, 2). Assim, se a máquina estiver regulada, qual a probabilidade, colhendo-se uma amostra de 100 pacotes,
da média dessa amostra ( x ) diferir de 50 kg em menos de 0,2828 kg?
Solução:   50 e    2  2

P ( 49,7172 < X < 50,2828 ) = P ( 49,7172  50 X  50,2828  50


  )
2 / 10 / n 2 / 10
P( 49,7172  50 50,2828  50 = P(2  Z  2)   (2)   (2)  0,9544
 Z )
2 / 10 2 / 10

Onde  (2)  P(Z  2)  0 , 0 2 2 8 e  (2)  P(Z  2)  0 , 9 7 7 2

Por outro lado, pelo Teorema Limite Central, quando n é grande, a proporção amostral p̂ de sucessos em n
P(1  P)
ensaios de Bernoulli tem distribuição aproximadamente normal com média P e desvio padrão ; e
n
pˆ  P
Z é aproximadamente N (0, 1).
P(1  P)
n
Multiplicando-se o numerador e o denominador de Z por n e notando-se que n p̂  T , pode-se também escrever
T  np
Z ~ N (0, 1),
np q
que foi o estabelecido na aproximação normal à binomial.

Exemplo 2: Um lote 625 chips foram produzidos por uma fabrica de acessorios electrónicos que possui índice de
perfeição (p) de 70%. Qual a probabilidade de se encontrar mais de 72% (450) de chips perfeitos?
Solução: n = 625 p = 0,70

0,72  0,70
P( pˆ  0,72)  P( Z  )  P( Z  1,09)  1   (1,09)  1  P( Z  1,09)  1  0,8621  0,1379
0,70  0,30
625
450  437,5
Ou P(T  450)  P( Z  )  P( Z  1,09)  0,1379
0,7  0,30  625

https://www.youtube.com/watch?v=3P6rEQM3nKc

https://www.youtube.com/watch?v=i6mUb252t-Q

https://www.youtube.com/watch?v=gWDjdP_dFf4

https://www.youtube.com/watch?v=ec9HWoY2kt8
8
Ficha de Exercícios Nº 4
__________________________________________________________________________________________________
1. Determinar a área (probabilidade) limitada pela curva normal padrão ( Seja Z ~ N(0,1)) em cada um dos casos abaixo.
a) P( Z > –1,28)
b) P(Z <2,62)
c) P(Z > 1,45)
d) P( 0 < Z < 1,2)
e) P(-1,96 < Z< -1,65)
f) P(-1,5 <Z <2,5)

2. Dada a distribuição normal N(10,25), calcular as probabilidades:


a) P( X > 4);
c) P( 5  X  15);
d) P(0  X  20).

3. Considerando que o peso de determinado artigo produzido por uma fábrica seja normalmente distribuído com
média de 20 gramas e variância de 16 gramas, determine a probabilidade de que uma unidade, selecionada ao
acaso, tenha peso: a) entre 16 e 22 gramas; b) entre 22 e 25 gramas; c) maior que 23 gramas.

4. Suponha que as notas em certa disciplina estão normalmente distribuídas com média 5,0 e desvio padrão 1,5.
a) determine o percentual de estudantes com nota superior a 8,0;
b) se a nota mínima para obter aprovação é 3,0, determine o percentual de estudantes reprovados;

5. Suponha que a renda de uma comunidade possa ser razoavelmente aproximada por uma distribuição normal
com média de $1500 e desvio padrão de $300.
a) Que percentagem da população terá renda superior a $1860?
b) Numa amostra de 50 pessoas dessa comunidade, quantos podemos esperar com renda inferior a
$1050?

6. Uma variável aleatória tem média μ(x)=15 e desvio padrão (x) = 4. Calcule P(14  x  15,5) , onde x é a
média de uma amostra aleatória de 64 elementos, retirada desta população.

7. Coleta-se uma amostra de 9 observações independentes de uma distribuição normal com média 2 e variância 4.
Determine a probabilidade de a média amostral:
a) Ser inferior a 1;
b) Ser superior a 2,5;
c) Estar entre 0 e 2.

8. Supõe-se que o consumo mensal de água por residência em certo bairro da cidade de Maputo tem distribuição Normal
com média 10 e desvio padrão 2 (em m3). Para uma amostra de 25 dessas residências, qual é a probabilidade de a
média amostral ser inferior a 9 m3.

9. A Cerveja de Moçambique relatou que 76% dos consumidores não lêem os ingredientes relacionados no rótulo dos
seus produtos. Uma amostra de 400 consumidores é selecionada à partir desta população. Calcule a probabilidade:
a) de que a proporção amostral seja superior a 80%?
b) de que menos de 75% dos consumidores amostrados não lêem o rótulo?

10. Tendo em mente estimar a proporção de alunos de um determinado "Campus" universitário que eram favoráveis à
revisão curricular, um estudo passado constatou que 57% dos era de facto favoráveis à revisão curricular.
Calcule a probabilidade de:
a) numa amostra de 49 alunos, menos de 49% sejam favoráveis à revisão curricular.
b) numa amostra de 36 alunos, mais de 55% sejam favoráveis à revisão curricular.

9
10

Você também pode gostar