Escolar Documentos
Profissional Documentos
Cultura Documentos
DEFINIÇÃO 4.1
Uma variável aleatória é uma variável que assume valores numéricos associados
com os resultados aleatórios de um experimento onde é atribuído um (e único) valor
numérico a cada ponto amostral. Sejam Ω espaço amostral de um experimento
aleatório E ω ∈ Ω um de seus resultados. Se
X:Ω ⟶ R
ω ↦ X(ω)
dizemos que X é variável aleatória (v.a.).
DEFINIÇÃO 4.2
O conjunto de todos os possíveis valores que uma variável aleatória X pode assumir
é denominado imagem de X e denotado por Im(X).
Temos que:
Im(X1) = {0, 1, 2};
Im(X2) = {1, 2, 3, ... };
Im(X3) = {X: 0 ≤ X ≤ 1} = [0,1];
Há diferenças entre Im(X1), Im(X2) e Im(X3):
Im(X1) é um conjunto finito;
Im(X2) é um conjunto infinito contável (ou enumerável);
Im(X3) é um conjunto infinito não contável (ou não enumerável)
O termo variável aleatória é mais significante que o termo variável porque o adjetivo
aleatório indica que o experimento de lançamento de moedas pode resultar em um
dos vários possíveis valores da variável —0, 1, e 2 — de acordo com o resultado
aleatório do experimento, HH, HT, TH, e TT. Assim, os possíveis valores da variável
aleatória variam de 0 até o número máximo de clientes que o banco detém na sua
base.
EXEMPLOS
O tempo que um projétil gasta para retornar à Terra ⟶ contínua
O número de vezes que um transistor em uma memória de computador muda de
estado em uma operação ⟶ discreta
O volume de gasolina que é perdido por evaporação, durante o enchimento de um
tanque de gasolina ⟶ contínua
O diâmetro de externo de um eixo usinado ⟶ contínua
O número de fraturas que excedem meia polegada em 10 milhas de uma auto
estrada interestadual ⟶ discreta
O peso de uma peça plástica moldada por injeção ⟶ contínua
O número de moléculas em uma amostra de gás ⟶ discreta
A concentração de saída de um reator ⟶ contínua
A corrente em um circuito elétrico ⟶ contínua
DEFINIÇÃO 4.4
Variáveis aleatórias que podem assumir valores que correspondem a quaisquer
pontos contidos em um ou mais intervalos são chamadas contínuas. Dizemos que
uma variável aleatória X é contínua se Im(X) é um conjunto não-enumerável.
EXEMPLO
Como a distribuição de probabilidade para uma variável aleatória discreta está
concentrada a pontos específicos (valores de x), o gráfico na Figura 4.3a representa
as probabilidades como as alturas de linhas verticais em cima dos valores
correspondentes de x. Embora a representação da distribuição de probabilidade
como um histograma, como na Figura 4.3b, é menos precisa (desde que a
probabilidade é espalhada em cima de um intervalo de unidade). Nós também
poderíamos apresentar a distribuição de probabilidade para x como uma fórmula.
Daremos as fórmulas para as distribuições de probabilidade de algumas variáveis
aleatórias discretas comuns posteriormente neste capítulo.
DEFINIÇÃO 4.5
A distribuição de probabilidade de uma variável aleatória discreta é um gráfico,
tabela ou fórmula que especifica as probabilidades associadas com cada possível
valor que a variável aleatória pode assumir.
DEFINIÇÃO 4.6
Sejam X v.a. discreta com imagem Im(X) e Ax, x ∈ Im(X), a partição de Ω induzida
pelos possíveis valores de X. A função de probabilidade (f.p.) de X é definida por
Px(x) = P(X = x) = P(Ax), x ∈ Im(X).
Duas exigências devem ser satisfeitas por todas as funções de probabilidade para
variáveis aleatórias discretas.
DEFINIÇÃO 4.5
O valor esperado é a média da distribuição de probabilidade ou uma medida de sua
tendência central. Você pode pensar como o valor da média de x em um número
muito grande (de fato, infinito) de repetições do experimento. Embora exista
semelhança entre a média aritmética e E(X), a diferença é que E(X) é caracterizada
como parâmetro associado a uma distribuição de probabilidade teórica.
Obs:
1) A moda representa valores possíveis da v.a.
2) Pode ser usada diretamente em variáveis de qualquer tipo de mensuração,
inclusive a nominal (variável qualitativa)
3) Pode não existir ou ter muitos valores modais.
Obs:
1) Pode ser manipulada algebricamente
2) Valores não são facilmente interpretados
3) Possui a unidade da v.a. ao quadrado (Ex.: X em metros, σ^2 será em metros
quadrados).
Desvio Padrão
Coeficiente de Variação
Quando duas ou mais variáveis são comparadas quanto a sua dispersão, a variância
(ou o desvio padrão) não pode ser utilizada se estas variáveis possuírem diferentes
unidades. Exemplo: X é altura (m) e Y é biomassa (kg).
Obs:
1) Mede a variação relativa à média
2) Adimensional
3) Pode ser expresso em porcentagem (mas pode ter valores maiores que 100%)
4) Não pode ser utilizado quando μ = 0
Conhecendo a média e o desvio padrão da distribuição de probabilidade de x, junto
com a Regra de Chebyshev (Tabela 2.7) e a Regra Empírica (Tabela 2.8), nós
podemos fazer declarações sobre a probabilidade que avalia se x cairá dentro dos
intervalos μ ± σ, μ ± 2σ e μ ± 3σ. Estas probabilidades são determinadas na caixa.
EXEMPLO
mostrado no gráfico. Note particularmente que localiza-se no centro da distribuição
de probabilidade. Considerando-se que esta distribuição é uma distribuição teórica
de frequência relativa que tem moderadamente a forma de sino (veja Figura 4.6),
nós esperamos pelo menos 75% (da Regra de Chebyshev) e, mais provável,
aproximadamente 95% das observações de x (da Regra Empírica) estarem no
intervalo — quer dizer, entre 1,46 e 5,54 —pode-se observar da Figura 4.6 que a
probabilidade que x estar no intervalo inclui a soma de p(x) para os valores x = 2, x =
3, x = 4 e x = 5. Esta probabilidade é p(2) + p(3) + p(4) + p(5) = 0,132 + 0,309 +
0,360 + 0,168 = 0,969. Esta porcentagem 96,9% são consistente com ambas as
Regras (de Chebyshev e Empírica).
REGRA EMPÍRICA DA AMPLITUDE
Uma regra que auxilia na interpretação do valor de um desvio padrão é a regra
empírica, aplicável somente a conjuntos de dados aproximadamente em forma de
sino, também conhecida como distribuição Normal ou de Gauss. (figura abaixo).
Essa figura mostra como a média e o desvio padrão estão relacionados com a
proporção dos dados que se enquadram em determinados limites. Assim é que, com
uma distribuição em forma de sino, temos 95% dos seus valores a menos de dois
desvios padrão da média. A regra empírica costuma a ser designada
abreviadamente como a regra 68 – 95 - 99. De acordo com a regra 68-95-99 temos
que:
TEOREMA DE CHEBYSHEV
DISTRIBUIÇÕES CONJUNTAS
Vamos analisar agora a distribuição conjunta de 2 dessas variáveis, ou seja,
queremos analisar, por exemplo, a probabilidade de X ser igual a 1 e Y ser igual a 0,
simultaneamente. Vamos calcular essas probabilidades e apresentá-las em forma de
tabela de dupla entrada.
Analisando simultaneamente as três variáveis, temos:
DISTRIBUIÇÕES MARGINAIS
DISTRIBUIÇÕES CONDICIONAIS
A partir da distribuição conjunta de (X,Y) pode-se obter a distribuição condicional de
X, ou seja, a probabilidade condicional de cada valor de X, condicionada a um
determinado valor de Y . Aplicando a definição de probabilidade condicional, temos
que:
Sendo uma distribuição de probabilidades, podemos calcular sua esperança e sua
variância:
ou então:
PROPRIEDADES DA COVARIÂNCIA
EXEMPLO