Você está na página 1de 30

PROBABILIDADES CONJUNTAS

ANÁLISE DA ESPERANÇA E DA
VARIÂNCIA
Autor(a): Dra. Mariza Akiko Utida

Revisor: Fábio Santiago

Tempo de leitura do conteúdo estimado em 1 hora e 18 minutos.


Introdução
Prezado(a) estudante!

Neste material, você irá aprender a analisar e a aplicar os procedimentos envolvendo o conceito e
as propriedades da esperança e da variância.

Você já parou para pensar como conseguimos medir a pressão sanguínea? Ou como se calcula a
vida útil de uma televisão de plasma? Ou, ainda, qual o lucro médio por conjunto (conjunto do quê?)
montado que espero conseguir? A resposta (para essas perguntas) está no estudo das medidas
para as distribuições , que utilizam muitos conjuntos de medidas na natureza, na indústria e nos
negócios . As variáveis aleatórias conjuntas representam as quantidades de notificações diárias de
incidentes de segurança em duas redes de computador.

Neste material, estudaremos as medidas da distribuição de probabilidade conjunta para a análise


de probabilidade : ( esperança e variância conjunta ).

Bons estudos!

Propriedades da
Esperança
Conjunta

Estudante, agora, vamos aprender a estrutura de medidas que proporciona expressar um conjunto
de dados referentes à observação de um determinado fenômeno.
O conceito mais conhecido é a média ponderada dos
possíveis valores que a variável aleatória pode receber,
também denominado de valor esperado ou esperança ,
isto é, as medidas de posição ou medidas que tendem
a centralizar, representando, assim, os fenômenos
através de seus valores médios , em torno dos quais
tendem a concentrar-se os dados. Um conceito
importante da probabilidade é o valor esperado de uma
variável aleatória.
Fonte: Maxim Evseev / 123RF.

Segundo Ross (2010, p. 161) “Seja uma variável aleatória X = x1 , x2 , … , xn com suas
respectivas probabilidades p(x1 ), p(x2 ), … , p(xn ), então a esperança, ou o valor esperado de X
representada por E(X), é definida por:

n
E (X) = ∑
i=1
”.
xi p (xi )

A definição de esperança é apresentada pela interpretação da probabilidade considerando a


realização de um experimento de uma sequência infinita de repetições independentes. O valor
esperado de X é uma média ponderada dos possíveis valores que X pode apresentar.

Matematicamente, a definição da esperança é uma medida utilizada para descrever uma


característica de uma população e para uma melhor representação quando precisa determinar a
distribuição de probabilidade de uma variável aleatória . De maneira geral, a distribuição de
probabilidade de uma variável aleatória é definida pela tabela abaixo.

xi x1 x2 ... xn Total

Pxi Px1 Px2 ... Pxn 1

Tabela 2.1 - Distribuição de probabilidade de uma variável aleatória


Fonte: Elaborada pela autora.

#PraCegoVer : na tabela, temos, na primeira linha, a demonstração dos valores das variáveis
aleatórias unidimensional xi ; na segunda linha, a probabilidade de ocorrer cada caso,
somando em um total de um inteiro, o que equivale a 100%.

Estudante, vamos ajudá-lo a entender melhor, utilizando um exemplo: um jogador lança duas
moedas no jogo cara ou coroa, ganhando R$ 2,00 se ocorrerem duas caras e R$ 1,00 se ocorrerem
uma cara. Por outro lado, ele perde R$ 3,00 se nenhuma cara ocorrer. Encontre o valor esperado E
do jogo , ou seja, quanto se espera que o jogador ganhe.

Vamos à solução, caro (a) estudante?

Inicialmente, deve-se construir o espaço amostral, temos S = KK, KC, CK, CC , em que K é a
face cara da moeda, C é a face coroa da moeda e a cada amostra tem a probabilidade de ocorrer de
0,25 (tem-se, nesse caso, quatro resultados como apresentado em S = KK, KC, CK, CC ,
possibilitando a probabilidade de ocorrência em cada caso em

P (xi ) =
1

4
= 0, 25) , ou seja, melhor apresentado na tabela a seguir.

xi 2 1 −3

1 2 1
P (xi )
4 4 4

Tabela 2.2 - Probabilidade de a face “cara” da moeda ocorrer


Fonte: Elaborado pela autora.

#PraCegoVer : na tabela, temos os valores das variáveis aleatórias xi , o número dois indica
X(KK) = R$2, 00 , o número um X(KC) = X(CK) = R$1, 00 e no número -3 temos
que X(CC) = R$ − 3, 00. O valor de P (xi ) , ou seja, a probabilidade de ocorrer cara ou

coroa, é 0,25 cada evento.

k
Logo, a esperança esperada determinada pela equação E (X) = ∑
i=1
xi p i , temos:

k
1 2 1 1
E(X) = ∑ xi p i = 2 ( ) + 1( ) − 3( ) = ( ) = 0, 25
4 4 4 4
i=1

Como a esperança é maior que zero , a probabilidade de o jogador obter um saldo positivo é de
25%.

Agora, prezado(a) estudante, vamos expandir o estudo para as condições de duas ou mais variáveis
aleatórias . As informações empregadas em um conjunto de dados, referentes aos dados inteiros
ou parte dos dados de uma população, na maior parte dos casos, contêm observações
multidimensionais, ou seja, observações relacionadas a várias variáveis . Por exemplo, em um
estudo de caso aplicado a alunos de uma universidade, podemos obter a idade, o tamanho da
família e o número de disciplinas já cursadas. Como pode haver repetição de valores, os resultados
podem ser organizados em uma tabela, com os possíveis pares associados às suas respectivas
frequências .

SAIBA MAIS

“O desenvolvimento da Probabilidade tem grande impulso em 1657, com a publicação do primeiro tratado
formal sobre probabilidades escrito pelo físico, geômetra e astrônomo holandês Christian Hygens. A esse
estudo deve-se o conceito de esperança matemática de grande relevância para o Cálculo de
Probabilidades e Estatística. Depois disso, apenas em 1713, foi publicado postumamente o primeiro livro
inteiramente dedicado à teoria das probabilidades de autoria de Jakob Bernoulli (1654-1705).”

Para saber mais sobre o desenvolvimento da probabilidade, acesse o link :

https://www.ime.unicamp.br/erpm2005/anais/m_cur/mc02_b.pdf
Fonte: Lopes e Meirelles (2005, p. 1).

É possível apresentar um resultado para variáveis aleatórias bidimensionais, análogo a variáveis


aleatórias unidimensionais, em que é obtido para a função h(X, Y ) de duas variáveis aleatórias de
distribuição conjunta, apresentada na definição abaixo.

Para variáveis aleatórias de distribuição discreta , de acordo com Devore (2011, p. 191), temos que:

Sejam X e Y as variáveis aleatórias de distribuição conjunta com funções


respectivamente dadas por p(x, y) e f(x, y), conforme as variáveis discretas. Então, o
valor esperado de uma função h(x, y) , representada por E[h(X, Y )] , é dado pela
equação: E [h(X, Y )] = ∑x ∑y h(x, y) ⋅ p(x, y).

Para variáveis aleatórias de distribuição contínua , segundo Devore (2011, p. 191), temos que:

Sejam X e Y as variáveis aleatórias de distribuição conjunta com funções


respectivamente dadas por p(x, y) e f(x, y), conforme as variáveis contínuas. Então, o
valor esperado de uma função h(x, y) , representada por E[h(X, Y )] , é dado pela
+∞ +∞

equação: E [h(X, Y )] = ∫ ∫ h(x, y) ⋅ f(x, y)dx dy .


−∞ −∞

Ainda, Devore (2011, p. 191) afirma que:

Sejam X e Y as variáveis aleatórias de distribuição conjunta com funções


respectivamente dadas por p(x, y) e f(x, y), conforme as variáveis sejam discretas ou
contínuas. Então, o valor esperado de uma função h(x, y) , representada por
E[h(X, Y )] ou μh (x, y), é dado pela equação:

E[h(X, Y )] =

∑ ∑ h (x, y) . p (x, y) se X e Y forem discretos


x y
{
+∞ +∞
∫ ∫ h (x, y) . f (x, y) dx dy se X e Y forem cont í nuos
−∞ −∞

Segundo Meyer (1984, p. 149),

seja uma variável aleatória bidimensional (X, Y ) e uma função real definida por
Z = H(X, Y ).

• Para as variáveis aleatórias discreta e se p (xi , yj ) = P (X = xi , Y = yj ), com


i, j = 1, 2, . temos que a esperança será:
∞ ∞
E (Z) = ∑ ∑ H (x i , y j ) p (x i , y j ) .
j=1 i=1

• Para as variáveis aleatórias contínua com a função de densidade f (x, y) , o valor da


+∞
+∞
esperança é definido pela equação: E (Z) = ∫
−∞
∫ H (x, y) f (x, y) dx dy .
−∞

Veremos, agora, caro(a) estudante, algumas propriedades importantes do cálculo do valor esperado
de uma variável aleatória . Em cada caso, admitimos que todos os valores esperados mencionados
existem.
Propriedade 1 . Se X = c , sendo c uma constante de número real, então, E(X) = c . De fato, se X
é uma variável aleatória discreta, temos que:

E (X) = ∑ xi P (X = xi ) = cP (X = c) = c.1 = c

i=1

Como o somatório de todos os elementos da probabilidade, por definição, é 1, ∑i=1 p (xi ) = 1

Propriedade 2 . Seja (X, Y ) uma variável aleatória e c uma constante real. Então,
E(cX) = cE(X).

Sendo assim, para o caso discreto, temos que: E(cX) = ∑


i=1
c xi P (X = xi ) == cE(X) .

Para o caso contínuo, temos que:


+∞ +∞
E (cX) = ∫
−∞
c x f (x) dx = c ∫
−∞
x f (x) dx = c E (X) .

Propriedade 3 . Considere uma variável aleatória bidimensional (X,Y) com uma distribuição de
probabilidade conjunta: E(X + Y ) = E(X) + E(Y ) .

No caso discreto, consideramos p(x, y) a probabilidade: seja H1 (X, Y ) = X e H2 (X, Y ) = Y

E(X + Y ) = ∑ ∑(xi + yj )p(xi , yj )

j=1 i=1

Para o caso contínuo, temos: seja (X,Y) variáveis aleatórias contínuas, consideramos
H1 (X, Y ) = X e H2 (X, Y ) = Y e f(x,y) a função densidade de probabilidade conjunta.

+∞ +∞

E (X + Y ) = ∫ ∫ [H1 (x, y) + H2 (x, y)] f (x, y) dx dy

−∞ −∞

+∞ +∞ +∞ +∞

= ∫ ∫ H1 (x, y) f (x, y) dx dy + ∫ ∫ H2 (x, y) f (x, y) dx dy

−∞ −∞ −∞ −∞

= E (X) + E (Y )

Propriedade 4 . Sejam n variáveis aleatórias X1 , … , Xn . Então,


E(X1 + X2 + ⋯ + Xn ) = E(X1 ) + E(X2 ) + ⋯ + E(Xn ) .

Propriedade 5 . Sejam as variáveis aleatórias independentes (X,Y), temos: E(XY ) = E(X)E(Y ) .

Para variáveis aleatórias discretas:


E (XY ) = ∑ ∑ xi y p (xi , y ) = ∑ ∑ xi y p (xi ) p (y ) = ∑ xi p (xi ) ∑
j=1 i=1 j j j=1 i=1 j j i=1 j=

Para variáveis aleatórias contínuas:


+∞ +∞ +∞ +∞
E (XY ) = ∫ ∫ xy f (x, y) dx dy = ∫ x g (x, y) dx ∫ y h (x, y) dy = E (X) E (Y )
−∞ −∞ −∞ −∞

O resultado válido afirma que a independência de X e Y implica o valor esperado do produto XY ser
igual ao produto de duas variáveis. Ou seja, é o produto dos valores esperados. Logo:
E(XY ) = E(X)E(Y ) .

Vejamos, agora, um exemplo com variável aleatória discreta .

cinco amigos compraram ingressos para um determinado show. Se os ingressos forem


dos lugares de 1 a 5 em certa fileira, e os ingressos forem distribuídos aleatoriamente
entre os cinco, qual é o número esperado de assentos que separam quaisquer dois dos
cinco?
Sejam X e Y os números dos lugares da primeira e da segunda pessoas,
respectivamente. Possíveis pares de (X,Y) são (1, 2), (1, 3), … , (5, 4), e a função
1
x = 1, … , 5; y = 1, … , 5; x ≠ y
conjunta de p (x, y) = {
20
. O número
0 caso contrário

de lugares que separam as duas pessoas é h(X, Y ) = |X − Y | − 1 . A tabela a


seguir apresenta cada resultado (DEVORE, 2011, p. 192).

h(x, y) x

1 2 3 4 5

1 - 0 1 2 3

2 0 - 0 1 2

y 3 1 0 - 0 1

4 2 1 0 - 0

5 3 2 1 0 -

Tabela 2.3 - Tabela de probabilidade distribuídas aleatoriamente entre os cinco elementos


Fonte: Adaptada de Devore (2011, p. 192).

#PraCegoVer : na tabela, temos os valores das variáveis aleatórias bidimensional discreta, em


que é a probabilidade da função em relação ao número de lugares que separam as duas
pessoas. Apresentando os possíveis lugares em pares de cinco pessoas, por isso, nos lugares
iguais, não se faz par consigo mesmo.

Logo, estudante, a esperança é determinada por:


5 5 1
E [h (X, Y )] = ∑ ∑ h (x, y) . p (x, y) = ∑ ∑ (|x − y| − 1) . = 1
x y x=1 y=1 20

Vejamos, agora, como podemos assimilar a definição da esperança de uma variável aleatória
contínua . Para isso, um exemplo prático é necessário.

Observe esse exemplo com variável aleatória contínua unidimensional : o ponteiro dos segundos
de um relógio elétrico move-se continuamente, varre uma volta como sendo representado pela
variável aleatória contínua indicada por X . Existe a probabilidade de vários pontos que o ponteiro
dos segundos do relógio pode indicar, desde que esteja entre zero e 360 graus que esse ponteiro
forma com o eixo, como passar pelo centro do mostrador e pelo número XII , conforme
apresentado na Figura 2.1. Determine o valor esperado do relógio elétrico.

Observe a figura a seguir.


Figura 2.1 - Relógio elétrico apresentando os ângulos
Fonte: Bussab e Moretin (2018, p. 163).

#PraCegoVer : o relógio mostra a divisão em quatro partes em números romanos III, V I, IX, XII e
em ângulos de zero a 360 graus (0,360°). O ponteiro maior está em zero, sendo representado pelo número
romano XII . O ponteiro menor é representado pelo número romano V I , ou ângulo de 180 graus. Por fim,
o ponteiro dos segundos do relógio está próximo a 90 graus e forma um ângulo x próximo ao número
romano III .

Solução:

Considerando, caro(a) estudante, o problema com um relógio elétrico, observamos que o conjunto
dos possíveis valores de X é um conjunto continuo de valores, pois X pode assumir qualquer valor
do intervalo {0, 360°} = {xϵR : 0 ≤ x ≤ 360°}.

Pela definição de variáveis aleatórias contínua unidimensional, temos:


2 2
+∞ 360
.
1 1 x 360 1 360
E (X) = ∫ x f (x) dx = ∫ x dx = / = ( − 0) = 180
−∞ 0 360 360 2 0 360 2

Portanto, E(X) = 180.

Fonte: ismagilov / 123RF.

Agora, veja um exemplo com duas variáveis aleatórias contínuas :


uma empresa comercializa latas luxuosas de nozes mistas com amêndoas,
castanhas de caju e amendoins. Suponha que o peso líquido de cada lata seja
exatamente 1 (Kg), mas que a contribuição do peso de casa tipo de noz seja
aleatória. Como os três pesos devem somar 1 , um modelo de probabilidade
conjunta para quaisquer dois fornece todas as informações necessárias sobre o
peso do terceiro tipo.

Fonte: Devore (2011, p. 183).

Sejam X o peso das amêndoas em uma lata selecionada e Y o peso das castanhas de caju, então, a
região de densidade positiva é D={(x,y):0≤x≤1,0≤y≤1,x+y≤1}. Considerando a função densidade de
probabilidade conjunta de X e Y, se 1 kg de amêndoas custar para a empresa R$ 1,00, 1 kg de
castanhas de caju custar R$ 1,50 e 1 kg de amendoim custar R$ 0,50, teremos:

24 xy 0 ≤ x ≤ 1, 0 ≤ y ≤ 1, x + y ≤ 1
f (x, y) = {
0 caso contrario

A região de densidade positiva D = (x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1, x + y ≤ 1 é apresentada na


figura.

Figura 2.2 - Região de densidade positiva D = (x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1, x + y ≤ 1

Fonte: Devore (2011, p. 183).

#PraCegoVer : a figura apresenta um gráfico no plano cartesiano X e Y , para valores de x e y maior que
zero e menor que 1, em relação à equação x + y ≤ 1 .

Devemos determinar o custo total esperado de uma lata (valor esperado).

Solução :
Pela definição da esperança conjunta de uma variável contínua aleatória bidimensional, temos:

+∞ +∞

E [h (X, Y )] = ∫ ∫ h (x, y) . f (x, y) dx dy se X e Y forem cont í nuos

−∞ −∞

Logo, estudante, utilizando a equação acima, temos f(x, y) = 24xy e como


X = amendoas, Y = castanhasdecaju e o amendoim sendo, segundo o gráfico,
y = 1 − x ⇒ 1 − x − y = 0 .

Portanto,
h(x, y) = 1x + (1, 5)y + (0, 5)(1 − x − y) = 0, 5 + 0, 5x + y ⇒ h(x, y) = 0, 5 + 0, 5x + y .

Sendo assim, a equação h(x, y) = 0, 5 + 0, 5x + y consiste no peso do amendoim. O custo total


esperado é:

+∞ +∞ 1 1−x

E [h (X, Y )] = ∫ ∫ h (x, y) . f (x, y) dx dy = ∫ ∫ (0, 5 + 0, 5x + y). 24 x y dy dx

−∞ −∞ 0 0

1 1−x

2 2
= ∫ ∫ (12xy + 12 x y + 24xy ) dy dx

0 0

2 1−x 2 2 1−x 3 1−x


= ∫ [6x y | + 6x y | + 8x y | ] dx
0 0 0

1 1

2 2 2 3 2 3 4
= ∫ [6x (1 − x) + 6x (1 − x) + 8y (1 − x) ] dx = ∫ (14x − 30x + 18x − 2x ) dx

0 0

2 1 3 1 4 1 5 1
= 7x | − 10x | + 4, 5 x | − 0, 4 x | = 1, 10
0 0 0 0

Por fim, o método para determinar o valor esperado do custo total esperado do peso do amendoim
é R$ 1,10.

Agora, caro(a) estudante, vamos colocar em prática tudo que aprendemos até aqui, resolvendo a
atividade a seguir. Vamos lá?

Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)

Você ganhou uma disputa e o seu prêmio está em um entre três envelopes. Você deve selecionar
um deles e ficar com o que houver nele. Dois envelopes contêm um cheque de R$ 30,00, mas o
terceiro envelope contém um cheque de R$ 3.000,00. Qual é o valor esperado dos ganhos E dos
seus ganhos, como distribuição de probabilidades?

Temos que o espaço amostral é S = 30, 30, 3000 , em que X = 30 ou 3000 .

Observe a tabela a seguir.

xi 30 3000

2 1
P (xi )
3 3

Tabela - Probabilidade de cada prêmio ocorrer


Fonte: Elaborada pela autora.

#PraCegoVer : na tabela, temos os valores das variáveis aleatórias x_i, os envelopes


com os valores dos prêmios em que o número 30 indica X(30) = R$30, 00 e o
número 3000 indica a variável aleatória X(3000) = R$3000, 00 . Na segunda linha
é apresentada a probabilidade de escolher algum dos três envelopes indicado por
P (xi ) , sendo o valor de cada probabilidade de 1

3
cada evento.

Assinale a alternativa correta, a qual indica o valor correto da expectância dos três envelopes de
prêmios ganhos.

a) A expectância ou o valor esperado é E(X) = 1020.


b) A expectância ou o valor esperado é E(X) = 1200.
c) A expectância ou o valor esperado é E(X) = 1220.
d) A expectância ou o valor esperado é E(X) = 1000.
e) A expectância ou o valor esperado é E(X) = 1120.

Conceito de Variância
Aplicado à
Distribuição Conjunta de
Probabilidades
Prezado(a) estudante, vamos seguir a nossa jornada de estudos? Observe que outra medida da
distribuição de probabilidade conjunta para a análise de probabilidade é a variância que depende do
cálculo da esperança, sendo muito necessária para determinar a variação em torno da média , visto
que é a medida que quantifica a dispersão. Trata-se de uma medida relativa de dispersão , útil para
a comparação em termos relativos do grau de concentração em torno da média.

Existem várias situações em que o cálculo da variância populacional é conhecido, como um


processo industrial. Se pudermos assegurar que uma certa máquina fornece medidas com precisão
constante, teremos sua variabilidade conhecida. Uma outra situação seria os resultados
encontrados, como no envase de garrafas de bebidas em que se deve ter uma pequena variação da
quantidade envasada.

A análise de variância refere-se a um conjunto de situações


experimentais e procedimentos estatísticos para a análise de
respostas quantitativas de unidades experimentais. Para o
cálculo da variância, construímos através dos dados uma
medida de dispersão ao qual determina o quanto cada valor
estará próximo ou distante da média.

Fonte: Anastasiia Nevestenko / 123RF.

A variância de uma variável aleatória unidimensional discreta X, segundo Meyer (1984, p. 157):

é definida por: V (X) ou σx


2
(sigma) , da
maneira seguinte:
V (X) = E[X − E(X)] = E[X − μx ] = E(X ) − [E(X)] .
2 2 22

Onde μx é a média, a raiz quadrada positiva de V (X) é denominada o desvio-padrão de


X , e é denotado por σx.

De uma maneira mais geral, a definição de variância para uma variável aleatória discreta contínua
unidimensional é dada por:

+∞

2
V (X) = ∫ (x − μ ) f (x) dx
x

−∞

Através da integral em que se calcula área, temos, que a esperança para variáveis aleatórias
continuas define pela função e sua imagem x f(x) entre o intervalo [+∞, −∞] , isto é,

+∞

E (X) = ∫ x f (x) dx

−∞

Portanto, variância mede dispersão. E o faz mais ou menos do mesmo modo que o desvio médio,
ou seja, medindo o afastamento médio dos dados em relação à média do conjunto. A diferença é
que, tomando o quadrado dos desvios, a variância consegue uma espécie de média ponderada
desses desvios, em que desvios maiores entram com peso maior que os desvios menores.

Propriedades da Variância Conjunta


De posse da definição formal de variância, a seguir, você irá aprender as propriedades dela, as quais
serão uteis em inúmeras aplicações. No infográfico a seguir, apresentam-se algumas propriedades.
Observe.
#PraCegoVer : o infográfico é estático, possui forma retangular e fundo em degradê branco e cinza. Do
lado esquerdo, há quatro círculos, em tons de amarelo a amarelo escuro, que estão dispostos um após o
outro na vertical e enumerados de um a quatro. Na frente de cada um, há um título e o texto
correspondente. O título do infográfico é “Propriedades para variância de uma variável aleatória”. Na frente
do primeiro círculo, há o título “Propriedade 1”. Logo abaixo, há o texto: “seja c um número real arbitrário,
porém fixado, então variável vê de xis mais cê igual vê de xis. Esta propriedade é intuitivamente evidente,
pois somar ou subtrair uma constante ao resultado da variável aleatória xis não altera sua variabilidade,
apenas desloca os valores de xis para a direita ou para a esquerda. Demonstração: Vê de xis mais cê é
igual a E de xis mais cê menos E de xis mais cê elevado ao quadrado, que é igual a E de (xis mais cê
menos E de xis e menos cê elevado ao quadrado), que é igual a E de xis menos E de xis elevado ao
quadrado e igual a Vê de xis” (MEYER, 1984, p. 159).” Na frente do segundo círculo, há o título “Propriedade
2”. Logo abaixo, há o texto: “seja c um número real arbitrário, porém fixado, então vê de cê vezes xis é igual
a cê ao quadrado vezes vê de xis. Demonstração: Vê de cê vezes xis igual a E de cê vezes xis elevado ao
quadrado menos ao quadrado de E de cê vezes xis, igual a cê ao quadrado e E de xis ao quadrado menos
cê ao quadrado vezes o quadrado de E de xis, igual a cê ao quadrado em evidência de E de xis ao
quadrado menos o quadrado de E de xis, igual a cê ao quadrado vezes vê de xis (MEYER, 1984, p. 159).” Na
frente do terceiro círculo, há o título “Propriedade 3” e, logo abaixo, há o texto: se o par ordenado entre
parênteses xis e ípsilon for uma variável aleatória bidimensional e se xis e ípsilon forem independentes,
então vê de xis mais ípsilon igual a vê de xis mais vê de ípsilon. Demonstração: vê de xis mais ípsilon é
igual a E de elevado ao quadrado de xis mais ípsilon fecha o quadrado menos o quadrado de E de xis mais
ípsilon fecha o quadrado igual a E de xis ao quadrado mais dois xis vezes ípsilon mais ípsilon ao quadrado
menos o quadrado de E de xis fecha o quadrado menos dois vezes E de xis e vezes E de ípsilon menos o
quadrado de E de ípsilon fecha o quadrado, igual a E de xis ao quadrado menos elevado ao quadrado de E
de xis fecha o quadrado mais E de ípsilon ao quadrado menos o quadrado de E de ípsilon fecha o
quadrado, por fim, igual a vê de xis mais vê de ípsilon. (MEYER, 1984, p. 160).” Na frente do quarto círculo
há o título “Propriedade 4” e, logo abaixo, há o texto: “sejam, entre parênteses xis1, xis2, reticência, xisn as
n variáveis aleatórias independentes, então: vê entre parênteses xis1, xis2, reticência, xisn fecha
parênteses igual a vê de xis1 mais vê de xis2 mais reticência mais vê de xisn. Demonstração: decorre
através da propriedade 3: vê abre parêntese de xis mais ípsilon fecha parêntese igual a vê de xis mais vê
de ípsilon, de maneira mais generalizada.”

A fim de você fixar alguns dos conceitos trazidos pelas propriedades da variância, a seguir, tem-se
um exemplo.

Estudante, os métodos para comparar as variâncias de duas populações (ou desvios padrão), por
exemplo, são necessários, no caso em que as populações sob investigação são normais, os
procedimentos são feitos com base em uma nova família de distribuições de probabilidades.

Vejamos, agora, um exemplo com variável aleatória discreta unidimensional :

o serviço de meteorologia classifica o tipo de céu em uma escala distribuída em 11


categorias empregada: 0, 1, 2, . . . , 10; em que zero representa um céu perfeitamente
claro e dez significa que o céu está totalmente chuvoso. Seja a variável aleatória X que
pode ser selecionada uma determinada estação meteorológica em um determinado dia e
hora, admitindo que a distribuição de probabilidade é dada pela tabela a seguir. Qual é a
classificação que se espera para o céu? (MEYER, 1984, p. 158).

Observe a tabela a seguir.

X 0 1 2 3 4 5 6 7 8 9 10

P(X) 0,05 0,15 0,15 0,06 0,06 0,06 0,06 0,06 0,15 0,15 0,05

Tabela 2.4 - Tabela de distribuição de probabilidade distribuídos entre os onze elementos


Fonte: Elaborada pela autora.

#PraCegoVer : na tabela, temos na primeira linha os valores das variáveis aleatórias


unidimensional distribuída de zero a dez, em que zero a probabilidade do céu claro é de 0,05 e
dez o céu nublado é também 0, 05(p0 = p1 0 = 0, 05); p1 = p2 = p8 = p9 = 0, 15 e
p 3 = p 4 = p 5 = p 6 = p 7 = 0, 06 .

Pede-se a média móvel (variância), para verificar as mudanças de temperatura.

Solução :

A variância das variáveis aleatórias discreta unidimensional X : V (X) = E(X


2
) − [E(X)]
2
.

E(X) = 0.(0, 05) + 1.(0, 15) + 2.(0, 15) + 3.(0, 06) + 4.(0, 06) + 5.(0, 06) + 6.(0, 06)

+7.(0, 06) + 8.(0, 15) + 9.(0, 15) + 10.(0, 05) = 5, 0

2
E(X ) = 0.(0, 05) + 1.(0, 15) + 4.(0, 15) + 9.(0, 06) + 16.(0, 06) + 25.(0, 06) + 36.(0, 06)

+49.(0, 06) + 64.(0, 15) + 81.(0, 15) + 100.(0, 05) = 35, 6

Portanto, a variância é: V (X) = E(X


2 2
) − [E(X)] = 35, 6 − 25 = 10, 6

Agora, caro(a) estudante, vejamos um exemplo com variável aleatória contínua unidimensional , de
acordo com Meyer (1984, p. 159): “suponhamos que X seja uma variável aleatória contínua definida
pela função densidade de probabilidade.
1 + x, se − 1 ≤ x ≤ 0
f (x) = { ”.
1 − x, se 0 ≤ x ≤ 1

Observe a figura a seguir.

Figura 2.3 - Região de densidade da função f(x)


Fonte: Elaborada pela autora.

#PraCegoVer : a figura apresenta um gráfico no plano cartesiano X e f(x) para calcular a área da função
de densidade apresentada pelas equações da reta, no intervalo de [-1, 0] e [0, 1].

É preciso determinar a variância das variáveis aleatórias contínuas definida pela função densidade
de probabilidade f(x) . Veja a solução a seguir.

Solução :

A variância conjunta das variáveis aleatórias contínuas unidimensionais


X : V (X) = E(X
2
) − [E(X)]
2
.

0 1
0 1
3 2 2 3
x x x x
E (X) = ∫ x (1 + x) dx + ∫ x (1 − x) dx = ( + ) + ( + ) = 0
3 2 2 3
−1 0
−1 0

0 1
0 1
4 3 3 4
x x x x
2 2 2
E (X ) = ∫ x (1 + x) dx + ∫ x (1 − x) dx = ( + ) + ( − )
4 3 3 4
−1 0
−1 0

4 4 3 3 3 3 4 4
0 (−1) 0 (−1) 1 0 1 0 1 1 1 1
= [( − ) + ( − )] + [( − ) − ( − )] = − + + − =
4 4 3 3 3 3 4 4 4 3 3 4

Portanto, a variância é:
1
2 2
V (X) = E(X ) − [E(X)] =
6

Estudante, em uma situação em que se:

observam os valores dos pares ordenados (xi , yj ) pode ser notável estudar as relações
por contingencia existentes entre os dois fenômenos, denominado relações estatísticas.
Não se trata de estudar relações funcionais, isto é, a medida em que o valor de uma
variável é determinado exatamente pela outra, porem estudar a forma de como a
alteração de uma variável poderá afetar a variação da outra, em média. Como por
exemplo, o peso e a altura normalmente estão relacionados, mas a relação não é
determinística. Duas variáveis associadas por uma relação estatística dizem-se
correlacionadas. Se as variações acontecem, em média ou tendencialmente, no mesmo
sentido, a correlação diz-se positiva. Se ocorrem em sentidos opostos, a correlação diz-
se negativa (SALSA; MOREIRA, 2014, p. 58).

No caso de dependência linear e de variáveis quantitativas, existe uma outra medida que é
frequentemente utilizada, definida com o nome de correlação entre variáveis aleatórias, que será
apresentada a seguir, para um conjunto de dados brutos.

Para a definição de correlação entre variáveis em um conjunto de dados brutos , considere


(MAGALHÃES; LIMA, 2005, p. 154):

um conjunto de dados com n pares de valores para as variáveis X e Y , representados


por (xi , yi ) , i = 1, 2, … , n. O coeficiente de correlação mede a dependência
linear entre as variáveis e é calculado da seguinte maneira:
n n
∑ (xi −¯
¯
x¯¯
¯¯¯
¯¯ ¯
¯¯¯
¯¯¯
¯
obs )(yi −yobs ) ∑ xi yi −n ¯
¯
x¯¯
¯¯¯
¯¯ ¯
¯¯¯
¯
obs yobs
¯¯
¯
i=1 i=1
ρ X,Y = =
n 2 n 2 n 2 n 2
2 2
√[∑ (xj −¯
¯
x¯¯
¯¯¯
¯¯
obs ) ][∑ (yj −¯
¯
y¯¯¯
¯¯
obs
¯
) ] √[∑ xj −n ¯
¯
x¯¯
¯¯¯
¯¯
obs ][∑ yj −n ¯
¯
y¯¯¯
¯¯
obs
¯
]
j=1 j=1 j=1 j=1

Em que xobs é a média da variavel X , o mesmo é para a variável ¯γ¯¯¯obs


¯¯¯¯
.

Segundo Meyer (1984, p. 168) seja

uma variável aleatória bidimensional (X,Y) definida por ρX,Y , e chamado de coeficiente
de correlação, entre X e Y, resolvemos da seguinte maneira:
E{[X−E(X)][Y −E(Y )]}
ρ X,Y = ,
√V (X)V (Y )

Supondo que existam as esperanças E(X) e E(Y) e que as variâncias V(X) e V(Y) sejam
diferentes de zero.

Teorema :

E{[X−E(X)][Y −E(Y )]}


O coeficiente de correlação, definida acima por ρX,Y = , pode ser
√V (X)V (Y )

simplificada gerando um teorema, segundo Meyer (1984, p. 168) o “teorema por


E(XY )−E(X)E(Y )
ρX,Y = .”
√V (X)V (Y )

Demonstração :

Considere o numerador da equação de coeficiente de correlação (MEYER, 1984, p. 168):

E {[X − E(X)]} = E [XY − XE(Y ) − Y E(X) + E(X)E(Y )] =


= E(XY ) − E(X)E(Y ) − E(Y )E(X) + E(X)E(Y ) =

= E(XY) − E(X)E(Y)”

E{[X−E(X)][Y −E(Y )]} E(XY )−E(X)E(Y )


Portanto, ρX,Y = ⇒ ρ = .
√V (X)V (Y ) √V (X)V (Y )

Estudante, ao verificar o coeficiente de correlação ,

a variação do coeficiente de correlação é de –1 a 1, inclusive. Quando x e y tem uma


correlação linear positiva forte, quando r está entre 0,8 e 1,0. Quando x e y tem uma
correlação linear negativa forte, r está entre -0,8 e -1,0.(em casas decimais). Quando x e y
tem correlação linear positiva perfeita ou correlação linear negativa perfeita, r é igual a 1
ou –1, respectivamente. Quando não há correlação linear, r está próxima (em casas
decimais) a 0.
É importante lembrar que quando r está próxima de 0 não significa que não há relação
entre x e y, significa apenas que não há relação linear (LARSON; FABER, 2015, p. 442).

Teorema :

O coeficiente de correlação entre X e Y satisfaz a desigualdade:


−1 ≤ ρ X,Y ≤ 1

O coeficiente de correlação é uma medida da relação linear entre X e Y. Quando


ρ_(X,Y)=±1, existe uma correlação perfeita entre X e Y, pois Y = aX + b . Se ρX,Y = 1,
a > 0, e se ρ X,Y = −1, a < 0. O grau de associação linear entre X e Y varia à medida

que ρX,Y varia entre -1 e +1 (BUSSAB; MORETIN, 2018, p. 218).

Analisando os coeficientes de correlação, caro(a) estudante, quanto mais próximo do limite inferior
ou do limite superior de −1 ≤ ρ
X,Y
≤ 1 , ou seja, de -1 ou +1 (o resultado próximo de zero),
significa que pior será o resultado .

Por exemplo, “a quantidade de chuva é um fator importante na produtividade agrícola. Para medir
esse efeito foram anotados, para oito diferentes regiões produtoras de soja, o índice pluviométrico
em milímetros ( X ) e a produção do último ano em toneladas ( Y ). Vamos determinar o coeficiente
de correlação” (MAGALHÃES; LIMA, 2005, p. 154).

Observe a tabela a seguir.

X 120 140 122 150 115 190 130 118

Y 40 46 45 37 25 54 33 30

Tabela 2.5 - Distribuição de probabilidade distribuída entre o índice pluviométrico e a produção agrícola
Fonte: Magalhães e Lima (2005, p. 154).

#PraCegoVer : na tabela, tem-se os valores das variáveis aleatórias na primeira linha, os valores
de X= índice pluviométrico em milímetros, com os valores de (120,140,122,150,115,190,130 e
118). Na segunda linha, tem-se os valores da variável Y=produção do último ano em toneladas,
com os valores (40,46,45,37,25,54,33 e 30).
Solução :

Para determinar a correlação, é necessário primeiramente calcular os somatórios. Observe a seguir.

Somatório da variável X :

8
∑ xi = 120 + 140 + 122 + 150 + 115 + 190 + 130 + 118 = 1085
i=1

Somatório da variável Y :

8
∑ y = 40 + 46 + 45 + 37 + 25 + 54 + 33 + 30 = 310
i=1 i

Somatório da multiplicação das variáveis X e Y :

8
∑ xi y = 120 . (40) + 140 . (46) + 122 . (45) + 150 . (37) + 115 . (25) + 190 . (54) + 1
i=1 i

8
∑ xi
Temos, também, que a média da variável X é: x̄ =
i=1

n
=
1085

8
= 135, 625 , e da variável Y é:
8
∑ yi
ȳ =
i=1

n
=
310

8
= 38, 75 , sendo n = 8 o número das regiões agrícolas.

Por fim, pela equação de correlação, temos:


n
∑ xi yi −n x̄ ȳ
i=1
ρ =
X,Y
n 2 n 2
2 2
√[∑ xj −n x̄ ][∑ yj −n ȳ ]
j=1 j=1

(43245)−[8 × (135,625) × (38,75)]


= 2 2 2 2
= 0, 73
√[ (1085) −8 × (135,625) ] [(310) −8 × (38,75) ]

Portanto, caro(a) estudante, a correlação entre o índice pluviométrico e a produção é determinada


por 0,73, como o resultado é próximo a 1, expressa associação positiva. Assim, isso indica que o
aumento da quantidade de chuva está associado com o aumento da produção, ou seja, lugares com
maior intensidade de chuva tenderiam a ter maior produtividade.

Segundo Larson e Farber (2015, p. 439) “uma correlação é definida como uma relação entre duas
variáveis. Os dados podem ser representados por pares ordenados (x,y), sendo x a variável
independente e y a variável dependente.”

As representações gráficas , estudante, são úteis na visualização do tipo de correlação existente


entre as variáveis, ou na ausência desta.

Observe a figura a seguir.


Figura 2.4 - Representação gráfica de dispersão sobre correlação
Fonte: Larson e Faber (2015, p. 439).

#PraCegoVer : a figura (a) apresenta uma representação gráfica de dispersão no plano cartesiano de um
exemplo de correlação linear negativa, conforme x cresce, y tende a decrescer. A figura (b) mostra um
exemplo de correlação linear positiva, conforme x cresce, y tende a crescer. A figura (c) apresenta um
exemplo gráfico de dispersão quando não há correlação, em que todos os pontos estão totalmente
aleatórios e dispersos. Por fim, a figura (d) apresenta um gráfico de dispersão de correlação não linear, em
que os pares ordenados crescem e decrescem em uma ordem de parábola.

As representações gráficas de correlação são apresentadas no plano cartesiano por pares


ordenados (x, y) , chamado de diagrama de dispersão , sendo colocados como pontos em plano
coordenado. Temos a variável independente (explanatória) x, indicada pelo eixo horizontal, e a
variável dependente (resposta) y, indicada pelo eixo vertical.

Vamos a outro exemplo, estudante: no Rio Grande do Sul, uma universidade deseja realizar um
estudo da velocidade do vento em todo o estado, sempre uma hora da manhã para os primeiros 15
dias, com a intenção de instalar energia eólica. Sendo coletado dados como o tempo e a velocidade
em uma tabela, observe a tabela a seguir.

x = D 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Y = vt 22,2 61,1 13,0 27,8 22,2 7,4 7,4 7,4 20,4 20,4 20,4 11,1 13,0 7,4 14,8

Tabela 2.6 - Dia e velocidade do vento no aeroporto


Fonte: Bussab e Moretin (2018, p. 484).

#PraCegoVer : na tabela, tem-se, na primeira linha, o dia de análise para verificar a velocidade
do tempo, sendo a variável X; na segunda linha, tem-se a velocidade do vento como a segunda
variável trabalhada, dividida em 15 partes.
Pede-se, para melhor visualização, a representação gráfica do comportamento do vento ao longo
dos 15 primeiros dias. É possível afirmar que existe algum tipo de correlação, estudante?

Solução :

O diagrama de dispersão é ajustado considerando todos os pontos no plano cartesiano.


Apresentamos o gráfico (diagrama de dispersão) dos pontos de intenção de instalar energia eólica,
conforme é mostrado na figura abaixo.

Figura 2.5 - Representação gráfica de dispersão sobre correlação do vento em um determinado tempo
Fonte: Bussab e Moretin (2018, p. 484).

#PraCegoVer : a figura apresenta os pontos no plano cartesiano da velocidade do vento. O eixo x mostra o
dia que foi analisado a velocidade do vento, que é representada no eixo y.

Caro(a) estudante, para ajustar a dispersão , consideramos três conjuntos de cinco pontos. É fácil
de observar que as linhas na figura representam o comportamento dos pontos de velocidade do
vento no plano cartesiano (x, y). Na representação gráfica, ocorre uma correlação linear negativa,
pois conforme x cresce o valor de y diminui.

REFLITA

“Karl Pearson (1857–1936), conhecido estatístico inglês,


desenvolveu o coeficiente amostral; o nome formal de ρ é
coeficiente de correlação de Pearson. ”
Fonte: Larson e Faber (2015, p. 33).
“Para saber mais sobre a representação gráfica de dispersão do
desenvolvimento da correlação de probabilidade, a análise dos
resultados de cada caso de correlação ρX,Y é fundamentada entre
o intervalo: −1 ≤ ρ
X,Y
≤ 1 , sendo o intervalo o mais conhecido
e robusto para medir o grau de correlação.
Casos particulares:
para o valor de ρX,Y = 1 a correlação é linear positiva e perfeita;
para o valor de ρ
X,Y
= −1 a correlação é linear negativa e
perfeita;
para o valor de ρX,Y = 0 é inexistente a correlação linear.”
Fonte: Larson e Faber (2015, p. 442).

Agora, estudante, vamos conhecer mais sobre a covariância entre duas variáveis aleatórias . Para
duas variáveis aleatórias X e Y dependentes, uma medida de dependência linear entre as variáveis
X e Y é dada pela covariância , isto é, a covariância mede a relação linear entre duas variáveis . A
covariância tem parecença à correlação entre duas variáveis, em que os coeficientes de correlação
têm um padrão e, deste modo, existe uma relação de linearidade, resultando em um coeficiente de
correlação. No entanto, os valores de covariância não são padronizados. Portanto, a covariância
pode variar de menos infinito a mais infinito, e o valor para uma relação linear ideal depende dos
dados. Como os dados não são padronizados, é difícil determinar a força da relação entre as
variáveis (DEVORE, 2011, p. 193).

Definição :

Sejam X e Y duas variáveis aleatórias , a definição de covariância é dada por:

Cov (X, Y ) = E [(X − ∑ x p x (x)) (Y − ∑ y p y (y))]

⎧ ∑ ∑ (X − ∑ x p x (x)) (Y − ∑ y p y (y)) p (x, y) X, Y discretas



⎪ x y

Cov (X, Y ) = ⎨ +∞ +∞


⎩ ∫ ∫ (X − ∑ x p x (x)) (Y − ∑ yp y (y)) f (x, y) dxdy X, Y cont í nuas

−∞ −∞

Segundo Magalhães e Lima (2005, p. 161) a “covariância é o valor esperado do produto dos desvios
de cada variável em relação a sua média. A covariância pode ser calculada mais facilmente pela
seguinte equação:

Cov(X, Y ) = σ(X,Y ) = E(XY ) − E(X)E(Y ) ”.

Caro(a) estudante, no caso em que as variáveis X e Y forem independentes , tem-se que


Cov(X, Y ) = 0, uma vez que o valor esperado do produto se torna igual ao produto dos valores

esperados.

Para auxiliar a interpretação da definição, apresentamos um exemplo para determinar o cálculo da


covariância.

Vejamos um exemplo de covariância bidimensional discreto : uma região foi subdividida em 10


sub-regiões. Em cada uma delas foram observadas duas variáveis: X = número de poços
artesianos; e o Y = número de riachos ou rios presentes na sub-região. Os resultados são
apresentados na tabela a seguir.
Observe, estudante, a tabela a seguir.

Sub-região 1 2 3 4 5 6 7 8 9 10

X 0 0 0 0 1 2 1 2 2 0

Y 1 2 1 0 1 0 0 1 2 2

Tabela 2.7 - Distribuição da quantidade de poços subdividida em dez sub-regiões


Fonte: Magalhães e Lima (2005, p. 142).

#PraCegoVer : na tabela, tem-se os dados: na primeira linha, a quantidade de regiões para o


estudo, sendo dez. Na segunda linha, com a variável X, a quantidade de poços artesianos das
dez regiões, sendo que as regiões 1, 2, 3, 4 e 10 não possuem nenhum poço artesiano; as
regiões 5 e 7 possuem um poço; e as regiões 6 e 9 possuem dois poços. Na terceira linha, com
a variável Y , tem-se o número de riachos ou rios, sendo que as regiões 4, 6 e 7 não possuem
nenhum riacho ou rio; as regiões 1, 3, 5 e 8 possuem um riacho ou rio; e, por fim, as regiões 2, 9
e 10 possuem dois riachos ou rios.

Após a coleta de dados brutos, a escolha de uma das sub-regiões ocorre aleatoriamente. Dessa
forma, precisamos determinar a probabilidade de cada região, por isso, apresentamos as
informações na tabela abaixo.

X\Y 0 1 2 P (X = x)

1 2 2 5
0
10 10 10 10

1 1 2
1 0
10 10 10

1 1 1 3
2
10 10 10 10

3 4 3
P (Y = y) 1
10 10 10

Tabela 2.8 - Probabilidade da quantidade de poços, riachos ou rios subdivididos em dez sub-regiões
Fonte: Magalhães e Lima (2005, p. 143).

#PraCegoVer : na tabela, a primeira linha indica a variável Y=quantidade de riachos ou rios,


variando de nenhum riacho a dois riachos e a soma das probabilidades P(X=x). Na segunda
linha, tem-se a probabilidade de zero poço X, com a combinação do resultado da quantidade de
probabilidade de cada região de rios Y. Na terceira linha, tem-se a resultado da probabilidade de
cada região de um poço X, com a combinação do resultado da probabilidade de cada região de
rios de 0 a 2 (variável Y). Na quarta linha, tem-se a probabilidade de dois poços (variável X) com
a combinação do resultado da probabilidade de cada região de rios (variável Y). Por fim, a
última linha é o somatório de probabilidade da variável Y.

Diante dos dados apresentados, estudante, pede-se para determinar a covariância da variável
aleatória bidimensional discreta.
Solução :

O cálculo da covariância diante dos dados apresentados é determinado através da equação:


Cov(X, Y ) = E(XY ) − E(X)E(Y ) . Logo, a esperança da variável X e Y , temos:

5 2 3 8
E(X) = ∑ xp(x) == 0x + 1x + 2x =
10 10 10 10
x

3 4 3
E(Y ) = ∑ yp(y) == 0x + 1x + 2x = 1
10 10 10
y

A esperança da probabilidade da multiplicação das duas variáveis ocorrerem são:

E(XY ) = [p(0, 0) + p(0, 1) + p(0, 2) + p(1, 0) + p(2, 0)] X [p(1, 1)] X [p(1, 2) + p(2, 1)] x(2, 2)

1 2 2 1 1 1 0 1 1 7 1 1 1 7
= [ + + + + ]X [ ]X [ + ]X = X X X =
10 10 10 10 10 10 10 10 10 10 10 10 10 10

Portanto, a covariância é determinada por:

7 8 1
Cov(X, Y ) = E(XY ) − E(X)E(Y ) = − × 1 = − = −0, 1
10 10 10

Estudante, o valor da covariância é negativo indicando que as variáveis aleatórias possuem relação
oposta, isto é, enquanto uma variável aumenta a outra diminui. Neste caso, os valores significam
que duas variáveis aleatórias tendem a variar entre si e acima da média , isto é, indicam que valores
acima da média de uma variável estão associados com valores médios abaixo da outra variável.

Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)

Uma distribuidora de materiais de construção, em uma semana, distribui uma quantidade de


cascalho (em toneladas) vendendo de acordo com a função de densidade de probabilidade
contínua e unidimensional apresentada pela equação abaixo f(x):
3 2
(1 − x ) 0 ≤ x ≤ 1
2
f (x) = {
0 caso contrá rio

Sendo a variável aleatória X = venda semanal do material de construção (cascalho).

DEVORE J. L. Probabilidade e Estatística para Engenharias e Ciências . 6. ed. São Paulo:


Cengage Learning, 2011. p. 136.

Determine o valor esperado e a variância da função de densidade de probabilidade f(x).

a) E(X) = 0, 385 e V (X) = 0, 049


b) E(X) = 0, 485 e V (X) = 0, 079
c) E(X) = 0, 375 e V (X) = 0, 059
d) E(X) = 0, 475 e V (X) = 0, 069
e) E(X) = 0, 395 e V (X) = 0, 089

praticar
Vamos Praticar
“Um estudante conduz um estudo para determinar se existe uma relação linear entre o número
de horas que um aluno faz exercícios a cada semana e o seu coeficiente de rendimento. Os dados
são mostrados na tabela abaixo.” (LARSON; FABER, 2015, p. 441).

Observe, caro(a) estudante, a tabela a seguir.

Horas de
12 3 0 6 10 2 18 14 15 5
exercício, x

CR, y 3,6 4,0 3,9 2,5 2,4 2,2 3,7 3,0 1,8 3,1

Tabela - Número de horas e coeficiente de rendimento


Fonte: Larson e Faber (2015, p. 441).

#PraCegoVer : na tabela, tem-se, na primeira linha, as horas em que o aluno faz


exercícios a cada semana, sendo, respectivamente, 12, 3, 0, 6, 10, 2, 18, 14, 15 e 5. Na
segunda linha, a variável y é o coeficiente de rendimento do aluno, sendo,
respectivamente, 3,6; 4,0; 3,9; 2,5; 2,4; 2,2; 3,7; 3,0; 1,8 e 3,1.

LARSON, R.; FARBER, B. Estatística Aplicada . São Paulo: Pearson, 2015.

Agora, determine os pontos em um diagrama de dispersão e descreva o tipo de correlação em


uma representação gráfica no plano cartesiano (x,y).
Material
Complementar

LIVRO

Probabilidade e Estatística para Engenharia e


Ciências
Editora : Thomson

Autor : Jay L. Devore

ISBN : 85-221-0459-X

Comentário : este livro apresenta a estatística e a probabilidade sob o ponto


de vista da engenharia e de outras áreas das ciências exatas, apresentando
os conceitos de maneira abrangente e profunda, por meio de uma sequência
lógica e direta, material gráfico, exemplos e exercícios que auxiliam na
aprendizagem. Probabilidade e estatística para engenharia, ciência da
computação, estatística, física e química e ciências a obra introduz uma
grande variedade de exercícios tanto após a apresentação de cada tópico
quanto no final de cada capitulo.

WEB

Como calcular o coeficiente de correlação r


Ano : 2017

Comentário : um exemplo de exercício resolvido sobre cálculo do coeficiente


de correlação e o raciocínio por trás do cálculo. Explorando dados
numéricos bivariados na Khan Academy: calculando o coeficiente de
correlação. A intuição por trás dos cálculos. A Khan Academy oferece
exercícios, vídeos e um painel de aprendizado personalizado para ajudar
estudantes a aprenderem no seu próprio ritmo, dentro e fora da sala de aula.
Conta com conteúdos de matemática, ciências e programação, do jardim da
infância ao ensino superior, com tecnologia de ponta.

ACESSAR
Conclusão
Caro(a) estudante, nesta unidade, você estudou a análise de esperança ou valor esperado de funções de
uma ou duas variáveis aleatórias discretas . Também estudamos algumas propriedades envolvendo a
esperança em variáveis aleatórias .

Depois, você estudou o conceito e as propriedades da variância de uma e duas variáveis aleatórias
discretas e contínuas, concluindo que a variância é uma das medidas de dispersão , que mostra o
comportamento dos dados de uma amostra em relação a uma medida central.

Você também pôde analisar que o fato de duas variáveis aleatórias serem fortemente correlacionadas
não significa que haja um índice de correlação forte entre os dados, ou seja, isso não implica em uma
relação funcional entre eles.

Por fim, o coeficiente de correlação é igual à covariância dividida pelo produto dos desvios padrão das
variáveis. Uma covariância positiva sempre resulta em uma correlação positiva, e uma covariância
negativa sempre resulta em uma correlação negativa. Até a próxima!

Referências
BUSSAB W.O.; MORETIN P. A. Estatística Básica . 9. ed. São
Paulo: Saraiva, 2018.

CALCULANDO o coeficiente de correlação r. | Matematica | Khan Academy. [ S. l.: s. n. ], 2017. 1 vídeo


(11m02s). Publicado pelo canal Khan Academy Brasil. Disponível em: https://www.youtube.com/watch?
v=m1bqsFYVxwM . Acesso em: 14 jun. 2021.

DEVORE J. L. Probabilidade e Estatística para Engenharias e Ciências . 6. ed. São Paulo: Cengage Learning,
2011. (Biblioteca Ânima).

LARSON, R.; FARBER, B. Estatística Aplicada . São Paulo: Pearson, 2015.

LOPES, C. E.; MEIRELLES, E. O Desenvolvimento da Probabilidade e da Estatística. In : Encontro Regional


de Professores da Matemática, 18., 2015, São Paulo. Anais eletrônicos [...]. São Paulo: Unicamp, 2005.
Disponível em: https://www.ime.unicamp.br/erpm2005/anais/m_cur/mc02_b.pdf . Acesso em: 23 abr.
2021.

MAGALHÃES M. N.; LIMA A. C. P. Noções de Probabilidade e Estatística . São Paulo: Editora da


Universidade de São Paulo, 2005. (Biblioteca Ânima).

MEYER, P. L. Probabilidade: Aplicações à Estatística . Rio de Janeiro: Editora LTC, 1984. (Biblioteca Ânima).
ROSS, S. Probabilidade Um curso moderno com aplicações . 8. ed. Porto Alegre: Bookman, 2010.

SALSA, I. S.; MOREIRA, J. A. Probabilidade e Estatística . 2. ed. Natal: EDUFRN, 2014.

Você também pode gostar