Você está na página 1de 6

Departamento de Matemática

Secção de Estatı́stica e Aplicações - IST

Probabilidades e Estatı́stica - LEIC + LERCI + LEE


2o semestre – 2004/05
2o Teste – Teste A - Resolução 30/4/2005 – 12h30m

Grupo I - 7.0 val.

Admita que o tempo diário dispendido em chamadas por um utente duma rede móvel é um v.a. X (em
minutos) cuja função densidade de probabilidade é dada por:
1 1 2
fX (x) = √ e− 8 (x−10) , x ∈ IR. (1)
2 2π

a) Identifique a v.a. X (i.e., identifique a sua distribuição), e indique o seu (1.5)

• valor esperado;
• variância;
• mediana.
b) Qual é a probabilidade de num dia o utente vir a gastar menos de 6 minutos em chamadas? (1.5)

c) Suponha que os tempos dispendidos em dias diferentes são v.a. independentes, com a função
densidade de probabilidade (1). Calcule a probabilidade de num mês de 30 dias o utente vir a
gastar menos de 5 horas e meia (330 minutos) em chamadas. (4.0)

Resolução:

a) A v.a. X em questão tem distribuição normal de parâmetros µ = 10 e σ = 2, como se pode


confirmar pelo formulário. Desta forma vem que:
• E[X] = µ = 10;
• V ar[X] = σ 2 = 22 ;
• Dado que uma v.a. normal tem função densidade de probabilidade simétrica em torno do seu
valor esperado, vem que a mediana coincide com o valor esperado, i.e., a mediana desta v.a. é
igual a µ = 10.
b)
X − 10 6 − 10
P (X < 6) = P ( < ) = Φ(−2) = 1 − Φ(2) = 1 − 0.9772 = 0.0228.
2 2

c) Seja Y a v.a. que contabiliza o tempo total dispendido em chamadas ao longo de um mês (de 30
dias). Se Xi designar o tempo que o utente gasta em chamadas no dia i, vem que
30
X
Y = Xi
i=1

Além disso a colecção de v.a.a {Xi , i = 1, . . . , 30} é uma colecção de v.a. i.i.d pelo que decorre da
propriedade reprodutiva das normais que

Y ∼ N (30 × 10, 30 × 22 ) = N (300, 120)

pelo que
Y − 300 330 − 300
P (Y ≤ 330) = P ( √ ≤ √ ) = Φ(2.74) = 0.9969
120 120

Página 1 de 3
Grupo II - 6.5 val.

Seja X a v.a. que indica o tempo de permanência (em segundos) em vermelho de um semáforo instalado
num cruzamento. Este tempo pode ser regulado ao longo do dia, e pretende-se estabelecer a sua influência
na intensidade de tráfego nesse cruzamento. Seja então Y a v.a. que indica a intensidade de tráfego
no cruzamento, classificada em três categorias: 0 (tráfego ligeiro), 1 (tráfego moderado) e 2 (tráfego
congestionado). Assuma que a função de probabilidade conjunta do par (X, Y ) é dada pela seguinte
tabela:

Y |X 10 15 20
0 0.2 0.1 0
1 0.1 0.2 0.1
2 0 0.1 0.2

a) Quando o semáforo permance 15 segundos em vermelho, qual é a intensidade esperada do tráfego?


(2.5)

b) Determine a covariância entre X e Y . Comente. (4.0)

Resolução:

a) Decorre da tabela da f.p.c. que a f.p. marginal de X e de Y são dadas por:


 
0.3
 x = 10, 20 0.3
 y = 0, 2
P (X = x) = 0.4 x = 15 ; P (Y = y) = 0.4 y=1 .
 
0 r.v.x 0 r.v.y
 

P2 P2
Nesta alı́nea pretende-se determinar E[Y |X = 15] = y=0 yP (Y = y|X = 15) = y=0 y P (X=15,Y =y)
P (X=15)
donde
P (X = 15, Y = 1) P (X = 15, Y = 2)
E[Y |X = 15] = +2
P (X = 15) P (X = 15)
0.2 0.1
= +2×
0.4 0.4
= 1.0

ou seja, quando o semáforo permanece 15 segundos no vermelho, é de esperar tráfego moderado.


b)

Cov(X, Y ) = E[XY ] − E[X]E[Y ]


X X
E[XY ] = xyP (X = x, Y = y) = 17.0
x∈{10,15,20} y∈{0,1,2}
X
E[X] = xP (X = x) = 15.0
x∈{10,15,20}
X
E[Y ] = yP (Y = y) = 1.0
y∈{0,1,2}

pelo que Cov(X, Y ) = 17.0 − 15.0 = 2.0, donde se conclui que:


• As v.a. X e Y são dependentes (uma vez que a covariância é não nula);
• Quando o tempo de permanência em vermelho (X) aumenta, a intensidade de tráfego (Y ) tem
tendência a aumentar (uma vez que a covariância é positiva).

Página 2 de 3
Grupo III - 6.5 val.

Suponha que o número de acidentes por mês que ocorrem nas rotundas de acesso ao IST-TagusPark
pode ser modelado por uma v.a. de Poisson, de parâmetro θ desconhecido. Em 7 meses consecutivos
registaram-se os seguintes valores de X:
3, 0, 3, 1, 2, 3, 2

a) Prove que a função de verosimilhança de θ para a amostra observada é dada por (2.0)

e−7θ θ14
L(θ; x1 = 3, x2 = 0, x3 = 3, x4 = 1, x5 = 2, x6 = 3, x7 = 2) = , θ > 0.
(3!)3 (2!)2

b) Deduza uma estimativa de máxima verosimilhança de θ com base nesta amostra. Qual a estimativa
de máxima verosimilhança da probabilidade de num mês não haver acidentes? Justifique. (4.5)

Resolução: Seja X a tal v.a. que modela o número de acidentes nas rotundas de acesso ao IST-
TagusPark, com X ∼ P oi(θ), sendo que θ é desconhecido.

1. A função de verosimilhança de uma amostra x1 , . . . , x7 , é dada por


L(θ; x1 , . . . , x7 ) = P (X1 = x1 , . . . , X7 = x7 )
7
Y
= P (Xi = xi ) porque as v.a. são independentes
i=1
Y7
= P (X = xi ) porque as v.a. são identicamente distribuı́das
i=1
7
Y e−θ θxi
=
i=1
xi !
P7
e−7θ θ i=1 xi
= Q7
i=1 xi !
pelo que no caso particular vem que
e−7θ θ3+0+3+1+2+3+2 e−7θ θ14
L(θ; x1 = 3, x2 = 0, x3 = 3, x4 = 1, x5 = 2, x6 = 3, x7 = 2) = = .
3!0!3!1!2!3!2! (3!)3 (2!)2

2. De acordo com a alı́nea anterior temos que


ln L(θ; x1 = 3, x2 = 0, x3 = 3, x4 = 1, x5 = 2, x6 = 3, x7 = 2) = −7θ + 14 ln θ − ln((3!)3 (2!)2 )
14
[ln L(θ; x1 = 3, x2 = 0, x3 = 3, x4 = 1, x5 = 2, x6 = 3, x7 = 2)]′ = −7 +
θ
′′ 14
[L(θ; x1 = 3, x2 = 0, x3 = 3, x4 = 1, x5 = 2, x6 = 3, x7 = 2)] = − 2
θ
′′
Como [ln L(θ; x1 = 3, x2 = 0, x3 = 3, x4 = 1, x5 = 2, x6 = 3, x7 = 2)] < 0 para todos os valores pos-
sı́veis de θ, vem que efectivamente o zero da primeira derivada é ponto máximo, i.e., a estimativa
de máxima verosimilhança de θ, θ̂, é tal que
14
−7 + = 0 ⇔ θ̂ = 2.0.
θ̂
Quanto à estimativa da probabilidade de num dia não haver acidentes: como P (X = 0) = e−θ ,
então decorre da propriedade da invariância dos estimadores de máxima verosimilhança que
emv(P (X = 0)) = emv(e−θ ) = e−emv(θ) = e−0.5
(onde emv(θ) designa estimativa de máxima verosimilhança de θ).

Página 3 de 3
Departamento de Matemática
Secção de Estatı́stica e Aplicações - IST

Probabilidades e Estatı́stica - LEIC + LERCI + LEE


2o semestre – 2004/05
2o Teste – Teste B – Resolução 30/4/2005 – 12h30m

Grupo I - 7.0 val.

O tempo de execução de um algoritmo genético num processador Pentium IV é uma v.a. X (em segundos),
a qual tem distribuição Exponencial de valor esperado 10 segundos.

a) Calcule a função de distribuição da v.a. X. (1.5)

b) Sabendo que um programa (resultado da implementação deste algoritmo) já está a ser executado
há 5 segundos, qual é a probabilidade de se ter de esperar pelo menos mais outros 5 segundos para
terminar a sua execução? (1.5)

c) Considere 50 execuções (independentes) desse mesmo programa. Determine aproximadamente,


justificando, a probabilidade do tempo total de 50 execuções exceder 10 minutos (600 segundos). (4.0)

Resolução:

a)
( (
0 x < 0; 0 x < 0;
FX (x) = P (X ≤ x) = Rx 1 −t/10
=
0 10 e dt x>0 1 − e−x/10 x>0

b) Nesta alı́nea pretende-se determinar P (X ≥ 5 + 5|X > 5); invocando a propriedade da amnésia da
exponencial, vem:

P (X ≥ 5 + 5|X > 5) = P (X > 5) = 1 − FX (5) = e−0.5 = 0.6065.

c) Seja Xi o i-ésimo tempo de execução do referido programa. Se Y for a v.a. que designa o tempo
total de 50 execuções (assumidas independentes) vem que
50
X
Y = Xi
i=1

com E[Y ] = 50 × E[X] = 500 e V ar[Y ] = 50 × 102 = 5000. Em face do TLC (aplicável, em
particular, a esta situação), resulta que
600 − 500
P (Y > 600) = 1 − P (Y ≤ 600) ≈ 1 − Φ( √ ) = 1 − Φ(1.41) = 1 − 0.9207 = 0.0793.
5000

Grupo II - 6.0 val.

Seja X a v.a. que indica o tempo de permanência (em segundos) em vermelho de um semáforo instalado
num cruzamento. Este tempo pode ser regulado ao longo do dia, e pretende-se estabelecer a sua influência
na intensidade de tráfego nesse cruzamento. Seja então Y a v.a. que indica a intensidade de tráfego
no cruzamento, classificada em três categorias: 0 (tráfego ligeiro), 1 (tráfego moderado) e 2 (tráfego
congestionado). Assuma que a função de probabilidade conjunta do par (X, Y ) é dada pela seguinte
tabela:

Página 4 de 3
Y |X 10 15 20
0 0.2 0.1 0
1 0.1 0.2 0.1
2 0 0.1 0.2

a) Determine a função de probabilidade da intensidade do tráfego quando o semáforo permanece 20


segundos no vermelho. (1.5)

b) Determine o coeficiente de correlação entre X e Y . Comente. (4.5)

Resolução:

a) Nesta alı́nea pretende-se determinar P (Y = y|X = 20) para y ∈ IR. Dado que

P (X = 20, Y = y)
P (Y = y|X = 20) =
P (X = 20)
P2
e que P (X = 20) = y=0 P (X = 20, Y = y) = 0.3, vem

0.2 2
 0.3 =
 3 y=2
P (Y = y|X = 20) = 0.1
0.3 =
1
3 y=1.

0 r.v.y

b) Decorre da tabela da f.p.c. que a f.p. marginal de X e de Y são dadas por:


 
0.3
 x = 10, 20 0.3
 y = 0, 2
P (X = x) = 0.4 x = 15 ; P (Y = y) = 0.4 y=1 .
 
0 r.v.x 0 r.v.y
 

Por outro lado Corr(X, Y ) = E[XY


√ ]−E[X]E[Y ] . Logo
V ar[X]V ar[Y ]
X X
E[XY ] = xyP (X = x, Y = y) = 17.0
x∈{10,15,20} y∈{0,1,2}
X
E[X] = xP (X = x) = 15.0
x∈{10,15,20}
X
E[Y ] = yP (Y = y) = 1.0
y∈{0,1,2}
X
E[X 2 ] = x2 P (X = x) = 240
x∈{10,15,20}

V ar[X] = E[X 2 ] − E 2 [X] = 15


X
E[Y 2 ] = y 2 P (Y = y) = 1.6
y∈{0,1,2}

V ar[Y ] = E[Y 2 ] − E 2 [Y ] = 0.6

donde
17 − 15
Cor(X, Y ) = √ = 0.66
15 × 0.6
Logo
• As v.a. X e Y são dependentes (porque a correlação é não nula);
• Quando o tempo de permanência em vermelho (X) aumenta, a intensidade de tráfego (Y ) tem
tendência a aumentar (porque a correlação é positiva);
• Grau de linearidade não muito elevado, uma vez que é consideravelmente inferior a 1.

Página 5 de 3
Grupo III - 7.0 val.

Em relação ao enunciado do Grupo I, suponha que afinal o parâmetro relativo ao tempo de execução do
algoritmo é desconhecido, sabendo-se apenas que X tem distribuição exponencial de parâmetro θ.

a) Prove que a função de verosimilhança do parâmetro θ com base numa amostra x1 , x2 , . . . , xn , é


dada por Pn (2.0)
L(θ; x1 , x2 , . . . , xn ) = θn e−θ i=1 xi , θ > 0.
b) Considere 6 execuções (independentes) do mesmo programa (resultado da implementação do referido
algoritmo). Suponha que os tempos de execução observados são: (4.0)

5, 10, 7, 12, 13, 8.


Obtenha a estimativa de máxima verosimilhança de θ.
c) Indique um estimador centrado do valor esperado de X. (1.0)

Resolução:

a) A função de verosimilhança de uma amostra x1 , . . . , xn , é dada por


L(θ; x1 , . . . , xn ) = fX1 ,...,Xn (x1 , . . . , xn )
Yn
= fXi (xi ) porque as v.a. são independentes
i=1
Y7
= fX (xi ) porque as v.a. são identicamente distribuı́das
i=1
Y7
= θe−θxi
i=1
n −θ n
P
=θ e i=1 xi

b) De acordo com a alı́nea anterior temos que


n
X
ln L(θ; x1 , . . . , xn ) = n ln θ − θ xi
i=1
n
′ n X
[L(θ; x1 , . . . , xn )] = − xi
θ i=1
n
[L(θ; x1 , . . . , xn )]′′ = − 2
θ
′′
Como [L(θ; x1 , . . . , xn )] = − θn2 < 0 para todos os valores possı́veis de θ, vem que efectivamente o
zero da primeira derivada é ponto máximo, i.e., a estimativa de máxima verosimilhança de θ, θ̂, é
tal que
n
n X n
− xi = 0 ⇔ θ̂ = Pn = x̄−1
θ̂ i=1 i=1 xi

Logo, em face da amostra obtida, vem


emv(θ) = 6/(5 + 10 + 7 + 12 + 13 + 8) = 0.11
(onde emv(θ) designa estimativa de máxima verosimilhança de θ).
c) Pela propriedade da invariância dos estimadores de máxima verosimilhança, vem que X̄ é um
estimador de 1θ . Além disso é estimador centrado uma vez que
Pn
Xi nE[X]
E[X̄] = E[ i=1 ]= = E[X] = 1/θ.
n n

Página 6 de 3

Você também pode gostar