Escolar Documentos
Profissional Documentos
Cultura Documentos
Com base numa amostra - conjunto de dados (x1 , . . . , xn ) - ou, no caso bivariado ainda com
uma segunda amostra (y1 , . . . , yn ), pretende obter-se:
1
• Simetria/assimetria: existindo simetria a média, mediana e moda coincidem; nas
distribuições assimétricas a média é ”puxada”para o lado mais longo da distribuição e
geralmente verifica-se,
Descrição gráfica
EXERCÍCIOS 1.
1. Considere os dados referentes ao peso (em Kg) de 40 cães de pequeno porte
2
4.3 6.8 9.2 7.2 8.7 8.6 6.6 5.2 8.1 10.9
7.4 4.5 3.8 7.6 6.8 7.8 8.4 7.5 10.5 6.0
7.7 8.1 7.0 8.2 8.4 8.8 6.7 8.2 9.4 7.7
6.3 7.7 9.1 7.9 7.9 9.4 8.2 6.7 8.2 6.5
(Resolução commandos R:
(b)
> pesocaes<-c(4.3,6.8,9.2,7.2,8.7,8.6,6.6,5.2,8.1,10.9,
7.4,4.5,3.8,7.6,6.8,7.8,8.4,7.5,10.5,6.0,
7.7,8.1,7.0,8.2,8.4,8.8,6.7,8.2,9.4,7.7,
6.3,7.7,9.1,7.9,7.9,9.4,8.2,6.7,8.2,6.5)
> summary(pesocaes)
> mean(pesocaes)
> median(pesocaes)
> var(pesocaes)
> sd(pesocaes)
> range(pesocaes)
(c)
> quantile(pesocaes,c(0.25,0.5,0.75))
> IQR(pesocaes)
> quantile(pesocaes,type=1)
> quantile(pesocaes,type=2)
> ?quantile
> quantile(pesocaes,0.68)
(d)
> par(mfrow=c(1,2))
> hist(pesocaes, col="red")
> hist(pesocaes, plot=FALSE)
> boxplot(pesocaes, col="red", main="Boxplot of pesocaes")
> boxplot(pesocaes, plot=FALSE)
> ?hist
> ?boxplot
> pesocaes[(pesocaes<quantile(pesocaes,0.25,type=2)-IQR(pesocaes,type=2)*1.5)
|(pesocaes>quantile(pesocaes,0.75,type=2)+IQR(pesocaes,type=2)*1.5)]
3
1 2 3 4 5 6 7 8 9 10
n. filhos 5 2 2 0 1 2 1 3 0 1
rendimento 6,2 1,3 2,5 1,2 3,6 3,0 0,7 3,4 2,1 4,1
x<-c(5,2,2,0,1,2,1,3,0,1)
y<-c(6.2,1.3,2.5,1.2,3.6,3.0,0.7,3.4,2.1,4.1)
summary(x)
quantile(x)
quantile(x,0.9)
var(x)
sd(x)
par(mfrow=c(2,2))
plot(table(x),xlab="Número de filhos")
hist(y,xlab="Rendimento (milhares de euros)")
boxplot(x,y,xlab="Número de filhos e Rendimento",ylab="N. filhos e rendimento (milhares
plot(x,y,xlab="Número de filhos",ylab="Rendimento (milhares de euros)")
cov(x,y)
cor(x,y)
(Resolução commandos R:
> read.table("turistavsocupacao.txt")
> ?read.table
> read.table("turistavsocupacao.txt")$V1
> x<-read.table("turistavsocupacao.txt")
(b)
4
Histogram of y
3.0
3.0
2.0
2.0
Frequency
table(x)
1.0
1.0
0.0
0.0
0 1 2 3 5 0 1 2 3 4 5 6 7
●
6
6
5
●
5
4
●
4
●
●
3
●
3
●
2
●
2
1
● ●
1
●
0
0 1 2 3 4 5
5
> ano2011<-c(x$V1[1],x$V11[1],x$V21[1],x$V31[1],x$V41[1],x$V51[1])
> ano2021<-c(x$V10[1],x$V20[1],x$V30[1],x$V40[1],x$V50[1],x$V60[1])
> classes<-c("Empregado","Desempregado","Estudante","Domestico","Reformado","Outras")
> dev.new()
> par(mfrow=c(2,2))
> barplot(ano2011,names.arg=classes,main="Ano 2011",col="gray",ylab="Freq. Relativa (%)
> barplot(ano2021,names.arg=classes,main="Ano 2021",col="black",ylab="Freq. Relativa (%
> barplot(matrix(c(ano2011,ano2021),2,6,byrow=T),beside=F,names.arg=classes,
main="Turismo por ocupacao",ylab="Freqs. Relat.",legend=c("2011", "2021"))
> barplot(matrix(c(ano2011,ano2021),2,6,byrow=T),beside=T,names.arg=classes,
main="Turismo por ocupacao",ylab="Freqs. Relat.",legend=c("2011", "2021"))
(c)
> emp<-c(46.0,44.5,43.2,44.5,45.0,45.6,47.3,49.0,49.3,50.3)
> des<-c(4.4,6.4,8.2,6.8,6.5,5.8,5.4,4.3,3.8,4.1)
> matplot(c(2011:2020),matrix(c(emp,des),10,2))
> matplot(c(2011:2020),matrix(c(emp,des),10,2),type="l",ylab="Freqs. Relat.",xlab="Anos
> legend(x="right",col=c("black","red"),lty=1:2,legend=c("Empregado","Desempregado"))
> ?par
2 Probabilidade
Definição 2.1 (Experiência Aleatória). Processo segundo o qual obtêm-se a observação
imprevisı́vel, ou resultado aleatório.
É importante distinguir se Ω é: discreto (finito, infinito numerável e.g. N) ou contı́nuo (infinito
não numerável e.g. R).
Casos particulares:
1. P (Ω) = 1,
2. P (A) ≥ 0, ∀A ⊂ Ω,
6
3. A1 , A2 , . . . ⊂ Ω disjuntos dois a dois,
∞
X
P (∪∞
i=1 Ai ) = P (Ai )
i=1
Nota: A axiomática comporta a definição de Laplace ( (no casos favoráveis)/(no casos possı́veis)
com Ω com todos os resultados equiprováveis) e a interpretação frequêncista (limn→∞ (no
observações favoráveis)/(no provas) com n provas ”iguais”).
TPC: Rever propriedades dos conjuntos e suas operações e.g. em Conjuntos (St.Aubyn,
Figueiredo, Loura, Ribeiro e Viegas 2004).
EXERCÍCIO: Num lançamento de um dado viciado, a probabilidade de ocorrer cada número
ı́mpar é o dobro da probabilidade de ocorrer cada número par:
a) Indique qual o espaço de resultados e calcule a probabilidade de cada acontecimento
elementar.
b) Calcule a probabilidade de que o número de pontos obtido no lançamento do dado seja
superior a 3.
c) Calcule a probabilidade de que o número de pontos obtido no lançamento do dado seja um
quadrado perfeito.
Solução: (a) Ω = {1, 2, 3, 4, 5, 6}, P ({1}) = P ({3}) = P ({5}) = 2/9,
P ({2}) = P ({4}) = P ({6}) = 1/9, (b) 4/9, (c) 1/3.
Propriedades 2.1.
1. P (∅) = 0
2. P (A) = 1 − P (A)
3. A ⊂ B =⇒ P (A) ≤ P (B)
4. P (B\A) = P (B ∩ A) = P (B) − P (A ∩ B)
5. P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
6. P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)
7
a) A probabilidade de pelo menos um dos gabinetes estar ocupado.
b) A probabilidade de A estar ocupado sabendo que pelo menos um dos outros gabinetes está
ocupado.
P (A ∩ B) = P (A) × P (B).
2. A, B̄ são independentes,
supostos independentes e com probabilidades iguais a, respectivamente, 0.8, 0.7 e 0.9. Calcule a
probabilidade de:
a) O edifı́cio ser terminado no tempo previsto, devido ao cumprimento dos prazos nas três
actividades referidas.
b) O prazo de execução ser cumprido para a escavação e não ser cumprido em pelo menos
uma das outras actividades.
8
Definição 2.7 (Partição de Ω). Coleção de subconjuntos de Ω, A1 , A2 , . . . , An tais que
Ai ∩ Aj = ∅ ∀i 6= j, e ∪ni=1 Ai = Ω.
Teorema 2.2 (Lei da Probabilidade Total).
Sendo B ⊂ Ω e {Ai }ni=1 uma partição de Ω cada com probabilidade não nula,
n
X
P (B) = P (B|Ai )P (Ai ).
i=1
EXERCÍCIO: Suponha que 5% da população portuguesa numa determinada faixa etária sofre de
obesidade e que de entre estes, 75% têm elevado nı́vel de colestrol. De entre os não obesos, 30%
têm elevado nı́vel de colestrol.
a) Qual a percentagem de pessoas com elevado nı́vel de colestrol?
b) Qual a percentagem de pessoas que tendo elevado nı́vel de colestrol são obesos?
Solução: (a) 0.3225, (b) 0.1163.
2. Uma lotaria tem 10 000 bilhetes numerados de 0000 a 9999. O número do primeiro prémio
é o número do bilhete saı́do numa extracção ao acaso.
(a) Um jogador comprou um bilhete com o número 6789. Qual a probabilidade de lhe
sair o primeiro prémio?
(b) Se o jogador comprar todos os bilhetes cujos números têm todos os algarismos iguais,
qual a probabilidade de lhe sair o primeiro prémio?
(c) Qual a probabilidade do número premiado ter todos os algarismos diferentes?
3. De um grupo de 50 alunos do IST (10 alunos por ano) é escolhida ao acaso uma comissão
coordenadora de 4 pessoas. Qual a probabilidade de:
9
(a) Ser escolhido um e um só aluno do 1o ano?
(b) Serem escolhidos um aluno (e só um) do 1o ano e um aluno (e só um) do 5o ano?
(c) Serem escolhidos no máximo dois alunos do 1o ano?
(d) Serem todos do mesmo ano?
(a) P (B)
(b) P (A ∩ B)
(c) P (B ∩ A)
(d) P (A ∪ B)
6. Uma colecção de 100 programas de computador foi examinada para detectar erros de
“sintaxe”, “input/output” e de “outro tipo” diferente dos anteriores. Desses 100
programas, 20 tinham erros de “sintaxe”, 10 tinham erros de “input/output” e 5 tinham
erros de “outro tipo”, 6 tinham erros de “sintaxe” e de “input/output”, 3 tinham erros de
“sintaxe”e de “outro tipo”, 3 tinham erros de “input/output”e de “outro tipo”e 2 tinham
os três tipos de erros considerados. Um programa é seleccionado ao acaso desta colecção.
Determine a probabilidade de que o programa seleccionado tenha:
9. Num parque natural há três percursos pedonais recomendados com durações e graus de
dificuldade distintos: A, B e C. Admita que 60% dos visitantes optam pelo percurso A,
30% pelo percurso B (podendo também já ter escolhido o percurso A) e 10% pelo percurso
C. Contudo, 10% acabam por fazer os percursos A e B; e, 5% dos que começaram por
fazer o percurso A, 20% dos que inicialmente fizeram o percurso B e 10% dos que já
fizeram os percursos A e B fazem também o percurso C.
10
11. Um geólogo crê que existe petróleo numa certa região com probabilidade 0.8 e que, caso
haja petróleo, a probabilidade de sair petróleo na primeira perfuração é de 0.5.
12. Num parque de estacionamento subterrâneo de uma superfı́cie comercial com três pisos,
um potencial cliente procura um lugar atendendo a dois critérios: profundidade do piso e
proximidade do elevador. A probabilidade de encontrar um lugar em cada um dos pisos é
igual a 0.3 para o piso −1, a 0.5 para o piso −2 e a 0.2 para o último piso. A probabilidade
de esse lugar se encontrar próximo do elevador é 0.05 no piso −1, 0.1 no piso −2 e 0.2 no
último piso.
2. Quantil de ordem p, χp : P (X ≤ χp ) ≥ p e P (X ≥ χp ) ≥ 1 − p
3. Moda, m0 : P (X = m0 ) = maxx∈R P (X = x)
4. Variância:
X
σ 2 = var(X) = E[(X − µ)2 ] = (x − µ)2 P (X = x) = E[X 2 ] − (E[X])2
x∈ΩX
√
5. Desvio padrão: σ = σ2
11
Propriedade 3.1 (Propriedades do valor médio e variância).
Sendo a, b constantes reais e X uma variável aleatória,
1. E[a] = a
2. E[aX + b] = aE[X] + b
3. var(X) ≥ 0
4. var(a) = 0
5. var[aX + b] = a2 var(X)
Definição 3.4 (V.a. Binomial (n, p)). X ∼ Bin(n, p), ΩX = {0, 1, . . . , n}, representa o
número de sucessos em n repetições independentes da prova de Bernoulli (p):
n!
P (X = x) = px (1 − p)n−x , x = 0, 1, . . . , n; E[X] = np, V ar(X) = np(1 − p).
(n − x)! x!
EXERCÍCIO:
Numa sala existem três lâmpadas ”iguais”, que funcionam independentemente. A probabilidade
de cada lâmpada fundir num dado espaço de tempo é 0.1. Seja X a v.a. que representa o número
de lâmpadas que findo esse perı́odo de tempo estão a funcionar. Determine:
a) A função de probabilidade de X.
c) A função de distribuição de X.
12
Definição 3.5 (V.a. Uniforme discreta (1, n)). X ∼ U nif (1, n), ΩX = {1, . . . , n}, reflecte
uma população com n elementos, todos igualmente prováveis:
n+1 n2 − 1
P (X = x) = 1/n, x = 1, . . . , n, E[X] = , V ar(X) = .
2 12
EXERCÍCIO:
1. Considere a variável aleatória discreta X com a seguinte função de distribuição:
0 ,x < 0
1/6 , 0 ≤ x < 2
FX (x) = P (X ≤ x) = 1/4 , 2 ≤ x < 4
1/2 , 4 ≤ x < 6
1 , x ≥ 6.
13
EXERCÍCIOS 3.1. (v.a.’s discretas):
1. Uma caixa contêm 5 lápis dos quais 2 estão partidos. Pretende-se avaliar o número de lápis
partidos e, retiram-se ao acaso e com reposição 3 lápis da caixa. Seja X a v.a. que
representa o número de lápis partidos nas 3 extracções.
3. Num armazém encontra-se um lote de 5000 janelas para serem distribuı́das mas, 100 destas
têm defeito. É efectuada uma inspecção sobre uma amostra de 10 janelas escolhidas ao
acaso com reposição. A inspecção rejeita o lote se forem encontradas mais do que duas
janelas com defeito nessa amostra.
4. Num lote de 500 interruptores existem 50 defeituosos. Desse lote retirou-se ao acaso e com
reposição uma amostra. O lote é rejeitado se tal amostra incluir pelo menos um
interruptor defeituoso. Calcule:
14
(c) Determine a moda, a (classe) mediana, os quartis e o valor esperado de X.
(d) Calcule, caso existam, a variância, o devio padrão e o coeficiente de variação de X.
Designaremos uma variável aleatória (v.a.) contı́nua se X tem função de distribuição (f.d.
cumulativa) FX (x) = P (X ≤ x) contı́nua ∀x ∈ R.
Propriedade 3.3. Propriedades da função de distribuição cumulativa FX (x) = P (X ≤ x):
1. limx→−∞ F (x) = 0, limx→+∞ F (x) = 1;
Note-se que,
P (a < X ≤ b) = P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X < b)
Z b
= fX (x) dx = FX (b) − FX (a) e P (X = x) = 0!
a
15
1. Valor médio ou esperança matemática:
Z ∞ Z ∞
µ = E[X] = x fX (x) dx, E[φ(X)] = φ(x) fX (x) dx
−∞ −∞
4. Variância:
Z ∞
2 2
σ = var(X) = E[(X − µ) ] = (x − µ)2 fX (x) dx = E[X 2 ] − (E[X])2
−∞
√
5. Desvio padrão: σ = σ2
EXERCÍCIO: Considere uma variável aleatória a tomar valores no intervalo [0, 1] todos
igualmente prováveis.
16
Propriedade 3.4. Falta de memória da v.a. exponencial:
EXERCÍCIO: Uma componente electrónica tem uma duração de vida, em centenas de horas, que
é uma variável aleatória com distribuição exponencial de valor esperado 0.5.
a) Calcule a função de distribuição da variável aleatória X.
b) Calcule a probabilidade de que a componente electrónica tenha uma duração de vida
superior a 150h, sabendo que já funcionou pelo menos durante 100 h.
c) Obtenha uma expressão para o quantil de probabilidade p, χp , e indique a mediana e o 1o
quartil.
Solução: (a) FX (x) = 0, x < 0; 1 − e−2x , x ≥ 0. (b) e−1 = 0.3679. (c) χp = −2−1 log(1 − p);
x̃ = χ1/2 = 2−1 log 2, χ1/4 = 2−1 log(4/3).
X ∼ N (µ, σ 2 ), a, b ∈ R =⇒ Y = aX + b ∼ N (aµ + b, a2 σ 2 ).
consequentemente,
z
X −µ
Z
2 1 − t2
X ∼ N (µ, σ ) =⇒ Z = ∼ N (0, 1) Φ(z) = P (Z ≤ z) = √ e 2 dt .
σ −∞ 2π
Propriedade 3.6. Cálculo da probabilidade com recurso à normal reduzida:
a−µ X −µ b−µ b−µ a−µ
P (a < X ≤ b) = P < ≤ =Φ −Φ ,
σ σ σ σ σ
Φ(−z) = 1 − Φ(z), ∀z ∈ R.
EXERCÍCIO: Seja X uma variável aleatória com distribuição normal de valor esperado 10 e
variância 4, que representa o comprimento de uma barra de ferro. Suponha que a barra é
considerada não defeituosa se 8 ≤ X ≤ 12 e defeituosa caso contrário.
a) Qual a probabilidade de que uma barra seja não defeituosa?
b) O custo de produção de cada barra é de 5 euros e o produtor vende cada barra não
defeituosa a 20 euros. Qual o lucro esperado por barra (considerando que não vende as
defeituosas)?
c) Qual a probabilidade de que, em 10 barras escolhidas ao acaso e com reposição do fabrico
diário, pelo menos 2 sejam defeituosas?
NOTA: > pnorm(12,10,2) = 0.8413447; > pnorm(8,10,2) = 0.1586553
17
3.3 Combinações lineares de variáveis aleatórias
n n n
X X X Xi
ci Xi , ci ∈ R, com casos particulares: Xi e X̄ = .
i=1 i=1 i=1
n
Propriedade 3.7 (Propriedades do valor médio e variância). Sejam X1 , X2 , . . . , Xn
variáveis aleatórias cada com valor esperado µi e variância σi2 , i.e. E[Xi ] = µi e V ar(Xi ) = σi2 ,
i = 1, 2, . . . , n. Prova-se que,
" n # n n
X X X
E ci X i = ci E [Xi ] = ci µi ,
i=1 i=1 i=1
n
! n n
X X X
V ar ci X i = c2i V ar (Xi ) = c2i σi2 , se as v.a.s forem independentes!
i=1 i=1 i=1
Consequentemente,
Pn n
i=1 Xi − nµ
X
∼aprox N (0, 1) Xi ∼aprox N nµ, nσ 2
√ ⇔
nσ 2 i=1
n
σ2
X̄ − µ aprox X Xi aprox
√ ∼ N (0, 1) ⇔ X̄ = ∼ N µ,
σ/ n i=1
n n
18
1. O tempo que um doente tem de esperar até ser atendido, em horas, tem distribuição
exponencial com valor esperado igual a 0.20.
2. Uma empresa vende peças cuja duração em centenas de horas é uma variável aleatória
contı́nua com a seguinte função de distribuição:
1 − e−λx , x > 0
FX (x) =
0 , caso contrário
3. O comprimento das peças produzidas por uma máquina é uma variável aleatória normal
com valor esperado µ (mm) e variância σ 2 (mm2 ). Uma peça é defeituosa se o seu
comprimento diferir do valor esperado mais do que σ. Sabe-se que 50% das peças
produzidas têm comprimento inferior a 2.5 mm.
(a) Qual a probabilidade da procura exceder 150 Kg de arroz num dia escolhido ao acaso?
(b) Calcule o valor esperado da procura diária de arroz, assim como uma medida da
variabilidade dessa procura.
(c) Qual a quantidade de arroz que deve ser deixada diariamente à disposição do público
para que não falte arroz em 95% dos dias?
19
5. O diâmetro interior de um tubo cilı́ndrico é uma variável aleatória X com distribuição
normal de valor esperado 3 cm e desvio padrão 0.02 cm e a espessura Y do mesmo tubo é
uma variável com distribuição normal de valor esperado 0.3 cm e desvio padrão 0.005 cm,
independente de X.
2. Um atirador acerta num alvo com probabilidade 1/3. Numa sequência de 30 tiros
independentes calcule:
3. O tempo (em horas) que João Pestana dorme por noite é uma variável aleatória com
distribuição uniforme no intervalo (7,12).
(a) Calcule a probabilidade de João Pestana dormir mais de 11 horas numa noite.
(b) Calcule a probabilidade de, em 20 noites, João Pestana dormir mais de 11 horas em
pelo menos 3 dessas noites.
(c) Qual a probabilidade de João Pestana dormir mais de 1100 horas em 100 noites?
4. O tempo de produção de uma certa peça de porcelana é uma variável aleatória com
distribuição exponencial de valor esperado 2 horas.
(a) Qual a probabilidade duma peça levar pelo menos 1h 45m a ser produzida?
(b) Verificando-se que em certo momento uma peça já está a ser produzida há 45m, qual
a probabilidade de ser necessário esperar pelo menos mais 1h 45m para concluir a
peça? Compare este resultado com o da alı́nea (a) e comente.
(c) Num dia em que a fábrica não tinha qualquer peça em stock foi aceite uma
encomenda de 100 peças, tendo a fábrica assumido o compromisso de fornecer as
peças no prazo máximo de 30 dias (o que corresponde a 240 horas de trabalho). Acha
que a fábrica tem boas possibilidades de cumprir o seu compromisso? Justifique.
(d) A fábrica mantém os registos do tempo de execução de cada peça. Seis peças foram
escolhidas ao acaso. Qual a probabilidade de 4 delas terem sido executadas no
máximo em 1h 45m cada uma?
5. Um dos elevadores dum grande edifı́cio público transporta, no máximo, 20 pessoas de cada
vez. A carga máxima transportada pelo elevador é de 1300 Kg. Os utilizadores deste
elevador pertencem a um largo estrato duma população em que se verificou que o peso
duma pessoa é aproximadamente normal com valor esperado 61 Kg e desvio padrão 10 Kg.
20
(a) Calcule a probabilidade do peso destes 20 utilizadores exceder a carga máxima.
(b) Sabendo que estão 15 pessoas no elevador com um peso de 950 Kg e que se espera a
entrada de mais 5 pessoas para completar a lotação e iniciar a viagem, determine a
probabilidade do peso total destes 20 passageiros exceder a carga máxima.
(c) Qual a probabilidade de haver nas 20 pessoas, que em certo momento viajam no
elevador,
i. quando muito 2 com peso superior a 85 Kg?
ii. pelo menos 1 com peso inferior a 40 Kg?
(d) Acha que, em face do tipo de população que utiliza o elevador, a carga máxima
indicada é adequada? Explique a sua opinião.
6. O intervalo de tempo, em minutos, entre a passagem de dois comboios numa estação de
metropolitano tem, em horas de ponta, distribuição uniforme no intervalo de (5, 15).
(a) Determine a probabilidade de se ter de esperar mais de 8 minutos entre dois comboios.
(b) Sabendo que o último comboio passou há oito minutos, qual é a probabilidade de se
ter de esperar pelo menos mais cinco minutos pelo próximo comboio?
(c) Admitindo que os intervalos de tempo entre passagens sucessivas dos comboios são
variáveis aleatórias independentes, calcule um valor aproximado para a probabilidade
da média dos intervalos de tempo entre 100 passagens exceder 9 minutos.
21
Estimador Média Amostral
Pn
Xi
X̄ = i=1 .
n
É um estimador centrado para a média populacional µ, i.e. E[X̄] = µ. Quando concretizada Pn a
−1
amostra aleatória - representada por (x1 , . . . , xn ) - obtém-se a estimativa x̄ = n i=1 xi , i.e.
um valor concreto para µ que quase certamente não será o verdadeiro valor de µ mas que deverá
aproximar-se deste pelas boas propriedades do estimador (e.g. E[X̄] = µ e limn→∞ V ar(X̄) = 0).
TPC: Verifique que E[X̄] = µ e limn→∞ V ar(X̄) = 0 usando as Propriedades 3.1 e 3.7.
O método da variável fulcral permite obter, com base numa amostra aleatória
X = (X1 , X2 , . . . , Xn ), um IC aleatório, correspondente a uma probabilidade 1 − α (usualmente
0.95, 0.99 e 0.9), para um parâmetro desconhecido θ (e.g. µ, σ 2 , p):
V (T (X), θ);
2. escolher α (valores mais comuns: 0.05, 0.01 ou 0.1) tal que (1 − α) × 100% corresponderá
ao nı́vel de confiança do IC (respectivamente, 95%, 99% e 90%);
22
CASOS CONCRETOS a (1 − α) × 100% = 95% (α = 0.05):
X̄ − µ
V (X̄, µ) = √ ∼ N (0, 1),
σ/ n
EXERCÍCIOS:
23
(a) Indique uma estimativa para o valor esperado da população em estudo.
(b) Construa um intervalo de confiança a 95% para a densidade média de construção.
Que dimensão deveria ter a amostra, aproximadamente, para que a amplitude do
intervalo fosse reduzida a metade?
(Solução: a) 4.544; b) i)
> 4.544-qnorm(0.975)*sqrt(2242.6/49-227.2^2/(49*50))/sqrt(50)
[1] 3.166492
> 4.544+qnorm(0.975)*sqrt(2242.6/49-227.2^2/(49*50))/sqrt(50)
[1] 5.921508
b) ii) n = 200)
EXERCÍCIOS 5.
1. Foram efectuados estudos em Los Angeles com o objectivo de determinar a concentração
de monóxido de carbono perto de vias rápidas. Para isso recolheram-se amostras de ar,
para as quais determinou-se a respectiva concentração (usando um espectrómetro). Os
resultados das medições em ppm (partes por milhão) foram os seguintes (para um perı́odo
de um ano):
102.2 98.4 104.1 101.0 102.2 100.4 98.6 88.2 78.8 83.0
84.7 94.8 105.1 106.2 111.2 108.3 105.2 103.2 99.0 98.8
2.3 1.9 2.1 2.8 2.3 3.6 1.4 1.8 2.1 3.2 2.0 1.9
24
5 Regressão Linear Simples
O modelo de RLS define-se como Y = β0 + β1 x + ε (ou Yi = β0 + β1 xi + εi , i = 1, . . . , n) sendo:
β0 - ordenada na origem,
β1 - declive da recta,
1. Obter o ‘melhor’ modelo: uma possibilidade será usar os estimadores (com base em
(Yi , xi )), ou P
estimativasP(com base em (yi , xi )) dos mı́nimos quadrados, i.e. tais que
minimizam ni=1 e2i = ni=1 (yi − β0 − β1 xi )2 obtendo-se,
( Pn Pn
(x −x̄)(yi −ȳ) xi yi −nx̄ȳ cov(x,y)
β̂1 = i=1Pn i 2 = Pi=1
n 2 2 = var(x)
i=1 (xi −x̄) i=1 xi −nx̄
β̂0 = ȳ − βˆ1 x̄.
3. Inferência:
\
(a) Estimar valores de Y dado x: E[Y |x] = β̂0 + β̂1 x
(b) Construir ICs e THs para β0 , β1 e E[Y |x]: podem usar-se os métodos habituais.
25
EXERCÍCIO. Interessa estudar a relação entre a resistência de um determinado tipo de
plástico (Y ) e o tempo que decorre a partir da conclusão do processo de moldagem até ao
momento de medição da resistência (x horas). As observações que se seguem foram efectuadas
em 12 peças construı́das com este plástico, escolhidas aleatoriamente:
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 32 48 72 64 48 16 40 48 48 24 80 56
yi 230 262 323 298 255 199 248 279 267 214 359 305
(a) Represente graficamente as observações e desenhe a recta que, no seu entender, melhor se
ajusta às observações.
(b) Considere um modelo de regressão linear simples para explicar as observações. Obtenha a
estimativa dos mı́nimos quadrados dos coeficientes da recta de regressão e desenhe-a no
gráfico.
(c) Obtenha uma estimativa pontual para o valor esperado da resistência obtida 48 horas
depois de concluı́da a moldagem. Acha legı́timo usar o mesmo procedimento tratando-se
de um perı́odo de 10 horas em vez de 48 horas? Justifique a sua resposta.
Solução: (b) β̂0 = 153.917, β̂1 = 2.417. (c) E[Y\ |x = 48] = 269.933; não é legı́timo para x = 10
2
porque 10 ∈ / (mini xi , maxi xi ). (d) R = 0.9593. A recta estimada ajusta-se bem: 95.9% da
variação de Y é explicada pela relação linear com x.
EXERCÍCIOS 6.
2. Da análise do consumo médio de energia por agregado familiar durante 10 dias de um mês
de Inverno numa cidade obtiveram-se os seguintes resultados, representando x a
temperatura diária média (o C) e Y o consumo médio de energia (kW ):
i 1 2 3 4 5 6 7 8 9 10
xi 15 14 12 14 12 11 11 10 12 13
yi 4.3 4.4 5.3 4.6 5.5 5.9 5.7 6.2 5.2 5.0
26
10
P 10
P 10
P
xi = 124 yi = 52.1 xi yi = 637.1
i=1 i=1 i=1
10 10
x2i = 1560 yi2 = 275.13
P P
i=1 i=1
O modelo de regressão linear simples foi usado para estudar a relação entre o consumo
médio de energia por agregado familiar e a temperatura diária média.
3. Uma liga metálica é submetida a várias tensões (x [103 Kgf /cm2 ]), tendo-se registado o
tempo decorrido (T [horas]) até se atingir a rotura. Alguns dos resultados obtidos nesta
experiência foram os seguintes:
i 1 2 3 4
xi 15 20 25 30
ti 2500 600 200 70
Admite-se que as duas variáveis estão relacionadas de acordo com o seguinte modelo de
regressão linear: ln T = β0 + β1 X + ε.
Soluções
Capı́tulo 2 (Probabilidade):
2a 0.0001
2b 0.001
2c 0.504
3a 988/2303
3b 435/2303
3c 22529/23030
3d 3/658
4a 1 + y − x
4b x − 2y
4c x − y
4d 1 − y
5a 2/3
5b 7/30
5c 7/30
5d 9/10
6a 0.13
27
6b 0.25
9a 0.82
9b 0.1
10a sim
10b não
11a 0.4
11b 2/3
12a 0.105
12b 0.1428
28
3b 0.6826
4a 0.375
4b µ = 4/3 = 133.3 Kg, σ = 62.36 kg.
4c 245.23 Kg.
5a µ = 3.6 cm, σ = 0.0224 cm.
5b 0.1867
TLC e revisões:
1 0.9236
2a 0.9999948
2b 0.0409
3 0.2
3 0.7939
3≈0
4a 0.4169
4b 0.4169
4c A probabilidade de cumprir com o compromisso é elevada, aproximadamente igual a 0.9772.
4d 0.3014
5a 0.0367
5b 0.0222
5(c)i 0.9994
5(c)ii 0.3032
6a 0.7
6b 0.286 e 5.5 m
6c 0.9997
Capı́tulo 4 (ICs):
1 (94.6,102.7), assumindo independência da amostra e população normal.
2 (1.7226,2.8434)
3 (27.67,29.13) h/semana.
Capı́tulo 5 (RLS):
1a β̂0 = 0.6359; β̂1 = 0.0965; E[Y\ |x = 90] = 9.2427.
2
1b R = 0.9711.
1c Modelo significativo.
2a ŷ = β̂0 + β̂1 x = 10.1589 − 0.3991x.
2b E[Y\ |x = 10] = 6.17, e não se deve usar para x = 20.
3a β̂0 = 11.2633; β̂1 = −0.23651.
3b E[Y\ |x = 25] = 210.7 horas, E[Y\ |x = 50] = 0.57 mas este não deve ser usado pois trata-se de
uma extrapolação sem qualquer fundamento.
29