Você está na página 1de 29

IST, PE-MA, 1o Sem, Q2 2022/23

Introdução à Probabilidade e Estatı́stica (IPE)


OBJECTIVO - Inferir sobre a população com base em informação amostral:
• extrair de forma eficiente a informação da amostra referente à população em estudo;
⇒ Inferência (Cap.4 - Estimação e Intervalos de Confiança);
• fornecer medidas que avaliam a qualidade das inferências.

Inclui teoria e técnicas usadas no dia-a-dia:


• análise descritiva de dados,
• inquéritos (estudos de mercado/opinião, eleições),
• inferências para avaliar e comparar a eficácia de procedimentos (ensaios experimentais e
tratamento clı́nicos),
• optimização (na qualidade do fabrico de produtos, consumo),
• previsão (ambiente e economia),
• decisão (planeamento, processos jurı́dicos).

1 Análise Exploratória de Dados


É essencial estarem bem definidas: a população (real ou conceptual) e/ou variável(eis) em
estudo, bem como o objectivo do trabalho.

Classificação das variáveis


• qualitativa nominal ou categórica (não ordenável)
• qualitativa ordinal
• quantitativa discreta
• quantitativa contı́nua (⊂ R)

Com base numa amostra - conjunto de dados (x1 , . . . , xn ) - ou, no caso bivariado ainda com
uma segunda amostra (y1 , . . . , yn ), pretende obter-se:

Medidas descritivas numéricas


• Localização: média (x̄ = ni=1 xi /n), mediana (valor central da amostra ordenada),
P
quantil (qα , α ∈ [0, 1], com quartis Qi = qi/4 i = 1, 2, 3)
 x[nα]+x[nα+1]
, nα ∈ N
Tipo 1: qα = x[dnαe], Tipo 2: qα = 2 , α ∈]0, 1[,
x[dnαe] , nα ∈
/N
sendo, bac ≤ a ≤ dae para qualquer a ∈ R e x[1] ≤ · · · ≤ x[n] a amostra ordenada;
moda (valor mais frequente); ”outliers” moderados são os valores da amostra menores
que Q1 − 1.5 × (Q3 − Q1 ) ou maiores que Q3 + 1.5 × (Q3 − Q1 ).

1
• Simetria/assimetria: existindo simetria a média, mediana e moda coincidem; nas
distribuições assimétricas a média é ”puxada”para o lado mais longo da distribuição e
geralmente verifica-se,

Assimetria positiva =⇒ média > mediana > moda

Assimetria negativa =⇒ média < mediana < moda


• Dispersão: amplitudes amostral e interquartil (IQR = Q3 − Q1 ), variância (s2 )
n n
2
X (xi − x̄)2 X x2i n
s = = − x̄2 ,
i=1
n−1 i=1
n − 1 n − 1

desvio-padrão (s) e coeficiente de variação (s/x̄).


• Dispersão e dependência bidimensional: covariância e correlação,
n n
X (xi − x̄)(yi − ȳ) X xi y i n
cov(x, y) = = − x̄ ȳ ∈ R
i=1
n−1 i=1
n−1 n−1
Pn
cov(x, y) xi yi − n x̄ ȳ
cor(x, y) = = p Pn 2 i=1 ∈ [−1, 1].
sx sy ( i=1 xi − n x̄2 ) ( ni=1 yi2 − n ȳ 2 )
P

Sucintamente, covariância positiva indica uma associação positiva (directa) entre as


variáveis, enquanto que covariância negativa indica uma associação negativa (inversa)
entre as variáveis. De forma mais precisa, se y = ax + b: cor(x, y) = −1 se a < 0 e
cor(x, y) = 1 se a > 0. Valores baixos indicam uma fraca associação linear entre as
variáveis.

(Parâmetros populacionais: média µ, variância σ 2 , correlação ρ - geralmente desconhecidos


e estimam-se usando as quantidades anteriores)

Descrição gráfica

• histograma e diagrama de barras


• caixa-de-bigodes (diagrama de extremos-e-quartis): rectângulo central (Q1 , Q2 , Q3 )
com 50% das observações centrais, caudas até ao menor e/ou maior valores
”não-outliers”, e destacar os ”outliers”.
• diagrama de dispersão

Por exemplo no histograma, a altura de cada retângulo é proporcional à fração da frequência da


classe (no total das medições ou observações). Usam-se critérios por vezes diferentes,
nomeadamente os software estatı́sticos, por exemplo na construção das classes, mas regras
básicas são geralmente satisfeitas (e.g. intervalos disjuntos e exaustivos, 5 a 20 classes).

EXERCÍCIOS 1.
1. Considere os dados referentes ao peso (em Kg) de 40 cães de pequeno porte

(a) Identifique e classifique a variável em estudo.


(b) Obtenha algumas medidas descritivas dos dados e comente.
(c) Determine o intervalo dos 25% menores e o intervalo dos 25% maiores da amostra,
bem como a amplitude inter-quantil. Indique o quantil amostral de 0.68.

2
4.3 6.8 9.2 7.2 8.7 8.6 6.6 5.2 8.1 10.9
7.4 4.5 3.8 7.6 6.8 7.8 8.4 7.5 10.5 6.0
7.7 8.1 7.0 8.2 8.4 8.8 6.7 8.2 9.4 7.7
6.3 7.7 9.1 7.9 7.9 9.4 8.2 6.7 8.2 6.5

Tabela 1: Peso (Kg) de cães de pequeno porte.

(d) Obtenha o histograma e a caixa de bigodes identificando possı́veis outliers.

(Resolução commandos R:

(b)
> pesocaes<-c(4.3,6.8,9.2,7.2,8.7,8.6,6.6,5.2,8.1,10.9,
7.4,4.5,3.8,7.6,6.8,7.8,8.4,7.5,10.5,6.0,
7.7,8.1,7.0,8.2,8.4,8.8,6.7,8.2,9.4,7.7,
6.3,7.7,9.1,7.9,7.9,9.4,8.2,6.7,8.2,6.5)
> summary(pesocaes)
> mean(pesocaes)
> median(pesocaes)
> var(pesocaes)
> sd(pesocaes)
> range(pesocaes)

(c)

> quantile(pesocaes,c(0.25,0.5,0.75))
> IQR(pesocaes)
> quantile(pesocaes,type=1)
> quantile(pesocaes,type=2)
> ?quantile
> quantile(pesocaes,0.68)

(d)

> par(mfrow=c(1,2))
> hist(pesocaes, col="red")
> hist(pesocaes, plot=FALSE)
> boxplot(pesocaes, col="red", main="Boxplot of pesocaes")
> boxplot(pesocaes, plot=FALSE)
> ?hist
> ?boxplot
> pesocaes[(pesocaes<quantile(pesocaes,0.25,type=2)-IQR(pesocaes,type=2)*1.5)
|(pesocaes>quantile(pesocaes,0.75,type=2)+IQR(pesocaes,type=2)*1.5)]

2. Os valores seguintes referem-se ao número de filhos e respectivo rendimento médio mensal


(em milhares de euros) de 10 famı́lias:

a) Classifique as variáveis em estudo.


b) Relativamente à amostra do número de filhos:

3
1 2 3 4 5 6 7 8 9 10
n. filhos 5 2 2 0 1 2 1 3 0 1
rendimento 6,2 1,3 2,5 1,2 3,6 3,0 0,7 3,4 2,1 4,1

i) Indique a mediana, os quartis e o quantil de ordem 0.9.


ii) Calcule a média e a moda, e comente a simetria/assimetria da amostra.
iii) Calcule a variância e o desvio padrão amostrais.
c) Obtenha o diagrama de barras, histograma, caixas de bigodes identificando possı́veis
outliers, e o diagrama de dispersão.
d) Calcule a covariância e a correlação entre o número de filhos e o rendimento mensal.

(Soluções: 1.5; 1,1.5,2; 3; 1.7; 2.23; 1.49; 1.71; 0.7)


(Resolução commandos R:

x<-c(5,2,2,0,1,2,1,3,0,1)
y<-c(6.2,1.3,2.5,1.2,3.6,3.0,0.7,3.4,2.1,4.1)
summary(x)
quantile(x)
quantile(x,0.9)
var(x)
sd(x)
par(mfrow=c(2,2))
plot(table(x),xlab="Número de filhos")
hist(y,xlab="Rendimento (milhares de euros)")
boxplot(x,y,xlab="Número de filhos e Rendimento",ylab="N. filhos e rendimento (milhares
plot(x,y,xlab="Número de filhos",ylab="Rendimento (milhares de euros)")
cov(x,y)
cor(x,y)

3. Em https://www.pordata.pt/Tema/Municipios/Turismo-84 obtiveram-se os dados


referentes ao Turismo da População Residente, Turistas por condição perante o trabalho.

a) Identifique a(s) populações e indique a variável em estudo.


b) Construa histogramas para comparar o turismo nos anos 2011 e 2020 entrando em
conta com os diferentes tipos de ocupação. Comente.
c) Analise a evolução temporal nos diferentes tipos de ocupação.

(Resolução commandos R:

> read.table("turistavsocupacao.txt")
> ?read.table
> read.table("turistavsocupacao.txt")$V1
> x<-read.table("turistavsocupacao.txt")

(b)

4
Histogram of y
3.0

3.0
2.0

2.0
Frequency
table(x)

1.0

1.0
0.0

0.0

0 1 2 3 5 0 1 2 3 4 5 6 7

Número de filhos Rendimento (milhares de euros)


N. filhos e rendimento (milhares de euros)

Rendimento (milhares de euros)


6

6
5


5
4


4



3


3


2


2
1

● ●
1


0

0 1 2 3 4 5

Número de filhos e Rendimento Número de filhos

5
> ano2011<-c(x$V1[1],x$V11[1],x$V21[1],x$V31[1],x$V41[1],x$V51[1])
> ano2021<-c(x$V10[1],x$V20[1],x$V30[1],x$V40[1],x$V50[1],x$V60[1])
> classes<-c("Empregado","Desempregado","Estudante","Domestico","Reformado","Outras")
> dev.new()
> par(mfrow=c(2,2))
> barplot(ano2011,names.arg=classes,main="Ano 2011",col="gray",ylab="Freq. Relativa (%)
> barplot(ano2021,names.arg=classes,main="Ano 2021",col="black",ylab="Freq. Relativa (%
> barplot(matrix(c(ano2011,ano2021),2,6,byrow=T),beside=F,names.arg=classes,
main="Turismo por ocupacao",ylab="Freqs. Relat.",legend=c("2011", "2021"))
> barplot(matrix(c(ano2011,ano2021),2,6,byrow=T),beside=T,names.arg=classes,
main="Turismo por ocupacao",ylab="Freqs. Relat.",legend=c("2011", "2021"))

(c)

> emp<-c(46.0,44.5,43.2,44.5,45.0,45.6,47.3,49.0,49.3,50.3)
> des<-c(4.4,6.4,8.2,6.8,6.5,5.8,5.4,4.3,3.8,4.1)
> matplot(c(2011:2020),matrix(c(emp,des),10,2))
> matplot(c(2011:2020),matrix(c(emp,des),10,2),type="l",ylab="Freqs. Relat.",xlab="Anos
> legend(x="right",col=c("black","red"),lty=1:2,legend=c("Empregado","Desempregado"))
> ?par

2 Probabilidade
Definição 2.1 (Experiência Aleatória). Processo segundo o qual obtêm-se a observação
imprevisı́vel, ou resultado aleatório.

Definição 2.2 (Espaço de Resultados Ω). Conjunto de todos os resultados possı́veis.

É importante distinguir se Ω é: discreto (finito, infinito numerável e.g. N) ou contı́nuo (infinito
não numerável e.g. R).

Definição 2.3 (Acontecimento ou Evento A ⊂ Ω). Qualquer subconjunto de Ω.

Casos particulares:

• acontecimento elementar - formado por um único elemento de Ω;

• acontecimentos mutuamente exclusivos, incompatı́veis ou disjuntos - não têm elementos


comuns i.e. a sua interseção é o conjunto vazio.

Seja A ∈ A qualquer acontecimento mensurável de Ω (i.e. pertencente a uma σ-álgebra, classe


adequada de conjuntos), mas abreviaremos o formalismo daqui em diante para A ⊂ Ω.

Definição 2.4 (Probabilidade, Axiomática de Kolmogorov). P : A → [0, 1] é uma função


de conjuntos:

1. P (Ω) = 1,

2. P (A) ≥ 0, ∀A ⊂ Ω,

6
3. A1 , A2 , . . . ⊂ Ω disjuntos dois a dois,

X
P (∪∞
i=1 Ai ) = P (Ai )
i=1

Nota: A axiomática comporta a definição de Laplace ( (no casos favoráveis)/(no casos possı́veis)
com Ω com todos os resultados equiprováveis) e a interpretação frequêncista (limn→∞ (no
observações favoráveis)/(no provas) com n provas ”iguais”).
TPC: Rever propriedades dos conjuntos e suas operações e.g. em Conjuntos (St.Aubyn,
Figueiredo, Loura, Ribeiro e Viegas 2004).
EXERCÍCIO: Num lançamento de um dado viciado, a probabilidade de ocorrer cada número
ı́mpar é o dobro da probabilidade de ocorrer cada número par:
a) Indique qual o espaço de resultados e calcule a probabilidade de cada acontecimento
elementar.
b) Calcule a probabilidade de que o número de pontos obtido no lançamento do dado seja
superior a 3.
c) Calcule a probabilidade de que o número de pontos obtido no lançamento do dado seja um
quadrado perfeito.
Solução: (a) Ω = {1, 2, 3, 4, 5, 6}, P ({1}) = P ({3}) = P ({5}) = 2/9,
P ({2}) = P ({4}) = P ({6}) = 1/9, (b) 4/9, (c) 1/3.
Propriedades 2.1.
1. P (∅) = 0
2. P (A) = 1 − P (A)
3. A ⊂ B =⇒ P (A) ≤ P (B)
4. P (B\A) = P (B ∩ A) = P (B) − P (A ∩ B)
5. P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
6. P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)

TPC: Provar as propriedades.

Definição 2.5 (Probabilidade condicionada). Sejam A, B ⊂ Ω e P (B) 6= 0,


P (A ∩ B)
P (A|B) = .
P (B)
NOTA: Ao condicionar estabelece-se um novo espaço de resultados, no qual todas as
propriedades anteriores são válidas.
EXERCÍCIO: Numa clinica dentária há 3 gabinetes A, B e C que são usados preferencialmente
por cada um dos médicos que aı́ trabalham. Admita que durante um determinado perı́odo num
dia tı́pico as probabilidades de cada gabinete estar ocupado são 0.5 para o A, 0.4 para o B e 0.3
para o C. Considere ainda que as probabilidades de cada um dos gabinetes B ou C estar
ocupado quando A está ocupado são ambas iguais a 0.2 e que a probabilidade de C estar
ocupado quando B está ocupado é 0.75. Se a probabilidade de todos os gabinetes estarem
simultaneamente ocupados for 0.15 determine:

7
a) A probabilidade de pelo menos um dos gabinetes estar ocupado.

b) A probabilidade de A estar ocupado sabendo que pelo menos um dos outros gabinetes está
ocupado.

Solução: (a) 0.85, (b) 0.125.

Teorema 2.1 (Lei da Probabilidade Composta).


Sejam A1 , A2 , . . . , An ⊂ Ω e P (A1 ∩ A2 ∩ . . . ∩ An−1 ) > 0, tem-se

P (A1 ∩ A2 ∩ . . . ∩ An ) = P (A1 )P (A2 |A1 )P (A3 |A1 ∩ A2 ) . . . P (An |A1 ∩ A2 ∩ . . . ∩ An−1 ).

Definição 2.6 (Acontecimentos independentes).

• A, B ⊂ Ω dizem-se independentes sse

P (A ∩ B) = P (A) × P (B).

• A1 , A2 , . . . , An ⊂ Ω dizem-se independentes sse

P (A1 ∩ · · · ∩ An ) = P (A1 ) × . . . × P (An ), . . . , P (Ai ∩ Aj ) = P (Ai ) × P (Aj ) ∀i 6= j.

Propriedades 2.2. Se A, B ⊂ Ω independentes, então

1. Ā, B são independentes,

2. A, B̄ são independentes,

3. Ā, B̄ são independentes.

TPC: Provar as propriedades.

EXERCÍCIO: A execução de um projecto de construção de um edifı́cio no tempo programado


está relacionada com os seguintes acontecimentos:

E = “escavação executada a tempo”

F = “fundações executadas a tempo”

S = “superestrutura executada a tempo”

supostos independentes e com probabilidades iguais a, respectivamente, 0.8, 0.7 e 0.9. Calcule a
probabilidade de:

a) O edifı́cio ser terminado no tempo previsto, devido ao cumprimento dos prazos nas três
actividades referidas.

b) O prazo de execução ser cumprido para a escavação e não ser cumprido em pelo menos
uma das outras actividades.

Solução: (a) 0.504, (b) 0.296.

8
Definição 2.7 (Partição de Ω). Coleção de subconjuntos de Ω, A1 , A2 , . . . , An tais que
Ai ∩ Aj = ∅ ∀i 6= j, e ∪ni=1 Ai = Ω.
Teorema 2.2 (Lei da Probabilidade Total).
Sendo B ⊂ Ω e {Ai }ni=1 uma partição de Ω cada com probabilidade não nula,
n
X
P (B) = P (B|Ai )P (Ai ).
i=1

Teorema 2.3 (Teorema de Bayes).


Sendo B ⊂ Ω, {Ai }ni=1 uma partição de Ω, todos com probabilidade não nula,
P (B|Ai )P (Ai )
P (Ai |B) = Pn , i = 1, . . . n.
j=1 P (B|Aj )P (Aj )

EXERCÍCIO: Suponha que 5% da população portuguesa numa determinada faixa etária sofre de
obesidade e que de entre estes, 75% têm elevado nı́vel de colestrol. De entre os não obesos, 30%
têm elevado nı́vel de colestrol.
a) Qual a percentagem de pessoas com elevado nı́vel de colestrol?

b) Qual a percentagem de pessoas que tendo elevado nı́vel de colestrol são obesos?
Solução: (a) 0.3225, (b) 0.1163.

EXERCÍCIOS 2 (Soluções no final do documento).


1. Admita que um lote contém peças pesando 5, 10, 15, 20 g e que existem pelo menos 2
peças de cada peso. Retiram-se 2 peças do lote. Seja X o peso da 1a peça retirada e Y o
peso da 2a peça retirada. Identifique e utilizando o plano xy marque:

(a) O espaço de resultados.


(b) O acontecimento A = {(x, y) : x = y}.
(c) O acontecimento B = {(x, y) : y > x}.
(d) O acontecimento C =“A 2a peça é duas vezes mais pesada do que a 1a ”.
(e) O acontecimento D =“A 1a peça pesa menos 10g do que a 2a ”.
(f) O acontecimento E =“O peso médio das duas peças é menor que 15 g”.
(g) Calcule as probabilidades dos acontecimentos em (b)–(f) supondo a
equiprobabilidades de todos os acontecimentos elementares.

2. Uma lotaria tem 10 000 bilhetes numerados de 0000 a 9999. O número do primeiro prémio
é o número do bilhete saı́do numa extracção ao acaso.

(a) Um jogador comprou um bilhete com o número 6789. Qual a probabilidade de lhe
sair o primeiro prémio?
(b) Se o jogador comprar todos os bilhetes cujos números têm todos os algarismos iguais,
qual a probabilidade de lhe sair o primeiro prémio?
(c) Qual a probabilidade do número premiado ter todos os algarismos diferentes?

3. De um grupo de 50 alunos do IST (10 alunos por ano) é escolhida ao acaso uma comissão
coordenadora de 4 pessoas. Qual a probabilidade de:

9
(a) Ser escolhido um e um só aluno do 1o ano?
(b) Serem escolhidos um aluno (e só um) do 1o ano e um aluno (e só um) do 5o ano?
(c) Serem escolhidos no máximo dois alunos do 1o ano?
(d) Serem todos do mesmo ano?

4. Sejam A e B acontecimentos tais que P (A) + P (B) = x e P (A ∩ B) = y. Determine em


função de x e de y a probabilidade de:

(a) Não se realizar nenhum dos dois acontecimentos.


(b) Que se realize um e um só dos dois acontecimentos.
(c) Que se realize pelo menos um dos dois acontecimentos.
(d) Que se realize quanto muito um único acontecimento.

5. Sejam P (A) = P (B) = 1/3 e P (A ∩ B) = 1/10. Calcule:

(a) P (B)
(b) P (A ∩ B)
(c) P (B ∩ A)
(d) P (A ∪ B)

6. Uma colecção de 100 programas de computador foi examinada para detectar erros de
“sintaxe”, “input/output” e de “outro tipo” diferente dos anteriores. Desses 100
programas, 20 tinham erros de “sintaxe”, 10 tinham erros de “input/output” e 5 tinham
erros de “outro tipo”, 6 tinham erros de “sintaxe” e de “input/output”, 3 tinham erros de
“sintaxe”e de “outro tipo”, 3 tinham erros de “input/output”e de “outro tipo”e 2 tinham
os três tipos de erros considerados. Um programa é seleccionado ao acaso desta colecção.
Determine a probabilidade de que o programa seleccionado tenha:

(a) Exclusivamente erros de “sintaxe”.


(b) Pelo menos um dos três tipos de erros.

7. Provar as propriedades 2.1.

8. Provar as propriedades 2.2.

9. Num parque natural há três percursos pedonais recomendados com durações e graus de
dificuldade distintos: A, B e C. Admita que 60% dos visitantes optam pelo percurso A,
30% pelo percurso B (podendo também já ter escolhido o percurso A) e 10% pelo percurso
C. Contudo, 10% acabam por fazer os percursos A e B; e, 5% dos que começaram por
fazer o percurso A, 20% dos que inicialmente fizeram o percurso B e 10% dos que já
fizeram os percursos A e B fazem também o percurso C.

(a) Qual é a probabilidade de um visitante fazer pelo menos um dos percursos?


(b) Sabendo que um visitante fez pelo menos um dos percursos A e B, qual é a
probabilidade de ele fazer também o percurso C?

10. Considere A e B tais que: P (A) = 1/4, P (B) = 1/3, P (A ∩ B) = 0.

(a) Poderão ser A e B incompatı́veis?


(b) São A e B independentes?

10
11. Um geólogo crê que existe petróleo numa certa região com probabilidade 0.8 e que, caso
haja petróleo, a probabilidade de sair petróleo na primeira perfuração é de 0.5.

(a) Qual a probabilidade de sair petróleo na primeira perfuração?


(b) Tendo-se procedido à primeira perfuração da qual não resultou petróleo, qual é a nova
probabilidade atribuı́da da existência de petróleo na região?

12. Num parque de estacionamento subterrâneo de uma superfı́cie comercial com três pisos,
um potencial cliente procura um lugar atendendo a dois critérios: profundidade do piso e
proximidade do elevador. A probabilidade de encontrar um lugar em cada um dos pisos é
igual a 0.3 para o piso −1, a 0.5 para o piso −2 e a 0.2 para o último piso. A probabilidade
de esse lugar se encontrar próximo do elevador é 0.05 no piso −1, 0.1 no piso −2 e 0.2 no
último piso.

(a) Qual é a probabilidade desse cliente conseguir um lugar junto ao elevador?


(b) Supondo que esse cliente conseguiu um lugar junto ao elevador, qual é a probabilidade
desse lugar se situar no piso −1?

3 Variáveis aleatórias (V.a.s)


3.1 V.a.s discretas
Abreviadamente, uma variável aleatória (v.a.) é uma função real a representar o resultado de
uma experiência aleatória, X : Ω → ΩX ⊂ R.
A variável diz-se discreta se ΩX for finito ou infinito numerável com:

Definição 3.1 (Função de probabilidade). P (X = x), x ∈ R:


X
P (X = x) ≥ 0, ∀x ∈ R, e P (X = x) = 1.
x∈ΩX

Definição 3.2 (Parâmetros e medidas de localização e dispersão).

1. Valor médio ou esperança matemática:


X X
µ = E[X] = xP (X = x), E[φ(X)] = φ(x)P (X = x)
x∈ΩX x∈ΩX

2. Quantil de ordem p, χp : P (X ≤ χp ) ≥ p e P (X ≥ χp ) ≥ 1 − p

3. Moda, m0 : P (X = m0 ) = maxx∈R P (X = x)

4. Variância:
X
σ 2 = var(X) = E[(X − µ)2 ] = (x − µ)2 P (X = x) = E[X 2 ] − (E[X])2
x∈ΩX


5. Desvio padrão: σ = σ2

6. Coeficiente de variação (adimensional): σ/|µ|

11
Propriedade 3.1 (Propriedades do valor médio e variância).
Sendo a, b constantes reais e X uma variável aleatória,

1. E[a] = a

2. E[aX + b] = aE[X] + b

3. var(X) ≥ 0

4. var(a) = 0

5. var[aX + b] = a2 var(X)

TPC: Provar as propriedades.

EXERCÍCIO: Calcular as medidas de localização e dispersão para as v.a.’s discretas:

a) X : P (X = x) = 1/10, 2/10, 7/10, x = 0, 1, 2,

b) Y : P (Y = y) = 7/10, 2/10, 1/10, y = 0, 1, 2.

Solução: (a) E[X] = 1.6, m0 = 2, Q1 = 1, Q2 = x̃ = Q3 = 2, V ar(X) = 0.44.


(b) E[X] = 0.4, m0 = 0, Q1 = Q2 = x̃ = 0, Q3 = 2, V ar(X) = 0.44.

Casos particulares importantes:

Definição 3.3 (V.a. Bernoulli). X ∼ Ber(p), ΩX = {0, 1}:

P (X = x) = px (1 − p)1−x x = 0, 1, E[X] = p, V ar(X) = p(1 − p).

Definição 3.4 (V.a. Binomial (n, p)). X ∼ Bin(n, p), ΩX = {0, 1, . . . , n}, representa o
número de sucessos em n repetições independentes da prova de Bernoulli (p):

n!
P (X = x) = px (1 − p)n−x , x = 0, 1, . . . , n; E[X] = np, V ar(X) = np(1 − p).
(n − x)! x!

EXERCÍCIO:
Numa sala existem três lâmpadas ”iguais”, que funcionam independentemente. A probabilidade
de cada lâmpada fundir num dado espaço de tempo é 0.1. Seja X a v.a. que representa o número
de lâmpadas que findo esse perı́odo de tempo estão a funcionar. Determine:

a) A função de probabilidade de X.

b) O valor esperado, moda, mediana e variância de X.

c) A função de distribuição de X.

Solução: (a) V.a. binomial (3,0.9):


P (X = x) = 0.001, x = 0; 0.027, x = 1; 0.243, x = 2; 0.729, x = 3.
(b) E[X] = 2.7, m0 = x̃ = 3, V (X) = 0.27.
(c) FX (x) = 0, x < 0; 0.001, 0 ≤ x < 1; 0.028, 1 ≤ x < 2; 0.271, 2 ≤ x < 3; 1, x ≥ 3.

12
Definição 3.5 (V.a. Uniforme discreta (1, n)). X ∼ U nif (1, n), ΩX = {1, . . . , n}, reflecte
uma população com n elementos, todos igualmente prováveis:
n+1 n2 − 1
P (X = x) = 1/n, x = 1, . . . , n, E[X] = , V ar(X) = .
2 12

EXERCÍCIO: Para as v.a.’s discretas U nif ome(1, 3) e U nif orme(1, 4):


a) Explicite a represente graficamente as funções de probabilidade e de distribuição.
b) Calcule as medidas de localização e dispersão.
Solução: (a) m0 = {1, 2, 3}, µ = 2, q0.5 = me = 2, q0.25 = 1, q0.75 = 3, V (X) = 2/3. (b)
m0 = {1, 2, 3, 4}, µ = 2.5, q0.5 = me = [2, 3], q0.25 = [1, 2], q0.75 = [3, 4], V (X) = 15/12.

Definição 3.6 (Função de distribuição cumulativa). FX (x), x ∈ R:


X
FX (x) = P (X ≤ x) = P (X = xi ), ∀x ∈ R.
xi ≤x

Propriedade 3.2. Propriedades da função de distribuição cumulativa FX (x) = P (X ≤ x):


1. limx→−∞ F (x) = 0, limx→+∞ F (x) = 1;
2. É uma função monótona não decrescente: se x1 > x2 , F (x1 ) ≥ F (x2 );
3. É uma função descontı́nua (em escada) sendo os pontos de descontinuidade os resultados
possı́veis da experiência aleatória; é contı́nua à direita, F (x+ ) = limt↓x F (t) = F (x);
4. P (X = x) = FX (x) − FX (x− ), sendo FX (x− ) = limt↑x F (t) = P (X < x);
5. P (a < X ≤ b) = P (X ≤ b) − P (X ≤ a) = FX (b) − FX (a).

EXERCÍCIO:
1. Considere a variável aleatória discreta X com a seguinte função de distribuição:


 0 ,x < 0
 1/6 , 0 ≤ x < 2


FX (x) = P (X ≤ x) = 1/4 , 2 ≤ x < 4
1/2 , 4 ≤ x < 6




1 , x ≥ 6.

(a) Determine a função de probabilidade de X.


(b) Calcule:
i. P (X ≤ 1).
ii. P (X > 5).
iii. P (0 < X ≤ 2).
iv. P (2 ≤ X < 6).
v. P (0 ≤ X ≤ 2).
vi. P (2 < X < 6).
Solução: (a) P (X = x) = 1/6, x = 0; 1/12, x = 2; 1/4, x = 4; 1/2, x = 6. (bi) 1/6, (bii) 1/2,
(biii) 1/12, (biv) 1/3, (bv) 1/4 (bvi) 1/4.

13
EXERCÍCIOS 3.1. (v.a.’s discretas):

1. Uma caixa contêm 5 lápis dos quais 2 estão partidos. Pretende-se avaliar o número de lápis
partidos e, retiram-se ao acaso e com reposição 3 lápis da caixa. Seja X a v.a. que
representa o número de lápis partidos nas 3 extracções.

(a) Caracterize a v.a., determine a sua função de probabilidade e represente-a


graficamente.
(b) Obtenha a função de distribuição cumulativa de X e represente-a graficamente.
(c) Obtenha a probabilidade de obter quando muito um lápis partido?

2. No final de uma visita a um parque, os visitantes são convidados a indicar os percursos


feitos. Em 30 respostas 20 mencionaram ter completado apenas o percurso A. Escolhidos
ao acaso e com reposição 2 dessas 30 respostas, qual é a probabilidade de pelo menos uma
referir ter feito apenas o percurso A?

3. Num armazém encontra-se um lote de 5000 janelas para serem distribuı́das mas, 100 destas
têm defeito. É efectuada uma inspecção sobre uma amostra de 10 janelas escolhidas ao
acaso com reposição. A inspecção rejeita o lote se forem encontradas mais do que duas
janelas com defeito nessa amostra.

(a) Caracterize a v.a.


(b) Qual a probabilidade de rejeição do lote?
(c) Qual o número esperado de janelas defeituosas?

4. Num lote de 500 interruptores existem 50 defeituosos. Desse lote retirou-se ao acaso e com
reposição uma amostra. O lote é rejeitado se tal amostra incluir pelo menos um
interruptor defeituoso. Calcule:

(a) A probabilidade de rejeição do lote se a amostra tiver dimensão 10.


(b) A dimensão máxima da amostra tal que a probabilidade de rejeição seja inferior a 0.3.

5. Considere a variável aleatória discreta X cujos resultados possı́veis {1, 2, 3, 4} são


equiprováveis.

(a) Determine a função de distribuição de X e represente-a graficamente.


(b) Calcule a moda, o valor esperado, a mediana, os quartis e a variância de X.

6. Considere a variável aleatória discreta X cujos resultados possı́veis {1, 2, 3, 4, 5} são


equiprováveis.

(a) Determine a função de distribuição de X.


(b) Calcule a moda, o valor esperado, a mediana, os quartis e a variância de X.

7. Considere a variável aleatória discreta X com a seguinte função de probabilidade:


 2
ax , x = −2, −1, 0, 1, 2
P (X = x) = a ∈ R.
0 caso contrário,

(a) Determine a e desenhe o gráfico da função.


(b) Determine a função de distribuição de X e represente-a graficamente.

14
(c) Determine a moda, a (classe) mediana, os quartis e o valor esperado de X.
(d) Calcule, caso existam, a variância, o devio padrão e o coeficiente de variação de X.

8. Considere a variável aleatória discreta X com a seguinte função de probabilidade:



cx , x = 1, 2, 3
P (X = x) =
0 , caso contrário

sendo c uma constante real.

(a) Determine c e desenhe o gráfico da função.


(b) Determine a função de distribuição de X e represente-a graficamente.
(c) Determine a moda, a (classe) mediana e o valor esperado de X.
(d) Calcule, caso existam, a variância, o desvio padrão e o coeficiente de variação de X.

3.2 V.a.s contı́nuas


Definição 3.7 (Função de distribuição cumulativa). FX (x), x ∈ R:
X
FX (x) = P (X ≤ x) = P (X = xi ), ∀x ∈ R.
xi ≤x

Designaremos uma variável aleatória (v.a.) contı́nua se X tem função de distribuição (f.d.
cumulativa) FX (x) = P (X ≤ x) contı́nua ∀x ∈ R.
Propriedade 3.3. Propriedades da função de distribuição cumulativa FX (x) = P (X ≤ x):
1. limx→−∞ F (x) = 0, limx→+∞ F (x) = 1;

2. É uma função monótona não decrescente: se x1 > x2 , F (x1 ) ≥ F (x2 );

3. É uma função contı́nua


Definição 3.8 (Função densidade de probabilidade). Denota-se por fX (x), x ∈ R:
Z ∞
fX (x) ≥ 0, ∀x ∈ R, e fX (x) dx = 1.
−∞

Relações entre as funções de densidade e distribuição:


Z x
dFX (x)
FX (x) = P (X ≤ x) = fX (u) du, e fX (x) = .
−∞ dx

Note-se que,
P (a < X ≤ b) = P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X < b)
Z b
= fX (x) dx = FX (b) − FX (a) e P (X = x) = 0!
a

Definição 3.9 (Parâmetros e medidas de localização e dispersão).

15
1. Valor médio ou esperança matemática:
Z ∞ Z ∞
µ = E[X] = x fX (x) dx, E[φ(X)] = φ(x) fX (x) dx
−∞ −∞

2. Quantil de ordem p, χp : FX (χp ) = p

3. Moda, m0 : fX (m0 ) = maxx∈R fX (x)

4. Variância:
Z ∞
2 2
σ = var(X) = E[(X − µ) ] = (x − µ)2 fX (x) dx = E[X 2 ] − (E[X])2
−∞


5. Desvio padrão: σ = σ2

6. Coeficiente de variação (adimensional): σ/|µ|

NOTA (Propriedades do valor médio e variância): A Proposição 3.1 verifica-se


igualmente para as v.a.s contı́nuas.

Definição 3.10 (V.a. Uniforme contı́nua).


X ∼ U nif [a, b]: ΩX = [a, b] com os resultados equiprováveis:

1  0 x<a
b+a (b − a)2
x−a
fX (x) = , a ≤ x ≤ b; FX (x) = a ≤ x < b ; E[X] = , V ar(X) = .
b−a  b−a 2 12
1 x≥b

EXERCÍCIO: Considere uma variável aleatória a tomar valores no intervalo [0, 1] todos
igualmente prováveis.

a) Indique o espaço de resultados associado e a função densidade de probabilidade e,


represente-a graficamente.

b) Determine a função de distribuição de X e represente-a graficamente.

c) Calcule a mediana, o valor esperado e a variância de X.

d) Repita as alı́neas anteriores considerando os intervalos [0, 1/2] e [0, 2].

Solução: (a) ΩX = [0, 1], fX (x) = 1, 0 ≤ x ≤ 1; 0,c.c.


(b) FX (x) = 0, x < 0; x, 0 ≤ x < 1; 1, x ≥ 1. (c) x̃ = E[X] = 1/2, V (X) = 1/12.
(di) ΩX = [0, 1/2], fX (x) = 2, 0 ≤ x ≤ 1/2; 0,c.c.,
FX (x) = 0, x < 0; 2x, 0 ≤ x < 1/2; 1, x ≥ 1/2., x̃ = µ = 1/4, σ 2 = 1/48.
(dii) ΩX = [0, 2], fX (x) = 1/2, 0 ≤ x ≤ 2; 0,c.c., FX (x) = 0, x < 0; x/2, 0 ≤ x < 2; 1, x ≥ 2,
x̃ = µ = 1, σ 2 = 1/3.

Definição 3.11 (V.a. Exponencial). X ∼ Exp(λ): ΩX = R+ comum na modelação do


“tempo de vida” de componentes eletrónicas e “tempo entre chegadas”:

−λx 0, x < 0, 1 1
fX (x) = λe , x ≥ 0; FX (x) = −λx E[X] = ; V ar(X) = 2 .
1 − e , x ≥ 0, λ λ

16
Propriedade 3.4. Falta de memória da v.a. exponencial:

P (X > t + x|X > t) = P (X > x), ∀x, t > 0.

EXERCÍCIO: Uma componente electrónica tem uma duração de vida, em centenas de horas, que
é uma variável aleatória com distribuição exponencial de valor esperado 0.5.
a) Calcule a função de distribuição da variável aleatória X.
b) Calcule a probabilidade de que a componente electrónica tenha uma duração de vida
superior a 150h, sabendo que já funcionou pelo menos durante 100 h.
c) Obtenha uma expressão para o quantil de probabilidade p, χp , e indique a mediana e o 1o
quartil.
Solução: (a) FX (x) = 0, x < 0; 1 − e−2x , x ≥ 0. (b) e−1 = 0.3679. (c) χp = −2−1 log(1 − p);
x̃ = χ1/2 = 2−1 log 2, χ1/4 = 2−1 log(4/3).

Definição 3.12 (V.a. Gaussiana ou Normal). X ∼ N (µ, σ 2 ):


1 (x−µ)2
fX (x) = √ e− 2σ2 , x ∈ R; E[X] = µ, var(X) = σ 2 .
2πσ 2

Propriedade 3.5. Fecho para transformações lineares:

X ∼ N (µ, σ 2 ), a, b ∈ R =⇒ Y = aX + b ∼ N (aµ + b, a2 σ 2 ).

consequentemente,
 z 
X −µ
Z
2 1 − t2
X ∼ N (µ, σ ) =⇒ Z = ∼ N (0, 1) Φ(z) = P (Z ≤ z) = √ e 2 dt .
σ −∞ 2π
Propriedade 3.6. Cálculo da probabilidade com recurso à normal reduzida:
     
a−µ X −µ b−µ b−µ a−µ
P (a < X ≤ b) = P < ≤ =Φ −Φ ,
σ σ σ σ σ
Φ(−z) = 1 − Φ(z), ∀z ∈ R.

EXERCÍCIO: Seja X uma variável aleatória com distribuição normal de valor esperado 10 e
variância 4, que representa o comprimento de uma barra de ferro. Suponha que a barra é
considerada não defeituosa se 8 ≤ X ≤ 12 e defeituosa caso contrário.
a) Qual a probabilidade de que uma barra seja não defeituosa?
b) O custo de produção de cada barra é de 5 euros e o produtor vende cada barra não
defeituosa a 20 euros. Qual o lucro esperado por barra (considerando que não vende as
defeituosas)?
c) Qual a probabilidade de que, em 10 barras escolhidas ao acaso e com reposição do fabrico
diário, pelo menos 2 sejam defeituosas?
NOTA: > pnorm(12,10,2) = 0.8413447; > pnorm(8,10,2) = 0.1586553

Solução: (a) 0.6826895; (b) 8.65379 euros; (c) 0.8757855.

17
3.3 Combinações lineares de variáveis aleatórias
n n n
X X X Xi
ci Xi , ci ∈ R, com casos particulares: Xi e X̄ = .
i=1 i=1 i=1
n
Propriedade 3.7 (Propriedades do valor médio e variância). Sejam X1 , X2 , . . . , Xn
variáveis aleatórias cada com valor esperado µi e variância σi2 , i.e. E[Xi ] = µi e V ar(Xi ) = σi2 ,
i = 1, 2, . . . , n. Prova-se que,
" n # n n
X X X
E ci X i = ci E [Xi ] = ci µi ,
i=1 i=1 i=1

n
! n n
X X X
V ar ci X i = c2i V ar (Xi ) = c2i σi2 , se as v.a.s forem independentes!
i=1 i=1 i=1

Combinações lineares de v.a.s normais independentes


Teorema 3.1. Uma combinação linear de v.a.’s normais é uma v.a. normal.
Corolário 3.1. Se Xi ∼ N (µi , σi2 ), i = 1, . . . , n, independentes, então
n n n
!
X X X
ci X i ∼ N ci µ i , c2i σi2 .
i=1 i=1 i=1

Consequentemente, se Xi ∼ N (µ, σ 2 ), i = 1, . . . , n, independentes e identicamente distribuı́das:


n n
σ2
 
X
2
 1X
Xi ∼ N nµ, nσ e X̄ = Xi ∼ N µ, .
i=1
n i=1 n

3.4 Teorema do Limite Central (população arbitrária!)


Teorema 3.2 (Teorema do Limite Central (versão simplificada)).
Sendo Xi v.a.’s independentes, E[Xi ] = µ, var(Xi ) = σ 2 < ∞, i = 1, . . . , n, então
Pn   Pn 
i=1 Xi − nµ i=1 Xi /n − µ
lim P √ ≤ z = lim P √ ≤ z = φ(z).
n→∞ σ n n→∞ σ/ n

Consequentemente,
Pn n
i=1 Xi − nµ
X
∼aprox N (0, 1) Xi ∼aprox N nµ, nσ 2

√ ⇔
nσ 2 i=1
n
σ2
 
X̄ − µ aprox X Xi aprox
√ ∼ N (0, 1) ⇔ X̄ = ∼ N µ,
σ/ n i=1
n n

EXERCÍCIO: Um elevador de acesso a um grupo de galerias de uma mina tem capacidade


nominal de 3800kg. Os mineiros que usam regularmente o elevador têm pesos que seguem uma
distribuição com valor esperado 75kg e desvio padrão 8kg. Calcule aproximadamente a
probabilidade de ser excedida a capacidade nominal do elevador quando nele se encontrarem 50
mineiros. (Solução: 0.1894.)

EXERCÍCIOS 3.2. (V.a.s contı́nuas).

18
1. O tempo que um doente tem de esperar até ser atendido, em horas, tem distribuição
exponencial com valor esperado igual a 0.20.

(a) Qual a probabilidade de ele ter de esperar mais de 30 minutos?


(b) Sabendo que um doente já esperou mais de 30 minutos, qual é a probabilidade de
ainda ter de esperar pelo menos mais 15 minutos?

2. Uma empresa vende peças cuja duração em centenas de horas é uma variável aleatória
contı́nua com a seguinte função de distribuição:

1 − e−λx , x > 0

FX (x) =
0 , caso contrário

(a) Determine a função de densidade de probabilidade de X.


(b) Determine a média, mediana, 1o e 3o quartis bem como a variância de X.
(c) A empresa dispõe de um stock de peças dos tipos A e B. Ao tipo A está associado um
parâmetro λ = 1/2 e ao tipo B um parâmetro λ = 1.
i. Compare o desempenho das peças dos stocks A e B através dos parâmetros
obtidos em (a).
ii. De um lote formado por 100 peças do tipo A e 50 peças do tipo B, retirou-se ao
acaso uma peça, cuja duração foi ensaiada. Em relação ao resultado desse ensaio
sabe-se apenas que a duração da peça foi inferior a 90h. Calcule a probabilidade
de que a peça escolhida seja do tipo B.

3. O comprimento das peças produzidas por uma máquina é uma variável aleatória normal
com valor esperado µ (mm) e variância σ 2 (mm2 ). Uma peça é defeituosa se o seu
comprimento diferir do valor esperado mais do que σ. Sabe-se que 50% das peças
produzidas têm comprimento inferior a 2.5 mm.

(a) Calcule o valor de µ.


(b) Determine a probabilidade de que uma peça seja não defeituosa.
NOTA: > pnorm(1,0,1) = 0.8413447

4. A procura diária de arroz num supermercado, em centenas de quilos, é uma variável


aleatória com função densidade de probabilidade:

 (2x)/3 , 0≤ x <1
fX (x) = −x/3 + 1 , 1 ≤ x ≤ 3
0 , restantes valores de x

(a) Qual a probabilidade da procura exceder 150 Kg de arroz num dia escolhido ao acaso?
(b) Calcule o valor esperado da procura diária de arroz, assim como uma medida da
variabilidade dessa procura.
(c) Qual a quantidade de arroz que deve ser deixada diariamente à disposição do público
para que não falte arroz em 95% dos dias?

19
5. O diâmetro interior de um tubo cilı́ndrico é uma variável aleatória X com distribuição
normal de valor esperado 3 cm e desvio padrão 0.02 cm e a espessura Y do mesmo tubo é
uma variável com distribuição normal de valor esperado 0.3 cm e desvio padrão 0.005 cm,
independente de X.

(a) Calcule o valor esperado e o desvio padrão do diâmetro exterior do tubo.


(b) Calcule a probabilidade de que o diâmetro exterior do tubo exceda 3.62 cm.

EXERCÍCIOS 3.3. (Revisões e TLC).


1. Um estudante decidiu amealhar diariamente uma pequena quantia para comprar uma
bicicleta. As probabilidades do estudante amealhar 50, 100 e 250 cêntimos em cada dia são
respectivamente 0.3, 0.6 e 0.1. Calcule, justificando, a probabilidade do estudante
amealhar mais do que 350 euros durante o ano (365 dias).

2. Um atirador acerta num alvo com probabilidade 1/3. Numa sequência de 30 tiros
independentes calcule:

(a) a probabilidade do atirador acertar pelo menos 1 vez no alvo.


(b) a probabilidade aproximada de o atirador acertar pelo menos 15 vezes no alvo usando
a aproximação à normal (sugestão: obtenha o valor exacto e compare-o com o
aproximado).

3. O tempo (em horas) que João Pestana dorme por noite é uma variável aleatória com
distribuição uniforme no intervalo (7,12).

(a) Calcule a probabilidade de João Pestana dormir mais de 11 horas numa noite.
(b) Calcule a probabilidade de, em 20 noites, João Pestana dormir mais de 11 horas em
pelo menos 3 dessas noites.
(c) Qual a probabilidade de João Pestana dormir mais de 1100 horas em 100 noites?

4. O tempo de produção de uma certa peça de porcelana é uma variável aleatória com
distribuição exponencial de valor esperado 2 horas.

(a) Qual a probabilidade duma peça levar pelo menos 1h 45m a ser produzida?
(b) Verificando-se que em certo momento uma peça já está a ser produzida há 45m, qual
a probabilidade de ser necessário esperar pelo menos mais 1h 45m para concluir a
peça? Compare este resultado com o da alı́nea (a) e comente.
(c) Num dia em que a fábrica não tinha qualquer peça em stock foi aceite uma
encomenda de 100 peças, tendo a fábrica assumido o compromisso de fornecer as
peças no prazo máximo de 30 dias (o que corresponde a 240 horas de trabalho). Acha
que a fábrica tem boas possibilidades de cumprir o seu compromisso? Justifique.
(d) A fábrica mantém os registos do tempo de execução de cada peça. Seis peças foram
escolhidas ao acaso. Qual a probabilidade de 4 delas terem sido executadas no
máximo em 1h 45m cada uma?

5. Um dos elevadores dum grande edifı́cio público transporta, no máximo, 20 pessoas de cada
vez. A carga máxima transportada pelo elevador é de 1300 Kg. Os utilizadores deste
elevador pertencem a um largo estrato duma população em que se verificou que o peso
duma pessoa é aproximadamente normal com valor esperado 61 Kg e desvio padrão 10 Kg.

20
(a) Calcule a probabilidade do peso destes 20 utilizadores exceder a carga máxima.
(b) Sabendo que estão 15 pessoas no elevador com um peso de 950 Kg e que se espera a
entrada de mais 5 pessoas para completar a lotação e iniciar a viagem, determine a
probabilidade do peso total destes 20 passageiros exceder a carga máxima.
(c) Qual a probabilidade de haver nas 20 pessoas, que em certo momento viajam no
elevador,
i. quando muito 2 com peso superior a 85 Kg?
ii. pelo menos 1 com peso inferior a 40 Kg?
(d) Acha que, em face do tipo de população que utiliza o elevador, a carga máxima
indicada é adequada? Explique a sua opinião.
6. O intervalo de tempo, em minutos, entre a passagem de dois comboios numa estação de
metropolitano tem, em horas de ponta, distribuição uniforme no intervalo de (5, 15).
(a) Determine a probabilidade de se ter de esperar mais de 8 minutos entre dois comboios.
(b) Sabendo que o último comboio passou há oito minutos, qual é a probabilidade de se
ter de esperar pelo menos mais cinco minutos pelo próximo comboio?
(c) Admitindo que os intervalos de tempo entre passagens sucessivas dos comboios são
variáveis aleatórias independentes, calcule um valor aproximado para a probabilidade
da média dos intervalos de tempo entre 100 passagens exceder 9 minutos.

4 (IC) Intervalos de Confiança


4.1 Estimação
De uma forma geral interessa estudar uma determinada população, representada por uma
variável aleatória (v.a.) X que segue um modelo probabilı́stico conhecido, por exemplo,
N (µ, σ), Bin(n, p), Exponencial(λ) ...
a menos de um parâmetro populacional desconhecido, por exemplo:
µ = E(X) - média populacional
p = P (sucesso) - probabilidade de sucesso em populações Bernoulli ou Binomial
λ = 1/E(X) numa população Exponencial.

Definição 4.1 (Amostra Aleatória). Uma amostra aleatória de dimensão n proveniente de


uma população X é um conjunto de n variáveis aleatórias independentes e identicamente
distribuı́das (i.i.d.), representada por:
X = (X1 , X2 , . . . , Xn ).
No que se segue θ representa um parâmetro desconhecido da população X.
Definição 4.2 (Estimador). Um estimador θ̂n = T (X) é uma função exclusiva da amostra
aleatória e portanto independente de parâmetros desconhecidos. Note-se que é uma variável
aleatória.
Dois estimadores a salientar:

21
Estimador Média Amostral
Pn
Xi
X̄ = i=1 .
n
É um estimador centrado para a média populacional µ, i.e. E[X̄] = µ. Quando concretizada Pn a
−1
amostra aleatória - representada por (x1 , . . . , xn ) - obtém-se a estimativa x̄ = n i=1 xi , i.e.
um valor concreto para µ que quase certamente não será o verdadeiro valor de µ mas que deverá
aproximar-se deste pelas boas propriedades do estimador (e.g. E[X̄] = µ e limn→∞ V ar(X̄) = 0).

TPC: Verifique que E[X̄] = µ e limn→∞ V ar(X̄) = 0 usando as Propriedades 3.1 e 3.7.

Estimador Variância Amostral (corrigida)


Pn 2
Pn
i=1 (Xi − X̄) X2 n
2
Sn−1 = = i=1 i − X̄ 2 .
n−1 n−1 n−1
É um estimador comum para a variância populacional σ 2 . A divisão por (n − 1) garante a
2
centralidade (i.e. E[Sn−1 ] = σ 2 e limn→∞ V ar(Sn−1
2
) = 0).
2
TPC: Verifique que E[Sn−1 ] = σ 2 usando as Propriedades 3.1 e 3.7.

4.2 ICs para parâmetros populacionais

MÉTODO DA VARIÁVEL FULCRAL

O método da variável fulcral permite obter, com base numa amostra aleatória
X = (X1 , X2 , . . . , Xn ), um IC aleatório, correspondente a uma probabilidade 1 − α (usualmente
0.95, 0.99 e 0.9), para um parâmetro desconhecido θ (e.g. µ, σ 2 , p):

[I(X), S(X)] tal que P (θ ∈ [I(X), S(X)]) = 1 − α.

1. Identificar a variável (aleatória!) fulcral, função do estimador T(X) e do parâmetro


desconhecido θ, com distribuição conhecida:

V (T (X), θ);

2. escolher α (valores mais comuns: 0.05, 0.01 ou 0.1) tal que (1 − α) × 100% corresponderá
ao nı́vel de confiança do IC (respectivamente, 95%, 99% e 90%);

3. obter os quantis de probabilidade α/2 e 1 − α/2,



χα/2 : P (V < χα/2 ) = α/2
χ1−α/2 : P (V > χ1−α/2 ) = α/2;

4. obter os limites inferior e superior do IC aleatório, I(X) e S(X), resolvendo a dupla


desigualdade,

P χα/2 < V (T (X), θ) < χ1−α/2 = P (I(X) < θ < S(X)) = 1 − α;

5. concretizar o IC com base na amostra dada, obtendo-se [i(x), s(x)].

22
CASOS CONCRETOS a (1 − α) × 100% = 95% (α = 0.05):

IC para µ com σ 2 conhecido:


Seja X com distribuição normal de média µ desconhecida mas variância σ 2 conhecida. Pela
variável fulcral (v.a. que depende do parâmetro desconhecido e com distribuição
conhecida),

X̄ − µ
V (X̄, µ) = √ ∼ N (0, 1),
σ/ n

conseguem-se obter os quantis FN−1(0,1) (0.025) = φ−1 (0.025) = −1.96 e


FN−1(0,1) (0.975) = φ−1 (0.975) = 1.96 tais que,
   
X̄ − µ σ σ
P −1.96 < √ < 1.96 = P X̄ − 1.96 √ < µ < X̄ + 1.96 √ = 0.95.
σ/ n n n

Pela resolução da dupla desigualdade, obtém-se o IC aleatório a 95% para µ,


 
σ σ
X̄ − 1.96 √ , X̄ + 1.96 √
n n

No caso de população arbitrária com n elevado, o argumento anterior repete-se


‘aproximadamente’ justificado pelo Teorema do Limite Central.

IC para µ com σ 2 desconhecido, população arbitrária e n elevado:


Estimando-se σ 2 por Sn−1
2
, de modo semelhante obtém-se o IC aleatório aproximado a 95%
para µ,
 
Sn−1 Sn−1
X̄ − 1.96 √ , X̄ + 1.96 √
n n

EXERCÍCIOS:

1. Medições do comprimento de 25 peças produzidas por uma máquina conduziram a uma


média x = 140 mm. Admita que cada peça tem comprimento aleatório com distribuição
normal de valor esperado µ e desvio padrão σ = 10 mm, e que o comprimento de cada peça
é independente das restantes.

(a) Indique uma estimativa para o valor esperado da população em estudo.


(b) Construa intervalos de confiança a 95%, 99% e 90% para o valor esperado da
população e compare os intervalos.

(Solução: a) 140 mm; b) IC a 95% com qnorm(0.975)=1.959964, (136.08,143.92); a 99%


com qnorm(0.995)=2.575829, (134.85,145.15); a 90% com qnorm(0.95)=1.644854,
(136.71,143.29).)

2. Da concretização de uma amostra aleatória de 50 lotes referente à (v.a. X) densidade de


construção num grande projecto urbano, obtiveram-se os seguintes valores:
50
X 50
X
xi = 227.2 e x2i = 2242.6.
i=1 i=1

23
(a) Indique uma estimativa para o valor esperado da população em estudo.
(b) Construa um intervalo de confiança a 95% para a densidade média de construção.
Que dimensão deveria ter a amostra, aproximadamente, para que a amplitude do
intervalo fosse reduzida a metade?
(Solução: a) 4.544; b) i)

> 4.544-qnorm(0.975)*sqrt(2242.6/49-227.2^2/(49*50))/sqrt(50)
[1] 3.166492
> 4.544+qnorm(0.975)*sqrt(2242.6/49-227.2^2/(49*50))/sqrt(50)
[1] 5.921508
b) ii) n = 200)

Duas caracterı́sticas importantes:


• A amplitude do IC reflete a precisão do IC e portanto da estimação.
• O erro de estimação, ou semi-amplitude do IC, também é uma medida usual para
avaliar a precisão da estimação.
Variável fulcral para comparação de médias com base em amostras independentes:
Populações normais com variâncias conhecidas (se desconhecidas, o resultado é válido
assimptoticamente, substituindo-se as variâncias por seus estimadores):
(X̄1 − X̄2 ) − (µ1 − µ2 )
q 2 ∼ N (0, 1).
σ1 σ22
n1
+ n2

EXERCÍCIOS 5.
1. Foram efectuados estudos em Los Angeles com o objectivo de determinar a concentração
de monóxido de carbono perto de vias rápidas. Para isso recolheram-se amostras de ar,
para as quais determinou-se a respectiva concentração (usando um espectrómetro). Os
resultados das medições em ppm (partes por milhão) foram os seguintes (para um perı́odo
de um ano):
102.2 98.4 104.1 101.0 102.2 100.4 98.6 88.2 78.8 83.0
84.7 94.8 105.1 106.2 111.2 108.3 105.2 103.2 99.0 98.8

Determine um intervalo de confiança a 95% para a concentração esperada de monóxido de


carbono. Indique as hipóteses a considerar para validar o resultado.
2. Suponha que a intensidade da corrente, em amperes, num certo circuito é uma variável
aleatória com distribuição normal com variância igual a 0.39. Uma amostra de dimensão
12 desta variável aleatória conduziu aos seguintes resultados:

2.3 1.9 2.1 2.8 2.3 3.6 1.4 1.8 2.1 3.2 2.0 1.9

Construa um intervalo de confiança a 99% para o valor esperado da intensidade da


corrente.
3. De modo a estudar a média do tempo despendido semanalmente, por famı́lia, a ver TV
numa grande cidade do sul dos EUA, um sociólogo recolheu uma amostra de 500 famı́lias.
Tal amostra conduziu a uma média de 28.4 h/semana e um desvio padrão corrigido (s) de
8.3 h/semana. Calcule um IC a 95% para o valor esperado.

24
5 Regressão Linear Simples
O modelo de RLS define-se como Y = β0 + β1 x + ε (ou Yi = β0 + β1 xi + εi , i = 1, . . . , n) sendo:

Y - variável aleatória dependente, a explicar

x - variável não aleatória, independente, explicativa

β0 - ordenada na origem,

β1 - declive da recta,

ε - erro aleatório supostamente verificando: E[ε] = 0 e V ar[ε] = σ 2 . Adicionalmente


assume-se frequentemente ε ∼ N (0, σ 2 ), para obter os estimadores e suas propriedades, e
construir ICs.

Com base numa amostra (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ), de dimensão n, pretende-se:

1. Obter o ‘melhor’ modelo: uma possibilidade será usar os estimadores (com base em
(Yi , xi )), ou P
estimativasP(com base em (yi , xi )) dos mı́nimos quadrados, i.e. tais que
minimizam ni=1 e2i = ni=1 (yi − β0 − β1 xi )2 obtendo-se,
( Pn Pn
(x −x̄)(yi −ȳ) xi yi −nx̄ȳ cov(x,y)
β̂1 = i=1Pn i 2 = Pi=1
n 2 2 = var(x)
i=1 (xi −x̄) i=1 xi −nx̄
β̂0 = ȳ − βˆ1 x̄.

2. Avaliar a qualidade do modelo:


P  P
n n 
(a) Coeficiente de Determinação: R2 = i=1 (Ŷi − Ȳ )2 / 2
i=1 (Yi − Ȳ ) , geralmente
calculado por

cov 2 (x, y) var(x)


r2 = ρ̂2 = = β̂12
var(x)var(y) var(y)
Pn 2
( ni=1 xi yi − nx̄ȳ)2
P
( i=1 (xi − x̄)(yi − ȳ))
= Pn Pn = Pn 2
( i=1 xi − nx̄2 )( ni=1 yi2 − nȳ 2 )
2 2
P
i=1 (xi − x̄) i=1 (yi − ȳ)

Note-se que r2 × 100% ∈ (0, 100), reflete a percentagem da variabilidade do Y que o


modelo consegue explicar.
(b) β̂1 6= 0 indica a relevância ou significância do modelo, que pode ser avaliada através
de um IC ou TH.

3. Inferência:
\
(a) Estimar valores de Y dado x: E[Y |x] = β̂0 + β̂1 x

E[εi ] = 0, V ar[εi ] = σ 2 E[Y |x] = β0 + β1 x



e independência ∀i6=j E[β̂0 + β̂1 x] = β0 + β1 x

(b) Construir ICs e THs para β0 , β1 e E[Y |x]: podem usar-se os métodos habituais.

25
EXERCÍCIO. Interessa estudar a relação entre a resistência de um determinado tipo de
plástico (Y ) e o tempo que decorre a partir da conclusão do processo de moldagem até ao
momento de medição da resistência (x horas). As observações que se seguem foram efectuadas
em 12 peças construı́das com este plástico, escolhidas aleatoriamente:
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 32 48 72 64 48 16 40 48 48 24 80 56
yi 230 262 323 298 255 199 248 279 267 214 359 305

(a) Represente graficamente as observações e desenhe a recta que, no seu entender, melhor se
ajusta às observações.

(b) Considere um modelo de regressão linear simples para explicar as observações. Obtenha a
estimativa dos mı́nimos quadrados dos coeficientes da recta de regressão e desenhe-a no
gráfico.

(c) Obtenha uma estimativa pontual para o valor esperado da resistência obtida 48 horas
depois de concluı́da a moldagem. Acha legı́timo usar o mesmo procedimento tratando-se
de um perı́odo de 10 horas em vez de 48 horas? Justifique a sua resposta.

(d) Calcule o coeficiente de determinação e comente o valor obtido.

Solução: (b) β̂0 = 153.917, β̂1 = 2.417. (c) E[Y\ |x = 48] = 269.933; não é legı́timo para x = 10
2
porque 10 ∈ / (mini xi , maxi xi ). (d) R = 0.9593. A recta estimada ajusta-se bem: 95.9% da
variação de Y é explicada pela relação linear com x.

EXERCÍCIOS 6.

1. Um estudo sobre a influência da velocidade do vento (X), em m/s, na quantidade de água


(Y ) que se evapora por dia, em centenas de litros, na albufeira de certa barragem, a
temperaturas constantes, conduziu a:
xi 20 50 30 100 70
yi 3 5 3 10 8

(a) Adoptando um modelo de regressão linear simples, estime a recta de regressão de Y


sobre X e obtenha uma estimativa da quantidade média de água evaporada quando a
velocidade do vento é igual a 90m/s. Faça uso dos seguintes valores:
P 2 P 2 P
x̄ = 54.0 ȳ = 5.8 xi = 18700 yi = 207 xi yi = 1960
i i i

(b) Calcule o coeficiente de determinação do modelo estimado.


(c) Avalie a significância da regressão face ao valor obtido na alı́nea anterior.

2. Da análise do consumo médio de energia por agregado familiar durante 10 dias de um mês
de Inverno numa cidade obtiveram-se os seguintes resultados, representando x a
temperatura diária média (o C) e Y o consumo médio de energia (kW ):

i 1 2 3 4 5 6 7 8 9 10
xi 15 14 12 14 12 11 11 10 12 13
yi 4.3 4.4 5.3 4.6 5.5 5.9 5.7 6.2 5.2 5.0

26
10
P 10
P 10
P
xi = 124 yi = 52.1 xi yi = 637.1
i=1 i=1 i=1
10 10
x2i = 1560 yi2 = 275.13
P P
i=1 i=1

O modelo de regressão linear simples foi usado para estudar a relação entre o consumo
médio de energia por agregado familiar e a temperatura diária média.

(a) Escreva a equação da recta de regressão estimada.


(b) Qual o valor predito para o consumo médio num dia de temperatura média igual a
10o C? Que responderia se lhe fosse pedida uma predição do consumo médio para um
dia com temperatura média de 20o C?

3. Uma liga metálica é submetida a várias tensões (x [103 Kgf /cm2 ]), tendo-se registado o
tempo decorrido (T [horas]) até se atingir a rotura. Alguns dos resultados obtidos nesta
experiência foram os seguintes:

i 1 2 3 4
xi 15 20 25 30
ti 2500 600 200 70

Admite-se que as duas variáveis estão relacionadas de acordo com o seguinte modelo de
regressão linear: ln T = β0 + β1 X + ε.

(a) Obtenha as estimativas dos mı́nimos quadrados de β0 e β1 .


(b) O modelo foi utilizado para prever os tempos correspondentes às tensões de
25 × 103 Kgf /cm2 e 50 × 103 Kgf /cm2 . Calcule as estimativas desses tempos. Diga,
justificando, se concorda que o modelo adoptado seja usado para predizer aqueles
tempos.

Soluções
Capı́tulo 2 (Probabilidade):
2a 0.0001
2b 0.001
2c 0.504
3a 988/2303
3b 435/2303
3c 22529/23030
3d 3/658
4a 1 + y − x
4b x − 2y
4c x − y
4d 1 − y
5a 2/3
5b 7/30
5c 7/30
5d 9/10
6a 0.13

27
6b 0.25
9a 0.82
9b 0.1
10a sim
10b não
11a 0.4
11b 2/3
12a 0.105
12b 0.1428

Capı́tulo 3 (V.a.’s discretas):


1a V.a. binomial (3,2/5):
P (X = x) = 27/125, x = 0; 54/125, x = 1; 36/125, x = 2; 8/125, x = 3.
1b FX (x) = 0, x < 0; 27/125, 0 ≤ x < 1; 81/125, 1 ≤ x < 2; 117/125, 2 ≤ x < 3; 1, x ≥ 3.
1c FX (1) = 81/125.
2 V.a. binomial (2,2/3): P (X ≥ 1) = 8/9.
3a V.a. binomial (10,0.02).
3b P (X > 2) = 1 − P (X ≤ 2) = 0.00086.
3c E[X] = 0.2.
4a V.a. binomial (10,0.1), 1 − FX (0) = 0.6513.
4b n : 1 − 0.9n < 0.3 =⇒ n ≤ 3, logo máximo igual a 3.
5a FX (x) = 0, x < 1; 0.25, 1 ≤ x < 2; 0.5, 2 ≤ x < 3; 0.75, 3 ≤ x < 14; 1, x ≥ 4.
5b m0 = {1, 2, 3, 4}, µ = 2.5, me = [2, 3], q.25 = [1, 2], q.5 = me , q.75 = [3, 4], V (X) = 15/12.
6a FX (x) = 0, x < 1; 0.2, 1 ≤ x < 2; 0.4, 2 ≤ x < 3; 0.6, 3 ≤ x < 4; 0.8, 4 ≤ x < 5; 1, x ≥ 5.
6b m0 = {1, 2, 3, 4, 5}, µ = 3, me = 3, q.25 = 2, q.5 = me , q.75 = 4, V (X) = 2.
7a a = 1/10
7b FX (x) = 0, x < −2; 0.4, −2 ≤ x < −1; 0.5, −1 ≤ x < 1; 0.9, 1 ≤ x < 2; 1, x ≥ 2.
7c m0 = {−2, 2}, classe mediana
√ [-1,1], q.25 = −2, q.75 = 2, µ = 0.
2
7d σ = V (X) = 3.4, σ = 3.4 = 1.844, não existe o coeficiente de variação.
8a c = 1/6
8b FX (x) = 0, x < 1; 1/6, 1 ≤ x < 2; 0.5, 2 ≤ x < 3; 1, x ≥ 3.
8c m0 = 3, classe mediana [2,3[,
p µ = 7/3.
2
8d σ = V (X) = 0.5(5), σ = 0.5(5) = 0.745356, CV (X) = 0.3194.

Capı́tulo 3 (v.a.’s contı́nuas):


1a P (X > 1/2) = e−5/2 = 0.082085.
1b Pela propriedade da falta de memória da v.a. exponencial,
P (X > 1/2 + 1/4|X > 1/2) = P (X > 1/4) = e−5/4 = 0.2865048.
2a fX (x) = λe−λx , x > 0; 0,c.c. 2b µ = 1/λ, x̃ = χ1/2 = (log 2)/λ, χ1/4 = λ−1 log(4/3),
χ3/4 = λ−1 log(4), σ 2 = 1/λ2 .
2(c)i Espera-se que as peças de A tenham um melhor desempenho que B pois
E[XA ] = 2 > E[XB ] = 1; note-se que semelhante conclusão segue dos quantis pois
χA B
p = 2 log(1/(1 − p)) > χp = log(1/(1 − p)), e.g. para a mediana
χ0.5 = 2 log(2) = 1.386 > χB
A
0.5 = log(2) = 0.693.
2(c)ii 0.4502.
3a µ = 2.5

28
3b 0.6826
4a 0.375
4b µ = 4/3 = 133.3 Kg, σ = 62.36 kg.
4c 245.23 Kg.
5a µ = 3.6 cm, σ = 0.0224 cm.
5b 0.1867

TLC e revisões:
1 0.9236
2a 0.9999948
2b 0.0409
3 0.2
3 0.7939
3≈0
4a 0.4169
4b 0.4169
4c A probabilidade de cumprir com o compromisso é elevada, aproximadamente igual a 0.9772.
4d 0.3014
5a 0.0367
5b 0.0222
5(c)i 0.9994
5(c)ii 0.3032
6a 0.7
6b 0.286 e 5.5 m
6c 0.9997

Capı́tulo 4 (ICs):
1 (94.6,102.7), assumindo independência da amostra e população normal.
2 (1.7226,2.8434)
3 (27.67,29.13) h/semana.

Capı́tulo 5 (RLS):
1a β̂0 = 0.6359; β̂1 = 0.0965; E[Y\ |x = 90] = 9.2427.
2
1b R = 0.9711.
1c Modelo significativo.
2a ŷ = β̂0 + β̂1 x = 10.1589 − 0.3991x.
2b E[Y\ |x = 10] = 6.17, e não se deve usar para x = 20.
3a β̂0 = 11.2633; β̂1 = −0.23651.
3b E[Y\ |x = 25] = 210.7 horas, E[Y\ |x = 50] = 0.57 mas este não deve ser usado pois trata-se de
uma extrapolação sem qualquer fundamento.

29

Você também pode gostar