Você está na página 1de 105

Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Universidade Jean Piaget de Angola


Faculdade de Ciências e Tecnologia

Probabilidade e Estatı́stica

MSc. Valter Tomé

30 de Julho de 2018

1 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Estatı́stica Descritiva

1 Introducão

2 Tabela de distribuição de frequências

3 Gráficos

4 Medidas de centralização

5 Medidas de variabilidade

6 Medidas de Posição

7 Medidas de Assimetria e de Curtose

8 Dados Agrupados em Classes

2 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução

A Estadı́stita descritiva trata da contagem, ordenação e


classificação dos dados obtidos por observações, para poder fazer
comparações e tirar conclusões.

Um estudo estatı́stico consta das seguintes fases:


Recolha de dados.
Organização e representação dos dados.
Análise dos dados.
Obtenção de conclusões.

4 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Conceitos de Estatı́stica

População: é o conjunto de todos os elementos sobre os


quais se submete um estudo estatı́stico.
Indivı́duo: Um indivı́duo ou unidade estatı́stica é cada um
dos elementos que componhem a população.
Amostra: é um conjunto representativo da população de
referência; o números de indivı́duos de uma amostra é menor
que o da população.
Amostragem: é a reunião dos dados que se deseja estudar,
obtidos de uma proporção reduzida e representativa da
população.

5 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Conceitos de Estatı́stica

Figura: População e Amostra

6 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Conceitos de Estatı́stica

Valor: Um valor é cada um dos diferentes resultados que se


pode obter num estudo estatı́stico.
Exemplo: Se lançamos uma moeda ao ar 5 vezes obtemos
dois valores: Cara e Coroa.

Dados: Um dado é cada um dos valores que obteve ao


realizar um estudo estatı́stico.
Exemplo: Lançamos uma moeda ao ar 5 vezes e foram obtidos
os seguintes resultads: Cara, Cara, Coroa, Cara, Coroa.

7 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Variáveis Estatı́sticas

Uma variável estatı́stica é cada uma das caracterı́sticas ou


qualidades que possuem os indivı́duos da população.
Variável Qualitativa
As variáveis qualitativas se referem a caracterı́sticas ou
qualidades que não podem ser medidas com números. Estas
classificam-se em:
1 Variável qualitativa nominal. Representam modalidades não
numéricas que que não admitem um critério de ordem.
Exemplo : O estado civil, com as seguintes modalidades:
solteiro, casado, divorciado e viúvo.
2 Variável qualitativa ordinal. Representam modalidades não
numéricas em que existe uma ordem.
Exemplo : Medalhas de uma competição desportiva: Ouro,
Prata, Bronze. .

8 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Variáveis Estatı́sticas

Variável Quantitativa: É a que se expressa mediante um


número; portanto, é possı́vel realizar operações aritméticas
com ela. Estas classificam-se em:
1 Variável Discreta. São aquelas que tomam apenas valores
inteiros positivos.
Exemplos : O número de acidentes de viação na cidade de
Luanda, o número de nascimentos diários no Huambo, o
número engenheiros em Angola.
2 Variável Contı́nua. Também tomam valores reais.
Exemplos : A altura de 5 pessoas (1.73, 1.82, 1.77, 1.69,
1.75.), a temperatura de uma dado material, o peso de
pacotes de farinha numa unidade de produção
.

9 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Tabela de distribuição de frequências

Uma tabela de distribuição de frequências é um dispositivo


para ordenação dos dados e facilitar a sua intepretação.
Passos para construção de uma tabela de frequências:
1 Identificar o Número de elementos da amostra (n).
2 Obter a amplitude total (R) dos dados:
R=maior.valor-menor.valor.
3 Selecionar o número de classes ou intervalos (k):
Regra de Sturges: k ≈ 1 + 3.322 log n
4 Determinar a amplitude das classes ou intervalos (h):
h ≈ Rk

Observação: Sempre que h e k forem arredondados com


inteiros, escolher o número inteiro que antecede ou sucede o
obtido. Além disso, é imprescindı́vel h × k > R. Na dúvida,
aproxime para números inteiros sucessores ao obtido.
11 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

O conjunto de dados a seguir lista o número de minutos que 50


usuários de Internet gastaramm online durante a mais recente
sessão. Construa uma tabela de distribução de frequências.

Tabela: 50 Usuários de internet


50 40 41 17 11 7 22 44 28 21
19 23 37 51 54 42 86 41 78 56
72 56 17 7 69 30 80 56 29 33
46 31 39 20 18 29 34 59 73 77
36 39 30 62 54 67 39 31 53 44

12 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Tabela de distribuição de frequências

1 n= 50.
2 menor.valor= 7, maior.valor= 86. R= 86 − 7 = 79.
3 k≈ 1 + 3.322 log 50 = 6.6440 ≈ 7. Teremos 7 classes.
4 h ≈ 79/7 ≈ 11.2877 ≈ 12. Observemos que se h=11 então
h × k = 77 < 79, portanto arredondamos h para 12.
Notações:
fi : frequência da classe i. i = 1, 2, . . . , k
fri = fi /n : frequência relativa da classe i.
Fi : frequência acumulada da classe i. Fi = f1 + f2 + · · · + fi
Fri = Fi /n : frequência relativa acumulada da classe i.

13 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Tabela de distribuição de frequências

Tabela: Tabela de Frequências


i Classe Ponto Médio fi Fi fri Fri
1 [7,19[ 13 6 6 0.12 0.12
2 [19,31[ 25 10 16 0.20 0.32
3 [31,43[ 37 13 29 0.26 0.58
4 [43,55[ 49 8 37 0.16 0.74
5 [55,67[ 61 5 42 0.10 0.84
6 [67,79[ 73 6 48 0.12 0.96
7 [79,91[ 85 2 50 0.04 1
Total 50 1 - -

Intepretação: Por exemplo, o tempo mais comum gasto pelos


usuários online foi de 31 à 42 minutos.
14 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

O quadro seguinte representa as alturas (em cm) de 40


funcionários de uma empresa.
a) Construir uma tabela de frequência das alturas dos funcionários.

Tabela: Altura dos funcionários


162 163 148 166 169 154 170 166
164 165 159 175 155 163 171 172
170 157 176 157 157 165 158 158
160 153 163 165 164 178 150 168
166 169 152 170 172 165 162 164

15 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Gráficos: Histograma, Poligono de frequências, e Ogiva

Tabela: Tabela de frequência vs gráficos


Ponto
i Classe fi Fi fi /n Fi /n
Médio
1 [1,2[ 1,5 1 1 0,025 0,025
2 [2,3[ 2,5 9 10 0,225 0,250
3 [3,4[ 3,5 11 21 0,275 0,525
4 [4,5[ 4,5 12 33 0,300 0,825
5 [5,6[ 5,5 5 38 0,125 0,950
6 [6,7[ 6,5 2 40 0,050 1,000
Total 40 - 1 -

17 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Gráficos: Histograma, Poligono de frequências, e Ogiva

Histograma. Se constrói desenhando rectângulos cuja base


corresponde a cada intervalo da classe e a sua altura ao valor
da frequência. Pode ser a frequência absoluta ou a frequência
relativa.

18 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Polı́gono de frequência. É uma representação gráfica dos


dados em que se une, através de segmentos de recta, todos os
pontos cuja abcissa é o centro de uma classe e a ordenada é a
frequência dessa classe. (O polı́gono pressupõe, normalmente,
em cada extremo, a existência de uma classe adicional de
frequência nula).

19 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Ogiva (ou Polı́gono de frequências acumuladas). Este


gráfico se usa para representar a frequência acumulada,
absoluta ou a relativa. Se obtém unindo segmentos de recta
que se estendem entre os extremos das classes e usando os
valores da frequência acumulada. A ogiva permite responder a
perguntas do tipo QUANTOS DADOS SÃO MENORES QUE

20 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

EXEMPLO: Quantos dados têm valor menor que 4.5?


Resposta: Aproximadamente 27 dados.

21 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de tendência central: Média, Moda e Mediana

Medidas de tendência central: São os números que


definem qual é o valor ao redor do qual se concentram os os dados
ou as observações.A seguir indicamos as mais utilizadas.
Média amostral
Se x1 , x2 · · · , xn representam os dados, então temos:
n
1X x1 + x2 + · · · + xn
x̄ = xi =
n n
i=1

EXEMPLO: Se os dados são 2,6,11,8,11,4,7,5 Então


2 + 6 + 11 + 8 + 11 + 4 + 7 + 5
x̄ = = 6, 75
8

23 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de tendência central: Média, Mediana e Moda

Moda amostral (Mo): É o valor que ocurre com maior


frequência na amostra. Pode ser que não exista a moda, e também
é possı́vel que existam mais de uma moda.
EXEMPLO: Se os dados são 2,6,11,8,11,4,7,5, então:

Mo = 11

Mediana amostral (x̃): É o valor que está no centro dos dados


ordenados. Sejam x1 , x2 · · · , xn e x(1) , x(2) · · · , x(n) os dados
ordenados de maneira crescente.
(
x( n+1 ) se n é ı́mpar
x̃ = 2
(x( n2 ) + x( n2 +1) )/2 se n é par

24 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de dispersão ou variabilidade : Amplitude total,


Variância, Desvio padrão, Coefiente de variação

Amplitude Total (R): É a diferença entre o maior e o menor


valor do conjuntos de observações (ou de dados):

R = valor .maximo − valor .minimo = x(n) − x(1)

A amplitude total, depende apenas das observações extremas


e ignora as outras observações.
Quanto maior for o número de observações maior tende a ser
a amplitude total.

26 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de dispersão ou variabilidade : Amplitude total,


Variância, Desvio padrão, Coefiente de variação

Desvio Absoluto Médio(δx̄ ): É a média dos desvios absolutos


em relação à media amostral. Vem dado pela seguintes fórmula:

n
1X
δx̄ = |xi − x̄|
n
i=1

27 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de dispersão ou variabilidade : Amplitude total,


Variância, Desvio padrão, Coefiente de variação

Variância (s 2 ) de uma amostra:

n
1 X
s2 = (xi − x̄)2
n−1
i=1

ou a fórmula alternativa

n
2 1 X 2
s = (xi − nx̄)
n−1
i=1

28 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de dispersão ou variabilidade : Amplitude total,


Variância, Desvio padrão, Coefiente de variação

Desvio padrão amostral(s): É a raı́z quadrada positiva da


variância

s = + s2

O desvio padrão amostral informa-nos sobre a dispersão dos

valores abservados relativamente à sua média. Quanto maior for a


dispersão, tanto maior é o desvio padrão. Se não existir dispersão,
isto é, se todos os valores valores forem iguais (e
consequentemente, iguais a média), então o desvio padrão é nulo.

29 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de dispersão ou variabilidade : Amplitude total,


Variância, Desvio padrão, Coefiente de variação

A variância e o desvio padrão são as medidas de variabilidade


mais usadas em análise estatı́stica. Uma das suas principais
caracterı́siticas importantes é que têm em consideração todos os
valores observados. O desvio padrão indica a proximidade com que
os valores estão agrupados ao redor da média. Um valor pequeno
do desvio padrão significa que as observações estão pouco
espalhadas à volta da média. A variança é o quadrado do desvio
padrão.

30 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de dispersão ou variabilidade : Amplitude total,


Variância, Desvio padrão, Coefiente de variação

Coefiente de variação(cv ): É o quociente entre a variância e o


módulo da méida.
s
cv =
|x̄|

Ou em percentagem,

s
cv = × 100%
|x̄|

31 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Posição: Quartil, Decil, Percentil

Quartis: são os números que dividem o grupo de dados em


grupos de aproximadamente 25% dos dados.

Primeiro Quartil (q1 ): A esquerda de q1 estão


aproximadamente 25% dos dados e a sua direita aproximadamente
75%.
Segundo Quartil (q2 ): Assim como a mediana, divide o grupo
de dados em duas partes, cada uma com aproximadamente 50%
dos dados.
Terceiro Quartil (q3 ): A esquerda de q3 estão aproximadamente
75% dos dados e a sua direita aproximadamente 25%.

33 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Posição: Quartil - Exemplo

Exemplo: Suponhamos que uma amostra contem 40 dados


ordenados: x(1) , x(2) , . . . x(40) . Calcule q1 , q2 e q3 .
q1 : 25% de 40 = 10.
Portanto: q1 = (x(10) + x(11) )/2
q2 : 50% de 40 = 20.
Portanto: q2 = (x(20) + x(21) )/2
q3 : 75% de 40 = 30.
Portanto: q3 = (x(30) + x(31) )/2

34 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Posição: Quantil, Decil, Percentil

Decis: são os números que dividem o grupo de dados em grupos


de aproximadamente 10% dos dados.

Primeiro decil (d1 ): A esquerda de d1 estão aproximadamente


10% dos dados e a sua direita aproximadamente 90%.
Segundo decil (d2 ): A esquerda de d2 estão aproximadamente
20% dos dados e a sua direita aproximadamente 80%.
Obs.: Existem 9 decis, e os restantes são calculados de forma
análoga.

35 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Posição: Decil - Exemplo

Exemplo: Suponhamos que uma amostra contem 40 dados


ordenados: x(1) , x(2) , . . . x(40) . Calcule d1 .

d1 : 10% de 40 = 4.
Portanto: d1 = (x(4) + x(5) )/2
d2 : 20% de 40 = 8.
Portanto: d2 = (x(8) + x(9) )/2

36 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Posição: Quantil, Decil, Percentil

Percentis: são os números que dividem o grupo de dados em


grupos de aproximadamente 1% dos dados.

Primeiro percentil (p1 ): A esquerda de p1 estão


aproximadamente 1% dos dados e a sua direita aproximadamente
99%.
Segundo percentil (p2 ): A esquerda de p2 estão
aproximadamente 2% dos dados e a sua direita aproximadamente
98%.
Obs.: Existem 99 percentis, e os restantes são calculados de forma
análoga.

37 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Posição: Percentil - Exemplo

Exemplo: Suponhamos que uma amostra contem 400 dados


ordenados: x(1) , x(2) , . . . x(400) . Calcule p1 e P82 .

p1 : 1% de 400 = 4.
Portanto: p1 = (x(4) + x(5) )/2
p82 : 82% de 400 = 328.
Portanto: p82 = (x(328) + x(329) )/2

38 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Posição: Relação entre Quartis, Decis e


Percentis

A seguir a apresentamos como estão relacionadas as medidas de


posição (ou de localização não central): Quartis, Decis e Percentis
(e também com a mediana).
1 x̃ = p50 = d5 = q2 .
2 p10 = d1 =, p20 = d2 . . ., p90 = d9 .
3 p25 = q1 , p50 = q2 e p75 = q3 .
A partir dos quantis definem-se outras medidas tais como:

A amplitude interquartil rq = q3 − q1 que é a

amplitude do intervalo [q1 , q3 ], que contém 50% das


observações centrais.

39 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coefiente


de Assimetria e Coeficiente de Curtose

Momento Amostral Simples de Ordem k


É a media dos valores observados elavados à potência k (onde k é
um número inteiro não negativo, ou seja, k ∈ N ∪ {0}).

n
0 1X k
mk = xi
n
i=1

41 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coef. de


Assimetria, coef. de Curtose

Momento Amostral Centrado de Ordem k


É a media dos desvios em relação a x̄ elavados à potência k (onde
k é um número inteiro não negativo, ou seja, k ∈ N ∪ {0} ).

n
1X
mk = (xi − x̄)k
n
i=1

42 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coef. de


Assimetria, coef. de Curtose

Coeficiente de Assimetria Amostral


O coeficiente de assimetria nos permite saber como é que os
valores se distribuem em relação ao centro, se maneira simetrica ou
não.

m3
a3 =
s3

onde m3 é o momento centrado de ordem 3 e s o desvio padrão


amostral.

43 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coef. de


Assimetria, coef. de Curtose

Coeficiente de Assimetria Amostral

A observação do polı́gno de frequência ajuda a ver se a


distribuição é simétrica ou não.
Um valor negativo indica que a cauda do lado esquerdo da
função densidade de probabilidade é maior que a do lado
direito. Um valor positivo indica que a cauda do lado direito é
maior que a do lado esquerdo. Um valor nulo indica que os
valores são distribuı́dos de maneira relativamente iguais em
ambos os lados da média, mas não implica necessariamente,
uma distribuição simétrica.

44 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coef. de


Assimetria, coef. de Curtose

Coeficiente de Assimetria Amostral

45 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coef. de


Assimetria, coef. de Curtose

46 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coef. de


Assimetria, coef. de Curtose

Coeficiente de Curtose Amostral


Curtose é uma medida de dispersão que caracteriza o
”achatamento”da curva da função de distribuição

m4
a4 =
s4

onde m3 é o momento centrado de ordem 4 e s o desvio padrão


amostral.

47 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coef. de


Assimetria, coef. de Curtose

Se a4 > 3, dizemos que a função de distribuição é leptocúrtica


e possui a curva da função de distribuição mais afunilada com
um pico mais alto do que a distribuição normal. Neste caso
dizemos que essa distribuição possui caudas pesadas.
Se a4 = 3, então a função de distribuição tem o mesmo
achatamento da distribuição normal, chamamos essas funções
de mesócurticas.
Se a4 < 3, então a funçao de distribuição é mais achatada do
que a distribuição normal . Dizemos que esta curva da função
de distribuição é platicúrtica.

48 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas de Assimetria e de Curtose: Momentos, Coef. de


Assimetria, coef. de Curtose

Coeficiente de Curtose Amostral

49 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Dados Agrupados em Classes

Se os dados duma amostra estão disponı́veis numa tabela de


frequências, podemos usar fórmulas para calcular as medidas
estatı́sticas descritivas de maneira aproximada.

Suponhamos que temos uma tabela de frequências como a


indicada abaixo, com os seguintes valores simbólicos:

Ponto
i Classe fi fi /n Fi Fi /n
Médio
1 [L1 , U1 ] m1 f1 f1 /n F1 F1 /n
.
2 [L2 , U2 ] m2 f2 f2 /n F2 F2 /n
... ... ... ... ... ... ...
k [Lk , Uk ] mk fk fk /n Fk Fk /n

51 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas descritivas para dados agrupados em classes(ou


dados classificados)

k
1X
1. Média para dados agrupados: x̄ = fi xi
n
i=1
k
1 X 2
2. Variância para dados agrupados: s = fi (xi − x̄)2
n−1
i=1
Onde:
n é o número de dados da amostra.
k é o número de classes.
xi é o ponto médio da classe i.
fi frequência absoluta da classe i

52 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas descritivas para dados agrupados em classes

h( n2 − Fi−1 )
3. Mediana para dados agrupados: x̃ = Li +
fi
Onde:
i o intervalo que contém a mediana.
Li limite inferior do intervalo i.
n número de dados.
Fi−1 frequência absoluta acumulada do intervalo anterior ao
intervalo i.
fi frequência absoluta do intervalo i.
h Amplitude do intervalo i.

53 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas descritivas para dados agrupados em classes

4. Moda para dados agrupados:


h(fi − fi−1 )
Mo = Li +
(fi − fi−1 ) + (fi − fi+1 )

Onde:
i o intervalo modal ou que contém a moda (o intervalo com
maior frequência absoluta).
Li limite inferior do intervalo i.
fi frequência absoluta do intervalo modal
fi−1 frequência absoluta do intervalo anterior ao modal.
fi+1 frequência absoluta do intervalo posterior ao modal.
h amplitude do intervalo que contém a moda.
54 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas descritivas para dados agrupados em classes

5. Percentil para dados agrupados:


j·n
h( 100 − Fi−1 )
pj = Li + j = 1, 2, . . . 99
fi

Onde:
i o intervalo que contém o percencil.
Li limite inferior do intervalo i.
n número de dados.
Fi−1 frequência absoluta do intervalo anterior ao intervalo i.
fi frequência absoluta do intervalo i.
h amplitude do intervalo.
55 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas descritivas para dados agrupados em classes

6. Decil para dados agrupados:

h( j·n − Fi−1 )
dj = Li + 10 j = 1, 2, . . . 9
fi

Onde:
i o intervalo que contém o decil.
Li limite inferior do intervalo i.
n número de dados.
Fi−1 frequência absoluta do intervalo anterior ao intervalo i.
fi frequência absoluta do intervalo i.
h amplitude do intervalo.
56 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Medidas descritivas para dados agrupados em classes

7. Quartis para dados agrupados:

h( j·n
4 − Fi−1 )
qj = Li + j = 1, 2, 3
fi

Onde:
i o intervalo que contém o primeiro quartil.
Li limite inferior do intervalo i.
n número de dados.
Fi−1 frequência absoluta do intervalo anterior ao intervalo i.
fi frequência absoluta do intervalo i.
h Amplitude do intervalo.
57 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Exemplo

A seguinte tabela de frequências contém os dados do número de


artigos vendidos por certo armazém em 50 dias, agrupados em 6
classes.

Ponto
i Classe fi fi /n Fi Fi /n
Médio
1 [10,20[ 15 2 0,04 2 0,04
2 [20,30[ 25 10 0,2 12 0,24
3 [30,40[ 35 12 0,24 24 0,48
4 [40,50[ 45 14 0,28 38 0,76
5 [50,60[ 55 9 0,18 47 0,94
6 [60,70[ 65 3 0,06 50 1
Total 50 1 - -

58 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Exemplo

Calcule a média, a variância, a mediana, a moda e os quartis.


A média é
k
1X
x̄ = fi xi
n
i=1
1
= (2 × 15 + 10 × 25 + 12 × 35 + 14 × 45 + 9 × 55 + 3 × 65)
50
= 40, 4

59 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Exemplo

A variância é
n
1 X
s2 = fi (xi − x̄)2
n−1
i=1
1
= 2(15 − 40.4)2 + 10(25 − 40.4)2 + 12(35 − 40.4)2 +
49
+ 14(45 − 40.4)2 + 9(55 − 40.4)2 + 3(65 − 40.4)2


= 164, 12

60 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Exemplo

Mediana
Para usar a fórmula da mediana devemos localizar a classe
que contém esta mediana. Visto que n = 50, a mediana é a
média dos dados x(25) e x(26) . Esses dados se encontram na
classe 4. e portanto

h( n2 − F3 ) 10 × ( 50
2 − 24)
x̃ = L4 + = 40 + = 40, 71
f3 14

61 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Exemplo

Moda
O intervalo que contém a moda é aquele com a maior
frequência absoluta. Neste exemplo seria a classe 4. Portanto

h(f4 − f3 ) 10 × 2
Mo = L4 + = 40 + = 42, 85
(f4 − f3 ) + (f4 − f5 ) 2+5

62 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Exemplo

Quartil q1
q1 correponde a observação x(13) . Este dado se encontra na
classe 3. Portanto
10[1 × ( n4 ) − F2 ] 10[1 × ( 50
4 ) − 12]
q1 = L3 + × = 30+ = 30, 41
f3 12

63 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Experiência Aleatória
É qualquer processo que gera um resultado que pode ser diferente
de cada vez que o processo é executado em iguais condições.

Observação
É o resultado associado a uma realização de uma experiência
aleatória.

Espaço Amostral
É o conjunto de todos os resultados possı́veis de uma experiência
aleatória (Representaremos este conjunto com a letra S).

64 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Exemplo 1.1: Considere as seguintes experiências aleatórias e


determine os seus espaços amostrais.
1 Lançar uma moeda e observar o número de caras obtidas.
2 Lançar um dado e observar o número mostrado na face de
cima.
3 Lançar uma moeda 3 vezes e observar a sequência caras e
escudos obtidas.
4 Contar o número de peças defeituosas produzidas numa
máquina no perı́odo de 1 hora.
5 Ensaiar uma lâmpada para determinar o tempo que demora a
fundir.

65 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Solução do Exemplo 1.1:

1 S1 = {0, 1}

2 S2 = {1, 2, 3, 4, 5, 6}

3 S3 = {CCC , CCE , CEC , CEE , ECC , ECE , EEC , EEE }

4 S4 = {0, 1, 2, . . . , n} onde n é o número máximo de peças que


pode ser produzido em uma hora.

5 S1 = {t ∈ R : t ≥ 0}

66 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Evento (ou Acontecimento)


É um subconjunto do espaço amostral.

Evento Simples (ou Elementar)


É um evento que contém exactamente um dos resultados possı́veis
de uma experiência aleatória.

Evento Composto
É um evento que contém mais do que um dos resultados possı́veis
de uma experiência aleatória.
Observação: O espaço amostral S é um evento certo (já que o
resultado da experiência é necessariamete um dos resultados
do espaço amostral) e o conjunto ∅, é o evento impossı́vel.
67 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Indique exemplos de eventos relacionados com as experiências


descritas no Exemplo 1.1, identifique o correspondente
subconjunto do espaço amostral, e classifique-os.

1 E1 : ”Ocorre uma cara”; E1 = {1} - Evento Simples

2 E2 : ”Ocorre um número par”; E2 = {2, 4, 6} - Evento


Composto

3 E3 : ”Ocorrem caras nos dois primeiros lançamentos”;


E3 = {CCC , CCE } - Evento Composto

4 E4 : ”Todas as peças são perfeitas”; E4 = {0} - Evento


Simples

5 E5 : ”A lâmpada queima em menos de uma hora”; 68 / 113


Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Definição 1.2 - Complemento de um evento A


É o evento Ā constituı́do por todos os elementos de S que não
pertencem a A, isto é,

Ā = {x ∈ S : x ∈
/ S}

Determine os complementos dos exemplos dos eventos definidos


anteriormente.
1 E¯1 : ”Ocorre um escudo”;
2 E¯2 : ”Ocorre um número ı́mpar”;
3 E¯3 : ”Ocorrem menos de duas caras nos dois primeiros
lançamentos ”;
4 E¯4 : ”Nem todas as peças são perfeitas”;
5 E¯5 : ”A lâmpada queima em uma ou mais horas”;
69 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Definição 1.3 - Interseção de dois eventos A e B


Designa-se por A ∩ B, é o evento que contém todos os lementos
que são comuns a A e a B, isto é, o evento que ocorre quando
ambos ocorrem e vem dado por

A ∩ B = {x ∈ S : x ∈ A e x ∈ B}

Definição 1.4 - Eventos mutuamente exclusivos A e B


A e B são mutuamente exclusivos ou disjuntos ou
incompatı́veis se não tiverem elementos comuns, isto é,se a
ocorrência de um implica a não a ocorrência do outro, ou
seja, A ∩ B = ∅.

70 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Definição 1.5 - Diferença entre os eventos A e B


Designa-se por A − B, ou também por A \ B, o evento que
contém todos os elementos de A que não pertencem a B, isto é, o
evento que ocorre quando A ocorre e B não ocorre, ou seja,

A − B = A \ B = A ∩ B̄ = {x ∈ S : x ∈ A e x ∈
/ B}

Definição 1.6 - Reunião de dois eventos A e B


Designa-se por A ∪ B e é o evento constituı́do pelos os elementos
de pertencem a A ou a B, isto é, o vento que ocorre quando
pelo menos um deles ocorre, ou seja,

A ∪ B = {x ∈ S : x ∈ A ou x ∈ B}
71 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Propriedades sobre conjuntos


1 A ∩ Ā = ∅; A ∪ Ā = S
2 Leis Comutativas: A ∩ B = B ∩ A; A∪B =B ∪A
3 Leis Associativas:
(A ∩ B) ∩ C = A ∩ (B ∩ C ); (A ∪ B) ∪ C = A ∪ (B ∪ C )
4 Elemento Neutro: A ∪ ∅ = A; A ∩ S = A;
5 Elemento Absorvente: A ∪ S = S; A ∩ ∅ = ∅;
6 Leis Distribuitivas:
A ∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C );
A ∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C )
7 Leis de De Morgan: A ∩ B = Ā ∪ B̄; A ∪ B = Ā ∩ B̄;

72 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Introdução a Probabilidade

Definição 1.7 - Conjuntos Finitos e Infinitos

Um conjunto é finito se possui um número finito de


elementos. Caso contrário, diz-se o conjunto é infinito.
Um conjunto é contável ou enumerável se podemos associar
um número inteiro distinto a cada um dos seus elementos.

Definição 1.8 - Partição


Diz que os eventos B1 , B2 , . . . , Br formam uma partição do
espaço amostral S se, e só se:
i) Bi ∩ Bj = ∅ sempre que i 6= j (Eventos mutuamente
exclusivos doia à dois)
ii) S = ∪ri=1 Bi = B1 ∪ B2 · · · ∪ Br
73 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Técnicas de Contagem - Análise Combinatória

A análise combinatória visa desenvolver métodos que


permitam contar o número de elementos de um conjunto,
sendo estes agrupamentos formados sob certas condições.

A primeira vista pode parecer desnecessária a existência destes


métodos. De facto, quando o número de elementos que
queremos contar for pequeno. Entretanto, se o número de
elementos a contar for grande, esse trabalho torna-se quase
impossı́vel.

74 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Técnicas de Contagem - Análise Combinatória Exemplos

Exemplo 1.9

1 Se A é o conjunto de números de dois algarismos distintos


formados a partir dos dı́gitos 1, 2, e 3 então
A = {12, 13, 21, 23, 31, 32} e #A = 6.
2 Se B é o conjunto das sequências de letras que se otbtêm,
mudando-se a ordem das letras na palavra ARI (anagramas
da palavra ARI) então B = {ARI , AIR, IRA, IAR, RAI , RIA} e
#B = 6.
3 Se C é o conjunto das diagonais de um heptágono então C =
{P1 P3 , P1 P4 , P1 P5 , P1 P6 , P2 P4 , P2 P5 , P2 P6 , P2 P7 , P3 P5 , P3 P6 ,
P3 P7 , P4 P6 , P4 P7 , P5 P7 , } e #C = 14.

75 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Técnicas de Contagem - Análise Combinatória

Exemplo 1.9 (Continuação)

4 Se D é o conjunto de números de três algarismos, todos


distintos, formados a partir dos dı́gitos 1, 2, 3, 4, 5, 6, 7, 8 então
D = {123, 124, 125, · · · , 875, 876} e #A = 6.
Podemos ver que neste caso é bastante trabalhoso determinar
todos os elementos do conjuntos. Usando técnicas que iremos
estudar veremos que #D = 336.

76 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Técnicas de Contagem - Análise Combinatória

Teorema 1.10 - Princı́pio fundamental da contagem


Se um evento pode ocorrer de n1 maneiras distintas e se,
independente deste, um segundo evento pode ocorrer de n2
maneiras distintas, então os evento podem ocorrer de n1 × n2
maneiras distintas. Generalização: Para r eventos temos:
n1 × n2 × · · · × nr maneiras distintas.

Exemplo 1.11
Em computação define

77 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Técnicas de Contagem - Análise Combinatória

Definição 1.12 (Permutações, Arranjos e Combinações)


Consideremos um conjunto de n elementos dos quais estamos
interessados em extrair p (p ≤ n) elementos, anotando a ordem
pela qual eles saem.
1 Se a extracção for efectuada sem reposição, no caso de
extrairmos todos os n elementos (p = n), o número de formas
diferentes de o fazer é a permutação de n elementos:

Pn = n! = n × (n − 1) × . . . × 2 × 1

Recordemos que por convenção 0! = 1.

78 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Técnicas de Contagem - Análise Combinatória

Definição 1.13 (Arranjos )

Caso p < n, o número de conjuntos diferentes de p elementos


que podemos formar a partir dos n elementos à escolha é
dado por arranjos de n elementos p a p

n!
Anp =
(n − p)!

79 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Técnicas de Contagem - Análise Combinatória

Definição 1.13 (Arranjos)

Se a extracção for efectuada com reposição, o número de


conjuntos diferentes de p elementos que podemos formar a
partir dos n elementos à escolha é np . A este número
chama-se arranjos com repetição e designa-se por:

Ānp = np

80 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Técnicas de Contagem - Análise Combinatória

Definição 1.14 (Combinações)

Podemos estar interessados em determinar quantos


subconjuntos de p elementos conseguimos formar a partir de
um conjunto de n elementos, não interessando a ordem pela
qual eles saem. Tal número é dados pelas combinações de n
elementos p a p:

n!
Cpn =
p!(n − p)!

Obs: Repare-se que as combinações são obtidas a partir dos


arranjos descontando-lhes as diferentes ordenações do
conjunto formado pelos p elementos.
81 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Probabilidade Clássica e Axiomas de Kolmogorov

Definição (Probabilidade Clássica ou Lei de Laplace)


Se uma experiência tiver N resultados possı́veis que sejam
diferentes, mas igualmente prováveis, e se exactamente n desses
resultados correspondem ao evento A, então

n no de resultados favoráveis
P(A) = = o
N n de resultados possı́veis

82 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Probabilidade Clássica e Axiomas de Kolmogorov

Axiomas de Kolmogorov
Sejam S um espaço amostral e E um evento qualquer. Então
1 P(E ) ≥ 0

2 P(S) = 1

3 Se E1 , E2 , . . . , En . . . é uma sucessão de eventos mutuamente


exclusivos então

[ ∞
X
P( Ei ) = P(Ei )
i=1 i=1

83 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Propriedades de Probabilidade

Sejam A, B e C eventos quaisquer de um espaço amostral S. As


seguintes propriedades de verificam:

1 P(∅) = 0.

2 P(Ā) = 1 − P(A).

3 P(A ∩ B̄) = P(A − B) = P(A) − P(A ∩ B).

4 P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

5 P(A ∪ B) = P(A) + P(B), quando P(A ∩ B) = 0.

6 P(A ∪ B ∪ C ) = P(A) + P(B) + P(C ) − P(A ∩ B) − P(A ∩ C )


− P(B ∩ C ) + P(A ∩ B ∩ C )
7 Se A ⊂ B então P(A) ≤ P(B).
84 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Probabilidade Condicional

A probabilidade do evento A ocorrer dado que o evento B


ocorreu designa-se por P(A|B) e lê-se probabilidade
condicional de A dado B, ou simplesmente probabilidade de A
dado B.
O efeito de saber-se que B ocorreu faz com que B se torne
num espaço amostral.
Definição 1.15 (Probabilidade Condicional)
A probabilidade condicional de A dado B designa-se por P(A|B)
e é dada por

P(A ∩ B)
P(A|B) = , se P(B) 6= 0
P(B)

85 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Teorema de Probabilidade Total e Teorema de Bayes

Definição 1.16 (Teorema de Probabilidade Total)


Sejam B1 , . . . , Bn uma partição do espaço de amostral S, com
P(Bi ) > 0, ∀i. Dado um qualquer evento ou acontecimento
A ⊂ S, tem-se

P(A) = P(B1 )P(A|B1 ) + P(B2 )P(A|B2 ) + . . . + P(Bn )P(A|Bn )

86 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Teorema de Probabilidade Total e Teorema de Bayes

Definição 1.17 (Teorema de Bayes)


Sejam B1 , . . . , Bn uma partição do espaço amostral S, com
P(Bi ) > 0, ∀i. Dado um qualquer evento ou acontecimento
A ⊂ S, com P(A) > 0, tem-se

P(Bi )P(A|Bi )
P(Bi |A) = ,
P(A)

ou seja,

P(Bi )P(A|Bi )
P(Bi |A) =
P(B1 )P(A|B1 ) + P(B2 )P(A|B2 ) + . . . + P(Bn )P(A|Bn )

87 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Independência de Eventos

Definição 1.18 (Eventos independentes)


Dois eventos dizem-se independentes se e só se

P(A ∩ B) = P(A)P(B)

Teorema 1.19
Se A e B são eventos independentes então

P(A|B) = P(A) se P(B) > 0 e

P(B|A) = P(B) se P(A) > 0


88 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Variáveis Aleatórias

Definição(Variável Aleatória)
Uma varável aleatória (v.a) X é uma função que associa um
número real x a cada resultado s do espaço espaço amostral S

Exemplo
Considere os casais que têm 3 filhos e a experiência estatı́stica em
que se regista o sexo de cada um dos 3 filhos por crescente de
idades. Estamos interessados no número de rapazes. Definir uma
variável que seja apropriada.

Sejam F e M os eventos ”a criança é do sexo femenino”e ”a


criança é do sexo masculino”, respectivamente. O espaço amostral.

89 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Variáveis Aleatórias

S = { sequência de indicadores do sexo dos 3 filhos de um casa,


por ordem crescente de idades }, ou seja,

S = { FFF, FFM, FMF, FMM, MFF, MFM, MMF, MMM }

A v.a de interesse é
X= número de rapazes entre os 3 filhos do casal.
Então,

X(FFF)=0

X(MFF)=X(FMF)=X(FFM)=1

X(MMF)=X(MFM)=X(FMM)=2

X(MMM)=3
90 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Variáveis Aleatórias

e a correspondência entre o espaço amostral e a caracterı́stica


numérica em estudo é mostrada na tabela:

s FFF FFM FMF FMM MFF MFM MMF MMM


x 0 1 1 2 1 2 2 3

91 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Exemplo
Considere os lançamento sucessivo de uma moeda até que ocorra
uma cara e suponha que se regista a sequência de caras e escudos
obtidos. Defina o espaço amostral e a variável aletória adequada.

Sejam C , E os eventos ”ocorrência de uma coroa”e ”ocorrência de


um escudo”. Então, o espaço amostral será

S = { C, EC, EEC, EEEC, . . . } (espaço amostral infinito


numéravel) e a v.a é

X = número de lançamentos que é necessário efectuar até que


ocorra uma cara, que toma valores inteiros positivos.

92 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Variáveis Aleatórias Discretas e Contı́nuas

Definição (Variável Aleatória Discreta)


Uma váriavel aleatória X é discreta se conjunto de valores
possı́vel de X for finito ou infinito numerável.

Definição (Variável Aleatória Contı́nua)


Uma váriavel aleatória X é contı́nua se tomar qualquer valor de
um intervalo ou de uma colecção de intervalos.
Na maioria dos problemas práticos
1 as variáveis aleatórias discretas representam dados contáveis
ou numeráveis (por exemplo, número de peças avariadas,
número acidentes por ano, ou número de nascimentos);
2 as variáveis aleatórias contı́nuas representam dados medidos
(por exemplo, tempo, distância, peso ou altura).
93 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Variáveis Aleatórias Discretas e Contı́nuas

Exemplo
Considere as situações seguintes. Defina, em cada caso, a variável
aleatória de interesse, indique a sua gama de valores possı́veis e
classifique-a.

(a) Contam-se as partı́culas emitidas por uma fonte radioctiva


durante um intervalo de tempo.
(b) Observa-se o tempo entre avarias de uma máquina em
funcionamento numa fábrica.
(c) Analisam-se livros de 256 páginas para se determinar o
número depáginas com erros.
(d) Estima-se o consumo de gasolina de um determinado modelo
automóvel. Para isso, mete-se 1 litro de combustı́vel no
tanque e regista-se a distância percorrida até a gasolina se
esgotar. (Admitir que não é razoável que essa distância 94 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Variáveis Aleatórias Discretas e Contı́nuas

Resolução

(a) X = número de partı́culas radioctivas contadas. A variável X


tomará valores nos no conjunto {0, 1, 2, . . .} ; portanto X é
uma variável aleatória discreta.
(b) X = tempo entre a as avarias;vas contadas. A variável X
tomará valores nos no conjunto [0, +∞[ ; portanto X é uma
variável aleatória contı́nua.
(c) X = número de páginas com erros. A variável X tomará
valores nos no conjunto {0, 1, 2, . . . , 256} ; portanto X é uma
variável aleatória discreta.
(d) X = distância percorrida com 1 litro de gasolina. A variável X
tomará valores nos no conjunto [0, 50]; portanto X é uma
variável aleatória contı́nua.
95 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Discretas

Definição (Função de probabilidade)


Seja X uma variável aleatória discreta. A função de
probabilidade de X é uma função que associa a cada valor
possı́vel de x de X a uma probailidade f (x) = P(X = x) e tem as
seguintes propridades
i) f (x) ≥ 0.
X
ii) f (x) = 1.
x

96 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Discretas

Definição (Função de distribuição acumulada)


Seja X uma variável aleatória discreta. A função de distribuição
acumulada de X é definida como
X
F (x) = P(X ≤ x) = f (u)
u≤x

onde o somatório à direita cobre todos os valores de u menores ou


igual que x.

Obs: A função de probabilidade pode ser obtida a partir da função


de distribuição.

97 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Discretas

Se X assume apenas um número finito de valores x1 , x2 , . . . , xn


então a função de distribuição



0, se x < x1

f (x1 ), se x1 ≤ x < x2





f (x1 ) + f (x2 ), se x2 ≤ x < x3

F (x) = ..


 .

f (x1 ) + f (x2 ) + . . . + f (xn−1 ), se xn−1 ≤ x < xn





1, se x ≥ xn

98 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Discretas

Exemplo
Lançam-se uma moeda duas vezes. Seja X o número de caras que
aparecem.
a) Determine a função de probabilidade da v.a X .
b) Construa o gráfico de probabilidade (gráfico em barras).
c) Determine a função de distribuição acumulada e o seu gráfico
correspondente.

99 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Contı́nuas

Função de densidade de probabilidade


Seja X uma variável aleatória contı́nua. A função de densidade de
probabilidade (f.d.p) de X é uma função f tal que

Z b
P(a < X < b) = f (x) dx
a

para cada a, b ∈ R tal que a < b e que tem as seguintes


propriedades:
i) f (x) ≥ 0, ∀x ∈ R,
Z ∞
ii) f (x) dx = 1.
−∞

100 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Contı́nuas

Função de distribuição acumulada


Seja X uma variável aleatória contı́nua com função densidade de
probabilidade f . A sua função de distribuição acumulada F está
definida para qualquer valor real x e é dada por

Z x
F (x) = P(X ≤ x) = f (u) du.
−∞

101 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Contı́nuas

Exemplo
1. Seja X uma v.a contı́nua.
a) Determine a constante c de maneira que a função
(
cx 2 , 0 < x < 3
f (x) =
0 caso contrário

seja uma função de densidade de probabilidade.

b) Calcule P(1 < X < 2).

c) Determine a função de distribuição acumulada F e use-a para


calcule P(1 < X ≤ 2).

102 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Contı́nuas

Terorema (Propriedades da função de distribuição acumulada F da


v.a contı́nua X)

i) F é uma função contı́nua.


ii) Se x ≤ y , então F (x) ≤ F (y ) (isto é, F é crescente).
iii) F (−∞) = lim F (x) = 0.
x→−∞
iv) F (+∞) = lim F (x) = 1.
x→+∞
v) f (x) = 0
F (x), se a função de distribuição acumulada for
derivável.
vi) P(a < X < b) = F (b) − F (a).

103 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições de Probabilidade Conjuntas e Distribuições


Bidimensionais

Definição (Vector Aleatório)


(X1 , X2 , . . . , Xn ) é um vector aleatório ou uma variável aleatória
n-dimensional se X1 = X1 (s), X2 = X2 (s), . . . , Xn = Xn (s) forem
n funções, cada uma associando um número real a cada resultado
s do espaço amostral S.

Função de probabilidade conjunta


Seja (X , Y ) um vector aleatório discreto. A função de
probabilidade conjunta de (X , Y ) é uma função fXY que associa a
cada para ordenado possı́vel (x, y ) de (X , Y ) a sua probailidade
fXY (x, y ) = P(X = x, Y = y ) e tem as seguintes propriedades

104 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições Bidimensionais

Função de probabilidade conjunta


Seja (X , Y ) um vector aleatório discreto. A função de
probabilidade conjunta de (X , Y ) é uma função fXY que associa
a cada para ordenado possı́vel (x, y ) de (X , Y ) a sua probailidade
fXY (x, y ) = P(X = x, Y = y ) e tem as seguintes propriedades

i) fXY (x, y ) ≥ 0
XX
ii) fXY (x, y ) ≥ 0
x y

105 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições Bidimensionais

Função de probabilidade conjunta


Seja (X , Y ) um vector aleatório contı́nua. A função de densidade
de probabilidade conjunta de (X , Y ) é uma função fXY tal que

Z Z
P((X , Y ) ∈ A) = fXY (x, y ) dx dy
A

para qualquer região A do espaço bidimensional e que tem as


seguintes propriedades:
i) fXY (x, y ) ≥ 0
Z +∞ Z +∞
ii) fXY (x, y ) dx dy = 1.
−∞ −∞

106 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Função de Distribuição Acumulada Conjunta

Função de distribuição acumulada conjunta


Seja (X , Y ) um vector aleatório discreto com função de
probabilidade conjunta fXY . A sua função de distribuição
acumulada conjunta FXY está definida para todo o par
(x, y ) ∈ R2 e é dada por

XX
FXY (x, y ) = P(X ≤ x, Y ≤ y ) = fXY (u, v ) ,
u≤x v ≤y

onde u e v tomam todos os valores possı́veis das v.a X e Y não


superiores, respectivamente, a x e y .

107 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Função de Distribuição Acumulada Conjunta

Função de distribuição acumulada conjunta


Seja (X , Y ) um vector aleatório contı́nuo com função de
densidade de probabilidade conjunta fXY . A sua função de
distribuição acumulada conjunta FXY está definida para todo o
par (x, y ) ∈ R2 e é dada por

Z x Z x
FXY (x, y ) = P(X ≤ x, Y ≤ y ) = fXY (u, v ) du dv .
−∞ −∞

Teorema
∂ 2 FXY (x,y )
Seja (X , Y ) um vector aleatório contı́nuo. Se ∂x∂y existir
∂ 2 FXY (x,y )
então fXY = ∂x∂y .
108 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Probabilidade Marginais

Definição (Probabilidade Marginais e Densidade Marginais )


No caso discreto, as funções de probabilidade marginais de X e de
Y são respectivamente,
X X
fX (x) = fXY (x, y ) e fY (y ) = fXY (x, y ),
y x

e no caso contı́nuo, as funções de densidade de probabilidade


marginais de X e de Y são respectivamente,
Z +∞ Z +∞
fX (x) = fXY (x, y ) dy e fY (y ) = fXY (x, y ) dx
−∞ −∞

109 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Probabilidade Marginais

Definição( Distribuições Marginais Acumuladas)


As funções de distribuição acumuladas marginais de X e de Y
são, são no caso discreto,
XX XX
FX (x) = fXY (u, y ) e YY (y ) = fXY (x, u)
u≤x y u≤y x

e no caso contı́nuo,
Z x Z +∞
FX (x) = fXY (u, y ) dy du e
−∞ −∞
Z y Z +∞
FY (y ) = fXY (x, u) dx du
−∞ −∞

110 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições Condicionais

Sejam X e Y duas variáveis aleatórias discretas, e considerem-se


os eventos {X = x} e {Y = y }. A probabilidade condicional
P(X = x|Y = y ) chama-se função de probabilidade condional de
X dado Y = y , denota-se por fX |Y =y (x) e é dada por

P(X = x, Y = y ) fXY (x, y )


fX |Y =y (x) = P(X = x|Y = y ) = = ,
P(Y = y ) fY (y )

se fY (y ) > 0.

111 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições Condicionais

Definição( Distribuições Marginais Acumuladas)


Seja fXY a função de probabilidade conjunta (f.d.p. conjunta, no
caso contı́nuo) do vector aleatório (X , Y ), e fX e fY as funções de
probabilidade marginais (f.d.p. marginais, no caso contı́nuo) de,
respectivamente, X e Y .
A função de probabilidade condicional de X dado Y = y , no
caso, e a função de densidade de probabilidade condicional de
X dado Y = y , no caso contı́nuo, são dadas por

fXY (x, y )
fX |Y =y (x) = se fY (y ) > 0
fY (y )

112 / 113
Introducão Tabela de distribuição de frequências Gráficos Medidas de centralização Medidas de variabilidade Medidas de Posição

Distribuições Condicionais

De forma análoga, a função de probabilidade condicional de Y


dado X = x, caso discreto e a função de densidade de
probabilidade condional de Y dado X = x, no caso contı́nuo, é

fXY (x, y )
fX |Y =y (x) = se fX (x) > 0
fY (y )

113 / 113

Você também pode gostar