Escolar Documentos
Profissional Documentos
Cultura Documentos
Amostra
Uma amostra é um subconjunto de dados extraído de uma
população.
Amostragem
É o processo de retirada de uma ou mais amostras de uma
população
Variável Aleatória
É uma variável que pode assumir a priori qualquer resultado
possível em um experimento aleatório.
As variáveis aleatórias podem ser quantitativas ou qualitativas.
V. A, Qualitativa
O seu valor é expresso por um atributo ou qualidade.
Ex.: Tipo de Rocha
V.A. Quantitativa
Associa à cada elemento da população um valor numérico para uma
característica a ser analisada.
As variáveis aleatórias quantitativaspodem ser discretas ou
contínuas.
V. A. Discreta
Em um dado experimento pode assumir, a priori, qualquer valor
dentro de um conjunto finito ou uma seqência infinita de valores.
V, A. Contínua
Em um dado experimento pode assumir, a priori, qualquer valor
dentro de um dado intervalo pertencente ao seu espaço amostral.
Ex.: Teor de uma dada substância.
Nomenclatura
Para se referir a uma variável aleatória de forma geral
será utilizada uma letra maiúscula.
P(Z>z)
Função massa de probabilidade de uma v. a. discreta X - p(x)
0.196
0.168
0.140
0.112
p(x)
0.084
0.056
0.028
0.000
0 1 2 3 4 5 6 7 8 9 10 11 12 13
X
p( x ) = 1
xi
i
Função densidade de probabilidade de uma v. a. contínua X - f(x)
Propriedades de f(x)
Propriedades de f(x)
f(x).dx
P(x<X<x+dx)
x x+dx
Função de repartição, ou Lei de repartição ou Funçào de distribuiçào
acumulada de uma variável aleatória X - F(x)
F ( x) = P( X x)
Para uma variável discreta X
F ( x ) = P ( X x ) = P ( X = ti ) − ti
ti x
2. Quando x → -∞ F(x) → 0
x→ ∞ F(x) → 1
dF ( x)
4. f ( x ) = = F ' ( x)
dx
b
5. P(a X b) = F (b) − F (a ) = f ( x)dx
a
No experimento de se lançar um dado de 6 faces
F(4)=P(X≤4) = 4/6
F(2)=P(X≤2) = 2/6
P(2≤X<4)=F(4)-F(2)=2/6
Relação entre F(x) e f(x)
Gráfico da função de repartição para o exemplo do
lançamento de 2 dados
Estatística Descritiva Estatística Inferencial
Tipos
Frequência Simples
→ Função massa ou densidade
Frequência Relativa
1. Critério de Sturges
2. 5 k 20
3.
n é o número de dados.
Histogramas
30
80
25
60
20
%
%
15
40
10
20
5
0 0
0 5 10 15 20 25 30 35 0 5 10 15 20 25 30 35
X X
0.8
0.6
%
0.4
0.2
0.0
0 10 20 30 40
X
Histograma em escala aritmética
Histograma em escala logaritmica
Histograma acumulado crescente
Presença de outliers
Anamorfose
Isolamento de populações diferentes
Histograma de frequência relativa de X
20
15
%
10
0
8 12 16 20 24
X
Função de repartição de X
1 .0
0.8
0.6
%
0.4
0.2
0.0
5 10 15 20 25
X
Observação de Outliers
Histograma de frequência relativa de X
25
20
15
%
10
0
0.0 7.5 1 5.0 22.5 30.0 37.5
X
função de repartição de X
1 .0
0.8
0.6
%
0.4
0.2
0.0
0 10 20 30 40
X
Anamorfose Gaussiana
Histograma de frequencia relativa de X
35
30
25
20
%
15
10
0
0 5 10 15 20 25 30 35
X
Dados originais
Anamorfose
15
Percent
10
0
-2 -1 0 1 2
X Normalizado
Dados transformados
Tabela de nscores para transformação inversa
14
15
12
10
%
%
10
8
5 4
0 0
-3 -2 -1 0 1 2 3 0 6 12 18 24 30 36
valores normais simulados valores de X simulados (200 valores)
30
30
25
Percent
20
20
%
15
10 10
0 0
0 5 10 15 20 25 30 35 0 5 10 15 20 25 30 35
EX = x . p( x )
i i para v. a. discreta
xi
EX = xf ( x)dx para v. a. contínua
−
x i
m= X = i =1
n
** Não tem sentido para variáveis categóricas
Propriedades da esperança matemática
Moda
X n +1 se n é ímpar
2
Me = Xn + Xn
2 2
+1
se n é par
2
24.95 6.49 6.49
19.85 9.66 media 17.23778 9.66 media 21.594
28.57 11.33 mediana 17.94 11.33 mediana 18.715
17.94 16.86 16.86
16.86 17.94 17.94
19.49 19.49 19.49
6.49 19.85 19.85
9.66 24.95 24.95
11.33 28.57 28.57
60.8
Quantil de uma variável aleatória X - xp
É o valor de X a que corresponde o valor da função de repartição
ou histograma acumulado crescente igual a p %.
F ( x p ) = p%
Tem-se então, que o primeiro quartil, ou quartil inferior Q1=X0,25 e
que o terceiro quartil, ou quartil superior Q3=X0.75. A mediana é igual
a X0.50. O terceiro decil corresponde a X0,3 , enquanto que o décimo
segundo percentil corresponde X0.12. X0 é o valor mínimo. X1.0 é o
valor máximo. De uma forma geral se tem o p-quantil de X,
expresso como x p
+
ms ( x) = E[ X s ] = f ( x)dx
s
x
−
2 = (
ix − )2
p(xi ) V. A. Discreta
xi
A variância nos indica como a variável aleatória X varia ou se distribui
em torno da sua esperança matemática ou média. É uma medida da
dispersão dos valores de X em torno da sua média.
(X )
n 2
i −X
sn2 = i =1
Variância experimental
n
(X )
n 2
i −X
sn2−1 = i =1
Variância Amostral
n −1
A variância bem como o desvio padrão são muito sensíveis a valores
extremos.
Para estimar σ2 da população deve-se utilizar a fórmula da variância
amostral quando n≤30. Quando n>30, pode-se usar qualquer uma
das duas fórmulas.
Var ( X ) = E[( X − ) ] = E X 2 − ( E X )
2 2
Propriedades da variância
1. Var (c) = 0
2. Var ( X + c) = Var ( X )
3. Var (cX ) = c 2Var ( X )
4. Var ( X + Y ) = Var ( X ) + Var (Y ) + 2 cov( X , Y ),
onde cov( X , Y ) é a covariância entre as variáveis X e Y
5. Cov( X , Y ) = E[ XY ] − E[ X ]. E[Y ] = E[( X − x )(Y − y )]
6. Var[ X ] = cov( X , X )
n
7. Se Y = ai X i então :
i =1
n n n
Var(Y) = a i Var ( X i ) + ai a j cov( X i , X j ) i j
2
i =1 i =1 j =1
n n
Var(Y ) = ai a j cov( X i , X j ) i, j
i =1 j =1
cov(z+y,z)=cov(x,z)+cov(y,z)
Propriedades da variância
1. Var (c) = 0
2. Var ( X + c) = Var ( X )
3. Var (cX ) = c 2Var ( X )
4. Var ( X + Y ) = Var ( X ) + Var (Y ) + 2 cov( X , Y ),
onde cov( X , Y ) é a covariância entre as variáveis X e Y
5. Cov( X , Y ) = E[ XY ] − E[ X ]. E[Y ] = E[( X − x )(Y − y )]
6. Var[ X ] = cov( X , X )
n
7. Se Y = ai X i então :
i =1
n n n
Var(Y) = a i Var ( X i ) + ai a j cov( X i , X j ) i j
2
i =1 i =1 j =1
n n
Var(Y ) = ai a j cov( X i , X j ) i, j
i =1 j =1
cov(z+y,z)=cov(x,z)+cov(y,z)
A - Variáveis X e Y independentes Cov(X,Y) = 0 ρ =0
Cov(X,Y) 15.6
Cov(X,Y) 0.0000156
i =1 i =1 j =1
n n
Var(Y ) = ai a j cov( X i , X j ) i, j
i =1 j =1
cov(z+y,z)=cov(x,z)+cov(y,z)
cov( X , Y ) = E[ XY ] − E[ X ]E[Y ]
cov( X , X ) = E[ XX ] − E[ X ]E[ X ]
cov( X , X ) = E[ X ] − ( E[ X ]) = Var ( X )
2 2
n n
2
n
2
Var ai X i = E ai X i − E ai X i
i =1 i =1 i =1
n
2
E ai X i
i =1
a1 X1 + a2 X 2 + a3 X 3 + a4 X 4
a1 X1 + a2 X 2 + a3 X 3 + a4 X 4
_____________________
n n
a ia j X i X j
i =1 j =1
n n n n
E a i a j X i X j = a i a j E X i X j
i =1 j =1 i =1 j =1
2
n
E ai X i
i =1
a1E X1 + a2 E X 2 + a3 E X 3 + a4 E X 4
a1E X1 + a2 E X 2 + a3 E X 3 + a4 E X 4
__________________________________
n n
a ia j E X i E X j
i =1 j =1
2
n n n
E ai X i = a i a j E X i X j
i =1 i =1 j =1
n n
2
n
2
Var ai X i = E ai X i − E ai X i =
i =1 i =1 i =1
n n n n
a ia j E X i X j − a ia j E X i E X j =
i =1 j =1 i =1 j =1
a i a j ( E X i X j − E X i E X j ) =
n n
i =1 j =1
n n n
(
Var ai X i = a i a j cov X i , X j )
i =1 i =1 j =1
É desejável
Condição de não enviesamento
n n
Z V* = z e =1
=1 =1
E[ Erro] = E[Z − ZV ] = 0
*
V
Distância Interquartil - IQR
IQR = Q3 – Q1
CV =
?
Valores extremos: valores erráticos que pertencem à solução
do problema e devem ter impacto significativo em estimativas
tais como média, variância, coeficientes de correlação linear ou
medidas de continuidade espacial.
Outliers: valores normalmente elevados que não são
relevantes para a solução da meta imposta pelo estudo.
A B C