Você está na página 1de 22

Faculdade de Ciências

Departamento de Matemática e Informática


Curso de Licenciatura em Estatística

Econometria
Aspectos Introductórios: Algebra Linear & Estatística Básica Variáveis
Aleatórias

Ornelle Nhaca

Maputo, Fevereiro 2016

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 1 / 22


CONTEÚDO
1 REFLESHEMENT ALGEBRA LINEAR
Material Bilbliográco
Operações com Matrizes
Determinante e Matriz Inversa
Autovalores e Autovectores
Decomposição de Valores Singulares
Aplicação em R
2 ESTATÍSTICA BÁSICA
Matrizes de Variaveis Aleatórias
Determinação de Medidas Descritivas
Aplicação em R
3 Variáveis aleatórias e suas Distribuições
Tipos de Variáveis aleatórias
Distribuições e suas Caracteristicas
Aplicação em R

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 2 / 22


Material Bilbliográco

BRAUN JHON e MURDOCH DUCAN (2007). A FIRST COURSE


IN STATISTICAL PROGRAMIMING WITH R . Cambridge
University Press: Cambridge.
JOHNSON RICHARD e WICHERMAN DEAM (2007). APPLIED
MULTIVARIATE STATISTICAL ANALYSIS . Sixth Edition.
Pearson: Prentice Hall, New Jersey.
ANTON HOWARD e RORRES CHRIRS (2010). ELEMENTARY
LINEAR ALGEBRA - Applications Version . Tenth Edition. Jhon
Willey & Sons.

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 3 / 22


Conceitos e Operações com Matrizes

Vectores
A qualquer array de x de n dados que compoem uma variável x1 , x2 , ..., xn é
designado por vector, e pode ser escrito sob forma
 
x1
x2 
0
x =  .  ou x = x1 , x2 , · · · , xn
  
 .. 
xn
0
onde x é designado vector transposto a coluna de x

Pode-se vericar se os mesmos (as) são linearmente independentes desde


que, para os vectores v1 , v2 , ..., vk existam constantes c1 , c2 , ..., ck de tal
forma que (??):
c1 v1 + c2 v2 + · · · + ck vk = 0 (1)

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 4 / 22


Cont...
Matriz
A qualquer disposição rectangular de dados de variáveis, arbitrariamente se
pode ter para n linhas e p colunas:
 
a11 a12 · · · a1p
a21 a22 · · · a2p 
M = . .. ..
 
 .. . .

|{z} · · ·
(n×p)
an1 an2 · · · anp

Observe que a sua transposta consiste em fazer das colunas em linhas


0
para M
Operações como:
I Adição/Subtração - Duas matrizes A e B de mesma dimensão podem
ser adicionadas ou subtraidas, desde que: A +/- B (ij ) nas entradas
aij + / − bij
I Multiplicação - Para A (n × k ) deve haver B (k × p ), (i,j ) se têm
Pl=1
ai 1 b 1j + ai 2 b2j + · · · + aik bkj = k ail blj
Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 5 / 22
Determinante e Matriz Inversa

Determinante (Generalização)
Se A é uma matriz (n × n), então o número obtido apartir do producto das
entradas de cada linha ou coluna de A pelo respectivo cofator??
adicionado os mesmos é designado cofator e suas somas chamadas
expanção cofatorial

Destacan-se três formas de obtenção:


Cálculo apartir de expanção de cofactores:
det(A) = a1j C1j + a2j C2j + · · · + anj Cnl
Redução de linhas (Jordan)
det(A1 ) det(A2 ) det(An )
Regra de Cramer : x1 = , x2 = ,..., xn =
det(A) det(A) detA

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 6 / 22


Cont...

Matrix Inversa
A condição fundamental da existência do inverso de um número (a−1 ), de
tal forma que a−1 a = aa−1 = 1 se a 6= 0, conceito igual ao da existência de
matriz inversa: Seja B tal que

B × |{z}
|{z} A × |{z}
A = |{z} B = I (identidade)
(k×k) (k×k) (k×k) (k×k)

−1
então B é chamada matriz inversa de A de é denotada por A

Para o seu cálculo procede-se


Cálculo do determinante det(A) 6= 0
Determinação dos cofatores Aij = (−1)(i+j) Mij
Transladar os valores nas posições aij (Atenção!!!)

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 7 / 22


Autovalores e Autovectores

Autovalores e Autovectores
Seja A, uma matriz quadrada, qualquer vector x não nulo de Rn é chamado
de autovector de A (ou operador matricial TA ), se Ax é um escalar
multiplicado por x, de tal modo que

Ax = λx

para algum escalar λ. O escalar λ é designado autovalor de A, e x é


designado autovector correspondente a λ

Para proceder-se com o seu cálculo:


Cálculo do derminante det(λI − A) = 0 obtendo a Equacão
(Polimónio) Característica (o)
Cálculo da expressão det(λI − A)x = 0, onde os autovectores obtidos
são vectores de espaços não nulos (??).

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 8 / 22


Decomposição de Valores Singulares

SVD
Seja A uma matrix m × n, de tal mod que A seja expressado como
PR 0
A = UΣV T = r =1 λi ui vi

onde U e V são matrizes ortogonais e Σ a matriz com valores singulares


na diagonal.

Notas:

V = v1 v2 · · · vn diagonal ortogonal de AT A

√ √ √
Diagonal não negativa de Σ é σ1 = λ1 , σ2 = λ2 , · · · , σk = λk
onde λ1 , λ2 , · · · , λk são os autovalores não nulos de AT A
correspondente a coluna de vectores de V, com variâncias positivas a
crescer de 1 a k
Avi 1
ui = = Avi (i = 1, 2, · · · , k)
kAvi k σi
Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 9 / 22
Decomposição de Valores Singulares (Exemplo)
Encontre a decomposição de valores singulares para a matrix
 
1 1
0 1
1 0

Solução: Determinando os autovalores


√ de AT A se têm λ1 = 3 e λ2 = 1 e os
valores corespondentes a σ1 = 3 e
σ2 = 1
√   √
2 2

v1 =  √2 
 2 
e v2 =  √
 
2 2


2 2
os autovectores de λ1 e λ2 , respectivamente, e V = [v1 |v2 ], procedendo com o
cálculo de u1 e u2 se têm
√
6 1

 3 0 − √  √   √2 √
3 2

√ √
 
1 1  6 3 0
2 1   2 2 
0 1 =
 − −√   0 1  √ √
 6 2 2
√2

3

1 0 √ 0 0 −
 6 2 1  2 2
−√
Ornelle Nhaca (UEM/DMI) 6 2Aula Teórico/Prática
3 #1 Licenciatura em Estatística 10 / 22
SVD - Exemplo 2

Encontre a decomposição de valores singulares para


3 1 1
 
A=
−1 3 1

0
Cálculo dos autovalores e os respectivos autovectores de AA
0
Cálculo dos autovalores e os respectivos autovectores de A A
0 0
Proceder com o cálculo dos productos matriciais A Av1 e A Av2

√1 √1
! !
√ 1 2 1
 √
√2 √1
  
SVD(A) = 12 √1 2 √ √ √ + 10 2 − 0
2
6 6 6 − √12 5 5

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 11 / 22


Códigos em R para Aplicação

Vide Ficha de Exercícios/ Trabalho #1

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 12 / 22


Matrizes de Variaáveis Aleatórias

A Matriz Amostral
Seja a matriz (n × p ), ao conjunto de elementos (dados) em p variáveis
desiguinar-se-á matriz amostral
 
x11 x12 · · · x1p
x21 x22 · · · x2p 
X = . .. ..
 
|{z}   .. . . · · ·

(n×p)
xn1 xn2 · · · xnp

Cada linha de X representa uma observação multivariada


Pelo que se tem, dados amostrais de tamanho n em uma p-variada
"população"
Assim todas medidas descritivas deverão ser calculadas de forma
multivariada

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 13 / 22


Determinação de Medidas Descritivas
Seja
4 1 1 2 5
   

X = −1 3 K = 4 1 6
3 5 4 0 4
Média:
 4−1+3 
2
 
x̄ = 3 =
1+3+5
3 3
Média corrigida ou matriz dos desvios: (??)
 
k1i − k̄
−2 1 0
 
0
k2i − k̄ 
1 |{z}
K − |{z} k̄ =  .  =  1 0 1
 
 .. 
1 −1 −1
|{z}
(n×p) (n×1) (1×p)
kni − k̄
Nota: Desde que d1 = d2 = · · · = dn a matriz dos desvios é de rank não
0 0 0
completo (??) e para o mesmo caso se têm |S|= |(K − 1k̄ ) (K − 1k̄ )|= 0
Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 14 / 22
Cont...
As medidas amostrais podem ser generalizadas de tal forma que se têm
1 0
x̄ = X 1 (2)
n
1 0 1 0
S = X (I − 11 )X (3)
n−1 n
Desde que se tenha S, pode-se então se ter a matriz de correlações
amostrais R
1
Passo 1: Seja denida p × p a matrix de desvios padrão D2 e calcular a
1 1
sua inversa, (D 2 )( − 1) = D− 2
√
0 0

s11 ···

1
 0 s22 ··· 0 
D2 =  . .. ..
 
|{z}  .. . . ··· 

(p×p) √
0 0 ··· spp

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 15 / 22


Cont...
Passo 2: Procedendo com o cálculo da matriz inversa dos desvios padrão
 1
0 0


s11 ···
 0 √1 0 
− 12
 s22 · · · 
|{z} =  ..
D .. ..
 
. . . · · ·

(p×p)
 
0 0 · · · √1spp
Passo 3: Compondo a matrix de correlações R se têm
s1p
√ s11 √ s12
 

s11 s11

s11 s22 ··· √ √
s11 spp
1
 
 √ s12√ √ √s22 ···
s2p
√ √ 
r12 · · · r1p
 s11 s22 s22 s22 s11 spp  .. .. .. 
R = .. .. ..   .
= . . 
. . . ···


s1p s2p spp
 r1p r2p · · · 1
√ √
s11 spp
√ √
s22 spp ··· √ √
spp spp

Se têm
1 1 1 1
R = D− 2 SD− 2 e por permutções matriciais S = D 2 RD 2
Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 16 / 22
Códigos em R para Aplicação

Vide Ficha de Exercícios #1/ Trabalho #1

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 17 / 22


Tipos de Variáveis Aleatórias
Variável Aleatória discreta
A uma função denida sobre espaço amostral s e assumindo valores em um
conjunto enumerável de de pontos do conjunto real designa-se por variável
aleatória discreta
O conjunto dos valores da variável e as respectivas probabilidades
P(xi ) com i = 1, · · · , n é chamado distribuição da variável aleatória X

Para PX = xi se têm ni=1 P(xi ) = 1


P

A função de probabilidade fornece as P(xi ) de ocorrência dos valores


que a variável aleatória pode assumir

Reminder!!!
Pn
µX = E (X ) = i=1 xi P(xi )
I E (X ± Y ) = E (X ) ± E (Y )
I E (X ± k) = E (X ) ± k
σ2X = V (X ) = E (X 2 ) − [E (X )]2
I V (X ± Y ) = V (X ) ± V (Y ) + 2COV (X , Y ) (??)
Ornelle Nhaca (kX
I V ) = k 2 V (X )
(UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 18 / 22
Cont...

Variável Aleatória Contínua


Uma variável aleatória X é contínua em <, se e sse existir uma função
f (x), de tal forma
f (x) ≥ 0, ∀y ∈ <
R +∞
−∞ f (x)dx = 1, onde f (x) é f.d.p

Reminder!!!
R +∞
µX = E (X ) = −∞ xf (x)dx
σX2 = V (X ) = E (X 2 ) − [(E (X )]2 , onde E (X 2 ) = x 2 f (x)dx
R +∞
−∞

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 19 / 22


Distribuições e suas Caracteristicas (Discretas)

Tabela: Sintese das principais distribuições Discretas

Distribuição Função densidade Média Desvio padrão


 
n x
Binomial P(xi ) = p (1 − p)n−x E (X ) = np V (X ) = np(1 − p)
x
−λ x
Poisson P(X = x) =  x!λ E (X ) = λ V (X ) = λ
1 (1−p)
Geométrica P(Xi ) = p(1 − p)x−1 p p2
−λ λx
Poisson x! λ λ

Remider!!!

A distribuição de Poisson, com λ = np é uma boa aproximação da


distribuição binomial quando p for suciente pequeno, n >>>, de tal
forma n ≤ 7
É sempre possivél conduzir ou aproximar todas distribuições a Normal
(??)
Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 20 / 22
Distribuições e suas Caracteristicas (Contínuas)

Tabela: Sintese das principais distribuições contínuas

Distribuição Função densidade Média Desvio padrão


1 x−µ 2
Normal f (x) = √ 1 − 2 ( σ ) , µ σ2
2πσ 2
para −∞ < X < +∞
1 (b+b) (b−a)2
Uniforme a−b , para a < X < b 2 12
1 1
Exponencial λ−λx , x ≥ 0 λ > 0 λ λ2
Reminder!!! (Distribuição Normal)
Grande número de variáveis quer econometricas ou não tendem a ter
distribuição Normal (Grande número de factores que actuam de modo
independente e aditivo)
A distribuição das médias amostrais de grande parte de variáveis tende
a ser normal
Grande parte de testes e modelos estatticos fazem assunção a
distribuição Normal
Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 21 / 22
Códigos em R para Aplicação

Vide Ficha de Exercícios #1/ Trabalho #1

Ornelle Nhaca (UEM/DMI) Aula Teórico/Prática #1 Licenciatura em Estatística 22 / 22