Você está na página 1de 10

1

MDIA

xi .

Tendncia Central

n
X=

MEDIANA
n -> par

x +x
~
x= k k +1
2

n -> mpar

~
x=x k+1

Moda
Mo = valor que ocorre mais
vezes na distribuio

Valor que equilibra a distribuio, dado que a soma


dos desvios em relao mdia = 0
Influenciada por valores extremos. Indicada para
distribuies simtricas.
Propriedades:
Soma/subtraco de K a todas as variveis:
somar/subtrair K mdia
Multiplicao/diviso de K a todas as variveis:
multiplicar/dividir a mdia por k

Obtm-se o valor da mdia


Adio/subtraco e
Multiplicao/diviso
> altera mdia

Valor que ocupa a posio central na sucesso das


observaes. Valor que divide o conjunto dos dados
ordenados em 2 subconjuntos, cada um com cerca
de metade das observaes.
Insensvel a valores extremos. Indicada para
distribuies assimtricas.
Propriedades:
Soma/subtraco de K a todas as variveis:
somar/subtrair K mdia
Multiplicao/diviso de K a todas as variveis:
multiplicar/dividir a mdia por k
A moda pode no ser nica. Com 2 ou mais modas
chamam-se distribuies PLURIMODAIS
Propriedades:
Soma/subtraco de K a todas as variveis:
somar/subtrair K mdia
Multiplicao/diviso de K a todas as variveis:
multiplicar/dividir a mdia por k

Obtm-se o n da observao
que representa a mediana

Valor da varivel com maior


frequncia

a No-Tendnci

Em distribuies simtricas mdia, mediana e moda so muito prximas


QUANTIS (elementos de
separao)
Quartis

i
Qi= . n
4

Valores que dividem a distribuio em partes iguais


Propriedades:
Soma/subtraco de K a todas as variveis:
somar/subtrair K mdia
Multiplicao/diviso de K a todas as variveis:

Obtm-se o n da observao
Resultado inteiro
Adicionar 1 observao

MEDIDAS DE DISPERSO

Amplitude total

h=maxmin

Mede a distncia entre 2 valores extremos


Sensvel a valores extremos

Intervalo interquartil

IQ=Q 3Q1

Mede a disperso das observaes em relao


mediana

Obtm-se o valor referente


diferena entre os
observados como mximo e
mnimo
Obtm-se o valor da
disperso

Insensvel a valores extremos.

Desvios

Clculo do desvio de cada observao em relao


mdia.

di=xi x

A soma de todos os desvios sempre zero

di>0 xi> x
observao acima da mdia

di=0 xi=x
No h desvio

di<0 xi< x
Varincia

Mdia dos quadrados dos desvios em relao


mdia.
Propriedades:
Soma/subtraco de K a todas as variveis:
varincia no altera
Multiplicao/diviso de K a todas as variveis:
multiplicar a varincia por k2

xi .

s2=

Observao abaixo da mdia


Traduz-se no quadrado das
unidades em que est
definida a varivel.
Quanto maior forem os
quadrados maiores so os
desvios.

Ou
2

s = fi . xi x

Desvio padro

s x = s

Mdia dos quadrados dos desvios em relao


mdia
Propriedades:
Soma/subtraco de K a todas as variveis:
varincia no altera
Multiplicao/diviso de K a todas as variveis:

Raiz quadrada da varincia,


usa-se porque tem a
vantagem de estar expressa
na mesma unidade da
varivel

Permitem verificar a distncia entre as observaes e a representatividade dos valores mdios

3
multiplicar/dividir o desvio por k
Coeficiente de variao
(disperso relativa)

Cv=

Cv=

Desvio padro
x

xix
Sx

Valor em percentagem.
Quanto maior a %, maior
a disperso
o valor do desvio padro
de x% da mdia

sx
x

Variveis estandardizadas
(variveis reduzidas)

Zi=

Permite a comparao entre duas ou mais


distribuies, dado que independente da unidade
em que se exprime a varivel

Para cada valor da distribuio subtrai-se a mdia e


divide-se pelo desvio padro. Indica quantas
unidades est acima ou abaixo da mdia. Permite
comparar o valor de cada caso com a distribuio
(mdia = 0 e desvio padro = 1)

MEDIDAS DE DISPERSO

4
Outlier

Valor muito grande ou muito pequeno em relao


s outras observaes

Bi= xi<Q 13 ( Q 3Q 1 )
Bs= xi>Q 3+3 (Q 3Q1 )
Caixa de Bigodes
Diagrama de caule e folhas
Caule
Folhas
Frequncia
0
334
0*
7889999
1
0001123
1*
44555

3
7
7
5

Diagrama no qual esto representados os valores


mximo e mnimos, os outliers e o intervalo
interquartis
Estrutura os dados de forma a obter uma rpida
informao. Os dgitos de cada nmero so
divididos em dgitos principais (caules) e dgitos
secundrios (folhas)

Medidas de assimetria (Indica o enviesamento das observaes)

Obtm-se o valor extremo

Permitem verificar a distncia entre as observaes e a representatividade dos valores mdios

SIMTRICA
ASSIMTRICA NEGATIVA

ASSIMTRICA POSITIVA
enviesada esquerdaenviesada direita
predominam os desvios positivos

predominam os desvios negativos

x =~
x=Mo

x < ~x< Mo

ou

ou

Q3 Q2 = Q2 Q1
Q3 Q2 < Q2 Q1
(Medidas de assimetria)
Coeficiente de Pearson

g=

x > ~x> Mo

ou

x mo
sx

Sensvel a valores extremos

Q3 Q2 > Q2 Q1
Resultados :
Coeficiente de Bowley
'

g=

( Q3Q 2 )(Q 2Q 1)
( Q3Q 2 )+(Q 2Q 1)

Pouco Sensvel a valores extremos

g > 0 = assimetria positiva


g < 0 = assimetria negativa
g = 0 = simetria

ANLISE BIVARIADA DE DADOS

Avaliao grfica - DIAGRAMA DE DISPERSO


Representao dos vrios pares ordenados (x,y) num referencial cartesiano, permitindo visualizar a relao existente
entre eles

ASSOCIAO POSITIVA
ASSOCIAO NULA
(X aumenta; Y aumenta)
qualquer tipo de relao)

ASSOCIAO NEGATIVA
(X aumenta; Y diminui)

(no h

A relao (associao) existente entre as variveis pode ser caracterizada quanto a:


FORMA
Linear pontos tm tendncia
para aproximar de uma recta
No linear pontos tm
tendncia para aproximar de
uma curva
Avaliao analtica
COVARINCIA

SENTIDO
Positiva ou directa variveis evoluem no mesmo
sentido

cov xy=n . xi. yi xi . yi

A covarincia sensvel mudana de escala, por


este motivo no uma medida adequada para
avaliar a intensidade da relao linear

Negativa ou inversa variveis evoluem em


sentido contrrio
Medida do grau de associao linear (mdia dos
produtos dos desvios em relao mdia)

INTENSIDADE
Pode ser nula, imperfeita
(fraca ou forte), perfeita

cov = 0 (nula) no existe


relao linear entre as variveis
cov < 0 (negativa) quando
uma varivel aumenta a outra
diminui
cov > 0 (positiva) quando uma
varivel aumenta a outra
tambm aumenta

ANLISE DE CORRELAO associao entre varveis (sentido e intensidade)

8
Avaliao analtica
CORRELAO

r xy =

r xy =

cov ( x , y )
sx . sy
n xi. yi xi . yi

* Serve para obviar os inconvenientes da covarincia


* O Coeficiente de Correlao (Pearson) mede a
intensidade da associao entre as variveis, uma
normalizao da covarincia, dividindo-a pelo
produtos dos desvios padro
* Insensvel escala de medio e de origem
* No mede a dependncia funcional, nunca
constitui uma prova slida de relaes causais.
* permite comparar variveis expressas em unidades
diferentes

[ n . xi ( xi ) ] . [n . yi ( yi ) ] .
2

Intervalo da variao

1 r 1

r =-1 = correlao perfeita


negativa
r < 0 => correlao no perfeita
negativa
r = 0 = correlao nula
r > 0 => correlao no perfeita
positiva
r = 1 = correlao perfeita
positiva
em valor absoluto, quanto maior
for o coeficiente, maior ser a
associao

ANLISE BIVARIADA DE DADOS

9
Modelo de regresso linear
Mtodo dos mnimos
quadrados (recta de
regresso

y=a+bx+ e

= valor real

observado

y=a+bx

= recta ajustada

Pretende-se ajustar uma recta que minimize o


somatrio do quadrado dos resduos
Y = varivel dependente ou endgena
X = varivel independente ou exgenea
e = varivel residual ou erro
a = constante, intercepo da recta com o eixo
vertical
b = constante, declive da recta

Clculo de b:

b=

n . xi . yi xi. yi
2

n . xi 2( xi )

Clculo de a, obtm-se pela


equao:

a= y b . x
Medida da qualidade do
ajustamento

r=

b . ( xix ) . ( yi y )

( yi y )2

O objectivo com que se ajustam as rectas de


regresso dos mnimos quadrados e, em geral, o de
prever ou predizer o valor de uma das variveis
uma vez conhecido o valor da outra. Mas a
previso pode ser pior ou melhor. A questo que se
pes a de avaliar a qualidade do ajustamento.
2

o valor do r deve ler-se x% da variao do Y


explicada pela variao do X

Intervalo de variao:

1 r 2 1
r=0 = ausncia de
relao linear
As rectas confundem-se,
esto sobrepostas

r=1

ou

r=1

implica relao linear


perfeita. As rectas
confundem-se, esto
sobrepostas
Quando existe correlao
linear no perfeita, quanto

ANLISE DE REGRESSO (linear simples) estuda a relao funcional entre as variveis

10
maior o coeficiente de
correlao, menor o ngulo
formado pelas duas rectas de
regresso.