Você está na página 1de 22

Representao de dados

multivariados
ESALQ/USP
Jan 2015

O problema da representao de
muitas variveis em duas
dimenses
Grficos precisam ser apresentados em duas

dimenses ou sobre o papel ou na tela de um


computador

Eixos horizontais e verticais representam


variveis

dados=read.table("pardocas01.txt",h=T);dados
pass X1 X2 X3 X4 X5
1 s 156 245 31.6 18.5 20.5
2 s 154 240 30.4 17.9 19.6
3
s 153 240 31.0 18.4 20.6
...
21 s 159 236 31.5 18.0 21.5
22 ns 155 240 31.4 18.0 20.7
...
48 ns 162 245 32.5 18.5 21.1
49 ns 164 248 32.3 18.8 20.9
data_s=subset(dados,pass=="s", select = c(X1, X2));data_s
X1 X2
1 156 245
2 154 240
4
153 240
....
21 159 236
attach(data_s)

data_ns=subset(dados,pass=="ns", select = c(X1, X2));data_ns


X1 X2
22 155 240
23 156 240
24 160 242
...
49
164 248
50
attach(data_ns)
plot(data_s, pch=15, ylab = "Extenso alar (mm)", xlab = "Comprimento total (mm)",
ylim=c(225,255), xlim=c(150,165))

points(data_ns$X1, data_ns$X2, pch=0)


legend(159,230,legend=c('Sobreviventes','No sobreviventes'),
col=c("black","black"),pch=c(15,0))

# 3D
require(lattice)
cloud(X1~X3*X2,col=as.numeric(dados$pass),data=dados)

*Sobrevivente

* No sobrevivente

X1: Comprimento total


X2: Extenso alar
X3: Comprimento do bico e cabea

Representando variveis ndices

Variveis ndices so variveis no observadas obtidas por


combinao linear das variveis originais.
O principal objetivo de muitos mtodos multivariados a
gerao de variveis ndices.
Com os valores dos CP1, CP2, CP3 pode-se representar
graficamente as relaes entre objetos.
OBS: A desvantagem de representar muitas variveis para
duas ou trs dimenses que alguma diferena-chave entre
os objetos possa ser perdida na reduo.

Exemplo: Qualidade da gua


do Rio Tapajs

CP1 = 0,399276 (Slidos Totais) + 0,329060 (Coliformes Totais) -0,356658


(Transparncia).
CP2 = 0,347818 (pH) + 0,349963 (Oxignio Dissolvido) - 0,452938 (Nitrognio Total ) +
- 0,304178 (IQA).

Representao de Draftman
(matriz de disperso)
CONSISTE: na representao simultnea de todos os pares de
variveis
VANTAGENS:
so
bidimensionais

necessrias

apenas

representaes

DESVANTAGENS: os objetos individuais no so facilmente


identificados, dificultando assim a identificao de quais so
similares e quais so diferentes.
pairs(dados, col=as.numeric(dados$pass))

Representao de Draftman do nmero de


pssaros e cinco variveis medidas em 49
pardocas

Sobreviventes
No sobreviventes

Retas de regresso so
includas nesses grficos
algumas vezes;
Servem para mostrar
relao
entre
as
variveis;
Servem para mostrar
existncia
entre
quaisquer objetos com
valores
estranhos
(DADOS DISCREPANTES).

Representao de pontos de dados


individuais

Consiste na representao de cada um dos


objetos para os quais as variveis so medidas
por um smbolo, com caractersticas diferentes
desse smbolo variando de acordo com as
diferentes variveis.
EX: Faces de Chernoff e Estrela

Representao grfica de medidas


da mandbula em diferentes
grupos caninos
(a)

Faces de Chernoff

(b)

Estrela

Faces de Chernoff
# Faces de Chernoff
library("aplpack")
caes=read.table("caes.txt", head=TRUE)
caes
x1 x2 x3
cao_moderno
9.7 21.0 19.4
chacal_dourado 8.1 16.7 18.3
lobo_chines
13.5 27.3 26.8
lobo_indiano
11.5 24.3 24.5
cuon
10.7 23.5 21.4
dingo
9.6 22.6 21.1
cao_pre_historico 10.3 22.1 19.1

faces(caes, face.type=1)

x4 x5
7.7 32.0
7.0 30.3
10.6 41.9
9.3 40.0
8.5 28.8
8.3 34.4
8.1 32.2

x6
36.5
32.9
48.1
44.6
37.6
43.1
35.0

Faces de Chernoff
Conexo variveis

Caractersticas

X1: Largura da mandbula


X2: Altura da mandbula
X3: Comprimento do primeiro molar
X4: Largura do primeiro molar
X5: Comprimento do primeiro ao terceiro molar
X6: Comprimento do primeiro ao quarto-pr-molar
sorriso

comprimento da face
largura da face
estrutura da face
comprimento da boca
largura da boca
quantidade de

X1: Largura da mandbula


X2: Altura da mandbula
X3: Comprimento do primeiro molar
X4: Largura do primeiro molar
X5: Comprimento do primeiro ao terceiro molar
X6: Comprimento do primeiro ao quarto-pr-molar

comprimento dos olhos


largura dos olhos
comprimento do cabelo
largura do cabelo
estilo do cabelo
comprimento do nariz

Recomenda-se fazer diferentes atribuies alternativas


de variveis s caractersticas

# Estrela
caes=read.table("caes.txt", head=TRUE)
caes
x1 x2 x3
cao_moderno
9.7 21.0 19.4
chacal_dourado 8.1 16.7 18.3
lobo_chines
13.5 27.3 26.8
lobo_indiano
11.5 24.3 24.5
cuon
10.7 23.5 21.4
dingo
9.6 22.6 21.1
cao_pre_historico 10.3 22.1 19.1

stars(caes, cex = 0.55)

x4 x5
7.7 32.0
7.0 30.3
10.6 41.9
9.3 40.0
8.5 28.8
8.3 34.4
8.1 32.2

x6
36.5
32.9
48.1
44.6
37.6
43.1
35.0

Desvantagem

A natureza subjetiva desse tipo de processo


insatisfatria;
Dificilmente so encontrados em pacotes estatsticos.

Perfis de variveis

outra forma de representar objetos agora


por linhas que mostram o perfil dos valores
das variveis

Perfis de variveis em ordem crescente de valores mdios para


as medidas da mandbula para sete grupos caninos.

M e d id a d a M a n d b u la

Alternativa de apresentar perfis das variveis: usar


grfico de colunas.

12

10

Você também pode gostar