Você está na página 1de 9

ANLISE MULTIVARIADA DE DADOS Por que um consumidor prefere um determinado produto ou um servio em detrimento de outro?

Essa preferncia estaria ligada ao preo, ao produto, ao atendimento ou a outro fator qualquer ou mesmo a uma combinao de alguns fatores? As respostas dos clientes poderiam ser obtidas atravs de um questionrio usando a escala Likert (variando de concordo totalmente at discordo totalmente). Na pesquisa chegaramos concluso que a preferncia do consumidor no poderia ser medida por uma simples medida, mas sim, por uma combinao mais complexas de vrias variveis. De acordo com o tipo de problema a ser avaliado devemos usar a tcnica multivariada adequada. ALGUMAS TCNICAS DE ANLISE MULTIVARIADA. -Regresso Linear Mltipla - Anlise Fatorial (Factor Analysis) - Anlise de Conglomerados (Cluster Analysis) - Anlise Discriminante (Discriminant Analysis) - Anlise Multivariada de Varincia (MANOVA) - Correlao Cannica -Anlise de Sobrevivncia - Regresso Logstica (Logistic Regression) Escalonamento Scaling) - Redes Neurais - Lgica Nebulosa ( Fuzzy Logic) Multidimensional (Multidimensional

-Lei de Newcomb-Benford

A anlise multivariada de dados no to recente, porm ela s evoluiu significativamente a partir do advento dos computadores. O maior problema enfrentado, at ento, era a grande quantidade de clculos envolvidos na resoluo dos problemas. Atualmente h vrios pacotes estatsticos que podem ser aplicados na resoluo das tcnicas multivariadas, tais como:

- SPSS (Statistical Package for the Social Sciences) - SAS - STATA - SYSTAT - STATISTICA - MATLAB - MINITAB - QUIKNET (Redes Neurais) - FUZZYTECH - MS EXCEL

CORRELAO E REGRESSO MLTIPLA

Objetivo: Verificar o grau variveis, simultaneamente.

de

interao

entre

vrias

Exemplo: Em uma pesquisa envolvendo grupo de homens com idades variando entre 18 e 25 anos, foram feitas algumas medidas das caractersticas fsicas dos mesmos. Os valores mdios dessas medidas, por idade, esto na tabela abaixo:

Idade Pesos Alturas Trax s (kg) (m) (cm) (anos ) 18 19 20 21 22 23 24 25 72 73 78 77 79 85 88 92 1,70 1,71 1,75 1,74 1,73 1,74 1,74 1,73 96,0 95,4 97,0 98,0 97,0 99,0 97,7 103,5

Quadris (cm)

Corpo (% gorduras) 5,8 9,5 12,4 13,0 11,3 12,0 13,8 16,0

99,0 99,7 101,0 102,5 103,0 102,0 104,0 105,6

Procedimentos:

1) Transcrevemos os dados da tabela nas clulas do Excel (por exemplo, de A1 at F9).

A G Idade s (anos) 18 19 20 21 22 23 24 25 Pesos (kg) 72 73 78 77 79 85 88 92

B Altura s (m) 1,70 1,71 1,75 1,74 1,73 1,74 1,74 1,73

C Trax (cm) 96,0 95,4 97,0

D Quadr is (cm) 99,0 99,7 101,0 98,0 102,5 97,0 103,0 99,0 102,0 97,7 104,0

E Corpo (% gorduras) 5,8 9,5 12,4 13,0 11,3 12,0 13,8 16,0

1 2 3 4 5 6 7 8 9

103,5 105,6

2) Clicar em: Dados Anlise de dados Correlao OK Intervalo de entrada A1:F9 Colunas Rtulos na primeira linha Intervalo de sada OK A11

Idades (anos) Idades (anos) Pesos(kg) Alturas (m) Trax (cm) Quadrs (cm) Corpo (% gordur.) 1 0,970467

Pesos (kg)

Alturas (m)

Trax (cm)

Quadrs (cm)

Corpo (% gordur.)

1 1 0,333426 0,545382 0,754537 1 0,8134088 3 1 1

0,552052 0,5199914 0,801814 0,8438078 0,950216 0,8996019 0,86142 0,8359793

0,7576993 6 0,900663582

Os dados acima mostram correlaes entre pares de variveis. Quanto mais prxima de 1, mais forte a correlao. A correlao de Pearson um nmero que varia entre -1 e 1

EQUAO DA RETA DE REGRESSO ENTRE AS VARIVEIS

Podemos relacionar as variveis entre si atravs de uma funo do tipo y=a0+a1.x1+a2.x2+...+an.xn , onde y a varivel dependente, os valores de x, as variveis independentes e os valores de a, os coeficientes de x.

Podemos determinar essa funo pelo Excel, digitando:

Dados Anlise de dados Regresso OK Intervalo y de entrada A1:A9 Intervalo x de entrada B1:F9

Rtulos Nvel de Confiana 95% Intervalo de sada A13 OK

RESUMO DOS RESULTADOS

Estatstica de regresso R mltiplo R-Quadrado R-quadrado ajustado Erro padro Observae s 0,989656 0,97942 0,927969 0,657409 8

ANOVA F de significa o 0,050659

gl Regresso Resduo

SQ

MQ

5 41,13563 8,227125 19,03605 2 0,864373 0,432187

Total

42

Coeficiente s Interseo Pesos(kg) Alturas (m) Trax (cm) Quadrs (cm) Corpo (% gordur.)

Erro padro

Stat t

valor-P 0,55849

95% inferiores -372,967 -0,15647 -118,131 -1,04344 -0,97809 -1,35601

95% superiore s

Inferior 95,0%

-51,9238 74,61522 -0,69589

269,1196 372,967 2

0,234856 0,090951 2,582243 0,122922 5,543927 28,74389 0,192873 0,864869 -0,11882 0,214895 -0,55293 0,635865 0,563347 0,358253 1,572484 0,256466 -0,08123 0,296278 -0,27415 0,809687

0,626185 0,15647 0

129,2189 118,131 1

0,805799 1,04344 0

2,104786 0,97809 2

1,193555 1,35601 1

Usando os coeficientes fornecidos pela tabela acima, a equao de regresso mltipla ser:

y= -51,9238 +0,234856x1 + 5,543927x2 - 0,11882x3 + 0,563347x4 - 0,08123x5 onde x1 so os pesos, x2 as alturas, x3 o trax, x4 os quadris, x5 a gordura no corpo e y as alturas correspondentes.