Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
Texto i: INTRODUO
SUMRIO
1.
INTRODUO................................................................................................................................................ 1
1.1. O QUE A ANLISE MULTIVARIADA? ................................................................................................................ 1
1.2. FERRAMENTAS COMPUTACIONAIS ...................................................................................................................... 1
1.3. DEFINIO DE ANLISE MULTIVARIADA ............................................................................................................ 1
2.
CONCEITOS BSICOS.................................................................................................................................. 2
2.1. COMBINAO LINEAR DE VARIVEIS (VARIATE) .................................................................................................. 2
2.2. ESCALAS DE MEDIDA......................................................................................................................................... 3
2.2.1. Escalas qualitativas.................................................................................................................................. 3
2.2.2. Escalas quantitativas................................................................................................................................ 4
2.3. ERROS DE MEDIDA E MEDIDA MULTIVARIADA .................................................................................................... 5
2.4. SIGNIFICNCIA ESTATSTICA VERSUS PODER ESTATSTICO .................................................................................. 6
3.
4.
5.
6.
CONCLUSO.................................................................................................................................................19
7.
REFERNCIAS..............................................................................................................................................20
Pr of. L or Via li , Dr .
1. INTRODUO
1.1. O QUE A ANLISE MULTIVARIADA?
Tcnicas analticas multivariadas esto sendo largamente aplicadas hoje na indstria, no
governo e nos centros de pesquisas das universidades. Hoje j no faz mais sentido seguir o que a
pouco tempo ainda era comum, considerar os consumidores como um grupo homogneo e
caracterizado por um pequeno grupo de variveis demogrficas. Ao contrrio, necessrio
desenvolver estratgias que atinjam grupos variados de consumidores com caractersticas
demogrficas e psicogrficas em um mercado com mltiplas restries (legais, econmicas,
competitivas, tecnolgicas, etc.). somente atravs de tcnicas multivariadas que as mltiplas relaes
destes tipos podem ser adequadamente examinadas para se obter um entendimento completo e realista
da tomada de deciso.
forma, a nica varivel dependente encontrada na anlise de varincia estendida para incluir
mltiplas variveis dependentes na anlise de varincia multivariada. Em muitos casos, como poder
ser visto, a anlise multivariada um meio de realizar em uma nica anlise aquilo que exigiria
mltiplas anlises no caso univariado. Outras tcnicas multivariadas, no entanto, foram projetadas para
lidar somente com casos multivariados, tal como a anlise de fatores, que visa identificar a estrutura
subjacente de um grupo de variveis ou a anlise discriminante, para diferenciar entre grupos baseados
em um conjunto de variveis.
Uma das razes para a dificuldade de se definir a anlise multivariada que o termo
multivariado no utilizado de forma consistente na literatura. Para alguns pesquisadores,
multivariado significa simplesmente examinar o relacionamento entre duas ou mais variveis. Outros
usam o termo somente para problemas onde todas as variveis assumem por hiptese uma distribuio
multivariada. Para ser considerado verdadeiramente multivariada, no entanto, todas as variveis devem
ser aleatrias e interrelacionadas de tal forma que seus diferentes efeitos no podem ser interpretados
de maneira significativa separadamente. Outros autores declaram que o propsito da anlise
multivariada medir, explicar e predizer o grau de relacionamento entre variates (combinao linear
de variveis). Desta forma, a caracterstica multivariada repousa nas mltiplas combinaes de
variveis (variates) e no somente sobre o nmero de variveis ou observaes.
A variate
Como j mencionado, o bloco bsico da construo da anlise multivariada a combinao
linear de variveis com pesos empiricamente determinados, ou simplesmente denominada de variate.
As variveis so especificadas pelo pesquisador ou analista enquanto que os pesos so determinados
pelo objetivo especfico das tcnicas multivariadas. Uma variate de n variveis ponderadas (X1 at Xn)
pode ser escrita da seguinte forma: Valor da variate = w1X1 + w2X2 + ... + wnXn,
Pr of. L or Via li , Dr .
quantidades
relativas de grau ou distncia. Onde se puder fazer declaraes de quantidade ou magnitude, tal como
o nvel de satisfao ou comprometimento com um trabalho, medidas mtricas so apropriadas.
objetos. Escalas nominais, tambm conhecidas como escalas categricas, fornecem o nmero de
ocorrncias (freqncias) em cada classe ou categoria da varivel sendo estudada. Os smbolos ou
nmeros atribudos a cada categoria no tem um significado quantitativo alm o de indicar a presena
ou ausncia do atributo ou caracterstica sob investigao. Exemplos de escalas nominais so: sexo,
religio, preferncia poltica, estado civil, etc.
A escala ordinal o nvel seguinte das escalas de medidas. Variveis podem ser ordenadas
atravs de escalas ordinais com respeito a quantidade do atributo que possuem. Cada subcategoria
pode ser comparada com outra em termos das relaes "maior que" ou "menos que". Por exemplo
nveis diferentes de satisfao do consumidor com alguns produtos novos podem ser ilustrados por
uma escala ordinal.
Produto A
Produto B
Produto C
Muito satisfeito
No satisfeito
Pr of. L or Via li , Dr .
A escala de razo o mais alto nvel de medida possvel, porque ela apresenta as vantagens
das demais escalas mais um zero absoluto. Todas as operaes matemticas so permitidas com este
tipo de escala. O peso, por exemplo, medido por uma escala deste tipo. Quando se diz que alguma
coisa pesa 10 kg, isto significa exatamente o dobro de algo que pesa 5kg, no importando se for
expresso em kg ou outra unidade qualquer. Aqui um peso zero significa ausncia total da
caracterstica, isto , peso.
Entender os diferentes tipos de escala de medida importante por duas razes. Primeiro
necessrio identificar a escala de medida usada para cada varivel para que dados mtricos no sejam
usados incorretamente como se fossem no-mtricos e vice-versa. Segundo, a escala de medida um
fator crtico na determinao do tipo de tcnica multivariada que ser mais apropriada para os dados
levando em considerao as variveis dependentes e independentes.
considerada mede o verdadeiro valor e est livre de erros. Se a mesma medida, por exemplo, feita
vrias vezes, medidas confiveis mostraro uma consistncia mais alta do que medidas menos
confiveis.
Um outro procedimento a ser seguido desenvolver medidas multivariadas, tambm
conhecidas como escalas somadas, onde vrias variveis so agrupadas para representar uma varivel
composta (por exemplo, escalas de personalidade de itens mltiplos ou classe de um produto). O
objetivo evitar o uso de uma nica varivel para representar um conceito e ao invs usa-se vrias
variveis como indicadores, todas representando diferentes facetas do conceito para obter uma
perspectiva mais global. O uso de mltiplos indicadores permite ao pesquisador especificar mais
precisamente as respostas desejadas e no colocar total confiana em uma nica resposta mas ao invs
numa resposta mdia ou tpica de um conjunto relacionado de respostas. A idia que respostas
mltiplas refletem de forma mais acurada a verdadeira resposta do que uma nica.
O impacto de erros de medida e uma confiabilidade pobre no podem ser vistos diretamente
pois eles esto embutidos nas variveis observadas. Resultados ruins nem sempre so devidos a erros
de medida, mas a presena de erros de medida seguramente distorcer o relacionamento observado e
tornar a tcnica multivariada menos poderosa.
2.4.
SIGNIFICNCIA
ESTATSTICA
VERSUS
PODER
ESTATSTICO
Todas as tcnicas multivariadas exceto a anlise de conglomerados e a reduo
multidimensional (multidimensional scaling) so baseadas em inferncias de valores populacionais ou
no relacionamento entre variveis de uma amostra extradas ao acaso de uma populao. Se fosse feito
o censo ento a inferncia seria desnecessria, porque qualquer diferena ou relacionamento, mesmo
que pequeno, verdadeiro e existe. Mas o censo raramente feito, ento, normalmente se obrigado a
trabalhar com amostras.
Interpretar inferncias estatsticas requer que o pesquisador especifique os nveis aceitveis de
erro. A abordagem mais comum especificar o Erro do Tipo I, cuja probabilidade representada por
(alfa). O erro do Tipo I consiste em rejeitar a hiptese nula quando ela verdadeira, isto , quando
ela no deveria ser rejeitada. Em outras palavras ele consiste em afirmarmos que os resultados so
significativos, no caso, estatisticamente significativos quando, de fato, eles no so. O erro do tipo I
apenas um dos dois tipos de erros possveis. O erro do tipo I pode ser cometido quando rejeitamos a
hiptese nula. No entanto, rejeitar a hiptese apenas uma das duas decises possveis. Se a hiptese
nula for aceita ento possvel se cometer o Erro do Tipo II, isto , aceitar a hiptese quando ela no
Pr of. L or Via li , Dr .
deveria ser aceita. A probabilidade de se cometer o erro do tipo II representada por (beta). No
entanto, uma probabilidade mais interessante 1- , que a probabilidade de tomar uma deciso
correta, isto , a probabilidade de se rejeitar a hiptese nula quando ela falsa. Esta probabilidade
denominada de poder do teste.
Os erros do tipo I e II variam inversamente, isto , quando a probabilidade de se cometer erro
do tipo I diminuda a probabilidade de se cometer erro do tipo II aumentada. Reduzir o erro do tipo
I, reduz tambm o poder do teste estatstico. Desta forma necessrio fazer um balano entre o nvel
de significncia () e o poder resultante.
O poder no apenas uma funo de , ele , na realidade, uma resultante de trs fatores:
1. Tamanho do efeito. A probabilidade de se obter significncia estatstica baseada no
somente em consideraes estatsticas, mas tambm na real magnitude do efeito de interesse sendo
estudado (por exemplo, a diferena de mdias entre dois grupos ou a correlao entre variveis) na
populao, denominado de tamanho do efeito. Como seria esperado, um efeito grande mais
provvel de ser detectado do que um pequeno e deste forma influenciam no poder do teste. Para avaliar
o poder de qualquer teste estatstico o pesquisador deve primeiramente entender o efeito sendo
estudado. O tamanho do efeito definido em termos de desvios padres para facilitar comparaes.
Diferenas de mdias so estabelecidas em termos de desvios padres, de modo que um efeito de 0,50
indica que a diferena mdia de meio desvio padro. Para correlaes o tamanho do efeito baseado
na correlao real entre as variveis.
2. Alfa. Como j foi discutido medida que a probabilidade de se cometer erro do tipo I (alfa)
diminui o poder do teste tambm decresce. Isto significa que se o analista reduz a chance de encontrar
um efeito incorreto significativo, a probabilidade de encontrar corretamente o efeito tambm diminui.
Normalmente os nveis utilizados para a significncia ficam em 5% e 1%, mas o analista deve
considerar o impacto desta deciso no poder do teste antes de tomar uma deciso definitiva.
3. Tamanho da amostra. A um dado nvel alfa, aumentar o tamanho da amostra sempre
produz aumento no poder do teste. Mas aumentar o tamanho da amostra pode tambm produzir "muito
poder". Isto quer dizer que aumentando o tamanho da amostra efeitos cada vez menores sero
detectados como estatisticamente significativos at que para uma amostra muito grande quase todo
efeito ser significativo. O analista deve estar sempre ciente que o tamanho da amostra pode afetar o
teste estatstico tanto tornando-o insensvel (para pequenos tamanhos de amostra) ou ento
extremamente sensvel (para amostras realmente grandes).
Pr of. L or Via li , Dr .
3 . T I P O S D E T C N I C A S M U LT I VA R I A D A S
A anlise multivariada um conjunto de tcnicas de anlise de dados sempre em expanso. A
seguir esto tabeladas as mais bem estabelecidas. Elas foram divididas em duas categorias: as do tipo
regresso e as do tipo correlao.
produto, homens de mulheres e crditos bons de crditos ruins, etc. At a receita federal americana
utiliza a anlise discriminante para comparar o pagamento de impostos de renda de locais selecionados
com um contribuinte hipottico e para identificar os retornos mais promissores e as reas de auditoria.
procedimento envolve obter um conjunto de pesos para as variveis dependentes e independentes que
forneam a correlao simples mxima entre o conjunto das variveis dependentes e as independentes.
Pr of. L or Via li , Dr .
uma nica varivel dependente. O que distingue o modelo linear de probabilidade da regresso
mltipla que a varivel dependente no-mtrica como na anlise discriminante. A escala nomtrica da varivel dependente requer uma abordagem diferenciada na estimao e nas hipteses sobre
a distribuio subjacente, mas em muitas outras caractersticas semelhante regresso mltipla.
Desta forma, uma vez que a varivel dependente seja corretamente especificada e a tcnica de
estimao apropriada seja empregada, os fatores bsicos considerados na regresso mltipla sero
utilizadas aqui da mesma forma. O modelo linear de probabilidade se diferencia da anlise
discriminante primeiramente porque ele acomoda qualquer tipo de varivel independente (tanto
mtricas quanto no-mtricas) e no necessita da hiptese de normalidade multivariada. No entanto,
em muitas situaes, particularmente com mais de dois nveis na varivel dependente a anlise
discriminante uma tcnica mais apropriada.
Pr of. L or Via li , Dr .
10
estimao apropriado e eficiente para uma srie de equaes de regresses mltiplas separadas serem
estimadas simultaneamente. Ela caracterizada por duas componentes bsicas:
(1) O modelo estrutural e
(2) O modelo de medida.
O modelo estrutural o caminho que relaciona as variveis dependentes e independentes. Em
tais situaes, teoria, experincia prvia e outros indicativos permitem que o analista distingue que
varivel independente estima que varivel dependente. Os modelos vistos anteriormente que
acomodam mltiplas variveis dependentes (anlise de varincia multivariada e correlao cannica)
no so apropriados nesta situao porque eles permitem uma nica relao entre as variveis
dependentes e independentes.
O modelo de medida permite que o analista uso vrias variveis (indicadores) para uma nica
varivel dependente ou independente. Por exemplo, a varivel dependente poder ser um conceito
representado por uma escala agregada tal como auto-estima. No modelo de medida o analista pode
avaliar a contribuio de cada item da escala bem como incorporar quo bem a escala mede o conceito
(confiabilidade) na estimao do relacionamento entre as variveis dependentes e independentes. Este
procedimento semelhante a executar a anlise de fatores dos itens da escala e usar os escores dos
fatores na regresso.
Pr of. L or Via li , Dr .
11
12
4 . C L A S S I F I C A O D A S T C N I C A S M U LT I VA R I A D A S
Para poder se familiarizar com as tcnicas multivariadas especficas apresentado na figura
4.1 uma classificao dos mtodos multivariados. Esta classificao baseado em trs julgamentos
que se deve fazer sobre os objetivos da anlise e a natureza dos dados:
(1) As variveis podem ser classificadas em independentes e dependentes de acordo com
algum critrio?
(2) Se sim, quantas so tratadas como dependentes em uma nica anlise?
(3) Qual a escala de medida utilizada para avaliar as variveis?
A tcnica multivariada selecionada depende das respostas a estas 3 questes. Quando uma
tcnica multivariada for considerada, a primeira pergunta a ser formulada : os dados podem ser
divididos em classificaes dependentes e independentes? A resposta a esta questo indica se uma
tcnica dependente ou interdependente deve ser utilizada. Observe que na figura 4.1 as tcnicas
dependentes esto de um lado e as independentes de outro.
Uma tcnica dependente pode ser definida como aquela em que uma varivel ou um conjunto
de variveis so identificadas como variveis dependentes para serem previstas ou explicadas por
outra ou outro conjunto de variveis conhecidas como independentes. Um exemplo de uma destas
tcnicas a anlise mltipla de regresso. Em contraste, uma tcnica interdependente aquela em
que uma nica varivel ou um grupo de variveis so definidas como sendo dependentes ou
independentes. Alm disso, o procedimento envolve a anlise de todas as variveis no conjunto
simultaneamente. A anlise de fatores uma tcnica de interdependncia.
Pr of. L or Via li , Dr .
13
Pr of. L or Via li , Dr .
14
Dependncia:
Interdependncia:
Quantas variveis
esto sendo
explicadas?
A estrutura do
relacionamento entre?
Relaes mltiplas
de variveis dependentes
e independentes?
Vrias variveis em
uma nica relao
Variveis
Casos/Respondentes
Objetos
Modelagem por
equaes estruturais
Qual o tipo de
varvel dependente?
Qual o tipo
de escala da
varivel dependente?
Anlise
de Fatores
Anlise de
Conglomerados
Como os
atributos so
mensurados?
Mtrica
No-mtrica
Qual a escala de
medida da varivel
explicativa?
Mtrica
Anlise cannica
correlao com
variveis dummy
Mtrica
No-mtrica
Anlise cannica
correlao
Anlise de varincia
multivariada
No-mtrica
Regresso
Mltipla
Pr of. L or Via li , Dr .
Anlise
Conjunta
Anlise
Discriminante
Modelos
Lineares de
Probabilidade
Mtrica
No-mtrica
Reduo
Multidimensional
Anlise
de correspondncia
15
(Qualitativas, Quantitativas )
(Qualitativas)
Anlise de varincia
Y = X1 + X2 + X3 + ... + Xn
(Quantitativas )
(Qualitativas)
(Quantitativas )
(Quantitativas, Qualitativas)
Anlise conjunta
Y = X1 + X2 + X3 + ... + Xn
(Quantitativa, Qualitativa)
(Qualitativas)
Pr of. L or Via li , Dr .
5 . A N L I S E M U LT I VA R I A D A : I N T E R P R E TA O
A anlise multivariada, mesmo quando aplicada corretamente, pelas restries de se acomodar
mltiplas variveis, cria resultados complexos que podem ser difceis de se interpretar. As orientaes
gerais seguintes podem ajudar nesta interpretao. A lista no uma coleo exaustiva de
consideraes, mas uma espcie de "filosofia da anlise multivariada".
resultados significativos para se assegurar que eles possuem significncia prtica, devido ao
crescimento do poder estatstico em virtude do tamanho da amostra. O tamanho da amostra afeta
tambm os resultados quando a anlise envolve grupos de resposta tal como na anlise discriminante e
MANOVA. Tamanhos desiguais entre grupos influenciam os resultados e requerem interpretaes
adicionais e/ou anlises.
6. CONCLUSO
Nesta introduo s tcnicas multivariadas o assunto no foi absolutamente esgotado. O que
se apresentou aqui de forma introdutria foi o elenco das tcnicas j sedimentadas. Tcnicas ainda
pouco conhecidas ou recm desenvolvidas no foram analisadas. O que se pretendeu foi apresentar um
panorama amplo das principais tcnicas, suas interelaes e um guia para a escolha e a aplicao das
mesmas. Novas tcnicas que esto rapidamente ganhando importncia, com aplicaes em quase todas
as reas so as redes neurais (neuronais) e a minerao de dados (data mining).
Pr of. L or Via li , Dr .
7. REFERNCIAS
AAKER, David A., DAY, George S. Marketing Research (3e). New York: John Wiley & Sons, 1986.
CHURCHILL, A, Jr. Marketing Research:Methodological Foundations (sixth edition). Orlando, FL:
Hartcourt Brace & Company, 1995, 1117 pp.
DILLON, William R., MADDEN, Thomas J., FIRTLE, Neil H. Marketing Research in a Marketing
Environment (Third edition). Boston, Massachusetts: IRWIN, 1987, 760 pp.
HAIR, Joseph F., Jr.. ANDERSON, Rolph E., TATHAM, Ronald L., BLACK William C.
Multivariate Data Analyis: with readings (fourth edition). Upper Saddle River, New Jersey:
Prentice Hall, 1995. 745 pp.
KACHIGAN, Sam Kash.
Pr of. L or Via li , Dr .