Você está na página 1de 4

Resumo de Anlise Fatorial

Gaspar Giacomini gaspargiacomini@gmail.com Fernanda Romano nandamromano@gmail.com

1) O que Anlise Fatorial? A Anlise Fatorial uma tcnica de interdependncia que examina as relaes entre as variveis e permite verificar se elas se agrupam em fatores/dimenses. O objetivo principal da Anlise Fatorial conhecer a estrutura subjacente entre as variveis da anlise. Lembre-se de que as tcnicas de interdependncia so aquelas em que NO se classifica uma varivel como a dependente e as outras como independentes e/ou prognosticadoras, mas que considera todo o conjunto de relacionamentos das variveis. Frequentemente se fala da Anlise Fatorial como uma tcnica de reduo de variveis. Contudo, cuidado: no se reduz o nmero de variveis, mas apenas o nmero de dimenses e/ou fatores. 2) Para que serve a Anlise Fatorial? Existem diversas razes pela qual pode ser adequado utilizar a Anlise Fatorial: para compreender a estrutura subjacente dos dados (saber como as variveis se comportam com relao aos construtos). para ter uma melhor visualizao dos dados e maior facilidade de interpretao dos resultados. para preparar os dados para o uso de outras tcnicas estatsticas multivariadas subseqentes. para suportar empiricamente hipteses ou teorias sobre a quantidade de dimenses de um fenmeno e a maneira como as variveis se agrupam.

3) As 2 grandes famlias de Anlise Fatorial Existem 2 grandes grupos de Anlise Fatorial: a Anlise Fatorial Exploratria (Exploratory Factor Analysis, ou EFA) e a Anlise Fatorial Confirmatria (Confirmatory Factor Analysism ou CFA). A principal diferena que, na primeira, as variveis so testadas todas contra todas para a montagem dos fatores/dimenses; na segunda, o pesquisador tem interesse em testar empiricamente um conhecimento a priori sobre como as dimenses do fenmeno estudado se comportam (o que feito com tcnicas mais avanadas como Equaes Estruturais). Como o objeto de estudo da disciplina de Pesquisa em Marketing a Anlise Fatorial Exploratria, a ela que nos referimos neste resumo. 4) Conceitos importantes para Anlise Fatorial Vale a pena relembrar alguns conceitos relevantes utilizados na Anlise Fatorial: Fator: uma dimenso latente que explica as correlaes entre um conjunto de variveis. Exemplo: F1 composto por 3 variveis: X1, X2 e X3 Comunalidade: quantidade de varincia que uma varivel compartilha com todas as demais, ou seja, quanto da varincia de um item est sendo utilizada na soluo fatorial. Buscamos uma alta comunalidade alta (acima de 0,50). No quadro ao lado, verificam-se comunalidades boas (coluna extraction). Multicolinearidade: a medida em que uma varivel pode ser explicada por outras variveis. medida que a multicolinearidade aumenta, a interpretao dos dados fica mais complicada, pois fica mais difcil averiguar e efeito de uma nica varivel.
X1 X2 X3

F1

Communalities s1 - localizao s2 - Bandeira/Marca BR s3 - Aparncia / Visual s4 - Facilidade de Acesso s5 - Preo do combustvel s6 - Espao interno para manobra Initial 1,000 1,000 1,000 1,000 1,000 1,000 Extraction ,503 ,670 ,548 ,598 ,687 ,582

Extraction Method: Principal Component Analysis.

Teste de Esfericidade de Barlett: permite examinar a hiptese nula de que as variveis no estejam correlacionadas na populao. Para haver adequacidade da Anlise Fatorial, preciso rejeitar a hiptese nula. Logo, queremos um escore alto neste teste, alm de baixa significncia. No quadro ao lado, o valor do teste foi de 1050, significativo a 0,000!

a KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square df Sig.

,813 1050,502 210 ,000

a. Based on correlations

KMO (Kaiser-Meyer-Olkin): outro ndice para avaliar a adequacidade da Anlise Fatorial. Valores altos (entre 0,50 e 1,00) indicam que a anlise fatorial adequada; valores baixos (abaixo de 0,50) indicam que a anlise fatorial no apropriada. No quadro acima, o KMO foi de 0,81 um bom nmero! Autovalor (Eigenvalue): a varincia total explicada por cada fator. Como os dados so padronizados em Z (mdia zero e desvio-padro 1), normalmente utiliza-se como critrio de corte autovalores maiores que 1, pois se espera que um fator responda, no mnimo, pela varincia de 1 item. Veja na tabela abaixo que a coluna total da esquerda (initial eigenvalues), o componente 1 apresenta um autovalor de 3,56, o componente 2 de 2,9, o componente 3 de 1,73 etc. Perceba que a linha de corte foi o fator 5, pois, aps ele, os autovalores so menores do que 1. Esses 5 componentes explicam 81,5% da variabilidade dos dados.
Total Variance Explained Initial Eigenvalues % of Variance Cumulative % 27,439 27,439 23,059 50,498 13,370 63,868 9,902 73,769 7,733 81,502 4,759 86,261 4,242 90,502 3,438 93,941 2,160 96,100 1,544 97,644 1,278 98,923 1,008 99,931 ,069 100,000 Extraction Sums of Squared Loadings Total % of Variance Cumulative % 3,567 27,439 27,439 2,998 23,059 50,498 1,738 13,370 63,868 1,287 9,902 73,769 1,005 7,733 81,502 Rotation Sums of Total 3,315 2,524 2,054 2,597 1,097

Component 1 2 3 4 5 6 7 8 9 10 11 12 13

Total 3,567 2,998 1,738 1,287 1,005 ,619 ,551 ,447 ,281 ,201 ,166 ,131 ,009

Extraction Method: Principal Component Analysis. a. When components are correlated, sums of squared loadings cannot be added to obtain a total variance.

Carga dos Fatores: a correlao simples entre as variveis e os fatores. Queremos cargas altas! Resduos: a diferena entre as correlaes observadas (que vem dos dados) e as correlaes reproduzidas (estimadas pela tcnica). Scree Plot: o grfico dos autovalores x n de fatores que mostra o momento um fator adicional passa a ter pouca contribuio incremental.

Confiabilidade: o grau em que uma varivel ou conjunto de variveis consistente em medir aquilo que se prope a medir. Em Anlise Fatorial, utilizam-se pelo menos 3 medidas de confiabilidade: (1) o Alpha de Cronbach (para medir a confiabilidade (consistncia) da escala, (2) a correlao item-com-itens e (3) a correlao item-com-total.

Reliability Statistics Cronbach's Alpha ,897 N of Items 3

Correlao Parcial: a correlao que permanece inexplicada depois que os efeitos das outras variveis so considerados. Se houver fatores verdadeiros nos dados, a correlao parcial dever ser pequena. Uma alta correlao parcial significa que a varivel no est correlacionada com um grande nmero de outras variveis na anlise (e ns gostaramos que estivesse!). O SPSS prov a matriz de correlao de anti-imagem, que justamente o valor negativo da correlao parcial. Validade: o grau em que uma varivel ou conjunto de variveis representa corretamente o conceito sendo estudado. Existem pelo menos 3 tipos importantes de validade: o Validade Nomolgica, tambm chamada de validade de face, que representa o grau em que o uso de uma medida ou conceito est respaldado pela reviso de literatura ou pela experincia emprica; o Validade Convergente, que representa o grau em que os itens que pertencem a um determinado construto ou fator esto correlacionados entre si ( X1, X2 e X3 altamente correlacionadas entre si); o Validade Discriminante, que representa o grau que os itens que pertencem a um construto (ou fator) no esto correlacionados com os itens de outros construtos (a varivel X4, ao lado, fere a validade discriminante por estar correlacionada tanto a F1 quanto a F2).

5) Os 2 mtodos principais para a Anlise Fatorial Existem dois mtodos principais de Anlise Fatorial: (1) Anlise Fatorial Comum e (2) Anlise de Componentes Principais. A tabela comparativa abaixo resume as diferenas. (1) Anlise Fatorial Comum (2) Anlise de Componentes Principais (Fatoramento dos Eixos Principais) Objetiva conhecer a estrutura subjacente pelo Objetiva direcionar a maior parte da varincia processo tradicional. para o menor nmero possvel de fatores. Tem como premissa a normalidade dos dados. No tem como premissa normalidade dos dados. o menos utilizado. o mtodo mais utilizado. Considera a varincia comum. Considera a varincia total.

6) A rotao de matrizes na Anlise Fatorial Quando analisamos a matriz de correlao entre as variveis e os fatores, muitas vezes nos deparamos com um problema: algumas variveis apresentam um alto fator de carga para mais de um fator. Isso ruim para ns, pois causa dificuldades para interpretar os dados. Na verdade, gostaramos que o fator de carga fosse alto para um nico fator! Para minimizar esse problema, utilizam-se tcnicas de rotao dos fatores. Atravs da rotao, a matriz de fatores transformada em uma matriz mais simples e fcil de interpretar (pois a maior parte das situaes de variveis com cargas altas em mais de um fator so eliminadas). Por isso, aconselhvel utilizar a Anlise Fatorial rotacionada! E existem 2 tipos de rotao: (1) Rotao Ortogonal e (2) Rotao oblqua. A Rotao Ortogonal, que usa o processo de rotao VariMax, uma tcnica que deve ser utilizada quando se sabe de antemo ou se especula que os fatores/dimenses NO estejam relacionados entre si. Essa expectativa pode estar ancorada na Reviso Terica ou em conhecimentos empricos. J a Rotao Oblqua, que usa o processo de rotao Oblimin, uma tcnica que deve ser utilizada quando se sabe ou se espera que haja correlao entre os fatores/dimenses.

7) Correlao x Covarincia na Anlise Fatorial Sabe-se que a Anlise Fatorial calculada com base no relacionamento entre as variveis. Normalmente esse relacionamento apresentado atravs da Matriz de Correlao. A Matriz de Correlao (CORR) utiliza dados padronizados (mdia 0 e desvio-padro 1). Contudo, tambm se pode utilizar a Matriz de Covarincia (COV), que considera os dados na sua escala original. Historicamente, a Matriz de Correlao se disseminou mais que a de Covarincia principalmente em virtude de a padronizao ser necessria quando se est medindo variveis em escalas diferentes. A ampla utilizao da CORR na rea de Economia, em que as variveis esto em escalas diferentes (ex: PIB, Populao, taxa de juros, etc), considerada um dos principais motivos para sua popularidade. Talvez por isso, tambm na rea de Marketing, seu uso se tornou comum. Contudo, como muitas vezes trabalhamos com uma nica escala em Marketing (como a de Likert de 5 pontos), poder-se-ia utilizar a Matriz de Covarincia, a qual, embora incomum, tem propriedade de manter o peso das variaes das variveis (que perdido quando se padroniza os dados). Nosso objetivo manter a variao sempre que possvel! 8) Quantas dimenses extrair na Anlise Fatorial Uma deciso importante em anlise fatorial a quantidade de fatores que devem ser extrados. Existem diversos critrios para determinar a quantidade de fatores: Autovalores > 1,00. Espera-se que um fator represente, no mnimo, a varincia de uma varivel padronizada (que 1,00). Scree Test (grfico). Atravs do Scree Test pode-se tomar uma deciso com base na informao visual fornecida pelo grfico (quando a inclinao em relao ao eixo X tem seu ngulo reduzido). Conhecimento a priori. Pode-se determinar o nmero de fatores a ser extrado com base em conhecimento prvio (respaldado na reviso de literatura ou experincia emprica), embora seja pouco comum fazer isso na Anlise Fatorial Exploratria. Percentual acumulado de varincia extrada. Nesse critrio, determina-se um % acumulado desejado de varincia extrada, e esse passa a ser o ponto de corte. Ex: parar extrao quando se chegar a 90%

9) As premissas da Anlise Fatorial A Anlise Fatorial possui algumas premissas que devem ser de conhecimento do pesquisador. Essas premissas so mais conceituais do que de clculo: Existe uma estrutura subjacente (correlao) entre as variveis escolhidas. A simples existncia de correlao entre as variveis no garantem que haja relevncia, mesmo que se cumpram as exigncias do clculo estatstico. uma responsabilidade do pesquisador garantir que os padres observados so conceitualmente vlidos e apropriados para a anlise fatorial. Homogeneidade da amostra. Por exemplo: inapropriado aplicar Anlise Fatorial para uma amostra com homens e mulheres, quando se sabe que o gnero um elemento diferenciador do comportamento/atitudes em relao ao fenmeno estudado. Nesse caso, deveriam ser realizadas Anlises Fatoriais separadamente para cada subamostra. Normalidade, homocedasticidade e linearidade so premissas relativas, pois impactam negativamente a Anlise Fatorial apenas na medida em que elas prejudicam as correlaes observadas. Essa correlao pode ser analisada pela perspectiva global do modelo e pela perspectiva das variveis individuais. Deve-se inspecionar visualmente da Matriz de Correlao para verificar se a maior parte das variveis possui uma correlao maior que 0,30 (condio para que a Anlise Fatorial seja apropriada).

Você também pode gostar