Você está na página 1de 6

Analise Fatorial Através de Componentes

Principais
Bruno Otero Terralheiro RA: 11201811885

Abstract
O presente trabalho tem como objetivo aplicar a técnica de análise fatorial,
através do método dos componentes principais em dados financeiros de empre-
sas brasileiras, e através da técnica estatı́stica diminuir a quantidade de variável
independente através da troca por fatores que explicam cerca de 80% a 90% das
variações dos dados originais.

Keywords: Analise Fatorial, Componentes Principais

1 Introdução
A análise fatorial de componentes principais é uma técnica estatı́stica comumente
utilizada em diversas áreas de pesquisa, como psicologia, sociologia, biologia, econo-
mia, entre outras. Essa técnica tem como objetivo identificar a estrutura subjacente
de correlação entre variáveis em um conjunto de dados, permitindo a redução da
dimensionalidade e a identificação dos principais fatores que explicam as variações
observadas.
A análise fatorial de componentes principais é uma técnica exploratória que per-
mite a identificação de um número menor de variáveis principais a partir de um
conjunto maior de variáveis. Essa técnica é amplamente utilizada para reduzir a com-
plexidade dos dados, facilitando a interpretação e análise dos resultados. A técnica é
particularmente útil em pesquisas que envolvem múltiplas variáveis que podem estar
correlacionadas entre si.
O objetivo deste artigo é apresentar uma revisão da literatura sobre a análise
fatorial de componentes principais, abordando seus principais conceitos teóricos, seus
principais usos em pesquisas acadêmicas e suas limitações. Para tanto, serão apresen-
tados exemplos de estudos em diferentes áreas de pesquisa que utilizam essa técnica
para analisar dados complexos.
O artigo também discutirá os principais critérios para a seleção do número de
componentes principais, os métodos para avaliar a adequação do modelo fatorial, bem

1
como as principais técnicas de rotação dos componentes e suas implicações para a
interpretação dos resultados.
Por fim, espera-se que este artigo possa fornecer uma visão geral da análise
fatorial de componentes principais e seus usos em pesquisas acadêmicas, ajudando
pesquisadores e estudantes a compreender melhor essa técnica estatı́stica e a aplicá-la
de forma adequada em suas pesquisas.

2 Referencial Teórico
De acordo com Mator (2019) a análise fatorial é uma técnica estatı́stica utilizada para
identificar padrões em conjuntos de dados. Ela é frequentemente utilizada para reduzir
a dimensionalidade de dados multivariados, identificar fatores subjacentes em uma
série de variáveis observadas e ajudar a explicar a estrutura subjacente dos dados.
Em outras palavras, para Hair (2019) a análise fatorial é uma técnica que tenta
explicar a variação em um conjunto de variáveis observadas por meio de um conjunto
menor de variáveis subjacentes, chamadas de fatores. Os fatores representam as fontes
de variabilidade comuns entre as variáveis observadas e são estimados a partir de uma
matriz de correlação ou covariância entre as variáveis.
Para Fiqueiredo Silva (2010) existem dois tipos de análise fatorial: análise fatorial
exploratória (EFA) e análise fatorial confirmatória (CFA). Na EFA, o objetivo é iden-
tificar a estrutura subjacente dos dados, enquanto na CFA, o objetivo é testar uma
hipótese pré-definida sobre a estrutura subjacente dos dados.
A análise fatorial envolve vários conceitos, como componentes principais, carga
fatorial, comunalidade, variância explicada, método de extração, método de rotação,
entre outros. A interpretação dos resultados da análise fatorial requer uma com-
preensão desses conceitos e da teoria subjacente à análise fatorial.
Componentes principais é uma combinação linear das variáveis de um conjunto
de dados, formado pelos autovalores daquele conjunto de dado, onde cada variável
contem um coeficiente acompanhando, os a score, a sua equação é:

Yp = ap1 · X1 + ap2 · X2 + ... + apn · Xn (1)


Segundo Varella (2008) pesquisadores usam a analise de componentes principais
para facilitar a analise de dados, onde há muitas variáveis, substituindo variáveis
correlacionadas por uma menor dimensão não correlacionada. Assim ao utilizar a
técnica de componentes principais reduzira o tamanho de sua amostra, o ideal para a
escolha dos componentes principais são os que explicam de 70% a 80% da amostra,
e são selecionados em ordem de maior significância, ou seja, os que mais explicam o
conjunto de dados.
A análise de componentes principais começa com o cálculo da matriz de covariância
ou matriz de correlação entre as variáveis originais. Em seguida, os autovalores e
autovetores dessa matriz são calculados, e os autovetores correspondentes aos maiores
autovalores são usados para calcular os componentes principais.
Os componentes principais podem ser interpretados em termos das variáveis origi-
nais, pois eles representam combinações lineares dessas variáveis. Eles também podem
ser usados para visualizar a estrutura dos dados em um espaço de menor dimensão. A

2
primeira componente principal geralmente explica a maior parte da variabilidade nos
dados, enquanto as componentes principais subsequentes explicam a variação restante
de forma decrescente.
A técnica da análise de componentes principais é frequentemente usada em áreas
como análise de dados, reconhecimento de padrões, bioinformática, finanças e muitas
outras áreas onde é necessário lidar com grandes conjuntos de dados multivariados.

3 Metodologia
3.1 Coleta de Dados
Os dados foram coletados na plataforma Economatica, referente a empresas brasileiras
não financeiras, foram obtido informações financeiras de 408 empresas distintas, dentro
das informações obtidas será utilizado as variaveis quantitativas:
• ATIVO: que representa o total de ativo de cada empresa que se refere aos recursos
controlados por uma empresa que têm o potencial de gerar benefı́cios econômicos
futuros. Esses recursos incluem bens tangı́veis, como propriedades, equipamentos e
estoques, bem como ativos intangı́veis, como patentes, marcas registradas, direitos
autorais e goodwill (valor intangı́vel da empresa);
• AC: que representa o Ativo Circulante de cada empresa onde inclui todos os recursos
financeiros que são convertidos em dinheiro ou utilizados durante o ciclo operacional
de uma empresa, geralmente dentro de um perı́odo de 12 meses;
• PC: que representa o Passivo Circulante de cada empresa, referente as obrigações
financeiras da empresa com terceiros dentro do perı́odo de um ano;
• CAPITAL GIRO: é a quantia de dinheiro necessária para financiar as atividades
operacionais diárias de uma empresa, incluindo a compra de matérias-primas, paga-
mento de salários e outras despesas operacionais. O capital de giro é um indicador
importante da saúde financeira da empresa e é calculado subtraindo-se os passivos
circulantes dos ativos circulantes.

3.2 Método da Pesquisa


O método de pesquisa utilizado para o desenvolvimento do trabalho foi a analise de
dados secundários, a onde o banco de dados foi coletado através de um site de pesquisa,
apos a exportação da planilha de dados, os dados foram importados para o software
R, lá foi constatado a presença de dados faltante, logo as observações que continham
dados faltantes foi retirada da análise.

4 Resultado
A partir dos dados obtidos, foram escolhidos os componentes principais através da
matriz de correlação, para que se possa ter uma melhor explicação, foram escolhidos
dois componentes principais, que explica certa de 89,9% da amostra. Para que se possa
entender a escolha dos componentes principais, apresenta-se gráfico da Figura 1
A Figura 1 mostra o quanto cada componente principal consegue explicar a vari-
abilidade dos dados, o número de componentes principais será o mesmo número de

3
Fig. 1 Relação entre os componentes principais e os dados

variável mas como a intenção é diminuir a dimensão dos dados é acolhido um número
menor de componentes principais, assim facilitando a análise. Assim para complemen-
tar a escolha dos dois componentes principais a Figura 2 mostra a variação de cada
componente.

Fig. 2 Dispersão entre os componentes principais e os dados

A partir da função ‘PCA’, obtida no pacote ‘FactoMineR’ do programa ‘R’,


podemos observar a influência que cada variável tem para o primeiro e o segundo
componente principal da amostra, como pode ser observado na Figura 3.
Assim as variáveis estão correlacionadas entre os dois primeiros componentes prin-
cipais, temos que quando mais uma variável esta próxima aos eixos verticais ou
horizontais mais esta variável influenciou naquele componente principal. Portanto a
correlação entre as variáveis e os dois primeiros componente principais é:

4
Fig. 3 Como as variáveis se associam ao primeiro e o segndo componente principal

Variáveis Componente 1 Componente 2


Ativo Total 0,7646 0,3098
Ativo Circulante 0,5056 -0,0658
Passivo Circulante 0,0914 0,6627
Capital de Giro 0,3892 -0,6786
Table 1 Tabela dos valores que compõem cada
componente principal

5 Conclusão
Em conclusão, a análise fatorial de componentes principais é uma técnica estatı́stica
útil para explorar a estrutura de correlação entre variáveis em um conjunto de
dados. A técnica é usada para reduzir a dimensionalidade dos dados, transformando
um conjunto de variáveis correlacionadas em um conjunto menor de variáveis não
correlacionadas, conhecidas como componentes principais.
Ao aplicar a análise fatorial de componentes principais, é importante avaliar o
número de componentes a serem retidos com base em critérios como a variância
explicada, o scree plot ou a interpretabilidade dos componentes. Uma vez que os com-
ponentes principais são identificados, eles podem ser usados para realizar análises
adicionais, como classificação ou regressão.
No entanto, a análise fatorial de componentes principais tem suas limitações, como
a suposição de que as variáveis devem estar linearmente correlacionadas e que a dis-
tribuição dos dados deve ser normal. Além disso, a interpretação dos componentes
principais pode ser subjetiva e requer conhecimento prévio do contexto do problema.

6 Referencia
• FIGUEIREDO FILHO, Dalson Brito; SILVA JÚNIOR, José Alexandre da. Visão
além do alcance: uma introdução à análise fatorial. Opinião pública, v. 16, p. 160-
185, 2010.

5
• HAIR, J. F., BLACK, W. C., BABIN, B. J., Anderson, R. E. (2019). Análise
multivariada de dados (7a ed.). Bookman Editora.
• MATOS, Daniel Abud Seabra; RODRIGUES, Erica Castilho. Análise fatorial. 2019.
• VARELLA, Carlos Alberto Alves. Análise de componentes principais. Seropédica:
Universidade Federal Rural do Rio de Janeiro, p. 38, 2008.

Você também pode gostar