Escolar Documentos
Profissional Documentos
Cultura Documentos
Principais
Bruno Otero Terralheiro RA: 11201811885
Abstract
O presente trabalho tem como objetivo aplicar a técnica de análise fatorial,
através do método dos componentes principais em dados financeiros de empre-
sas brasileiras, e através da técnica estatı́stica diminuir a quantidade de variável
independente através da troca por fatores que explicam cerca de 80% a 90% das
variações dos dados originais.
1 Introdução
A análise fatorial de componentes principais é uma técnica estatı́stica comumente
utilizada em diversas áreas de pesquisa, como psicologia, sociologia, biologia, econo-
mia, entre outras. Essa técnica tem como objetivo identificar a estrutura subjacente
de correlação entre variáveis em um conjunto de dados, permitindo a redução da
dimensionalidade e a identificação dos principais fatores que explicam as variações
observadas.
A análise fatorial de componentes principais é uma técnica exploratória que per-
mite a identificação de um número menor de variáveis principais a partir de um
conjunto maior de variáveis. Essa técnica é amplamente utilizada para reduzir a com-
plexidade dos dados, facilitando a interpretação e análise dos resultados. A técnica é
particularmente útil em pesquisas que envolvem múltiplas variáveis que podem estar
correlacionadas entre si.
O objetivo deste artigo é apresentar uma revisão da literatura sobre a análise
fatorial de componentes principais, abordando seus principais conceitos teóricos, seus
principais usos em pesquisas acadêmicas e suas limitações. Para tanto, serão apresen-
tados exemplos de estudos em diferentes áreas de pesquisa que utilizam essa técnica
para analisar dados complexos.
O artigo também discutirá os principais critérios para a seleção do número de
componentes principais, os métodos para avaliar a adequação do modelo fatorial, bem
1
como as principais técnicas de rotação dos componentes e suas implicações para a
interpretação dos resultados.
Por fim, espera-se que este artigo possa fornecer uma visão geral da análise
fatorial de componentes principais e seus usos em pesquisas acadêmicas, ajudando
pesquisadores e estudantes a compreender melhor essa técnica estatı́stica e a aplicá-la
de forma adequada em suas pesquisas.
2 Referencial Teórico
De acordo com Mator (2019) a análise fatorial é uma técnica estatı́stica utilizada para
identificar padrões em conjuntos de dados. Ela é frequentemente utilizada para reduzir
a dimensionalidade de dados multivariados, identificar fatores subjacentes em uma
série de variáveis observadas e ajudar a explicar a estrutura subjacente dos dados.
Em outras palavras, para Hair (2019) a análise fatorial é uma técnica que tenta
explicar a variação em um conjunto de variáveis observadas por meio de um conjunto
menor de variáveis subjacentes, chamadas de fatores. Os fatores representam as fontes
de variabilidade comuns entre as variáveis observadas e são estimados a partir de uma
matriz de correlação ou covariância entre as variáveis.
Para Fiqueiredo Silva (2010) existem dois tipos de análise fatorial: análise fatorial
exploratória (EFA) e análise fatorial confirmatória (CFA). Na EFA, o objetivo é iden-
tificar a estrutura subjacente dos dados, enquanto na CFA, o objetivo é testar uma
hipótese pré-definida sobre a estrutura subjacente dos dados.
A análise fatorial envolve vários conceitos, como componentes principais, carga
fatorial, comunalidade, variância explicada, método de extração, método de rotação,
entre outros. A interpretação dos resultados da análise fatorial requer uma com-
preensão desses conceitos e da teoria subjacente à análise fatorial.
Componentes principais é uma combinação linear das variáveis de um conjunto
de dados, formado pelos autovalores daquele conjunto de dado, onde cada variável
contem um coeficiente acompanhando, os a score, a sua equação é:
2
primeira componente principal geralmente explica a maior parte da variabilidade nos
dados, enquanto as componentes principais subsequentes explicam a variação restante
de forma decrescente.
A técnica da análise de componentes principais é frequentemente usada em áreas
como análise de dados, reconhecimento de padrões, bioinformática, finanças e muitas
outras áreas onde é necessário lidar com grandes conjuntos de dados multivariados.
3 Metodologia
3.1 Coleta de Dados
Os dados foram coletados na plataforma Economatica, referente a empresas brasileiras
não financeiras, foram obtido informações financeiras de 408 empresas distintas, dentro
das informações obtidas será utilizado as variaveis quantitativas:
• ATIVO: que representa o total de ativo de cada empresa que se refere aos recursos
controlados por uma empresa que têm o potencial de gerar benefı́cios econômicos
futuros. Esses recursos incluem bens tangı́veis, como propriedades, equipamentos e
estoques, bem como ativos intangı́veis, como patentes, marcas registradas, direitos
autorais e goodwill (valor intangı́vel da empresa);
• AC: que representa o Ativo Circulante de cada empresa onde inclui todos os recursos
financeiros que são convertidos em dinheiro ou utilizados durante o ciclo operacional
de uma empresa, geralmente dentro de um perı́odo de 12 meses;
• PC: que representa o Passivo Circulante de cada empresa, referente as obrigações
financeiras da empresa com terceiros dentro do perı́odo de um ano;
• CAPITAL GIRO: é a quantia de dinheiro necessária para financiar as atividades
operacionais diárias de uma empresa, incluindo a compra de matérias-primas, paga-
mento de salários e outras despesas operacionais. O capital de giro é um indicador
importante da saúde financeira da empresa e é calculado subtraindo-se os passivos
circulantes dos ativos circulantes.
4 Resultado
A partir dos dados obtidos, foram escolhidos os componentes principais através da
matriz de correlação, para que se possa ter uma melhor explicação, foram escolhidos
dois componentes principais, que explica certa de 89,9% da amostra. Para que se possa
entender a escolha dos componentes principais, apresenta-se gráfico da Figura 1
A Figura 1 mostra o quanto cada componente principal consegue explicar a vari-
abilidade dos dados, o número de componentes principais será o mesmo número de
3
Fig. 1 Relação entre os componentes principais e os dados
variável mas como a intenção é diminuir a dimensão dos dados é acolhido um número
menor de componentes principais, assim facilitando a análise. Assim para complemen-
tar a escolha dos dois componentes principais a Figura 2 mostra a variação de cada
componente.
4
Fig. 3 Como as variáveis se associam ao primeiro e o segndo componente principal
5 Conclusão
Em conclusão, a análise fatorial de componentes principais é uma técnica estatı́stica
útil para explorar a estrutura de correlação entre variáveis em um conjunto de
dados. A técnica é usada para reduzir a dimensionalidade dos dados, transformando
um conjunto de variáveis correlacionadas em um conjunto menor de variáveis não
correlacionadas, conhecidas como componentes principais.
Ao aplicar a análise fatorial de componentes principais, é importante avaliar o
número de componentes a serem retidos com base em critérios como a variância
explicada, o scree plot ou a interpretabilidade dos componentes. Uma vez que os com-
ponentes principais são identificados, eles podem ser usados para realizar análises
adicionais, como classificação ou regressão.
No entanto, a análise fatorial de componentes principais tem suas limitações, como
a suposição de que as variáveis devem estar linearmente correlacionadas e que a dis-
tribuição dos dados deve ser normal. Além disso, a interpretação dos componentes
principais pode ser subjetiva e requer conhecimento prévio do contexto do problema.
6 Referencia
• FIGUEIREDO FILHO, Dalson Brito; SILVA JÚNIOR, José Alexandre da. Visão
além do alcance: uma introdução à análise fatorial. Opinião pública, v. 16, p. 160-
185, 2010.
5
• HAIR, J. F., BLACK, W. C., BABIN, B. J., Anderson, R. E. (2019). Análise
multivariada de dados (7a ed.). Bookman Editora.
• MATOS, Daniel Abud Seabra; RODRIGUES, Erica Castilho. Análise fatorial. 2019.
• VARELLA, Carlos Alberto Alves. Análise de componentes principais. Seropédica:
Universidade Federal Rural do Rio de Janeiro, p. 38, 2008.