Você está na página 1de 6

Análise multivariada I - Lista de exercícios I

Claudemir Rodrigues de Oliveira - 2873314

Exercício 2/3 - Base 500MM

Analisando os coeficientes do agglomeration schedule podemos observar um grande salto entre os estágios
48 e 49, fazendo levar a crer na existência de dois agrupamentos. Um deles contendo somente a empresa 1 , a
Petrobras, e o outro agrupamento contendo todas as outras empresas. A seguir, analisando as distâncias no
dendrograma, coletei mais uma evidência da divisão em dois agrupamentos.
Agora que foi decidido pela existência de dois agrupamentos, realizei uma análise K-means, e obtive que
somente a variável “Vendas” é significativa para a divisão nestes dois agrupamentos. Os dados seguem abaixo:

O próximo passo da análise foi remover as duas maiores empresas do banco de dados e repetir o exercício.
Os dados com a remoção da Petrobras e da Petrobras distribuidora seguem abaixo:

Dendrograma :

Aqui, novamente obtive 2 agrupamentos, um contendo a Fiat e outro


contendo todas as outras empresas. É possível chegar a esta conclusão
observando o salto destacado na coluna coefficients do quadro agglomera-
tion schedule. A imagem do dendrograma reforça a ideia da divisão em dois
agrupamentos.
Foi realizada uma nova análise K-means nesta nova situação e obtive que tanto a variável rentabilidade
quanto a variável Endividamento Geral são significativas para a divisão das empresas em dois agrupamentos.Os
dados seguem abaixo:

Exercício 4 - Base Faculdades: Agglomeration schedule e Dendrograma.


Desta vez os coeficientes do agglomeration schedule não foram tão claros para definir o número de
agrupamentos, a decisão de dividir os dados em 6 grupamentos foi tomada analisando-se as distâncias no
dendrograma. A seguir foi realizada uma análise K-means baseada na divisão em 6 agrupamentos e foi obtido
que todos as variáveis são significativas para esta divisão em particular. Os dados seguem abaixo:

Exercicío 5: Base de dados digitada do exercício 5:

Na tabela do agglomeration schedule podemos observar grandes saltos na distância entre os estágios 21
e 22 e entre os estágios 23 e 24. Com o auxilio do dendrograma resolví pela existência de 3 agrupamentos.
A seguir foi realizada uma análise K-means baseada na divisão em 3 agrupamentos e foi obtido que
todos as variáveis são significativas para esta divisão em 3 agrupamentos. Os dados seguem abaixo:
Exercício 6- Base de Dados SupermercadosBrasileiros.

Na tabela do agglomeration schedule podemos observar grandes saltos na distância entre os estágios 27
28 e 29, indicando a existência de 2 ou 3 agrupamentos. A análise do dendrograma reforça a existência de 2
agrupamentos.
A seguir foi realizada uma análise K-means baseada na divisão em 2 agrupamentos e foi obtido que
todos as variáveis são significativas para esta divisão. Os dados seguem abaixo:
O próximo passo da análise foi remover as três maiores empresas do banco de dados e repetir o exercício.
Os dados com a remoção da CBD, Carrefour e Wal- Mart seguem abaixo:

Na tabela do agglomeration schedule podemos observar grandes saltos na distância entre os estágios 12
e 13 e entre os estágios 23, 24, 25 e 26. A análise do dendrograma reforça a existência de 4 agrupamentos.
Assim ficamos com 5 agrupamentos no total, um contendo as três maiores empresas e outros quatro que foram
obtidos na nova análise.
A seguir foi realizada uma análise K-means baseada na divisão em 4 agrupamentos e foi obtido que
todos as variáveis são significativas para esta divisão. Os dados seguem abaixo:

Você também pode gostar