Escolar Documentos
Profissional Documentos
Cultura Documentos
Lista 1 - Multivariadas PDF
Lista 1 - Multivariadas PDF
Analisando os coeficientes do agglomeration schedule podemos observar um grande salto entre os estágios
48 e 49, fazendo levar a crer na existência de dois agrupamentos. Um deles contendo somente a empresa 1 , a
Petrobras, e o outro agrupamento contendo todas as outras empresas. A seguir, analisando as distâncias no
dendrograma, coletei mais uma evidência da divisão em dois agrupamentos.
Agora que foi decidido pela existência de dois agrupamentos, realizei uma análise K-means, e obtive que
somente a variável “Vendas” é significativa para a divisão nestes dois agrupamentos. Os dados seguem abaixo:
O próximo passo da análise foi remover as duas maiores empresas do banco de dados e repetir o exercício.
Os dados com a remoção da Petrobras e da Petrobras distribuidora seguem abaixo:
Dendrograma :
Na tabela do agglomeration schedule podemos observar grandes saltos na distância entre os estágios 21
e 22 e entre os estágios 23 e 24. Com o auxilio do dendrograma resolví pela existência de 3 agrupamentos.
A seguir foi realizada uma análise K-means baseada na divisão em 3 agrupamentos e foi obtido que
todos as variáveis são significativas para esta divisão em 3 agrupamentos. Os dados seguem abaixo:
Exercício 6- Base de Dados SupermercadosBrasileiros.
Na tabela do agglomeration schedule podemos observar grandes saltos na distância entre os estágios 27
28 e 29, indicando a existência de 2 ou 3 agrupamentos. A análise do dendrograma reforça a existência de 2
agrupamentos.
A seguir foi realizada uma análise K-means baseada na divisão em 2 agrupamentos e foi obtido que
todos as variáveis são significativas para esta divisão. Os dados seguem abaixo:
O próximo passo da análise foi remover as três maiores empresas do banco de dados e repetir o exercício.
Os dados com a remoção da CBD, Carrefour e Wal- Mart seguem abaixo:
Na tabela do agglomeration schedule podemos observar grandes saltos na distância entre os estágios 12
e 13 e entre os estágios 23, 24, 25 e 26. A análise do dendrograma reforça a existência de 4 agrupamentos.
Assim ficamos com 5 agrupamentos no total, um contendo as três maiores empresas e outros quatro que foram
obtidos na nova análise.
A seguir foi realizada uma análise K-means baseada na divisão em 4 agrupamentos e foi obtido que
todos as variáveis são significativas para esta divisão. Os dados seguem abaixo: