Você está na página 1de 16

Análise de Cluters

&
Análise Multidimensional
(MDA)
Grupo 6:
Gabriel Silva Alvarenga: 13781945
Guilherme Augusto Arrabal de Souza: 5642180
Julia Mie Suzuki: 13672411
Rafael Francisco de Freitas Timoteo: 12924740
Objetivos Dados
Classificação das amostras em sub- 300 faixas
grupos; 6 Gêneros musicais
Busca por padrão; 7 variáveis quantitativas contínuas (Spotify for Developers):
Comparação de resultados; Dançabilidade
Energia

Ferramentas
Instrumentalidade
Vivacidade
Valência
Acusticidade
RStudio Fala
SPSS
Análise de Cluster
Máxima Similaridade Intra-Grupos
Agrupar amostras em grupos (clusters), visando
a maior proximidade possível entre pontos de
um mesmo conglomerado

Máxima Diferença Inter-Grupos


Cada grupo é o mais diferente possível dos
demais

Quantidade de Grupos
Aplicação do método TwoStep Cluster Analysis
(SPSS), que revela “grupos naturais” dentro do
dataset por meio de uma árvore de
características de cluster usando a distância
euclidiana como medida de similaridade
Análise de Cluster: K-means
Definção de centróides Critérios de parada
A cada iteração, serão atualizados; a ordem de anális das Variação da distância menor ou igual a 2%
variáveis é desconsiderada Máximo de 10 iterações
Análise de Cluster: Resultados
Jazz Rock Forró Hip-Hop Clássica Bossa Nova

cluster 1 9 1 42 4

cluster 2 32 7 1 8 39

cluster 3 9 42 49 50 7

0 50 100 150 200


Análise de Cluster: Conclusões
Cluster 1:
músicas instrumentais e acústicas, já que possui altos valores de
instrumentalidade e acusticidade
é a categoria com menos músicas;
clássica, jazz, bossa nova, rock

Cluster 2:
meio termo das músicas, concentrando valores medianos da maior parte
das variáveis;
jazz, bossa nova, clássica, rock, forró

Cluster 3:
músicas agitadas e positivas pelos altos valores de dançabilidade, energia
e valência;
a maior parte do banco de dados;
hip-hop, forró, rock, jazz, bossa nova Identificação de um padrão?
Escalonamento Multidimensional (MDS)
Análise de Semelhança entre
Objetos: a técnica analisa medidas
de similaridade e estima a posição
relativa de cada objeto em um
espaço dimensional.

Operação: transformação de uma


matriz de distâncias entre
observações em representação
visual de menor dimensionalidade.
MDS: Distâncias
Cálculo e definição de matrizes de distância (Euclidiana e Manhattan) no Rstudio.

Análise das diferenças entre as matrizes de distância original e as obtidas pelo MDS.

Comandos para gerar as matrizes de distância.


MDS Distâncias
i Diferença entre as matrizes de distância euclidiana e Manhattan com as suas
matrizes originais

Distâncias máximas:
- Euclidiana: 5.8
-Manhattan: 10.4

Comandos para recuperação da matriz de distâncias.


MDS: Gráficos dos pontos obtidos
Análise para três dimensões: points
Análise para três dimensões: eig
Outros resultados:

"Goodness of Fit" (ajuste do modelo), que avalia quão


bem o modelo de Escalonamento Multidimensional se
ajusta aos dados.

0.7724538 sugere que o modelo MDS proporcionou um


ajuste razoável aos dados, mas não é o ideal
MDS: Resultados

É possível concluir que, por fim, o


objetivo de identificar uma
separação espacial entre as músicas
foi alçando, embora ainda não seja o
ideal.
Referências:
Link para o Banco de Dados:
https://docs.google.com/spreadsheets/d/1v90WflY8cCZzsxVaj9w94FCTeXLaXXqcD7OMwO7HsVY/edit?usp=drive_link

FARIA, Regis Rossi A.; SILVA, Ana Amélia Benedito. Análise de Clusters I. São Paulo, 2023. 110 slides, color. Disponível
em: https://edisciplinas.usp.br/mod/resource/view.php?id=4925584

FARIA, Regis Rossi A.; SILVA, Ana Amélia Benedito. Escalonamento Multidimensional I São Paulo, 2023. 36 slides, color.
Disponível em: https://edisciplinas.usp.br/mod/resource/view.php?id=4925590
Hair Jr., J. F; et al. Análise Multivariada de Dados. 6a ed. Porto Alegre: Bookman, 2009.

Você também pode gostar