O documento apresenta dois casos de estudo sobre análise de agrupamentos. O primeiro caso analisa dados de estudantes ingressantes em uma faculdade para propor novos programas de bolsas de estudo. O segundo caso analisa dados de lojas de uma rede varejista para identificar discrepâncias entre elas. Ambos os casos utilizam métodos hierárquicos e não hierárquicos de agrupamento.
O documento apresenta dois casos de estudo sobre análise de agrupamentos. O primeiro caso analisa dados de estudantes ingressantes em uma faculdade para propor novos programas de bolsas de estudo. O segundo caso analisa dados de lojas de uma rede varejista para identificar discrepâncias entre elas. Ambos os casos utilizam métodos hierárquicos e não hierárquicos de agrupamento.
O documento apresenta dois casos de estudo sobre análise de agrupamentos. O primeiro caso analisa dados de estudantes ingressantes em uma faculdade para propor novos programas de bolsas de estudo. O segundo caso analisa dados de lojas de uma rede varejista para identificar discrepâncias entre elas. Ambos os casos utilizam métodos hierárquicos e não hierárquicos de agrupamento.
1) O departamento de concessão de bolsas de estudo de uma faculdade deseja investigar
a relação de interdependência entre os estudantes ingressantes em determinado ano
letivo, com base apenas em duas variáveis métricas (idade, em anos, e renda média familiar, em R$). O objetivo é propor uma quantidade ainda desconhecida de novos programas de concessão de bolsas voltados a grupos homogêneos de alunos. Para tanto, foram coletados os dados dos 100 novos estudantes e elaborada uma base, que se encontra no arquivo Bolsa de Estudo.sav, com as seguintes variáveis:
Pede-se:
a. Elabore uma análise de agrupamentos por meio de um esquema de aglomeração
hierárquico, com método de encadeamento completo (jurthest neighbor) e distância quadrática euclidiana. Apresente apenas a parte final da tabela do esquema de aglomeração e discuta os resultados. Lembrete: Como as variáveis possuem unidades distintas de medida, é necessária a aplicação do procedimento de padronização Zscores para a correta elaboração da análise de agrupamentos.
b. Com base na tabela do item anterior e no dendrograma, pergunta-se: Há indícios de
serem formados quantos agrupamentos de estudantes?
c. É possível identificar um ou mais estudantes muito discrepantes dos demais em
relação às duas variáveis em análise?
d. Se a resposta do item anterior for positiva, elabore novamente a análise de
agrupamentos hierárquicos com os mesmos critérios, porém, agora, sem o(s) estudante(s) considerado(s) discrepante(s).A partir da análise dos novos resultados, podem ser identificados novos agrupamentos?
e. Discuta como a presença de outlíers pode prejudicar a interpretação dos resultados
em análise de agrupamentos.
2) A diretoria de marketing de um grupo varejista deseja estudar eventuais discrepâncias
existentes em suas 18 lojas espalhadas em três regionais distribuídas pelo território nacional. A direção da companhia, a fim de manter e preservar a imagem e a identidade da marca, deseja saber se as lojas são homogêneas em relação à percepção dos consumidores sobre atributos como atendimento, sortimento e organização. Dessa forma, foi inicialmente elaborada uma pesquisa com amostras de clientes em cada loja, a fim de que fossem coletados dados referentes a esses atributos, definidos com base na nota média obtida (0 a 100) em cada estabelecimento comercial. Na sequência, foi elaborado o banco de dados de interesse, que contém as seguintes variáveis: Os dados encontram-se nos arquivos Regional Varejista.sav. Pede-se:
a. Elabore uma análise de agrupamentos por meio de um esquema de aglomeração
hierárquico, com método de encadeamento único e distância euclidiana. Apresente a matriz de distâncias entre cada par de observações. Lembrete: Como as variáveis possuem a mesma unidade de medida, não é necessária a aplicação do procedimento de padronização Zscores.
b. Apresente e discuta a tabela do esquema de aglomeração.
c. Com base na tabela do item anterior e no dendrograma, pergunta-se: Há indícios de
serem formados quantos agrupamentos de lojas?
d. Elabore um escalonamento multidimensional e, na sequência, apresente e discuta o
gráfico bidimensional gerado com as posições relativas das lojas.
e. Elabore uma análise de agrupamentos por meio do procedimento k-means, com a
quantidade de agrupamentos sugerida no item (c), e interprete, considerando o nível de significância de 5%, a análise de variância de um fator para cada variável considerada no estudo. Qual variável mais contribui para a formação de pelo menos um dos clusters formados, ou seja, qual delas é a mais discriminante dos grupos?
f. Existe correspondência entre as alocações das observações nos grupos obtidas pelos métodos hierárquico e não hierárquico?
g. É possível identificar associação entre alguma regional e determinado grupo
discrepante de lojas, o que poderia justificar a preocupação da diretoria em relação à imagem e à identidade da marca? Caso a resposta seja afirmativa, elabore novamente a análise de agrupamentos hierárquicos com os mesmos critérios, porém, agora, sem esse grupo discrepante de lojas. A partir da análise dos novos resultados, pode-se visualizar, de forma mais nítida, as diferenças entre as demais lojas?