Você está na página 1de 13

Histograma - Interpretar os principais

resultados

Saiba mais sobre Minitab Statistical Software

Complete os passos a seguir para interpretar um histograma.

Neste tópico

 Etapa 1: Avalie as características chaves


 Etapa 2: Procure por indicadores de dados incomuns ou anormais
 Etapa 3: Avalie o ajuste de uma distribuição
 Passo 4: Avaliar e comparar grupos

Etapa 1: Avalie as características chaves


Examine os picos e dispersão da distribuição. Avalie como o tamanho da amostra
pode afetar a aparência do histograma.

Picos e dispersão
Identificar os picos, que são os agrupamentos mais altos de barras. Os picos
representam os valores mais comuns. Avalie a dispersão da sua amostra para
entender o quanto seus dados variam.

Por exemplo, neste histograma dos tempos de espera do cliente, o pico de dados
ocorre em cerca de 6 minutos. A dispersão de dados é a partir de cerca de 2
minutos a 12 minutos.
Investigue qualquer característica indesejável ou surpresa no histograma. Por
exemplo, o histograma dos tempos de espera do cliente demonstrou uma
dispersão que é maior do que o esperado. Uma investigação revelou que uma
atualização de software aos computadores causou atrasos nos tempos de espera
do cliente.

Tamanho de amostra (n)


O tamanho de amostra pode afetar a aparência do gráfico.

Por exemplo, apesar de estes histogramas parecerem diferentes, ambos foram


criados usando amostras selecionadas aleatoriamente de dados da mesma
população.

n = 20

n = 100

Um histograma funciona melhor quando o tamanho de amostra for de pelo menos


20. Se o tamanho de amostra for muito pequeno, cada barra no histograma pode
não conter pontos de dados suficientes para demonstrar precisamente a
distribuição dos dados. Quanto maior a amostra, mais o histograma se parecerá
com a forma da distribuição de população. Se o tamanho amostral for menor do
que 20, considere usar um gráfico de valor individual.

Etapa 2: Procure por indicadores de dados incomuns


ou anormais
Dados assimétricos e dados multimodais indicam que os dados podem ser
anormais. Os Outliers podem indicar outras condições em seus dados.

Dados assimétricos

Quando os dados são assimétricos, a maior parte dos dados está localizada no lado
superior ou inferior do gráfico. A assimetria indica que os dados podem não ser
normalmente distribuídos.

Estes histogramas ilustram dados assimétricos. O histograma com dados


assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera
são relativamente curtos e apenas alguns tempos de espera são longos. O
histograma com dados assimétricos à esquerda mostra os dados de tempos de
falha. Alguns itens falham imediatamente e muitos outros itens falham
posteriormente.

Assimétricos à direita

Assimétricos à esquerda

Se você sabe que seus dados não são naturalmente assimétricos, investigue as
possíveis causas. Se você desejar analisar dados severamente assimétricos, leia o
tópico de considerações de dados para análise para garantir que você pode usar
dados que não são normais.

Outliers
Outliers, que são valores de dados que estão distantes dos outros valores de dados,
podem afetar fortemente seus resultados. Geralmente, outliers são a maneira mais
fácil de identificar em um boxplot.

Em um histograma, as barras isoladas nas extremidades identificam os outliers.

Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados


ou de medição. Considere a remoção de valores de dados que estejam associados
a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida,
repita a análise.

Dados multimodais

Dados multimodais têm mais do que um pico. (Um pico representa o modo de um
ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são
coletados a partir de mais de um processo ou condição, como mais do que uma
temperatura.

Por exemplo, estes histogramas são gráficos dos mesmos dados. O histograma
simples tem dois picos, mas não está claro o que os picos significam. O histograma
com grupos demonstra que os picos correspondem a dois grupos.

Simples
Com grupos

Se você tiver informações adicionais que permitem a classificação das observações


em grupos, poderá criar uma variável de grupo com estas informações. Depois,
você poderá criar o gráfico com grupos para determinar se a variável de grupo
contabiliza os picos nos dados.

DICA

Para adicionar uma variável de grupo a um gráfico existente, clique duas vezes em
uma representação de dados no gráfico e, logo, clique na aba Grupos.

Etapa 3: Avalie o ajuste de uma distribuição

Se seu histograma tiver uma linha de distribuição ajustada, avalie o quão perto as
alturas das barras seguem o formato da linha. Se as barras seguirem a linha de
distribuição ajustada de perto, os dados se ajustarão bem a distribuição.

OBSERVAÇÃO

Para informações sobre como especificar diferentes distribuições e parâmetros, vá


para Linhas de distribuição ajustadas.

Bom ajuste
Ajuste ruim
Para uma medida precisa do ajuste de distribuição, use um gráfico de
probabilidade para verificar o ajuste da significância estatística.

Passo 4: Avaliar e comparar grupos


Se seu histograma tiver grupos, avalie compare o centro e dispersão dos grupos.

Centros

Procure por diferenças entre os centros dos grupos.

Por exemplo, estes histogramas demonstram o tempo de conclusão para três


versões de um pedido de cartão de crédito. O centro para cada versão do pedido
de cartão de crédito está e um local diferente. As diferenças nos locais indicam que
os tempos médios de conclusão são diferentes.

Histogramas sobrepostos

Histograma em painéis

Para determinar se uma diferença nas médias é estatisticamente significativa,


realize uma das seguintes ações:

 Use um teste t de 2 amostras se você tiver apenas dois grupos.


 Use um ANOVA com um fator se você tiver três ou mais grupos.
Dispersões
Procure por diferenças entre as dispersões dos grupos.

Por exemplo, estes histogramas demonstram os pesos dos jarros que foram cheios
por três máquinas. Apesar de os histogramas terem quase o mesmo centro, alguns
histogramas são mais amplos e dispersos. A dispersão mais ampla indica que tais
máquinas enchem os jarros de forma menos consistente.

Histogramas sobrepostos

Histograma em painéis

Para determinar se a diferença na dispersão (variância) é estatisticamente


significante, realize uma das seguintes ações:

 Use um teste para 2 variâncias se você tiver apenas dois grupos.


 Use um teste de igualdade de variâncias caso tenha três ou mais grupos.

Linhas de distribuição ajustadas


Saiba mais sobre Minitab Statistical Software

Use uma linha de distribuição ajustada para avaliar o quão bem os dados da
amostra seguem uma distribuição teórica específica. Por padrão, o Minitab ajusta
uma distribuição normal e estima os parâmetros para a distribuição de sua amostra.

Neste tópico
 Sobre linhas de distribuição ajustadas
 Adicionar uma linha de distribuição ao criar um gráfico
 Adicionar ou remover uma linha de distribuição ajustada em um gráfico de
probabilidade existente ou um gráfico da FDA empírica
 Adicionar ou remover uma linha de distribuição ajustada em um histograma
 Editar uma linha de distribuição ajustada

Sobre linhas de distribuição ajustadas


Uma linha de distribuição ajustada é uma curva de distribuição teórica calculada
usando-se estimativas de parâmetros derivadas de uma amostra ou de valores
históricos que você insere. Use linhas de distribuição ajustadas para determinar
quão bem os dados amostrais seguem uma distribuição específica. Essas linhas de
distribuição são normalmente sobrepostas com os dados atuais de forma que você
possa comparar diretamente os dados empíricos com a distribuição hipotética.

Exemplos de linhas de distribuição ajustadas

Os gráficos a seguir incluem uma linha de distribuição normal ajustada. Cada tabela
do gráfico exibe as estimativas de parâmetro usadas para gerar a linha ou a curva.

Nesse gráfico de probabilidade, a linha sólida do meio é a linha de distribuição

normal ajustada.
Nesse gráfico de FDA empírica, a linha vermelha é a linha de distribuição normal

ajustada.

Nesse histograma, a distribuição normal ajustada não parece ser um bom ajuste.
Existem mais dados do que o esperado à esquerda do pico e na cauda direita.

Adicionar uma linha de distribuição ao criar um


gráfico

Uma linha de distribuição normal ajustada aparece por padrão, por exemplo, em
gráficos de probabilidade e em gráficos da FDA empírica. É possível especificar uma
distribuição diferente para esses gráficos ou adicionar uma linha de distribuição
ajustada a outros gráficos, como os histogramas, ao criar um gráfico.

1. Na caixa de diálogo do gráfico que você está criando, clique


em Distribuição ou Visualização de Dados.
2. Na guia Distribuição, selecione uma distribuição e especifique os
parâmetros. Para obter informações sobre distribuições e parâmetros,
acesse Distribuições para linhas ajustadas.
3. Na guia Exibição de Dados, especifique as opções de exibição.
Observação
Na guia Exibição de Dados apenas para gráficos de probabilidade, é também
possível especificar o nível de confiança para o intervalo de confiança. Por
padrão, os intervalos de confiança mostram os limites de confiança de 95%
para os percentis individuais da distribuição. Estes intervalos formam as
linhas contínuas exteriores do gráfico e podem ser usados para avaliar a
precisão das estimativas dos percentis individuais. Os intervalos de
confiança não devem ser utilizados para avaliar o ajuste de distribuição.

Adicionar ou remover uma linha de distribuição


ajustada em um gráfico de probabilidade existente
ou um gráfico da FDA empírica

1. Clique duas vezes no gráfico.


2. Clique com o botão direito do mouse no gráfico e
selecione Adicionar > Exibição de dados.
3. Na caixa de diálogo Adicionar exibição de dados, marque ou
desmarque Ajuste da distribuição.

Adicionar ou remover uma linha de distribuição


ajustada em um histograma

1. Clique duas vezes no gráfico.


2. Clique com o botão direito do mouse no gráfico e
selecione Adicionar > Ajuste de distribuição.
3. Na caixa de diálogo Adicionar Ajuste de distribuição, selecione uma
distribuição e especifique os parâmetros. Para obter informações sobre
distribuições e parâmetros, acesse Distribuições para linhas ajustadas.
Editar uma linha de distribuição ajustada

1. Clique duas vezes no gráfico.


2. Clique duas vezes na linha de distribuição ajustada.
3. Selecione a guia para fazer as edições desejadas.
 Atributos: Mudar a cor, tamanho, ou tipo de linha.
 Grupos: insira uma variável categórica para visualizar os grupos.
 Opções: Selecione uma distribuição e especifique os parâmetros.
Apenas nos gráficos de probabilidade, é também possível especificar
o nível de confiança para o intervalo de confiança.

DICA

Mantenha o ponteiro do mouse sobre a linha de distribuição ajustada para


visualizar uma tabela de percentis estimados. Para copiar o texto da dica de
ferramenta, selecione o elemento que tem a dica de ferramenta, clique com o
botão direito e selecione Copiar texto.

Visão geral de ANOVA com 1 fator

Saiba mais sobre Minitab Statistical Software

Use ANOVA com 1 fator quando você tem um fator categórico e uma resposta
contínua e quer determinar se as médias populacionais de dois ou mais grupos
diferentes. Se o teste verificar que pelo menos um grupo é diferente, utilize a caixa
de diálogo Comparações no ANOVA com um fator para identificar pares de grupos
que são significativamente diferentes.

Por exemplo, um fabricante de tapetes quer determinar se existem diferenças na


durabilidade entre vários tipos de tapete.
Onde encontrar esta análise

Para executar uma ANOVA com um fator, selecione Estat > ANOVA > Um fator.

Quando usar uma análise alternativa

 Se você tiver dois ou mais fatores categóricos fixos, use Ajustar modelo linear
generalizado se você tiver todos os fatores fixos ou Ajustar modelo de efeitos
mistos se você tiver fatores aleatórios.
 Se você quiser representar graficamente a relação entre um preditor
contínuo (numérico) e uma resposta contínua, use Gráfico de linha ajustada.
 Se você tiver mais de um preditor, use Ajuste do modelo de regressão.
 Se você tiver apenas variáveis categóricas, tanto para a resposta quanto para
os fatores, vá para O que é um modelo linear generalizado? a fim de saber
qual tipo de análise de regressão usar.

Visão geral de Teste t para 2 Amostra

Saiba mais sobre Minitab Statistical Software

Use Teste t para 2 Amostra para fazer o seguinte:

 Determine se as médias da população de dois grupos independentes diferem.


 Calcular um intervalo de valores que provavelmente inclui a diferença entre as
médias da população.

Por exemplo, um consultor de saúde deseja comparar os índices de satisfação dos


pacientes de dois hospitais. Se as médias dos dois hospitais forem diferentes, o
consultor utiliza o intervalo de confiança para determinar se a diferença é
praticamente significativa.

Onde encontrar esta análise


Para realizar um teste t com 2 amostra, selecione . Estat > Estatísticas
Básicas > Teste t para 2 Amostra.

Quando usar uma análise alternativa


Se tiver dados pareados ou dependentes, tais como medições de rolamentos
obtidas com dois paquímetros, use Teste t pareado em vez disso. Para obter mais
informações, vá para Como amostras dependentes e independentes são
diferentes?.

Você também pode gostar