Você está na página 1de 20

Estatística I Profa.

Fádua Ferreira

UNIVERSIDADE FEDERAL DO PARÁ


FACULDADE DE ECONOMIA
ESTATÍSTICA I
MEDIDAS DE RESUMO PARA DADOS AGRUPADOS
Aula 03

Professora Fádua Ferreira


faduafanotnio@gmail.com

CRONOGRAMA DE AULAS
1ª Avaliação

• 02/09/2019: Introdução à Estatística;

• 09/09/2019: Medidas de resumo para dados brutos;

• 16/09/2019: Medidas de resumo para dados agrupados;

• 23/09/2019: REVISÃO;

• 30/09/2019 – 04/10/2019: Não haverá aula;

• 07/10/2019: 1ª AVALIAÇÃO.
Estatística I Profa. Fádua Ferreira

ORGANIZAÇÃO E APRESENTAÇÃO DE
DADOS
CONTINUAÇÃO

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS


Um histograma é um gráfico de frequência que tem por
objetivo ilustrar como uma determinada amostra ou
população de dados está distribuída.
Como todos os gráficos, a finalidade de um histograma é
quantificar uma realidade.
Para isso devemos utilizar dois conceitos: frequência e
variável.
O primeiro se refere ao número de vezes que algo ocorre e o
segundo é o valor numérico em uma escala de medição.
Estatística I Profa. Fádua Ferreira

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS


Exemplo: Dados da altura da planta (cm) em experimentos de
competição de híbridos de milho.
Estatística I Profa. Fádua Ferreira

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS


INTERPRETAÇÕES:
• A frequência diminui a medida que as alturas das plantas
aumentam.
• A maioria das plantas tem altura entre 240 e 250 cm.
• Uma menor quantidade de plantas tem alturas entre 280 e
209

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS


Definição: O gráfico de caixa (boxplot) é um gráfico
utilizado para avaliar a distribuição empírica do dados
que apresenta simultaneamente várias características
de dados:
• tendência central;
• dispersão;
• simetria;
• presença de observações discrepantes (“outliers”).
Estatística I Profa. Fádua Ferreira

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS


Exemplo: Dados da altura da planta (cm) em experimentos de
competição de híbridos de milho.
Estatística I Profa. Fádua Ferreira

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS


Exemplo: Dados da altura da planta (cm), por tipo de grão, em
experimentos de competição de híbridos de milho.

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS


Exemplo: Dados do diâmetro (cm) da roseta foliar de bromélias
expostas ao sol.

Note a presença de dois valores discrepantes.


Estatística I Profa. Fádua Ferreira

GRÁFICOS PARA VARIÁVEIS QUANTITATIVAS


Leitura, anotação ou transcrição incorreta dos dados.
Erro na execução do experimento ou na tomada da medida.
Mudanças não controláveis nas condições experimentais ou
dos pacientes.
Características inerente à variável estudada (por exemplo,
grande instabilidade do que está sendo medido).

MEDIDA DE ASSIMETRIA
Significa desvio ou afastamento da simetria.
Como já foi dito anteriormente, as distribuições de
frequências não diferem apenas quanto ao valor médio e à
variabilidade, como também quanto à sua forma.
Do ponto de vista desse último aspecto, as características mais
importantes são o grau de deformação (assimetria).
Estatística I Profa. Fádua Ferreira

MEDIDA DE ASSIMETRIA
Relação com as medidas de tendência central:

MEDIDA DE ASSIMETRIA
Relação da assimetria com o gráfico de caixa:
Estatística I Profa. Fádua Ferreira

MEDIDA DE ASSIMETRIA
O coeficiente de assimetria é expresso da seguinte forma:
𝑄 + 𝑄 − 2𝑋
𝐴 =
𝑄 −𝑄
Este é chamado de segundo coeficiente de assimetria de Person.

Classificação:
• 𝐴 = 0: simétrico.
• 𝐴 > 0: assimétrico positivo.
• 𝐴 < 0: assimétrico negativo.

MEDIDA DE ASSIMETRIA
Exemplo: Encontre a As para os dados do diâmetro (cm) da roseta
foliar de bromélias expostas ao sol, dispostos a seguir:
5,4 5,8 6,4 6,6 7,3 6,6 6,8 6,8 7,0 6,4 7,3 7,5
8,2 8,8 11,8 8,8 12,3 5,4
Estatística I Profa. Fádua Ferreira

MEDIDA DE ASSIMETRIA
Exemplo: Encontre a As para os dados do diâmetro (cm) da roseta
foliar de bromélias expostas ao sol, dispostos a seguir:
RESOLUÇÃO:
ROL: 5,4 5,4 5,8 6,4 6,4 6,6 6,6 6,8 6,8 7,0
7,3 7,3 7,5 8,2 8,8 8,8 11,8 12,3
Temos que:

• 𝑃𝑜𝑠 = = 4,5 ≈ 5 ⇒ Q = 6,4
, ,
•𝑄 =𝑋= = = 6,9

• 𝑃𝑜𝑠 = = 13,5 ≈ 14 ⇒ 𝑄 = 8,2

MEDIDA DE ASSIMETRIA
Exemplo: Encontre a As para os dados do diâmetro (cm) da roseta
foliar de bromélias expostas ao sol, dispostos a seguir:
RESOLUÇÃO:
Assim,
6,4 + 8,2 − 2 ∗ 6,9
𝐴 = = 0,44
8,2 − 6,4
Como 𝐴 > 0 temos um indicativo de assimetria positiva.
Estatística I Profa. Fádua Ferreira

MEDIDA DE CURTOSIS
É uma medida de achatamento (curtosis) da distribuição dos dados,
indicando a intensidade das frequências na vizinhança dos valores
centrais.
A classificação da distribuição de frequência, relativamente ao seu
achatamento, pode ser feita através do coeficiente percentílico de
curtosis,
𝑄 −𝑄
𝐾=
2 𝑃 −𝑃
Classificação:
𝐾 = 0,263: mesocúrtica
𝐾 > 0,263: platicúrtica
𝐾 < 0,263: leptocúrtica

MEDIDA DE CURTOSIS
Estatística I Profa. Fádua Ferreira

MEDIDA DE CURTOSIS
Exemplo: Encontre o K para os dados do diâmetro (cm) da roseta foliar
de bromélias expostas ao sol, dispostos a seguir:
5,4 5,8 6,4 6,6 7,3 6,6 6,8 6,8 7,0 6,4 7,3 7,5
8,2 8,8 11,8 8,8 12,3 5,4

MEDIDA DE CURTOSIS
Exemplo: Encontre o K para os dados do diâmetro (cm) da roseta foliar
de bromélias expostas ao sol, dispostos a seguir:
RESOLUÇÃO:
ROL: 5,4 5,4 5,8 6,4 6,4 6,6 6,6 6,8 6,8 7,0
7,3 7,3 7,5 8,2 8,8 8,8 11,8 12,3

• 𝑃𝑜𝑠 = = 4,5 ≈ 5 ⇒ 𝑄 = 6,4

• 𝑃𝑜𝑠 = = 13,5 ≈ 14 ⇒ 𝑄 = 8,2

• 𝑃𝑜𝑠 = = 1,8 ≈ 2 ⇒ 𝑃 = 5,4

• 𝑃𝑜𝑠 = = 16,2 ≈ 16 ⇒ 𝑃 = 8,8
Estatística I Profa. Fádua Ferreira

MEDIDA DE CURTOSIS
Exemplo: Considere os dados do diâmetro (cm) da roseta foliar de
bromélias expostas ao sol:
Então,
8,2 − 6,4
𝐾= = 0,2647
2(8,8 − 5,4)
Dessa forma, como 𝐾 = 0,2647 > 0,263, o grau de achatamento da
distribuição dos dados é classificada como platicúrtica.

MEDIDA DE CURTOSIS
Distribuição dos comprimentos dos camarões-rosa é considerada
leptocúrtica.
Podemos avaliar o histograma também.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE RESUMO PARA


DADOS AGRUPADOS

ORGANIZAÇÃO DE DADOS
DADOS AGRUPADOS
Consiste em agrupar dados oriundos de variáveis
quantitativas (discretas e contínuas) em tabelas de
frequência.
Os dados são agrupados segundo algumas estratégias
pré-definidas.
Uma vez agrupados a natureza do dado agrupado se
torna qualitativa ordinal.
Estatística I Profa. Fádua Ferreira

ORGANIZAÇÃO DE DADOS
DADOS AGRUPADOS
1. Encontrar o menor e o maior valores no conjunto dos dados;
2. Determinar a amplitude total:
𝐴 = 𝑋( ) − 𝑋( )
3. Determinar o número de intervalos (classes), através de um valor
indicado pela literatura, ou utilizando,
𝑁 = 0,9   𝑛
4. A amplitude dos intervalos é obtida utilizando a seguinte expressão:
𝐴
𝐴 =
𝑁
Uma vez calculados, basta montar a tabela e determinar a frequências.

ORGANIZAÇÃO DE DADOS
DADOS AGRUPADOS
Exemplo 1: Considere os dados de diâmetros (cm) de brotos de
bromélias, em rol:
4,1 4,5 4,6 5,8 5,8 6,1 6,3 6,6 6,6 6,8 7,0 7,0
7,2 7,3 7,3 8,1 8,2 8,5 8,6 8,7 8,7 8,7 8,7 8,9
9,0 9,1 9,6 10,3 10,9 11,0
Temos, 𝑛 = 30, então:
A amplitude total é dada por: A = 11 − 4.1 = 6.9.
 
O número de intervalos é obtido por: 𝑁 = 0,9 30 = 4,9 ≈ 5
,
Então, a amplitude dos intervalos é: 𝐴 = = = 1,4
,
Estatística I Profa. Fádua Ferreira

ORGANIZAÇÃO DE DADOS
DADOS AGRUPADOS
Faixa de Diâmetro (cm) 𝑓 𝑓% 𝐹 𝐹%
4,1 – 5,5 3 10,00 3 10,00
5,5 – 6,9 7 23,33 10 33,33
6,9 – 8,3 7 23,33 17 56,67
8,3 – 9,7 10 33,33 27 90,00
9,7 – 11,1 3 10,00 30 100,00
Total 30 100

MEDIDAS DE RESUMO PARA DADOS


AGRUPADOS
Uma vez que dispomos de dados em intervalos de
valores, as medidas de resumo precisam ser adaptadas.
Para os cálculos de das medidas, faremos o uso de:
• Frequências;
• Limites dos intervalos de agrupamento;
• Ou de uma nova definição do valor da variável em
questão.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE RESUMO PARA DADOS


AGRUPADOS
Média: Na presença de dados agrupados, temos a seguinte definição para o
cálculo da média:
𝑋 × 𝑓 +𝑋 ×𝑓 +⋯+𝑋 𝑓
𝑋=
𝑓 +𝑓 +⋯+𝑓
em que 𝑓 , é a frequência absoluta.
𝑋 representa o ponto médio do intervalo, e é calculado da seguinte forma:
𝑙 +𝑠
𝑋 =
2
onde 𝑙 e 𝑠 são os limites inferior e superior, respectiva mente, de cada
intervalo.
Note também que a soma das frequências resulta no tamanho amostrai,
logo, ∑ 𝑓 = 𝑛.

MEDIDAS DE RESUMO PARA DADOS


AGRUPADOS
Para o cálculo da mediana em dados agrupados ainda precisamos das
posições.
Logo, temos que a mediana para dados agrupados é dada por
𝑃𝑜𝑠 − 𝐹 ,
𝑋=𝑙 + ×ℎ
𝑓
em que:
• 𝑙 : é o limite inferior da classe da mediana.
• 𝑃𝑜𝑠 : é a posição da mediana.
• 𝐹 , : é a frequência acumulada absoluta anterior da classe da mediana.
• 𝑓 : é a frequência absoluta da classe da mediana.
• ℎ: é a amplitude da classe da mediana, em que: ℎ = 𝑠 − 𝑙 .
Estatística I Profa. Fádua Ferreira

MEDIDAS DE RESUMO PARA DADOS


AGRUPADOS
Para obter a moda para dados agrupados, usamos a seguinte
expressão:
Δ
𝑀𝑜 = 𝑙 + ×ℎ
Δ +Δ
em que:
Δ : é a diferença entre a frequência absoluta da classe da moda com a
frequência absoluta anterior.
Δ = 𝑓 − 𝑓,
Δ : é a diferença entre a frequência absoluta da classe da moda com a
frequência absoluta posterior.
Δ = 𝑓 − 𝑓,

MEDIDAS DE SEPARATRIZES
QUARTIS
Para o cálculo dos quartis para dados agrupados, temos:
𝑃𝑜𝑠 − 𝐹 ,
𝑄 =𝑙 + × ℎ, 𝑖 = 1,2,3.
𝑓
em que:
• 𝑙 : é o limite inferior da classe do quartil 𝑖.
• 𝑃𝑜𝑠 : é a posição do quartil 𝑖.
• 𝐹 , : é a frequência acumulada absoluta anterior do quartil 𝑖.
• 𝑓 : é a frequência absoluta da classe do quartil 𝑖.
• ℎ: a amplitude da classe do quartil 𝑖, em que
ℎ =𝑠 −𝑙
Estatística I Profa. Fádua Ferreira

MEDIDAS DE SEPARATRIZES
DECIS
Para o cálculo dos decis para dados agrupados, temos:
𝑃𝑜𝑠 − 𝐹 ,
𝐷 =𝑙 + × ℎ, 𝑖 = 1,2,3, … , 9.
𝑓
em que:
• 𝑙 : é o limite inferior da classe do decil 𝑖.
• 𝑃𝑜𝑠 : é a posição do decil 𝑖.
• 𝐹 , : é a frequência acumulada absoluta anterior do decil 𝑖.
• 𝑓 : é a frequência absoluta da classe do decil 𝑖.
• ℎ: a amplitude da classe do decil 𝑖, em que
ℎ =𝑠 −𝑙

MEDIDAS DE SEPARATRIZES
PERCENTIS
Para o cálculo dos percentis para dados agrupados, temos:
𝑃𝑜𝑠 − 𝐹 ,
𝑃 =𝑙 + × ℎ, 𝑖 = 1,2,3, … , 99.
𝑓
em que:
• 𝑙 : é o limite inferior da classe do percentil 𝑖.
• 𝑃𝑜𝑠 : é a posição do percentil 𝑖.
• 𝐹 , : é a frequência acumulada absoluta anterior do percentil 𝑖.
• 𝑓 : é a frequência absoluta da classe do percentil 𝑖.
• ℎ: a amplitude da classe do percentil 𝑖, em que
ℎ =𝑠 −𝑙
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARABILIADADE
VARIÂNCIA
A expressão para o cálculo de variância para dados agrupados é dada
por:
Populacional:
∑𝑓 𝑋 − 𝑋
𝜎 =
𝑁
Amostral
∑𝑓 𝑋 − 𝑋
𝑆 =
𝑛−1
Em que:
• 𝑋 : é o ponto médio do intervalo 𝑖.
• 𝑓 : é a frequência absoluta do intervalo 𝑖.

PRÓXIMA AULA: REVISÃO


Obs.: 07/10/2019: 1ª AVALIAÇÃO

Você também pode gostar