Você está na página 1de 22

Estatística I Profa.

Fádua Ferreira

UNIVERSIDADE FEDERAL DO PARÁ


FACULDADE DE ECONOMIA
ESTATÍSTICA I

MEDIDAS DE RESUMO PARA DADOS BRUTOS


Aula 02

Professora Fádua Ferreira


faduafanotnio@gmail.com

CRONOGRAMA DE AULAS
1ª Avaliação

• 02/09/2019: Introdução à Estatística;

• 09/09/2019: Medidas de resumo para dados brutos;

• 16/09/2019: Medidas de resumo para dados agrupados;

• 23/09/2019: REVISÃO;

• 30/09/2019: 1ª AVALIAÇÃO.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE RESUMO PARA


DADOS BRUTOS

ORGANIZAÇÃO DE DADOS
• Medidas de tendência central
 Média, mediana, moda e separatrizes

• Medidas de variabilidade ou dispersão


 Variância, desvio padrão, amplitude, coeficiente de
variação, escore padronizado, amplitude
interquartílica.

• Medidas de assimetria e curtoses


Estatística I Profa. Fádua Ferreira

MEDIDAS DE TENDÊNCIA
CENTRAL

MEDIDAS DE TENDÊNCIA CENTRAL


MÉDIA
Definição: a média de um conjunto de dados é a soma dos
valores dos dados dividida pelo número de observações.
Interpretado como o "centro de gravidade”, ponto de
equilíbrio, o valor esperado.
Seja 𝑋 , 𝑋 , … , 𝑋 valores de uma determinada variável 𝑋,
temos que a média é expressa por
𝑿𝟏 + 𝑿𝟐 + ⋯ + 𝑿𝒏 ∑𝒏𝒊 𝟏 𝑿𝒊
𝑿= =
𝒏 𝒏
Comumente chamado de média aritmética, ou "x-barra".
Estatística I Profa. Fádua Ferreira

MEDIDAS DE TENDÊNCIA CENTRAL


MÉDIA
Exemplo 1: Sejam os seguintes valores da altura de brotos de
explantes de abacaxi (cm):
1.00 1.31 1.42 1.37 1.52 1.68 1.19 1.73

Exemplo 2: Os pesos (em libras) de uma amostra de adultos


antes de iniciarem um estudo sobre perda de peso estão
listados. Qual é o peso médio dos adultos?
274 235 223 268 290 285 235

MEDIDAS DE TENDÊNCIA CENTRAL


MEDIANA
Definição: é o valor que divide a distribuição dos dados ao meio, ou
seja, 50% das observações ficam acima da mediana e o restante
abaixo.
Denotada por 𝑿.
Para o cálculo da mediana precisamos COLOCAR OS DADOS EM ROL
para determinar a posição da mediana nos dados.
Se 𝑛 for impar: (1) 𝑃𝑜𝑠 = (2) 𝑋 = 𝑋( )/ .
/ ( )/
Se 𝑛 for par: (1) 𝑃𝑜𝑠1 = 𝑒 𝑃𝑜𝑠2 = (2) 𝑋 =
Estatística I Profa. Fádua Ferreira

MEDIDAS DE TENDÊNCIA CENTRAL


MEDIANA
• Quando o 𝑛 é impar: • Quando o 𝑛 é par:
Seja os seguintes dados: Seja os seguintes dados:
1 2 5 6 7 1 2 5 6 7 7
Como 𝑛 = 5 Como 𝑛 = 6
5+1 6 𝑃𝑜𝑠1 = 6/2 = 3 𝑒
𝑃𝑜𝑠 = = =3 𝑃𝑜𝑠2 = (6 + 2)/2 = 4
2 2
Portanto a mediana é igual Portanto a mediana é igual à
à 𝑋 = 5. 𝑋= = 5,5.

MEDIDAS DE TENDÊNCIA CENTRAL


MEDIANA
Exemplo 1: Os preços (em dólares) de uma amostra de porta-
retratos digital estão listados a seguir. Determine o preço
mediano dos porta-retratos.
1.00 1.19 1.31 1.37 1.42 1.52 1.68 1.73

Exemplo 2: As idades de uma amostra de fãs em um show de


rock estão listadas a seguir. Determine a idade mediana.
274 235 223 268 290 285 235
Estatística I Profa. Fádua Ferreira

MEDIDAS DE TENDÊNCIA CENTRAL


MODA
A moda (𝑴𝒐) de um conjunto de dados é o valor que ocorre
com a maior frequência.
Um conjunto de dados pode ter uma moda, mais de uma
moda, ou não ter moda.
Classificação:
1. Amodal: quando não há um valor mais frequente.
2. Unimodal: somente um valor que mais se repete.
3. Bimodal: dois valores que mais se repete.
4. Polimodal: mais de dois valores frequentes.

MEDIDAS DE TENDÊNCIA CENTRAL


MODA
Exemplo 1: Sejam os seguintes valores da altura de brotos de
explantes de abacaxi (cm):
10 50 50 70 70 70 100 100 120 130

Exemplo 2: Os preços (em dólares por pés quadrados) para


uma amostra de condomínios de South Beach (Miami Beach,
Flórida) estão listados a seguir. Determine a moda dos preços.
18, 18, 19, 19, 19, 20, 21, 21, 21, 21, 23, 24, 24, 26, 27, 27, 29,
30, 30, 30, 33, 33, 34, 35, 38.
Estatística I Profa. Fádua Ferreira

SEPARATRIZES

MEDIDAS DE SEPARATRIZES
Definição: as medidas separatrizes são medidas de posição e
tem por finalidade dividir um conjunto de dados, relativo a um
fenômeno, em K partes iguais.
As medidas separatrizes são:
1. Mediana: Divide os dados em duas partes iguais;
2. Quartil: Divide os dados em quatro partes iguais;
3. Decil: Divide os dados em dez partes iguais;
4. Percentil: Divide os dados em cem partes iguais.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE SEPARATRIZES
QUARTIS
Definição: são valores dados a partir do conjunto de observações
ordenado em ordem crescente, que dividem a distribuição em quatro
partes iguais. Denominados de 𝑄 , 𝑄 𝑒 𝑄 .
O primeiro quartil, 𝑄 , é o número que deixa, aproximadamente, 25%
das observações abaixo e, aproximadamente, 75% acima.
Enquanto que o terceiro quartil, 𝑄 , deixa, aproximadamente, 75% das
observações abaixo e, aproximadamente, 25% acima.
Já 𝑄 é a mediana, deixa 50% das observações abaixo e 50% das
observações acima.

MEDIDAS DE SEPARATRIZES
QUARTIS
Assim como na obtenção da mediana, os quartis são obtidos
através do cálculo das posições.
O cálculo para as posições dos quartis é dado por
𝑖×𝑛
𝑃𝑜𝑠 = , 𝑖 = 1,2,3.
4
em que 𝑖 indica qual é o quartil e 𝑛 é o tamanho amostral.
Exemplo: Encontre o 𝑄 para os dados de produção de cana-de-açúcar,
de uma determinada variedade, por toneladas de hectares, dispostos a
seguir:
88 89 90 91 92 93 95 96 97 99
Estatística I Profa. Fádua Ferreira

MEDIDAS DE SEPARATRIZES
DECIS
Definição: são valores dados a partir do conjunto de observações
ordenado em ordem crescente, que dividem a distribuição em dez
partes iguais. Denominados de 𝐷 , 𝑖 = 1,2,3 … , 9.
Já 𝐷 é a mediana, deixa 50% das observações abaixo e 50% das
observações acima.

MEDIDAS DE SEPARATRIZES
DECIS
Os decis são obtidos através do cálculo das posições.
O calculo para as posições dos decis usamos a seguinte
expressão:
𝑖×𝑛
𝑃𝑜𝑠 = , 𝑖 = 1,2, … , 9.
10
em que 𝑖 indica qual é o decil e 𝑛 é o tamanho amostral.
Exemplo: Encontre o 𝐷 para os dados de produção de cana-
de-açúcar, de uma determinada variedade, por toneladas de
hectares, dispostos a seguir:
88 89 90 91 92 93 95 96 97 99
Estatística I Profa. Fádua Ferreira

MEDIDAS DE SEPARATRIZES
PERCENTIS
Definição: são valores dados a partir do conjunto de
observações ordenado em ordem crescente, que
dividem a distribuição em 100 partes iguais.
Denominados de
Note que, é a mediana, éa , éa .

MEDIDAS DE SEPARATRIZES
PERCENTIS
Os percentis são obtidos através do cálculo das posições.
O cálculo para as posições dos decis usamos a seguinte
expressão:
𝑖×𝑛
𝑃𝑜𝑠 = , 𝑖 = 1,2, … , 99.
100
em que 𝑖 indica qual é o percentil e 𝑛 é o tamanho amostral.
Exemplo: Encontre o 𝑃 para os dados de produção de cana-
de-açúcar, de uma determinada variedade, por toneladas de
hectares, dispostos a seguir:
88 89 90 91 92 93 95 96 97 99
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE

MEDIDAS DE VARIABILIDADE
As medidas de tendência central nos dão uma ideia da
concentração dos dados em torno de um valor.
Entretanto, é preciso também conhecer suas
características de espalhamento ou dispersão -
medidas de variabilidade (ou dispersão).
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
Sejam os seguintes conjun-
tos de dado: Importância do
uso das medidas de
variabilidade.
Observe que cada série tem
a mesma média e mediana.
No entanto, note que a
dispersão entre os valores é
bem diferente.

MEDIDAS DE VARIABILIDADE
Exemplo: Considere o exemplo de duas linha de produção de uma
peça. A média do comprimento da peça é de 75cm e ambas as linhas
estão produzindo peças com médias próximas desse valor. Podemos
considerar que as peças produzidas por ambas as linhas são
adequadas?
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
É claro que as peças produzidas pela primeira linha de produção são
melhores que a segunda.
Isso ocorre porque a dispersão dos elementos em torno da média é
menor, ou seja, os elementos estão mais concentrados em torno da
média na primeira linha de produção.
Como queremos avaliar a dispersão dos dados em torno da média, esse
valor estará relacionado com a distância dos dados em relação à
média.

MEDIDAS DE VARIABILIDADE
No exemplo da imagem anterior, temos
𝑑 +𝑑 +𝑑 +𝑑 =0
O qual nos levaria à conclusão errada de que não existe
variação entre os dados.
Desta forma, precisamos de alguns medidas estatísticas para
poder estudar a dispersão dos dados de forma correta.
Dispersão é sinônimo de variação ou variabilidade. Para
medir a dispersão, duas medidas são usadas mais
frequentemente: a amplitude e o desvio padrão. Para
definirmos desvio padrão é necessário definir variância.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
Como uma medida de variação, a amplitude tem a vantagem
de ser fácil de calcular.
Sua desvantagem, entretanto, é que ela usa somente dois
valores do conjunto de dados.
Duas medidas de variação que usam todos os valores do
conjunto de dados são a variância e o desvio padrão.
Porém, antes de aprendermos essas medidas, precisamos
entender o que chamamos desvio de um valor no conjunto de
dados.

MEDIDAS DE VARIABILIDADE
Definição
O desvio de um valor em uma população é a
diferença entre o valor e a média do conjunto de
dados.
Desvio de .
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
AMPLITUDE TOTAL
Definição: é a diferença entre o maior valor e o menor
valor do conjunto de dados.
Utilizado para comparar dois procedimentos.
A amplitude total é expressa por:
( )
em que é o mínimo e ( ) é o máximo.

MEDIDAS DE VARIABILIDADE
AMPLITUDE TOTAL
Exemplo 1: Dosagem de colesterol, realizada por dois procedimentos.

𝐴 𝑚𝑖𝑐𝑟𝑜 = 208 − 193 = 15 e 𝐴 𝑎𝑢𝑡𝑜 = 232 − 178 = 54.


Note que a amplitude total foi cerca de 4 vezes maior pelo
Autoanalisador do que com o Microenzemático.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
VARIÂNCIA
A variância é a medida de dispersão definida como a média do
quadrado dos desvios dos elementos em relação à média.
Populacional
∑ 𝑥 −𝜇
𝜎 = , 𝜎 >0
𝑁
Amostral

𝑥 −𝑋
𝑆 = , 𝑆>0
𝑛−1
Geralmente estaremos utilizando 𝑆 por estarmos trabalhando com
amostras.

MEDIDAS DE VARIABILIDADE
DESVIO PADRÃO
Também é uma medida de variabilidade em torno da média. Está
diretamente relacionado com a variância.
Expresso pela raiz quadrada da variância, ou seja:
Populacional
  ∑ 𝑥 −𝜇
𝜎= , 𝜎>0
𝑁
Amostral
  ∑ 𝑥 −𝑋
𝑆= , 𝑆>0
𝑛−1
Geralmente estaremos utilizando 𝑆 por estarmos trabalhando com
amostras.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
DESVIO PADRÃO
INTERPRETANDO O DESVIO PADRÃO
Ao interpretar o desvio padrão de um conjunto de dados, lembre-se de
que ele é uma medida que indica o quanto, em média, os valores se
desviam da média desse conjunto. Quanto mais espalhados estiverem
os valores, maior será o desvio padrão.
Valores de dados que se encontram a mais ou menos dois desvios
padrão da média são considerados incomuns, enquanto aqueles que
se encontram a mais de três desvios padrão da média são muito
incomuns.
Valores incomuns e muito incomuns têm uma influência maior no
desvio padrão do que aqueles que estão mais próximos da média.
Isso acontece porque os desvios são elevados ao quadrado.

MEDIDAS DE VARIABILIDADE
DESVIO PADRÃO
Muitos conjuntos de dados da vida real têm distribuições que são
aproximadamente simétricas e em forma de sino. A Regra Empírica pode
ajudá-lo a ver quão valioso é o desvio padrão como uma medida de variação.
Regra Empírica (ou Regra 68-95-99,7)
Para conjuntos de dados com distribuições que são aproximadamente
simétricas e com forma de sino, o desvio padrão tem estas características:
1. Cerca de 68% dos dados encontram-se dentro do intervalo de ± 1 desvio
padrão em relação à média.
2. Cerca de 95% dos dados encontram-se dentro do intervalo de ± 2 desvios
padrão em relação à média.
3. Cerca de 99,7% dos dados encontram-se dentro do intervalo de ± 3
desvios padrão em relação à média.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
DESVIO PADRÃO

MEDIDAS DE VARIABILIDADE
Exemplo 1: Os preços (em dólares) de uma amostra de porta-retratos
digital estão listados a seguir. Determine variância e o desvio padrão
dos porta-retratos.
1.00 1.19 1.31 1.37 1.42 1.52 1.68 1.73

Exemplo 2: As idades de uma amostra de fãs em um show de rock


estão listadas a seguir. Determine a variância e o desvio padrão das
idades.
274 235 223 268 290 285 235
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
Exemplo 3: Variância e desvio padrão para as alturas de brotos de
explantes de abacaxi (cm).

MEDIDAS DE VARIABILIDADE
Exemplo 4: Variância e desvio padrão para os dados de um
experimento de competição de híbridos de milho, com respeito ao
rendimento médio, por kg/ha.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
COEFICIENTE DE VARIAÇÃO (CV)
O desvio padrão é bastante afetado pela magnitude dos
dados, ou seja, ele não é uma medida resistente.
Se quisermos comparar a variabilidade de dois conjuntos de
dados podemos usar o coeficiente de variação, que é definido
como a razão entre o desvio padrão 𝑆 e a média amostral.
O cálculo do CV é obtido usando a seguinte expressão:
Populacional: 𝐶𝑉 = ∗ 100. Amostral: 𝐶𝑉 = ∗ 100.
Útil na comparação de procedimentos, grupos ou
procedimentos, em que as médias são diferentes.

MEDIDAS DE VARIABILIDADE
COEFICIENTE DE VARIAÇÃO (CV)
Classificação:
baixo;
médio;
alto;
muito alto.
Estatística I Profa. Fádua Ferreira

MEDIDAS DE VARIABILIDADE
COEFICIENTE DE VARIAÇÃO (CV)
Exemplo 1: Calcule o coeficiente de variação para avaliar a magnitude
do desvio padrão do rendimento médio (kg/ha) de Competições de
híbridos de milho.
𝐶𝑉 = 24,92 e 𝐶𝑉 = 11,63.
Note que, o rendimento médio
para o grão do tipo semidentado,
apresentou menor variabilidade.
Note que o 𝐶𝑉 mede a variação de um
conjunto de dados em relação à média.
Ambos tipos de grão apresentaram
um CV médio.

MEDIDAS DE VARIABILIDADE
COEFICIENTE DE VARIAÇÃO (CV)
Exemplo 2: Calcule o coeficiente de variação para avaliar a magnitude
do desvio padrão do número de ciclos, em dia, de competições de
híbridos de milho.
Estatística I Profa. Fádua Ferreira

SÍMBOLOS NAS FÓRMULAS


População Amostra
Variância 𝜎2 𝑆2
Desvio Padrão 𝜎 𝑆
Média 𝜇 𝑋
Número de observações 𝑁 𝑛
Desvio 𝑥−𝜇 𝑥−𝑋
Soma dos Quadrados ∑ 𝑥−𝜇 2 ∑ 𝑥−𝑋 2

PRÓXIMA AULA:
MEDIDAS DE RESUMO PARA
DADOS AGRUPADOS

Você também pode gostar