Você está na página 1de 51

Métodos Estatísticos Aplicados à Economia I

Aula 3

Karina Y. Yaginuma

Departamento de Estatística
Universidade Federal de Fluminense

30 de agosto de 2017

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas Resumo

Tabelas e Gráfico.
Muitas vezes queremos resumir ainda mais estes dados,
apresentando um ou alguns valores que sejam representativos.
Quando usamos apenas um valor obtemos uma redução
drástica dos dados.
Medidas de Posição e Medidas de dispersão.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição

Média aritmética: é a soma das observações divididas pelo


número de observações.
Exemplo: Considere o conjunto de dados

3+4+7+8+8
3, 4, 7, 8, 8 ⇒ = 6.
5
Formalmente, se x1 , . . . , xn são as n observações (distintos ou
não) da variável X, a média de X é dada por
n
x1 + · · · + xn 1X
x̄ = = xi .
n n i=1

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição

Se tivermos n observações de X, nas quais n1 são iguais a x1 , . . . ,


nk são iguais a xk , então a média de X é dada por
k k
n1 x1 + · · · + nk xk 1X X
x̄ = = ni xi ou x̄ = fi xi ,
n n i=1 i=1

ni
já que fi = n.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição

Posso tirar a média das variáveis salário pela tabela de frequência?

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição

Posso tirar a média das variáveis salário pela tabela de frequência?

Não, pois perdemos informações sobre os valores indivívuais de


cada funcionário.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição

Mediana: é a realização que ocupa a posição central dos dados


ordenados em ordem crescente.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição

Mediana: é a realização que ocupa a posição central dos dados


ordenados em ordem crescente.
Exemplo:
3, 4, 7, 8, 8 ⇒ a mediana é o valor 7.

Se o número for par, usa-se como mediana a média das duas


observações centrais.

3, 4, 7, 8, 8, 9 ⇒ a mediana será (7 + 8)/2 = 7.5

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição

Considere as observações ordenadas em ordem crescente:

x(1) ≤ x(2) ≤ · · · ≤ x(n−1) ≤ x(n) .

As observações ordenadas são chamadas de estatística de ordem.


Com esta notação, a mediana da variável X pode ser definida como
(
x( n+1 ) , se n ímpar,
mediana(x) = 2
x( n ) +x( n +1)
2
2
2
se n par.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição
Da mesma forma, conseguimos calcular a mediana através da tabela
de distribuição de frequência no caso em que os dados não estão
agrupados em classes.

Note que, n = 20 par, então


x(10) + x(11) 2+2
mediana = = =2
2 2
Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3
Medidas de posição
Moda: é definida como a realização mais frequente do conjunto
de dados.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de posição
Moda: é definida como a realização mais frequente do conjunto
de dados.
Exemplo 1:
3, 4, 7, 8, 8 ⇒ a moda é o valor 8.
Exemplo 2:

A moda da variável número de filhos de empregados casados é


2.
Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3
Medidas de dispersão

O resumo de um conjunto de dados por uma única medida


representativa de posição central esconde toda a informação
sobre a variabilidade das observações.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de dispersão

O resumo de um conjunto de dados por uma única medida


representativa de posição central esconde toda a informação
sobre a variabilidade das observações.

Exemplo: Suponha que cinco grupos de alunos submeteram-se


a um teste, obtendo as seguintes notas:
Grupo A (variável X): 3, 4, 5, 6, 7
Grupo B (variável Y ): 1, 3, 5, 7, 9
Grupo C (variável Z): 5, 5, 5, 5, 5
Grupo D (variável W ): 3, 5, 5, 7
Grupo E (variável V ): 3, 5, 5, 6, 6

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Exemplo - Continuação

Calculando a média e mediana de cada grupo obtemos o seguinte


resultado:

Variável Média Mediana


X 5.0 5.0
Y 5.0 5.0
Z 5.0 5.0
W 5.0 5.0
V 5.0 5.0

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Exemplo - Continuação

Calculando a média e mediana de cada grupo obtemos o seguinte


resultado:

Variável Média Mediana


X 5.0 5.0
Y 5.0 5.0
Z 5.0 5.0
W 5.0 5.0
V 5.0 5.0

A identificação de cada grupo por sua média (mediana) nada informa


sobre suas diferentes variabilidade.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de dispersão

Notamos a conveniência de serem usadas medidas que


sumarizem a variabilidade de um conjunto de observações.
Permitindo a comparação de diferentes conjuntos de valores,
como os dados do exemplo.
Duas medidas de dispersão bastante usadas são desvio médio
e variância.
O princípio básico é analisar os desvios das observações em
relação à média dessas observações.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de dispersão

Desvio médio:
n
1X
dm(x) = |xi − x̄|.
n i=1

Variância:
n
1X
var(x) = (xi − x̄)2 .
n i=1

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de dispersão
Exemplo: Considere o exemplo anterior. Para o grupo A temos
|3 − 5| + |4 − 5| + |5 − 5| + |6 − 5| + |7 − 5| 6
dm(x) = = = 1.2,
5 5
(3 − 5)2 + (4 − 5)2 + (5 − 5)2 + (6 − 5)2 + (7 − 5)2 10
var(x) = = = 2.0.
5 5

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de dispersão
Exemplo: Considere o exemplo anterior. Para o grupo A temos
|3 − 5| + |4 − 5| + |5 − 5| + |6 − 5| + |7 − 5| 6
dm(x) = = = 1.2,
5 5
(3 − 5)2 + (4 − 5)2 + (5 − 5)2 + (6 − 5)2 + (7 − 5)2 10
var(x) = = = 2.0.
5 5

Enquanto para o grupo D temos


|3 − 5| + |5 − 5| + |5 − 5| + |7 − 5| 4
dm(x) = = = 1.0,
4 4
(3 − 5)2 + (5 − 5)2 + (5 − 5)2 + (7 − 5)2 8
var(x) = = = 2.0.
4 4

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Medidas de dispersão
Exemplo: Considere o exemplo anterior. Para o grupo A temos
|3 − 5| + |4 − 5| + |5 − 5| + |6 − 5| + |7 − 5| 6
dm(x) = = = 1.2,
5 5
(3 − 5)2 + (4 − 5)2 + (5 − 5)2 + (6 − 5)2 + (7 − 5)2 10
var(x) = = = 2.0.
5 5

Enquanto para o grupo D temos


|3 − 5| + |5 − 5| + |5 − 5| + |7 − 5| 4
dm(x) = = = 1.0,
4 4
(3 − 5)2 + (5 − 5)2 + (5 − 5)2 + (7 − 5)2 8
var(x) = = = 2.0.
4 4

Podemos dizer que segundo o desvio médio, o grupo D é mais


homogêneo que A. Enquanto ambos são igualmente homogêneos,
segundo a variância.
Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3
Medidas de dispersão

Sendo a variância uma medida de dimensão igual ao quadrado


da dimensão dos dados, pode causar problemas de
interpretação.
Costuma-se usar o desvio padrão, que é definido como a raiz
quadrada da variância.
p
dp(x) = var(x).

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Coeficiente de variação

Diferentemente das medidas de dispersão anteriormente


apresentadas, o coeficiente de variação é uma medida relativa
de variação que é sempre expressa sob a forma de
porcentagem, e não em termos das unidades dos dados.

Medida adimensional.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Coeficiente de variação

Definida por

dp(x)
cv(x) = × 100.

Mede a dispersão dos dados em relação à média.


Fornece uma medida de homogeneidade dos dados.
Quanto menor o coeficiente de variação, maior a
homogeneidade.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Coeficiente de variação

O coeficiente de variação é bastante útil quando se comparam


dois ou mais conjuntos de dados que são mensurados em
unidades diferentes.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Coeficiente de variação

O coeficiente de variação é bastante útil quando se comparam


dois ou mais conjuntos de dados que são mensurados em
unidades diferentes.
Exemplo: Considere a seguinte tabela
Média Desvio padrão
Altura 1.143m 0.063m
Peso 50kg 6 kg

De que modo podemos comparar a variação do peso e a


variação da altura?

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Coeficiente de variação

Calculando o coeficiente de variação, temos que

Média Desvio padrão CV


Altura 1.143m 0.063m 5.5%
Peso 50kg 6 kg 12%

Neste grupo de indivíduos, os pesos apresentam maior dispersão.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Análise de simetria

Tanto a média como o desvio padrão podem não ser medidas


adequadas para representar um conjunto de valores, pois:
São afetados por valores extremos.
Apenas com estes dois valores não temos ideia da simetria ou
assimetria da distribuição dos dados.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Análise de simetria

Para contornar estes fatos, outras medidas precisam ser


consideradas.
Vimos que a mediana é um valor que deixa metade dos dados
abaixo dela e metade acima.
De modo geral, podemos definir uma medida, chamada quantil
de ordem p, indicada por q(p), 0 < p < 1, tal que 100p% das
observações sejam menores do que q(p).

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Análise de simetria

Em particular, temos
q(0, 25) = q1 : 1o Quartil
q(0, 50) = q2 : Mediana = 2o Quartil
q(0, 75) = q3 : 3o Quartil

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Exemplo

Suponha que temos 9 observações de uma variável X:

15, 5, 3, 8, 10, 2, 7, 11, 12.

Ordenando os valores teremos

2 < 3 < 5 < 7 < 8 < 10 < 11 < 12 < 15.

Vamos calcular o 1o Quartil, a mediada e o 3o Quartil.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Exemplo

Para calcular a posição do quartil de ordem p, realizamos o seguinte


calculo:
Posição do p-quartil = p × (n + 1),

onde n é o número de observações.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Análise de simetria

Suponha que a distribuição dos dados seja aproximadamente


simétrica. Então, temos que
q2 − x(1) ≈ x(n) − q2 ;
q2 − q1 ≈ q3 − q2 ;
q1 − x(1) ≈ x(n) − q3 .

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Análise de simetria

Suponha que a distribuição dos dados seja aproximadamente


simétrica. Então, temos que
q2 − x(1) ≈ x(n) − q2 ;
q2 − q1 ≈ q3 − q2 ;
q1 − x(1) ≈ x(n) − q3 .

Suponha que a distribuição dos dados seja assimétrica à


esquerda. Então, temos que
q2 − x(1) > x(n) − q2 ;
q2 − q1 > q3 − q2 ;
q1 − x(1) > x(n) − q3 .

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Análise de simetria

Suponha que a distribuição dos dados seja assimétrica à direita.


Então, temos que
q2 − x(1) < x(n) − q2 ;
q2 − q1 < q3 − q2 ;
q1 − x(1) < x(n) − q3 .

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Análise de simetria

Suponha que a distribuição dos dados seja assimétrica à direita.


Então, temos que
q2 − x(1) < x(n) − q2 ;
q2 − q1 < q3 − q2 ;
q1 − x(1) < x(n) − q3 .

Essa informação pode ser expressa através de um gráfico,


conhecido como Box Plot.
Descreve várias características dos dados: centro, dispersão,
simetria e valores atípicos.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plot
É um gráfico de um conjunto de dados que consiste em uma linha
que se estende do valor mínimo ao valor máximo, em uma caixa com
linhas traçadas no primeiro quartil, na mediana e no terceiro quartil.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plot
É um gráfico de um conjunto de dados que consiste em uma linha
que se estende do valor mínimo ao valor máximo, em uma caixa com
linhas traçadas no primeiro quartil, na mediana e no terceiro quartil.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plot

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plot e Histograma

Vejamos a seguir como os box plots se relacionam com os


histogramas na visualização da distribuição dos dados.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plot e Histograma

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plot e Histograma

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plot e Histograma

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Outliers - Box Plot

Podemos inlcuir no Box Plot informações sobre possíveis


outliers.
Nesta contrução, dizemos que um valor é um outlier, se o valor
observado supera
q3 + 1.5 × dq

ou se é inferior a
q1 − 1.5 × dq ,

onde dq = q3 − q1 .

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Outliers - Box Plot

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plots Comparativos

Box Plots comparativos (lado a lado).


Forma de revelar semelhanças e diferenças entre dois conjuntos
de dados consistindo de observações da mesma variável.
Importante: usar a mesma escala para que possa ser feita
comparações corretas.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Exemplo

Os dados a seguir correspondem aos recordes de atletas de 10


países na Olimpíada de Los Angeles em 1984 em algumas provas
de atletismo. Usando o box plot compare o desempenho entre sexo.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Box Plots Comparativos - Exemplo

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Exercício I

Considere os dados da tabela 2.1, para as variáveis idade e salário.


1 Faça o calculo para os primeiros 10 funcionários das medidas:
média, mediana, variância e desvio padrão.
2 Esboçe o BoxPlot da variável idade.

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3


Exercício II

O gerente de operações de um serviço de entregas de


encomendas está avaliando a compra de uma nova frota de
caminhões. Quando as encomendas são carregadas nos
caminhões, no preparo para a entrega, precisamos considerar
dois importantes parâmetros: o peso (em quilos) e o volume (em
metros cúbicos) de cada um dos itens. O gerente de operações
extrai uma amostra de 200 pacotes e descobre que
a média do peso é de 26 quilos, com um desvio padrão de 3.9
quilos
e a média do volume é de 8.8 metros cúbicos, com um desvio
padrão de 2.2 metros cúbicos

De que modo podem ser comparadas a variação do peso e a


variação do volume?

Karina Y. Yaginuma Métodos Estatísticos Aplicados à Economia I Aula 3

Você também pode gostar