Você está na página 1de 34

UNIVERSIDADE FEDERAL DE PERNAMBUCO

CENTRO ACADÊMICO DO AGRESTE


CURSO DE ENGENHARIA CIVIL
ESTATÍSTICA

Aula 04 - Estatística Descritiva

Prof. Artur Paiva


17/04/2015
Estatística Descritiva
Tipo de Medidas Descritivas

Slide 2   Prof. Artur Paiva


Estatística Descritiva
Medidas de Posição
- Média aritmética
- Média para dados agrupados
- Mediana
- Moda
- Média geométrica
- Percentil, decil, quartil
- Escore Z
Slide 3   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão

- Amplitude
- Desvio médio
- Variância
- Desvio padrão
- Coeficiente de variação

Slide 4   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão

Medidas de tendência central fornecem um resumo


parcial das informações de um conjunto de dados. A
necessidade de uma medida de variação é aparente, para
que nos permita, por exemplo, comparar conjuntos
diferentes de valores. Algumas característica desta
medida devem ser atendidos como veremos a seguir.

Slide 5   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão
Para um conjunto de dados, uma única medida
representativa da posição central, esconde toda a
informação sobre a variabilidade dos dados. Veja, por
exemplo, os seguintes dados:

• Variável A : 8, 8, 9, 10, 11, 12, 12


• Variável B : 5, 6, 8, 10, 12, 14, 15
• Variável C : 1, 2, 5, 10, 15, 18, 19

Média; Mediana; Moda?? 10; 10; 8 e 12(A) e Sem Moda (B e C)


Slide 6   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão
• Variável A : 8, 8, 9, 10, 11, 12, 12 (Méd 10, Md 10, Mo 8 e 12)
• Variável B : 5, 6, 8, 10, 12, 14, 15 (Méd 10, Md 10, Mo não tem)
• Variável C : 1, 2, 5, 10, 15, 18, 19 (Méd 10, Md 10, Mo não tem)

As medidas de tendência central pouco ou nada informam a


respeito da dispersão dos dados.
O conceito de medida de dispersão é relativamente difícil. O
quanto informativo é dizer que as três amostragens possuem
dispersão 4, 10 e 18?

Slide 7   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão
• Variável D : 8, 9, 10, 10, 10, 11, 12 (Méd 10, Md 10, Mo 10)
• Variável E : 5, 7, 9, 10, 11, 13, 15 (Méd 10, Md 10, Mo não tem)
• Variável F : 1, 5, 8, 10, 12, 15, 19 (Méd 10, Md 10, Mo não tem)

Estes três conjuntos de dados também possuem dispersão


máxima igual a 4, 10 e 18, respectivamente. As amostras A, B e C
apresentam um maior número de observações mais distantes da
média, enquanto nas amostras D, E e F ocorre um maior número de
observações concentradas em torno da média. Torna-se interessante
que haja uma definição a qual use todas as observações e que seja
um pequeno valor quando as observações se aproximam da média e
grande quando estas são espaçadas.
Slide 8   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão

Na prática, existem várias medidas que expressam a


variabilidade de um conjunto de dados, sendo que as
mais utilizadas baseiam-se na ideia que consiste em
verificar a distância de cada valor observado em relação
à média.

Para uma sequência de valores, a Amplitude será a


diferença entre o maior e o menor valor.

Slide 9   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão

A Amplitude é a medida de dispersão mais simples.


Um problema é que a amplitude depende apenas dos
valores extremos.

• Variável G : 2, 9, 10, 10, 10, 11, 12 (Amplitude 10)


• Variável H : 5, 7, 9, 10, 11, 13, 15 (Amplitude 10)
• Variável I : 5, 5, 8, 10, 12, 15, 15 (Amplitude 10)

Slide 10   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão
O critério geralmente utilizado é aquele que mede a concentração dos dados em
torno da média, e algumas medidas são as mais usadas: desvio médio,
variância, desvio padrão e Coeficiente de Variação.
Ex: 3, 4, 5, 6, 7 (média 5), os desvios xi-x, são: -2, -1, 0, 1 ,2.
1, 3, 5, 7, 9 (média 5), os desvios xi-x, são: -4, -2, 0, 2, 4.
É fácil observar que a soma dos desvios é igual a zero, o que torna inviável esta
medida. As opções são:
a) Considerar o total dos desvios em valor absoluto (módulo) ou,
b) Considerar o total dos quadrados dos desvios. Assim teríamos:
Para a amostra: 3, 4, 5, 6, 7
5

 ni x i = x2 + 1 + 0 + 1 + 2 = 6 (a)
i 1
5
² = 4 + 1 + 0 + 1 + 4 = 10 (b)
 ni  x i x 
i 1
Slide 11   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão – Desvio médio
O desvio médio para uma sequência com n elementos e
média μ será:

Ex: 3, 4, 5, 6, 7
DM = 1,2
1, 3, 5, 7, 9
DM = 2,4
Baseado nos dados, pode-se dizer que a primeira amostra é mais
homogênea.

Slide 12   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão – Variância

A medida que contempla os aspectos apresentados e que é


mais utilizada é a Variância. A variância é representada
por dois símbolos: s² (letra grega sigma) para população
e s² para uma amostra.
A variância é uma medida que expressa um desvio
quadrático médio. A unidade da variância é portanto o
quadrado dos dados originais. Ex: para dados expressos
em centímetros a variância será expressa em centímetros
quadrados.
Slide 13   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão – Variância

A variância será determinada pela equação abaixo:

Onde:
N = número de elementos existente na população
μ = média da população
σ2 = variância da população

Obs.: A variância pode ser representado por “Var(X)”.


Slide 14   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão – Variância amostral
A variância da amostra será determinada pela equação
abaixo:

Onde:
s2 = variância amostral
n = número de elementos da amostra em estudo
x = média da amostra

O denominador n-1 tem o propósito de tornar a variância da amostra a


estimativa da variância da população. (n-1) é conhecido como grau de
liberdade e refere-se ao número de somas independentes lineares numa
soma de quadrados.
Slide 15   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão – Variância amostral
Para as amostras:
(1) 3, 4, 5, 6, 7 e
(2) 1, 3, 5, 7, 9
As variâncias seriam:
s1² = [(3-5)²+ (4-5) ² + (5-5) ²+ (6-5) ²+ (7-5) ²]/4 s1² =2,5

s2² = [(1-5) ²+ (3-5) ²+ (5-5) ²+ (7-5) ²+ (9-5) ²]/4 s2² =10

A amostra (1) é mais homogênea.

Slide 16   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão – Variância para dados
agrupados
A variância será determinada pela equação abaixo:

Onde:
N = número de elementos existente na população
n = número de elementos da amostra em estudo
μ = média da população x = média da amostra
σ2 = variância da população s2 = variância amostral
fi = frequência de cada um dos elementos Xi
Slide 17 Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão – Variância para dados
agrupados

Média, DM(x) e Var (x)?

Média = (0*4)+(1*5)+(2*7)+(3*3)+(5*1))/20 = 1,65

DM(x) = [4*(0-1,65) + 5* (1-1,65) + 7* (2-1,65) + 3* (3-1,65) + 1* (5-1,65)]/20


= 0,98

Var(x) s² = [4*(-1,65)² + 5* (-0,65)² + 7* (0,35)² + 3* (1,35)² + 1* (3,35)²]/19 =


1,6
Slide 18 Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão – Variância para dados
agrupados

Desenvolvendo as fórmulas anteriores é possível chegar


aos seguintes resultados.

Essas fórmulas facilitarão bastante o cálculo manual.


Obs.: Para o cálculo da variância, quando os dados estão agrupados em classes,
basta substituir os verdadeiros valores observados Xi pelo ponto médio da i-
ésima classe.
Slide 19   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão – Desvio-padrão

O desvio-padrão será dado pela raiz quadrada da


variância.

O resultado será válido também para o desvio-padrão amostral.


O uso do desvio padrão como medida de variabilidade é preferível pelo fato de
ser expresso na mesma unidade de medida dos valores observados, pois a
variância pode causar problemas de interpretação por ser expressa em termos
quadráticos.
Obs.: O desvio-padrão pode ser representado por “DP(X)”.
Slide 20   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão – Desvio-padrão

Para as amostras:
(1) 3, 4, 5, 6, 7 e
(2) 1, 3, 5, 7, 9

s1= =1,58
2,5

s2= 10
=3,16

Slide 21   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão –
Variância amostral x Variância da população

Na prática o valor de μ raramente é conhecido. Por isso, o


valor x é utilizado como substituto. No entanto, as
observações Xi, tendem a ser mais próximas do seu
valor, do que da média populacional μ. Para compensar
isso, usa-se n-1 como divisor em vez de n. A utilização
de n traria distorções na medida de variabilidade.

Slide 22 Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão
Exemplo: Considere as forças de ruptura obtidas de duas amostras
de seis corpos de prova de concreto (em psi):
Amostra 1: 230; 250; 245; 258; 265; 240
Amostra 2: 190; 228; 305; 240; 265; 260
Qual são as médias das medidas observadas?
Med = 248 psi
22
Amostras

Amostra 2
Amostras

11 Amostra 11
Amostra
Média
00
180
180 200
200 220
220 240
240 260
260 280
280 300
300 320
Forçade
Força deruptura
ruptura(psi)
(psi)

Slide 23   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão
Amostra 1: 230; 250; 245; 258; 265; 240
Amostra 2: 190; 228; 305; 240; 265; 260
Qual são as variâncias e desvio-padrão das medidas observadas?
Amostra 1: s² = 1025,15 psi²; s= 32,02 psi
Amostra 2: s² = 1502,00 psi²; s= 38,76 psi
2

Amostra 2
Amostras

1
Amostra 1
Média
0
180 200 220 240 260 280 300 320
Força de ruptura (psi)

Diagrama de pontos
Slide 24   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão
Exemplo: Calcule a variância e o desvio-padrão para a seguinte
distribuição amostral.

Solução: Para calcular a variância amostral será utilizado o


resultado a seguir, já conhecido.

A tabela será montada de forma a facilitar os cálculos e as substituições na


fórmula.
Slide 25   Prof. Artur Paiva
Estatística Descritiva
Medidas de Dispersão
Exemplo: Calcule a variância e o desvio-padrão para a seguinte
distribuição amostral.
xi 5 7 8 9 11 Soma
fi 2 3 4 5 2 16
xi.fi 10 21 32 45 22 130
xi².fi 50 147 256 405 242 1100

Slide 26 Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão
Exemplo: Calcule a média e o desvio-padrão para a seguinte
distribuição amostral.

Solução:

Slide 27   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão
Exemplo: Calcule a variância e o desvio-padrão para a seguinte
distribuição amostral.

Solução (continuação):

Slide 28   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão – Coeficiente de
Variação
O coeficiente de variação (CV) é uma medida relativa de
variabilidade. (expresso em porcentagem (%))

A utilidade imediata do coeficiente de variação é a possibilidade de avaliar o


grau de representatividade da média. Esta medida também é bastante útil na
comparação entre conjuntos de dados, em relação à variabilidade, ainda que
as unidades de medida nos conjuntos de dados sejam distintas.
Um critério de decisão sobre a representatividade ou não da média, pode ser dada
pela seguinte linha de corte:
Se CV ≥ 50%, a média não é representativa.
Se CV < 50%, a média é representativa.
Slide 29   Prof. Artur Paiva
Estatística Descritiva
Medidas de Posição, Dispersão – Exercício
Acredita-se que a resistência à tensão da borracha siliconizada seja uma função
da temperatura de cura. Um estudo foi realizado, no qual amostras de 12
espécimes de borracha foram preparadas usando temperaturas de cura de
20ºC e 45ºC. Os dados mostram os valores de resistência à tensão, em
megapascals:
20ºC: 2,07; 2,14; 2,22; 2,03; 2,21; 2,03; 2,05; 2,18; 2,09; 2,14; 2,11; 2,02
45ºC: 2,52; 2,15; 2,49; 2,03; 2,37; 2,05; 1,99; 2,42; 2,08; 2,42; 2,29; 2,01

a) Mostre o diagrama de pontos dos valores da resistência à tensão em


temperaturas baixas e altas.
b) Calcule a média amostral da resistência à tensão em ambas as amostras.
c) A temperatura de cura parece ter influência na resistência à tensão baseando-se
no gráfico? Comente.
d) Calcule os desvios-padrões. O aumento nas temperaturas parece influenciar a
variabilidade da resistência à tensão? Explique.
Slide 30   Prof. Artur Paiva
Estatística Descritiva
Medidas de Posição, Dispersão – Exercício
As emissões de hidrocarboneto em velocidade lenta, em partes por milhão
(ppm), de automóveis de 1980 e 1990 são dadas pro 20 carros selecionados
aleatoriamente:
Modelos de 1980: 141; 359; 247; 940; 882; 494; 306; 210; 105; 880; 200; 223;
188; 940; 241; 190; 300; 435; 241; 380
Modelos de 1990: 140; 160; 20; 20; 223; 60; 20; 95; 360; 70; 220; 400; 217; 58;
235; 380; 200; 175; 85; 65

a) Construa um diagrama de pontos sobrepostos.


b) Calcule as médias amostrais para os dois anos e sobreponha as duas médias no
gráfico.
c) Comente o que o gráfico indica em relação às mudanças de emissões da
população de canos de 1980 para a de 1990. Use os conceitos de
variabilidade em seus comentários.

Slide 31   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão – Exercício
Calcule a média, o desvio-padrão, a variância, a mediana e a moda
amostrais aproximadas para os dados na seguinte distribuição de
frequências:
Intervalo de Classe Frequência
-10 – 0 3
0 – 10 8
10 – 20 12
20 – 30 16
30 – 40 9
40 – 50 4
50 – 60 2

Med = 22,41; Var(X) = 208,25; DP(X) = 14,43 Mo = 23,64

Slide 32   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão – Exercício
Um livro com 50 páginas apresentou um número de erros de
impressão por página conforme tabela:
1) Qual o número médio de erros por página?
2) Qual o número mediano de erros por página?
3) Qual o número modal de erros por página?
4) Qual o desvio padrão do número de erros por página?
Erros Nº Páginas
0 25
1 20
2 3
Med = 0,66 erros;
3 1
Md = 0,50 erros;
4 1 Mo = 0,00 erros;
Total 50 DP(X) = 0,84 erros

Slide 33   Prof. Artur Paiva


Estatística Descritiva
Medidas de Dispersão – Exercício
Dada a tabela abaixo, calcule:

33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97

Desvio médio, Variância, Desvio padrão, e Coeficiente de variação

Slide 34   Prof. Artur Paiva

Você também pode gostar