Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 03
Aula 03
Estatstica descritiva
Recapitulando: As trs principais caractersticas de um conjunto de dados so:
Um valor representativo do conjunto de dados: uma mdia (Medidas de Tendncia Central) Uma medida de disperso ou variao. A natureza ou forma da distribuio dos dados: sino, uniforme, assimtrica,... (Tabelas de frequncia e histogramas)
Medidas de Variao
Determina a caracterstica de variao de um conjunto de dados
Amplitude Desvio Desvio mdio ou desvio absoluto Desvio padro Varincia
Amplitude
Diferena entre o maior e o menor valor
Subtraia o menor valor do maior Amplitude = 1,88 1,60 = 0,28 m
Anlise Estatstica da Turma de Prob. e Eventos x Aluno 1 1,72 Aluno 2 1,60 Aluno 3 1,74 Aluno 4 1,88 Aluno 5 1,82 Aluno 6 1,75 Aluno 7 1,82 Aluno 8 1,75 Aluno 9 1,73 Aluno 10 1,75 Aluno 11 1,80 Aluno 12 1,75 Aluno 13 1,73 Aluno 14 1,84 Aluno 15 1,76 Aluno 16 1,78 Aluno 17 1,75 Aluno 18 1,69 31,66 Soma 1,759 Mdia 0,28 Amplitude
xx
xx
n
Anlise Estatstica da Turma de Prob. e Estatstica Eventos x x-x |x-x| Aluno 1 1,72 -0,04 0,04 Aluno 2 1,60 -0,16 0,16 Aluno 3 1,74 -0,02 0,02 Aluno 4 1,88 0,12 0,12 Aluno 5 1,82 0,06 0,06 Aluno 6 1,75 -0,01 0,01 Aluno 7 1,82 0,06 0,06 Aluno 8 1,75 -0,01 0,01 Aluno 9 1,73 -0,03 0,03 Aluno 10 1,75 -0,01 0,01 Aluno 11 1,80 0,04 0,04 Aluno 12 1,75 -0,01 0,01 Aluno 13 1,73 -0,03 0,03 Aluno 14 1,84 0,08 0,08 Aluno 15 1,76 0,00 0,00 Aluno 16 1,78 0,02 0,02 Aluno 17 1,75 -0,01 0,01 Aluno 18 1,69 -0,07 0,07 Soma Desvio Mdia desvios mdio 1,759 0,000 0,043
Desvio Padro
Desvio padro: medida da variao dos valores em relao mdia. Ex.: Calcular o desvio padro do conjunto de dados ao lado.
Passo 1: Calcule a mdia; Passo 2: Calcule o DESVIO de cada medida sobre a mdia
Desvio =
xx
Anlise Estatstica da Turma de Prob. e Estatstica x-x Eventos x Aluno 1 1,72 -0,04 Aluno 2 1,60 -0,16 Aluno 3 1,74 -0,02 Aluno 4 1,88 0,12 Aluno 5 1,82 0,06 Aluno 6 1,75 -0,01 Aluno 7 1,82 0,06 Aluno 8 1,75 -0,01 Aluno 9 1,73 -0,03 Aluno 10 1,75 -0,01 Aluno 11 1,80 0,04 Aluno 12 1,75 -0,01 Aluno 13 1,73 -0,03 Aluno 14 1,84 0,08 Aluno 15 1,76 0,00 Aluno 16 1,78 0,02 Aluno 17 1,75 -0,01 Aluno 18 1,69 -0,07 31,66 0,00 Soma 1,759 ------Mdia
Desvio Padro
Calcule o desvio padro do conjunto de dados ao lado.
Passo 3: Eleve ao quadrado cada uma das diferenas; Passo 4: Some todos os quadrados obtidos
Anlise Estatstica da Turma de Prob. e Estatstica x-x (x-x) 2 Eventos x Aluno 1 1,72 -0,04 0,0015 Aluno 2 1,60 -0,16 0,0252 Aluno 3 1,74 -0,02 0,0004 Aluno 4 1,88 0,12 0,0147 Aluno 5 1,82 0,06 0,0037 Aluno 6 1,75 -0,01 0,0001 Aluno 7 1,82 0,06 0,0037 Aluno 8 1,75 -0,01 0,0001 Aluno 9 1,73 -0,03 0,0008 Aluno 10 1,75 -0,01 0,0001 Aluno 11 1,80 0,04 0,0017 Aluno 12 1,75 -0,01 0,0001 Aluno 13 1,73 -0,03 0,0008 Aluno 14 1,84 0,08 0,0066 Aluno 15 1,76 0,00 0,0000 Aluno 16 1,78 0,02 0,0004 Aluno 17 1,75 -0,01 0,0001 Aluno 18 1,69 -0,07 0,0047 31,66 0,00 0,065 Soma
(x x)
Desvio Padro
Passo 5: Divida o total por (n-1), onde n o nmero de dados coletados (amostra); Passo 6: Extraia a raiz quadrada do resultado anterior
2 ( x x )
n 1
Anlise Estatstica da Turma de Prob. e Estatstica x-x (x-x) 2 Eventos x Aluno 1 1,72 -0,04 0,0015 Aluno 2 1,60 -0,16 0,0252 Aluno 3 1,74 -0,02 0,0004 Aluno 4 1,88 0,12 0,0147 Aluno 5 1,82 0,06 0,0037 Aluno 6 1,75 -0,01 0,0001 Aluno 7 1,82 0,06 0,0037 Aluno 8 1,75 -0,01 0,0001 Aluno 9 1,73 -0,03 0,0008 Aluno 10 1,75 -0,01 0,0001 Aluno 11 1,80 0,04 0,0017 Aluno 12 1,75 -0,01 0,0001 Aluno 13 1,73 -0,03 0,0008 Aluno 14 1,84 0,08 0,0066 Aluno 15 1,76 0,00 0,0000 Aluno 16 1,78 0,02 0,0004 Aluno 17 1,75 -0,01 0,0001 Aluno 18 1,69 -0,07 0,0047 31,66 0,00 0,065 Soma 1,759 ------------Mdia
Desvio Padro
(x x) = n 1
2
0,062
Desvio Padro
De uma amostra
s=
(x x)
n 1
Observao:
A unidade do desvio padro a mesma unidade dos valores originais, ou conjunto de dados.
De uma populao
=
2 ( ) x x
n(n 1)
Vantagens e desvantagens: Mais conveniente para uso com nmeros extensos e com grandes conjuntos de valores Maior facilidade de uso com calculadoras e computadores (apenas trs registros: n, x e x2) Elimina erros de arredondamento No evidencia o conceito de desvio mdio da frmula tradicional
Varincia
Desvio padro ao quadrado
s2 varincia amostral 2 varincia populacional
(x x) = n 1
N
Observao:
A unidade da varincia a mesma unidade do conjunto de dados, elevada ao quadrado.
(x x) =
Consideraes finais
Arredondamento:
Tomar uma casa decimal a mais em relao s que constam dos dados originais. Arredondar apenas o resultado final e no os resultados intermedirios. Se necessitarmos arredondar os resultados intermedirios, acrescente duas casas decimal a mais em relao s que constam dos dados originais
Teorema de Tchebichev
A proporo de qualquer conjunto de dados a menos de K desviospadro a contar da mdia sempre ao menos 1-1/k2, onde k um nmero positivo maior do que 1. Para k=2 e k=3, temos:
Ao menos (75%) de todos os valores esto no intervalo de 2 desviospadro em torno da mdia Ao menos 8/9 (89%) de todos os valores esto no intervalo de 3 desviospadro em torno da mdia
Teorema de Tchebichev
A frao (porcentagem) de QUALQUER conjunto de dados, a menos de K desvios a contar da mdia, SEMPRE ao menos:
1 - 1/ K2
onde K>1
[x 2s, x + 2s]
[ x 3s, x + 3s]
Teorema de Tchebichev
Barbeadores eltricos sem fio da marca XYZ tm vida mdia de 8,0 anos, com desvio padro de 3,0 anos.
Tchebichev tambm til para identificar valores estranhos em um conjunto de dados: aqueles que ficam de fora do intervalo !
Identificando outliers
Outliers so valores estranhos que se localizam muito distantes da mdia Por isso, as estatsticas descritivas so, usualmente, muito influenciadas (contaminadas) por eles Podem se originar em erros de coleta OU em desvios de processo Esses outliers devem ser muito bem analisados antes de um possvel descarte!
Identificando outliers
Tchebichev pode nos ajudar na identificao de outliers Valores fora do intervalo de +/- 2s devem ser analisados para um possvel descarte
[x 2s, x + 2s]
s CV = x
(amostra)
CV =
(populao )
O Coeficiente de Variao til para compararmos a variabilidade (disperso) de dois conjuntos de dados de ordem de grandezas diferentes
Medidas de disperso
Seja o seguinte conjunto de preos de geladeiras em 7 lojas distintas
750,00 800,00 790,00 810,00 820,00 760,00 780,00
x = 787,14
s = 25,63
x = 49,14
s = 4,81
Medidas de disperso
Uma vez que, em geral, uma geladeira custa bem mais que um liquidificador, a tendncia que o desvio-padro da geladeira seja tambm maior! O coeficiente de variao uma medida adimensional que normaliza o desvio padro em relao mdia
CV geladeira =
CVliquidific ador =
Com o CV podemos concluir que os preos da geladeira tm uma menor variabilidade que os do liquidificador
Dj = Q3 - Q1 = P0,75 - P0,25
Se alterarmos significativamente o ltimo valor: 05; 07; 08; 10; 12; 15; 18; 20; 28; 35; 40; 200 Dj = 28 - 10 = 18 !!!
Escore Padronizado
xx z= s
z=
Nmero de desvios-padro pelo qual um valor dista da mdia (para mais ou para menos)
Exerccio
As alturas da populao de homens adultos tm mdia =1,752m, desvio padro =0,071m e distribuio grfica em forma de sino (normal). O jogador de basquete Michael Jordan, que mede 1,98m, pode ser considerado excepcionalmente alto? Determine o escore padro z para ele.
Resoluo
Calcula-se o escore z conforme segue: