Escolar Documentos
Profissional Documentos
Cultura Documentos
Esttistica Descrita 1
Esttistica Descrita 1
=
=
k
i
i
f n
1
Escrevendo a frmula anterior como
k
k
x
n
f
x
n
f
x
n
f
x + + + = !
2
2
1
1
pode ser observado que a mdia amostral corresponde mdia ponderada dos valores
distintos de X na amostra, onde o peso dado a cada valor x
i
nesse caso corresponde
proporo dos n valores iguais a x
i
, com i = 1 a k.
exemplo:
a seguinte distribuio de frequncia d as idades de jovens em determinada lanchonete a
determinada hora.
Idade Frequncia
15 2
16 5
17 11
18 9
19 14
20 13
encontre a mdia aritmtica da idade dos indivduos acima.
soluo:
= x (2.15 +5.16 +11.17 +9.18 +14.19 +13.20)/54 18,24.
OBS.: se a tabela for organizada em classes de valores da varivel, para o clculo da
mdia devemos substituir cada classe pelo seu ponto mdio (mdia aritmtica do
limite superior e inferior da classe em questo) e calcular a mdia conforme
discutido acima.
! Mediana amostral
Outra estatstica usada para indicar o centro de um conjunto de dados a mediana
amostral, que pode ser definida, de maneira simplificada, como o valor intermedirio do
conjunto de dados, cujos n valores so dispostos em ordem crescente.
Se n for mpar, a mediana ser o valor que ocupa a posio (n +1)/2; se n for par,
a mediana ser a mdia aritmtica dos valores ocupando as posies n/2 e n/2 +1.
exemplo:
encontre a mediana para os dados apresentados acima.
INF 162 Prof. Luiz Alexandre Peternelli
20
soluo:
j que temos 54 observaes, segue que a mediana amostral ser a media dos valores
ocupando as posies 27 e 28, quando essas 54 observaes so organizadas em ordem
crescente. Portanto a mediana ser o valor 18,5.
OBS.: a escolha entre media e mediana depende do tipo de informao o pesquisador
tenta obter dos dados. A media afetada por valores extremos ocorrendo na
distribuio, enquanto a mediana faz uso de apenas um ou dois valores centrais,
no sendo, portanto, afetada por valores extremos.
! Moda amostral
Outra estatstica que tem sido usada para indicar a tendncia central de um
conjunto de observaes a moda amostral. Ela definida como o valor que ocorre com
maior frequncia. Podemos ter sries unimodais, bimodais ou multimodais, dependendo
do nmero de valores modais ocorrendo na amostra.
exemplo:
encontre a moda para o mesmo exemplo acima.
soluo:
a moda ser o valor 19, pois esse valor ocorre com maior frequncia na distribuio. Essa
uma distribuio unimodal.
Medidas de Disperso
Essas medidas so teis para complementar as informaes fornecidas pelas
medidas de posio. Descrevem a variabilidade ocorrendo no conjunto de dados sendo
analisados.
! Varincia amostral
A varincia amostral de um conjunto de dados, x
1
, x
2
, , x
n
, definida por
1
) (
1
2
2
=
n
x x
s
n
i
i
=
1 n
SQD
x
,
onde SQD
x
corresponde soma de quadrados dos desvios de X.
exemplo:
encontre a varincia amostral para os dois conjuntos de dados abaixo:
A: 3, 4, 6, 7, 10 B: -20, 5, 15, 24
soluo:
a mdia para o conjunto A 6; portanto a varincia ser:
s
2
=[(-3)
2
+(-2)
2
+(0)
2
+1
2
+4
2
]/4 =7,5
a mdia para o conjunto B tambm 6; portanto a varincia de B ser:
s
2
=[(-26)
2
+(-1)
2
+9
2
+(18)
2
]/3 360,67
INF 162 Prof. Luiz Alexandre Peternelli
21
Portanto, apesar dos dois conjuntos terem a mesma mdia, h maior variabilidade
nos valores do conjunto B do que nos do conjunto A.
Para o clculo da varincia til se faz a seguinte identidade algbrica:
n
x
x x n x ) x x (
2
n
1 i
i
n
1 i
2
i
2
n
1 i
2
i
n
1 i
2
i
= =
=
= = =
Tambm, o clculo da varincia pode ser simplificado por notar que se:
b ax y
i i
+ = , i =1, , n
ento, como visto atrs, b x a y + = e, ento
= =
=
n
i
i
n
i
i
x x a y y
1
2 2
1
2
) ( ) (
ou seja, adicionando uma constante a cada valor do conjunto de dados no altera a
varincia amostral; enquanto multiplicando-se cada valor por uma constante, a nova
varincia amostral ser igual a varincia original multiplicada pelo quadrado da
constante.
exemplo:
O conjunto de dados abaixo fornece o nmero mundial de acidentes areos fatais
de aeronaves comerciais nos anos de 1985 a 1993.
Ano 1985 1986 1987 1988 1989 1990 1991 1992 1993
Acidentes 22 22 26 28 27 25 30 29 24
encontre a varincia amostral do nmero de acidentes nesses anos.
soluo:
considere o seguinte conjunto de dados resultante da subtrao de 22 de cada
valor original:
0, 0, 4, 6, 5, 3, 8, 7, 2
chamando esses valores de y
1
, y
2
, , y
9
, teremos
, 35
9
1
=
= i
i
y 203
9
1
2
=
= i
y .
Portanto, j que a varincia dos dados transformados corresponde exatamente varincia
dos dados originais, usando-se a identidade algbrica acima teremos:
361 , 8
8
) 9 / 35 ( 9 203
2
2
= s
OBS.: se a cada valor de X tivermos associado sua frequncia de ocorrncia, ento
1
) (
2
2
i
i
i
i i
f
x x f
s =
1
) (
2
2
i
i
i
i
i
i i
i i
f
f
x f
x f
INF 162 Prof. Luiz Alexandre Peternelli
22
! Desvio padro amostral
A raiz quadrada positiva da varincia amostral chamada de desvio padro
amostral, ou seja,
1
) (
11
2
2
= =
=
n
x x
s s
n
i
i
Existem outras medidas tambm teis para representar a disperso dos dados.
Poderamos citar: Amplitude Total, Erro padro da mdia, Coeficiente de variao.
! Amplitude total
A amplitude total a diferena entre o maior e o menor valor da srie. Tem a
vantagem de ser rpido e fcil de ser calculada, porm fornece um nmero ndice
grosseiro da variabilidade de uma distribuio, por levar em conta apenas 2 valores de
um conjunto.
! Erro-padro da mdia
O erro-padro da mdia mede a preciso da mdia. Sua frmula dada por:
n
s
n
s
) X ( V ) X ( s
X
2
X
= = =
! Coeficiente de Variao
O coeficiente de variao uma medida de disperso relativa. uma medida til
para comparao, em termos relativos, do grau de concentrao, em torno da mdia, de
sries distintas. Por ser um nmero admensional permite a comparao de sries de
variveis com unidades diferentes. Sua frmula dada por:
C.V. (%) = 100
X
s
) X (
OBS.: se existem duas amostras distintas A e B, e se desejamos saber qual delas a mais
homognea, ou seja, de menor variabilidade, basta fazermos o seguinte: calculamos as
mdias e os desvios padres de A e B, e:
- se
B A
X X = , ento o prprio desvio padro informar qual a mais homognea.
- se
B A
X X , ento a mais homognea ser a que tiver menor C.V.
OBS.: valores muito altos de C.V. indicam pequena representatividade da mdia.
exemplo:
Supor duas amostras:
A={1, 3, 5}
B={53, 55, 57}
Qual das duas a mais homognea?
soluo:
C.V.
A
=2/3(100) =66,7%
C.V.
B
=2/55(100) =3,6%
INF 162 Prof. Luiz Alexandre Peternelli
23
Portanto a amostra B a mais homognea.
Exerccios Propostos
1) Considerando os dados amostrais abaixo, calcular: mdia aritmtica, varincia, desvio
padro, erro padro da mdia e coeficiente de variao
Dados: 2, 3, 5, 1, 2, 1, 4, 3, 3, 4, 3.
R.:2,81; 1,56; 1,24; 0,37; 44,12%
2) Em certa regio a temperatura mdia 20
0
C e a precipitao mdia 700 mm. O
desvio padro para temperatura 3
0
C, enquanto que a varincia para a precipitao
1225 mm
2
. Qual dos dois fenmenos apresenta maior variabilidade? J ustifique.
R.: a temperatura apresenta maior variabilidade relativa. Voc justifica
3) Um artigo retirado da revista Technometrics (Vol. 19, 1977, p. 425) apresenta os
seguintes dados sobre a taxa de octanagem de vrias misturas de gasolina:
88,5 87,7 83,4 86,7 87,5 91,5 88,6 100,3 96,5 93,3 94,7
91,1 91,0 94,2 87,8 89,9 88,3 87,6 84,3 86,7 84,3 86,7
88,2 90,8 88,3 98,8 94,2 92,7 93,2 91,0 90,1 93,4 88,5
90,1 89,2 88,3 85,3 87,9 88,6 90,9 89,0 96,1 93,3 91,8
92,3 90,4 90,1 93,0 88,7 89,9 89,8 89,6 87,4 88,4 88,9
91,2 89,3 94,4 92,7 91,8 91,6 90,4 91,1 92,6 89,8 90,6
91,1 90,4 89,3 89,7 90,3 91,6 90,5 93,7 92,7 92,2 92,2
91,2 91,0 92,2 90,0 90,7
(a) Construa o diagrama de folhas-e-ramos para esses dados
(b) Construa a distribuio de frequncia e o histograma. Use 8 intervalos de classe.
(c) Construa a distribuio de frequncia e o histograma, agora com 16 intervalos de
classe.
(d) Compare a forma dos dois histogramas em b e c. Ambos os histogramas mostram
informaes similares?
4) O seguinte conjunto de dados representa as vidas de 40 baterias de carro da mesma
marca e mesmas caractersticas com aproximao at dcimos do ano. As baterias
tinham garantia para 3 anos.
2,2 4,1 3,5 4,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1
3,3 3,8 3,1 4,7 3,7 2,5 4,3 3,4 3,6 2,9 3,3
3,9 3,1 3,3 3,1 3,7 4,4 3,2 4,1 1,9 3,4 4,7
3,8 3,2 2,6 3,9 3,0 4,2 3,5
(a) Construa a distribuio de frequncia e o histograma;
(b) Faa o grfico da distribuio de frequncias relativas acumuladas.
(c) Calcule a mdia aritmtica dos dados originais
INF 162 Prof. Luiz Alexandre Peternelli
24
(d) Usando a distribuio de frequncia conforme obtido em a calcule a mdia
novamente. Para tal, considere os pontos mdios de cada classe (mdia entre os
dois limites de cada classe) para serem os valores da varivel no clculo da mdia.
(e) Obtenha a varincia para os dados originais conforme feito para a mdia em c.
(f) Obtenha a varincia a partir da distribuio de frequncia conforme feito para a
mdia no tem d.
obs.: use 7 intervalos de classe. Amplitude da classe igual a 0,5. E o incio do
intervalo mais baixo em 1,5.
5) Mostre que
2
) (
i
i i
x x f =
i
i
i
i i
i i
f
x f
x f
2
2
) (
6) Mostre que a soma de quadrados dos desvios (SQD) em relao mdia um
mnimo. Dica: Considere f(a) a funo que representa a SQD em relao a a. Ou
seja,
=
=
n
i
i
a x a f
1
2
) ( ) ( . Usando seus conhecimentos de clculo, mostre que f(a)
ser mnimo quando a for igual a mdia dos valores de X.
7) Calcule a mdia, mediana, e amplitude total dos valores dispostos no seguinte
diagrama de ramos e folhas
6 0 5 5 8 9
7 2 4 4 5 7 8
8 2 3 3 5 7 8 9
9 0 0 1 4 4 5 7
10 0 2 7 8
11 0 2 4 5
12 2 4 5
INF 162 Prof. Luiz Alexandre Peternelli
25
UNIVERSIDADE FEDERAL DE VIOSA
--Departamento de Informtica / CCE
INF 161 - Iniciao Estatstica / INF 162 Estatstica I
Lista de Exerccios: Estatstica Descritiva
1) Os dados abaixo se referem a medidas tomadas em uma amostra de 10 ces:
Co 1 2 3 4 5 6 7 8 9 10
Peso (kg) 23,0 22,7 21,2 21,5 17,0 28,4 19,0 14,5 19,0 19,5
Comprimento (cm) 104 105 103 105 100 104 100 91 102 99
Pede-se, para as caractersticas avaliadas, peso e comprimento, as estatsticas:
a) Mdia;
b) Varincia;
c) Desvio-padro;
d) Erro-padro da mdia;
e) Coeficiente de variao;
f) Qual das duas caractersticas a mais homognea;
g) Mediana;
h) Moda.
2) Um pesquisador dispe das seguintes informaes, a respeito dos valores de uma
amostra:
- a mdia de todos os valores igual a 50,34;
- a soma dos quadrados dos valores igual a 150.000;
- a amostra constituda de 52 valores distintos.
Pergunta-se:
Com essas informaes possvel obter alguma(s) medida(s) de disperso dos
valores amostrais? Em caso afirmativo, efetue os clculos e obtenha a(s) respectiva(s)
medida(s).
3) Considere os dados: 12, 17, 17, 17, 10, 10, 9, 9, 9, 12, 12, 6, 6, 6, 17, 17, 12, 12, 9, 9,
9, 12, 12, 12, 12. Supondo que sejam valores assumidos por uma varivel aleatria
discreta X, pede-se:
a) Mdia, mediana e moda;
b) Erro-padro da mdia e C.V.(%).
INF 162 Prof. Luiz Alexandre Peternelli
26
4) Duas turmas A e B com n
A
= 50 e n
B
= 80 apresentaram mdias X
A
= 65 e X
B
= 70
e varincias s
A
2
225 = e s
B
2
235 = . Qual a turma mais homognea?
5) A mdia de aprovao na disciplina de Estatstica 6 ou mais. Durante um perodo
letivo foram realizadas quatro provas, sendo que a primeira prova teve peso dois, a
segunda e a terceira o dobro do peso da primeira e a ltima igual ao peso da primeira.
Os resultados, incluindo os de uma prova de substituio optativa, foram os seguintes:
Estudantes 1
a
2
a
3
a
4
a
Optativa
1 2,5 4,5 5,0 6,0 7,0
2 2,0 8,5 7,0 3,0 5,0
3 8,5 10,0 9,0 8,5 nc
4 3,5 5,5 8,5 7,5 6,5
5 3,0 5,0 6,0 4,5 5,0
6 6,0 3,0 4,0 5,0 2,0
7 8,0 1,5 2,0 9,0 5,0
8 1,5 2,0 1,0 2,5 nc
9 7,5 8,0 8,5 10,0 nc
10 5,5 4,5 5,0 4,5 2,5
Sabendo-se que a nota da prova optativa substitui a menor nota das provas
precedentes, determine:
a) Mdia de cada estudante;
b) Para cada prova: mdia, moda, mediana, varincia, desvio-padro, erro-padro da
mdia e CV.
c) Para o perodo: mdia, varincia, desvio-padro, erro-padro da mdia, CV.
d) Liste as provas em ordem crescente de homogeneidade.
INF 162 Prof. Luiz Alexandre Peternelli
27
RESPOSTAS
( ) ( )
( ) ( )
( ) ( )
cm e cm cm Mo kg Mo h
cm Md kg Md g
CV CV e
cm Y s kg X s d
cm Y s kg X s c
cm Y V kg X V b
cm Y kg X a
Y X
Y X
Y X
105 104 , 100 ; 0 , 19 )
50 , 102 ; 35 , 20 )
CV. menor possui que a pois o, Compriment f)
% 16 , 4 ; % 37 , 18 )
3338 , 1 ; 1957 , 1 )
2177 , 4 ; 7812 , 3 )
7889 , 17
; 2973 , 14
)
3 , 101 ; 58 , 20 ) . 1
2 2
= =
= =
= =
= =
= =
= =
= =
2. s
2
=357,3723; s =18,9043; CV =37,55%; 2,6215 = ) X s(
3. a) X =11,4; Md =12; Mo =12 b) ( ) 6904 , 0 = X s ; CV =30,28%
4. Turma B
5. a)
Estudante 1 2 3 4 5 6 7 8 9 10
Mdia 5,33 6,50 9,17 7,00 5,25 3,83 5,17 1,67 8,42 4,50
b)
Arguio
1
a
2
a
3
a
4
a
X
6,05 5,50 5,60 5,85
Mo 5 2; 4,5; 5 5; 8,5 2,5
Md 6,25 5,0 5,5 5,5
s
2
4,02 6,94 7,54 7,78
s 2,01 2,64 2,75 2,79
s( X )
0,63 0,83 0,87 0,88
CV(%) 33,16% 47,91% 49,05% 47,68%
( )
c X s s s X CV ) , ; , ; ; , ; , = = = = = 56833 62098 4919 02275 4385%
2
d) 3
a
, 2
a
, 4
a
, 1
a