Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução à Estatística
´
"A Estatistica ^
e´ uma ciencia ´
que estuda os metodos ´
e tecnicas que permitam tirar
~
conclusoes sobre populacoes
¸ ~ partindo de amostras."
¸~ da Estatistica
1.2 Aplicacoes ´
^
b) Fazer inferencias ¸~ de interesse a partir das informacoes
sobre uma populacao ¸~ contidas
´
nos dados amostrais (dados extraidos ¸~
desta populacao).
´
1.3 Fases do Metodo ´
Estatistico
´
A etapas do metodo ´
Estatistico ´
numa pesquisa cientifica e´ resumida no seguinte
diagrama:
Planejamento Coleta ¸~
Apuracao ¸~
Apresentacao Tabelas ´
Analise
1
´
1.4 Conceitos Basicos
~
i) POPULACAO
¸ ¸~ e´ um conjunto de elementos com pelo
: No sentido geral, uma populacao
´
menos uma caracteristica ´
comum observavel.
¸~ com o
ii) AMOSTRA: e´ um subconjunto, necessariamente finito, tomado da populacao
´
proposito ¸~ sobre tal populacao.
de obter informacoes ¸~
iv) VARIAVEL´ : e´ qualquer caracteri tica que possa ser observada ou medida: cor de olhos,
estatura, estado civil, peso, etc.
´
Variaveis ¸~ (valor assumido pela variavel)
Variacoes ´
--------------------------------------------------------------------------------------
- cor - azul, verde, . . .
- no. de filhos - 0, 1, 2, . . .
- peso -40 kg, 51 kg, 52.3Kg,
´
As variaveis podem ser QUALITATIVAS (ou ´
CATEGORICAS) ou
´
QUANTITATIVAS (ou NUMERICAS).
´ Qualitativa: cor
Exemplo: Variavel
´ Quantitativa: peso, no. de filhos
Variavel
2
´ quantitativa que pode assumir qualquer valor real chama-se Variavel
Definição: Uma variavel ´
´
Continua.
~ chamadas Variaveis
Por outro lado, aquelas que so´ podem assumir valores inteiros sao ´
Discretas.
Exemplo: Variavel ´
´ Continua: peso
´ Discreta: no. de filhos
Variavel
¸~ fornecem variaveis
De modo geral, pode-se dizer que mensuracoes ´ ´
continuas e
¸~
contagem (ou enumeracoes), ´
variaveis discretas.
¸~ de Dados em Tabelas
1.5 Apresentacao
Esquema Geral:
´
Titulo
----------------------------------------------------------------
Cabecalho
¸ ´
Variavel Freq. %
----------------------------------------------------------------
classe 1 F i
classe 2 F i
: : :
classe k Fk ik
---------------------------------------------------------------
Total n 100,00
---------------------------------------------------------------
Rodape´ Fonte:
´
Uma tabela estatistica deve ser auto-suficiente.
Deve apresentar:
´
TITULO
3
CABECALHO
¸
RODAPÉ
~es:
Observaço
1) Nenhuma "célula ou casela" deve ficar em branco, apresentando sempre um no. ou sinal:
´
- (hifen), ´
quando o valor numerico e´ nulo
^
.... (reticencia), ~ se dispoe
quando nao ~ de dado.
#
¸~ quando ha´ dúvida quanto a exatidao
? (interrogacao), ~ do valor numerico.
´
´
0 (zero), quando o valor numerico e´ muito pequeno para ser expresso pela unidade utilizada.
~ destacados.
3) Os totais e subtotais serao
~
Regra com base nas "NORMAS DE APRESENTACAO ¸ TABULAR" aprovadas pela XVIII
´
´ Geral do Conselho Nacional de Estatistica.
Assembleia
4
Exemplo de Tabela:
´
Titulo Tabela 1.1 Populacao ¸~ Brasileira da Regiao ~ Sul em 1965
-----------------------------------------------------------------
Cabecalho
¸ Estados ¸~
Populacao %
-----------------------------------------------------------------
Parana´ 7.000.000 43,75
Sta Catarina 3.000.000 18,75
R.G.do Sul 6.000.000 37,50
-----------------------------------------------------------------
Total 16.000.000 100,00
-----------------------------------------------------------------
Rodape´ Fonte: IBGE - 1967.
¸~ Grafica
1.6 Apresentacao ´
´
Os graficos devem ser auto-explicativos;
´
Devem ter sempre um titulo e fonte;
~ fique explicito
Podem vir acompanhados de legenda, caso nao ´ o nome da classe no
´
grafico.
¸~ graficas
As representacoes ´ ^
das tabelas de frequencias ´ de diagramas
podem ser atraves
´
(graficos ´
construidos ´
sobre o plano cartesiano) mapas e figuras geometricas, unidimensionais
ou bidimensionais.
´
Os diagramas, histogramas e poligonos ^
de frequencias ~ graficos
sao ´ representados sobre
o 1o. quadrante de um sistema de eixos cartesianos.
^
Representa-se no eixo y os valores das frequencias ´
e no eixo x os valores da variavel
(classes) em estudo.
5
Capítulo 2
Apresentação dos Dados Qualitativos
Exemplo: ^
Tabela 1 : Assistencia Federal em 1985 aos governos locais
---------------------------------------------------------------------------
´
Auxilios Valores
~ de Dolares)
(em milhoes ´ %
----------------------------------------------------------------------------
Saúde 26.530 20%
Educacao¸~ 18.108 13.5%
Transporte 18.075 13.5%
Recursos Naturais 3.918 3%
Outros 7.625 6%
^
Assistencia Social 27.430 20%
^ # ^
Assistencia a Infancia 3.669 3%
Habitacao
¸ ~ 6.156 5%
Seguro Social 9.980 7%
Geral 12.620 9%
------------------------------------------------------------------------------
TOTAL 134.111 100%
------------------------------------------------------------------------------
Fonte: IBGE - 1967.
6
2.2 Apresentação Gráfica
Construça~o:
#
Sugesta~o: As vezes, por motivos de espaco ´
¸ ou para facilitar a leitura, costuma-se usar graficos
com as barras dispostas horizontalmente.
¸~ com muitas classes.
Isto ocorre no caso de legendas muito extensas ou distribuicao
7
8
2.2.2 Setograma (Pizza)
Construça~o:
´
Consiste de um circulo ´
dividido em setores, cujas areas ~ porporcionais #as
sao
porcentagens dadas.
~ com valores absolutos. Para isso, e´ preciso
E´ ilustrado com valores percentuais e nao
transformar os valores absolutos em porcentagens (%) utilizando-se a regra abaixo:
3600 -- 100%
-- i
360 * i
Portanto, = 100
9
Observaça~o: Costuma-se colorir os setores de modo diferente, a fim de dar ^enfase aos
tamanhos relativos de cada um.
¸~ do fenomeno.
´ da evolucao
Objetivo: Dar ideia ^
´
E´ empregado para representar tabelas temporais (dados dispostos por periodo de
tempo).
10
2.2.4 Cartograma
11
Capítulo 3
Apresentação de Dados Quantitativos
Distribuição de Frequência
´
Os dados numericos podem ser representados numa tabela (quadro) de forma agrupada
~ em intervalos.
ou nao
´
Costuma-se agrupar em intervalos os dados continuos.
´ quando a amostra de dados discretos for muito grande, agrupamo-os tambem.
Porem, ´
~ ´
Nada impede de nao agruparmos os dados continuos, quando a amostra for pequena.
~ agrupados em intervalos
Exemplo: a) dados nao
12
Sejam n: o tamanho da amostra e k: o número de intervalos.
¸~ dos dados.
ROL: e´ o arranjo dos dados (da amostra) em ordem crescente. E´ uma ordenacao
^
FREQUENCIA ABSOLUTA SIMPLES DE UMA CLASSE ( Fi ) :
E´ o no. de vezes que o elemento aparece na amostra ou no. de elementos pertencentes a
uma classe.
k
Fi = n
i=1
^
FREQUENCIA RELATIVA DE UMA CLASSE ( fi ):
Fi
E´ dada por fi = n , i=1, 2, . . ., k
e geralmente e´ expressa em porcentagem.
k
Observaça~o: fi = 1.
i=1
^
FREQUENCIA ACUMULADA DE UMA CLASSE ( Fac ):
´ ^
E a soma das frequencias ´ e inclusive, a classe dada.
das classes anteriores ate,
~ descritas a seguir:
Exemplo: As notas de 32 estudantes de uma classe estao
13
Capítulo 4
Apresentação de Dados Não Agrupados em Intervalos
Ilustraça~o Numérica:
¸~
Suponhamos que estamos interessados no estudo do "no. de dias de internacao", de 20
pacientes de um hospital.
Dados: 2 0 1 1 3 0 1 2 4 2 1 0 3 4 3 0 0 1 2 4
Rol: 0 0 0 0 0 1 1 1 1 1 2 2 2 2 3 3 3 4 4 4
¸~ do tempo de internacao
Distribuicao ¸~ num hospital
----------------------------------------------------------------
no. de dias Fi fi Fac
----------------------------------------------------------------
0 5 0.25 5
1 5 0.25 10
2 4 0.20 14
3 3 0.15 17
4 3 0.15 20
---------------------------------------------------------------
Total 20 1.00
--------------------------------------------------------------
Fonte: SUS 1980
~ e´ aconselhavel
NOTA: Este tipo de tabela nao ´ quando estamos trabalhando com
amostras grandes.
14
4.2 Apresentação Gráfica
´
Os graficos ~ uma ideia
dao ¸~ das medidas de posicao
´ da forma da distribuicao, ¸~ e dispersao
~
^
do fenomeno em estudo.
´
4.2.1 Grafico ~
em Bastao
15
´
4.2.2 Grafico ^
de Frequencia Acumulada
16
Capítulo 5
Apresentação de Dados Agrupados em Intervalos
Regras Gerais para elaborar uma Distribuiça~o de Freque^ncias para dados agrupados em
intervalos.
1) Ordenar os dados.
´ da formula:
3) Calcular o no. de intervalos (k) atraves ´
k = 1 + 3.32*log10 (n) , k Z
Ilustraça~o Numérica:
´
Considere uma amostra de 14 recem-nascidos, onde se observou o peso:
4.3 3.7 2.5 2.8 3.0 2.2 3.5 3.7 2.1 2.4 2.7 2.4 3.3
¸~ de Frequencias.
Arranjar os dados numa Distribuicao ^
Sol.:
Rol: 2.1 2.2 2.4 2.4 2.5 2.7 2.8 3.0 3.3 3.5 3.7 3.7 4.3
17
¸~ dos Pesos de Recem-Nascidos
Distribuicao ´
----------------------------------------------------------------
Pesos Fi fi Fac
----------------------------------------------------------------
2.1 -- 2.6 5 0.36 5
2.6 -- 3.1 3 0.21 8
3.1 -- 3.6 2 0.14 10
3.6 -- 4.1 2 0.14 12
4.1 -- 4.6 2 0.14 14
---------------------------------------------------------------
Total 14 1.00
--------------------------------------------------------------
~es:
Observaço
2) Devem ser evitadas classes do tipo "40 anos e mais", "menores de 20 anos"
´
3) Deve-se, sempre que possivel, utilizar intervalos com tamanhos iguais, o que permite uma
~
comparacao ^
¸ perfeita das frequencias dos intervalos.
5) Os dados agrupados passam a assumir o valor medio ´ do intervalo. Portanto, quanto maior
for o tamanho do intervalo, menor precisao~ se obtera´ do fenomeno^ ´ maiores
analisado (i. e,
~ ~
serao as possibilidades de distorcao ´
¸ na analise ´
estatistica).
18
5.2 Apresentação Gráfica
5.2.1 Histograma
^
Consiste de um conjunto de retangulos justapostos que tem:
´
i) as bases sobre um eixo horizontal (eixo dos X) com centro no ponto medio dos intervalos e
#
as larguras iguais as amplitudes dos intervalos.
^ ^ Fi
ii) cada retangulo do Histograma tem altura dada por: altura do retangulo = hi
^
Se todos os intervalos tiverem a mesma amplitude, toma-se as alturas dos retangulos
# ^
numericamente iguais as frequencias dos intervalos.
19
´
5.2.2 Poligono ^
de Frequencia
´
Consta de um poligono ´
cujos vertices ~ obtidos pela interseccao
sao ¸~ de cada ponto medio
´
^
do intervalo e sua respectiva frequencia.
Exemplo:
´
O acrescimo ´
dos segmentos PQ e RS se faz necessario, ´
para que a area total delimitada
#
´ ^
pelo poligono e o eixo das abscissas seja proporcional a frequencia ¸~
total da distribuicao.
´
Neste caso, o acrescimo ´
dos segmentos PQ e RS se faz necessario, para que a soma das
^ # ´ ^
´
areas dos retangulos ´
do histograma seja igual a area total limitada pelo poligono de frequencia
e o eixo dos X.
20
´
5.2.3 Ogiva de Galton (Poligono ^
de Frequencia Acumulada)
Exemplo: ---------------------------------------------
idades Fi Fac
---------------------------------------------
18 -- 22 11 11
22 -- 26 6 17
26 -- 30 2 19
30 -- 34 1 20
34 -- 38 2 22
------------------------------------------------
Total 22
-----------------------------------------------
21
22
Capítulo 6
Dados Bivariados
Exemplo: Afirma-se que certa droga e´ eficiente na cura de resfriados. Em um experimento com
# ´
164 pessoas resfriadas essa droga foi dada a metade das pessoas sendo pilulas de acúcar
¸ dadas
#
¸~ dos pacientes ao tratamento estao
a outra metade. As reacoes ~ registradas na tabela abaixo:
-----------------------------------------------------------------------------------------------
Resultado Resultado Sem TOTAL
Positivo Negativo ~
Reacao
¸
-----------------------------------------------------------------------------------------------
Droga 58 10 8 76
Acúcar
¸ 44 8 36 88
-----------------------------------------------------------------------------------------------
Total 102 18 44 164
-----------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
Resultado Resultado Sem TOTAL
23
Positivo Negativo ¸~
Reacao
-----------------------------------------------------------------------------------------------
Droga 58/76 10/76 8/76 76/76
Acúcar
¸ 44/88 8/88 36/88 88/88
-----------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
Resultado Resultado Sem TOTAL
Positivo Negativo ~
Reacao
¸
-----------------------------------------------------------------------------------------------
Droga 58/164 10/164 8/164 76/164
Acúcar
¸ 44/164 8/164 36/164 88/164
-----------------------------------------------------------------------------------------------
Total 102/164 18/164 44/164 164/164
-----------------------------------------------------------------------------------------------
´
Suponhamos que temos duas variaveis quantitativas X e Y onde foram observados n
´
valores para cada variavel.
Neste caso, os dados sao~ representados por n pares (X , Y ) , (X , Y ) , . . . , (Xn ,
Yn ) representados pela tabela:
X Y
----------
X Y
X Y
: :
Xn Yn
----------
´
Numa analise ´
estatistica ~
preliminar podemos formular as seguintes questoes:
´
i) As variaveis ~ realacionadas?
sao
ii) Qual e´ a forma de relacionamento entre as duas variaveis?
´
~
iii) Como podemos medir esta relacao?
¸
iv) Como podemos prever uma variavel ´ a partir do conhecimento da outra?
Se considerarmos X e Y separadamente, nao ~ podemos responder a essas questoes.
~
24
¸~ visual do relacionamento entre as duas variaveis
Uma verificacao ´ X e Y pode ser dada a
~
´
partir de graficos de X versus Y (DIAGRAMA DE DISPERSAO).
25
~ sanguinea
Exemplo: A tabela abaixo nos da´ a idade e a pressao ´ correspondente a um grupo de
12 mulheres.
Idade 56 42 72 36 63 47 55 49 38 42 68 60
-------------------------------------------------------------------------------------------
~
Pressao 147 125 160 118 149 128 150 145 115 140 152 155
´
Sanguinea
¸~ entre X e Y?
Existe alguma relacao
Sol:
26
EXERCÍCIO: Considerando as informações sobre os alunos da disciplina de Inferência
Estatística da UEM, contidas na Tabela 01, abaixo, construa um gráfico adequado para
representar as variáveis:
a) sexo
b) estado civil
c) transporte
d) meio de informação segundo o sexo dos alunos
27
1a Lista de Exercícios de Estatística Descitivia
´
Pais 1973 1974 1975 1976
------------------------------------------------------------------------------------
EUA 1.717.387 2.022.477 2.395.222 2.901.246
RFA 520.776 709.767 871.352 1.118.029
Japao~ 318.260 598.024 841.162 1.005.100
´
Suica¸ 357.049 559.621 735.509 980.729
Canada´ 360.152 401.363 410.839 482.032
Inglaterra 324.477 401.088 430.252 420.674
Franca ¸ 205.467 241.942 300.066 326.261
-------------------------------------------------------------------------------------
Fonte: Revista Visao ~ - 14/nov/77
¸~ de um
2) Os seguintes dados referem-se ao número de ´itens defeituosos na fabricacao
¸~
determinado produto, em 20 dias de observacao.
3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6.
Pede-se:
¸~ de frequencia;
a) construir a distribuicao ^
~ ´
b) construir o diagrama de Bastao e o grafico da freq. acumulada;
^
c) a ocorrencia de mais de 6 defeitos corresponde a que porcentagem do total de defeitos
encontrados?
´
3) Os dados abaixo referem-se aos montantes (em milhares de dolares) ´
de 32 emprestimos
pessoais em uma companhia financeira.
28
¸~ de frequencia;
a) construir a distribuicao ^
´
b) construir o histograma, o poligono ^
de frequencias e a ogiva de Galton;
´
c) qual a porcentagem dos individuos ´
que tiveram menos de 4 mil dolares ´
de emprestimos?
´
Pais ¸~
Producao Vendas
-----------------------------------------------
1976 985.469 974.594
1977 919.239 908.664
1978 1.068.194 1.067.343
1979 1.127.966 1.121.245
1980 1.165.206 1.118.610
1981 780.852 800.777
1982 859.254 861.207
------------------------------------------------
Fonte: ANFAVEA
------------------------------------------------------
Valores Fi fi Fac
------------------------------------------------------
1 4 0.08
2 4
3 0.16 16
4 7 0.14
5 5 28
6 38
7 7 0.14 45
8
---------------------------------------------------------
29
6) Em cada um dos seguintes casos indique se os dados podem ser considerados como dados
´
qualitativos ou quantitativos (numericos), ´
neste último caso dizer se e´ continuo ou discreto.
´
7) Montar uma tabela para representar o número de casos da molestia ´ Z, 1970/1974
X, na area
´
(dados hipoteticos), sabendo-se que em 1970 ocorreram 8.000 casos da doenca, ¸ em 1971
7.600, em 1972 7.200, em 1973 7.300 e em 1974 teve-se 7.000 casos.
´
Construir os graficos ´
que se julgar necessario.
´
9) Segundo o Boletim Estatistico do IBGE, durante o ano de 1973, foram aplicadas as
seguintes vacinas no Servico
¸ de Saúde dos Postos, Estado do Rio de Janeiro: 81335 vacinas
´
antivariolicas, ´
23012 antiamarilicas, ´
12058 anticolericas, 2155 antitificas, 12276 de outras
´
especies.
^
a) Organize esses dados em uma tabela, indicando frequencias absolutas e percentagens.
´
b) Construa um grafico ´
de barras verticais e um grafico de setores.
´
10) Calcule a porcentagem de cada diagnostico para os dados apresentados na tabela abaixo.
Faca ´
¸ um grafico de barras.
30
´
Tabela 1: Diagnostico ´
de biopsias de mama, feitas entre 1963 e 1972, inclusive, no
Hospital dos Servidores do Estado, RJ.
---------------------------------------------------
´
Diagnostico Freq.
----------------------------------------------------
Displasia 1.010
Tumor Benigno´ 344
Tumor Maligno´ 329
´
Inflamatoria 54
Diversos 288
---------------------------------------------------
Fonte: PIZA et alii (1977)
¸~ previas
11) Num hospital foi estudado o número de gestacoes ´ ~
e o peso de 16 maes.
Os dados observados foram os seguintes:
peso 69,1 57,3 72,7 54,3 68 72,5 58,7 64 62,1 65,9 60,6 49 59,3 66 45 60,4
¸~ 1
no. de gestacoes: 1 2 0 1 3 2 1 0 1 2 4 3 0 2 2
¸~ de frequencia
Elaborar uma distribuicao ^ ´
e construir os graficos para cada conjunto de dados.
31
Capítulo 7
Medidas Descritivas
7.1 Introdução
Uma outra maneira de se resumir os dados de uma variável quantitativa, além de tabelas
¸~ de frequencias)
(distribuicoes ^ e gráficos, é apresentá-los na forma de valores numéricos,
denominados medidas descritivas.
Agora estudaremos as medidas que possibilitem representar um conjunto de dados
quantitativos de forma resumida em termos de centralidade e variabilidade da amostra.
As medidas descritivas auxiliam a análise do comportamento dos dados.
^
A) Medidas de Tendencia Central
~
B) Medidas de Dispersao
¸~ (Separatrizes)
C) Medidas de Posicao
D) medidas de assimetria e de curtose.
~
As medidas de tendência Central de maior uso sao:
´ aritimetica
A) media ´
B) mediana
C) moda
_
´
7.2.2 MEDIA ´
ARITMETICA X
Seja x , x , . . . , xn os dados
_ amostrais e n: tamanho da amostra.
´ ´
A MEDIA ARITMETICA X dos valores x , x , . . . , xn e´ definida por:
n
_ xi
i=1
X= n
32
Exemplo: Sete pacientes foram escolhidos, ao acaso, em um hospital, onde se observou o
número de dias que estes permaneceram internados.
Obteve-se: 1 8 4 5 4 3 _2
´ aritmetica
Calcule a media ´ ´
X (o tempo medio ^
de permanencia no hospital).
7
_ xi
¸~ = 3.85 ~
i=1 1+8+4+5+4+3+2 27
Solucao: X= 7 = 7 = 7 =4
_
X = 4 dias
~es:
Observaço
_
´
1) Para o calculo de X com os dados da tabela acima, foi suposto que, todos os
´
individuos ´
com idades em um determinado intervalo tinham a idade dada pelo ponto medio do
~ corresponde #a realidade (ver Bercho,
intervalo, o que, em geral, nao ´ pg. 72, 74).
´
2) A media ´
aritmetica ~ pode ser calculada quando o 1o. ou o último intervalo
nao
tiverem extremos indefinidos.
_
~es Gerais sobre X: A media
Observaço ´ aritmetica
´ de um conjunto de dados:
33
¸~ Rol: 1
Solucao: 2 3 4 4 5 8
^
Exemplo: Os dados abaixo representam os tempos de sobrevivencia ´
(media) de 6 cobaias
´
submetidas a um experimento medico:
3 15 46 64 126 623
¸~
Solucao: Rol: 3 15 46 64 126 623
~es Gerais:
Observaço
¸~ e´ assimetrica,
2) Se a distribuicao ´ ¸~ melhor do que a
a mediana e´ uma medida de posicao
´ aritmetica.
media ´
Observaça~o:
^ igual frequencia,
2) se "todos" os valores tem ^ ~ tem
diremos que o conjunto de dados nao
moda.
Exemplo: i) 10 10 12 13 18
Mo = 10 (conjunto unimodal)
34
ii) 100 100 200 200 300 600
Mo = 100 e Mo = 200 (conjunto bimodal)
iii) a) 1 2 3 4 5 6
Mo (conjunto amodal)
b) 1 1 3 3 5 5
Mo
´
3) O fato de um conjunto de dados apresentar mais de uma moda pode ser um indicio
de heterogeneidade dos dados.
¸~ acidentais
4) Um aspecto importante a ressaltar e´ que podemos distinguir as flutuacoes
(outliers) da amostra dos verdadeiros valores modais.
~ ´
7.2.5 RELACAO
¸ ENTRE MEDIA , MEDIANA E MODA
¸~ simetrica,
Em uma distribuicao ´ observa-se que a Média Mediana Moda (Figura a)
35
^
7.2.6 ESCOLHENDO UMA MEDIDA DE TENDENCIA CENTRAL
´
Tendo a media, ¸~ e´
a mediana e a moda o mesmo objetivo, em que condicoes
´ empregar cada uma dessas medidas?
recomendavel
´ aritmetica
A media ´ ´
´ de longe, a mais usada dentre as estatisticas
e, ^
de tendencia central,
mas nem sempre e´ ela quem melhor representa um conjunto de dados.
Por exemplo, suponhamos _ os dados 1, 1, 1, 1, 1, 2, 2, 2, 2, 20.
A media aritmetica e X = 3.3 , enquanto a mediana e´ Med = 1.5 , o que e´ bem mais
´ ´ ´
representativo, dado que a maior parte das observacoes ¸~ e´ 1 ou 2.
O fato e´ que a media
´ aritmetica
´ e´ muito influenciada por valores extremos, tal como 20
no exemplo dado, enquanto que a mediana nao ~ e´ afetada por esses valores.
Quando o tamanho da amostra e´ grande, esta desvantagem da media ´ torna-se menos
importante.
´
A proposito ´
de analises ´
estatisticas, ´ apresenta, sobre a mediana, a vantagem de
a media
´ de manipular algebricamente.
ser mais facil ´
A moda e´ a menos empregada.
Um confronto mais alargado necessita do conceito de robustez, que infelizmente, nao ~
cabe no presente estudo.
´
Os metodos ´
estatisticos ~ especial ^enfase ao estudo da variacao.
dao ¸~
Uma medida de posicao, ¸~ como a media ´ por exemplo, por si so´ e´ insuficiente para
descrever uma populacao.
¸~ ~
Duas populacoes
¸ ´
podem ter a mesma media, mas diferir muito no
~
grau de variacao
¸ de seus valores.
Consideremos
_ ^ amostras: a) 4, 4, 4 b) 3, 4, 5 c) 0, 4, 8. Todas tem
as tres ^ a mesma
´
media, ~
ou seja, X = 4; mas na amostra a) nao existe variacao~ ~
¸ em c) e´ maior do que
¸ e a variacao
~ ´
^ amostras de caracteristicas
em b). Sao portanto tres diferentes.
As medidas de dispersão auxiliam as medidas de tendência central a descrever o
conjunto de dados adequadamente.
36
^
7.3.2 VARIANCIA AMOSTRAL (S )
n
_ xi
i=1
´
Seja x , x , . . ., xn um conjunto de dados com media X = n , define-se
^
VARIANCIA AMOSTRAL por:
n _
xi X
S = i=1
n1
n
n x i
xi
i=1
n
´
Uma formula ´
analoga, ´ S
e: i=1
n1
^
Exemplo: Calcular a variancia, S , da seguinte amostra: 5 8 10 12 15
Sol: xi xi
---------------
5 25
8 64
10 100
12 144
15 225
---------------
50 558
n
n x i
xi - i=1
n
Usando S = i=1
n-1 , tem-se
558 - 505
S = 5-1 = 14.5
Portanto, S = 14.5.
~
7.3.3 DESVIO-PADRAO (S)
~ ^
Define-se DESVIO-PADRAO (S) como sendo a raiz quadrada positiva da variancia
(S ).
37
~ tem as mesmas propriedades que a variancia
^ #
2) O desvio-padrao e seu uso e´ as vezes preferido,
~ que os dados (mesma unidade de medida) enquanto que a
uma vez que tem igual dimensao
^
variancia ~ do quadrado dos dados.
tem a dimensao
~
7.3.4 COEFICIENTE DE VARIACAO
¸ (DE PEARSON) (C.V.)
S
_
Sol: Aplicando-se o CV = X , temos:
2.72
- para o fornecedor A, CVA = 107.9 = 0.0252 ou 2.52%
1.08
- para o fornecedor B, CVB = 108 = 0.01 ou 1%
38
~
7.3.5 RELACAO
¸ ENTRE AS MEDIDAS DE VARIABILIDADE DE DUAS
~
DISTRIBUICOES
¸ DISTINTAS
~ da distribuicao
a) o desvio-padrao ¸~ A e´ maior do que o da distribuicao
¸~ B, i. e,
´
SA SB .
´
b) as medias ~ iguais, i. e,
sao ´ _ _
XA = XB .
¸~ da distribuicao
c) o coeficiente de variacao ¸~ A e´ maior do que o da distribuicao
¸~ B, i. e,
´
CVA CVB .
7.4 Separatrizes
Estas medidas são valores que ocupam posições no conjunto de dados, em rol,
dividindo-o em partes iguais e podem ser:
--------------|---------------|---------------|---------------
Q Q Q
39
Exemplo 1: Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36
Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
15
2 40
3 43
15
3936
2 37.5
3 40
-----|-----|-----|-----|-----|-----|-----|-----|-----|-----
D D D D D5 D6 D7 D8 D9
-----|-----|---------------|-------------------|-----|-----
P P . . . P50 ... P98 P99
40
A seguir são apresentados alguns dos percentis mais usados:
41
Para os dados em rol, o cálculo das medidas separatrizes é dado por:
42
´
2a Lista de Exercicios ´
de Estatistica Descritiva
´ , mediana e moda
Determinar a) media
^
b) variancia ~ e coeficiente de variacao
, desvio-padrao ¸~
o o
c) 1- e 3- quartis.
d) Tabelar os dados acima e repetir os ´itens a) , b) e c).
´ , mediana e moda
Determinar: a) media
^
b) variancia ~ e coeficiente de variacao
, desvio-padrao ¸~
c) 1-o e 3-o quartis.
d) 4-o decil e 80-o percentil
43
^
4) Dado o histograma abaixo, no interior de cujos retangulos ^
foram anotadas as frequencias
´
absolutas, localize a media, a mediana e a moda:
´
5) Dada a figura a seguir (poligono ^
de frequencia), ¸~ sera?
o primeiro quartil da distribuicao ´
¸~ de frequencias
6) A tabela seguinte fornece a distribuicao ^ ¸~ do nivel
das medicoes ´ ´
de calcio no
soro (em mg/100ml) em uma amostra 15 adultos normais.
´
Niveis de ^
Frequencia
´
Calcio____________________________
_____
8,0----9,0 1
9,0----10,0 5
10,0----11,0 9
11,0----12,0 7
12,0----13,0
_______________________________3__
Total 25
44
7) Consideremos os seguintes dados: 1 1 1 1 1 2 2 2 2 20
^
Determine as medidas de tendencia ´
central (media, ^
moda e mediana) e a variancia.
^
Qual ou quais das medidas de tendencia central representam melhor os dados acima.
´
8) Realiza-se uma prova de Estatistica para duas turmas, os resultados foram
os seguintes: _
-Turma A: X _ = 5 e = 2,5
-Turma B: X = 4 e = 2
^
Qual turma que apresentou resultados mais homogeneos? Justifique.
´
9) Em uma maternidade foram fornecidos os seguintes dados sobre peso, em quilos, de recem-
nascidos prematuros:
^
Que medida de tendencia ¸~
central descreve mais adequadamente a distribuicao?
Justifique sua resposta.
Pontos ^
Frequencia
14,5 --- 24,5 10
24,5 --- 29,5 24
29,5 --- 34,5 38
34,5 --- 39,5 54
39,5 --- 44,5 22
44,5 --- 49,5 18
49,5 --- 54,5 22
54,5 --- 59,5 12
Total 200
´
a) Quantos pontos, no minimo, o adolescente deve obter para que fique entre os 100
melhores?
´
b) Quantos pontos, no minimo, o adolescente deve obter para se classificar entre os 25%
melhores?
45