Você está na página 1de 45

Capítulo 1

Introdução à Estatística

1.1 Definição de Estatística


Entre as várias definições existentes na literatura, a que mais nos parece ser adequada é:

´
"A Estatistica ^
e´ uma ciencia ´
que estuda os metodos ´
e tecnicas que permitam tirar
~
conclusoes sobre populacoes
¸ ~ partindo de amostras."

¸~ da Estatistica
1.2 Aplicacoes ´

¸~ e o tamanho da amostra, tal que as observacoes


a) Planejar o experimento, a selecao ¸~
deem ~
^ base suficiente para tirar conclusoes precisas e validas.
´

^
b) Fazer inferencias ¸~ de interesse a partir das informacoes
sobre uma populacao ¸~ contidas
´
nos dados amostrais (dados extraidos ¸~
desta populacao).

´
1.3 Fases do Metodo ´
Estatistico
´
A etapas do metodo ´
Estatistico ´
numa pesquisa cientifica e´ resumida no seguinte
diagrama:

Planejamento Coleta ¸~
Apuracao ¸~
Apresentacao Tabelas ´
Analise

do  dos  dos  dos  e ¸~


Interpretacao

Experimento Dados Dados Dados ´


Graficos ~
e Conclusao

Observaça~o: O uso de metodos


´ ´
estatisticos esta´ relacionado com qualquer area,
´ seja da saúde,
´
social ou tecnologica.

1
´
1.4 Conceitos Basicos

~
i) POPULACAO
¸ ¸~ e´ um conjunto de elementos com pelo
: No sentido geral, uma populacao
´
menos uma caracteristica ´
comum observavel.

¸~ pode ser classificada como finita ou infinita.


Uma populacao

¸~ Finita: altura dos alunos de uma determinada escola.


Exemplo: Populacao

¸~ Infinita: todos os resultados (cara ou coroa) em sucessivos lancamentos


Exemplo: Populacao ¸
de uma moeda.

¸~ com o
ii) AMOSTRA: e´ um subconjunto, necessariamente finito, tomado da populacao
´
proposito ¸~ sobre tal populacao.
de obter informacoes ¸~

iii) DADOS: Chamamos de dados os elementos da amostra.

iv) VARIAVEL´ : e´ qualquer caracteri tica que possa ser observada ou medida: cor de olhos,
estatura, estado civil, peso, etc.

´
Variaveis ¸~ (valor assumido pela variavel)
Variacoes ´
--------------------------------------------------------------------------------------
- cor - azul, verde, . . .
- no. de filhos - 0, 1, 2, . . .
- peso -40 kg, 51 kg, 52.3Kg,

´
As variaveis podem ser QUALITATIVAS (ou ´
CATEGORICAS) ou
´
QUANTITATIVAS (ou NUMERICAS).

´ Qualitativa: cor
Exemplo: Variavel
´ Quantitativa: peso, no. de filhos
Variavel

2
´ quantitativa que pode assumir qualquer valor real chama-se Variavel
Definição: Uma variavel ´
´
Continua.
~ chamadas Variaveis
Por outro lado, aquelas que so´ podem assumir valores inteiros sao ´
Discretas.

Exemplo: Variavel ´
´ Continua: peso
´ Discreta: no. de filhos
Variavel

¸~ fornecem variaveis
De modo geral, pode-se dizer que mensuracoes ´ ´
continuas e
¸~
contagem (ou enumeracoes), ´
variaveis discretas.

¸~ de Dados em Tabelas
1.5 Apresentacao

Esquema Geral:

´
Titulo
----------------------------------------------------------------
Cabecalho
¸  ´
Variavel Freq. %
----------------------------------------------------------------
classe 1 F i
classe 2 F i
: : :
classe k Fk ik
---------------------------------------------------------------
Total n 100,00
---------------------------------------------------------------
Rodape´  Fonte:

´
Uma tabela estatistica deve ser auto-suficiente.
Deve apresentar:

´
TITULO

- Deve ser objetivo e claro.


- E´ colocado na parte superior da tabela.
- Deve indicar:
- a natureza do fato estudado (o que?)
´
- as variaveis ´
escolhidas na analise do fato (como?)
- o local em que o mesmo foi observado (onde?)
´
- a epoca em que o mesmo foi observado (quando?)

3
CABECALHO
¸

- E´ a parte da tabela em que e´ designada a natureza do conteúdo de cada coluna (a


´
variavel, ^
tipos de frequencias).

RODAPÉ

E´ reservado para: Notas e Chamadas.


#
¸~ pertinentes.
Refere-se as observacoes

¸~ ou fornecedora dos dados e ano


´ pela sua organizacao
FONTE: Indica a entidade responsavel
~
da publicacao ~
¸ ou observacao
¸ do fato.

~es:
Observaço

1) Nenhuma "célula ou casela" deve ficar em branco, apresentando sempre um no. ou sinal:

´
- (hifen), ´
quando o valor numerico e´ nulo

^
.... (reticencia), ~ se dispoe
quando nao ~ de dado.

#
¸~ quando ha´ dúvida quanto a exatidao
? (interrogacao), ~ do valor numerico.
´

´
0 (zero), quando o valor numerico e´ muito pequeno para ser expresso pela unidade utilizada.

2) As tabelas devem ser fechadas no alto e embaixo por linhas horizontais.


~ serao
Nao ~ fechadas, #a direita e #a esquerda, por linhas verticais.
E´ facultativo o emprego de tracos ¸ verticais para a separacao¸~ de colunas no corpo da
tabela.

~ destacados.
3) Os totais e subtotais serao

¸~ que compreendem muitas tabelas, estas devem ser numeradas em ordem


4) Em publicacoes
crescente, conforme a ordem de aparecimento.

~
Regra com base nas "NORMAS DE APRESENTACAO ¸ TABULAR" aprovadas pela XVIII
´
´ Geral do Conselho Nacional de Estatistica.
Assembleia

4
Exemplo de Tabela:

´
Titulo  Tabela 1.1 Populacao ¸~ Brasileira da Regiao ~ Sul em 1965
-----------------------------------------------------------------
Cabecalho
¸  Estados ¸~
Populacao %
-----------------------------------------------------------------
Parana´ 7.000.000 43,75
Sta Catarina 3.000.000 18,75
R.G.do Sul 6.000.000 37,50
-----------------------------------------------------------------
Total 16.000.000 100,00
-----------------------------------------------------------------
Rodape´  Fonte: IBGE - 1967.

¸~ Grafica
1.6 Apresentacao ´
´
Os graficos devem ser auto-explicativos;

´
Devem ter sempre um titulo e fonte;

~ desfigure os fatos ou as relacoes


Devem ser construidos em uma escala que nao ¸~ que se
deseja destacar;

~ fique explicito
Podem vir acompanhados de legenda, caso nao ´ o nome da classe no
´
grafico.

¸~ graficas
As representacoes ´ ^
das tabelas de frequencias ´ de diagramas
podem ser atraves
´
(graficos ´
construidos ´
sobre o plano cartesiano) mapas e figuras geometricas, unidimensionais
ou bidimensionais.

´
Os diagramas, histogramas e poligonos ^
de frequencias ~ graficos
sao ´ representados sobre
o 1o. quadrante de um sistema de eixos cartesianos.
^
Representa-se no eixo y os valores das frequencias ´
e no eixo x os valores da variavel
(classes) em estudo.

5
Capítulo 2
Apresentação dos Dados Qualitativos

2.1 Apresentação Tabular


¸~ das classes e´ imediata, ja´ que a variavel
A constituicao ´ apresenta modalidades de
~
individualizacao ^
¸ espontanea.

As classes podem ser dispostas em ordem alfabetica´ ~ ser


ou, se desejar poderao
^
relacionadas em ordem crescente ou decrescente de frequencia.

Exemplo: ^
Tabela 1 : Assistencia Federal em 1985 aos governos locais
---------------------------------------------------------------------------
´
Auxilios Valores
~ de Dolares)
(em milhoes ´ %
----------------------------------------------------------------------------
Saúde 26.530 20%
Educacao¸~ 18.108 13.5%
Transporte 18.075 13.5%
Recursos Naturais 3.918 3%
Outros 7.625 6%
^
Assistencia Social 27.430 20%
^ # ^
Assistencia a Infancia 3.669 3%
Habitacao
¸ ~ 6.156 5%
Seguro Social 9.980 7%
Geral 12.620 9%
------------------------------------------------------------------------------
TOTAL 134.111 100%
------------------------------------------------------------------------------
Fonte: IBGE - 1967.

6
2.2 Apresentação Gráfica

2.2.1 Diagrama de Barras

´ de como se realacionam os valores da tabela a partir de dados observados.


Objetivo: Dar ideia

Construça~o:

E´ representado por retangulos


^ dispostos verticalmente, com base no eixo horizontal e
equidistantes.
¸~ entre qualquer dos retangulos
A separacao ^ deve ser menor do que a largura dos
^
retangulos.
^
Considerando-se bases de tamanhos iguais aos diversos retangulos, as alturas devem
^
indicar as frequencias correspondentes.

#
Sugesta~o: As vezes, por motivos de espaco ´
¸ ou para facilitar a leitura, costuma-se usar graficos
com as barras dispostas horizontalmente.
¸~ com muitas classes.
Isto ocorre no caso de legendas muito extensas ou distribuicao

7
8
2.2.2 Setograma (Pizza)

Objetivo: Comparar cada valor da tabela com o total.


^
Utiliza-se de preferencia ¸~ ou porcentagens.
para representar proporcoes

Construça~o:

´
Consiste de um circulo ´
dividido em setores, cujas areas ~ porporcionais #as
sao
porcentagens dadas.
~ com valores absolutos. Para isso, e´ preciso
E´ ilustrado com valores percentuais e nao
transformar os valores absolutos em porcentagens (%) utilizando-se a regra abaixo:

3600 -- 100%
 -- i

360 * i
Portanto, = 100

onde  : ^angulo do setor


#
i : porcentagem correspondente a classe da tabela

9
Observaça~o: Costuma-se colorir os setores de modo diferente, a fim de dar ^enfase aos
tamanhos relativos de cada um.

2.2.3 Diagrama Linear

¸~ do fenomeno.
´ da evolucao
Objetivo: Dar ideia ^
´
E´ empregado para representar tabelas temporais (dados dispostos por periodo de
tempo).

Construça~o: E´ obtido marcando-se, no plano cartesiano, os pares ordenados dados


^
pelas coordenadas tempo e frequencia observada correspondente, e a
seguir ligando-se esses pontos por meio de uma linha (segmento).

10
2.2.4 Cartograma

11
Capítulo 3
Apresentação de Dados Quantitativos
Distribuição de Frequência

´
Os dados numericos podem ser representados numa tabela (quadro) de forma agrupada
~ em intervalos.
ou nao
´
Costuma-se agrupar em intervalos os dados continuos.
´ quando a amostra de dados discretos for muito grande, agrupamo-os tambem.
Porem, ´
~ ´
Nada impede de nao agruparmos os dados continuos, quando a amostra for pequena.

~ agrupados em intervalos
Exemplo: a) dados nao

Número de Acidentes por dia na rodovia Dutra em Janeiro de 1977


-----------------------------------------------------------------------------
Número de acidentes/dia númsero de dias
-----------------------------------------------------------------------------
0 10
1 7
2 4
3 5
4 3
5 2
---------------------------------------------------------------------------
Total 31
---------------------------------------------------------------------------
Fonte: DNER

b) dados agrupados em intervalos

Altura dos Alunos da classe em marco ¸ de 1977


----------------------------------------------------------------------
Alturas (m) Número de alunos
----------------------------------------------------------------------
1.50 -- 1.60 5
1.60 -- 1.70 15
1.70 -- 1.80 17
1.80 -- 1.90 3
---------------------------------------------------------------------
Total 40
---------------------------------------------------------------------
Fonte: Secretaria da Escola

12
Sejam n: o tamanho da amostra e k: o número de intervalos.

¸~ dos dados.
ROL: e´ o arranjo dos dados (da amostra) em ordem crescente. E´ uma ordenacao

CLASSES: e´ um único valor observado ou um intervalo representando os dados.

^
FREQUENCIA ABSOLUTA SIMPLES DE UMA CLASSE ( Fi ) :
E´ o no. de vezes que o elemento aparece na amostra ou no. de elementos pertencentes a
uma classe.
k
 Fi = n
i=1

^
FREQUENCIA RELATIVA DE UMA CLASSE ( fi ):

Fi
E´ dada por fi = n , i=1, 2, . . ., k
e geralmente e´ expressa em porcentagem.

k
Observaça~o:  fi = 1.
i=1

^
FREQUENCIA ACUMULADA DE UMA CLASSE ( Fac ):
´ ^
E a soma das frequencias ´ e inclusive, a classe dada.
das classes anteriores ate,

~ descritas a seguir:
Exemplo: As notas de 32 estudantes de uma classe estao

6.0 0.0 2.0 6.5 5.0 3.5 4.0 7.0


8.0 7.0 8.5 6.0 4.5 0.0 6.5 6.0
2.0 5.0 5.5 5.0 7.0 1.5 5.0 5.0
4.0 4.5 4.0 1.0 5.5 3.5 2.5 4.5

¸~ das notas dos estudantes


Distribuicao
---------------------------------------------------
notas Fi fi Fac
---------------------------------------------------
0.0 -- 1.5 3 0.094 3
1.5 -- 3.0 4 0.125 7
3.0 -- 4.5 5 0.156 12
4.5 -- 6.0 10 0.312 22
6.0 -- 7.5 8 0.250 30
7.5 -- 9.0 2 0.062 32
----------------------------------------------------
Total 32 1
----------------------------------------------------

13
Capítulo 4
Apresentação de Dados Não Agrupados em Intervalos

Neste caso, cada categoria ou classe corresponde a um determinado valor observado


´ identifica-se uma classe com um único valor.
(valor da amostra), isto e,

4.1 Apresentação Tabular

Ilustraça~o Numérica:

¸~
Suponhamos que estamos interessados no estudo do "no. de dias de internacao", de 20
pacientes de um hospital.

Dados: 2 0 1 1 3 0 1 2 4 2 1 0 3 4 3 0 0 1 2 4

Rol: 0 0 0 0 0 1 1 1 1 1 2 2 2 2 3 3 3 4 4 4

¸~ do tempo de internacao
Distribuicao ¸~ num hospital
----------------------------------------------------------------
no. de dias Fi fi Fac
----------------------------------------------------------------
0 5 0.25 5
1 5 0.25 10
2 4 0.20 14
3 3 0.15 17
4 3 0.15 20
---------------------------------------------------------------
Total 20 1.00
--------------------------------------------------------------
Fonte: SUS 1980

~ e´ aconselhavel
NOTA: Este tipo de tabela nao ´ quando estamos trabalhando com
amostras grandes.

14
4.2 Apresentação Gráfica

´
Os graficos ~ uma ideia
dao ¸~ das medidas de posicao
´ da forma da distribuicao, ¸~ e dispersao
~
^
do fenomeno em estudo.

´
4.2.1 Grafico ~
em Bastao

¸~ marca-se no eixo das abscissas do sistema de coordenadas


Para sua construcao,
#
¸~ de frequencias.
cartesiana os pontos referentes as classes da distribuicao ^
#
Nestes pontos constroem-se perpendiculares cujos comprimentos sejam iguais as
^
frequencias.

15
´
4.2.2 Grafico ^
de Frequencia Acumulada

16
Capítulo 5
Apresentação de Dados Agrupados em Intervalos

5.1 Apresentação Tabular

Regras Gerais para elaborar uma Distribuiça~o de Freque^ncias para dados agrupados em
intervalos.

1) Ordenar os dados.

2) Determinar o valor de R, onde:

R = maior valor observado - menor valor observado.

´ da formula:
3) Calcular o no. de intervalos (k) atraves ´

k = 1 + 3.32*log10 (n) , k  Z

4) Calcular o tamanho (h) de cada intervalo:


R
h = k

5) Calcular Fi , fi , i=1, . . ., k e Fac para cada intervalo.

Ilustraça~o Numérica:

´
Considere uma amostra de 14 recem-nascidos, onde se observou o peso:

4.3 3.7 2.5 2.8 3.0 2.2 3.5 3.7 2.1 2.4 2.7 2.4 3.3

¸~ de Frequencias.
Arranjar os dados numa Distribuicao ^

Sol.:
Rol: 2.1 2.2 2.4 2.4 2.5 2.7 2.8 3.0 3.3 3.5 3.7 3.7 4.3

R = 4.3 - 2.1 = 2.2


n = 14
k = 1 + 3.32*log(14) = 4.8  k~
=5
h = 2.2
5 = 0.44  h~ = 0.5

17
¸~ dos Pesos de Recem-Nascidos
Distribuicao ´
----------------------------------------------------------------
Pesos Fi fi Fac
----------------------------------------------------------------
2.1 -- 2.6 5 0.36 5
2.6 -- 3.1 3 0.21 8
3.1 -- 3.6 2 0.14 10
3.6 -- 4.1 2 0.14 12
4.1 -- 4.6 2 0.14 14
---------------------------------------------------------------
Total 14 1.00
--------------------------------------------------------------

~es:
Observaço

1) As classes devem ser mutuamente exclusivas e exaustivas.

2) Devem ser evitadas classes do tipo "40 anos e mais", "menores de 20 anos"

´
3) Deve-se, sempre que possivel, utilizar intervalos com tamanhos iguais, o que permite uma
~
comparacao ^
¸ perfeita das frequencias dos intervalos.

~ superior ao no. de casas dos dados,


4) h deve ser expresso com um no. de casas decimais nao
i.e., ^ 3 casas decimais, h pode ter no maximo
´ se os dados tem ´ 3 casas decimais.

5) Os dados agrupados passam a assumir o valor medio ´ do intervalo. Portanto, quanto maior
for o tamanho do intervalo, menor precisao~ se obtera´ do fenomeno^ ´ maiores
analisado (i. e,
~ ~
serao as possibilidades de distorcao ´
¸ na analise ´
estatistica).

6) O processo de agrupamento em intervalos, geralmente inutiliza muitos detalhes originais dos


dados.
~ obdecer um criterio
Se nao ¸~ as medidas descritivas (que serao
´ para construcao, ~ vistas a
seguir) podem distorcer muito dos dados coletados.
Sua vantagem esta´ no aspecto global obtido.

18
5.2 Apresentação Gráfica
5.2.1 Histograma
^
Consiste de um conjunto de retangulos justapostos que tem:

´
i) as bases sobre um eixo horizontal (eixo dos X) com centro no ponto medio dos intervalos e
#
as larguras iguais as amplitudes dos intervalos.

^ ^ Fi
ii) cada retangulo do Histograma tem altura dada por: altura do retangulo = hi

caso as amplitudes dos intervalos sejam diferentes.

^
Se todos os intervalos tiverem a mesma amplitude, toma-se as alturas dos retangulos
# ^
numericamente iguais as frequencias dos intervalos.

Exemplo: Idade dos alunos da UNESP


-------------------------------
Idade Fi
-------------------------------
18 -- 22 11
22 -- 26 6
26 -- 30 2
30 -- 34 1
34 -- 38 2
-------------------------------
Total 22
-------------------------------

19
´
5.2.2 Poligono ^
de Frequencia

´
Consta de um poligono ´
cujos vertices ~ obtidos pela interseccao
sao ¸~ de cada ponto medio
´
^
do intervalo e sua respectiva frequencia.

Acrescenta-se os segmentos PQ e RS que vao ~ ate´ os pontos medios


´ imediatamente
^ ~
inferior e superior no eixo X e cujas frequencias sao nulas.

Exemplo:

´
O acrescimo ´
dos segmentos PQ e RS se faz necessario, ´
para que a area total delimitada
#
´ ^
pelo poligono e o eixo das abscissas seja proporcional a frequencia ¸~
total da distribuicao.

Observaça~o: Pode-se tambem ^


´ obte-lo, ´
ligando-se os pontos medios ^
dos topos dos retangulos
de um histograma.

´
Neste caso, o acrescimo ´
dos segmentos PQ e RS se faz necessario, para que a soma das
^ # ´ ^
´
areas dos retangulos ´
do histograma seja igual a area total limitada pelo poligono de frequencia
e o eixo dos X.

20
´
5.2.3 Ogiva de Galton (Poligono ^
de Frequencia Acumulada)

¸~ das medidas separatrizes (mediana, quartil,...).


E´ útil para determinacao
A Ogiva e´ a representacao ¸~ grafica
´ ^
da frequencia acumulada de uma distribuicao¸~ de
^
frequencias.
E´ uma poligonal que parte do limite inferior do 1o. intervalo e para cada limite superior
^
indica a frequencia acumulada do intervalo.

Exemplo: ---------------------------------------------
idades Fi Fac
---------------------------------------------
18 -- 22 11 11
22 -- 26 6 17
26 -- 30 2 19
30 -- 34 1 20
34 -- 38 2 22
------------------------------------------------
Total 22
-----------------------------------------------

21
22
Capítulo 6
Dados Bivariados

Suponhamos que temos duas variaveis ´ ´


(caracteristicas ´
observaveis) A e B. Um dos
´ ´ ¸~
interesses da Estatistica e´ descobrir possiveis relacoes ´
existentes entre as variaveis A e B.
Exemplo: Podemos estar interessados em verificar a relacao ¸~ existente entre fumante e
^
cancer ~
no pulmao.

6.1 Dados Qualitativos Bivariados

Exemplo: Afirma-se que certa droga e´ eficiente na cura de resfriados. Em um experimento com
# ´
164 pessoas resfriadas essa droga foi dada a metade das pessoas sendo pilulas de acúcar
¸ dadas
#
¸~ dos pacientes ao tratamento estao
a outra metade. As reacoes ~ registradas na tabela abaixo:

-----------------------------------------------------------------------------------------------
Resultado Resultado Sem TOTAL
Positivo Negativo ~
Reacao
¸
-----------------------------------------------------------------------------------------------
Droga 58 10 8 76
Acúcar
¸ 44 8 36 88
-----------------------------------------------------------------------------------------------
Total 102 18 44 164
-----------------------------------------------------------------------------------------------

Existe diferenca ¸~ produzidas pela droga e pelas pilulas


¸ significativa nas reacoes ´ de
acúcar?
¸
´
Para verificarmos possiveis ¸~ entre as duas variaveis
relacoes ´ qualitativas A e B podemos
# ^
contruir tabelas equivalentes a tabela anterior com as frequencias relativas de cada categoria.

Exemplo: 1) Comparar os dois grupos (droga e acúcar)


¸ ¸~ em cada
para varificar se as proporcoes
~ iguais ou nao.
grupo sao ~ Para isto contruimos a tabela:

-----------------------------------------------------------------------------------------------
Resultado Resultado Sem TOTAL

23
Positivo Negativo ¸~
Reacao
-----------------------------------------------------------------------------------------------
Droga 58/76 10/76 8/76 76/76
Acúcar
¸ 44/88 8/88 36/88 88/88
-----------------------------------------------------------------------------------------------

2) Comparar a droga e acúcar


¸ ¸~
com suas respectivas reacoes:

-----------------------------------------------------------------------------------------------
Resultado Resultado Sem TOTAL
Positivo Negativo ~
Reacao
¸
-----------------------------------------------------------------------------------------------
Droga 58/164 10/164 8/164 76/164
Acúcar
¸ 44/164 8/164 36/164 88/164
-----------------------------------------------------------------------------------------------
Total 102/164 18/164 44/164 164/164
-----------------------------------------------------------------------------------------------

6.2 Dados Quantitativos Bivariados

´
Suponhamos que temos duas variaveis quantitativas X e Y onde foram observados n
´
valores para cada variavel.
Neste caso, os dados sao~ representados por n pares (X , Y ) , (X , Y ) , . . . , (Xn ,
Yn ) representados pela tabela:

X Y
----------
X Y
X Y
: :
Xn Yn
----------

´
Numa analise ´
estatistica ~
preliminar podemos formular as seguintes questoes:

´
i) As variaveis ~ realacionadas?
sao
ii) Qual e´ a forma de relacionamento entre as duas variaveis?
´
~
iii) Como podemos medir esta relacao?
¸
iv) Como podemos prever uma variavel ´ a partir do conhecimento da outra?
Se considerarmos X e Y separadamente, nao ~ podemos responder a essas questoes.
~

24
¸~ visual do relacionamento entre as duas variaveis
Uma verificacao ´ X e Y pode ser dada a
~
´
partir de graficos de X versus Y (DIAGRAMA DE DISPERSAO).

25
~ sanguinea
Exemplo: A tabela abaixo nos da´ a idade e a pressao ´ correspondente a um grupo de
12 mulheres.

Idade 56 42 72 36 63 47 55 49 38 42 68 60
-------------------------------------------------------------------------------------------
~
Pressao 147 125 160 118 149 128 150 145 115 140 152 155
´
Sanguinea

¸~ entre X e Y?
Existe alguma relacao

Sol:

Uma inspecao¸~ do diagrama de dispersao


~ acima nos revela a existencia
^ ¸~
de uma relacao
linear entre X e Y.

26
EXERCÍCIO: Considerando as informações sobre os alunos da disciplina de Inferência
Estatística da UEM, contidas na Tabela 01, abaixo, construa um gráfico adequado para
representar as variáveis:

a) sexo
b) estado civil
c) transporte
d) meio de informação segundo o sexo dos alunos

27
1a Lista de Exercícios de Estatística Descitivia

1) A tabela a seguir fornece os investimentos e reinvestimentos estrangeiros no Brasil nos anos


de 1973 a 1976:

´
Pais 1973 1974 1975 1976
------------------------------------------------------------------------------------
EUA 1.717.387 2.022.477 2.395.222 2.901.246
RFA 520.776 709.767 871.352 1.118.029
Japao~ 318.260 598.024 841.162 1.005.100
´
Suica¸ 357.049 559.621 735.509 980.729
Canada´ 360.152 401.363 410.839 482.032
Inglaterra 324.477 401.088 430.252 420.674
Franca ¸ 205.467 241.942 300.066 326.261
-------------------------------------------------------------------------------------
Fonte: Revista Visao ~ - 14/nov/77

Construir: a) um diagrama de barras para os EUA;


´
b) um grafico ´
de setores para 1976, referente aos 7 paises;

¸~ de um
2) Os seguintes dados referem-se ao número de ´itens defeituosos na fabricacao
¸~
determinado produto, em 20 dias de observacao.

3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6.

Pede-se:

¸~ de frequencia;
a) construir a distribuicao ^
~ ´
b) construir o diagrama de Bastao e o grafico da freq. acumulada;
^
c) a ocorrencia de mais de 6 defeitos corresponde a que porcentagem do total de defeitos
encontrados?

´
3) Os dados abaixo referem-se aos montantes (em milhares de dolares) ´
de 32 emprestimos
pessoais em uma companhia financeira.

6.0 0.0 2.0 6.5 5.0 3.5 4.0 7.0


8.0 7.0 8.5 6.0 4.5 0.0 6.5 6.0
2.0 5.0 5.5 5.0 7.0 1.5 5.0 5.0
4.0 4.5 4.0 1.0 5.5 3.5 2.5 4.5

28
¸~ de frequencia;
a) construir a distribuicao ^
´
b) construir o histograma, o poligono ^
de frequencias e a ogiva de Galton;
´
c) qual a porcentagem dos individuos ´
que tiveram menos de 4 mil dolares ´
de emprestimos?

¸~ e as vendas da indústria automobolistica


4) A tabela a seguir retrata a producao ´ no Brasil,
´
referente ao periodo 76/82, em unidades:

´
Pais ¸~
Producao Vendas
-----------------------------------------------
1976 985.469 974.594
1977 919.239 908.664
1978 1.068.194 1.067.343
1979 1.127.966 1.121.245
1980 1.165.206 1.118.610
1981 780.852 800.777
1982 859.254 861.207
------------------------------------------------
Fonte: ANFAVEA

Com base na tabela citada, elaborar:


´
a) grafico ¸~ e vendas;
de Barras para producao
´
b) grafico ¸~ e vendas.
Linear para producao

5) Completar os dados que faltam:

------------------------------------------------------
Valores Fi fi Fac
------------------------------------------------------
1 4 0.08
2 4
3 0.16 16
4 7 0.14
5 5 28
6 38
7 7 0.14 45
8
---------------------------------------------------------

29
6) Em cada um dos seguintes casos indique se os dados podem ser considerados como dados
´
qualitativos ou quantitativos (numericos), ´
neste último caso dizer se e´ continuo ou discreto.

¸~ por minuto em adultos normais.


a) Número de pulsacoes
b) Lugar de nascimento de uma pessoa.
´
c) Causa de obito ´
de um individuo.
d) Conteúdo de albumina no sangue.
e) Número de atendimentos em um Pronto Socorro durante 24 horas.
f) Aumento de Peso em cobaias submetidas a uma determinada dieta.

´
7) Montar uma tabela para representar o número de casos da molestia ´ Z, 1970/1974
X, na area
´
(dados hipoteticos), sabendo-se que em 1970 ocorreram 8.000 casos da doenca, ¸ em 1971
7.600, em 1972 7.200, em 1973 7.300 e em 1974 teve-se 7.000 casos.
´
Construir os graficos ´
que se julgar necessario.

¸~ residente estimada, rural e urbana, para o Brasil, em


8) A tabela seguinte mostra a populacao
~ de pessoas, de acordo com a Fundacao
milhoes ¸~ IBGE:

Ano 1972 1973 1974 1975 1976 1977 1978 1979


-------------------------------------------------------------------------------
Pop. Urbana 56.6 59.0 61.5 64.1 66.7 69.5 72.3 75.2
-------------------------------------------------------------------------------
Pop. Rural 42.1 42.4 42.7 43.1 43.4 43.8 44.1 44.5
´
Representar os dados empregando um grafico linear e de barras.

´
9) Segundo o Boletim Estatistico do IBGE, durante o ano de 1973, foram aplicadas as
seguintes vacinas no Servico
¸ de Saúde dos Postos, Estado do Rio de Janeiro: 81335 vacinas
´
antivariolicas, ´
23012 antiamarilicas, ´
12058 anticolericas, 2155 antitificas, 12276 de outras
´
especies.
^
a) Organize esses dados em uma tabela, indicando frequencias absolutas e percentagens.
´
b) Construa um grafico ´
de barras verticais e um grafico de setores.

´
10) Calcule a porcentagem de cada diagnostico para os dados apresentados na tabela abaixo.
Faca ´
¸ um grafico de barras.

30
´
Tabela 1: Diagnostico ´
de biopsias de mama, feitas entre 1963 e 1972, inclusive, no
Hospital dos Servidores do Estado, RJ.
---------------------------------------------------
´
Diagnostico Freq.
----------------------------------------------------
Displasia 1.010
Tumor Benigno´ 344
Tumor Maligno´ 329
´
Inflamatoria 54
Diversos 288
---------------------------------------------------
Fonte: PIZA et alii (1977)

¸~ previas
11) Num hospital foi estudado o número de gestacoes ´ ~
e o peso de 16 maes.
Os dados observados foram os seguintes:

peso 69,1 57,3 72,7 54,3 68 72,5 58,7 64 62,1 65,9 60,6 49 59,3 66 45 60,4

¸~ 1
no. de gestacoes: 1 2 0 1 3 2 1 0 1 2 4 3 0 2 2

¸~ de frequencia
Elaborar uma distribuicao ^ ´
e construir os graficos para cada conjunto de dados.

31
Capítulo 7
Medidas Descritivas
7.1 Introdução
Uma outra maneira de se resumir os dados de uma variável quantitativa, além de tabelas
¸~ de frequencias)
(distribuicoes ^ e gráficos, é apresentá-los na forma de valores numéricos,
denominados medidas descritivas.
Agora estudaremos as medidas que possibilitem representar um conjunto de dados
quantitativos de forma resumida em termos de centralidade e variabilidade da amostra.
As medidas descritivas auxiliam a análise do comportamento dos dados.

Classificam-se as medidas descritivas como:

^
A) Medidas de Tendencia Central
~
B) Medidas de Dispersao
¸~ (Separatrizes)
C) Medidas de Posicao
D) medidas de assimetria e de curtose.

7.2 Medidas de Tendência Central


7.2.1 Introdução

As medidas de tendência central são assim denominadas por indicarem um ponto em


torno do qual se concentram os dados. Este ponto tende a ser o centro da distribuição dos
dados.

~
As medidas de tendência Central de maior uso sao:

´ aritimetica
A) media ´
B) mediana
C) moda
_
´
7.2.2 MEDIA ´
ARITMETICA X

Seja x , x , . . . , xn os dados
_ amostrais e n: tamanho da amostra.
´ ´
A MEDIA ARITMETICA X dos valores x , x , . . . , xn e´ definida por:
n
_  xi
i=1
X= n

32
Exemplo: Sete pacientes foram escolhidos, ao acaso, em um hospital, onde se observou o
número de dias que estes permaneceram internados.
Obteve-se: 1 8 4 5 4 3 _2
´ aritmetica
Calcule a media ´ ´
X (o tempo medio ^
de permanencia no hospital).
7
_  xi
¸~ = 3.85 ~
i=1 1+8+4+5+4+3+2 27
Solucao: X= 7 = 7 = 7 =4
_
X = 4 dias

Portanto, o tempo medio ^


´ de permanencia no hospital e´ de 4 dias.

~es:
Observaço
_
´
1) Para o calculo de X com os dados da tabela acima, foi suposto que, todos os
´
individuos ´
com idades em um determinado intervalo tinham a idade dada pelo ponto medio do
~ corresponde #a realidade (ver Bercho,
intervalo, o que, em geral, nao ´ pg. 72, 74).

´
2) A media ´
aritmetica ~ pode ser calculada quando o 1o. ou o último intervalo
nao
tiverem extremos indefinidos.

_
~es Gerais sobre X: A media
Observaço ´ aritmetica
´ de um conjunto de dados:

1) e´ da mesma forma da variavel


´ considerada
2) Sempre existe e e´ única (assume um único valor)
^
3) Sofre muito a influencia de valores extremos (muito grandes ou muito pequenos).

7.2.3 MEDIANA (Med)

A Mediana e´ o valor central de um rol, isto e,


´ a medida que divide o rol em duas partes
iguais.

Consideraremos dois casos:

i) Quando n é ímpar - neste caso a mediana pertence ao rol.

Exemplo: Consideremos os dados 1 8 4 5 4 3 2.

33
¸~ Rol: 1
Solucao: 2 3 4 4 5 8

~ o elemento que divide o rol em duas partes iguais e´ Med=4.


Como n=7 e´ ´impar, entao

ii) Quando n é par : neste caso, a mediana e´ a media


´ dos dois valores centrais.

^
Exemplo: Os dados abaixo representam os tempos de sobrevivencia ´
(media) de 6 cobaias
´
submetidas a um experimento medico:
3 15 46 64 126 623

¸~
Solucao: Rol: 3 15 46 64 126 623

X() + X() 46 + 64 110


Med = 2 = 2 = 2 = 55

~es Gerais:
Observaço

~ e´ afetada pela grandeza dos valores extremos (aberrantes) e sim pelo


1) A mediana nao
número de elementos da amostra.

¸~ e´ assimetrica,
2) Se a distribuicao ´ ¸~ melhor do que a
a mediana e´ uma medida de posicao
´ aritmetica.
media ´

~ poder ser tratada algebricamente.


3) Sua grande desvantagem reside no fato de nao ´

7.2.4 MODA (Mo)

A MODA de um conjunto de dados amostrais e´ o valor (ou valores) mais frequentes no


rol.

Observaça~o:

1) Pode haver mais de uma moda.

^ igual frequencia,
2) se "todos" os valores tem ^ ~ tem
diremos que o conjunto de dados nao
moda.

Exemplo: i) 10 10 12 13 18
Mo = 10 (conjunto unimodal)

34
ii) 100 100 200 200 300 600
Mo = 100 e Mo = 200 (conjunto bimodal)

iii) a) 1 2 3 4 5 6
 Mo (conjunto amodal)

b) 1 1 3 3 5 5
 Mo

´
3) O fato de um conjunto de dados apresentar mais de uma moda pode ser um indicio
de heterogeneidade dos dados.

¸~ acidentais
4) Um aspecto importante a ressaltar e´ que podemos distinguir as flutuacoes
(outliers) da amostra dos verdadeiros valores modais.

~ ´
7.2.5 RELACAO
¸ ENTRE MEDIA , MEDIANA E MODA

¸~ simetrica,
Em uma distribuicao ´ observa-se que a Média  Mediana  Moda (Figura a)

Em uma distribuição assimétrica, observa-se que:

i) Média  Mediana  Moda (Figura b) ou


ii) Média  Mediana  Moda (Figura c) .

35
^
7.2.6 ESCOLHENDO UMA MEDIDA DE TENDENCIA CENTRAL

´
Tendo a media, ¸~ e´
a mediana e a moda o mesmo objetivo, em que condicoes
´ empregar cada uma dessas medidas?
recomendavel

´ aritmetica
A media ´ ´
´ de longe, a mais usada dentre as estatisticas
e, ^
de tendencia central,
mas nem sempre e´ ela quem melhor representa um conjunto de dados.
Por exemplo, suponhamos _ os dados 1, 1, 1, 1, 1, 2, 2, 2, 2, 20.
A media aritmetica e X = 3.3 , enquanto a mediana e´ Med = 1.5 , o que e´ bem mais
´ ´ ´
representativo, dado que a maior parte das observacoes ¸~ e´ 1 ou 2.
O fato e´ que a media
´ aritmetica
´ e´ muito influenciada por valores extremos, tal como 20
no exemplo dado, enquanto que a mediana nao ~ e´ afetada por esses valores.
Quando o tamanho da amostra e´ grande, esta desvantagem da media ´ torna-se menos
importante.
´
A proposito ´
de analises ´
estatisticas, ´ apresenta, sobre a mediana, a vantagem de
a media
´ de manipular algebricamente.
ser mais facil ´
A moda e´ a menos empregada.
Um confronto mais alargado necessita do conceito de robustez, que infelizmente, nao ~
cabe no presente estudo.

7.3 Medidas de Dispersão (ou de Variabilidade)


7.3.1 Introdução

´
Os metodos ´
estatisticos ~ especial ^enfase ao estudo da variacao.
dao ¸~
Uma medida de posicao, ¸~ como a media ´ por exemplo, por si so´ e´ insuficiente para
descrever uma populacao.
¸~ ~
Duas populacoes
¸ ´
podem ter a mesma media, mas diferir muito no
~
grau de variacao
¸ de seus valores.
Consideremos
_ ^ amostras: a) 4, 4, 4 b) 3, 4, 5 c) 0, 4, 8. Todas tem
as tres ^ a mesma
´
media, ~
ou seja, X = 4; mas na amostra a) nao existe variacao~ ~
¸ em c) e´ maior do que
¸ e a variacao
~ ´
^ amostras de caracteristicas
em b). Sao portanto tres diferentes.
As medidas de dispersão auxiliam as medidas de tendência central a descrever o
conjunto de dados adequadamente.

As medidas de dispersao ~ (ou medidas de variabilidade) sao ~ medidas que permitem


¸~
quantificar a variacao, ou ainda o grau de afastamento (espalhamento), dos dados em torno da
´
media. As medidas de dispersao~ de maior uso sao:
~ ^
i) variancia
~
ii) desvio padrao.

Observaça~o: De modo geral, se consideramos a variabilidade em torno de cada medida de


¸~ as medidas de dispersao
posicao, ~ servem para verificarmos a representatividade destas
medidas.

36
^
7.3.2 VARIANCIA AMOSTRAL (S )
n
_  xi
i=1
´
Seja x , x , . . ., xn um conjunto de dados com media X = n , define-se
^
VARIANCIA AMOSTRAL por:
n _ 
xi  X
S = i=1
n1

n 
n  x i 
xi 
 i=1
n
´
Uma formula ´
analoga, ´ S 
e: i=1
n1

^
Exemplo: Calcular a variancia, S , da seguinte amostra: 5 8 10 12 15

Sol: xi xi
---------------
5 25
8 64
10 100
12 144
15 225
---------------
50 558
n 
n  x i 
xi - i=1
n
Usando S = i=1
n-1 , tem-se

558 - 505
S = 5-1 = 14.5

Portanto, S = 14.5.

~
7.3.3 DESVIO-PADRAO (S)
~ ^
Define-se DESVIO-PADRAO (S) como sendo a raiz quadrada positiva da variancia
(S ).

~es: 1) Por definicao


Observaço ¸~ S e S sao
~ nao-negativos
~ e podem assumir qualquer valor maior
^ o mesmo valor, i.e.,
ou igual a zero. O valor "zero" e´ obtido quando todos os dados tem ´
~ ~
quando nao ha´ variacao
¸ alguma entre os valores dos dados.

37
~ tem as mesmas propriedades que a variancia
^ #
2) O desvio-padrao e seu uso e´ as vezes preferido,
~ que os dados (mesma unidade de medida) enquanto que a
uma vez que tem igual dimensao
^
variancia ~ do quadrado dos dados.
tem a dimensao

~
7.3.4 COEFICIENTE DE VARIACAO
¸ (DE PEARSON) (C.V.)

¸~ dos dados em torno da media.


E´ uma medida relativa do grau de concentracao ´ E´
definida por:
CV = XS_ .
_
~ e X e´ a media.
onde S e´ o desvio-padrao ´
~
Observaça o.: O CV independe das unidades em que foram medidos os dados.

Aplicaça~o: O coeficiente de variacao


¸~ e´ uma medida valiosa para comparar a variacao
¸~ (o grau
de homogeneidade) entre dois conjuntos de dados (duas distrib. de Freq.) medidos em unidades
diferentes.
´
Ou ainda, quando apresentam medias diferentes, embora suas unidades de medidas
sejam iguais.

Exemplo: Suponhamos que determinado fornecedor "A" de parafusos tenha enviado ao


Departamento de Compras de uma empresa uma amostra de 2000 parafusos, de comprimento
variando entre 101 e 113 mm. Efetuaram uma analise´ e encontrou-se:
´ do parafuso = 107.9 mm
Comprimento medio
~ do comprimento = 2.72 mm
desvio-padrao
Admitindo-se um fornecedor "B", que apresentou um lote deste mesmo parafuso com o
mesmo no. de pecas:
¸
´ do parafuso = 108 mm
Comprimento medio
~ do comprimento = 1.08 mm
desvio-padrao
Qual o lote que voce^ escolheria se fosse o comprador?

S
_
Sol: Aplicando-se o CV = X , temos:

2.72
- para o fornecedor A, CVA = 107.9 = 0.0252 ou 2.52%

1.08
- para o fornecedor B, CVB = 108 = 0.01 ou 1%

Pelos resultados, o lote do fornecedor (B) apresenta menor CV do que o lote do


fornecedor (A).
Logo, o lote escolhido seria do fornecedor (B).

38
~
7.3.5 RELACAO
¸ ENTRE AS MEDIDAS DE VARIABILIDADE DE DUAS
~
DISTRIBUICOES
¸ DISTINTAS

Examinando a figura a seguir podemos dizer:

~ da distribuicao
a) o desvio-padrao ¸~ A e´ maior do que o da distribuicao
¸~ B, i. e,
´
SA  SB .

´
b) as medias ~ iguais, i. e,
sao ´ _ _
XA = XB .

¸~ da distribuicao
c) o coeficiente de variacao ¸~ A e´ maior do que o da distribuicao
¸~ B, i. e,
´

CVA  CVB .

7.4 Separatrizes
Estas medidas são valores que ocupam posições no conjunto de dados, em rol,
dividindo-o em partes iguais e podem ser:

7.4.1 QUARTIS (Qi )

Os quartis dividem um conjunto de dados (ordenados de forma crescente) em quatro


partes iguais. Há três quartis correspondentes, respectivamente:

--------------|---------------|---------------|---------------
Q Q Q

39
Exemplo 1: Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36

Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

  15

2  40

3  43

Exemplo 2: Amostra ordenada: 7, 15, 36, 39, 40, 41

  15

3936
2    37.5

3  40

7.4.2 DECIS (Di )

¸~ de freq. em 10 partes iguais.


Os Decis (Di ) dividem o rol ou a distribuicao

-----|-----|-----|-----|-----|-----|-----|-----|-----|-----

D D D D D5 D6 D7 D8 D9

7.4.3 PERCENTIS (Pi )

¸~ de freq. em 100 partes iguais.


Os Percentis (Pi ) dividem o rol ou a distribuicao

-----|-----|---------------|-------------------|-----|-----
P P . . . P50 ... P98 P99

40
A seguir são apresentados alguns dos percentis mais usados:

41
Para os dados em rol, o cálculo das medidas separatrizes é dado por:

        

onde  é a parte inteira de  e  a parte fracionária (ou decimal).

42
´
2a Lista de Exercicios ´
de Estatistica Descritiva

1) Uma amostra de 20 trabalhadores na producao¸~ de uma pequena companhia apresentou os


´
seguintes salarios ´
para uma dada semana, em dolares:
$140 ; 140 ; 140 ; 140 ; 140 ; 140 ; 140 ; 140 ; 155 ; 155
$165 ; 165 ; 180 ; 180 ; 200 ; 205 ; 225 ; 230 ; 240

´ , mediana e moda
Determinar a) media
^
b) variancia ~ e coeficiente de variacao
, desvio-padrao ¸~
o o
c) 1- e 3- quartis.
d) Tabelar os dados acima e repetir os ´itens a) , b) e c).

2) A tabela abaixo mostra a distribuicao, ¸~ em toneladas, das cargas maximas


´ suportadas por
certos cabos fabricados por uma companhia.
-----------------------------------------------
´
Carga Maxima (ton.) N-o de cabos
-----------------------------------------------
9.3 -- 9.7 2
9.7 -- 10.1 5
10.1 -- 10.5 12
10.5 -- 10.9 17
10.9 -- 11.3 14
11.3 -- 11.7 6
11.7 -- 12.1 3
12.1 -- 12.5 1
-----------------------------------------------
Total 60

´ , mediana e moda
Determinar: a) media
^
b) variancia ~ e coeficiente de variacao
, desvio-padrao ¸~
c) 1-o e 3-o quartis.
d) 4-o decil e 80-o percentil

~ tem dois tipos de valvulas, ^ as



3) Uma indústria de valvulas de televisao _ ´ ´
A e B. As valvulas tem
¸~
duracoes ´
medias de XA = 1495 horas e XB = 1875 horas, respectivamente, e os desvios
~
padroes de SA = 280 horas e SB = 310 horas. Qual indústria produz valvulas ´ mais
^
homogeneas?

43
^
4) Dado o histograma abaixo, no interior de cujos retangulos ^
foram anotadas as frequencias
´
absolutas, localize a media, a mediana e a moda:

´
5) Dada a figura a seguir (poligono ^
de frequencia), ¸~ sera?
o primeiro quartil da distribuicao ´

¸~ de frequencias
6) A tabela seguinte fornece a distribuicao ^ ¸~ do nivel
das medicoes ´ ´
de calcio no
soro (em mg/100ml) em uma amostra 15 adultos normais.

´
Niveis de ^
Frequencia
´
Calcio____________________________
_____
8,0----9,0 1
9,0----10,0 5
10,0----11,0 9
11,0----12,0 7
12,0----13,0
_______________________________3__
Total 25

Determinar as seguintes medidas: ´


a) media
b) mediana
c) moda
^
d) variancia
e) Q , D7 e P80

OBS: Q e´ o primeiro quartil D7 e´ o setimo


´ decil P80 e´ o octagesimo
´ percentil

44
7) Consideremos os seguintes dados: 1 1 1 1 1 2 2 2 2 20
^
Determine as medidas de tendencia ´
central (media, ^
moda e mediana) e a variancia.
^
Qual ou quais das medidas de tendencia central representam melhor os dados acima.

´
8) Realiza-se uma prova de Estatistica para duas turmas, os resultados foram
os seguintes: _
-Turma A: X _ = 5 e  = 2,5
-Turma B: X = 4 e  = 2
^
Qual turma que apresentou resultados mais homogeneos? Justifique.

´
9) Em uma maternidade foram fornecidos os seguintes dados sobre peso, em quilos, de recem-
nascidos prematuros:

Peso ao nascer No. de prematuros


__(em
____________________________________
Kg) nascidos vivos_________
menos de 1,0 2
1,0---1,5 6
1,5---2,0 9
2,0---2,5 5
__
mais
_______________________________
de 2,5 3 ______________
Total 25

^
Que medida de tendencia ¸~
central descreve mais adequadamente a distribuicao?
Justifique sua resposta.

~ os resultados de um teste psicologico


10) Na tabela abaixo estao ´ aplicado a 200 adolescente:

Pontos ^
Frequencia
14,5 --- 24,5 10
24,5 --- 29,5 24
29,5 --- 34,5 38
34,5 --- 39,5 54
39,5 --- 44,5 22
44,5 --- 49,5 18
49,5 --- 54,5 22
54,5 --- 59,5 12
Total 200

´
a) Quantos pontos, no minimo, o adolescente deve obter para que fique entre os 100
melhores?

´
b) Quantos pontos, no minimo, o adolescente deve obter para se classificar entre os 25%
melhores?

45

Você também pode gostar