Você está na página 1de 65

1

UNIVERSIDADE FEDERAL DO MARANHO


CENTRO DE CINCIAS EXATAS E TECNOLOGIA
DEPARTAMENTO DE MATEMTICA
PROF. ALDIVAM ALBUQUERQUE





APOSTILA DE ESTATSTICA DESCRITIVA

2




1 INTRODUO
Histria da Estatstica
As primeiras aplicaes da estatstica estavam voltadas para as necessidades
de Estado, na formulao de polticas pblicas, fornecendo dados
demogrficos e econmicos administrao pblica. A abrangncia da
estatstica aumentou no comeo do sculo XIX para incluir a acumulao e
anlise de dados de maneira geral. Hoje, a estatstica largamente aplicada
nas cincias naturais, e sociais, inclusive na administrao pblica e privada.
Seus fundamentos matemticos foram postos no sculo XVII com o
desenvolvimento da teoria das probabilidades por Pascal e Fermat, que surgiu
com o estudo dos jogos de azar. O mtodo dos mnimos quadrados foi descrito
pela primeira vez por Carl Friedrich Gauss cerca de 1794. O uso de
computadores modernos tem permitido a computao de dados estatsticos em
larga escala e tambm tornaram possvel novos mtodos antes impraticveis.
Etimologia
O termo estatstica deriva do neolatim statisticum collegium ("conselho de
Estado") e do Italiano statista ("estadista" ou "poltico"). O alemo Statistik,
introduzido pelo primeira vez por Gottfried Achenwall (1749), designava
originalmente a anlise de dados sobre o Estado, significando a "cincia do
Estado" (ento chamada aritmtica poltica (political arithmetic) em ingls). A
palavra adquiriu o significado de coleta e classificao de dados em geral
atravs de Sir John Sinclair.
Assim, o propsito original da Statistik era fornecer os dados a serem usados
pelo governo e outras organizaes. A coleta de dados sobre estados e
localidades continua, em grande parte atravs de rgos estatsticos nacionais
e internacionais. Em particular, os censos fornecem informao regular sobre
as populaes.
Origens na probabilidade
Os mtodos matemticos da estatstica emergiram da teoria das
probabilidades, que remonta correspondncia entre Pierre de Fermat e Blaise
Pascal (1654). Christiaan Huygens (1657) deu o tratamento cientfico mais
antigo que se conhece sobre o assunto. A obra pstuma Ars Conjectandi
(1713) de Jakob Bernoulli e Abraham de Moivre, The Doctrine of Chances
(1718) tratou o assunto como um ramo da matemtica.
[1]
Na era moderna, a
3

obra de Kolmogorov tem sido til na formulao dos modelos fundamentais da
teoria das probabilidades, imprescindveis estatstica.
A teoria dos erros remonta obra pstuma Opera Miscellanea (1722) de Roger
Cotes, mas uma edio de memrias preparada por Thomas Simpson em 1755
(impressa em 1756) aplicou pela primeira vez a teoria discusso dos eros na
observao. A reimpresso (de 1757) dessas memrias estabelece o axioma
de que erros positivos e negativos so igualmente provveis, e que existem
certos limites dentro dos quais todos os erros iro ocorrer; erros contnuos so
discutidos e fornecida uma curva de probabilidades.
Pierre-Simon Laplace (1774) fez a primeira tentativa de deduzir a regra para a
combinao de observaes dos princpios da teoria das probabilidades. Ele
representou a lei das probabilidades dos eros atravs de uma curva. Ele
deduziu uma frmula para a mdia de trs observaes. Ele tambm deu (em
1781) uma frmula para a lei de 'facilidade de erro' (um termo devido a Joseph
Louis Lagrange, 1774), mas que levou a equaes no tratveis. Daniel
Bernoulli (1778) introduziu o princpio do produto mximo de probabilidade de
um sistema de erros concorrentes.
O mtodo dos mnimos quadrados, que foi usado para minimizar erros na
medio de dados, foi publicado independentemente por Adrien-Marie
Legendre (1805), Robert Adrain (1808) e Carl Friedrich Gauss (1809). Gauss
usou o mtodo no sua famosa predio de onde se localizava o planeta ano
Ceres. Outras provas foram dadas por Laplace (1810, 1812), Gauss (1823),
James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W. F. Donkin
(1844, 1856), John Herschel (1850) e Morgan Crofton (1870).
Outros que contriburam foram Ellis (1844), De Morgan (1864), Glaisher (1872)
e Giovanni Schiaparelli (1875). A frmula de Peters (1856) para r, o ero
provvel de uma nica observao, bastante conhecida.
No sculo XIX, autores que trataram da teoria geral incluem Laplace, Sylvestre
Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872),
Hermann Laurent (1873), Liagre, Didion e Karl Pearson. Augustus De Morgan e
George Boole fizeram melhorias na apresentao da teoria.
Adolphe Quetelet (1796-1874), outro importante fundador da estatstica,
introduziu a noo de "homem mdio" (l'homme moyen) como um meio de
compreender fenmenos sociais complexos como taxas de criminalidade, de
casamento e de suicdio.
A estatstica hoje
Durante o sculo XX, a criao de instrumentos precisos para a agronomia,
sade pblica (epidemiologia, bioestatstica, etc.), controle de qualidade
4

industrial e propsitos econmicos e sociais (taxa de desemprego,
econometria, etc.) necessitavam avanos substanciais nas prticas estatsticas.
Hoje, a utilizao da estatstica se expandiu para muito alm das suas origens.
Inivduos e organizaes usam a estatstica para compreender dados e fazer
deciso bem-informadas nas cincias naturais e sociais, na medicina, nos
negcios e em outras reas.
A estatstica geralmente tida no como um ramo da matemtica, mas como
uma rea distinta, ainda que intimamente relacionada. Muitas universidades
mantm departamentos separados de matemtica e estatstica.
O que vem a mente quando se fala em estatstica?
Logo, se pensa em pesquisa.

Saldo da balana comercial em 2004

Fonte: Ministrio do Desenvolvimento, Indstria e Comrcio Exterior

A realizao de uma pesquisa envolve muitas etapas, como escolha da
amostra, a coleta, a organizao dos dados (informaes), o resumo desses
dados (em tabelas, grficos) e a interpretao dos resultados obtidos.
Vivemos na era da informao , da comunicao. E a comunicao
envolve, principalmente, descries de fenmenos, objetos e acontecimentos,
as quais comunicaremos, com muito mais objetividade se utilizarmos de
1586
1969
2583
1959
3117
3801
3482
3431
3172
3006
2077
3510
0
500
1000
1500
2000
2500
3000
3500
4000
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Valores (em US$ milhes)
5

Coleta dos
dados
Organizao
de dados
Apresentao
dos dados
Anlise dos
dados
Interpretao
Sada dos
dados
expresses resultantes de uma contagem ou de uma medida, ou seja, se
apresentarmos uma descrio numrica daquilo a que nos referimos.
Um dos mtodos capazes de nos fornecer tcnicas para descries
numricas claras e sintticas dos fatos, por mais complexo que sejam o
mtodo(a palavra vem do grego mthodos caminho para chegar ao fim)
estatstico.
O mtodo estatstico nos ensina as tcnicas de observaes dos objetos
e acontecimentos e a quantificao de suas caractersticas, tais como:
a) Ensina como colher dados numricos, como sintetiz-los e comunic-
los de maneira clara.
b) Ensina, ainda, a descrever e interpretar os acontecimentos, bem
como a fazer previses para o futuro.
Assim podemos definir as etapas distintas do mtodo estatstico.




2.0 DEFINIO DA ESTATSTICA
a cincia que trata das tcnicas de coletas, organizao,
apresentao, anlise e interpretao dos dados com base nos fenmenos
coletivos.

3.0 CONCEITOS BSICOS
3.1- Fontes e a coleta de dados
Depois de planejar, cuidadosamente, o estudo de qualquer fato ou
fenmeno, e depois de determinar as suas caractersticas mensurveis, o
pesquisador inicia a coleta dos dados.
Os dados podem ser colhidos de fontes primrias ou em fontes
secundrias.
Fonte: a entidade responsvel pelo fornecimento ou elaborao dos
dados, pode ser:
Primria: o prprio pesquisador quem elabora os instrumentos de coleta: tipo
um teste ou um questionrio.
6

Secundria: O pesquisador se utiliza de fontes j existentes , por exemplo,
revistas, livros, arquivos etc...
Observao: Quando o pesquisador se utiliza de fontes secundrias deve
enunciar as mesmas com todas as informaes que as caracterizem: nome da
fonte, data da coleta dos dados, local da coleta, entidade, pessoa ou equipe
responsvel por aqueles dados.
Exemplo: Um administrador deseja estudar e descrever o crescimento da
populao da cidade de Graja-MA.
Neste caso,
1) O administrador determina o perodo de tempo dentro do qual deseja
pesquisar o crescimento da populao, por exemplo 2005 a 2009.
2) O administrador recorre aos arquivos competentes de onde pesquisa os
resultados dos censos pesquisados em Graja, durante o perodo
escolhido.

7


Atividade:
Caracterize exaustivamente as fontes que podero fornecer os dados
necessrios de uma pesquisa escolhida por voc.
a) Objetivo da pesquisa
b) Fontes da pesquisa


No caso da fonte primaria existem dois problemas a considerar:
1) Que instrumentos sero mais adequados para a coleta de dados:
Questionrio, entrevista, prova de conhecimento ... Isso vai depender
que pesquisa ir ser executada.
2) Que tipo de indivduos e que nmero de indivduos devem ser
submetidos ao exame, para a coleta dos dados.

8

3.2 Populao
um conjunto de pessoas, coisas ou acontecimentos que tenha pelo
menos uma caracterstica em comum.
Exemplo: Nmero de alunos matriculados na disciplina de estatstica do curso
de zootecnia.
3.3 Amostra
um subconjunto de uma populao. Podemos dizer tambm que
uma parcela representativa da populao que examinada com o propsito de
tirarmos concluses sobre a essa populao.
Exemplo: Quando queremos pesquisar a inteno de votos da populao de
Graja-MA. Recorremos a um grupo de eleitores e no a toda populao.
Assim, chamado de U o universo estatstico, e de A uma amostra, temos
U A .
Para refletir: Em que situao temos A=U?
Resposta: Quando todos os elementos do universo so pesquisados.
3.4 Parmetro
So valores singulares que existem na populao e que servem para
caracteriz-la.Para definirmos um parmetro devemos examinar toda a
populao.
Ex: Os alunos do curso de estatstica tem em mdia 1,65 metros de estatura.

3.5 Estimador
Toma por base a amostra.
Ex: Amostra de 1000 eleitores.
O parmetro seria a porcentagem de votos nessa amostra do candidato A.
3.6 Varivel
Atributo de elementos de uma populao ou amostra que pode ser
medido.
Exemplo: Uma industria automobilstica que pretende lanar um novo modelo
de carro faz uma pesquisa para sondar a preferncia dos consumidores sobre:
9

QUANTITATIVAS
(assumem valores numricos)
ex: Peso, altura, idade
DISCRETAS
(quando se trata de
contagem)
ex: Quant. de mulheres desta
turma
CONTINUAS
(que pode ser medida) ex:
altura, quant. de vezes que o
professor se atrasa no
semestre
Tipo de combustvel ; n de portas, cor etc...ou seja as variveis so: Tipo de
combustvel ; n de portas, cor.
Esquema das variveis:



VARIVEIS
CONTINUAS
(que pode ser medida) ex:
altura, quant. de vezes que o
professor se atrasa no
semestre
QUALITATIVAS OU
CATEGRICOS
(apresentam como possveis
valores uma qualidade.
(sexo, cor de cabelo, grau de
instruo)
NOMINAS
(quando no se tem uma
ordem) exp: esporte favorito -
seus valores so qualidades
do individuo; gostar ou no
de um esporte.
Tipo de combustvel ; n de portas, cor etc...ou seja as variveis so: Tipo de
combustvel ; n de portas, cor.


QUALITATIVAS OU
CATEGRICOS
(apresentam como possveis
valores uma qualidade.
(sexo, cor de cabelo, grau de
instruo)
ORDINAIS
(quando existe uma ordem)
Ex: Grau de instruo, pode
ser ordenado -
fundamental, mdio, superior
Tipo de combustvel ; n de portas, cor etc...ou seja as variveis so: Tipo de
10

ATIVIDADE:

1) Uma concessionria de automveis tem cadastrados 3500 clientes e fez
uma pesquisa sobre a preferncia de compra em relao a cor (branca,
vermelha, azul), preo , nmero de portas (duas ou quatro) e estado de
conservao (novo ou usado).Foram consultados 210 clientes.Diante
dessas informaes, responda:
a) Qual o universo estatstico e qual a amostra dessa pesquisa?
b) Quais so as variveis e qual o tipo de cada uma?
c) Quais os possveis valores da varivel cor.
2) Dado a R R f : , onde 1 2 ) ( + = x x f , que tipo de varivel o x .

11

4.0 TABELAS
um quadro que resume um conjunto de dados dispostos segundo
linhas e colunas de maneira sistemtica.
De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela
devemos colocar :
um trao horizontal ( - ) quando o valor zero;
trs pontos ( ... ) quando no temos os dados;
zero ( 0 ) quando o valor muito pequeno para ser expresso pela
unidade utilizada;
um ponto de interrogao ( ? ) quando temos dvida quanto exatido
de determinado valor.
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto, pois
dever sempre indicar continuidade.
4.1 Elementos de uma tabela
Na tabela deve conter: ttulo, cabealho, corpo, rodap.
Um titulo completo de uma tabela responde a trs perguntas: O que?,
quando ? onde?.

DISTRIBUIO DE RECURSOS EDUCACIONAIS BRASIL 2009. Ttulo

Fonte:Anurio Brasileiro de educao Rodap
TABELA I.




NVEIS N DE ALUNOS
MATRICULADOS
DESPESAS
POR R$ 1,00
Primrio 10217324 2606800
Mdio
Superior
Total
12


4.2 Classificao das tabelas
a) Simples:
Faixa Etria de Pessoas entre 0 a 30 anos






FONTE: Questionrio aplicado
b) Dupla Entrada







Rodap
c) Mltipla entrada

Populao presente nas regies sul e sudeste 1940/1980.
IDADE (ANOS) N DE PESSOAS
10 500
20 100
25 250
TOTAL 850
SEXO
IDADE
M F TOTAL




REGIO 1940 1950 1960 1970 1980
SUL 5735305
Paran 1236276
Sta.Catarina 1178340
13







5.0 SRIES ESTATISTICAS
qualquer tabela que apresenta a distribuio de um conjunto de dados
estatsticos em funo da poca, do local ou do fenmeno.
Exemplo:
poca: 78 82
Local: Brasil
Fenmeno: Produo de caf.
5.1-Srie geogrfica, territorial ou de localizao
Acontece quando: poca um elemento fixo ; fenmeno elemento
fixo; local elemento varivel.
Exemplo:
Produo de peas fundidas
Nas regies Oeste e Leste
Minas Gerais 1971






Fonte: SENAI (BH)
5.1-Srie cronolgica, histrica, temporal
R.Grande do Sul 3320689
SUDESTE ........
PRODUO
REGIES
TONELADAS
OESTE 34383
LESTE 26997
TOTAL 62346
14

O fenomeno estudado numa faixa de tempo. Acontece quando: poca
elemento varivel ; local e fenomeno elemento fixo.
Exemplo:




Produo de petrleo Bruto Brasil (1000m
3
)






Fonte: Conjuntiva econmica Fev /1983
5.2-Srie especfica, categrica
Acontece quando: poca e local elementos fixos ; fenomeno elemento
varivel.
Exemplo:
Produo Agrcola no Brasil 1974
(Produtos selecionados)





ANO PRODUO
1976 9702
1977 9332
1978 9304
1980 10562
PRODUTO PRODUO EM 1000T
Algodo 1959
Caf 165
cana-de-acar 3220
Fumo em folha 96412
15


Fonte: Revista Comrcio e Mercado Maro 1976
5.2-Srie Mista, Dupla entrada
Acontece quando se tem duas ou mais sries variando:
-Como vimos as sries so: Histrica, geogrfica, especfica.
Histrica x Geogrfica
Histrica x Especfica
Geogrfica x Especfica
Exemplo:
Produo de laminados , no-planos
Brasil 1986-88







Fonte: Instituto Brasileiro de Siderrgica

Neste exemplo temos poca e fenmeno variando e local fixo.


TIPOS
QUANTIDADE(1000T)
1986 1987 1988
BARPA 1414 1272 1139
VERGALHES 2203 1272 2209
PERFILADOS 526 538 425
TUBOS 990 344 330
16

ATIVIDADE

1) Relacionar os aniversariantes da turma pelos meses do ano em uma tabela,
relacionando as seguintes variveis: Aniversariantes, meses, nomes,
quantidade.
2) Faa uma tabela conforme o texto abaixo:
Em 1962 a populao brasileira era de 741.000.000 habitantes, sendo 74000
candidatos as universidades e 48000 o nmero de vagas. Em 1964 a
populao brasileira era de 788.000.000 habitantes com 95000 candidatos as
universidades e 56000 vagas. Em 1966 a populao brasileira era de
839.000.000 habitantes, com 128000 candidatos as universidades e 69000
vagas. Em 1969 a populao do Brasil se elevou a 923.000.000 habitantes com
198000 candidatos as universidades e 110000 vagas.
Fonte: IBGE (dados fictcios)

ANO HABITANTES CANDIDATOS A
UNIVERSIDADE
N
VAGAS














17

6.0 TERMOS DE UMA PESQUISA ESTATSTICA
6.1 Frequncia absoluta e frequncia relativa
Suponha que entre um grupo de turistas, participantes de uma excurso,
tenha sido feita uma pesquisa sobre a nacionalidade de cada um e que o
resultado dela tenha sido o seguinte:
Pedro- brasileiro, Ana brasileira, Sergio brasileiro, Ramon Espanhol,
Laura espanhol, Claudia brasileira, Raul: argentino, Nelson brasileiro,
Silvia brasileiro, Pablo espanhol.
O numero de vezes que um varivel citado representa a frequncia
absoluta (fi) desse valor.
A varivel nacionalidade a frequncia absoluta :
Brasileiro 6
Espanhol 3
Argentino 1

A frequencia relativa (fri) regista a frequencia absoluta em relao ao total de
citaes. No exemplo acima temos: brasileira = 6/10 ou 60%.
Ela pode ser expressa em frao, decimal ou porcentagem.
Vamos montar a tabela:
NACIONALDADE fi fri (%)
Brasileira 6 Memoria de
clculo:
6/10 = 0,6 x
100 = 60%
Espanhol 3 30 %
Argentino 1 10 %

6.2 Srie de Distribuio de frequncia
Uma distribuio de frequncia aquela na qual o fenmeno ou fato
apresenta gradaes ou subdivises.
18

a) Com dados sem intervalo de classe.
Exemplo: As notas da turma em estatistica.

Xi -> nota , fi -> frequncia absoluta, i - > indice.

i xi fi
1 2 5
2 3,5 6
3 7,0 8
4 7,5 9
5 8,0 10
6 9,5 2

=
=
6
1 i
fi n
40

Onde n = tamanho da amostra.

b) Dados com intervalo de classe.

Classes: So intervalos de variao da varivel.

REVISANDO INTERVALOS NUMRICOS:
Intervalo aberto em a e aberto em b, ]a,b[ , {xR/a < x < b}
Aberto esquerda e aberto direita


Intervalo aberto em a e fechado em b, ]a,b], {xR/a < x b}
Aberto esquerda e fechado direita


Intervalo fechado em a e aberto em b, [a,b[, {xR/a x < b}
Fechado esquerda e aberto direita


Intervalo fechado em a e fechado em b, [a,b], {xR/a x b}
19

Fechado esquerda e fechado direita
NOTAO NA DISTRIBUIO DE FREQUNCIA:

_________ , intervalo aberto
|-------------- , intervalo semi
--------------| , intervalo semi
|-------------| , intervalo fechado.

Usando os dados da
classe.
Notas
0 |---- 2
2 |---- 4
4 |---- 6
6 |---- 8
8 |---- 10
TOTAL

Para montarmos uma tabela de frequncia, precisamos seguir alguns critrios.
Para fazermos nosso estudo utilizaremos como exemplo a seguinte pesquisa:
Um professor resolver coletar, as alturas dos alunos em uma sala de aula e
anotou os resultados em uma lista de dados brutos como segue:
Altura em cm de 40 alunos de uma classe:









Fechado esquerda e fechado direita

NA DISTRIBUIO DE FREQUNCIA:
_________ , intervalo aberto
, intervalo semi-aberto direito
| , intervalo semi-aberto esquerdo
| , intervalo fechado.
Usando os dados da tabela anterior podemos montar nossa tabela de
Fi
-
11
-
17
12
40
5
1
=

= i
fi

Para montarmos uma tabela de frequncia, precisamos seguir alguns critrios.
nosso estudo utilizaremos como exemplo a seguinte pesquisa:
Um professor resolver coletar, as alturas dos alunos em uma sala de aula e
anotou os resultados em uma lista de dados brutos como segue:
Altura em cm de 40 alunos de uma classe:
tabela anterior podemos montar nossa tabela de
Para montarmos uma tabela de frequncia, precisamos seguir alguns critrios.
nosso estudo utilizaremos como exemplo a seguinte pesquisa:
Um professor resolver coletar, as alturas dos alunos em uma sala de aula e

20







6.3 ROL

a tabela obtida aps a ordenao dos dados.


6.4 Tabela de freqncia

Ordena-se os dados, agrupando

a tabela obtida aps a ordenao dos dados.
freqncia sem intervalo de classe
se os dados, agrupando-os em sequncia crescente.


os em sequncia crescente.
21










6.5 Amplitude total ou ranger (At)

a diferena entre o maior e o menor valor da amostra.

At = Xmax Xmin

At = 178 148 = 30.

Quando dizemos que a amplitude total dos valores 30, estamos
afirmando alguma coisa do grau de concentrao. evidente que,
quanto maior a amplitude total, maior a disperso dos valores da
varivel.

6.6 Clculo do nmero de classe(k)

Para determinar o n de classes ou intervalos nos quais a amostra
dever ser dividida, utilizaremos a frmula de Sturges:


Neste caso, nosso clculo ser:
k = 1+ 3,3log40
k 6,28 . Usaremos ento 7 intervalos.

6.7 Tamanho do intervalo de classe (h)
k
At
h =
o quociente entre a amplitude total e o intervalo da classe.
K = 1 + 3,3log n
22

Calculando h temos:
77 , 4
28 , 6
30
= h , neste caso, usaremos 5 cm, pois estaremos trabalhando com
cm a altura dos alunos.

Agora montaremos a tabela com intervalos de classes conforme os critrios
estudados acima.





n fi
i
=

=
7
1

40

6.8 Clculo da frequncia relativa (fri)
o quociente entre as frequncias absolutas de cada classe e o nmero de
observaes.
n
fi
fri = , para colocar sob a forma de %, basta multiplicar por 100, 100 x
n
fi
fri =
Montando a tabela temos:
Exemplo: para i = 1, temos 075 , 0
40
3
40
1
1 = = =
f
fr
23

i Altura fi (alunos) Fri fri(%)
1 148 |- 153 3
0,075 ->
memria de
clculo:
3/40=0,075
7,5 ->memria
de clculo:
0,075 x 100 =
7,5
2 153 |- 158 7 0,175 17,5
3 158 |- 163 11 0,275 27,5
4 163 |- 168 10 0,25 25
5 168 |- 173 4 0,1 10
6 173 |- 178 4 0,1 10
7 178 |- 183 1 0,025 2,5



6.9 Frequncias acumuladas (Fi)
o acumulo das frequncias absolutas.
Podem ser representadas conforme esquema abaixo:
Absoluta ( Fi )
Crescente
Relativa ( Fri )
Frequncia acumulada (Fi) Absoluta ( Fi )
Decrescente
Relativa ( Fri )
Montando a tabela de frequncias acumuladas temos:
Frequncia acumulada crescente absoluta ( Fi )
i=1 F
1
= 3
i=2 F
2
= F
1
+ f
2
=3+5=8
i=3 F
3
= F
2
+ f
3
=8+7=15
i=4 F
4
= F
3
+ f
4
=15+13=28
i=5 F
5
= F
4
+ f
5
=28+9=37
i=6 F
6
= F
5
+ f
6
=37+2=39
24

i=7 F
7
= F
6
+ f
7
=39+1=40

Frequncia acumulada crescente relativa ( Fri )

=
fi
Fi
Fri ou na forma de porcentagem 100 x
fi
Fi
Fri

=
Montando a tabela temos:
075 , 0
40
3 1
1 = =

fi
F
Fr , multiplicando por 100 encontra a Fri % = 7,5%.


Frequncia acumulada decrescente absoluta ( Fi )
i=1 F
1
= Fn = f7=40
i=2 F
2
= F
1
- f
1
=40-3=37

i=3 F
3
= F
2
- f
2
=37-7=30
Complete o restante:
i=4 F
4
=
i=5 F
5
=
i=6 F
6
=
i=7 F
7
=

Frequncia acumulada decrescente relativa ( Fri )

=
fi
Fi
Fri ou na forma de porcentagem 100 x
fi
Fi
Fri

=
Montando a tabela temos:
1
40
40 1
1 = =

fi
F
Fr , multiplicando por 100 encontra a Fri % = 100%.
25

875 , 0
40
35 2
2 = =

fi
F
Fr , multiplicando por 100 encontra a % 5 , 87 2 = Fr .
Agora, complete o restante da tabela como segue:
i Altura
fi
(alunos) Fri fri(%) Fi Fri Fri % Fi Fri Fri%
1 148 |- 153 3
2 153 |- 158 7
3 158 |- 163 11
4 163 |- 168 10
5 168 |- 173 4
6 173 |- 178 4
7 178 |- 183 1

O significado de Fri %, significa que por exemplo Fr
4
% est correspondendo a
77,5 % da amostra.
7.0 ESTATSTICA GRFICA

Os grficos so os meios usuais pelos quais comunicamos as idias
contidas nas tabelas. Sua finalidade facilitar a compreenso do
comportamento do fenmeno, facilitando comparaes que, dificilmente nos
ocrreriam, vista, simplesmente, de nmeros. Fazer grficos transformar os
valores das tabelas em figuras, pontos, linhas, barras, reas, etc.
O grfico deve ser composto de simplicidade, clareza e veracidade , ou
seja deve expressar a verdade e possibilitar um claro entendimento ao pblico
interessado.
Iremos aprender a desenhar a mo-livre os principais grficos. claro,
que com a tecnologia a nosso favor, temos vrios softwares que possam nos
auxiliar na construo dos mesmos.
Os principais grficos so: Lineares, Colunas ou barras, setores, entre
outros.
Ns iremos aprender a fazer os seguintes grficos:


26











7.1 Grfico Linear sem dados agrupados
Veja a seguinte tabela: Nmero de alunos matriculados no curso de
Enfermagem de Graja no perodo de 1997.1 a 2000.2.
Ano/Simestre Matriculas
1997.1 218
1997.2 228
1998.1 190
1998.2 159
1999.1 164
1999.2 138
2000.1 178
2000.2 186
Como construir o grfico linear:
1 Passo: Intervalo de dados (I
T
) = a diferena entre o maior e o menor valor
da frequncia.
I
T
= 228 138 = 90.
2 Passo: Determinar a escala grfica: No mnimo 5 cm e no mximo 15 cm.
I
T
= 228 138 = 90 (valor real)
I
A
= 230 130 = 100 Valor aparente. Arredonda os valores reais.
Escala: Valor aparente dividido pela escala grfica = 100: 5 = 20 alunos
matriculados por cm, neste caso o intervalo ficou muito grande, ento vamos
dividir por 10, logo teremos: 100:10 = 10 alunos por cm.
27

3 Passo: Montando o grfico temos:


218
228
190
159
164
138
178
186
130
140
150
160
170
180
190
200
210
220
230
240
1997.1 1997.2 1998.1 1998.2 1999.1 1999.2 2000.1 2000.2
M
a
t
r
i
c
u
l
a
s
Alunos matriculados no periodo de 1997.1 a
2000.2 - UEMA - Curso de Enfermagem
Matriculas
28

7.2 Grfico de Colunas
Veja a tabela dos n de alunos matriculados na UEMA, no campus de
So Luis MA no periodo de 1997.1 a 2000.2.
Ano/Simestre Matriculas
1997.1 3466
1997.2 3477
1998.1 3520
1998.2 3255
1999.1 3669
1999.2 3296
2000.1 3569
2000.2 3498
A metodologia para a construo do grfico de colunas a mesma que
utilizamos para o grfico linear.
1 Passo:Determinao do intervalo
I
T
= 3669 3255 = 414
I
A
= 3700 0 = 3700 o valor mximo que a coluna ir atingir.
2 passo: Determinando a escala grfica: I
A
: 10 = 3700:10=370 variao da
escala grfica.
3 Passo: Construo do grfico.


3466 3477
3520
3255
3669
3296
3569
3498
370
740
1110
1480
1850
2220
2590
2960
3330
3700
1997.1 1997.2 1998.1 1998.2 1999.1 1999.2 2000.1 2000.2
Alunos matriculados no Campus So Luis-MA -
UEMA - Perodo 1997.1 a 2000.2
Matriculas
29

7.3 Grfico de Setores

Os grficos em setores ou setogramas so usados para representar
valores absolutos ou porcentagens complementares. conhecido tambem
como cartograma em setores.Para constru-lo parte-se do fato de que o
nmero total de graus de um arco de circunferncia 360. Obtemos cada
setor por meio de uma regra de trs simples e direta, lembrando que o total da
srie corresponde a 360.
Conforme a tabela abaixo construiremos o grfico de setores.

Dotao orcamentria da UEMA
Recursos Liberados 1997 a 2000
Anos R$ 1.000,00 Grau
1997 27403,4
1998 29596,7
1999 25335,7
2000 28417,7
Total 110753,5

Metodologia para construo do grfico:
1 Passo: Determinar os graus correspondente de cada ano.
1997:
Regra de trs simples:
110753,5 360
27403,4 x

= = 89
50 , 110753
40 , 27403 360x
x

Faa o restante dos anos e obter a tabela:

30

Anos R$ 1.000,00 Grau
1997 27403,4 89
1998 29596,7
1999 25335,7
2000 28417,7
Total 110753,5

Agora s montar o grfico de setores conforme abaixo:



7.4 Grfico para distruibuio de frequncias
Usaremos as mesmas metodologias utilizada para construo dos
grficos sem dados agrupados.
7.4.1 Para valores ponderados
Vamos fazer o grfico linear da tabela abaixo:



27,403.40
25%
29,596.70
27%
25,335.70
23%
28,417.70
25%
Dotao orcamentria da UEMA -
Recursos Liberados -1997 a 2000
1997
1998
1999
2000
31


Notas dos alunos de estatistica da UEMA
1 nota 2009.2
Notas fi (Alunos) Fi Fi
0 1 1 50
1 2 3 49
2 4 7 47
3 4 11 43
4 3 14 39
5 5 19 36
6 5 24 31
7 6 30 26
8 8 38 20
9 8 46 12
10 4 50 4
TOTAL 50

Para construir o grfico seguiremos os passos:
1 Passo:Determinao do intervalo
I
T
= 8 1 = 7
I
A
= 8 0 = 8 o valor mximo que o eixo y ter.
2 passo: Determinando a escala grfica: I
A
: 8 = 8:8=1cm variao da
escala grfica, que significa 1 cm para cada aluno.
3 Passo: Construo do grfico.

0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9 10 11
N


D
E

A
L
U
N
O
S
NOTAS
32




7.4.2 Anlise do grfico da Frequncia acumulada crescente e
decrescente
Montaremos o grfico baseado na tabela anterior.

O ponto de equilibrio est mostrando o momento em que as notas esto
equilibradas.

7.4.3 Histograma e polgono de frequncia com colunas justapostas.

Distribuio agrupada das notas
De 50 alunos do colgio X 1 Bimestre
Altura
fi
(alunos) Fi Fi
0 |- 2 3 3 50
2 |- 4 8 11 47
4 |- 6 8 19 39
6 |- 8 11 30 31
8 |-|10 20 50 20
Fi; 50
Fi; 4
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5 6 7 8 9 10 11
F
r
e
q
u

n
c
i
a
s

a
c
u
m
u
l
a
d
a
s
Notas dos alunos de estatistica da UEMA
1 nota 2009.2
33

Total 50

A metodologia para fazer o histograma a mesma para os demais grficos.
Montando o grfico:










Podemos observar que o ponto mdio de cada retangulo, forma o polgono de
frequncia.











34

7.4.4 Polgono de frequncia acumuladas ou ogivas de Galton.

A ogiva de Galton tem por finalidade a representao grfica das tabelas
de frequncias acumuladas.










Para construir a ogiva, em cada limite inferior desenhamos o valor da
frequncia acumulada e ligamos estes pontos com uma srie de segmentos em
linha reta.


35

8.0 MEDIDAS DE TENDNCIA CENTRAL

A estatstica tem por objetivo sumarizar dados para que tenhamos uma
viso global do comportamento dos fatos. O pesquisador se defronta com uma
quantidade de dados grandes, e apesar dos mesmos poderem estar
representados em grficos e tabelas, preciso resumir essa informao.
Assim, usam as medidas de tendncia central ou de posio, pois eas do o
valor do ponto em torno do qual os dados se distribuem.

8.1 Mdia Aritmtica (
___
X )
A mdia indica o ponto de equilbrio da distribuio dos dados
observados.
8.1.1 Mdia aritmtica simples
A mdia aritmtica simples de um conjunto de dados numricos igual
ao quociente entre a soma dos valores do conjunto e o nmero total dos
valores.
Exemplo:
a) X: 2 ; 3 ; 4,5 ; 7 ; 10 sendo X: notas.

___
X = 3 , 5
5
10 7 5 , 4 3 2
=
+ + + +
.
Genericamente podemos escrever:
n
Xi
X
n
i

=
=
1
___
, onde Xi = cada elemento da amostra ; n = n de elementos da
amostra.




36


37

8.1.2 Mdia aritmtica para dados na tabela de freqncia
Exemplo:
Xi Fi Xi.fi
2 2 4
3 3 9
4,5 2 9
7 1 7
10 3 30
Total

=11 fi

= 59 ) . ( fi Xi

Para o clculo da mdia utilizaremos a frmula:

=
=
=
fi n
fi Xi
X
n
i 1
___
) . (
, aplicando temos:
___
X = 59/11 = 5,36.

8.1.3 Mdia aritmtica com intervalo de classes

Notas (Classes
fi
(alunos) Xm fi.Xm
0 |- 2 7 1 7
2 |- 4 10 3 30
4 |- 6 13 5 65
6 |- 8 7 7 49
8 |-|10 3 9 27
Total

= 40 fi

=178 ) . ( Xm fi
Para o clculo utilizaremos a mdia da classe (Xm),
2
ls Li
Xm
+
=
.
Precisamos tambm dos valores de (fi.Xm) e em seguida aplicamos a frmula:

=
fi
fi Xm
X
.
___
, logo temos que
___
X =178/40 = 4,45.
38


Atividade:
Calcule a mdia de evaso das escolas do Estado do Maranho da cidade So
Luis, conforme a tabela de classe abaixo:

Indices
N de
escolas
0,0 a 0, 2 15
0,2 a 0,4 18
0,6 a 0,6 25
0,6 a 0,8 22
0,8 a 1,0 13



39

8.2 Mdia Geomtrica ( g X
___
)
A mdia geometrica de n valores definida, genericamente, como a raiz
n-sima do produto de todos eles.
8.2.1 Mdia Geomtrica Simples ( g X
___
)
Dados n valores X
1
, X
2
,...,X
n
, a mdia geomtrica desses valores ser:
n
n
i
Xi
C
1
___
Xg
=
= =
n
Xn X X X ... 3 . 2 . 1 , onde

(pi), o produtrio.
Exemplo:
Calcular a mdia geomtrica das seguintes notas:
8 9 5 6 3 5 7 8 8 4.
n = 10, logo,
10
___
4 . 8 . 8 . 7 . 5 . 3 . 6 . 5 . 9 . 8 = g X = 5,97.
Observao:
Para o clculo na calculadora cientfica.
1) Aperta 10 + SHIFT + X
Y
no exemplo. 10 ) 4 . 8 . 8 . 7 . 5 . 3 . 6 . 5 . 9 . 8 (
x

Em termos de logartmos temos que:
.
REVISANDO LOGARITMO:
Definio de logaritmo


sendo b>0 ,a>0 e a1

a= base do logaritmo
b= logaritmando ou antilogaritmo
x= logaritmo
1 5 pois 0 1 log 3)
16 4 pois 2 16 log 2)
32 2 pois 5 32 log 1)
: Exemplos
0
5
2
4
5
2
= =
= =
= =
b x b a
a
x
log = =

: obtemos log igualdade Na b x
a
=
antilogaritmo:Inverso do
logaritmo
b a b x anti
x
a
= => = log
Ex: 8 2 3 log
3
2
= = anti


40


41

Usando o mesmo exemplo para a frmula dos logaritmos temos:
1 passo: calcula os logaritmos de todas as notas:
log8= 0,903
log9= 0,954
log5= 0,698
log6= 0,778
log3= 0,477
log5= 0,698
log7= 0,845
log8= 0,903
log8= 0,903
log4= 0,602

log
7,761

Calculo do antilog na calculadora cientifica:
1- Na base 10: HIFT + Log (Ativa a tela superior) + o resultado
n
Xi
n
i

=1
log
,
2- Para qualquer base: Digite a base + XY + expoente.

8.2.2 Mdia Geomtrica Ponderada
A mdia geomtrica ponderada de um conjunto de nmeros dispostos
em uma tabela de freqncia calculada por intermdio da seguinte
expresso:
]
log ... 2 log 2 1 log 1
log[ Xg
___
n
Xn fn X f X f
anti
+ + +
=
,ou
]
log
log[ Xg
1
___
n
Xi fi
anti
n
i

=
=





]
log
log[ Xg
1
___
n
Xi
anti
n
i

=
=
97 , 5 ]
10
761 , 7
log[ Xg
___
= = anti
42


Exemplo: Calcule a mdia geomtrica das notas a seguir:
Xi(Notas) Alunos(fi) logXi fi.logXi
1 3 0 0
2 5 0,30103 1,50515
3 7

4 6

5 8

6 10

7 12

8 11

9 7

10 5 1 5

= 74 fi

= 58536 , 53 ) log . ( Xi fi

Aplicando a frmula para ]
log
log[ Xg
1
___
n
Xi fi
anti
n
i

=
=
29 , 5 Xg ] 7244126486 , 0 log[ Xg ]
74
58536 , 53
log[ Xg
___ ___ ___
= => = => = anti anti
Propriedade: A mdia geomtrica menor ou igual a mdia aritmtica.
A desigualdade g < ..sempre se verifica, quando os valores da srie
forem positivos e nem todos iguais. Se entre eles houver um ou mais zeros, a
mdia geomtrica ser nula.
A igualdade g = ..s ocorrer quando todos os valores da srie forem
iguais.
8.2.3 Mdia Geomtrica para dados agrupados
Utilizaremos a tabela abaixo para o calculo de g X
___
.
Indices
N de
escolas Xm logXm fi.logXm
0,0 |- 0, 2 15 0,1 -1 -15
0,2 |- 0,4 18
0,6 |- 0,6 25
0,6 |- 0,8 22
0,8 |- 1,0 13
43

Total 93

= 9403 , 35 ) log . ( Xm fi

Onde,
Xm Mdia da classe.
A frmula fica assim descrita:
]
log
log[ Xg
1
___
n
Xm fi
anti
n
i

=
=
41 , 0 Xg ]
93
9403 , 35
log[ Xg
___ ___
= =>

= anti
8.3 Mdia Harmnica ( h X
___
)
o inverso da mdia aritmtica dos inversos.
8.3.1- Mdia Harmnica Simples Para dados brutos
Dado um conjunto de n valores X1, X2,...,Xn, a mdia harmnica do
conjunto ser:

=
=
n
i
x
n
h X
1
___
1
,seja X1 e X2 dois valores quaisquer a
2
1
1
1
2
___
X X
h X
+
=
Ex: Calcular a mdia harmnica das notas 8-9-5-6-3-5-7-8-8-4.
62 , 5
4
1
8
1
8
1
7
1
5
1
3
1
6
1
5
1
9
1
8
1
10
___
=
+ + + + + + + + +
= h X .
8.3.2- Mdia Harmnica para dados agrupados em classe
Usaremos a frmula

=
=
n
i
Xm
fi
n
h X
1
___
,onde Xm a mdia da classe
Exemplo: Calcular a mdia Harmnica da tabela:
Notas fi Xm fi/Xm
1 |- 3 2 2 1
3 |- 5 4 4 1
5 |- 7 8 6 1,3
Usando a frmula temos:
96 , 4
03 , 4
20
1
___
= = =

=
n
i
Xm
fi
n
h X
,
A mdia harmnica menor ou
igual mdia geomtrica. Logo:
44

7 |- 9 4 8 0,5
9 |- 11 2 10 0,2

= = fi 20
-

= 03 , 4
Xm
fi


8.4 Moda (
Mo
)
uma medida de tendncia central, tambm denominada de norma,
valor dominante ou valor tpico. A moda de um conjunto de dados o valor que
se repete mais, isto , daquele com maior freqncia. Em estatstica, a mesma
significao que lhe damos vulgarmente.Afinal, o que est na moda aquilo
que mais se v.

8.4.1 Moda para valores simples
Basta observar o que ocorre mais vezes, ou seja, o valor de maior
freqncia.
Ex1: quando a amostra for unimodal, ou seja, possui uma nica moda.
8-9-5-5-6-3-5-6-7-4-2.
Mo=5, pois o elemento que mais se repete na amostra.
Ex2: Quando for bimodal 8-9-9-5-5-6-3-7-2-1.
Mo
1
=9 e Mo
2
=5

8.4.2 Moda para valores agrupados
Para dados agrupados utilizaremos a frmula de CZUBER.
h L Mo ).
2 1
1
( inf
+

+ = , onde
Linf=Limite inferior da classe modal
1 =Diferena entre a freqncia absoluta da classe modal e a imediatamente
anterior.
2 =Diferena entre a freqncia absoluta da classe modal e a imediatamente
posterior.
45

h=intervalo da classe
Exemplo: Dada a distribuio dos pesos dos alunos da escola X, calcular a
moda.




Pesos Alunos
35 |- 40 10
40 |- 45
08
45 |- 50 13
50 |- 55
15
55 |- 60 18
60 |- 65
16
65 |- 70 14
70 |- 75 11
75 |- 80 09
80 |- 85 05
85 |- 90 06
TOTAL 125







Atividade:
Encontre a moda dos pesos dos alunos da turma.(Construa a tabela de
freqncia com dados agrupados em classe.



Seguiremos os passos para encontrarmos a Mo.
1 Passo: Localizar a classe modal: 55|- 60, fi=18,
Linf=55.
2 Passo: Calcular 1 e 2 e h.
1 =18-15=3
2 =18-16=2
h=Ls-Li=60-55=5
3 Passo: Aplicar a frmula de CZUBER.
h L Mo ).
2 1
1
( inf
+

+ =
. 58
5 ).
2 3
3
( 55
=
+
+ =
Mo
Mo

Assim, podemos concluir que o peso de maior
freqncia da classe 58.

46








9.0 MEDIDAS DE SEPARATRIZES
Uma distribuio por freqncia quando colocada sob forma ogival
apresenta os dados em uma sucesso ordinal (1, 2, 3,etc.). Esta sucesso
ordinal comporta uma srie de anlises relevantes ao estudo estatstico dos
dados. Aqui, nos interessa as medidas de separatrizes que so:
Mediano, Quartil, Decil, Percentil.

9.1 - Mediana (Me)

o elemento que est exatamente no centro das informaes
ordenadas. |__________Me__________|
0% 50% 100%

9.1.1 - Mediana para dados no-agrupados

Para se obter o elemento mediana de uma srie deveremos seguir os
seguintes passos:
a) Se n for mpar a mediana o termo de ordem
2
1 +
=
n
P . Onde P o
elemento mediano.
b) Se n for par a mdia aritmtica dos termos de ordem :
Calcula:
2
1
n
P = e 1
2
2
+ =
n
P e
2
2 1 P P
Me
+
=
47

Exemplos:
a) Determine o valor da mediana da srie que composta dos seguintes
elementos: 56, 58 , 62, 65 e 90.
Soluo:
n = 5 (mpar), ordenada srie da elemento 3
2
1 5
2
1
0
=
+
=
+
=
n
P . Ento Me = 62.
b) Pesquisa realizada a respeito de erros por folha, cometidos por digitadores,
revelou as seguintes quantidades: 12, 12, 13, 13, 15, 16, 18,20. Determinar a
quantidade mediana de falhas.
Soluo:
n = 8(par), ento elemento 5 1
2
8
e elemento 4
2
8
0
2
0
1
= + = = = P P
Logo a mediana ser:
14
2
28
2
15 13
= =
+
= Me
9.1.2 - Mediana para dados agrupados sem intervalo de classes

Dado a tabela abaixo, vamos determinar a mediana.
xi(Notas) Fi Fi Posio
2 4 4 1 a 4
3 10 14 5 a 14
4 15 29 15 a 29
5 20 49 30 a 49
10 18 67 50 a 67
13 12 79 68 a 79
16 6 85 80 a 85
17 4 89 86 a 89
Total 89
Seguiremos os passos:
1 passo: Determinar a Fi.
2 passo: Determinar P.
n=89, impar, logo 45
2
1 89
0
=
+
= P
3 passo: O elemento xi que est na 45 posio a Mediana, ou seja Me=5.
QUANDO n PAR:
Esta a 45 posiao
48

xi(Notas) Fi Fi Posio
12 5 5 1 a 5
15 10 15 6 a 15
18 13 28 16 a 28
20 15 43 29 a 43
25 7 50 44 a 50
30 6 56 51 a 56
Total 56

n=56 (par)
Calcularemos:
2
1
n
P = e 1
2
2
+ =
n
P para encontrar
2
2 1 P P
Me
+
=
28
2
56
1
= = P = 18 20 29 1
2
56
2
= = + = P
Calculando
2
2 1 P P
Me
+
= => 19
2
20 18
=
+
= Me
Logo Me=19.

9.1.3 - Mediana para dados agrupados com intervalo de classes

Para encontrar a mediana utilizaremos a seguinte frmula:
h
fmd
Fant
n
L Me ).
2
( inf

+ = , onde:
Linf=limite inferior da classe mediana.
P=n/2=elemento mediano.
Fant=freqncia acumulada anterior a classe da mediana
fmd=freqncia da classe mediana.
Exemplo:
Um determinado professor aplicou um teste de conhecimentos gerais e
determinou que aqueles que tirassem nota superior ou igual ao valor da
mediana teriam conceito A, e abaixo conceito B.
Abaixo a tabela de classe:
49

Notas (xi) fi (alunos) Fi posio
0,0 |- 2,5 12 12 0 a 12
2,5 |- 5,0 15 27 13 a 27
5,0 |- 7,5 22 49 28 a 49
7,5 |- 10 19 68 50 a 68
Total 68

Para determinar a mediana seguiremos os passos:
1 Passo: Determinar Fi
2 Passo: Determinar as posies
3 Passo: Determinar a classe mediana (P)
P=n/2 = 68/2=34
4 Passo: Linf=5 ; h=(Ls-Li) = 7,5-5=2,5
5 Passo: localizar Fant: neste caso fant=27
6 Passo: localizar fmd=22
7 Passo: Utilizar a frmula h
fmd
Fant
n
L Me ).
2
( inf

+ =
80 , 5
5 , 2 ).
22
27 34
( 5
=

+ =
Me
Me


Atividade:
Encontrar a altura mediana da turma utilizando tabela agrupada em classe.

50

9.2 Quartil (Q)


Divide a amostra em quatro partes iguais


!-------------------!-------------------!
Me

!---------!---------!---------!---------!
Q1 Q2 Q3

Para determinar o elemento quartil, utilizaremos a frmula:

4
.n i
EQi = , onde i=1,2,3. E para determinar cada elemento num dado intervalo
de classe usaremos:

h
fqi
Fant
n i
L Qi ).
4
.
( inf

+ = , onde:

Linf=limite inferior da classe quartilica i.
4
.n i
=elemento quartilico
Fant=freqncia acumulada anterior a classe da quartilica
fqi=freqncia absoluta da classe quartilica.
h=intervalo de classe.


9.3 Decil (D)
Divide a amostra em dez partes iguais.
!-------------------!-------------------!
Me
!---------!---------!---------!---------!
Q1 Q2 Q3
!---!---!---!---!---!---!---!---!---!---!
51

D1 D2 D3 D4 D5 D6 D7 D8 D9
Para determinar o elemento decil, utilizaremos a frmula:

10
.n i
EQi = , onde i=1,2,3,4,5,6,7,8,9. E para determinar cada elemento num dado
intervalo de classe usaremos:

h
fdi
Fant
n i
L Di ).
10
.
( inf

+ = , onde:

Linf=limite inferior da classe decilica.
10
.n i
=elemento decilico
Fant=freqncia acumulada anterior a classe decilica
fdi=freqncia absoluta da classe decilica.
h=intervalo de classe.


9.4 Percentil (P)

Divide a amostra em cem partes iguais.

!-------------------!-------------------!
Me
!---------!---------!---------!---------!
Q1 Q2 Q3
!---!---!---!---!---!---!---!---!---!---!
D1 D2 D3 D4 D5 D6 D7 D8 D9
!---!---!---!---!---!---!---!---!---!---!
C10 C20 C30 C40 C50 C60 C70 C80 C90
Para determinar o elemento percentil, utilizaremos a frmula:

, onde i=1,2,3,....,99. E para determinar cada elemento num dado intervalo de
classe usaremos:

52

h
fpi
Fant
n i
L Pi ).
100
.
( inf

+ = , onde:

Linf=limite inferior da classe percentilica.
100
.n i
=elemento percentil
Fant=freqncia acumulada anterior a classe percentilica
fdi=freqncia absoluta da classe percentilica.
h=intervalo de classe.


Exemplo:

1) Um professor resolveu realizar um simulado em sua escola, como um
preparativo para o vestibular e adotou como avaliao as medidas de
separatrizes. Ento:
Conceito excelente: Acima de Q
3
.
Conceito Bom: entre D
4
e D
5
.
Conceito Regular: entre Q
1
e P
40 (incluindo
P40)
Conceito Insuficiente: abaixo de P
20


Aps a aplicao da prova verificou-se a seguinte distribuio de freqncias:

Pontos Alunos Fi
10|-20 22 22
20|-30 25 47
30|-40 29 76
40|-50 32 108
50|-60 38 146
60|-70 42 188
70|-80 34 222
80|-90 23 245
90|-100 17 262
100|-110 16 278
Total 278 -


Aplicando a frmula para cada elemento temos:

03 , 76 10 ].
34
188 5 , 208
[ 70 3 =

+ = Q


84 , 50 10 ].
38
108 20 , 111
[ 50 4 =

+ = D

Vamos calcular cada elemento separatriz
5 , 69
4
278 . 1
4
.
1
2 , 111
100
278 . 40
100
.
40
6 , 55
100
278 . 20
100
.
20
139
10
278 . 5
10
.
5
2 , 111
10
278 . 4
10
.
4
5 , 208
4
278 . 3
4
.
3
= = =
= = =
= = =
= = =
= = =
= = =
n i
EQ
n i
EP
n i
EP
n i
ED
n i
ED
n i
EQ

84 , 50 4 40 = = D P
76 , 37 10 ].
29
47 5 , 69
[ 30 1 =

+ = Q

Podemos fazer a seguinte anlise:
Conceito excelente: Acima de Q
3
. Ser >76,03
Conceito Bom: entre D
4
e D
5
. 50,84<x<58,15
Conceito Regular: entre Q
1
e P
40 .
37,76<x50,84
Conceito Insuficiente: abaixo de P
20.
<32,96
53


15 , 58 10 ].
38
108 139
[ 50 5 =

+ = D


96 , 32 10 ].
29
47 6 , 55
[ 30 20 =

+ = P



Atividade

A tabela abaixo representa os salrios pagos a 100 professores da Escola
Aprendiz.
Salrios Professores
0|- 2 40
2|- 4 30
4|- 6 10
6|- 8 15
8|- 10 5
Total 100

Determinar:
A) Salrio Mdio
B) O salrio que mais ocorre na amostra
C) O salrio que divide a amostra em duas partes iguais
D) O valor em que 80% dos salrios lhe so inferiores
E) O valor em que 20% dos salrios lhe so inferiores

54

__
X
10.0 MEDIDAS DE DISPERSO OU VARIABILIDADE
Um conjunto de valores pode ser convenientemente sintetizado, por
meio de procedimentos matemticos, em poucos valores representativos
mdia aritmtica, mediana e moda. Tais valores podem servir de comparao
para dar a posio de qualquer elemento do conjunto.
Assim, no o bastante dar uma das medidas de posio para
caracterizar perfeitamente um conjunto de valores, pois, mesmo sabendo, por
exemplo, que a temperatura mdia de duas cidades a mesma, ainda assim
somos levados a pensar a respeito do clima dessas cidades. Em uma delas
poder a temperatura variar entre limites de muito calor e de muito frio. A outra
poder ter uma variao pequena de temperatura e possuir, portanto, no que
se refere temperatura, um clima mais favorvel.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a
maior ou menor disperso ou variabilidade entre esses valores e a sua medida
de posio, a Estatstica recorre s medidas de disperso ou variabilidade,
para saber como os valores esto dispersos em torno da mdia.

________|_______ Xi

10.1 Amplitude total
A amplitude total de um conjunto de nmeros a diferena entre o
maior valor da amostra, como j vimos no inicio.
At = Xmax Xmin
10.1.1- Amplitude para dados agrupados sem intervalo de classe.

Xi fi
2 4
3,5 7
5 8
7 4
8 3

10.1.2- Amplitude para dados agrupados com intervalo de classe.
At=8-2=6
55

2
1 3 Q Q
Q

=
Se os dados vierem dispostos em uma tabela de frequncias, com os
valres agrupados em classes, h duas formas de se definir a amplitude total:
1) At=ponto mdio da ltima classe menos ponto mdio da primeira
classe.
Exemplo:
Notas (xi) fi (alunos)
0,0 |- 2,5 12
2,5 |- 5,0 15
5,0 |- 7,5 22
7,5 |- 10 19
Total 68
Ponto mdio ltima classe = Ls Li = (10+7,5)/2 = 8,75
Ponto mdio 1 classe = Ls Li = (0+2,5)/2 = 1,25
At=8,75-1,25 => At=7,5
2) At=limite superior da ltima classe menos o limite inferior da primeira
classe.
At=10-0=> At=10.
Observao: Embora a amplitude total seja a mais simples das medidas de
disperso, h uma forte restrio ao seu uso em virtude de sua grande
instabilidade, uma vez que ela leva em conta apenas os valores extremos da
srie de dados.
10.2 Desvio quartilico ou amplitude semi-interquartilica.
uma medida que mostra a diferena entre o terceiro e o primeiro
quartis, que aproveita 50% dos dados e que pouco influenciada pelos valores
extremos. Ele utilizado quando se descrevem resultados, empregando como
medida de tendncia central a mediana.

Onde,
Q
3
=terceiro quartil; Q
1
=primeiro quartil.
Exemplo: Pontos obtidos em lingua portuguesa no concurso do vestibular 2002.
Pontos N de alunos Fi
10 |- 20 5 3
20 |- 30 12 10
30 |- 40 20 21
56

40 |- 50 14 31
50 |- 60 10 35
60 |- 70 4 39
Total 65 -

- Calculo do EQ
1
:
25 , 16
4
65
4
.
1 = = =
n i
EQ
38 , 29 10 ].
12
5 25 , 16
[ 20 1 =

+ = Q

- Calculo do EQ3:
75 , 48
4
65 . 3
4
.
3 = = =
n i
EQ

39 , 48 10 ].
14
37 75 , 48
[ 40 3 =

+ = Q

- Clculo de Q:
505 , 9
2
38 , 29 39 , 48
=

= Q
A amplitude semi-interquatlica menos grosseira do que a amplitude total
porque usa dois valores menos extremos.
10.3 Desvio mdio (Dm)
O desvio mdio ou mdia dos desvios igual mdia aritmtica de seus
valores absolutos tomados em relao a uma das seguintes medidas: mdia ou
mediana.
10.3.1- Desvio mdio para dados brutos
Para dados brutos utilizaremos a frmula:
n
X xi
Dm
n
i

=
1
__
| |
, onde di= | |
__
X xi =desvio em relao a mdia aritmtica.
Ou ainda
n
Me xi
Dm
n
i

=
1
| |
, onde di= | | Me xi =desvio em relao a mediana.
57

Ex: Dadas as notas de Lngua Portuguesa da turma A e B, verifique qual a
mais homognea.
Turma A: 2-3-5-5-6-6-8-9
Turma B: 3-3-5-7-8-8-8-9


1 Passo: calcular a mdia da turma A e B.
5 , 5
8
9 8 6 6 5 5 3 2
___
=
+ + + + + + +
= A X
375 , 6
8
9 8 8 8 7 5 3 3
___
=
+ + + + + + +
= A X
Agora calcularemos o Dm de A e B.
Turma A: 2-3-5-5-6-6-8-9
|2 - 5,5|=3,5
|3 - 5,5|=2,5
|5 - 5,5|=0,5
|5 - 5,5|=0,5
|6 - 5,5|=0,5
|6 - 5,5|=0,5
|8 - 5,5|=2,5
|9 - 5,5|=3,5

n
i
X xi
1
__
| | =14
Turma B: 3-3-5-7-8-8-8-9
|3 - 5,5|=2,5
|3 - 5,5|=2,5
|5 - 5,5|=0,5
|7 - 5,5|=1,5
|8 - 5,5|=2,5
n
X xi
Dm
n
i

=
1
__
| |
= 75 , 1
8
14
=
n
X xi
Dm
n
i

=
1
__
| |
= 25 , 2
8
18
=
Podemos concluir que a turma A mais
homognea, pois possui o desvio mdio
menor.l
58

|8 - 5,5|=2,5
|8 - 5,5|=2,5
|9 - 5,5|=3,5

n
i
X xi
1
__
| | =18


10.3.2- Desvio mdio para dados agrupados em classes
Para dados agrupados em classes usaremos a frmula:
n
X Xm
Dm
n
i

=
1
__
| |
, onde Xm o ponto mdio do intervalo das classes.
Exemplo:Calcular o desvio mdio dos valores representativos da taxa de
evaso escolar de 80 escolas.
Taxa de Evaso
N
Escolas Xm Xm.fi |Xm-
___
X | |Xm-
___
X |.fi
5 |- 25 4 15 60 64,5 258
25 |- 45 6 35 210 44,5 267
45 |- 65 14 55 770 24,5 343
65 |- 85 26 75 1950 4,5 117
85 |- 105 14 95 1330 15,5 217
105 |- 125 8 115 920 35,5 284
125 |- 145 6 135 810 55,5 333
145 |- 165 2 155 310 75,5 151
Total 80 - 6360 - 1970

A mdia:
5 , 79 80 / 6360
| .
___ ___
= = => =

X
fi
fi Xm
X

Dm=1970/80=24,625.
Isso siginifica que em mdia os valores esto afastados da mdia 24,625.

10.4 Desvio Padro
59

a medida de disperso geralmente mais empregada, pois leva em
considerao a totalidade dos valores da varivel em estudo. um indicador
de variabilidade bastante estvel. O desvio padro baseia-se nos desvios em
torno da mdia aritmtica.
Indica a disperso dos dados; quanto mais dispersos, maior o desvio padro
O Desvio padro pode ser da populacional ou amostral (S).
a)Para o populacional sem dados agrupados usaremos a frmula:
n
X Xi


=
__
) (
2



Exemplo:
Exemplo: Calcular o desvio padro da populao representada por - 4 , -3 , -2 ,
3 , 5
Xi
___
X Xi-
___
X (Xi-
___
X )
2

-4 -0,2 -3,8 14,44
-3 -0,2 -2,8 7,84
-2 -0,2 -1,8 3,24
3 -0,2 3,2 10,24
5 -0,2 5,2 27,04
Total - - 62,8
Aplicando a frmula temos:
n
X Xi


=
__
) (
2

= > 54 , 3
5
8 , 62
= => =
Quando se tratar de dados agrupados com intervalos de classe uzaremos a
frmula:

(
(

=
fi
fi X Xi .
__
) (
2



b)Para o desvio padro amostral (S) usaremos a frmula:
60


(
(
(
(
(

\
|

=


=
=
n
i
n
i
n
Xi
Xi
n
S
1
2
1 2
1
1
, para dados brutos.Ex:

Exemplo:


Aplicando a frmula temos:

958 , 12
7
) 159 (
4619
1 7
1
2
= =>
(

= S S

c) Desvio padro amostral para dados agrupados.
Quando os valores vierem dispostos em uma tabela de frequncias,o clculo
do desvio-padro ser realizado usando a frmula:
(
(
(
(
(

\
|

=


=
=
n
i
n
i
n
fi Xm
fi Xm
n
S
1
2
1 2
.
.
1
1
, onde
Xm= o ponto mdio dos intervalos de classes
fi=frequncia absoluta
n=nmero de elementos da amostra.
Exemplo: Dadas as notas abaixo, verificar o desvio-padro.
Notas alunos Xm Xm.fi Xm
2
.fi
0|- 2 12 1 12 12
2|- 4 16 3 48 144
4|- 6 20 5 100 500
6|- 8 18 7 126 882
8|- 10 12 9 108 972
Total 78 394 2510
Xi Xi2
10 100
12 144
13 169
20 400
25 625
34 1156
45 2025

=159

= 4619

61


Aplicando a frmula

78
) 394 (
2510
1 78
1
2

= S







10.4 Varincia
A varincia nada mais
A varincia pode ser populacional que o desvio
quadrado. (
2
)
A varincia pode ser populacional que o desvio
(S
2
).
11.0 - COEFICIENTE DE
Uma pergunta que pode surgir : O desvio padro calculado grande ou
pequeno?
Esta questo relevante por exemplo, na avaliao da preciso de
mtodos.
Um desvio padro pode ser considerado grande ou pequeno
dependendo da ordem de grandeza da varivel.
Uma maneira de se expressar a variabilidade dos dados tirando a
influncia da ordem de grandeza da varivel atravs do coeficiente de
variao, definido por:

O CV :
60 , 2
2
= =>
(

(
S
A varincia nada mais do que o quadrado do desvio padro.
A varincia pode ser populacional que o desvio-padro populacional ao
A varincia pode ser populacional que o desvio-padro amostral quadrado
COEFICIENTE DE VARIAO
Uma pergunta que pode surgir : O desvio padro calculado grande ou
Esta questo relevante por exemplo, na avaliao da preciso de
Um desvio padro pode ser considerado grande ou pequeno
dependendo da ordem de grandeza da varivel.
Uma maneira de se expressar a variabilidade dos dados tirando a
influncia da ordem de grandeza da varivel atravs do coeficiente de
do que o quadrado do desvio padro.
padro populacional ao
padro amostral quadrado
Uma pergunta que pode surgir : O desvio padro calculado grande ou
Esta questo relevante por exemplo, na avaliao da preciso de
Um desvio padro pode ser considerado grande ou pequeno
Uma maneira de se expressar a variabilidade dos dados tirando a
influncia da ordem de grandeza da varivel atravs do coeficiente de
62

interpretado como a variabilidade dos dados em relao mdia.
Quanto menor o CV mais homogneo o conjunto de dados.
adimensional, isto , um nmero puro, que ser positivo se a mdia for
positiva; ser zero quando no houver variabilidade entre os dados, ou
seja, .
usualmente expresso em porcentagem, indicando o percentual que o
desvio padro menor
Um CV considerado baixo (indicando um conjunto de dados
razoavelmente homogneo) quando for menor ou igual a 25%. Entretanto, esse
padro varia de acordo com a aplicao.
Por exemplo, em medidas vitais (batimento cardaco, temperatura corporal
etc) espera-se um CV muito menor do que 25% para que os dados sejam
considerados homogneos.
Pode ser difcil classificar um coeficiente de variao como baixo, mdio,
alto ou muito alto, mas este pode ser bastante til na comparao de duas
variveis ou dois grupos que a princpio no so comparveis.

Exemplos:
1. Em um grupo de pacientes foram tomadas as pulsaes (batidas por
minuto) e dosadas as taxas de cido rico (mg/100ml). As mdias e os
desvios padro foram:
Os coeficientes de variao so:
estvel do que o cido rico.
2. Em experimentos para a determinao de clorofila em plantas, levantou
se a questo de que se o mtodo utilizado poderia fornecer resultados
mais consistentes. Trs mtodos foram col
abacaxi foram analisadas com cada um dos mtodos. Os resultados
foram os seguintes:
interpretado como a variabilidade dos dados em relao mdia.
Quanto menor o CV mais homogneo o conjunto de dados.
adimensional, isto , um nmero puro, que ser positivo se a mdia for
positiva; ser zero quando no houver variabilidade entre os dados, ou
usualmente expresso em porcentagem, indicando o percentual que o
desvio padro menor
do que a mdia
Um CV considerado baixo (indicando um conjunto de dados
razoavelmente homogneo) quando for menor ou igual a 25%. Entretanto, esse
padro varia de acordo com a aplicao.
Por exemplo, em medidas vitais (batimento cardaco, temperatura corporal
se um CV muito menor do que 25% para que os dados sejam
considerados homogneos.
Pode ser difcil classificar um coeficiente de variao como baixo, mdio,
alto ou muito alto, mas este pode ser bastante til na comparao de duas
u dois grupos que a princpio no so comparveis.
Em um grupo de pacientes foram tomadas as pulsaes (batidas por
minuto) e dosadas as taxas de cido rico (mg/100ml). As mdias e os
desvios padro foram:

Os coeficientes de variao so:
, o que evidencia que a pulsao mais
estvel do que o cido rico.
Em experimentos para a determinao de clorofila em plantas, levantou
se a questo de que se o mtodo utilizado poderia fornecer resultados
mais consistentes. Trs mtodos foram colocados prova e 12 folhas de
abacaxi foram analisadas com cada um dos mtodos. Os resultados
foram os seguintes:
interpretado como a variabilidade dos dados em relao mdia.
Quanto menor o CV mais homogneo o conjunto de dados.
adimensional, isto , um nmero puro, que ser positivo se a mdia for
positiva; ser zero quando no houver variabilidade entre os dados, ou
usualmente expresso em porcentagem, indicando o percentual que o
ou maior
Um CV considerado baixo (indicando um conjunto de dados
razoavelmente homogneo) quando for menor ou igual a 25%. Entretanto, esse
Por exemplo, em medidas vitais (batimento cardaco, temperatura corporal,
se um CV muito menor do que 25% para que os dados sejam
Pode ser difcil classificar um coeficiente de variao como baixo, mdio,
alto ou muito alto, mas este pode ser bastante til na comparao de duas
Em um grupo de pacientes foram tomadas as pulsaes (batidas por
minuto) e dosadas as taxas de cido rico (mg/100ml). As mdias e os
e
, o que evidencia que a pulsao mais
Em experimentos para a determinao de clorofila em plantas, levantou-
se a questo de que se o mtodo utilizado poderia fornecer resultados
ocados prova e 12 folhas de
abacaxi foram analisadas com cada um dos mtodos. Os resultados
63

Note que as mdias so bastante diferentes devido s diferenas entre
os mtodos. Entretanto, os trs CV so prximos, o que indica que a
consistncia dos mtodos praticamente equivalente, sendo que o
mtodo 3 mostrou
12.0 - ESCORE PADRONIZADO
O escore padronizado, ao contrrio do CV, til para comparao dos
resultados individuais.
Por exemplo, um aluno que tenha obtido nota 7 numa prova cuja mdia
da classe foi 5 foi melhor do que numa prova em que tirou 8 mas a mdia da
classe foi 9.
Alm da comparao da nota individual com a mdia da classe, tambm
importante avaliar em cada caso se a variabilidade das notas foi grande ou
no.
Por exemplo, o desempenho deste aluno que obteve nota 7 seria
bastante bom se o desvio padro da classe fosse 2 e apenas razovel se o
desvio padro da classe fosse 4.
Sejam os dados observados
e a mdia e o desvio padro, ento
denominado escore padronizado.
Os escores padronizados so muito teis na comparao da posio
relativa da medida de um indivduo dentro do grupo ao qual pertence, o que
justifica sua grande apliacao como medida de avaliao de desempenho.
Exemplo:
Os escores padronizados so amplamente utilizados em teste de aptido fsica.
Mathews (1980) compara testes de aptido fsica e conhecimento desportivo.

Tabela 10: Resultados obtidos
desvio padro da turma em teste de aptido fsica e conhecimento desportivo
Teste

Note que as mdias so bastante diferentes devido s diferenas entre
os mtodos. Entretanto, os trs CV so prximos, o que indica que a
onsistncia dos mtodos praticamente equivalente, sendo que o
mtodo 3 mostrou-se um pouco menos consistente.
ESCORE PADRONIZADO
O escore padronizado, ao contrrio do CV, til para comparao dos
Por exemplo, um aluno que tenha obtido nota 7 numa prova cuja mdia
da classe foi 5 foi melhor do que numa prova em que tirou 8 mas a mdia da
Alm da comparao da nota individual com a mdia da classe, tambm
m cada caso se a variabilidade das notas foi grande ou
Por exemplo, o desempenho deste aluno que obteve nota 7 seria
bastante bom se o desvio padro da classe fosse 2 e apenas razovel se o
desvio padro da classe fosse 4.
os dados observados em uma amostra de tamanho
a mdia e o desvio padro, ento

denominado escore padronizado.
Os escores padronizados so muito teis na comparao da posio
relativa da medida de um indivduo dentro do grupo ao qual pertence, o que
a grande apliacao como medida de avaliao de desempenho.
Os escores padronizados so amplamente utilizados em teste de aptido fsica.
Mathews (1980) compara testes de aptido fsica e conhecimento desportivo.
Resultados obtidos por duas alunas do curso secundrio, mdia e
desvio padro da turma em teste de aptido fsica e conhecimento desportivo

x z
Note que as mdias so bastante diferentes devido s diferenas entre
os mtodos. Entretanto, os trs CV so prximos, o que indica que a
onsistncia dos mtodos praticamente equivalente, sendo que o
O escore padronizado, ao contrrio do CV, til para comparao dos
Por exemplo, um aluno que tenha obtido nota 7 numa prova cuja mdia
da classe foi 5 foi melhor do que numa prova em que tirou 8 mas a mdia da
Alm da comparao da nota individual com a mdia da classe, tambm
m cada caso se a variabilidade das notas foi grande ou
Por exemplo, o desempenho deste aluno que obteve nota 7 seria
bastante bom se o desvio padro da classe fosse 2 e apenas razovel se o
em uma amostra de tamanho e
Os escores padronizados so muito teis na comparao da posio
relativa da medida de um indivduo dentro do grupo ao qual pertence, o que
a grande apliacao como medida de avaliao de desempenho.
Os escores padronizados so amplamente utilizados em teste de aptido fsica.
Mathews (1980) compara testes de aptido fsica e conhecimento desportivo.
por duas alunas do curso secundrio, mdia e
desvio padro da turma em teste de aptido fsica e conhecimento desportivo

64

Maria Joana Maria Joana
abdominais em 2 min 30 6 42 38 2,00 1,33
salto em extenso (cm) 155 23 102 173 -2.33 0,78
suspenso braos
flexionados (seg)
50 8 38 71 -1.50 2,63
correr/andar em 12 min (m) 1829 274 2149 1554 1,17 -1,00
conhecimento desportivo 75 12 97 70 1,83 -0,42

Maria apresentou um desempenho muito acima da mdia em fora abdominal
(dois desvio padro acima da mdia); sua capacidade aerbica
(corrida/caminhada) est acima da mdia mas no notvel e ela tem um
conhecimento desportivo bastante bom comparado com o grupo.

65

Referncias:
- Raposo, Anselmo Baganha.Estatstica aplicada educao.So Luis:UEMA
Ed, 2004.
-Cunha, S.Ezequiel.Iniciao estatstica.Belo Horizonte, L;Brasilia, INL,
1976.

Você também pode gostar