Você está na página 1de 45

Estatstica

Autor: Prof. Alan Rodrigo Navia


Colaboradores: Profa. Silmara Maria Machado
Prof. Nonato Assis de Miranda
Profa. Ana Carolina Bueno Borges

Professor conteudista: Alan Rodrigo Navia


Alan Rodrigo Navia natural de So Paulo e morador de Taboo da Serra. graduado em Materiais, Processos e
Componentes Eletrnicos pela Fatec-SP. Possui mestrado em Engenharia Eletrnica pela Poli-USP, na rea de Circuitos
Integrados.
Exerceu as seguintes funes no mercado de trabalho: pesquisador em Engenharia na Swiss Group, analista
estatstico na Amcham, especialista em sistemas pleno no Carrefour e atualmente coordenador de sistemas no
Grupo Renac.
Academicamente, lecionou na Fundao Santo Andr no curso de Engenharia, foi auxiliar docente do curso de
Engenharia Eletrnica na Poli-USP e leciona h quase dez anos na Unip. Principais disciplinas de atuao: Estatstica,
Banco de Dados, Programao de Computadores e Matemtica, para diversos cursos de graduao. Este material foi
escrito com base nos vrios anos de docncia em Estatstica, para cursos que no so da rea de Exatas.

Dados Internacionais de Catalogao na Publicao (CIP)


F325e

Navia, Alan Rodrigo


Estatstica / Alan Rodrigo Navia. So Paulo: Editora Sol, 2013.
80 p., il.
Notas: este volume est publicado nos Cadernos de
Estudos e Pesquisas da UNIP, Srie Didtica, ano XVII, n. 2-045/13,
ISSN 1517-9230
1. Estatstica. 2. Pedagogia. 3. Servio Social. I. Ttulo.
CDU 519.2

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrnico, incluindo fotocpia e gravao) ou arquivada em qualquer sistema ou banco de dados sem
permisso escrita da Universidade Paulista.

Prof. Dr. Joo Carlos Di Genio


Reitor

Prof. Fbio Romeu de Carvalho


Vice-Reitor de Planejamento, Administrao e Finanas

Profa. Melnia Dalla Torre


Vice-Reitora de Unidades Universitrias

Prof. Dr. Yugo Okida


Vice-Reitor de Ps-Graduao e Pesquisa

Profa. Dra. Marlia Ancona-Lopez


Vice-Reitora de Graduao

Unip Interativa EaD


Profa. Elisabete Brihy
Prof. Marcelo Souza
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli

Material Didtico EaD


Comisso editorial:

Dra. Anglica L. Carlini (UNIP)

Dra. Divane Alves da Silva (UNIP)

Dr. Ivan Dias da Motta (CESUMAR)

Dra. Ktia Mosorov Alonso (UFMT)

Dra. Valria de Carvalho (UNIP)
Apoio:

Profa. Cludia Regina Baptista EaD

Profa. Betisa Malaman Comisso de Qualificao e Avaliao de Cursos

Projeto grfico:

Prof. Alexandre Ponzetto
Reviso:

Juliana Maria Mendes
Amanda Casale

Sumrio
Estatstica
APRESENTAO.......................................................................................................................................................7
INTRODUO............................................................................................................................................................7
Unidade I

1 CONCEITOS FUNDAMENTAIS..........................................................................................................................9
1.1 Conceitos iniciais......................................................................................................................................9
1.2 Dados.......................................................................................................................................................... 10
1.3 Populao x amostra.............................................................................................................................11
1.4 Amostragem ............................................................................................................................................11
2 DISTRIBUIO DE FREQUNCIAS.............................................................................................................. 14
2.1 Conceitos bsicos.................................................................................................................................. 14
2.2 Elementos de uma distribuio de frequncia.......................................................................... 18
2.2.1 Classe (i)....................................................................................................................................................... 18
2.2.2 Limites de classe (li e Li)........................................................................................................................ 18
2.2.3 Amplitude de classe (hi)........................................................................................................................ 18
2.2.4 Amplitude amostral (AA)...................................................................................................................... 18
2.2.5 Ponto mdio de classe (xi).................................................................................................................... 19

2.3 Tipos de frequncias............................................................................................................................. 19


2.3.1 Frequncia absoluta ou simples (fi).................................................................................................. 19
2.3.2 Frequncia relativa (fri)......................................................................................................................... 19
2.3.3 Frequncia acumulada (Fi)................................................................................................................... 20

2.4 Construo de distribuies de frequncias.............................................................................. 21


2.4.1 Distribuio sem intervalo................................................................................................................... 21
2.4.2 Distribuio com intervalo................................................................................................................... 21

2.5 Representaes grficas..................................................................................................................... 24


2.5.1 Histograma (grfico de colunas) ...................................................................................................... 24
2.5.2 Polgono de frequncias (grfico cartesiano) ............................................................................. 24

3 MEDIDAS DE TENDNCIA CENTRAL.......................................................................................................... 25


3.1 Mdia (x)................................................................................................................................................... 25
3.1.1 Dados no agrupados............................................................................................................................ 25
3.1.2 Distribuio de frequncias sem intervalo.................................................................................... 26
3.1.3 Distribuio de frequncias com intervalo................................................................................... 26

3.2 Moda (Mo)................................................................................................................................................ 28


3.2.1 Dados no agrupados............................................................................................................................ 28
3.2.2 Distribuio de frequncias sem intervalo.................................................................................... 29
3.2.3 Distribuio de frequncias com intervalo................................................................................... 29

3.3 Mediana (Md).......................................................................................................................................... 30


3.3.1 Dados no agrupados............................................................................................................................ 31
3.3.2 Distribuio de frequncias sem intervalo.................................................................................... 31
3.3.3 Distribuio de frequncias com intervalo................................................................................... 32

4 MEDIDAS DE DISPERSO.............................................................................................................................. 34
4.1 Introduo................................................................................................................................................ 34
4.2 Varincia (s2)............................................................................................................................................ 35
4.2.1 Dados no agrupados............................................................................................................................ 35
4.2.2 Distribuio de frequncias sem intervalo.................................................................................... 36
4.2.3 Distribuio de frequncias com intervalo................................................................................... 37

4.3 Desvio-padro (s).................................................................................................................................. 38


4.3.1 Dados no agrupados............................................................................................................................ 39
4.3.2 Distribuio de frequncias sem intervalo.................................................................................... 39
4.3.3 Distribuio de frequncias com intervalo................................................................................... 40

4.4 Coeficiente de variao (CV)............................................................................................................. 40


Unidade II

5 CONCEITOS BSICOS DE PROBABILIDADE............................................................................................. 46


5.1 Conceitos fundamentais.................................................................................................................... 46
5.2 Eventos complementares .................................................................................................................. 50
5.3 Eventos independentes....................................................................................................................... 51
5.4 Eventos mutuamente exclusivos.................................................................................................... 52
5.4.1 Exerccio resolvido................................................................................................................................... 54

6 DISTRIBUIO NORMAL DE PROBABILIDADES.................................................................................... 56


6.1 Conceitos fundamentais.................................................................................................................... 56
6.1.1 Exerccios resolvidos............................................................................................................................... 61

7 CORRELAO LINEAR..................................................................................................................................... 66
7.1 Conceitos e diagrama de disperso............................................................................................... 66
8 COEFICIENTE DE PEARSON........................................................................................................................... 68

APRESENTAO

Este livro-texto contempla os temas fundamentais para um curso de Introduo Estatstica, que na
maioria das instituies de ensino superior ou tcnico tem durao semestral.
A grande quantidade de exerccios de fixao e a preocupao em explicar os mtodos de clculo,
passo a passo, sem excesso de texto, so os pontos marcantes deste material, que tem como objetivo
ensinar os conceitos bsicos de Estatstica para um pblico que no lida diariamente e/ou tem pouca
desenvoltura com a Matemtica.
O pr-requisito para acompanhar esta obra somente a Matemtica do primeiro grau, atualmente
chamado de Ensino Fundamental, o que atende principalmente aos cursos que no so de Exatas, pois
nestes a Matemtica exercitada a todo o momento, nas mais diversas disciplinas, tais como Fsica,
Clculo, Programao de Computadores etc.
Espero que esta obra ajude o leitor a compreender os conceitos bsicos de Estatstica de maneira
mais leve, porm bastante consistente.
INTRODUO

Este livro-texto aborda os assuntos fundamentais da Estatstica, desde o estudo de uma varivel at
a introduo ao estudo do comportamento mtuo de duas variveis.
A Unidade I cobre os conceitos introdutrios, porm importantssimos para o entendimento do
restante do material, a organizao de dados em tabelas de frequncia, a obteno de medidas de
tendncia e posio e a determinao de medidas de disperso e variabilidade. Esses tpicos fazem parte
da Estatstica Descritiva (responsvel por organizar e descrever os dados coletados).
A Unidade II cobre os conceitos de probabilidade simples (que tambm so abordados na disciplina
Matemtica), distribuio normal de probabilidades e a determinao da correlao entre duas variveis,
por meio do diagrama de disperso e do coeficiente de Pearson.
Cada unidade pode ser ministrada em um bimestre, se o curso introdutrio de Estatstica for de duas
horas-aula semanais. Vale lembrar que o material tem como leitor-alvo o aluno de graduao dos cursos
da rea de Humanas e Cincias Sociais Aplicadas.
Espero que este livro auxilie o aluno com pouca desenvoltura em Matemtica a entender e aplicar
os conceitos bsicos de Estatstica, alm de servir como guia para qualquer aluno relembrar Estatstica
rapidamente.

ESTATSTICA

Unidade I
1 CONCEITOS FUNDAMENTAIS
1.1 Conceitos iniciais

A palavra estatstica tem origem do vocbulo latino status, que significa estado, e foi utilizada para
o levantamento de dados por parte do Estado, visando tomada de decises.
Atualmente a Estatstica parte da Matemtica Aplicada que se dedica ao estudo e interpretao
de fenmenos coletivos e deles extrai concluses.
A Estatstica fornece mtodos para:
coleta de dados, feita normalmente por meio de um questionrio ou da observao direta do
fenmeno estudado;
organizao e descrio dos dados;
anlise e interpretao dos dados visando tomada de decises.
A Estatstica pode ser aplicada s mais diversas reas do conhecimento, tais como Economia, Fsica,
Medicina, Psicologia, Engenharia, Pedagogia e Servio Social, para tabular e interpretar os resultados de
um experimento, e, mais recentemente, para a gerao e a interpretao de indicadores.
Esses indicadores so largamente utilizados na gesto dos mais diversos segmentos do conhecimento.
Para um aluno de qualquer curso superior, a Estatstica muito importante para:
organizar e analisar os dados de um experimento cientfico/observao de um fenmeno em
qualquer rea do conhecimento;
servir de embasamento para entender, analisar e at criar indicadores relevantes em seu trabalho
(entendendo que, muitas vezes, o egresso de um curso superior pode assumir um cargo de gerncia
no seu segmento de formao).
Podemos citar como exemplos de indicadores: o ndice de desenvolvimento humano (IDH) de
uma determinada localidade, a taxa de evaso de clientes de uma empresa de telefonia e os vrios
indicadores de aprendizado utilizados na educao.

Unidade I
A Estatstica pode ser classificada em:
descritiva: responsvel pela coleta, organizao e descrio dos dados;
indutiva: responsvel pela anlise e interpretao dos dados.
1.2 Dados

Dados so informaes obtidas a partir de medies, resultados de pesquisas, contagens e


levantamentos em geral.
Alguns exemplos de dados so: o nmero de alunos de uma classe, o nmero de eleitores que
votaram em um determinado candidato em uma eleio, o nmero de leitos ocupados em um hospital
e as notas dos candidatos de um determinado concurso pblico.
Em Estatstica, os dados podem ser classificados como:
Qualitativos: so dados compostos de qualquer informao no numrica. Exemplos: estado
civil (solteiro, casado); cor dos olhos (pretos, castanhos, verdes); time do corao (Corinthians,
Palmeiras, So Paulo, Santos); religio praticada (catlica, protestante, budista); tipo sanguneo
(A, B, O) etc.
Quantitativos: so dados compostos de informaes numricas e podem ser subdivididos em:
Discretos: so compostos somente por nmeros inteiros e enumerveis (na maioria das vezes,
so oriundos de uma contagem). Exemplos: nmero de filhos, populao de um municpio, nmero de
escolas particulares em um determinado local, nmero de visitas em um determinado site na internet
etc.
Contnuos: so compostos por nmeros inteiros ou fracionrios (na maioria das vezes, so
obtidos por meio de uma medio). Exemplos: altura, peso, preo de um determinado produto, rea de
um terreno, renda mensal de uma famlia, o tempo gasto em uma viagem nacional, a distncia entre
dois bairros etc.
Dados

Qualitativos

Quantitativos

Discretos

Contnuos
Figura 1 Classificao dos dados em Estatstica

10

ESTATSTICA

Observao
A classificao da varivel depende do contexto. Por exemplo: para fins
cadastrais, a varivel idade poderia ser quantitativa discreta; na Pediatria,
porm, contnua, pois a parte fracionria tambm considerada.
1.3 Populao x amostra

Populao o conjunto de entes portadores de, no mnimo, uma caracterstica comum; tambm
chamada de universo estatstico. Um exemplo so os estudantes de uma instituio de ensino, pois
a caracterstica comum o fato de estudarem na mesma instituio. Os eleitores de um estado da
federao tambm so um exemplo.
Na maioria das vezes, podemos concluir que invivel ter acesso a toda a populao para a coleta
de dados (por limitaes monetrias, de tempo etc.). Logo, normalmente feita a coleta em uma parte,
que deve ser muito representativa dessa populao. Tal parcela denominada amostra.
Amostra corresponde ao subconjunto finito e representativo de uma populao. Para obtermos
uma boa amostra, utilizamos a tcnica da amostragem.
1.4 Amostragem

H diversos tipos de amostragem.


Na amostragem simples (ou aleatria), todos os itens da populao tm igual chance de pertencer
amostra (normalmente feita por sorteio).

Sorteio

Amostra
Populao
Figura 2 Amostragem simples

J na amostragem sistemtica, os itens encontram-se ordenados e enumerados, e a coleta dos


elementos da amostra feita periodicamente.
8 7 6 5 4 3 2 1
Populao

7 4 1
Amostra

Figura 3 Amostragem sistemtica

11

Unidade I
Observao: perodo de trs (elementos coletados, iniciando do primeiro e em seguida coletando de
trs em trs).
Na amostragem estratificada, a populao encontra-se dividida em vrios estratos, e as amostras
so coletadas aleatoriamente de cada estrato.

Amostra
Populao
Figura 4 Amostragem estratificada

Saiba mais
Aps a leitura e a compreenso deste material, voc pode aprofundar
os estudos em amostragem (para compreender assuntos como tamanho e
nvel de confiana de amostra), lendo o livro a seguir:
BRUNI, A. L. Estatstica aplicada gesto empresarial. So Paulo: Atlas,
2007.
Exemplos de Aplicao

1. Cite pelo menos dez aplicaes da Estatstica (pesquise em jornais e sites da internet).
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
2. Defina os termos amostra e populao.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
12

ESTATSTICA
3. O que so dados qualitativos?
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
4. O que so dados quantitativos discretos e quantitativos contnuos?
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
5. D pelo menos oito exemplos para cada tipo de dado:
a) Qualitativo
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
b) Quantitativo discreto
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
c) Quantitativo contnuo
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
6. Pesquise um exemplo prtico para cada tipo de amostragem.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________

13

Unidade I
2 DISTRIBUIO DE FREQUNCIAS
2.1 Conceitos bsicos

Para compreender todos os conceitos, ser utilizada uma amostra como exemplo. A amostra de
quarenta alunos de uma escola qualquer, e a varivel a ser estudada a estatura deles em centmetros.
Segue a tabela dos valores de estaturas (em cm) coletados:
Tabela 1 Tabela primitiva das estaturas dos alunos
166

161

162

165

164

162

168

156

160

164

155

163

155

169

170

154

156

153

156

158

160

150

160

167

160

161

163

173

155

168

152

160

155

151

164

161

172

157

158

161

Essa tabela com os dados coletados (dados brutos), sem nenhuma organizao, chamada de tabela
primitiva.
Analisando os dados na tabela primitiva, para determinar a maior e a menor estatura, ser necessrio
examinar item a item, o que tende a ser ineficiente, principalmente se o tamanho da amostra for grande.
Logo, se os dados da tabela forem organizados em ordem crescente ou decrescente, ser obtida uma
nova tabela chamada de rol.
Tabela 2 Rol das estaturas dos alunos
150

155

160

162

166

151

156

160

162

167

152

156

160

163

168

153

156

160

163

168

154

157

161

164

169

155

158

161

164

170

155

158

161

164

172

155

160

161

165

173

Examinando o rol, fica fcil determinar a maior e a menor estatura (173 e 150 cm, respectivamente),
o que permite concluir que a faixa de estaturas de 150 a 173 cm. Outros questionamentos, como: Qual
a estatura com o maior nmero de alunos? (160 cm) e Qual(is) (so) a(s) estatura(s) inexistente(s) no
14

ESTATSTICA
intervalo de 150 a 173 cm? (159 e 171 cm), podem ser respondidos, porm com uma observao mais
cuidadosa do rol.
Para responder ao questionamento anterior com mais agilidade, o rol ser alocado em uma
tabela, em que cada estatura ter um nmero correspondente de ocorrncias (vindo da contagem
do rol).
Tabela 3 Tabela de ocorrncias das estaturas dos alunos
Estatura (cm)

Nmero de ocorrncias

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

Esta tabela de ocorrncias para todos os valores das estaturas chamada de distribuio
de frequncias. Nesse caso, como foram exibidos todos os valores de estatura, esta distribuio
classificada como sem intervalo.

15

Unidade I
Tabela 4 Distribuio de frequncias sem intervalo para as estaturas dos alunos
Estatura (cm)

Fi

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

fi

40

Onde:
fi = frequncia (nmero de ocorrncias para cada valor de estatura)
fi = n
fi = soma das frequncias
n = nmero de elementos da amostra (n = 40)
A amostra das estaturas tem a faixa de estaturas de 23 cm (basta subtrair a maior da menor estatura),
que resulta numa tabela com muitas linhas. Se a faixa de estaturas fosse maior, a tabela teria ainda mais
linhas, o que prejudicaria a anlise rpida dos dados.
Para gerar uma tabela mais enxuta e de fcil anlise, possvel agrupar as estaturas em intervalos. No
exemplo, as estaturas sero agrupadas de quatro em quatro, gerando intervalos de 4 cm (no momento,
16

ESTATSTICA
no h a necessidade de preocupar-se com a razo de o agrupamento ser de quatro em quatro, pois
adiante ser explicado o critrio de clculo utilizado). Essa tabela chamada de distribuio de
frequncias com intervalo.
Tabela 5 Distribuio de frequncias com intervalo para as estaturas dos alunos
Estaturas (cm)

fi

150 154

154 158

158 162

11

162 166

166 170

170 174

fi

40

Onde:
o operador de intervalo.

Inclui o valor

No inclui o valor (utiliza-se o anterior)


Figura 5

Exemplo:
O quinto intervalo da tabela anterior que mostra 166 170 para as estaturas de 166 a 169 cm
(note que o valor 170 cm considerado no sexto). Os valores do rol que atendem a esse intervalo so:
166, 167, 168, 168 e 169. Estes cinco valores resultam na frequncia igual a 5 para o quinto intervalo.
A etapa da contagem dos valores do rol para a tabela de frequncias deve ser feita com o mximo de
cuidado, pois um erro na contagem ocasiona anlises equivocadas e valores errados de todas as medidas
estatsticas feitas a partir dessa tabela.

Saiba mais
O modelo de distribuio estudado o mais utilizado pelos autores,
porm existem outros modelos, com outros tipos de intervalo alm do .
Matematicamente um intervalo pode ser representado de diversas maneiras,
como (,, e ).
Para mais informaes sobre esse assunto, leia:

MORETTIN, L. G. Estatstica bsica. So Paulo: Makron Books, 1999.


17

Unidade I
2.2 Elementos de uma distribuio de frequncia

Todos os conceitos a seguir sero explicados com base na distribuio de frequncias j explicada
anteriormente (Tabela 5).
2.2.1 Classe (i)
cada intervalo, ou cada linha para uma tabela de frequncias. O total de classes de uma tabela de
frequncias denominado k.
Exemplo: i = 3 (terceira classe: 158 162)

k=6

2.2.2 Limites de classe (li e Li)


So os extremos de cada classe.
Onde li o limite inferior (extremo a esquerda) e Li o limite superior (extremo a direita) da classe.
O ndice i apenas indica qual a classe abordada.
Exemplo: l2 = limite inferior da segunda classe = 154

L5 = limite superior da quinta classe = 170

2.2.3 Amplitude de classe (hi)


a medida do intervalo de classe.
hi = Li - li
Exemplo: h3 = amplitude da terceira classe
h3 = L3 -l3 = 162 - 158 = 4cm
Observao
Uma distribuio com intervalos sempre ter a mesma amplitude para
todas as classes. Note que para todos os intervalos o h 4.
2.2.4 Amplitude amostral (AA)
a diferena entre o valor mximo e o valor mnimo da amostra. obtido por meio do rol (nesse
caso, a Tabela 2).
AA = Xmax - xmin
18

ESTATSTICA
Exemplo: Amplitude amostral para as estaturas dos alunos
AA = 173 - 150 = 23cm
2.2.5 Ponto mdio de classe (xi)
o ponto que divide a classe em duas partes iguais. Ser muito utilizado a partir deste ponto.
xi =

li + Li
2

Exemplo: Ponto mdio da segunda classe.


x2 =

154 + 158
= 156 cm
2

2.3 Tipos de frequncias

2.3.1 Frequncia absoluta ou simples (fi)


o nmero de ocorrncias para cada uma das classes, obtida por meio da contagem no rol.
Exemplo: f3 = 11
2.3.2 Frequncia relativa (fri)
a razo (diviso) da frequncia simples com a soma das frequncias da classe. Fornece a participao
percentual de cada classe em relao amostra.
ri =

i
i

Lembrete
fi = n (a soma das frequncias igual ao nmero de elementos do rol).
e
fri = 1 (a soma das frequncias relativas deve ser sempre igual a 1,
que indica 100%).

19

Unidade I
Exemplo:
r2 =

2
9
=
= 0, 225
i 40

Isso significa que 22,5% das estaturas esto na segunda classe, pois 0,225 x 100 = 22,5%.
2.3.3 Frequncia acumulada (Fi)
a soma das frequncias at a classe indicada.
Exemplo:
F2 = frequncia acumulada da segunda classe = soma das frequncias simples at a segunda classe.
F2 = 4 + 9 = 13
Finalmente temos a distribuio com as frequncias e os pontos mdios calculados.
Tabela 6 Distribuio de frequncias com intervalo para as estaturas dos alunos, com as
frequncias calculadas
I

Estaturas (cm)

fi

xi

fri

Fi

150 154

152

0,100

154 158

156

0,225

13

158 162

11

160

0,275

24

162 166

164

0,200

32

166 170

168

0,125

37

170 174

172

0,075

40

40

1,000

Para a coluna fi, contar cuidadosamente os elementos do rol, lembrando-se da notao de


intervalo e considerando as repeties.
Para facilitar a determinao da coluna xi, basta calcular o ponto mdio, a primeira classe (152) e
somar a amplitude de classe (4), intervalo por intervalo.
No obrigatrio, mas altamente recomendvel utilizar duas ou trs casas aps a vrgula para
os valores de fri, visando sempre a um percentual preciso por classe.
Note que o ltimo valor de Fi sempre a soma das frequncias (fi).
20

ESTATSTICA
2.4 Construo de distribuies de frequncias

2.4.1 Distribuio sem intervalo


Dado o rol de uma pesquisa referente ao nmero de carros por residncia em um determinado bairro
de SP (n = 20).
Tabela 7 Rol do nmero de carros por residncia
0

Anlise: este rol apresenta poucas possibilidades de valores para a varivel, mais precisamente de 0
a 4 carros, e isso permite concluir que a distribuio sem intervalos a mais indicada.
Logo, para construir a distribuio de frequncias sem intervalos, no existe nenhum clculo. A
partir do rol, basta colocar em cada classe um dos valores da varivel e contar o nmero de ocorrncias
para cada classe.
Tabela 8 Distribuio de frequncias sem intervalo para o rol do nmero de carros por residncia
N de carros

Fi

20

2.4.2 Distribuio com intervalo


Com base no rol das estaturas dos alunos (n = 40), j mostrado e repetido a seguir para fins didticos.
Tabela 9 Repetio do rol das estaturas dos alunos
150

155

160

162

166

151

156

160

162

167

152

156

160

163

168

153

156

160

163

168

154

157

161

164

169

155

158

161

164

170

155

158

161

164

172

155

160

161

165

173

21

Unidade I
Anlise: este rol apresenta muitas possibilidades de valores para a varivel, mais precisamente de
150 a 173 cm (o que resultaria em uma distribuio sem intervalo com muitas linhas), e isso permite
concluir que a distribuio com intervalos a mais indicada.
Logo, para construir a distribuio de frequncias com intervalos, necessrio determinar:
o nmero de classes da distribuio (k)
k= n
Onde o valor de K deve ser sempre arredondado para inteiro.
Para o rol anterior:
K = 40 = 6, 32 , arredondando temos 6;
logo k = 6 (a distribuio dever ter 6 classes).
a amplitude de classe (h)
h=

AA
k

Em que o valor de h sempre ser arredondado para cima.


Para o rol do exemplo:
173 150 23
= = 3, 83 , arredondando para cima temos 4;
6
6
logo h = 4 (cada uma das classes ter amplitude de 4cm).
h=

De posse das duas informaes necessrias para montar uma tabela com intervalo (k = 6 e h = 4),
realizamos o seguinte procedimento:
Passo 1: colocar o menor valor do rol no limite inferior da primeira classe.
Passo 2: somar o valor de h calculado e colocar no limite superior da primeira classe. Colocar o sinal
de intervalo entre os limites.
Tabela 10 Incio da construo de uma distribuio sem intervalo

22

Estaturas (cm)

150 154

ESTATSTICA
Passo 3: repetir o limite superior da classe em foco na classe abaixo.
Tabela 11 Andamento da construo de uma distribuio sem intervalo
I

Estaturas (cm)

150 154

154

Passo 4: somar o valor de h (h = 4) calculado e colocar no limite superior desta classe. Colocar o
sinal de intervalo entre os limites.
Tabela 12 Andamento da construo de uma distribuio sem intervalo
I

Estaturas (cm)

150 154

154 158

Passo 5: repetir os passos 3 e 4 at completar o total de intervalos k calculado (k = 6).


Passo 6: determinar as frequncias simples (pela contagem no rol) para todas as classes da
distribuio. Finalmente, somar as frequncias, lembrando que fi deve ser igual a n.
Tabela 13 Distribuio sem intervalo finalizada

k=6

Estaturas (cm)

fi

150 154

154 158

158 162

11

162 166

166 170

170 174

40

h=4

Observao
Esse um dos critrios existentes para se construir uma distribuio de
frequncias com intervalo de classe. Existe tambm o critrio de Sturges,
que tambm bem conhecido. A principal diferena est no clculo de k,
pois nesse caso k dado por:
K =1+3,3 log n
23

Unidade I
2.5 Representaes grficas

Para a distribuio com intervalo, podemos representar os dados utilizando dois tipos de grfico: o
histograma e o polgono de frequncias.
2.5.1 Histograma (grfico de colunas)
Composio:
no eixo x (horizontal): os limites das classes da varivel em estudo;
no eixo y (vertical): as frequncias para cada uma das classes;
a altura da barra ser proporcional frequncia de cada uma das classes.
f
12
9
6
3
0

150

154

158

162

166

170

174

estaturas (cm)

Figura 6 Histograma para uma distribuio com intervalo (Tabela 13)

2.5.2 Polgono de frequncias (grfico cartesiano)


Composio:
no eixo x (horizontal): os pontos mdios das classes da varivel em estudo;
no eixo y (vertical): as frequncias para cada uma das classes;
ligar os pontos (no cruzamento das coordenadas dos eixos x e y); para fechar o polgono, devese:
- subtrair a amplitude de classe (no exemplo, h = 4) do ponto mdio da primeira classe (l1)
para fechar o polgono pela esquerda (no eixo x);
- somar a amplitude de classe (h = 4) no ponto mdio da ltima classe da distribuio para
fechar o polgono pela direita.
24

ESTATSTICA
f
12
9
6
3
0

150

154

158

162

166

170

174

Estaturas (cm)

Figura 7 Polgono de frequncias para uma distribuio com intervalo (Tabela 13)

3 MEDIDAS DE TENDNCIA CENTRAL

Para analisar um conjunto de dados, muitas vezes necessrio obter um nico valor que represente
toda a amostra em estudo. Esse valor usualmente obtido pelas medidas de tendncia central.
As medidas de tendncia central abordadas sero:
a mdia (x);
a moda (Mo);
a mediana (Md).
O clculo de cada uma das medidas de tendncia central ser explicado em trs abordagens:
dados no agrupados (no alocados em tabelas de frequncia);
distribuio de frequncia sem intervalo;
distribuio de frequncia com intervalo.
3.1 Mdia (x)

A mdia de um conjunto de dados a soma dos dados dividida pelo nmero de elementos do
conjunto.
3.1.1 Dados no agrupados
x=

xi
n

Onde: xi a soma dos valores do conjunto de dados.


n o nmero de elementos do conjunto de dados.


25

Unidade I
Exemplo: as notas de um aluno em uma determinada disciplina durante o ano foram: 3,5; 5,0; 6,5
e 9,0. A nota mdia do aluno na disciplina pode ser calculada por:
x=

3, 5 + 5, 0 + 6, 5 + 9, 0 24
=
= 6, 0
4
4

3.1.2 Distribuio de frequncias sem intervalo


x=

xi.fi
n

Onde: xi.fi a multiplicao dos valores das classes com as respectivas frequncias, classe por classe.
n o nmero de elementos do conjunto de dados que, nesse caso, determinado pela soma
das frequncias.
Exemplo: dada a distribuio sem intervalo da Tabela 8, determine o nmero mdio de veculos por
residncia em um determinado bairro.
Para armazenar os valores de xi.fi, uma coluna criada. Em seguida, os valores da coluna so somados,
gerando xi.fi.
Tabela 14 Clculo da mdia para uma distribuio sem intervalo

x=

N de carros

fi

xi.fi

0x2=0

1x9=9

2 x 5 = 10

3x2=6

4x2=8

20

xi.fi = 33

33
= 165
,
20

Logo, no bairro citado h em mdia 1,65 carros por residncia (para efeito de interpretao,
aproximadamente 2 carros por residncia).
3.1.3 Distribuio de frequncias com intervalo
x=


26

xi.fi
n

Onde: xi.fi a multiplicao dos pontos mdios das classes com as respectivas frequncias, classe
por classe.

ESTATSTICA
Lembrando que:
xi =

li + Li
2

n o nmero de elementos do conjunto de dados que, nesse caso, determinado pela soma
das frequncias.
Exemplo: dada a distribuio com intervalo da Tabela 13, determine a estatura mdia dos alunos
que compem a amostra.
O procedimento similar ao da distribuio sem intervalo, apenas com o detalhe de xi, que para uma
distribuio com intervalo o ponto mdio da classe.
Tabela 15 Clculo da mdia para uma distribuio com intervalo

x=

Estaturas (cm)

fi

xi

xi.fi

150 154

(150 + 154)/2 = 152

152 x 4 = 608

154 158

(154 + 158)/2 = 156

156 x 9 = 1404

158 162

11

(158 + 162)/2 = 160

160 x 11 =1760

162 166

(162 + 166)/2 = 164

164 x 8 = 1312

166 170

(166 + 170)/2 = 168

168 x 5 = 840

170 174

(170 + 174)/2 = 172

40

172 x 3 = 516
xi.fi = 6440

6440
= 161 cm
40

Logo, a estatura mdia para a amostra de alunos de 161 cm.


Observao
Uma anlise muito simples comparar os dados com a mdia. No
exemplo anterior, temos estaturas acima e abaixo da mdia. Logo, a mdia
pode ser um interessante indicador de classificao.
Exemplos de Aplicao

Compare as vendas mensais com uma mdia histrica, para indicar o desempenho de cada vendedor.

27

Unidade I

Observao
Alm da mdia que estudamos, muito utilizada como indicador de
tendncia, existem outros tipos, como: a mdia ponderada, que tambm
indica tendncia, mas considera os valores da varivel com pesos diferentes,
e a mdia mvel em um determinado nmero de valores (tipicamente de 3
a 12), largamente utilizada no clculo de previso.
3.2 Moda (Mo)

A moda o valor que ocorre com maior frequncia em um conjunto de dados. Serve para indicar as
regies das mximas frequncias.
3.2.1 Dados no agrupados
Dados os conjuntos a seguir, a moda ser determinada analisando-se as maiores frequncias.
Exemplo 1: conjunto 1
20 30

40

80

10

20 30 20

10

O valor 20 se repete mais vezes que os outros (possui maior frequncia).


Mo = 20
Exemplo 2: conjunto 2
10
20
30 30 30 40 50 50 50 60
Os valores 30 e 50 se repetem mais vezes que os outros valores do conjunto; logo, existem duas
modas (30 e 50).
Mo = 30 e Mo = 50 (conjunto bimodal)
Exemplo 3: conjunto 3
100

110

124

145

101

200

500

Nenhum valor se repete mais vezes que os outros valores do conjunto; logo, no existe valor modal
(conjunto amodal).

28

ESTATSTICA
3.2.2 Distribuio de frequncias sem intervalo
Para determinar a moda em uma distribuio sem intervalo, basta identificar a classe com maior
frequncia simples (classe modal). A moda ser o valor da varivel da classe modal.
Exemplo: dada a distribuio sem intervalo da Tabela 8, determine o valor modal dos veculos por
residncia em um determinado bairro.
Tabela 16 Obteno da moda para uma distribuio sem intervalo
N de carros

fi

20

Maior fi na segunda classe (classe modal)


O valor da varivel para a classe modal igual a 1; logo, Mo = 1.
3.2.3 Distribuio de frequncias com intervalo
Para determinar a moda em uma distribuio com intervalo, inicialmente necessria a classe modal
(da mesma forma que na distribuio sem intervalo).
Nesse caso, a moda ser obtida aplicando-se a frmula a seguir na classe modal:
Mo = l * +

d1
h*
d1 + d2

Onde: l* o limite inferior da classe modal



h* a amplitude da classe modal




d1 = f* - fant
d2 = f* - fpost
f* a frequncia simples da classe modal
fant a frequncia simples anterior (acima) classe modal.
fpost a frequncia simples posterior (acima) classe modal.

Existem vrios modelos para clculo da moda. O modelo aqui apresentado o mais utilizado e
chama-se Moda de Czuber.
29

Unidade I
Exemplo: dada a distribuio com intervalo da Tabela 13, determine a estatura modal dos alunos
que compem a amostra.
Tabela 17 Obteno da moda para uma distribuio com intervalo
I

Estaturas (cm)

fi

150 154

154 158

158 162

11

162 166

166 170

170 174

40

Maior fi na terceira classe (classe modal)


l* = 158
h* = 4
d1 = 11 - 9 = 2
d2 = 11 - 8 = 3
Logo:
2
4
2+3
8
Mo = 158 + = 158 + 1, 6
5
Mo = 159, 6 cm
Mo = 158 +

Observao
Assim como nos dados no agrupados, uma distribuio pode ser
bimodal, desde que existam duas maiores frequncias. Nesse caso basta
calcular as modas para as duas classes modais. Isso vale para mais de duas
modas em uma distribuio, ainda que essa ocorrncia no seja to comum.
3.3 Mediana (Md)

A mediana o valor que caracteriza o centro de uma distribuio de frequncias. Divide um conjunto
ordenado de dados em duas partes iguais de 50% (da o fato de a mediana ser considerada tambm uma
medida de posio).
30

ESTATSTICA
3.3.1 Dados no agrupados
Dados os conjuntos a seguir, antes de determinar a mediana, necessrio ordenar os dados da amostra.
Exemplo 1: conjunto ordenado 1
20

30

50

80

190

210

300

Esta uma amostra mpar, pois possui 7 elementos (n = 7).


Para amostras mpares, a mediana o elemento central da srie de dados.
20

30

50

80

190

210

300

Logo, Md = 80.
Exemplo 2: conjunto ordenado 2
100 230

300

500

600

800

Esta uma amostra par, pois possui 6 elementos (n = 6)


Para amostras pares, existem dois elementos centrais na srie de dados, ento a mediana a mdia
de ambos.
100 230
Logo,



300 500
600
Md = (300+500) / 2
Md = 800 / 2
Md = 400

800

3.3.2 Distribuio de frequncias sem intervalo


Para determinar a mediana em uma distribuio sem intervalo necessrio:
Passo 1: determinar as frequncias acumuladas (Fi) de todas as classes da distribuio.
Passo 2: identificar a classe mediana. Para isso, necessrio calcular uma referncia.
i
2
Passo 3: comparar o valor da referncia com cada uma das frequncias acumuladas. Se houver um
Fi igual referncia, a classe deste Fi ser a classe mediana. Caso contrrio, dever ser escolhido o Fi
superior mais prximo da referncia para obter a classe mediana.
31

Unidade I
Passo 4: a mediana o valor da varivel da classe encontrada (classe mediana).
Exemplo: dada a distribuio sem intervalo da Tabela 18, determine o valor da mediana.
i 20
=
= 10 (referncia)
2
2
Tabela 18 Obteno da mediana para uma distribuio sem intervalo
N de carros

fi

Fi

11

16

18

20

20

Valor de Fi (11) superior mais prximo da referncia


(10). Esta a classe mediana (segunda classe).
O valor da varivel para a classe mediana igual a 1; logo, Md =1
3.3.3 Distribuio de frequncias com intervalo
Para determinar a mediana em uma distribuio com intervalo, inicialmente necessria a classe
mediana (da mesma forma que na distribuio sem intervalo, isto , seguindo os passos 1, 2 e 3).
Nesse caso, a mediana ser obtida aplicando-se a frmula a seguir na classe mediana:
i

Fant

Md = l * +
h *
*
Onde: l* o limite inferior da classe mediana

fi/2 a referncia, j calculada anteriormente para a escolha da classe mediana.

Fant a frequncia acumulada anterior (acima) classe mediana.

f* a frequncia simples da classe mediana.

h* a amplitude da classe mediana.
Exemplo: dada a distribuio com intervalo da Tabela 13, determine a estatura mediana dos alunos
que compem a amostra.
i 40
=
= 20 (referncia)
2
2
32

ESTATSTICA
Tabela 19 Obteno da mediana para uma distribuio com intervalo
I

Estaturas (cm)

fi

Fi

150 154

154 158

13

158 162

11

24

162 166

32

166 170

37

170 174

40

40

Valor de Fi (24) superior mais prximo da


referncia (20). Esta a classe mediana
(terceira classe).
l* = 158
fi/2 = 20
Fant = 17 = 13 + 4
f* = 11
h* = 4
Logo:
Md = 158 +

[20 17] 4
11

3
4
11
12
Md = 158 +
11
Md = 158 + 1, 09
Md = 159, 09 cm
Md = 158 +

Concluindo: a estatura que divide os 50% mais altos dos 50% mais baixos de 159,09 cm.
Observao
Alm da mediana, uma medida tanto de tendncia quanto de
posio, existem outras tambm importantes, como o quartil, o decil e
o percentil. O mtodo de obteno muito parecido com o da mediana,
que tem o dois como referncia nos clculos. O quartil, o decil e o
percentil, por sua vez, dividem uma srie em quatro, dez ou cem partes
iguais.
33

Unidade I
4 MEDIDAS DE DISPERSO
4.1 Introduo

As medidas de disperso tm como finalidade indicar o quanto os dados apresentam-se dispersos


em torno de uma regio central, isto , mostram o grau de variao em uma amostra.
As medidas de disperso abordadas sero:
a varincia (s2);
o desvio-padro (s);
o coeficiente de variao (CV).
Observao
Alm das medidas de disperso estudadas, existem modelos mais
simplificados, como a amplitude e o desvio mdio, que tm sua importncia,
porm no so to utilizados como o desvio-padro.
O clculo de cada uma das medidas ser explicado utilizando-se as trs abordagens citadas
anteriormente.
Porm, antes de serem apresentadas as frmulas e os mtodos para o clculo, interessante
acompanhar, por meio de um exemplo, o significado e a importncia do clculo da disperso.
Exemplo: existem trs grupos de pessoas (cada um com oito elementos). A varivel em estudo a
idade dessas pessoas.
Grupo 1:
20

20

20

20

20

20

20

20

19

20

20

21

22

22

10

13

20

25

35

50

Grupo 2:
18

18

Grupo 3:
2

Desejamos tirar algumas concluses sobre os trs grupos analisando a principal medida de tendncia,
a mdia.
34

ESTATSTICA
20 + 20 + 20 + 20 + 20 + 20 + 20 + 20 160
=
= 20
8
8
18 + 18 + 19 + 20 + 20 + 21 + 22 + 22 160
=
= 20
x do grupo 2 =
8
8
2 + 5 + 10 + 13 + 20 + 25 + 35 + 50 160
x do grupo 3 =
=
= 20
8
8
x do grupo 1 =

Os valores das mdias para os trs grupos foram iguais, mas percebemos que os grupos so totalmente
distintos quanto s idades.
No grupo 1, todos os valores coincidem com a mdia, pois no existem diferenas em relao a
esta, logo no existe disperso. um grupo formado somente por pessoas de 20 anos de idade.
No grupo 2, os valores no coincidem exatamente com a mdia, mas tambm no se afastam
muito desta, logo existe uma pequena disperso. um grupo formado por pessoas com idades
prximas de 20 anos.
No grupo 3, a maioria dos valores est bem afastada de mdia, logo existe uma considervel
disperso. um grupo formado pelas mais diversas idades.
Concluso: apenas utilizando a mdia, os trs grupos apresentavam um perfil de idades igual. No
entanto, considerando tambm a disperso das idades (afastamento dos valores em relao mdia),
podemos indicar as diferenas existentes entre os trs grupos.
4.2 Varincia (s2)

a mdia dos quadrados das diferenas dos valores em relao a sua mdia.
4.2.1 Dados no agrupados
( xi x )2
s =
n
2

Onde: xi so os valores da varivel



x a mdia do conjunto de valores

n o nmero de elementos do conjunto de valores
Exemplo: as notas que um aluno tirou em um determinada disciplina durante o ano foram:3,5; 5,0;
6,5; e 9,0. A varincia das notas do aluno na disciplina pode ser calculada por:
Obteno da mdia.
x=

3, 5 + 5, 0 + 6, 5 + 9, 0 24
=
= 6, 0
4
4
35

Unidade I
Obteno da varincia utilizando uma tabela para organizar os clculos.
Tabela 20 Tabela para auxiliar na obteno da varincia de dados no agrupados
xi

xi - x

(xi - x)2

3,5

3,5 - 6 = -2,5

(-2,5)2 = 6,25

5,0

5 - 6 = -1

(-1)2 = 1

6,5

6,5 6 = 0,5

(0,5)2 = 0,25

9,0

9-6=3

(3)2 = 9

24

s2 =

(xi - x)2 = 16,5

16, 5
= 4,13
4
Lembrete
O nmero elevado ao quadrado o produto do nmero por ele mesmo.
Para os clculos deste livro, uma calculadora com operaes bsicas (+, -, x
e /) e raiz quadrada mais que suficiente.

4.2.2 Distribuio de frequncias sem intervalo


s2 =

( xi x )2 i
n

Onde: xi so os valores da varivel para cada classe



x a mdia dos valores da distribuio

fi a frequncia simples de cada classe

n o nmero de elementos do conjunto de valores
Exemplo: dada a distribuio sem intervalo da Tabela 8, determine a varincia de veculos por
residncia em um determinado bairro.
Obteno da mdia (j vista no item 3.1.2).
x=

36

33
= 165
, carros
20

ESTATSTICA
Tabela 21 Clculo da varincia para uma distribuio sem intervalo
N de carros (xi)

fi

xi.fi

xi - x

(xi - x)2

(xi - x)2.fi

0x2=0

0 - 1,65 = -1,65

(-1,65)2 = 2,72

2,72 x 2 = 5,44

1x9=9

1 - 1,65 =- 0,65

(-0,65)2 = 0,42

0,42 x 9 = 3,78

2 x 5 = 10

2 - 1,65 = 0,35

(0,35) = 0,12

0,12 x 5 = 0,60

3x2=6

3 - 1,65 = 1.35

(1,35) = 1,82

1,82 x 2 = 3,64

4x2=8

4 - 1,65 = 2,35

(2,35) = 5,52

5,52 x 2 = 11,04

20

xi.fi = 33

2
2
2

(xi - x)2.fi = 24,5

Logo:
s2 =

24, 5
= 1, 23 carros2
20
Observao
Um dos problemas do uso direto da varincia que a unidade e o valor
estaro elevados ao quadrado.

4.2.3 Distribuio de frequncias com intervalo


Considere:
s2 =

( xi x )2 i
n

Onde:
xi o ponto mdio para cada classe
Lembrando que:
xi =

li + Li
2

Onde: x a mdia dos valores da distribuio



fi a frequncia simples de cada classe

n o nmero de elementos do conjunto de valores
Exemplo: dada a distribuio com intervalo da Tabela 13, determine a varincia das estaturas dos
alunos que compem a amostra.
37

Unidade I
O procedimento similar ao da distribuio sem intervalo, apenas com o detalhe de xi, que para uma
distribuio com intervalo o ponto mdio da classe.
Tabela 22a-b Clculo da varincia para uma distribuio com intervalo
a)

x=

Estaturas (cm)

fi

Xi

xi.fi

150 154

(150 + 154)/2 = 152

152 x 4 = 608

154 158

(154 + 158)/2 = 156

156 x 9 = 1404

158 162

11

(158 + 162)/2 = 160

160 x 11 =1760

162 166

(162 + 166)/2 = 164

164 x 8 = 1312

166 170

(166 + 170)/2 = 168

168 x 5 = 840

170 174

(170 + 174)/2 = 172

172 x 3 = 516

40

xi.fi = 6440

6440
= 161 cm
40

b)
xi - x

(xi - x)2

(xi - x)2.fi

152 - 161 = -9

(-9)2 = 81

81 x 4 = 324

156 - 161 = -5

(-5) = 25

25 x 9 = 225

160 -161 = -1

(-1)2 = 1

1 x 11 = 11

164 -161 = 3

(3)2 = 9

9 x 8 = 72

168 -161 = 7

(7)2 = 49

49 x 5 = 245

172 - 161 = 11

(11)2 = 121

121 x 3 = 363

(xi - x)2.fi = 1240

Logo:
s2 =

1240
= 31 cm2
40

4.3 Desvio-padro (s)

a raiz quadrada da varincia. a medida de disperso mais utilizada, por ter a mesma unidade que
a mdia, possibilitando uma melhor avaliao da disperso da amostra.
38

ESTATSTICA
4.3.1 Dados no agrupados
Considere:
( xi x )2
n

s=

Onde: xi so os valores da varivel



x a mdia do conjunto de valores

n o nmero de elementos do conjunto de valores
Utilizando o mesmo exemplo do item 4.2.1:
s2 =

16, 5
= 4,13
4

Logo:
s = 4,13 = 2, 03
4.3.2 Distribuio de frequncias sem intervalo
Considere:
( xi x )2 i
n

s2 =

Onde: xi so os valores da varivel para cada classe



x a mdia dos valores da distribuio

fi a frequncia simples de cada classe

n o nmero de elementos do conjunto de valores
Utilizando o mesmo exemplo do item 4.2.2:
s2 =

24, 5
= 1, 23 carros2
20

Logo:
s = 123
, = 111
, carros

39

Unidade I
4.3.3 Distribuio de frequncias com intervalo
Considere:
( xi x )2 i
n

s=

Onde: xi o ponto mdio para cada classe


Lembrando que: xi =

li + Li
2

x a mdia dos valores da distribuio


fi a frequncia simples de cada classe
n o nmero de elementos do conjunto de valores
Utilizando o mesmo exemplo do item 4.2.3:
s2 =

1240
= 31 cm2
40

Logo:
s = 31 = 5, 57 cm
4.4 Coeficiente de variao (CV)

o quociente entre o desvio-padro e a mdia. a medida de disperso relativa, que indica a


variabilidade percentual da amostra em relao mdia.
O coeficiente de variao til para comparao de variabilidade de dois conjuntos de dados com
unidades de medidas diferentes. Por exemplo, quando precisamos comparar altura e peso, idade e
nmero de filhos. Quanto menor este valor, mais homogneo ser o conjunto de dados.
s
CV = 100
x
A unidade do coeficiente de variao uma porcentagem (%).
A frmula e o mtodo de clculo so exatamente os mesmos para as trs abordagens apresentadas.
Vale ressaltar que quanto maior o CV, maior ser a variabilidade dos dados do conjunto, em relao
a sua mdia.
40

ESTATSTICA
Exemplo: calcular o coeficiente de variao do exemplo abordado no item 4.3.3 (estaturas dos
alunos).
Como:
x = 161 cm
s = 5,57 cm
Logo:
CV =

5, 57
557
100 =
= 3, 46%
161
161

As estaturas tm uma variabilidade de 3,46% em relao mdia.


importante dizer que o coeficiente de variao usado para comparar dois conjuntos de dados
com unidades diferentes. Exemplo: til para comparao de variabilidade de dois conjuntos de dados
com unidades de medida diferentes. Quanto menor esse valor, mais homogneo ser o conjunto de
dados.
Resumo
Nesta Unidade abordamos inicialmente os principais conceitos tericos
para o estudo dos mtodos estatsticos.
Foi apresentada a definio de Estatstica bem como a sua diviso em
Estatstica Descritiva e Indutiva. Neste livro-texto abordaremos a maior
parte da Estatstica Descritiva e o incio da Indutiva. Conceitos como os
tipos de dados, que podem ser quantitativos (subdivididos em discretos
e contnuos) e qualitativos, foram abordados com uma quantidade
significativa de exemplos para a perfeita compreenso.
Vimos ainda as definies de populao e amostra, e foi feita uma
breve explicao introdutria de amostragem, em que foram exibidos seus
principais tipos (aleatria, sistemtica e estratificada).
Estudamos as formas de se armazenar dados quantitativos, que
anteriormente estavam sob a forma de uma tabela primitiva ou um rol, em
distribuies de frequncias.
Aprendemos que existem dois tipos de distribuies de frequncias: sem
intervalo de classe e com intervalo de classe. Abordamos as diferenas e os
mtodos para a construo de uma tabela de frequncias, com ou sem intervalo.
41

Unidade I
Ressaltamos que erros, tanto na montagem da tabela quanto na contagem dos
valores do rol, resultam em anlise e medidas/indicadores errados.
Na sequncia, apresentamos os principais tipos de frequncias
existentes (simples, relativa e acumulada) e as suas respectivas finalidades.
Mostramos tambm a montagem de grficos (histograma e polgono de
frequncias) para distribuies de frequncias com intervalo (por serem as
mais utilizadas na prtica).
Alm disso, estudamos as trs principais medidas de tendncia
central: a mdia, a moda e a mediana. As medidas foram analisadas
sob trs abordagens distintas (dados no agrupados, distribuio de
frequncia sem intervalo e distribuio de frequncia com intervalo),
pois os mtodos de obteno das medidas apresentam significativas
diferenas para cada abordagem.
Vimos que a mdia de dados no agrupados a mdia aritmtica,
muito utilizada academicamente para verificar o aproveitamento do aluno
em uma disciplina. Aprendemos ainda que para a obteno da mdia para
distribuio de frequncia, devemos levar em conta tanto a frequncia
quanto o valor da varivel.
Abordamos a moda, que indica a(s) maior(es) frequncias em
uma srie de dados. Foram apresentadas as trs abordagens para a
obteno. A mediana, posio que indica o centro de uma srie de
dados (divide a srie em duas partes de 50%) tambm foi apresentada
das trs maneiras.
No que se refere s medidas de disperso, estudamos trs das principais,
novamente nas trs abordagens (dados no agrupados, distribuio sem
intervalo e distribuio com intervalo).
Aprendemos que a varincia, definida pela mdia dos quadrados das
diferenas dos valores em relao a sua mdia, importante, porm no
muito utilizada, pelo fato de a unidade da grandeza envolvida no clculo
estar elevada ao quadrado. Vimos, entretanto, que o desviopadro,
cuja definio a raiz quadrada da varincia, muitssimo utilizado
em vrias reas do conhecimento, para quantificar a disperso de uma
srie de dados.
Para termos uma noo percentual da disperso em relao mdia,
foi apresentado o coeficiente de variao, que uma medida de disperso
derivada do desvio-padro e da mdia dos dados analisados.
42

ESTATSTICA

Exerccios
Questo 1. Foi realizada uma pesquisa sobre a faixa etria das crianas participantes de um
acampamento. O grfico a seguir mostra os resultados:
8
7
6
Freq

5
4
3
2
1
0
5

Idade

11

13

15

Figura 8

Com base no grfico, julgue as afirmaes a seguir:


I. O conjunto de dados possui 6 classes e a amplitude de cada classe 2.
II. O limite inferior da primeira classe 5 e o limite superior 7.
III. Os valores 5, 7, 9, 11, 13 e 15 so os pontos mdios de cada classe.
IV. A moda 11.
V. O polgono de frequncia construdo a partir do limite inferior de cada classe.
So corretas apenas as afirmativas:
A) I, II, IV.
B) I, II, V.
C) II, III, V.
D) I e III.
E) III e IV.
Resposta correta: alternativa D.
43

Unidade I
Anlise das afirmativas
I Afirmativa correta.
Justificativa: no histograma, cada coluna corresponde ao nmero de classes da tabela de frequncias.
No grfico anterior h seis colunas que correspondem s seis classes da tabela de frequncias.
II Afirmativa incorreta.
Justificativa: o limite inferior da primeira classe o extremo inferior 4, sendo esse o valor em que
comea a coluna correspondente primeira classe. O limite superior da primeira classe o extremo
superior 6, sendo esse o valor em que termina a coluna correspondente da primeira classe.
III Afirmativa correta.
Justificativa: os pontos mdios de cada classe so os pontos que dividem as classes em duas partes
iguais, e os valores dos pontos mdios do histograma anterior so 5, 7, 9, 11, 13 e 15.
IV Afirmativa incorreta.
Justificativa: a moda uma medida de tendncia central que indica o valor que ocorre com maior
frequncia no conjunto de dados. No histograma podemos visualizar que h duas modas: 11 e 13. Este
conjunto de dados chamado de bimodal.
V Afirmativa incorreta.
Justificativa: o polgono de frequncias deve ser construdo ligando-se os pontos de cruzamentos do
eixo x (os pontos mdios de cada classe) com o eixo y (a frequncia em cada uma das classes).
Questo 2. (Oficial de Fazenda-SEFAZ 2011) Com base no resultado final do concurso para o cargo
de Especialista em Polticas Pblicas e Gesto Governamental da SEPLAG, prova realizada pelo CEPERJ
em 01.08.2010, as frequncias para o nmero de acertos obtidos nas cinco questes de Estatstica pelos
1.535 candidatos que realizaram a prova esto mostradas no quadro a seguir:
Quadro 1

44

Nenhum acerto

393 candidatos

1 acerto

627 candidatos

2 acertos

417 candidatos

3 acertos

81 candidatos

4 acertos

12 candidatos

5 acertos

5 candidatos

TOTAL

1.535 candidatos

ESTATSTICA
O grfico a seguir mostra a frequncia relativa dos acertos.
Estatstica - Prova para EPPGG
45,0%

40,8%

40,0%
35,0%
30,0%

27,2%

25,6%

25,0%
20,0%
15,0%
10,0%

5,3%

5,0%
0,0%
1

3
4
Nmero de acertos

0,8%

0,3%

Figura 9

Com base na tabela e no grfico, julgue as afirmativas a seguir:


I. A moda e a mediana da distribuio so iguais.
II. A amplitude interquartlica igual a 2.
III. A mdia da distribuio igual a 2.
IV. A probabilidade de um candidato, escolhido ao acaso entre os 1.535, ter acertado no mximo
duas questes igual a 66,4%.
So corretas apenas as afirmativas:
A) I e II.
B) I e III.
C) I, III e IV.
D) II, III e IV.
E) II e IV.
Resoluo desta questo na plataforma.
45