Você está na página 1de 109

SE

eguro
& nsino

volume i

Estatstica
Bsica
para tomada
de deciso

Estatstica Bsica para


Tomada de Deciso
Volume 1

Coleo
Seguro & Ensino

Estatstica Bsica para


Tomada de Deciso
Volume 1
Autores
Helio Morrone Cosentino
lvaro Alves de Moura Jr.
Andr Castilho Ferreira da Costa

Rio de Janeiro
2013

1 edio: outubro - 2013


Fundao Escola Nacional de Seguros Funenseg
Rua Senador Dantas, 74 Trreo, 2o, 3o e 4o andares
Rio de Janeiro RJ Brasil CEP 20031-205
Tels.: (21) 3380-1000
Fax: (21) 3380-1546
Internet: www.funenseg.org.br
e-mail: faleconosco@funenseg.org.br
Impresso no Brasil/Printed in Brazil
Nenhuma parte deste livro poder ser reproduzida ou transmitida sejam quais forem os meios empregados:
eletrnicos, mecnicos, fotogrficos, gravao ou quaisquer outros, sem autorizao por escrito da Fundao
Escola Nacional de Seguros Funenseg.
Coordenao Editorial
Assessoria da Diretoria Executiva/Ncleo de Publicaes
Edio
Vera de Souza
Mariana Santiago
Produo Grfica
Hercules Rabello
Capa
Grifo Design
Diagramao
Info Action Editorao Eletrnica Ltda. Me
Reviso
Monica Teixeira Dantas Savini

Virginia Thom CRB-7/3242


Responsvel pela elaborao da ficha catalogrfica
C767e

Cosentino, Helio Morrone


Estatstica bsica para tomada de deciso / Hlio Morrone Cosentino; lvaro Alves de
Moura Jr.; Andr Castilho Ferreira da Costa. Rio de Janeiro: Funenseg, 2013.
108 p. ; 26 cm (Coleo Seguro & Ensino, v. 1)
ISBN n 978-85-7052-556-7.
1. Estatstica. I. Moura Jr, lvaro Alves. II. Costa, Andr Castilho Ferreira da. III. Ttulo.

0013-1239

CDU 519
iv

Sumrio
Apresentao, vii

CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO


COM A ESTATSTICA E NOSSO DIA A DIA, 1
Resumindo Informaes........................................................................................2
A Coleta de Dados..................................................................................................4
Formas de Coletar Dados......................................................................................4
Consideraes ticas sobre os Processos de Amostragem.................................8
Variveis..................................................................................................................8
Tipos de Variveis..................................................................................................9
Exerccios..............................................................................................................10


APRESENTAO DOS DADOS (TABELAS E GRFICOS), 11
Sries Estatsticas.................................................................................................11
Elaborao de uma Distribuio de Frequncias Agrupada em Classes........15
Comparando Sries de Dados............................................................................19
Tcnicas Grficas para Representar Dados.................................................... 24
Grfico de Colunas . ..........................................................................................24
Grfico de Barras Horizontais...........................................................................30
Histograma.........................................................................................................30
Caractersticas das Curvas de Frequncias Assimetria e Curtose..................34
Grfico de Setores ou Pizza...............................................................................36
Grfico de Linhas...............................................................................................40
Grfico de Pontos ou Disperso.........................................................................41
Pictrogramas......................................................................................................45
Resumindo a Utilizao dos Recursos Computacionais para
Elaborao de Grficos......................................................................................47
Caractersticas de Tabelas e Grficos de Qualidade.........................................48
Exerccios..............................................................................................................52

MEDIDAS RESUMO, 53
Mdias...................................................................................................................54
Mdia Aritmtica Simples e Ponderada (x) ......................................................54
Mdia Ponderada................................................................................................57
Usando o Excel para Calcular a Mdia.......................................................58
Mediana..............................................................................................................60
Clculo da Mediana para Variveis Contnuas..................................................62
Usando o Excel para Clculo da Mediana.................................................. 64
Moda..................................................................................................................66
Usando o Excel para Clculo da Moda........................................................68
Medidas Separatrizes (ou Medidas de Posio Relativa)...................................69
Usando o Excel para o Clculo dos Quartis, Decis e Centis.......................74
Exerccios..............................................................................................................78

MEDIDAS DE DISPERSO, 79
Clculo do Desvio-Mdio simples (ou Desvio Absoluto)
para uma Populao........................................................................................ 81
Clculo da Varincia e do Desvio-Padro para uma Populao.................. 82
Clculo do DMS para Populaes......................................................................84
Clculo do Desvio-Padro para Populaes......................................................84
Trabalhando com Desvios em Amostras........................................................ 86
Calculando a Mdia, o Desvio-Mdio e o Coeficiente de Variao..................87
Calculando a Varincia, o Desvio-Padro e o Coeficiente de Variao............88
Usando o Excel para o Clculo do Desvio-Mdio e do Desvio-Padro........89
Usando a Ferramenta de Anlise de Dados Estatstica Descritiva do Excel.......92
Exerccios..............................................................................................................95
Formulrio Resumo........................................................................................ 98

vi

Apresentao

com grande satisfao que apresento este livro desenvolvido pelos professores Helio
Morrone Cosentino, lvaro Alves de Moura Jnior e Andr Castilho Ferreira da Costa,
experientes acadmicos e especialistas em mtodos quantitativos.
Eles tm atuado com sucesso em vrias instituies de ensino superior de So Paulo, notadamente na ESNS-SP, onde lecionam para o curso de graduao em Administrao.
A redao do texto, simples e objetiva, bem como a exemplificao de aplicaes na rea
de seguros, atravs da planilha Excel, certamente facilitaro o aprendizado daqueles que
necessitam utilizar a Estatstica para o processo de tomada de deciso na indstria de seguros.
O livro certamente servir como um adequado material de apoio nas disciplinas especficas
ministradas no curso de graduao em Administrao com linha de formao em Seguros
e Previdncia, assim como nos de ps-graduao em Seguros e Resseguro ministrados
pela ESNS-SP.
Espero para breve a continuidade deste projeto, com o desenvolvimento de novos volumes
pelos autores.
Uma boa leitura para todos!
Domingos Alves Corra Neto

vii

viii

Caractersticas do Mtodo
Quantitativo e sua
Relao com a Estatstica
e Nosso Dia a Dia

Ao se deparar com a necessidade de aprofundamento do conhecimento o pesquisador obrigado a compreender conjuntos de dados relevantes ao seu objeto de pesquisa.
Para tanto, necessrio trabalhar dados relativos a situaes problemas, que posteriormente se refletiro em informaes seguras para comparaes e julgamentos.
O Mtodo Quantitativo parte da metodologia cientfica que tem por objetivo coletar,
simplificar, analisar e modelar dados. Talvez seu aspecto mais relevante seja realizar
previses e projees que podem auxiliar no processo de tomada de decises, a partir
de dados relativos ao fenmeno estudado. Sua principal caracterstica que costuma
trabalhar com uma elevada quantidade de informaes.
A fase inicial deste processo est associada chamada Estatstica Descritiva, objeto
de estudo deste livro. A ela compete coletar os dados, organiz-los e resumi-los, apresentando-os (descrevendo-os) sob uma forma de fcil compreenso com tabelas, grficos e
valores tpicos que representem o comportamento de todo o conjunto dos dados.
A quantidade de informaes que temos que lidar em nosso dia a dia exige obrigatoriamente uma ferramenta capaz de controlar as vendas de uma empresa, a quantidade
de leitos livres em um hospital, a programao de entregas de uma transportadora, as
notas de um aluno etc.

Explorando melhor a ideia de Estatstica Descritiva


A Estatstica Descritiva utilizada na ordenao, resumo e apresentao de
dados relativos a um determinado fenmeno, de forma a tornar suas informaes
amplamente acessveis.

ESTATSTICA BSICA PARA TOMADA DE DECISO

RESUMINDO INFORMAES
Observe que em um jornal ou revista, aps lermos os ttulos comumente conduzimos
nossa viso diretamente para os grficos contidos nos artigos, depois para as tabelas e,
finalmente (j tendo compreendido a mensagem principal transmitida pelos grficos e
tabelas) passamos aos detalhes do texto. Muitas vezes j consideramos suficiente ler os
grficos e tabelas e damos a compreenso do assunto por completa, sem ao menos ler o texto.
Em qualquer empresa, que diariamente conte com diversos relatrios de controle
(estoques, vendas, faturamento) seus dirigentes precisam manter um panorama atualizado
da situao do negcio. Para tanto, devem consultar incontveis listagens de dados para
conhecer o desempenho de cada setor. Tarefa pouco produtiva ou mesmo impossvel!
Uma forma de simplificar a ao dos executivos dessa empresa seria resumir as informaes coletadas com o uso de recursos estatsticos, gerando uma forma de consulta
fcil e rpida, tornando o processo de controle eficaz.
De forma mais completa, o fluxo de informaes envolvido nessa empresa poderia
seguir as seguintes etapas da Fig. 1:
Figura 1
Fluxo de Informaes Tpico de um Negcio

9
0

COLETANDO OS DADOS
(Obteno dos dados brutos)

5 6

1
10

8
3

8
7

6
4

ORGANIZANDO OS DADOS
(Relatrios, listagens etc.)

RESUMINDO E MELHORANDO A
QUALIDADE DA INFORMAO
(Elaborao de tabelas)

Data

Vendas ($)

17

10

33

15

50

30

100

FACILITANDO A COMPREENSO E
VISUALIZAO DAS INFORMAES
(Elaborao de grficos)

OBTENDO MEDIDAS QUE REPRESENTEM O CONJUNTO


DE DADOS PERMITINDO ANLISE DAS INFORMAES
E TOMADA DE DECISES

CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO COM A ESTATSTICA E NOSSO DIA A DIA

Os processos estatsticos passam por etapas semelhantes, independentemente da


situao estudada, seja na administrao de empresas, medicina, engenharia ou qualquer
outra atividade.
De forma mais sistemtica e detalhada podemos examinar na Fig. 2 os passos de um
processo estatstico bsico:
Figura 2
Processo Estatstico Padro para Tratamento de Dados

DIRETA
COLETA

D
E
S
C
R
I
T
I
V
A

ESTATSTICA
INFERENCIAL
E MULTIVARIADA

INDIRETA

CRTICA

Anlise de
possveis falhas do
processo (erros de
informao, vcios,
fraudes etc)

APURAO

Processamento
manual/eletrnico
dos dados

TABULAO

APRESENTAO

ANLISE

Contnua
Peridica
Ocasional

RESUMINDO
OS DADOS

Descrio dos
dados obtidos
e elaborao de
tabelas e grficos
para facilitar a
visualizao e
compreenso

Concluses
Interpretaes
Previses

Embora a estatstica descritiva tambm possibilite concluses iniciais e interpretaes sobre os fatos estudados, normalmente cabe estatstica inferencial e multivariada este estudo mais completo, ou seja, a estatstica descritiva tem por foco relatar e
organizar dados passados ou presentes que serviro de base para anlises, previses e
projees futuras sobre um fenmeno.
Em uma empresa, por exemplo, os dados relativos s vendas realizadas nos ltimos
trs anos servem como base para gerarmos modelos de previso das vendas do prxi-

ESTATSTICA BSICA PARA TOMADA DE DECISO

mo ano, ou seja, com base no desempenho das vendas de um determinado produto em


perodos anteriores podemos tentar estabelecer o comportamento das vendas em um
dado momento futuro.
Normalmente a estatstica faz uso de parcelas de uma populao (amostras) para
um estudo, em vez de examinar todos os elementos da populao. A forma correta e
adequada de faz-lo tambm objeto de estudo especfico da estatstica inferencial
(e no da descritiva), mas ser comentado em linhas gerais adiante.

A COLETA DE DADOS
A coleta de dados DIRETA realizada a partir dos elementos estudados e pode ser
classificada sob trs formas diferentes:
CONTNUA: controle dirio de frequncia de alunos, registros de nascimentos,
cotao do valor dirio de uma ao.
PERIDICA: mdias semestrais dos alunos, censo demogrfico (a cada 10 anos).
NECESSIDADES MOMENTNEAS: pesquisas de opinio para lanamento de
um novo produto, cadastramento de vtimas ou sobreviventes de uma epidemia.
J a coleta de dados INDIRETA elaborada a partir de dados previamente reunidos
pela coleta direta (algum j fez a coleta direta antes). Por exemplo, a quantidade de
nascimentos mensais em um estado pode ser obtida (indiretamente) a partir do nmero
de nascimentos dirios registrados em cada uma das diversas cidades daquele estado.
O pesquisador precisa apenas juntar os dados previamente obtidos.

FORMAS DE COLETAR DADOS


Retirada de
elementos
caractersticos

Populao

Amostra

A coleta de dados deve ser realizada de forma bastante criteriosa, uma vez que servir
como base para todo o estudo estatstico sobre o fenmeno.
Ela pode ser realizada atravs de um CENSO, que envolve todos os elementos de
uma populao, ou por AMOSTRAGEM quando usa apenas um subconjunto significativo dessa populao.

CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO COM A ESTATSTICA E NOSSO DIA A DIA

A utilizao do censo bastante restritiva, uma vez que costuma envolver custos
elevados e dificuldade da obteno de dados.
J a utilizao de AMOSTRAS, obtidas atravs de tcnicas amostrais busca a reduo de custos e uma maior facilidade na obteno e processamento de dados. A ideia
estudar apenas parte da populao e transferir as informaes obtidas a partir desta
amostra para toda a populao.
Desta forma evita-se analisar um a um os elementos da populao, minorando custos
e trabalho, porm aumentando-se o risco de erro.
Matematicamente, a POPULAO (alguns chamam de UNIVERSO) definida
como o conjunto constitudo por todos os elementos que poderiam ser investigados no
estudo, j a AMOSTRA um subconjunto desta populao. muito importante que a
amostra seja realmente representativa da populao, ou seja, ela deve guardar as mesmas
caractersticas da populao de onde se originou.
Costumeiramente a discusso sobre tcnicas amostrais realizada em um captulo
parte, dada sua vital importncia em estudos estatsticos. Desta forma, abordaremos
aqui apenas suas principais ideias, sem esgot-las, mas em profundidade suficiente para
o entendimento dos conceitos ora abordados. A Fig. 3 demonstra as possveis espcies
de amostras.
Figura 3
Tipos de Amostragem Possveis

Populao

Amostra
P R O B A B I L S T I C A

Aleatria Estratos Grupo Sistemtica


simples
(cluster)

Com a amostragem probabilstica possvel a
generalizao das concluses obtidas, pois este
procedimento permite, a partir de uma amostra uma
generalizao para o comportamento da populao.
Para que haja esta generalizao, fundamental
que a amostra guarde as mesmas propores das
caractersticas medidas na populao.

NO-PROBABILSTICA

Convenincia
(ou julgamento
ou acessibilidade)

Quota

Fatia

Em contraponto, as tcnicas de
amostragem no probabilsticas NO
permitem generalizaes nem projees
que fujam estritamente aos elementos
pesquisados.

ESTATSTICA BSICA PARA TOMADA DE DECISO

Na amostra PROBABILSTICA ocorre a escolha de elementos com base em probabilidades determinadas (na verdade h uma chance igual de qualquer elemento ser
selecionado), j na amostra NO PROBABILSTICA no so aferidas a probabilidade
de suas ocorrncias.
Por esses motivos, o uso de amostras no probabilsticas deve ser restrito a estudos
iniciais de um fenmeno, ou quando se deseja conhec-lo de forma inicial, devendo ser
seguido depois de uma explorao mais rigorosa, caso sejam desejados resultados consistentes que permitam generalizaes, estabelecimentos de leis ou obteno de padres
de comportamento.
A utilizao de procedimentos estatsticos que envolvam amostras no probabilsticas dificilmente pode ser empregada na modificao de processos de quaisquer espcies (administrativos, industriais ou mesmo tericos), uma vez que pode ser afetado
pelo vis da escolha da amostra. Amostras com vieses so ditas tendenciosas, impedem
generalizaes e podem implicar em erros.

Relatrio Hyte, um caso tpico de vis ou no?


Apesar dos estudos de Hyte terem revolucionado a cultura norte-americana e
terem sido bem conduzidos do ponto de vista estatstico na ocasio, hoje discutese sua validade. Somente as pessoas que eram livres para discutir sexo teriam
respondido s perguntas voluntariamente, ou seja: o resultado (incorreto???)
mostrou o quadro de uma populao americana extremamente liberal frente a
hbitos sexuais, o que de fato no ocorreria, pois uma parcela da populao (os
conservadores) no teria participado.

Neste captulo discutiremos apenas as amostras probabilsticas, ficando o mrito do


uso das amostras no probabilsticas para discusso em momento posterior.

Explorando um pouco mais as amostras probabilsticas


Qual o tipo de amostra probabilstica mais eficiente?
O tipo de amostragem utilizado deve ser escolhido conforme as necessidades do
estudo a ser feito, mas de forma geral a amostragem aleatria simples costuma ser
a mais eficiente, seguida pela amostragem sistemtica, estratificada e, por ltimo,
a por grupos. J em termos de custo-benefcio, a ordem talvez se inverta.

CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO COM A ESTATSTICA E NOSSO DIA A DIA

Se houver dvida sobre a escolha do tipo de amostra, para maior segurana recomenda-se a amostragem aleatria simples. A Fig. 4 procura estabelecer com mais detalhes:
Figura 4
Tipos de Amostragens Probabilsticas, Caractersticas e Usos
TIPO

CARACTERSTICAS

ALEATRIA SIMPLES

Uso bastante simples em


amostras pequenas e mdias,
sendo trabalhosa em amostras
grandes. Os elementos a serem
estudados so escolhidos
aleatoriamente (um sorteio, por
exemplo)

ESTRATIFICADA

Uso quando existirem estratos,


sendo necessrio definir a
proporcionalidade adequada
para os constituintes da amostra

SISTEMTICA

GRUPO (cluster)

ALGUNS USOS
Controle de qualidade

Quando a populao tiver


parte de seus componentes
com caractersticas especficas
que podem ser decisivas nos
resultados finais do estudo

Uso peridico, para


acompanhamento de processos,
sistemas e linhas de produo

Tpicos de indstrias onde


necessrio um controle de
qualidade dos lotes. Pode
tambm ser utilizada em servios

Usada quando a populao


estiver espalhada por uma
grande rea. Os elementos de
uma populao so divididos em
vrios grupos representativos.
Um ou mais grupos so
escolhidos e seus elementos so
investigados em detalhes

Cidades, bairros, clientes de


filiais ou departamentos de uma
empresa so grupos formados
naturalmente

Alguns exemplos costumam ilustrar situaes tpicas.


Na amostragem ALEATRIA SIMPLES em uma empresa sorteiam-se alguns
funcionrios para responderem a uma pesquisa de opinio sobre a qualidade dos servios do restaurante da empresa. Esse sorteio pode ser feito com um globo giratrio
contendo bolinhas numeradas, tabelas randmicas do Excel ou mesmo tabelas prontas
pr-sorteadas.
Na amostragem ESTRATIFICADA, em uma populao com 40 pessoas, contendo
30 homens e 10 mulheres, escolhem-se trs homens e uma mulher para responderem a uma pesquisa de opinio sobre caractersticas de um novo modelo de veculo.
Respeita-se a proporo de 3:1 (estratos de homens/mulheres).
Na SISTEMTICA, em uma linha de produo de lmpadas, a cada lote contendo
1.000 unidades produzidas uma lmpada, sistematicamente, retirada ao acaso para
testes e avaliao pelo controle de qualidade.
J na amostragem por GRUPOS (clusters), em uma cidade deseja-se estudar
as caractersticas de sade pblica e poluio do ar dos bairros vizinhos a uma
fbrica poluidora.

ESTATSTICA BSICA PARA TOMADA DE DECISO

CONSIDERAES TICAS SOBRE OS


PROCESSOS DE AMOSTRAGEM
Discuta com o seu professor as implicaes sobre as manipulaes que podem envolver um processo de amostragem.
Aps o entendimento de como podemos retirar uma amostra de uma populao, devemos pensar no que gostaramos de saber sobre esta populao. Quais as perguntas que
faramos. Talvez essa seja a ideia bsica sobre o conceito estatstico de VARIVEL.

VARIVEIS
Embora na metodologia cientfica o conceito de varivel seja mais amplo, sob o
ponto de vista da estatstica a denominao de varivel dada s possveis formas de
representao de um fenmeno em estudo, como representa a Fig. 5.
Em uma pesquisa de opinio, por exemplo, as diversas questes contidas no questionrio buscam avaliar todas as variveis envolvidas no problema. O termo varivel
bem apropriado, visto que se espera que as respostas possam variar para cada um
dos entrevistados.
Figura 5
Ideia de Varivel

Fenmeno

Resultados Possveis

Variveis

Questes relativas
ao estudo
No de filhos?
Qual sua estatura?
Compraria esta revista?

Respostas

0; 1; 2; 3; ........
1,65 m; 1,87 m; ........
Sim; No; Talvez; ...

Observe que as respostas necessrias a qualquer estudo estatstico podem ser


diversas, ou seja, comumente so abordadas inmeras variveis que envolvem dados
mensurveis (medidos), tais como estatura, renda, quantidade de vendas e produtos
armazenados, ou dados que podem ser apenas enumerados (categorizados), como raa,
preferncia por uma cor, religio, preferncia musical.

CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO COM A ESTATSTICA E NOSSO DIA A DIA

Esquematicamente, os tipos de variveis envolvidos na estatstica descritiva


podem ser divididos em duas grandes classes, conforme segue na Fig. 6:

TIPOS DE VARIVEIS
Figura 6
Tipos de Variveis

Qualitativa

Expressa por
ATRIBUTOS:
cor (branca/negra/amarela....),
sexo (masc./fem.), ...

Varivel

Quantitativa

Varivel Discreta
Assume um valor nico em
um conjunto enumervel
(ex.: no de pacientes em
um hospital, pode ser 1;
2; 3; 4 ... e nunca 2,3;
3,745 ..).

Expressa por
VALOR NUMRICO:
idade, salrio, quantidade
de produtos vendidos

Varivel Contnua Pode


assumir diversos valores em
um dado intervalo (ex: massa
de uma pessoa 60 kg ou
60,5 kg ou 60,523 kg
dependendo da preciso da
balana ou do mtodo).

Dependendo do tipo de varivel utilizado em um estudo ser necessrio adotar um


tratamento estatstico especfico. As variveis qualitativas no permitem clculos ou
representaes matemticas diretas (mdia, por exemplo), porm aceitam abordagens
estatsticas apropriadas (determinao da moda, por exemplo). No possvel fazer
conta com a preferncia das pessoas. Se trs pessoas preferem a cor verde, duas a vermelha e quatro a roxa qual seria a cor resultante preferida pela populao? As variveis qualitativas subdividem-se em duas categorias: nominais (apenas uma qualidade,
como cor dos olhos) e ordinais (existe hierarquia, como grau de instruo). Note que,
mesmo que seja associado um cdigo a essa varivel qualitativa, como a escala Likert
(1 = discordo totalmente, 2 = discordo parcialmente, 3 = neutro, 4 = concordo parcialmente e 5 = concordo totalmente), ela NO se torna uma varivel quantitativa.
As variveis quantitativas dividem-se em duas subclasses (discretas e contnuas) e
sempre aceitam ser representadas atravs de valores numricos (mdia, mediana, moda,
ndices, coeficientes e taxas).
O conceito de varivel discreta e contnua relativamente simples, porm pode causar
alguma confuso em tratamentos estatsticos mais elaborados.

ESTATSTICA BSICA PARA TOMADA DE DECISO

Embora as variveis discretas assumam somente valores inteiros, podem ser


representadas durante os clculos sob outras formas. No exemplo sobre pacientes atendidos em um hospital, sempre encontraremos como resultado valores inteiros (22; 23; 24;
25;...), porm a mdia de pacientes atendidos em um dia pode ser um nmero no inteiro
(25,68 pacientes/dia). A varivel permanece sendo do tipo discreta, apenas sua representao estatstica modificou-se, apresentando-se como um nmero decimal.

Exerccios

10

1) Classifique as variveis a seguir e sugira um tipo de escala


para medi-las:
Tabela 1
Estudo de Enfermidades por Sexo, Gnero,
Cor, Gravidade e Epsdios na Empresa T&T
N

Sexo

Idade

Cor

Gravidade

Episdios

39

branca

Leve

amarela

Leve

24

preta

Moderada

13

branca

Grave

20

parda

Leve

preta

Moderada

12

amarela

Moderada

43

branca

Leve

preta

Grave

10

30

branca

Grave

11

12

branca

Moderada

12

11

parda

Leve

Fonte: Departamento Mdico T&T 2004.

Apresentao dos Dados


(Tabelas e Grficos)

Os dados coletados durante um processo estatstico devem ser inicialmente tabulados,


para somente depois serem apresentados e comunicados de forma conveniente.
Na fase de tabulao devem sofrer uma anlise crtica, quando o pesquisador
verificar se as informaes possuem qualidade suficiente para utilizao segura.
Nesse momento so verificadas fraudes, tendenciosidades e erros que possam ter ocorrido
durante o processo de coleta de dados.
Em uma pesquisa de opinio, por exemplo, comum que o supervisor de uma equipe
de entrevistadores telefone para alguns dos respondentes para verificar se, de fato, ele foi
entrevistado. Assim, evita-se que algum entrevistador desonesto preencha por si prprio
vrios questionrios, esgotando sua cota de trabalho rapidamente.
Aps a eliminao de quaisquer itens suspeitos ou incorretos, o que acarretar na
diminuio de tamanho da amostra poder ocorrer a apurao manual ou eletrnica dos
dados (normalmente softwares como Excel, SPSS, Statistica, Minitab etc) e s ento a
apresentao e comunicao dos resultados.
Uma pesquisa necessita de um planejamento bastante cuidadoso, abordando as variveis estritamente necessrias. Caso contrrio, corre-se o risco de obteno de dados
suprfluos que s dificultam a observao do problema focado. Deve-se evitar a tentao
de aplicar inmeros instrumentos de pesquisa ao mesmo tempo (testes, questionrios,
escalas), que somente geraro dados inteis, sendo comum o pesquisador acreditar que
o uso de softwares estatsticos vai trat-los com facilidade. De fato, recursos computacionais podem tratar elevada poro de informaes, porm a interpretao e relao
entre os resultados e as variveis s podem ser aferidas pelo pesquisador.

SRIES ESTATSTICAS
Uma forma bastante til na apresentao dos dados atravs das sries estatsticas,
as quais os dados so dispostos em diferentes tipos de tabelas, que podem ser classificadas em quatro tipos:

11

12

ESTATSTICA BSICA PARA TOMADA DE DECISO

i) Srie Temporal: um tipo de srie na qual o elemento varivel representa um determinado perodo (dia, ms, trimestre, ano etc).
Exemplo Srie Temporal
Exportaes Brasileiras (FOB)
em US$ milhes
Ano

Exportaes FOB

2000

55.085,60

2001

58.222,64

2002

60.361,79

2003

73.084,14

2004

96.475,24

2005

118.308,39

2006

137.807,47

2007

160.649,07

2008

197.942,44

2009

152.994,74

2010

201.915,29

2011

256.039,58

Fonte: BCB

ii) Srie Geogrfica: expressa um tipo de srie em que o elemento varivel expresso
por uma determinada localidade (bairro, cidade, estado, regio, pas etc).
Exemplo Srie Geogrfica
DPVAT Indenizaes Pagas por Regio 2010
REGIO

Qtde Total

Indenizaes Pagas

NORTE

21.254

R$ 196.615.694,48

NORDESTE

61.316

R$ 485.943.320,08

CENTRO OESTE

21.350

R$ 221.743.217,62

SUDESTE

70.501

R$ 535.016.405,38

SUL

77.930

R$ 589.468.442,53

TOTAL

252.351

R$ 2.028.787.080,09

Fonte: Seguradora Lder

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

iii) Srie Especfica: expressa um tipo de srie em que o chamado elemento varivel
um determinado fenmeno (mortes por acidente de carros, exportaes por setor de
atividade etc).
Exemplo Srie Especfica
Ocorrncias Policiais Registradas, por Natureza 2 Trimestre de 2011
Discriminao

Capital

Estado

Contra a pessoa

34.071

164.887

Contra o patrimnio

112.846

286.517

Contra os costumes

834

3.519

Entorpecentes

1.520

11.721

Contravencionais

3.835

19.545

Outros criminais (no inclui contravenes)

6.490

32.746

Total de Crimes Violentos (Hom. Doloso, Roubo, Latrocnio, Estupro e EMS)

38.198

81.588

Total de delitos

159.596

518.935

No Criminais

92.784

262.082

Fonte: Secretaria de Segurana Pblica do Estado de So Paulo

iv) Distribuio de Frequncias demonstram com que frequncia (quantas vezes) o


dado observado se repete. A Distribuio de Frequncias pode ser estruturada de
duas formas: simples (no agrupadas em classes) ou agrupada em classes, conforme
mostram os exemplos abaixo.
Exemplo Distribuio de Frequncias Simples (no agrupada em classes/
intervalos)
Nota de Estatstica da Turma A
Notas (xi)

N. de Alunos (fi)

1,0

2,0

3,0

4,0

5,0

12

6,0

7,0

8,0

9,0

10,0

Total

50

Fonte: Dirio de Classe

13

14

ESTATSTICA BSICA PARA TOMADA DE DECISO

Exemplo Distribuio de Frequncias agrupada em classes/intervalos


bitos p/Ocorrncia por Faixa Etria no Municpio de
So Paulo CID10: V01-V99 Acidentes de transporte
Perodo: 2010
Faixa Etria (Xi)

Frequncia (fi)

Menor 1 ano

1 a 4 anos

5 a 9 anos

11

10 a 14 anos

23

15 a 19 anos

101

20 a 29 anos

340

30 a 39 anos

218

40 a 49 anos

148

50 a 59 anos

137

60 a 69 anos

91

70 a 79 anos

96

80 anos e mais

66

Idade ignorada

28

Total
Fonte: DATASUS

1.263

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

ELABORAO DE UMA DISTRIBUIO DE


FREQUNCIAS AGRUPADA EM CLASSES
Os softwares realizam, como ser demonstrado ao longo deste captulo, esta tarefa
com facilidade. Porm, com o objetivo de compreender como se elabora uma distribuio de frequncias faremos, inicialmente, de forma manual, o que costuma exigir uma
primeira ordenao lgica (Rol) dos dados para facilitar a contagem. A figura a seguir
ilustra o processo.

A elaborao do Rol opcional e muitas vezes no tem grande utilidade prtica,


permitindo-se montar diretamente dois diferentes tipos de tabelas de distribuio
de frequncias:

Dados
brutos

Rol
(opcional)

Tabela de
Frequncia

Frequncia Simples: usos mais


adequados com variveis discretas;
pequenas ou mdias quantidades de
dados; valores que se repetem diversas
vezes no rol.

Frequncia por classes: usos mais


adequados com variveis contnuas
e/ou com quantidades de dados mdias
ou elevadas; com valores que no se
repetem diversas vezes no rol.

15

16

ESTATSTICA BSICA PARA TOMADA DE DECISO

Observe a seguinte sequncia de dados e sua apresentao em uma tabela. Por serem dados com caractersticas discretas, em pequena quantidade e se repetirem no rol,
poderemos usar uma tabela de distribuio de frequncia simples:
Rol: 25, 25, 30, 45, 45, 50, 62, 77
xi

fi

Fi

fi %

Fi %

25

2/8 = 25%

25%

30

2+1 = 3

1/8 = 12,5 %

37,5 %

45

2+1+2 = 5

25%

62,5%

50

2+1+2+1 = 6

12,5 %

75%

62

2+1+2+1+1 = 7

12,5 %

87,5%

77

2+1+2+1+1 +1
=8

12,5 %

100%

Coluna das
variveis (xi)
indica quais as
variveis presentes
no rol

100%

Coluna das
frequncias
simples ( fi )
indica quantas
vezes cada
varivel aparece
no rol
fi = n = no de
elementos do rol

Coluna das
frequncias
(relativas)
porcentuais
( fi %) indica a
participao %
de cada uma das
variveis no todo

A tabela poder conter apenas as colunas que o pesquisador julgar necessrias.


As colunas Fi e Fi % apresentam os resultados das frequncias acumuladas simples
e porcentuais, respectivamente, a cada linha.
Os resultados numricos iguais, hachurados em cinza nas duas ltimas linhas da
tabela, permitem verificar se os clculos como um todo esto corretos.
Como dissemos anteriormente, o Rol: 25, 25, 30, 45, 45, 50, 62, 77 constitudo
por pequena quantidade de variveis discretas que se repetem no rol, motivo pelo qual
utilizamos a forma mais adequada de representao que a tabela de distribuio de
frequncias simples.
A ttulo de comparao, montaremos com os mesmos dados uma tabela de distribuio de frequncias por classe. Lembramos, no entanto, que este tipo de tabela
mais recomendado para quantidades mais elevadas de dados, mas para efeito didtico
vamos montar uma distribuio agrupada em classes.
Neste caso escolhemos trs classes, sendo que os critrios mais comumente adotados
para definir o no de classes podem ser:
a experincia do pesquisador;
o interesse especfico que possumos no estudo;

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

critrios matemticos podem ser escolhidos, sendo o mais comum o CRITRIO DA


RAIZ em que o no de classes determinado pela raiz quadrada do nmero de dados
observados, ou seja, K = n ; em que K o nmero de intervalos e n o nmero de
dados observados; e
pode-se usar ainda a regra de Sturges, em que K = 1 + 3,3 log n.
No exemplo, usando o critrio da raiz, verificamos que nosso rol possui n = 8 elementos, ento K = 8 = 2,8. Comumente aproximamos o resultado para o maior inteiro
prximo ao valor, no caso K = 3. A ttulo de comparao, podemos imaginar K como
sendo a quantidade de gavetas que ser necessria em um armrio para conter todas as
variveis do rol.
No passo seguinte devemos calcular o tamanho destas gavetas, de forma que sejam
suficientemente grandes para receber todos os valores.
Assim, calculamos a Amplitude de classe (A):

A = (maior valor do rol menor valor do rol) / K

No nosso caso, A = (77 25) / 3 = 17,3 que pode ser utilizado desta forma, ou arredondado para 18 ou mesmo 20. Desta forma, a classe no 1 inicia-se em 25 (menor valor
do rol) e adicionado da amplitude A = 20 e assim por diante, ou seja:

25 + 20 = 45 ou 25 | 45 e depois
45 + 20 = 65 ou 45 | 65 e finalmente
65 + 20 = 85 ou 65 | 85
A aproximao (arredondamento) da amplitude de classe para valores inteiros normalmente facilita a compreenso dos resultados, mas deve ser utilizado com parcimnia,
para no distorcer muito os resultados. O resultado final seria:
Classe

xi

fi

Fi

fi %

Fi %

25 a 45

37,50%

37,50%

45 a 65

50,00%

87,50%

65 a 85

12,50%

100,00%

100,00%

Total

Perceba no exemplo acima que os valores esto sendo repetidos, ou seja, no primeiro
intervalo o limite superior da primeira classe, o valor 45, igual ao limite inferior da

17

18

ESTATSTICA BSICA PARA TOMADA DE DECISO

segunda classe. No entanto, para efeito de clculo e classificao das frequncias de


classes devemos adotar alguns critrios para a definio desses limites de classes.
Uma maneira de se fazer isso utilizando os seguintes critrios:
1)
2)
3)
4)

| (inclui o limite inferior da classe, e exclui o limite superior da classe);


| (exclui o limite inferior da classe, e inclui o limite inferior da classe);
|| (incluem os limites inferior e superior da classe); e
(excluem os limites inferior e superior da classe).

Vale ressaltar que a escolha desses intervalos depende da disposio dos dados ao
longo da distribuio de frequncias, o que significa que cada caso dever ser avaliado
individualmente, sempre seguindo a mxima de tornar a interpretao o mais fcil
possvel para o leitor.
Dois pesquisadores diferentes podem escolher valores de K e de A diversos, pois a
regra no d uma soluo exata para a disposio da distribuio de frequncias, o que
implicar em duas, ou mais, tabelas diferentes, que representaro o mesmo fenmeno.
Se no exemplo acima tivssemos escolhido A = 18, teramos:
Classe

xi

fi

25 | 43

43 | 61

61 | 79

Total

Observe as diferenas de valores na coluna das frequncias. Note tambm


que a 1a tabela facilita mais a compreenso. Em uma revista ou relatrio, por exemplo, a
1a tabela provavelmente seria mais adequada leitura e entendimento do que a outra,
porm ambas esto corretas e representam adequadamente o fenmeno. Uma dica para
elaborar uma distribuio de frequncia sempre buscar facilitar ao mximo o leitor,
mas cuidado, no elabore distribuio com classes muito grande, sendo que parte delas
tenha uma frequncia muito pequena, tal procedimento pode distorcer as estatsticas
(mdia, moda, mediana etc) calculadas a partir dessa srie.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Comparando Sries de Dados


Suponha a necessidade de comparar diversas sries de valores, como nos ris abaixo.
Isto poderia acontecer, por exemplo, em um estabelecimento comercial que realiza suas
vendas sob trs formas de pagamento diferentes (dinheiro, cheque e carto de crdito).
Se desejarmos observar a relao entre as trs modalidades de pagamentos deveremos obter tabelas com o mesmo no de classes (K) e a mesma amplitude (A) em cada
uma das classes.
O critrio da raiz pode ser aplicado nos ris apenas para dar uma ideia da quantidade
de classes que poderemos usar, mas nada impede ao pesquisador criar quantas classes
(K) achar necessrias para estudo do problema, lembrando a utilizao de intervalos de
classe (A) de mesmo tamanho para facilitar o entendimento.
Dinheiro
2,00
2,38
4,59
12,20
12,30
15,00
15,00
16,35
19,27
22,10
23,20
37,50
48,00
53,75
n = 14

Cheque
12,00
19,00
45,00
88,33
95,40
125,12

Carto
26,00
29,50
32,00
44,00
48,00
56,30
59,50
60,00
60,00
132,25

n=6

Para criarmos um critrio de classes que atenda


s trs sries de dados, poderamos imagin-las
constituindo uma srie nica.
Para um total de (14 + 6 + 10) = 30 valores
K=n

ou

K = 30 = 5,48 = 6 classes

A = (maior valor menor valor) / K


A = (132,25 2,00) / 6 = 21,71 = 22,00 ou 25,00
Optamos por uma tabela de distribuio de
frequncia por classes, uma vez que temos
uma quantidade mdia de dados, trabalhamos
com uma varivel contnua e existem poucos
valores que se repetem nos ris.

n = 10

Para melhorar ainda mais o aspecto final da tabela, alm de forarmos a aproximao
da amplitude da classe (A) para $ 25,00 poderamos iniciar tambm a classe no 1 em zero,
uma vez que o menor valor dos ris ($2,00) prximo a este valor. Teramos ento:
Xi (R$)

Dinheiro fi

Cheque fi

Carto fi

0 | 25

11

25 | 50

50 | 75

75 | 100

100 | 125

125 | 150

14

10

Classe

Total

O jogo de aproximaes usado no clculo de A, K e do incio do primeiro intervalo


de classe aprimorado com a prtica do pesquisador.

19

20

ESTATSTICA BSICA PARA TOMADA DE DECISO

Os softwares estatsticos montam tabelas semelhantes a estas, porm no tm a


sensibilidade de fazer sozinhos estes ajustes e corremos o risco de obter algo assim:
Intervalo (xi)
($)

Classe
1

2,00 | 23,71

23,71 | 45,42

45,42 | 67,13

67,13 | 88,84

88,84 | 110,55

110,55 | 132,26

Para K = 6, A = 21,71 e iniciando a


primeira classe em $2,00 repare nos
valores de difcil observao, embora
no haja qualquer erro do ponto de
vista estatstico.

No entanto, possvel criar alguns critrios para os softwares que nos permita
elaborar tabelas de distribuio de frequncias condizentes com as operaes que
realizamos acima.
Vamos nos basear em um novo exemplo para elaborar uma Distribuio de Frequncias pelo Excel. A tabela abaixo apresenta os valores (em R$ mil) dos totais dos
contratos de seguros de automveis fechados pela Corretora Mega Seguro durante o
perodo de 60 dias.
Dia

Valor
em R$

Dia

Valor
em R$

Dia

Valor
em R$

Dia

Valor
em R$

Dia

Valor
em R$

Dia

Valor
em R$

15

11

16

21

22

31

24

41

31

51

28

16

12

17

22

23

32

27

42

28

52

35

17

13

18

23

15

33

29

43

25

53

35

18

14

18

24

16

34

29

44

35

54

31

19

15

19

25

17

35

34

45

25

55

32

20

16

20

26

18

36

26

46

36

56

35

20

17

20

27

19

37

34

47

30

57

35

22

18

20

28

20

38

31

48

37

58

32

23

19

21

29

21

39

25

49

33

59

34

10

16

20

21

30

22

40

34

50

28

60

24

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

O primeiro passo consiste em elaborar as classes, o que pode ser feito seguindo as
regras j citadas, ou at mesmo a experincia do pesquisado em dispor os valores analisados. Para o exemplo acima, a distribuio ter cinco classes, sendo que a amplitude
de cada classe ser de R$ 5 mil, como est descrito abaixo:
Classes

xi
(R$ mil)

15 | 20

20 | 25

25 | 30

30 | 35

35 | 40
Total

Uma vez definidas, manualmente, as classes, j possvel informar quais os parmetros para o Excel, para que o software possa fazer os clculos que nos permitiro
elaborar uma distribuio de frequncias.
Cabe lembrar que tais recursos servem para facilitar o nosso trabalho, sobretudo
quando estamos trabalhando com um grande nmero de dados observados (500, 1.000,
10.000), o que tornaria a elaborao manual de uma tabela de distribuio bastante
trabalhosa e passvel de vrios erros. Com o Excel, uma vez definidas as classes e a
amplitude de cada classe, essa busca ser rpida e precisa.
Definidos esses parmetros, precisamos inform-los levando em considerao apenas um valor numa nova coluna, uma vez que o Excel no l os intervalos como esto
descritos acima. O novo valor indicado representa sempre o intervalo superior da classe,
sendo que o valor informado tambm ser considerado para aquela classe. Dessa forma,
como a nossa distribuio acima exclui o valor superior, devemos informar que o limite
superior da primeira classe ser 19,99, e assim consecutivamente para as demais classes,
conforme est descrito na tabela abaixo:
Classes

xi (terico)

xi (Excel)

15 | 20

19,99

20 | 25

24,99

25 | 30

29,99

30 | 35

34,99

35 | 40

39,99

Total

21

22

ESTATSTICA BSICA PARA TOMADA DE DECISO

Para que o Excel faa o clculo das frequncias devemos numa nova coluna,
da frequncia simples, inserir a funo estatstica Frequncia, conforme est ilustrado
abaixo:

Ao clicarmos na funo, abrir uma caixa, para a qual deveremos informar a Categoria (Estatstica) e a funo (Frequncia), conforme segue:

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Em seguida, abrir uma nova caixa solicitando a matriz dos dados (dados brutos) e
a Matriz-bin (as classes):

Clique Ok. Mas ainda no terminou. Agora selecione a coluna da frequncia, clique
F2 (vai aparecer a frmula da frequncia na clula), e em seguida clique Ctrl Shift e Enter
ao mesmo tempo. Ateno, no clique apenas Enter, preciso utilizar o comando Ctrl
Shift e Enter para replicar a frmula para as demais clulas da frequncia. Realizada essa
etapa, o Excel distribuir os dados nas classes previamente definidas, como segue:

23

24

ESTATSTICA BSICA PARA TOMADA DE DECISO

As demais frequncias podero ser inseridas como frmulas e replicadas para todas
as classes, conforme segue:
Classes

xi (Terico)

xi (Excel)

fi

Fi

fi %

Fi %

15 | 20

19,99

16

16

26,67%

26,67%

20 | 25

24,99

16

32

26,67%

53,33%

25 | 30

29,99

10

42

16,67%

70,00%

30 | 35

34,99

11

53

18,33%

88,33%

35 | 40

39,99

60

11,67%

100,00%

60

100,00%

Total

Lembre-se, qualquer dvida tecle F1 e abrir uma janela de Ajuda do Excel!

TCNICAS GRFICAS PARA REPRESENTAR DADOS


Grficos tm capital funo na representao dos dados e variveis em um estudo
estatstico. Alguns modelos comuns costumam atender ampla maioria das necessidades
usuais de qualquer estudo.
Alis, uma indicao fundamental, que ressaltaremos permanentemente neste captulo, optar pela utilizao de modelos bsicos e tradicionais, objetivando a simplicidade
da comunicao da informao. A seguir, vamos apresentar alguns dos tipos de grficos
utilizados com maior frequncia.

Grfico de Colunas
o tipo de grfico utilizado para a apresentao de sries cronolgicas, categricas
(atributos) e de localizao (departamentos, regies).
Algumas dicas para a utilizao desses dos grficos de coluna:
Sugere-se no utilizar esse tipo de grfico para um nmero muito grande de observaes e/ou variveis.
Tal qual o histograma, sugere-se a utilizao de dois eixos (principal e secundrio),
quando as unidades das variveis analisadas so diferentes. Exemplo: nmeros
absolutos e porcentagem.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Evoluo das Indenizaes do DPVAT Pagas por Natureza Quantidade

Fonte: Lder Seguradora DPVAT

Agora vamos elaborar um grfico de colunas no Excel. Para tanto, vamos utilizar o
exemplo acima.
Selecione as clulas que contm os dados do exemplo. Clique em Inserir, em seguida em Grfico. Aparecero vrias opes de grficos, clicar no Grfico de Colunas,
em seguida mais uma srie de opes, agora s de grficos de coluna ser ofertada.
Escolha aquele que desejar e for adequado ao trabalho que est realizando.

25

26

ESTATSTICA BSICA PARA TOMADA DE DECISO

Basta escolher o tipo de grfico de coluna desejado e clicar enter que o grfico j estar
pronto. Caso queira, poder fazer uma srie de ajustes para melhorar o grfico elaborado.

No caso de duas unidades diferentes, o ideal que cada unidade esteja associada a
um eixo vertical, ou seja, deve trabalhar com um eixo vertical principal e um eixo vertical
secundrio, conforme o exemplo abaixo.
Evoluo das Indenizaes Pagas por Natureza
no 1o Trimestre de 2012 Quantidade e %

Fonte: Lder Seguradora DPVAT

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Para elaborar um grfico de coluna e linha no Excel so necessrios alguns macetes. Tais como, criar uma coluna vertical secundria e mudar o tipo de grfico para
uma das variveis analisadas.
Perceba no exemplo acima que o eixo vertical esquerdo est em quantidade de indenizaes pagas, enquanto que o eixo vertical direito em porcentagem. Para elaborar
esse grfico no Excel sero necessrios os seguintes procedimentos:
1o) clique com o boto direito do mouse sobre a coluna da porcentagem, aberta a Janela,
clique em Formatar Srie de Dados.

A janela Formatar Srie de Dados se abrir, sendo que a primeira opo para formatao a Opes de Srie, escolher Plotar srie no Eixo Secundrio.

27

28

ESTATSTICA BSICA PARA TOMADA DE DECISO

Perceba que a coluna da quantidade de indenizaes sumiu. Para resolver isso, vamos mudar o tipo de grfico da coluna %. Para tanto, clique com o boto direito do
mouse sobre a coluna, e escolha Alterar tipo de grfico na janela que se abrir.

Escolha um grfico de linha. Automaticamente as colunas e as linhas aparecero


novamente, sendo que poderemos ainda fazer mais alguns ajustes para deixar o
grfico ainda mais informativo.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Uma dica importante, desde que a srie estatstica no seja muito longa adicionar os rtulos (valores das variveis) no grfico. Para tanto, basta clicar com o
boto direito do mouse sobre a coluna e sobre a linha, quando houver, e solicitar
Adicionar rtulo de dados, e o grfico ficar com a seguinte aparncia:

Evoluo das Indenizaes Pagas por Natureza


no 1o trimestre de 2012 Quantidade e %

Fonte: Lder Seguradora DPVAT

29

30

ESTATSTICA BSICA PARA TOMADA DE DECISO

Grfico de Barras Horizontais


Assim como o grfico de colunas, o grfico de barras geralmente utilizado para
descrever um conjunto de dados que precisam evidenciar as magnitudes das variveis
analisadas. A diferena a disposio da identificao das variveis, que por serem
extensas, ficam melhor dispostas num grfico de barras horizontais.
Sugere-se no utilizar esse tipo de grfico para um nmero muito grande observaes
e/ou variveis. E, sempre que possvel, informe os rtulos com os dados das variveis
para tornar a informao ainda mais visvel. Veja o exemplo a seguir:
Populao Residente no Brasil por Unidade da Federao Censo 2010

Fonte: Censo 2010 IBGE

Para elaborar o grfico acima no Excel siga os mesmos passos do exemplo de Grfico
em Colunas, exceto que dever escolher a opo de grfico em barras.

Histograma
utilizado para apresentao de dados de uma tabela de distribuio de frequncias.
No deixa de ser um grfico de colunas, porm com algumas caractersticas peculiares.
So representadas as variveis ou intervalos de classes no eixo horizontal e as frequncias no eixo vertical.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Alm da visualizao do fenmeno, histogramas indicam tambm caractersticas


da distribuio que sero teis na modelagem matemtica para inferncias, previses e
projees sobre os fatos envolvidos no estudo. Uma vez construdo o grfico (histograma), adiciona-se a ele curvas que indicam comportamento das variveis envolvidas, ou
seja, mostram uma imagem tendencial do fenmeno.
Para uma varivel discreta:
eixo horizontal (x) representa os valores da srie
eixo vertical (y) representa os valores das frequncias
a representao usa segmentos de reta verticais ou simplesmente pontos
O rol 2 3 3 3 3 5 5 5 5 5 5 5 5 6 6 6 6 6 6 7 7 resulta em uma tabela de distribuio
de frequncia com o seguinte aspecto:
xi

fi

As possveis representaes grficas abaixo podem ser utilizadas separadamente ou


associadas (sobrepostas) em um mesmo grfico:

Histograma simples

Polgono das frequncias

Grfico de disperso

Curva polida das


frequncias ou ogiva

31

32

ESTATSTICA BSICA PARA TOMADA DE DECISO

Para uma varivel contnua:


eixo horizontal (x) representa os intervalos (das classes) da srie;
eixo vertical (y) representa os valores das frequncias; e
a representao usa colunas, com base inferior de largura correspondente ao intervalo
da classe (as colunas podem ser justapostas).

Num histograma para variveis discretas, o polgono das frequncias uma linha
que une os pontos mdios das bases superiores das colunas. A rea do polgono igual
rea do histograma (colunas).
Vamos nos basear no exemplo acima para elaborar um Histograma no Excel. No caso
do Histograma o Excel possui uma Ferramenta de Anlise que nos permite no apenas
elaborar uma tabela de Distribuio de Frequncias, igual quela que j elaboramos, mas
tambm preparar o grfico correspondente, ou seja, o histograma da distribuio.
Para tanto, clique em Dados, e em seguida em Anlise de Dados. Abrir uma janela
com diversas ferramentas de anlise, escolha a opo Histograma.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Em seguida, uma nova janela se abrir solicitando algumas informaes acerca


da distribuio. A primeira delas o Intervalo de Entrada, que corresponde aos dados
(brutos), informe as clulas em que esses valores se encontram; em seguida, informe as
clulas que compem o Intervalo do Bloco (classes); o Intervalo de sada, que corresponde clula em que a distribuio ser apresentada; e, por fim, o resultado grfico,
que corresponde ao Histograma.

Ao finalizar essas operaes clique enter, e o Histograma j est pronto.

33

ESTATSTICA BSICA PARA TOMADA DE DECISO

Assim como demonstrado anteriormente, a apresentao do grfico pode ser aprimorada para melhorar a compreenso do mesmo, basta explorar os diversos recursos
do Excel.

Frequncia

34

Assim como a tabela de distribuio de frequncias, o histograma pode ser complementado a partir do clculo das demais frequncias (absolutas e relativas) j discutidas,
lembrando que quando houver diferentes unidades aconselhvel a utilizao de dois
eixos verticais (o principal e o secundrio).

Caractersticas das Curvas de Frequncias Assimetria e


Curtose
Com relao s curvas de frequncias, merecem ser analisadas, duas medidas que
tambm contribuem para descrever o comportamento de um conjunto de dados observados. So: o grau de assimetria e de curtose.
O grau de assimetria nos permite avaliar a disperso dos dados observados em relao s medidas de tendncia central. Quando no se registra tal disperso, dizemos que
a distribuio simtrica, o que significa que a Mdia igual Mediana e Moda, de
tal modo que 50% dos dados observados esto exatamente abaixo dessas estatsticas e
50% acima, conforme mostra a figura a seguir.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Assimetria

Negativamente
Assimtrica

Mdia

Moda

Simtrica

Mdia = Mediana = Moda

Mediana

Possitivamente
Assimtrica

Moda

Mdia

Mediana

Dando prosseguimento avaliao do comportamento de uma distribuio, outra


importante caracterstica pode ser observada quanto curva de frequncia, que est
associada ao seu achartamento ou afilamento , ou seja, seu grau de curtose. Por exemplo, uma distribuio pode apresentar elevado achatamento, o que mostra que os dados
observados esto fortemente distribudos ao longo da curva (distribuio platicrtica).

Curtose

Leptocrtica
Mesocrtica

Platicrtica

35

36

ESTATSTICA BSICA PARA TOMADA DE DECISO

Existem tcnicas estatsticas que nos permitem calcular tanto o grau de assimetria
de uma curva de frequncia quanto de Curtose. No entanto, nos restringiremos apenas
s avaliaes conceitual e grfica dessas medidas.

Grfico de Setores ou Pizza


utilizado para mostrar e comparar a importncia entre as vrias propores envolvidas em um estudo. Ao contrrio dos demais grficos, no permitem anlises mais
profundas do fenmeno, no serve para elaborao de projees matemticas, mas possui
um bom apelo visual para apresentaes visuais e grficas.
Sugere-se para esse tipo de grfico um nmero reduzido de observaes, haja vista
que seu objetivo de propiciar uma imediata noo dos valores ou porcentuais.
Tambm possvel apresentar, em um grfico de setores, diferentes unidades de
medida, como mostra o exemplo a seguir.
Populao Residente no Brasil em 2010 por Regio
em N. de Habitantes e Distribuio %
Centro-Oeste
14.058.094;
7,4%
Sul
27.386.891;
14,4%

Sudeste
80.364.410;
42,1%

Fonte Censo IBGE

Norte
15.864.454;
8,3%
Nordeste
53.081.950;
27,8%

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

A elaborao de um grfico de setores no Excel requer um procedimento semelhante


aos demais grficos, basta selecionar as clulas em que as informaes esto dispostas
e pedir para inserir grfico de Pizza.

Basta clicar no grfico selecionado e a operao ser realizada. Uma srie de melhorias no aspecto visual do grfico poder ser feita, apenas clique com o boto direito
do mouse sobre o grfico para efetu-las.

37

38

ESTATSTICA BSICA PARA TOMADA DE DECISO

Uma das melhorias sugeridas a incluso dos valores da srie no prprio grfico.
Para tanto, clique com o boto direito exatamente sobre o grfico, ao abrir a janela escolha Adicionar Rtulo de Dados.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Mas ainda possvel incluir os percentuais. Para tanto, clique novamente sobre o
grfico e, em seguida, em Formatar Rtulos de Dados na janela aberta.

Ao abrir a Janela Formatar Rtulo de Dados, clique nas opes desejadas, sempre
objetivando tornar ainda mais clara a interpretao dos resultados.

Busque sempre explorar todas as opes que o software nos fornece, e se no gostar
do resultado s desfazer a opo escolhida.

39

ESTATSTICA BSICA PARA TOMADA DE DECISO

Grfico de Linhas
Geralmente utilizado para descrever sries temporais, principalmente quando so
bastante longas. O grfico de linhas, por descrever uma srie temporal, permite que o
leitor identifique a tendncia do fenmeno analisado ao longo do tempo.
Sugere-se que se a varivel apresentar uma amplitude muito grande de um momento
para o outro, o grfico seja separado de tal modo que a tendncia possa ser mais visvel.
No exemplo abaixo possvel ver uma situao em que uma grande amplitude no
permite ver, em detalhes, o comportamento do ndice de inflao a partir de 1994.
ndice Geral de Preos IGP-DI 1945/2011 em %

40

Fonte: FGV

Para esse caso reitera-se a sugesto de separar o grfico, de tal modo que se possa detalhar o comportamento do aumento dos preos. Perceba, no exemplo abaixo, que o ndide
de inflao tem oscilado bastante aps 1994. No grfico anterior essas variaes no eram
visveis, em funo dos elevados ndices registrados entre os anos de 1986 e 1995.
Assim como os demais grficos, o grfico de linha pode ser complementado com
rtulos, bem como uma srie de ajustes podem ser feitos para melhorar a apresentao
e facilitar sua compreenso.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

em %

ndice Geral de Preos IGP-DI e Linha de Tendncia (em %)

Fonte: FGV

Recomenda-se, ainda, que para sries temporais curtas no seja utilizado o grfico
de linhas. Nesse caso, o grfico de colunas ser mais apropriado.

Grfico de Pontos ou Disperso


um tipo de grfico geralmente utilizado para relacionar duas variveis.
Ademais, considerada uma tcnica relativamente simples de projees e previses de
cenrios futuros, uma vez que pode, complementarmente, se apoiar no uso de modelos
matemticos (regresso linear, mltipla etc).
Apesar da existncia de tcnicas estatsticas mais acuradas para estudar a relao
entre variveis, o grfico de disperso recorrentemente utilizado para mostrar o grau
de associao entre duas variveis.
No exemplo a seguir, busca-se relacionar a renda mdia dos trabalhadores com carteira assinada ao nmero de pessoas ocupadas. Ambas as variveis so calculadas pela
Pesquisa Mensal de Emprego do IBGE.
Observe no grfico a seguir que possvel identificar um comportamento que expressa a relao entre as duas variveis analisadas. Esse comportamento aponta para
uma tendncia de crescimento da renda dos trabalhadores associado ao crescimento do
nmero de pessoas empregadas.

41

ESTATSTICA BSICA PARA TOMADA DE DECISO

Perceba que os pontos esto bastante prximos uns dos outros, e seguem uma
tendncia crescente, corroborando a hiptese de associao entre renda e aumento do
nmero de pessoas empregadas, que tem como contrapartida a reduo do nmero
de pessoas desempregadas.
Pessoas Ocupadas Renda Mdia (R$) (PME/IBGE)

Renda Mdia das Pessoas Ocupadas em R$

42

N. de pessoas ocupadas (em mil)

Para reforar essa constatao, que apenas visual, o Excel dispe de um recurso
adicional, que permite a incluso de uma linha de tendncia, que mede o grau de associao entre as duas variveis. Para tanto, o software estima uma funo matemtica
Renda Mdia = f (Nmero de pessoas ocupadas), e mede o Coeficiente de Determinao
R 2 (que o quadrado do Coeficiente de Correlao entre variveis).
Vamos elaborar o grfico do exemplo anterior, e incluir a linha de tendncia para o
grfico acima.
Para tanto, selecione as clulas em que se encontram os dados observados para as
duas variveis (apenas as colunas cujos dados sero utilizados para efeito de construo
do grfico. Observe que a coluna do perodo no far parte do grfico, logo no est
sendo selecionada. Em seguida, Clique em inserir, Grficos e escolha um dos Grficos
de Diperso apresentados.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Uma vez elaborado o grfico, clique com o boto direito do mouse sobre os dados e
pea para Adicionar Linha de Tendncia.

43

44

ESTATSTICA BSICA PARA TOMADA DE DECISO

Em seguida uma janela, chamada Formatar Linha de Tendncia se abrir. Nessa janela
ser solicitada a escolha de tipo de Tendncia (funo matemtica) que ser utilizada, o
que requer uma certa experincia por parte do pesquisador, ou que a mesma j seja definida previamente pelo estudo em questo. No nosso exemplo escolhemos uma tendncia
Linear. Vrias outras informaes so requeridas, vamos escolher apenas duas delas:
que seja informada a Equao da linha de tendncia e o Coeficiente de Determinao
que mede o grau de associao entre as variveis.

No grfico a seguir j possvel identificar os resultados da incluso da linha de


tendncia, que inclusive nos permite, a partir da Equao estimada, fazer projees
para o futuro. Por exemplo, ao supor-se que o nmero de pessoas empregadas seja de
25 milhes substituir na varivel da equao pode-se inferir que a renda mdia
estimada ser de R$1.919,1.
Ademais, deve-se ressaltar que o grau de associao entre as duas variveis bastante elevado, uma vez que o R 2 0,9291. Se R 2 for igual a 1, o grau de associao
considerado perfeito.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Renda Mdia do Pessoal Ocupado Pessoal Ocupado


Maro de 2002/Janeiro de 2012 PME-IBGE

em R$

y = 0,1646x 2195,9
R = 0,9291

Apesar de bastante til, essa ferramenta de anlise estatstica limitada. Tcnicas


bem mais sofisticadas, e confiveis, so utilizadas para a elaborao de estudos que
precisam ter uma confiabilidade maior.

Pictrogramas
Geralmente so grficos de barras horizontais ou de colunas, mas com a diferena
que as barras e colunas so substitudas por figuras, cujo tamanho procura reproduzir
as propores das variveis analisadas.
Esse tipo tem um objetivo mais visual do que tcnico, e so mais apropriados para
apresentaes ou textos menos formais.
Para elaborar um Pictograma no Excel necessrio, inicialmente, criar um grfico
de colunas (ou de barras horizontais) primeiro. Uma vez criado o grfico, clique com o
boto direito do mouse sobre as colunas, e em seguida sobre Formatar Srie de Dados.
Escolha Preenchimento, e em seguida Preenchimento da Imagem ou Textura, em Arquivos escolha uma imagem previamente gravada e pronto, ela ser anexada s colunas
do grfico.

45

46

ESTATSTICA BSICA PARA TOMADA DE DECISO

No grfico a seguir possvel ter uma melhor visualizao do resultado final de um


Pictograma.
Roubo de Veculos 1o Trimestre de 2012 SSP/SP
14.000
13.000

11.719

10.000
8.000

6.314
6.000

5.084

4.000
2.000
0

So Paulo Capital

Grande SP (exceto Capital)

Interior

Lembre-se, as figuras utilizadas num pictograma precisam ser previamente


gravadas numa pasta, para que possam ser reproduzidas pelo Excel.

Bom, esses so os principais grficos utilizados para complementar a tarefa de apresentar um conjunto de dados. Porm, outros tipos de grficos podem ser encontrados
tanto nos livros de estatstica quanto no prprio Excel.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Em caso de dvidas, sobre o tipo de grfico a utilizar, opte pelo grfico de


colunas. Pode-se dizer que ele rene todas as qualidades necessrias para o entendimento
dos fenmenos estudados e possui atributos tcnicos e visuais suficientes para artigos
cientficos, relatrios, apresentaes, revistas etc.
Evite usar colunas em trs dimenses (3D), que apesar de melhorarem o aspecto geral
da figura diminuem sua compreenso, especialmente quando existirem vrias colunas.

Resumindo a Utilizao dos Recursos Computacionais


para Elaborao de Grficos
Na prtica diria do mundo dos negcios costume a manipulao de grandes volumes de dados. Temos como exemplo relatrios de vendas e extratos de movimentao
de contas bancrias.
Comumente estes dados so expressos por valores numricos, e a eles so associadas
funes matemticas, o que permite sua apresentao atravs de grficos.
A elaborao de grficos um poderoso recurso para resumir e facilitar a visualizao destes dados. Uma maneira fcil para realizar tal tarefa atravs de recursos
computacionais, com o uso do aplicativo Excel.
Os grficos podem ser construdos passo a passo ao acessar o assistente de grficos
selecionando no menu Inserir e a seguir Grficos.
Os passos que o assistente percorrer com voc sero:

ETAPA 1
Permite ao
usurio escolher o
modelo de grfico
desejado (Pizza,
colunas, barras,
linhas...)

ETAPA 2
Pede ao usurio
que escolha e
indique os dados
numricos a
partir dos quais
ser elaborado o
grfico

ETAPA 3
Permite escolher
a diagramao do
grfico (colocao
de ttulos, escolha
de cores, tipos de
bordas...)

ETAPA 4
Salva o grfico

necessrio
que voc j
tenha os dados
previamente
disponveis em
uma tabela

Para saber mais sobre montagem de grficos no Excel, veja uma aula virtual na
pgina www.mat 1 xyz......com.br. L voc poder ver com detalhes a confeco
de grficos.

47

48

ESTATSTICA BSICA PARA TOMADA DE DECISO

CARACTERSTICAS DE TABELAS E GRFICOS


DE QUALIDADE
A regra bsica para elaborao de tabelas e grficos optar pela simplicidade.
Cada grfico/tabela dever preferencialmente conter uma nica informao, evitando-se
agrupar grandes conjuntos de dados, o que causa dificuldade de compreenso ao leitor.
Durante a diagramao, evite bordas, cores, linhas de grade e todos os elementos
visuais que possam carregar visualmente seu aspecto. Veja nas figuras a seguir alguns
exemplos do que fazer ou no.
Uma tabela inadequada:
REGIO

Participao
no mercado

% de
participao

Previso

R$ 12.000

12%

+12 %

R$ 135.000

5%

R$ 120.000

CONCORRNCIA

Crescimento

Regio Norte

25 %

+4 %

Regio Sul

12 %

22%

+ 76 %

Regio Leste

15 %

R$ 2.000

13%

5%

Regio Oeste

15%

CO

R$ 20.000

18%

+23%

Regio Oeste

5%

SU

R$ 132.000

No determ.

------

Tot

------------

72%

Comentrios sobre a tabela inadequada:


1) A tabela traz duas informaes diferentes ao mesmo tempo. Na verdade so duas
tabelas agrupadas, misturando diversas informaes de uma empresa com a de seu
concorrente. Separe-as e identifique-as.
2) Falta ttulo na tabela. A forma correta constar um ttulo, que fornea informaes
detalhadas ao leitor, sem que ele tenha que consultar quaisquer elementos no texto
do relatrio (a tabela em si autoexplicativa). Dever constar sempre o perodo de
tempo a que ela se refere, bem como a fonte de dados.
REGIO

CONCORRNCIA

Poderia ser assim:

TABELA No 01 Participao no mercado nacional da ACMEX Ltda. situao


atual e previses para o binio 2004/2005.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

3) Evitar misturar siglas com palavras ou repetir informaes que sobrecarreguem


o visual da tabela.
TABELA No 01 Participao..... TABELA No 02 ........
REGIO

CONCORRNCIA

Regio Norte

Regio Sul

Regio Leste

Regio Oeste
Repetio da
palavra Regio.
Seria melhor
o ttulo
CONCORRNCIA
POR REGIO

PQ no escrever Norte, Sul, Leste...


(ou N, S, L ... para o concorrente).
Padronize!

4) Alinhe os valores numricos sua direita. Isto permite melhor visualizao das grandezas envolvidas. Caso haja a presena de valores negativos eles podem ser coloridos
ou negritados para chamar a ateno. comum em atos contbeis coloc-los entre
parnteses. Neste caso use uma legenda logo abaixo da tabela indicando algo como
( ) ...valores negativos.
Participao
% de
no mercado participao

Previso

Participao
no mercado
(em R$)

Participao
(em %)

Previso
(em %)

R$ 12.000

12%

+12 %

12.000

12

12

R$ 135.000

5%

+4 %

135.000

R$ 120.000

22%

+ 76 %

120.000

22

76

R$ 2.000

13%

5%

2.000

13

R$ 20.000

18%

+23%

20.000

18

23

R$ 132.000

No determ.

-----

132.000

----------

-------

Evite repetir unidades


como R$ ou %.
O correto que elas
constem exclusivamente
no ttulo.
No entanto, na prtica
cotidiana comum
(e aceitvel) a repetio
do smbolo de %.

MELHOR

Valores indeterminados
devem ser representados
por traos. Nunca misture
notaes diferentes, ou
use zero ou f (vazio).
Use zero exclusivamente
para zero.

Evite usar sinais de +.


Identifique e destaque
somente valores
negativos.

49

50

ESTATSTICA BSICA PARA TOMADA DE DECISO

5) Na diagramao da tabela recomendvel:


a) evitar linhas verticais;
b) evitar linhas horizontais (so aceitveis para separar ttulos de colunas e linhas
de totalizadores, ou seja, limitar a tabela em cima e embaixo);
c) evitar cores e sombreamentos desnecessrios; use-as somente para destacar algo
imprescindvel;
d) evitar usar negritos e/ou letras maisculas nas clulas internas da tabela (so
aceitveis somente nos ttulos);
e) evitar abreviaes nos ttulos das colunas e linhas (se necessrio aumente sua
tabela);
f) evitar linhas e colunas de tamanhos diferentes; melhor procurar uniformizar
suas larguras;
g) quando houver vrias tabelas em um texto, na medida do possvel, todas devero
ser de mesmas dimenses e alinhadas igualmente;
h) Quando houver mais de uma tabela no texto, cada uma delas dever ser numerada
e identificada com seu ttulo;
i) evitar colocar duas ou mais tabelas lado a lado, sendo melhor posicion-las uma
seguida da outra, verticalmente;
j) centralizar cada uma das tabelas na pgina; e
k) o contedo das clulas devero ser centralizados.

APRESENTAO DOS DADOS (TABELAS E GRFICOS)

Como ficaria a tabela melhor apresentada1:


Tabela 1
Participao no Mercado Nacional da ACMEX Ltda
Situao Atual e Previses para o Binio 2006/2008
REGIO

PARTICIPAO NO
MERCADO
(em R$)

PARTICIPAO
(em %)

PREVISO

NORTE

12.000

12

12

SUL

135.000

LESTE

120.000

22

76

OESTE

2.000

13

(5)

CENTRO-OESTE

20.000

18

23

SUDESTE

132.000

-------

------

( ) ...valores negativos
Fonte: Diretoria de Planejamento e Marketing (agosto 2009)

As caractersticas apresentadas neste captulo podem no possuir rigor adequado para trabalhos acadmicos e cientficos em nveis mais elaborados. Nosso objetivo foi proporcionar ao aluno alguns conceitos bsicos de comunicao
visual, uma vez que ele est tomando os primeiros contatos com o tema de maneira mais aplicada sua futura prtica
de trabalho. Ao longo de seu curso de graduao, espera-se que o aluno aprimore tais conhecimentos.
1

51

ESTATSTICA BSICA PARA TOMADA DE DECISO

Exerccios

52

1) Os dados a seguir representam as notas dadas em uma


pesquisa de satisfao geral de um restaurante:
7,0
3,0
8,0

8,0
9,0
8,0

8,0
8,0
9,0

5,0
8,0
6,0

6,0
6,0
7,0

8,0
4,0
10,0

7,0
6,0
10,0

6,0
5,0
5,0

7,0
2,0
8,0

7,0
10,0
8,0

a) Organize o rol.
b) Monte uma tabela de frequncias, indicando a frequncia
simples, a frequncia relativa simples, a frequncia acumulada e a frequncia relativa acumulada.
c) Com a ajuda do Excel, monte grficos que mostrem o
desempenho do restaurante.
2) A tabela abaixo indica o tamanho do estabelecimento por nmero de funcionrios, em 31 de dezembro de 2011, no setor
de atividades auxiliares dos servios financeiros, seguros,
previdncia complementar, planos de sade e de resseguros
no municpio de So Paulo, de acordo com o tamanho do
estabelecimento:
Tamanho do
Estabelecimento por
nmero de funcionrios (xi)

Nmero de
Estabelecimentos
(fi)

De 1 a 4

3.011

De 5 a 9

2.480

De 10 a 19

3.228

De 20 a 49

5.906

De 50 a 99

6.217

De 100 a 249

9.271

De 250 a 499

11.070

De 500 a 999
Total

7.102
48.285

a) Complete a tabela calculando a frequncia simples, a


frequncia relativa simples, a frequncia acumulada
e a frequncia relativa acumulada.
b) Com a ajuda do Excel, monte grficos que facilitem a compreenso dos dados para uma pessoa que no conhea
estatstica.

Medidas Resumo

Temos insistido ao longo dos captulos anteriores sobre a principal funo da Estatstica Descritiva, que seria a capacidade de resumir dados e apresent-los de forma
acessvel e de fcil compreenso. Para tanto, exploramos nos captulos anteriores a
forma de faz-lo, atravs de tabelas e grficos.
Uma outra forma de obter elementos que permitam caracterizar sries de valores
estabelecer algumas medidas resumo, ou seja, encontrar um ou mais nmeros que
representem todos os demais valores que compem o estudo. So as chamadas medidas
de posio (medidas de tendncia central e separatrizes).
Tais medidas representam um valor ao redor do qual os elementos da srie esto
distribudos; em uma representao grfica, posicionaria a srie em um eixo horizontal,
localizando um determinado valor em torno do qual a srie se concentra.
Num passo seguinte, no prximo captulo, ser discutida a qualidade destas medidas resumo como representantes do todo, ou seja, estudaremos se, de fato, este valor
competente para representar toda uma populao ou amostra.
O quadro a seguir, mostra algumas caractersticas destas medidas de tendncia central:
Tipo

Representao

Usos e Caractersticas

Mdia

x (amostra) ou
(populao)

deve ser utilizada quando houver forte concentrao de valores na rea


central da srie organizada (rol);
no representa adequadamente sries que possuam valores extremados.

Mediana

md

pode ser utilizada quando houver forte concentrao de dados no incio


ou no final da srie;
mais importante a quantidade de elementos presentes na srie, do que
propriamente seus valores;
no afetada por valores extremados presentes no conjunto de
medidas, como acontece para a mdia.

Moda

mo

pode ser utilizada quando houver forte concentrao de dados no incio


ou no final da srie;
utilizada em sries que apresentam um elemento tpico, que se repete
com maior frequncia do que os demais.

53

54

ESTATSTICA BSICA PARA TOMADA DE DECISO

MDIAS
Talvez sejam as medidas de posio mais comumente utilizadas, o que acaba muitas
vezes representando um problema, uma vez que so usadas indiscriminadamente (quando
seria mais adequado o uso da mediana ou da moda), causando percepes distorcidas
do fenmeno estudado.
Costuma ser usada de forma incompleta, pois a utilizao da mdia implica na
necessidade do clculo de outra grandeza chamada desvio (disperso), que ser estudada
no captulo seguinte.
Por exemplo, se um aluno tirou, em trs avaliaes, as notas zero, cinco e dez, supondo que o peso de cada prova o mesmo, a mdia desse aluno ser cinco. Perceba que
a mdia desse aluno no reflete com exatido o seu desempenho, uma vez que ele tirou
uma nota muito ruim (zero) e uma nota mxima (dez). Para avaliar o comportamento
desse fenmeno, e de qualquer outro, o ideal utilizar outras medidas estatsticas, sobretudo aquelas que vo medir a disperso dos dados observados no exemplo as trs
notas em relao mdia.
Portanto, expressar uma mdia sem seu correspondente valor de desvio pode implicar
em grave erro de avaliao de um fenmeno.
Os diferentes tipos de mdias so representados a seguir:



Mdia

Aritmtica Simples
Aritmtica Ponderada
Geomtrica
Geomtrica Ponderada
Harmnica

Mdia Aritmtica Simples e Ponderada (x)


Vamos retomar o exemplo descrito acima, do aluno que tirou nota 0, 5 e 10 nas trs
avaliaes que fez. Para clculo da mdia aritmtica dessas notas bastante simples,
basta somar as trs notas e dividir por trs.

Mas agora vamos formalizar esse clculo, utilizando as frmulas apropriadas para
tanto. Neste caso, como representa uma mdia aritmtica simples, a frmula utilizada
para tanto a seguinte:

MEDIDAS RESUMO

Nesse exemplo, a MDIA ARITMTICA SIMPLES assim denominada, porque


os valores da frequncia simples dos trs dados observados igual a 1. Porm, quando
temos dados observados com frequncia superior a 1, o ideal que passemos a utilizar
uma ponderao. Por exemplo, a nota mdia dos 10 alunos que realizaram o exame final
de estatstica pode ser calculada somando-se as dez notas e dividindo por 10. Suponha
que essas so as notas desse grupo de alunos: 4, 4, 5, 5, 5, 6, 6, 7, 7 e 8.
A mdia do grupo ser:

Podemos refazer esse clculo levando em considerao as frequncias das notas, para
tanto vamos dispor essas notas numa tabela de distribuio de frequncia comum:
xi

fi

Total

10

Neste caso, vamos utilizar uma nova frmula que utilize as frequncias como uma
forma de ponderar as notas.

Perceba que o elemento no numerador da frmula passou a ser multiplicado (ponderado) pela frequncia, e o denominador a somatria da frequncia, que corresponde
exatamente ao nmero de dados observados. Precisamos, primeiramente, multiplicar os
dados observados (notas) pelas respectivas frequncias:
xi

fi

xi fi

15

12

14

Total

10

57

55

56

ESTATSTICA BSICA PARA TOMADA DE DECISO

Agora basta utilizar esses resultados na frmula:

bastante simples, e a interpretao exatamente a mesma, ou seja, a nota mdia


dos dez alunos que realizaram o exame de estatstica 5,7. Note que esse mesmo clculo
pode ser considerado para o primeiro exemplo, as trs notas de um aluno (0, 5 e 10).
A nica diferena que a ponderao, no caso a frequncia, de cada nota igual a 1.
Neste caso a distribuio de frequncia ficar assim:
xi

fi

xi fi

10

10

Total

15

E o clculo da mdia ser:

Voc deve estar se perguntando porque complicar tanto o clculo de uma simples mdia.
O fato que situaes mais complexas, tais como a utilizao de uma grande quantidade
de dados observados ou sries estatsticas j dispostas em distribuies de frequncias,
passam a requerer essa forma de calcular a mdia. Os exemplos utilizados realmente no
demandam a utilizao da frmula para o clculo da mdia, mas com esses exemplos
procuramos demonstrar como a interpretao dessa medida estatstica fcil.
O exemplo seguinte demonstra o clculo da mdia para uma varivel contnua ou
para uma distribuio de frequncias agrupada em classes. Assim como no exemplo dos
dez alunos, neste caso calculamos a mdia aritmtica ponderada que pode ser obtida
a partir de uma tabela de distribuio de frequncias.
Vale lembrar que nesses casos os dados observados so apresentados em intervalos,
como no exemplo abaixo, em que na primeira classe os valores observados vo de 2
(inclusive) a 6 (exclusive), e assim por diante.
xi

fi

2 | 6

6 | 10

10 | 14

14 | 18

Total

10

MEDIDAS RESUMO

Para calcular a mdia, entre outras estatsticas, no podemos utilizar os intervalos.


Nesse caso, utilizamos o valor mdio de cada intervalo de classe, que representa a mdia
simples do limite inferior e superior de cada intervalo de classe. Para esse mesmo exemplo,
observe que no primeiro intervalo o limite inferior da primeira classe igual a 2 e o limite
superior 6, ento a mdia desse intervalo ser (2+6)/2 = 4. Esse valor corresponder ao
dado observado (xi ) para efeito de clculo da mdia, conforme veremos abaixo:
xi

xi

fi

xi fi

2 | 6
(2+6) / 2

4 . 4 = 16

6 | 10
(6 + 10 ) / 2

8 . 2 = 16

10 | 14
(10+14)/2

12

12 . 1 =12

14 | 18
(14+18)/2

16

16 . 3 = 48

10

94

Uma vez identificado o ponto mdio de cada intervalo, basta aplicar a frmula da
mdia tal qual fizemos no exemplo anterior:

Mdia Ponderada
Outra medida de posio comumente utilizada a mdia ponderada. Essa medida
semelhante obtida a partir da distribuio de frequncias. Como observamos, em
uma distribuio de frequncias, elas assumem a funo de ponderao na composio
da somatria dos dados observados.
No caso a seguir essa mesma perspectiva existe. A diferena que passamos a chamar
tal componente de peso ou ponderao (pi). No exemplo a seguir temos uma empresa
que est buscando apurar a sua margem de lucro, que obtida a partir da venda de seis
produtos com participaes e taxas de retorno diferentes.
Para que possamos identificar o lucro auferido com os seis produtos devemos, inicialmente, calcular a participao de cada produto no volume total de vendas e, assim,
compor os pesos ou ponderaes de cada um deles.
Uma vez que calculamos o peso de cada produto devemos multiplic-los pela respectiva margem de lucro. A somatria desses resultados compe a mdia ponderada da
margem de lucro da empresa.

57

58

ESTATSTICA BSICA PARA TOMADA DE DECISO

Produtos

Vendas

Margem de Lucro
(xi)

Participao nas
Vendas (pi)

xi pi

Produto A

R$ 60.000

4,00%

0,3158

1,2632%

Produto B

R$ 40.000

6,00%

0,2105

1,2632%

Produto C

R$ 30.000

8,00%

0,1579

1,2632%

Produto D

R$ 25.000

3,00%

0,1316

0,3947%

Produto E

R$ 20.000

5,00%

0,1053

0,5263%

Produto F

R$ 15.000

7,00%

0,0789

0,5526%

Total

R$ 190.000

5,26%

Veja o clculo da mdia ponderada abaixo.

Observe que a somatria do peso tem que ser igual a 1.

Usando o Excel para Calcular a Mdia


O clculo da mdia utilizando o Excel bastante simples, e pode ser feito de duas
maneiras: a partir da incluso de uma funo estatstica; e, por meio da ferramenta
de anlise de dados. Como a ferramenta de anlise de dados nos fornece um conjunto
de resultados denominado estatstica descritiva, vamos trabalhar, por enquanto, apenas
com a primeira opo. Para tanto, vamos utilizar os dados apresentados na tabela abaixo,
que representam o ndice de sinistralidade do seguro de automvel, entre julho de 2010
e junho de 2011.
Ms/Ano

Sinistralidade

Ms/Ano

Sinistralidade

jul/10

0,65

jul/11

0,68

ago/10

0,64

ago/11

0,72

set/10

0,64

set/11

0,68

out/10

0,63

out/11

0,68

nov/10

0,65

nov/11

0,69

dez/10

0,6

dez/11

0,63

jan/11

0,67

jan/12

0,7

fev/11

0,66

fev/12

0,68

mar/11

0,65

mar/12

0,72

abr/11

0,63

abr/12

0,69

mai/11

0,68

mai/12

0,72

jun/11

0,68

jun/12

0,7

Fonte: SUSEP

MEDIDAS RESUMO

Para que o Excel identifique todos os dados da tabela, lembre-se que os mesmos
devero estar dispostos numa nica coluna.

Em seguida clique em fx. A janela Inserir funo se abrir, selecione a categoria


estatstica e, sem seguida MDIA e clique OK, conforme est demonstrado abaixo.

59

60

ESTATSTICA BSICA PARA TOMADA DE DECISO

Em seguida uma nova janela se abrir, solicitando as clulas onde se encontram os


dados observados, que neste exemplo so de B2 at B25.

Clique Ok e o resultado, a mdia do conjunto de dados observados, ser apresentado


na clula escolhida. Nesse exemplo, o resultado 0,67, o que significa dizer que a sinistralidade mdia para o seguro de automveis no perodo analisado 0,67.

Mediana
A mediana (md) um valor que separa o rol em duas partes com o mesmo nmero de
elementos, ou seja, o valor que ocupa a posio central do conjunto de dados observados.
Clculo da mediana para variveis discretas:
Na srie 8, 4, 5, 9, 5, 2, 7 teramos:

ROL:

2 4 5 5 7 8 9

trs elementos de cada lado


5 o elemento central
md = 5
no MPAR de elementos na srie

MEDIDAS RESUMO

Portanto, a Mediana do conjunto de dados acima Md=5, ou seja, esse valor divide
o rol exatamente ao meio. Perceba que 50% dos dados esto abaixo da mediana e 50%
acima. Para calcular a Mediana necessrio identificar o Elemento Mediano (EMd), que
corresponde posio, no rol, em que se encontra a Mediana.
Quando o nmero de dados observados mpar, neste caso so sete dados, o
elemento mediano calculado da seguinte maneira:
, ou seja, a Mediana est na quarta posio, ou o quarto elemento
da srie de dados, que para esse caso igual a 5.
Rol
Posio

Dados

Quando a srie possui um nmero par de elementos, temos dois termos centrais:
(n /2) e (n/2 + 1). Exemplo: na srie 7, 21, 13, 15, 10, 8, 9, 13

61

62

ESTATSTICA BSICA PARA TOMADA DE DECISO

A regra de bolso para o clculo da Mediana quando o nmero de elementos par


a seguinte:
1o passo) Calcule o elemento mediano:

De acordo com a frmula acima, o elemento mediano est na quarta posio. Porm, como j foi demonstrado, esse valor no est dividindo a srie
exatamente ao meio, por isso se faz necessrio o segundo passo:

2o passo) Calcule a mdia simples do valor que est na quarta posio e na posio
imediatamente posterior, ou seja, na quinta posio, que para esse exemplo
so os valores 10 e 13.
Rol
Posio

Dados

10

13

13

15

21

Portanto, o resultado da Mediana ser:

Clculo da Mediana para Variveis Contnuas


Da mesma forma que fizemos algumas adaptaes para o clculo da mdia de uma
srie disposta numa distribuio de frequncias agrupada em classes, o clculo da mediana
tambm requer que adotemos algumas regras de bolso para encontrar o valor mediano.
No exemplo abaixo, temos a distribuio de idades dos funcionrios de uma empresa:
Classe

Idades (xi)

fi

18 | 22

22 | 26

26 | 30

30 | 34

34 | 38

Total

21

MEDIDAS RESUMO

O primeiro passo para calcular a mediana dessa distribuio identificar o elemento


Mediano:

Portanto, o valor mediano na posio 10,5. Para identificar a classe em que se encontra esse valor mediano precisamos complementar a distribuio com a Frequncia
Acumulada.
Classe

Idades (xi)

fi

Fi

18 | 22

22 | 26

26 | 30

15

30 | 34

19

34 | 38

21

21

Total

Agora que temos a coluna da frequncia acumulada, possvel identificar a classe em


que se encontra o valor mediano. Como o elemento mediano igual a 10,5, a mediana se
encontra na terceira classe (de 26 a 30 exclusive), que indica os valores que esto entre
8a e a 15a posies. Lembre-se que os dados esto agrupados em ordem crescente, por
isso podemos identificar as posies de cada classe a partir da frequncia acumulada.
Ademais, como o Elemento Mediano (10,5) um valor decimal, o mesmo indica que
a Mediana est localizada entre o 10o e 11o elemento da srie. Observando a coluna das
frequncias acumuladas (Fi), note que o 10o e 11o elementos da srie esto localizados
na terceira classe, portanto esta classe ser considerada como a classe mediana.
Classe

Intervalo
(idades)

fi

Fi

26 | 30

15

7
Classe mediana

Este intervalo de quatro elementos (26 a 30 anos) possui oito funcionrios, ento
podemos dividi-lo de forma adequada:

Idades:

26 anos

Termo da srie:

md

30 anos

x=?
7o

10,5o

15o

63

64

ESTATSTICA BSICA PARA TOMADA DE DECISO

Ou seja:

15 7
4

10,5 7
x

ou seja

8
4

10,5 7

Desta forma, Md = 26 + x md = 26 +

x
10,5 7
8

x=

10,5 7
8

.4

. 4 md = 27,8

Generalizando o clculo, temos a seguinte frmula para o clculo da mediana para


variveis contnuas:

onde:
l md Limite inferior da classe onde se encontra o valor mediano;
EMd Elemento mediano;
Fant Frequncia acumulada da classe anterior classe onde se encontra o valor mediano;
f Md Frequncia simples da classe onde se encontra o valor mediano; e
h Amplitude do intervalo onde se encontra o valor mediano.

Usando o Excel para Clculo da Mediana


Assim como a mdia, o clculo da mediana no Excel pode ser feito utilizando a
incluso de uma funo estatstica, ou por meio da ferramenta de anlise Estatstica
Descritiva. Por enquanto vamos nos ater apenas primeira forma, ou seja, vamos incluir
uma funo estatstica.
Para tanto, vamos nos basear no exemplo da Sinistralidade das seguradoras no Brasil entre julho de 2010 e junho de 2012, lembrando que os dados devem estar dispostos
numa nica coluna.

MEDIDAS RESUMO

Escolha uma clula e clique em fx, e uma nova janela Inserir funo se abrir.
Uma vez aberta a janela Inserir funo escolha a funo Med (de Mediana), e em seguida
clique OK.

65

66

ESTATSTICA BSICA PARA TOMADA DE DECISO

Ao clicar OK abrir a janela Argumentos da funo, na qual sero informadas as


clulas onde se encontram a srie de dados, que para esse exemplo so de B2 at B25.

D OK e o valor da mediana aparecer imediatamente na clula escolhida, que para


o exemplo em questo igual a 0,68.

Moda
A moda (mo) o valor que possui maior frequncia em uma srie, ou seja, o valor
que mais se repete na srie.
No caso de tratarmos com variveis discretas, basta identificar no rol ou na tabela
de distribuio a varivel que possui maior frequncia.

Exemplo 1
No rol 5 5 6 6 6 9 10 12 12

Mo = 6

Caso tivssemos este mesmo rol expresso na forma de uma tabela de distribuio:
xi

fi

10

12

Mo = 6

MEDIDAS RESUMO

Exemplo 2
No Rol 2 3 4 4 5 5 6 7 8 9.
Existem dois valores modais: Mo=4 e Mo=5. Uma srie pode ter mais do que
dois valores modais.

Exemplo 3:
No Rol 1 2 3 4 5 6 7 8 9 10.
Neste caso, no existe nenhum dado observado que se repete, logo, dizemos que
a srie AMODAL.

No caso de duas variveis diferentes possurem as mesmas maiores frequncias,


diramos que a srie bimodal, existem casos em que mais do que duas variveis possuem as mesmas maiores frequncias, assim como uma srie pode no ter nenhum valor
que se repete mais do que as demais de uma determinada srie, o que caracteriza uma
srie amodal.
Como os dados esto agrupados em classes (intervalos de valores), o clculo da Moda
ser feito por aproximao. Para tanto, vamos utilizar a seguinte frmula de King:

Onde,
Mo o valor modal;
lmo o limite inferior da classe em que se encontra o valor modal;
fpost frequncia simples da classe posterior quela em que se encontra o valor modal;
fant o limite inferior da classe anterior quela em que se encontra o valor modal; e
h a amplitude da classe em que se encontra o valor modal.
Calculemos a Moda para o exemplo abaixo, que apresenta a distribuio de idades
dos 21 funcionrios de uma empresa:
Classe

Idades (xi)

fi

18 | 22

22 | 26

26 | 30

30 | 34

34 | 38

Total

21

67

68

ESTATSTICA BSICA PARA TOMADA DE DECISO

O primeiro passo consiste em identificar a classe em que se encontra o valor modal, que
para o exemplo em questo a terceira, uma vez que este intervalo apresenta a maior frequncia. Em seguida, apliquemos a frmula identificando cada um dos seus elementos:

Portanto, a idade modal da srie em questo 27,8 anos.

Usando o Excel para Clculo da Moda


Voltemos ao exemplo da Sinistralidade das seguradoras no Brasil entre julho de
2010 e junho de 2012, reiterando que a srie deve estar disposta numa nica coluna.
Escolha uma clula e, em seguida, clique no cone fx. Em seguida, na janela aberta selecione a categoria estatstica, que apresentar uma srie de funes. Escolha a funo
MODO, ou seja, o Moda, conforme est demonstrado a seguir:

MEDIDAS RESUMO

D OK, e o valor da Moda ser apresentado na clula escolhida, que para o presente
exemplo igual a 0,68.

Portanto, o resultado indica que para o perodo analisado o ndice de sinistralidade


modal, o que mais se repetiu ao longo da srie, 0,68.

Medidas Separatrizes (ou Medidas de Posio Relativa)


Alm da mdia, mediana e moda, outras medidas de posio podem ser utilizadas
para caracterizar uma srie. Permitem comparar valores de conjuntos de dados diferentes,
ou mesmo dentro de um mesmo conjunto de dados, sendo denominadas genericamente
por QUANTIS, mais especificamente: Decil, Quartil, e PERCENTIL.
Assim como a mediana, o quartil, o decil e o centil divide a srie de dados de tal
modo que se torna possvel avali-la de forma segmentada. So chamadas medidas separatrizes, pois assim como a mediana que divide a srie em duas partes iguais, o quartil
dividir a srie em quatro partes iguais, o decil em dez partes iguais e o centil em cem
partes iguais, conforme descreve a figura a seguir:
O quartil divide a srie em quatro partes iguais, de tal modo que podemos calcular o 1o, o 2o e o 3o quartil. Para tanto, precisamos identificar o elemento quartil
, assim como fizemos no clculo da Mediana, lembrando que tal elemento
identifica a posio no rol do valor quartil.
Observe que o primeiro quartil (Q1) separa a sequncia ordenada deixando 25% ()
de seus valores sua esquerda e o restante (75%) direita. J o 2o quartil, que coincide
com a mediana, separa a srie em duas partes simtricas.

69

70

ESTATSTICA BSICA PARA TOMADA DE DECISO

Q1

Q2

Q3

Mediana

Da mesma forma, o Elemento Decil:


decil que temos o interesse em calcular.
D1

D2

D3

D4

nos d a posio do i-simo

D5

D6

D7

D8

D9

Mediana

ER, por fim, o Elemento Centil:


da srie de dados.
C1

C2...

C10...

C40...

C50...

indica a posio do i-simo decil

C60...

C70...

C90...

C95...

C99

Mediana

Observe nas figuras acima que para as trs medidas separatrizes possvel identificar um valor mediano correspondente, pois essa estatstica alm de ser uma medida
de tendncia central, tambm tem a funo de uma separatriz ao dividir exatamente ao
meio uma srie de dados. Portanto, o valor da mediana o mesmo do segundo quartil,
do quinto decil e do quinquagsimo centil.
Vamos trabalhar sobre um exemplo, para que possamos calcular as trs medidas separatrizes, bem como interpretar os seus resultados. A srie abaixo, apresentada numa distribuio
de frequncias comum, representa a idade de 110 clientes da Corretora Alpha com idade entre
18 e 39 anos, que contrataram seguro de automvel num determinado perodo.
xi

fi

18

19

20

10

21

12

22

15

23

18

24

21

25

23

Total

110

MEDIDAS RESUMO

Vamos calcular o primeiro quartil (Q1). Para tanto, precisamos identificar a posio
desse valor, ou seja, precisamos o elemento do primeiro quartil

O resultado acima indica que o Q1 est na 27,5a posio no rol. Para identificarmos
essa posio na srie precisamos de mais uma informao, a frequncia acumulada:
xi

fi

18

19

11

20

10

21

21

12

33

22

15

48

23

18

66

24

21

87

25

23

110

Total

110

Agora conseguimos identificar a classe, bem como o valor do primeiro quartil


(Q1). Observe que a terceira classe, que corresponde aos clientes de 21 anos, inclui do
22o ao 33o dados da srie (ou do rol), como o primeiro elemento quartil corresponde
25a posio, podemos concluir que o Q1=21. Esse resultado indica que 25% dos clientes
da amostra tm entre 19 e 21 anos de idade.
Vamos utilizar o mesmo exemplo para calcular o terceiro quartil (Q3). Neste caso o
elemento decil ser:

. O terceiro quartil se encontra na 82,5a po-

sio, ou seja, est na stima classe, o que significa que 75% dos clientes dessa amostra
tm at 24 anos de idade.
Baseando-nos no mesmo exemplo, vamos calcular agora o quarto decil (D4), para
o qual o elemento decil

. De acordo com o resultado, o quarto

decil est na 44a posio da srie, ou na quinta classe, logo D4=22, o que significa que
40% dos clientes dessa amostra tm entre 18 e 22 anos.
Ainda em relao ao exemplo acima, vamos calcular o 60o centil. Neste caso, o
elemento centil ser

. Considerando que o 60o centil se encontra

na 66a posio, temos que o D60=23. Portanto, 60% dos clientes da amostra tm entre
18 e 23 anos de idade.
Como os dados do exemplo anterior esto dispostos numa distribuio de frequncia
simples ou comum, foi possvel realizar o clculo das medidas separatrizes baseando-se

71

72

ESTATSTICA BSICA PARA TOMADA DE DECISO

apenas nos correspondentes elementos, que ao indicarem a posio das medidas nos
forneceram a classe (ou a idade dos clientes). Porm, quando trabalhamos com variveis
contnuas ou com uma distribuio de frequncias agrupadas em classes, precisamos calcular um valor aproximado que corresponder aos quartis, decis ou centis desejados.
Suponha que a Corretora Alpha tenha 140 clientes que contrataram seguro residencial, e que estamos interessados em avali-los de acordo com a faixa salarial (em
salrios mnimos) de cada um deles. Para tanto, foi elaborada a seguinte distribuio
de frequncias:
xi

fi

5 | 10

10

10

10 | 15

17

27

15 | 20

25

52

20 | 25

35

87

25 | 30

21

108

30 | 35

18

126

35 | 40

14

140

Total

140

Baseado no exemplo acima, vamos calcular o primeiro quartil (Q1). Assim como
na distribuio anterior, precisamos identificar o elemento quartil, que neste caso ser
. De acordo com o resultado, o Q1 est na 35a posio, ou seja, na
terceira classe. Lembre-se, nessa classe se encontram os valores da srie (ou do rol) que
esto dispostos entre 28a e a 52a posio. Porm, como a distribuio est agrupada em
classes, precisaremos recorrer a uma frmula, semelhante a da mediana, para poder
encontrar o valor do primeiro quartil, que ser a seguinte:

Sendo que:
lQi o limite inferior da classe em que se encontra o i-simo quartil;
EQi o i-simo quartil;
FAnt a frequncia acumulada da classe anterior quela em que se encontra o i-simo
quartil;
fQi a frequncia simples da classe em que se encontra o i-simo quartil; e
h a amplitude da classe em que se encontra o i-simo quartil.

MEDIDAS RESUMO

Voltemos ao exemplo, como o EQi = 35, temos que:


. Portanto, 25% dos clientes dessa
carteira ganham at 16,6 salrios mnimos.
Baseando-nos no mesmo exemplo, calculemos agora o quinto decil (D5), para o qual
precisamos utilizar a seguinte frmula:

Muito bem, agora precisamos encontrar o Elemento Decil, que neste caso ser
. Como o quinto decil est na 70a posio da srie temos que o
mesmo se encontra na quarta classe (20 | 25 salrios mnimos). Neste sentido, temos:
. Portanto, 50% dos clientes dessa
carteira ganham at 22,6 salrios mnimos.
Lembre-se que 5o decil, assim como o 2o quartil e o 50o centil correspondem mediana
da srie, assim sendo, o valor calculado acima tambm representa o valor mediano da
srie. Aplique a frmula da mediana para tirar a prova do que est sendo afirmado.
Para finalizar as medidas separatrizes, vamos calcular o 65o centil, sendo que a frmula para o clculo dos decis :
centil

. Para o exemplo o elemento

. Aplicando a frmula, temos que:

O resultado indica que 65% dos clientes da carteira de seguro residencial da Corretora
Alpha tem uma renda de at 26 salrios mnimos.

73

74

ESTATSTICA BSICA PARA TOMADA DE DECISO

Usando o Excel para o Clculo dos Quartis, Decis e Centis


Para realizar esse o clculo das separatrizes (Quartis, Decis e Centis) no Excel
disponha os dados da srie numa nica coluna e escolha uma clula para incluir uma
funo. Ao clicar em fx a janela Inserir Funo ser aberta, em seguida escolha categoria
Estatstica, e selecione a funo Percentil.

Em seguida uma nova janela, denominada Argumentos da Funo se abrir, solicitando que seja informada a Matriz, que corresponde srie de dados, e o K, que se refere
ao i-simo percentil. Note que tanto o clculo dos quartis quanto dos decis e dos centis
ser realizado a partir dessa funo Percentis. Basta indicar o valor percentil proporcional
medida que busca calcular, sendo que o intervalo desse valor vai de 0 a 1.

MEDIDAS RESUMO

No exemplo a seguir vamos calcular o 1o quartil, que tambm corresponde ao 25o


centil. Para tanto, indique que o valor percentil igual a 0,25.

Basta clicar OK e o valor do 1o quartil aparecer na clula escolhida para a insero


da funo. Seguindo a mesma lgica, caso queira calcular o 2o quartil (que corresponde
ao 5o decil, 50o centil e mediana), o valor Percentil a ser informado dever ser 0,5.
Por fim, para o clculo do 3o quartil o valor do Percentil igual a 0,75, sendo que o
mesmo, obviamente, corresponde ao 75o centil.

75

76

ESTATSTICA BSICA PARA TOMADA DE DECISO

Para o clculo dos decis a lgica a mesma. Por exemplo, para calcular o 4o decil
(que corresponde ao 40o centil), indique para o valor percentil 0,4.

Ao clicar OK aparecer o valor desejado na clula escolhida.

MEDIDAS RESUMO

Por fim, o clculo dos centis corresponde ao prprio Percentil, sendo que qualquer valor
indicado entre 0 e 1 resultar no i-simo centil. Por exemplo, o clculo do 65o centil.

O centil calculado ser igual a 24, lembrando que de acordo com esse resultado 65%
dos clientes analisados pela amostra tm at 24 anos de idade.

Uma vez abordadas as medidas estatsticas denominadas de Tendncia Central e Separatrizes, vamos abordar, agora, as medidas que permitem complementar a anlise descritiva
de uma srie de dados a partir de medidas que nos permitem analisar a disperso (ou variabilidade) dos dados observados da srie em relao s medidas de Tendncia Central.

77

ESTATSTICA BSICA PARA TOMADA DE DECISO

Exerccios

78

1) Os dados a seguir representam as notas dadas em uma


pesquisa de satisfao geral de um restaurante:
7,0
3,0
8,0

8,0
9,0
8,0

8,0
8,0
9,0

5,0
8,0
6,0

6,0
6,0
7,0

8,0
4,0
10,0

7,0
6,0
10,0

6,0
5,0
5,0

7,0
2,0
8,0

7,0
10,0
8,0

a) Calcule a moda, mdia e mediana do conjunto de dados.


b) Mostre os quartis desse conjunto de dados.
2) A tabela abaixo indica o Tamanho do Estabelecimento, a parir
do nmero de funcionrios com registro em carteira em 31
de dezembro de 2011, no setor de atividades auxiliares dos
servios financeiros, seguros, previdncia complementar,
planos de sade e de resseguros no municpio de So Paulo,
de acordo com o tamanho do estabelecimento:
Tamanho do
Estabelecimento
por nmero
de funcionrios
registrados (Xi)

Nmero de
Estabelecimentos
(fi)

De 1 a 4

3.011

De 5 a 9

2.480

De 10 a 19

3.228

De 20 a 49

5.906

De 50 a 99

6.217

De 100 a 249

9.271

De 250 a 499

11.070

De 500 a 999

7.102

Total

48.285

a) Calcule a mdia e analise o resultado.


b) Calcule a moda e analise o resultado.
c) Calcule a mediana e analise o resultado.
d) Calcule o 1o e o 3o quartil e analise os resultados.
e) Calcule o 3o e o 7o decil e analise os resultados.
f) Calcule o 33o e o 67o centil e analise os resultados.

Medidas de Disperso

As medidas de disperso so teis para avaliar a representatividade da mdia, ou


seja, o quanto a mdia representa bem um conjunto de dados e, consequentemente, na
possibilidade de ser utilizada para a tomada de decises.
As principais medidas de disperso so a amplitude (A), o desvio-mdio simples (DMS) que tambm chamado de desvio-mdio absoluto, a varincia (2) e o
desvio-padro ().
Estatisticamente, o conceito de disperso sinnimo de: variabilidade, diferena,
desvio, distncia.
Como dissemos no captulo anterior, a mdia uma das medidas mais utilizadas
na estatstica, porm sua utilizao sem critrios pode causar erros de julgamento.
Para que tenha real utilidade, seu clculo dever estar obrigatoriamente associado ao
clculo de seu desvio.
Um exemplo ilustrativo: suponha a necessidade de escolher um piloto de avies
recm-formado. Caso voc examine somente as mdias finais que alcanaram durante
seus cursos, no observar qualquer diferena (nota 5 para ambos).
Piloto A

Piloto B

Decolar

10

Pousar

zero

Nota mdia:

Tomando sua deciso somente pelo valor da mdia voc incorrer em um erro de
julgamento grave, pois o piloto A no sabe sequer pousar o avio. J analisando a distribuio de notas dos candidatos, podemos observar um maior equilbrio das habilidades
do piloto B, que seria uma melhor opo.

79

80

ESTATSTICA BSICA PARA TOMADA DE DECISO

O fato de preferirmos o piloto B deve-se comparao da sua nota mdia com cada
uma das suas habilidades, ou seja:
Piloto A

Piloto B

Decolar

10

Pousar

zero

Nota mdia:

desvios

10

Desvio: 5 5 = 0
para as duas
habilidades do piloto B

Para o piloto A teramos as seguintes diferenas (desvios) entre a mdia e suas notas,
que devem ser calculadas em valores absolutos (mdulo):
d A = d1 + d2 = |10-5| + |0-5| = 5 + 5 = 10 (maior desvio total)
J para o piloto B:
d B = d1 + d2 = |5-5| + |5-5| = 0 + 0 = 0 (menor desvio total)

Cuidado
Se no utilizssemos o valor absoluto, teramos para o piloto A: (5-10) + (5-0) =
-5 + 5 = 0 o que daria a falsa impresso que no existem diferenas entre os dois pilotos, pois ambos teriam desvios iguais a zero! De qualquer forma, devemos lembrar
que no existem notas negativas; o fato de ocorrer um desvio -5 indica apenas que
ele est abaixo da mdia, e +5 est acima da mdia, como em uma escala.

Pousar

Decolar

Piloto A:

-5

mdia ( x ) = 5

+5

MEDIDAS DE DISPERSO

CLCULO DO DESVIO-MDIO SIMPLES (OU


DESVIO ABSOLUTO) PARA UMA POPULAO
Costumeiramente no trabalhamos com o desvio total, mas sim com o chamado
desvio-mdio simples (DMS), ou seja:
ou ainda, de forma expandida
Onde:
di .... somatrio dos valores absolutos dos desvios
n ..... nmero de elementos da srie envolvidos
xi ..... variveis
Ademais, comum associarmos ao clculo dos desvios um coeficiente de variao
percentual (tambm chamado de erro percentual), expresso por uma razo entre o desvio
e a mdia da srie, ou seja:

No exemplo dos pilotos teramos o seguinte tratamento completo:


Para o primeiro piloto:
Piloto A

Desvios (di)

Decolar

10

d1 = |10 5| = 5

Pousar

Zero

d2 = | 0 5 | = 5

di = 5+5 = 10

81

82

ESTATSTICA BSICA PARA TOMADA DE DECISO

Para o outro piloto, temos:


Piloto B

Desvios (di)

d1 = |5 5| = 0

Pousar

d2 = |5 5| = 0

Decolar

di = 0 + 0 = 0

Comparando ambos os pilotos, e acrescentando um novo conceito de disperso,


denominado Amplitude, definido como a diferena entre o maior e o menor valor
da srie (A = maior valor menor valor), teramos:
X

Amplitude

DMS

CV%

Piloto A

10 0 = 10

100 %

Piloto B

5 5=0

0%

A mdia 5 para ambos os pilotos no possibilitaria uma tomada de deciso segura,


porm a maior amplitude para o piloto A, apoiada pelo maior desvio, indica que ele
tem uma maior variao de suas notas (no caso 100%, um valor muito grande), o que
permitiria escolhermos o piloto B, que possui menor desvio.
Estatisticamente, o piloto que oferece menor risco para seus passageiros o piloto B.

CLCULO DA VARINCIA E DO DESVIO-PADRO


PARA UMA POPULAO
Outra maneira de calcularmos o desvio de uma srie de valores utilizarmos o chamado desvio-padro, que se assemelha conceitualmente ao anterior. Em vez de utilizar-se
do valor absoluto (mdulo) para evitar valores negativos de desvios (valores da srie
inferiores mdia), ele faz uso do quadrado, ou seja, calcula as diferenas e eleva-as ao
quadrado, garantindo sempre resultados positivos.
Esta fase do clculo recebe o nome de clculo da varincia, que representada pela
letra grega sigma elevada ao quadrado (2).

MEDIDAS DE DISPERSO

Elevar um valor de desvio ao quadrado evita que tenhamos valores negativos, porm
aumenta seu valor, que fica bastante ampliado em relao realidade. Uma forma de
compensarmos este aumento indevido determinarmos a raiz quadrada da varincia,
que o chamado desvio-padro, representado pela letra grega sigma ()
Temos ento:
2

e
comum associarmos ao clculo dos desvios-padro um Coeficiente de variao
percentual, expresso por uma razo entre o desvio-padro e a mdia da srie, ou seja:

Por que utilizar este artifcio, elevar ao quadrado e depois extrair a raiz quadrada? No seria mais simples trabalharmos com o valor absoluto (mdulo), ou seja,
usar o desvio-mdio simples (DMS) em vez do desvio-padro ()?
Na realidade o clculo do valor absoluto no uma operao algbrica (adio,
multiplicao, extrao de razes ou potenciao com valores inteiros ou fracionados),
o que causar dificuldades em clculos posteriores de inferncias estatsticas.
Tal fato no acontece com a varincia, que possui maior versatilidade algbrica.
Por exemplo, a varincia possui a propriedade aditiva: duas populaes independentes,
com varincias distintas, ao terem um elemento de cada populao escolhidos aleatoriamente e somados, apresentaro uma varincia igual soma da varincia das populaes
de onde foram extrados.
J o uso de valores absolutos criaria dificuldades neste tipo de clculo.
Desta forma, mais comum o uso do desvio-padro () do que o desvio-mdio
simples (DMS), no dia a dia da estatstica. Compare as duas formas de clculo:
Na srie: 2 4 4 4 5 6 6 6 9 9

x = (2 + 4.3 + 5 + 6.3 + 9.2) / 10

x = (2 + 12 + 5 + 18 + 18) / 10 = 5,5

n = 10

Repare que nos clculos dos desvios abaixo, poderamos calcular o desvio de cada
uma das medidas individualmente, um a um, ou multiplic-los pela sua frequncia ( f i).
Por exemplo, o valor 4 aparece trs vezes no rol, o que permite calcular uma vez seu
desvio e multiplic-lo por trs agilizando o trabalho.

83

84

ESTATSTICA BSICA PARA TOMADA DE DECISO

Clculo do DMS para Populaes


Calculamos inicialmente o desvio de cada uma das medidas:
xi

fi

xi X fi

|2 5,5| . 1 = 3,5

|4 5,5| . 3 = 4,5

|5 5,5| . 1 = 0,5

|6 5,5| . 3 = 4,5

|9 5,5| . 2 = 9,0

10

= 22,0

Podemos calcular agora o desvio-mdio simples (DMS):

Clculo do Desvio-Padro para Populaes


Calculamos inicialmente a varincia de cada uma das medidas:

xi

fi

( xi X )2 fi

(2 5,5)2 . 1 = 3,52 . 1 = 12,3

(4 5,5)2 . 3 = 1,52 . 3 = 6,8

(5 5,5)2 . 1 = 0,52 . 1 = 0,3

(6 5,5)2 . 3 = 1,52 . 3 = 6,8

(9 5,5)2 . 2 = 3,52 . 2 = 24,5

10

= 50,7

MEDIDAS DE DISPERSO

Antes de calcularmos o desvio-padro, devemos calcular a varincia (2) da srie:

Agora, o clculo do desvio-padro ():

observe que os clculos dos dois tipos de desvios resultam em valores diferentes,
porm ambos podem ser usados para medir a disperso de uma srie em torno de
sua mdia;
o clculo do desvio-padro () necessita do clculo prvio da varincia (2);
o clculo da varincia (2), neste primeiro momento, s tem utilidade como passo
intermedirio para determinao do desvio-padro (), mas em tpicos avanados
de estatstica ter papel fundamental na anlise de dados;
as unidades dimensionais da mdia e dos desvios correspondem s dimenses originais dos dados, ou seja, se estivermos tratando com idades, o valor mdio ser
expresso, por exemplo, em anos, assim como qualquer um dos desvios. A dimenso
da varincia (2), no entanto, no ter significado prtico (anos2);
qualquer um dos tipos de desvios adotados acima (DMS ou ), apoiados pelo clculo
da amplitude (A), permitem uma avaliao segura de dados;
se estivermos trabalhando com uma nica populao o clculo do coeficiente de
variao (CV%) opcional;
a maior utilidade do coeficiente de variao (CV%) o de permitir uma comparao
entre duas populaes diferentes; e
as ideias desenvolvidas at o momento neste captulo so aplicveis a populaes e precisam de algumas adaptaes para o uso em amostras, conforme veremos a seguir.

85

86

ESTATSTICA BSICA PARA TOMADA DE DECISO

TRABALHANDO COM DESVIOS EM AMOSTRAS


O clculo dos desvios para amostras ligeiramente diferente do clculo utilizado
para populaes. Basicamente, ocorre uma alterao nos denominadores, que envolvem
o tamanho da populao (n) e da amostra (n-1). Algumas alteraes na nomenclatura
tambm so usuais, observe no quadro a seguir:

Clculo dos desvios em


POPULAES

Clculo dos desvios em


AMOSTRAS

Desvio-mdio simples

Desvio-mdio simples

Varincia e desvio-padro

Varincia e desvio-padro

Note que ao trabalharmos com amostras, comum denominarmos a varincia por


s e o desvio-padro por s, ambos derivados do termo ingls sample (amostra).
O fato de dividirmos por (n-1) na amostra, e no por n como na populao, deve-se
ao motivo de apenas (n-1) valores poderem ser associados a qualquer nmero, antes que
o ltimo valor possa ser determinado no clculo individual das varincias.
A prtica demonstra que a diviso por (n-1) faz o valor da varincia amostral (s2)
tender ao valor da varincia populacional (2); caso a varincia amostral fosse dividida
por n, o valor da varincia populacional ficaria subestimado.
2

MEDIDAS DE DISPERSO

Suponha que o exemplo da Corretora Alpha de 140 clientes que contrataram seguro
residencial seja uma amostra extrada do total de clientes de todos os tipos de seguro
comercializado pela corretora. Vamos avaliar esses clientes, de acordo com a faixa salarial
(em salrios mnimos) de cada um deles, calculando a renda mdia (Mdia) e as disperses
em relao mdia (Desvio-Mdio, Desvio-Padro e Coeficiente de Variao).
xi

fi

5 | 10

10

10 | 15

17

15 | 20

25

20 | 25

35

25 | 30

21

30 | 35

18

35 | 40

14

Total

140

Calculando a Mdia, o Desvio-Mdio e o Coeficiente


de Variao
Mdia:
Desvio-Mdio:
Coeficiente de Variao:

xi

fi

xi

xi fi

xi X

xi X fi

5 | 10

10

7,5

75

15,3571

153,571

10 | 15

17

12,5

212,5

10,3571

176,0707

15 | 20

25

17,5

437,5

5,3571

133,9275

20 | 25

35

22,5

787,5

0,3571

12,4985

25 | 30

21

27,5

577,5

4,6429

97,5009

30 | 35

18

32,5

585

9,6429

173,5722

35 | 40

14

37,5

525

14,6429

205,0006

Total

140

3.200

952,1414

87

88

ESTATSTICA BSICA PARA TOMADA DE DECISO

De acordo com os resultados, a mdia salarial da amostra de clientes da corretora


de 22,86 salrios mnimos, e o desvio-mdio em relao a esse valor 6,85 salrios
mnimos, o que representa uma disperso dos dados observados em relao mdia de
29,97%, de acordo com o coeficiente de variao.

Calculando a Varincia, o Desvio-Padro e o Coeficiente


de Variao
xi

fi

xi

xi fi

( xi X )2

( xi X )2 fi

5 | 10

10

7,5

75

235,8405

2.358,4052

10 | 15

17

12,5

212,5

107,2695

1.823,5818

15 | 20

25

17,5

437,5

28,69852

717,4630

20 | 25

35

22,5

787,5

0,12752

4,4632

25 | 30

21

27,5

577,5

21,55652

452,6869

30 | 35

18

32,5

585

92,98552

1.673,7394

35 | 40

14

37,5

525

214,4145

3.001,8033

Total

140

3.200

10.032,1429

Varincia:

Desvio-Padro:

De acordo com os resultados, a mdia salarial da amostra de clientes da corretora


de 22,86 salrios mnimos, o Desvio-Padro de 6,85 salrios mnimos, o que representa
uma disperso dos dados observados em relao mdia de 37,19%, de acordo com o
coeficiente de variao.

MEDIDAS DE DISPERSO

Usando o Excel para o Clculo do Desvio-Mdio


e do Desvio-Padro
No exemplo abaixo esto dispostos os Prmios Ganhos por 30 seguradoras no ano
de 2010 (dados da SUSEP), cuja mdia para a amostra de R$1.414.178.294,00.

Para calcular o Desvio-Mdio lembre-se que os dados devem estar dispostos numa
nica coluna. Escolha uma clula em branco e clique em inserir funo, ou no cone fx,
para abrir a janela funo. Selecione a Categoria Estatstica, e a funo Desv. Mdio.

89

90

ESTATSTICA BSICA PARA TOMADA DE DECISO

Selecionar e informar as clulas em que se encontram a srie de dados e clicar Ok.


O valor do Desvio-Mdio aparecer na clula inicialmente escolhida.

Neste exemplo, o Desvio-Mdio ser igual a R$765.674.746,15.

MEDIDAS DE DISPERSO

Como a Mdia R$1.414.178.294,00, temos que o Coeficiente de Variao


. Cabe ressaltar que o Excel no tem a funo Coeficiente de Variao.
Para o clculo da Varincia e do Desvio-Padro o procedimento o mesmo, apenas
escolha a funo DESVPAD:

Portanto, o valor do Desvio-Padro da Amostra R$990.167.556.

91

92

ESTATSTICA BSICA PARA TOMADA DE DECISO

De acordo com esses resultados, o Coeficiente de Variao ser:


,
ou seja, os prmios recebidos pelas 30 seguradoras apresentam uma disperso de cerca
de 70% em relao ao Prmio Mdio.

Usando a Ferramenta de Anlise de Dados Estatstica


Descritiva do Excel
Vrios dos clculos que realizamos pelo Excel foram baseados na incluso de uma
funo estatstica. No entanto, o Excel tem uma Ferramenta de Anlise, chamada
Estatstica Descritiva, que nos permite obter essas estatsticas, bem como outras que no
foram contempladas pelo livro.
Exemplo: Na tabela abaixo esto dispostas as 50 maiores seguradoras do Brasil,
classificadas pelo Lucro Lquido (FUNENSEG):

Fonte: FUNENSEG

MEDIDAS DE DISPERSO

Para calcular a Estatstica Descritiva dessa srie clique em Dados, e em seguida em


Anlise de Dados, lembrando que a srie deve estar disposta em uma nica coluna:

Ao abrir a janela Anlise de Dados, escolha a Ferramenta de Anlise Estatstica


Descritiva:

93

94

ESTATSTICA BSICA PARA TOMADA DE DECISO

Em seguida informe: o Intervalo de Entrada, que corresponde s clulas em que se


encontram os valores da srie, o intervalo de sada, que representa a clula a partir da
qual os resultados sero dispostos, clique em resumo estatstico, e OK.

Os resultados sero os seguintes:

Perceba que quase todos os resultados constantes da Ferramenta de Anlise Estatstica


Descritiva foram abordados ao longo do livro, basta agora fazer as devidas anlises.

MEDIDAS DE DISPERSO

7,0
3,0
8,0

8,0
9,0
8,0

8,0
8,0
9,0

5,0
8,0
6,0

6,0
6,0
7,0

8,0
4,0
10,0

7,0
6,0
10,0

6,0
5,0
5,0

7,0
2,0
8,0

7,0
10,0
8,0

a) Calcule o desvio-mdio.
b) Calcule o coeficiente de variao.
c) Calcule o desvio-padro.
d) Calcule o coeficiente de variao.
2) A tabela abaixo indica o tamanho do estabelecimento por nmero de funcionrios, em 31 de dezembro de 2011, no setor
de atividades auxiliares dos servios financeiros, seguros,
previdncia complementar, planos de sade e de resseguros
no municpio de So Paulo, de acordo com o tamanho do
estabelecimento:
Tamanho do
Estabelecimento
por nmero
de funcionrios
registrados (Xi)

Nmero de
Estabelecimentos
(fi)

De 1 a 4

3.011

De 5 a 9

2.480

De 10 a 19

3.228

De 20 a 49

5.906

De 50 a 99

6.217

De 100 a 249

9.271

De 250 a 499

11.070

De 500 a 999

7.102

Total

48.285

a) Calcule o desvio-mdio.
b) Calcule o coeficiente de variao.
c) Calcule o desvio-padro.
d) Calcule o coeficiente de variao.

Ex
xe
e rr c
c c
c ii o
os
s
E

1) Os dados a seguir representam as notas dadas em uma


pesquisa de satisfao geral de um restaurante:

95

ESTATSTICA BSICA PARA TOMADA DE DECISO

Exerccios

96

Exerccios Complementares
As tabelas a seguir indicam os vnculos empregatcios ativos
em 31 de dezembro de 2011, no setor de atividades auxiliares
dos servios financeiros, seguros, previdncia complementar,
planos de sade e de resseguros no municpio de So Paulo.
1) De acordo com a remunerao em salrios mnimos:
Remunerao em
Salrio Mnimo
(Xi)

Nmero de Funcionrios
Registrados (fi)

At 0,50

11

0,51 a 1,00

274

1,01 a 1,50

3.964

1,51 a 2,00

5.265

2,01 a 3,00

8.617

3,01 a 4,00

6.009

4,01 a 5,00

3.983

5,01 a 7,00

5.372

7,01 a 10,00

4.800

10,01 a 15,00

4.076

15,01 a 20,00

2.052

Total

44.423

Fonte: RAIS Relao Anual de Informaes Sociais

Pede-se:
a) Complete a tabela de distribuio de frequncia com a fr (%),
F e Fr (%).
b) Calcule a mdia e analise o resultado.
c) Calcule a moda e analise o resultado.
d) Calcule a Mediana e analise o resultado.
e) Calcule o 1o e o 3o quartil e analise os resultados.
f) Calcule o 3o e o 7o Decil e analise os resultados.
g) Calcule o Coeficiente de Variao a partir do Desvio-Mdio.
h) Calcule o Coeficiente de Variao a partir do Desvio-Padro.
i) Calcule o 33o e o 67o centil e analise os resultados.
j) Calcule o Coeficiente de Variao a partir do Desvio-Mdio.
h) Calcule o Coeficiente de Variao a partir do Desvio-Padro.
i) Analise os resultados.

MEDIDAS DE DISPERSO

Faixa Etria
(Xi)
10 a 14
15 a 17
18 a 24
25 a 29
30 a 39
40 a 49
50 a 64
Total

Nmero de Funcionrios
Registrados (fi)
1
293
8.871
11.212
16.966
7.710
3.050
48.103

Fonte: RAIS Relao Anual de Informaes Sociais

Pede-se:
a) Complete a tabela de distribuio de frequncia com a fr (%),
F e Fr (%).
b) Calcule a mdia e analise o resultado.
c) Calcule a moda e analise o resultado.
d) Calcule a Mediana e analise o resultado;
e) Calcule o 1o e o 3o quartil e analise os resultados.
f) Calcule o 3o e o 7o Decil e analise os resultados.
g) Calcule o Coeficiente de Variao a partir do Desvio-Mdio.
h) Calcule o Coeficiente de Variao a partir do Desvio-Padro.
i) Calcule o 33o e o 67o centil e analise os resultados.
j) Calcule o Coeficiente de Variao a partir do Desvio-Mdio.
h) Calcule o Coeficiente de Variao a partir do Desvio-Padro.
i) Analise os resultados.
3) De acordo com o grau de escolaridade
Grau de Instruo
(Xi)
Analfabeto
At 5a incompleto
5a completo
a
6 a 9a fundamental
Fundamental completo
Mdio incompleto
Mdio completo
Superior incompleto
Superior completo
Mestrado
Doutorado
Total

Nmero de Funcionrios
(fi)
1
75
132
241
655
1.173
14.668
8.871
22.119
289
61
48.285

Fonte: RAIS Relao Anual de Informaes Sociais

a) Complete a tabela de distribuio de frequncias.


b) Analise os resultados.

Ex
xe
e rr c
c c
c ii o
os
s
E

2) De acordo com a faixa etria:

97

98

ESTATSTICA BSICA PARA TOMADA DE DECISO

FORMULRIO RESUMO
1) Mdia Aritmtica
a) Dados Brutos (No Agrupados)


b) Dados Agrupados em Tabelas de Frequncia Variveis Discretas

c) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas

neste caso xi = ponto mdio do intervalo da classe i.

2) Mdia aritmtica
3) Mediana
a) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas

Onde:
l md Limite inferior da classe onde se encontra o valor mediano;
EMd Elemento mediano;
Fant Frequncia acumulada da classe anterior classe onde se encontra o valor mediano;
f Md Frequncia simples da classe onde se encontra o valor mediano; e
h Amplitude do intervalo onde se encontra o valor mediano.
4) Moda
a) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas
Moda de King:



Onde:
Mo o valor modal;
lmo o limite inferior da classe em que se encontra o valor modal;
fpost frequncia simples da classe posterior quela em que se encontra o valor modal;
fant o limite inferior da classe anterior quela em que se encontra o valor modal; e
h a amplitude da classe em que se encontra o valor modal.

MEDIDAS DE DISPERSO

5) Amplitude total

At = xmx xmn, onde: xmx maior valor de xi e xmn menor valor de xi

6) Desvio-mdio simples (DMS)


a) Dados Brutos (No Agrupados)


b) Dados Agrupados em Tabelas de Frequncia Variveis Discretas

c) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas

neste caso xi = ponto mdio do intervalo da classe i.

7) Varincia clculo para populao


a) Dados Brutos (No Agrupados)


b) Dados Agrupados em Tabelas de Frequncia Variveis Discretas

c) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas




neste caso xi = ponto mdio do intervalo da classe i.

99

100

ESTATSTICA BSICA PARA TOMADA DE DECISO

8) Varincia clculo para amostra


a) Dados Brutos (No Agrupados)

b) Dados Agrupados em Tabelas de Frequncia Variveis Discretas

c) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas

neste caso xi = ponto mdio do intervalo da classe i.

9) Desvio-padro clculo da populao


onde: s2 (x) = varincia da populao.

10) Desvio-padro clculo para amostra


onde: s2 (x) = varincia da amostra.

11) Coeficiente de variao clculo para populao



12) Coeficiente de variao clculo para amostra

13) Varincia relativa clculo para populao