Você está na página 1de 143

ALUNO (A): -------------------------------------------------------------------------------------

PROFESSOR (A): ----------------------------------------------------------------------------










CURSO DE QUALIFICAO
PROFISSIONAL
ECONOMETRIA


GOVERNO DO ESTADO DO GOVERNO DO ESTADO DO GOVERNO DO ESTADO DO GOVERNO DO ESTADO DO
AMAZONAS AMAZONAS AMAZONAS AMAZONAS
CETAM
Centro de Educao Tecnolgica do
Amazonas
SEPLAN
Secretaria de Estado de Planejamento e
Desenvolvimento Econmico














APOSTILA DE ECONOMETRIA
















PROF. Geraldo Lopes de Souza Jnior


2





NDICE


1 - INTRODUO A ESTATSTICA ................................................................................................................ 3
1.1 - UM POUCO DE HISTRIA................................................................................................................... 3
1.2 - O QUE ESTATSTICA?....................................................................................................................... 4
1.3 - POR QUE ESTUDAR ESTATSTICA? ................................................................................................... 4
1.4 - QUANDO E COMO SE DEVE USAR A ESTATSTICA? ....................................................................... 5
1.5 - SOFTWARES ESTATSTICOS................................................................................................................ 6
1.6 - ALGUNS CONCEITOS FUNDAMENTAIS ............................................................................................ 7
2 - ORGANIZAO, RESUMO E APRESENTAO DE DADOS ESTATSTICOS ................................ 8
2.1 - TIPOS DE DADOS ................................................................................................................................. 8
2.2 - DISTRIBUIES DE FREQNCIA.................................................................................................... 9
2.3 - MEDIDAS ............................................................................................................................................. 22
2.4 - ASSIMETRIA DAS DISTRIBUIES................................................................................................... 38
2.5 - DIAGRAMA EM CAIXAS...................................................................................................................... 43
3 - ANLISE BIDIMENSIONAL...................................................................................................................... 50
3.1 - ANLISE BIDIMENSIONAL DE VARIVEIS QUALITATIVAS .......................................................... 51
3.2 - ANLISE BIDIMENSIONAL DE VARIVEIS QUANTITATIVAS........................................................ 56
4 - ANLISE DE SRIES TEMPORAIS ......................................................................................................... 81
4.1 - MODELO CLSSICO DAS SRIES TEMPORAIS............................................................................... 83
4.2 - OBTENO DA TENDNCIA............................................................................................................. 86
4.3 - OBTENO DAS VARIAES SAZONAIS......................................................................................... 95
4.4 - OBTENO DE VARIAES CCLICAS E IRREGULARES ............................................................. 99
4.5 - RECOMPOSIO.............................................................................................................................. 104
5 - NMEROS NDICES.................................................................................................................................. 112
5.1 - NMEROS NDICES SIMPLES ......................................................................................................... 112
5.2 - NMEROS NDICES COMPOSTOS.................................................................................................. 115
5.3 - MUDANA DE BASE DE UM NMERO NDICE............................................................................ 119
5.5 - NDICES BRASILEIROS E INTERNACIONAIS................................................................................. 122
REFERNCIAS ................................................................................................................................................ 141

3


1 - INTRODUO A ESTATSTICA



Geralmente, quando comeamos a lecionar um curso de estatstica direcionado
para no estatsticos, somos indagados por questes muito pertinentes. Como
exemplo podemos citar:

O que estatstica?
Por que estudar estatstica?
O que a estatstica tem haver com a formao profissional que estou
almejando?
Quando se deve usar a estatstica?
Como se deve usar a estatstica?

Na pretenso de responder essas e muitas outras perguntas, produzimos este
material buscando uma linguagem acessvel e atraente.

1.1 - UM POUCO DE HISTRIA

Em uma pesquisa feita por um grande matemtico e estatstico de nossos dias,
Gauss Cordeiro, encontramos indcios estatsticos desde muito tempo antes de
Cristo. Por exemplo, em 5000 a.C. j existiam registros egpcios de presos de
guerra, em 3000 a.C. os jogos de dados, em 2000 a.C. temos o Censo Chins, em
1500 a.C. dados de mortos em guerras no Velho Testamento, em 1100 a.C. j
existiam registros de dados em livros da Dinastia Chinesa, em 400 a.C. possvel
encontrarmos uma descrio detalhada de coleta de dados em livros de
Constantinopla e em aproximadamente 100 a.C. Horcio usa um baco de fichas
como instrumento de clculo porttil.

Para algum j familiarizado com o curso de Administrao Pblica, esses
dados podem ser vistos como indcios de relatrios gerenciais primitivos e no
estatstica propriamente dita. O leitor que afirma isso est parcialmente correto. Aqui
ficam ntidas as razes comuns entre a estatstica e a administrao.

4


Contudo, as interseces no se do apenas antes de Cristo. Muito pelo
contrrio, aps Cristo os pontos em comuns se do de forma mais consistentes e
constantes. Temos em 400 d.C. o desenvolvimento da teoria dos nmeros, em 695
d.C. a utilizao da mdia ponderada pelos rabes na contagem de moedas, em
1303 d.C. a origem dos nmeros combinatrios (Shihchieh Chu), em 1707 d.C.
Nmeros ndices (Fleetwood), em 1710 d.C. a primeira publicao de um Teste de
Significncia (John Arbuthnot), em 1892 d.C. determinao do Coeficiente de
Correlao (Edgeworth) e em 1915 d.C. a frmula do Lote Econmico (Harris).


1.2 - O QUE ESTATSTICA?

A fim de conceituar a estatstica, podemos dizer que ela uma reunio de
mtodos quantitativos que serve para estudar e medir os fenmenos acerca de uma
populao. Ou, um ramo da matemtica que trata da coleta, da anlise, da
interpretao e da apresentao de massas de dados numricos.

Etimologicamente, criada por Schmeitzel (1785) a partir do latim status
(estado), statisticum.

Sendo usada originalmente na Idade Antiga para levantamentos de dados no
intuito de auxiliar o estado na tomada de decises.


1.3 - POR QUE ESTUDAR ESTATSTICA?

Queremos chamar a ateno do estudante para dois objetivos relevantes. O
primeiro, mais geral, fazer com que o estudante possa distinguir entre problemas
onde a estatstica pode ser aplicada e problemas onde ela no se aplica. O segundo
que inclui a capacidade de reconhecer qual tcnica se aplica determinada
situao e de utiliz-la da melhor forma possvel na resoluo do problema.

Agora, responder a pergunta Por que estudar estatstica? uma tarefa para o
leitor. Esta pergunta deve ser feita no s para a disciplina de estatstica, mas para
5


todas as outras disciplinas. Desta forma ser possvel fazer um link entre as
disciplinas estudadas em Cincias Contbeis e perceber a relevncia da estatstica
para o curso. Contudo, podemos evidenciar o seguinte:

O detentor de conhecimentos estatsticos pode ter uma viso mais crtica
das informaes expostas pela imprensa e das experincias do cotidiano
que oferecem inmeras interpretaes;
O raciocnio estatstico est amplamente difundido e muito utilizado na
administrao pblica e privada. Assim, possvel que, no futuro, um
empregador venha a contratar ou promover um profissional por causa de
seus conhecimentos estatsticos;
Os administradores precisam do conhecimento da estatstica para tomar
algumas de suas decises e para evitar serem ludibriados por certos
resultados errneos ou viciados;
Muitos peridicos e revistas de administrao pblica e reas afins trazem
referncias freqentes a estudos estatsticos;

Esperamos que estas razes possam dar uma idia do que o estudante de
Administrao Pblica pode esperar do seu estudo de estatstica.


1.4 - QUANDO E COMO SE DEVE USAR A ESTATSTICA?

Hoje, muito comum ouvir algo do tipo: As estatsticas mostram um
crescimento econmico no ltimo semestre, Segundo as estatsticas do ministrio
da agricultura, o cultivo de macaxeira e aa o responsvel pelo decrescimento em
dois pontos percentuais do desemprego no interior do Amazonas, O ndice
pluviomtrico do rio Negro vem subindo a uma taxa de oito centmetros por dia, A
taxa de criminalidade juvenil diminuiu em 60% no ltimo ano de governo de Eduardo
Braga, Houve um aumento de 120% na procura por educao nos ensinos
fundamental e mdio, afirma a SEMED. Esses tipos de frases do nosso cotidiano
so resultados de uma parte da estatstica que utiliza nmeros para descrever fatos,
chamada apropriadamente de Estatstica Descritiva. Podemos afirmar que a
estatstica descritiva responsvel pela organizao, resumo, simplificao,
interpretao e apresentao de informaes um pouco mais complexas.
6


Outra parte da estatstica, muito interessante, est relacionada com a teoria de
probabilidade. Usamos a probabilidade para resolver questes que envolvem o
acaso. Introdutoriamente podemos citar jogos de azar, resultados de partidas de
futebol e resultados de lanamentos de moedas. Mais especificadamente, a
aceitao de determinada abordagem em uma populao em estudo, a deciso de
investir na compra de determinadas aes, a deciso de contratar funcionrios para
empresa, todas utilizam a probabilidade consciente ou inconscientemente.

A probabilidade nos d indicativos, no certezas. Em uma de minhas leituras
encontrei um caso curioso. Um aluno pergunta ao professor: Se a probabilidade a
cincia do acaso, como fao para ganhar na loteria?, assim o professor, como
tantos outros conhecedores de estatstica respondeu: Se eu soubesse, no estaria
aqui dando aulas!.

Por fim, temos um terceiro ramo da estatstica que est interessado na anlise
e interpretao de dados amostrais: a inferncia. Basicamente a amostragem aborda
uma frao, o mais fidedigna possvel, de determinada populao e utiliza as
informaes extradas deste pequeno grupo para fazer inferncia sobre a populao
toda. A amostragem est presente no nosso dia a dia e podemos perceb-la atravs
de certos procedimentos. Como exemplos, temos: assistir por alguns instantes
determinado programa da TV para avaliar se vale a pena continuar assistindo; comer
um pedacinho do bolo para ver se o bolo est bom; consultar apenas alguns alunos
da classe para determinar o que a maioria pensa a respeito de determinado assunto.
Deve ficar claro ao estudante de estatstica que essas trs reas no so
separadas ou distintas. Muito pelo contrrio, elas tendem a se correlacionar.
Descrever e resumir dados corresponde primeira fase de uma anlise estatstica.
preciso ressaltar que os fundamentos de amostragem se baseiam na teoria de
probabilidade.


1.5 - SOFTWARES ESTATSTICOS

comum ouvir dos alunos frases do tipo Estatstica no. No gosto de fazer
clculos!. Hoje um curso de estatstica para Administrao Pblica exige
7


inicialmente do aluno um conhecimento bsico de matemtica (nada sofisticado) e
certa familiaridade com o Windows ou Linux, editores de texto e planilhas.

Os pacotes estatsticos mais usuais como o Minitab, SPSS e R, importam
dados do Excel e/ou bloco de notas do Windows. Com eles possvel ter anlises
estatsticas (resumos, grficos e tabelas) em curto espao de tempo dando um ou
dois cliques. Chamaremos a ateno para um pacote estatstico em particular, o
Scientific Annalsys Ststistical - SAS. O SAS talvez seja, hoje, o pacote mais
completo e eficiente disponvel no mercado.


1.6 - ALGUNS CONCEITOS FUNDAMENTAIS

Aqui deve comear de fato a familiarizao com a linguagem estatstica. Os
conceitos ora apresentados so de grande importncia para o curso e sero
constantemente usados no decorrer do curso de estatstica.

Populao: coleo de elementos (pessoas, objetos, animais, itens) que
so inerentes ao estudo de um fenmeno coletivo possuindo alguma
caracterstica em comum;
Amostra: frao ou subconjunto da populao;
Parmetro: caracterstica numrica estabelecida para toda a populao;
Estimador: caracterstica numrica estabelecida para uma amostra;
Varivel: caracterstica no numrica de uma populao ou amostra;
Censo: uma avaliao direta de um parmetro, utilizando todos os
componentes da populao;
Estimao: uma avaliao indireta de um parmetro, como base em um
estimador;
Dados brutos: uma seqncia de valores numricos no organizados,
obtidos diretamente da observao de um fenmeno coletivo;
Rol: uma seqncia ordenada, de forma crescente ou decrescente, dos
dados brutos.


8


2 - ORGANIZAO, RESUMO E APRESENTAO DE DADOS
ESTATSTICOS



2.1 - TIPOS DE DADOS

Podemos classificar as variveis e os dados em estudo basicamente em dois
grupos: Quantitativos (discretos ou contnuos) e Qualitativos (nominais ou ordinais).


2.1.1 - Dados quantitativos


Os dados quantitativos envolvem variveis que so inerentemente numricas.
Esse tipo de varivel pode ser dividido em variveis quantitativas discretas ou
variveis quantitativas continuas. Uma varivel quantitativa discreta s pode assumir
determinados valores, em geral inteiros. Os dados discretos originam-se da
contagem de itens ou elementos com determinada caracterstica. Como exemplos: o
nmero de aes de uma empresa; o nmero de alunos numa sala de aula; a
quantidade de acidentes numa fbrica; etc. As variveis que podem assumir
virtualmente qualquer valor num intervalo de valores so chamadas contnuas.
Caractersticas como idade, altura, peso, renda, tempo necessrio pra realizar
determinada tarefa, enquadram-se nesta categoria. Os dados referentes a essas
caractersticas e similares dizem-se contnuos, embora na prtica os instrumentos de
mensurao tenham limitaes fsicas que lhes restringem o grau de preciso.


2.1.2 - Dados qualitativos

Os dados qualitativos envolvem variveis que no so inerentemente
numricas, contudo as variveis qualitativas devem ser convertidas em valores
numricos antes de serem processadas estatisticamente. Esse tipo de varivel pode
ser dividido em variveis qualitativas nominais ou variveis qualitativas ordinais. As
variveis qualitativas nominais envolvem categorias tais como sexo (masculino ou
feminino), curso de estudo (Cincias Contbeis, Servio Social, Administrao,
Filosofia, Pedagogia), desempenho (excelente, bom, regular, ruim), etc. Os dados
9


nominais surgem quando se definem categorias ou classes e se conta o nmero de
observaes pertencentes a cada categoria. Os dados ordinais consistem de valores
atribudos para denotar ordem: primeiro, segundo, terceiro, quarto, etc.

Para cada tipo de varivel existem tcnicas diferentes para resumir as
informaes. Contudo, poderemos observar que as tcnicas usadas num caso
podem ser usadas para outros.Faz-se necessrio evidenciar que em algumas
situaes possvel atribuir valores numricos s vrias qualidades ou atributos de
uma varivel qualitativa e depois analisar os dados como se esses fossem
quantitativos. Mas isto s poder ser feito se o procedimento for passvel de
interpretao.Existe um tipo de varivel qualitativa para a qual essa quantificao
muito til: a chamada varivel dicotmica. Para essa varivel s podem ocorrer duas
realizaes, usualmente chamadas sucesso e fracasso. A varivel sexo um bom
exemplo disso.

Organograma para o tipo de variveis e dados

2.2 - DISTRIBUIES DE FREQNCIA


Podemos afirmar que uma distribuio de freqncia um mtodo de
agrupamento de dados em classes, possibilitando determinar o nmero ou
percentual de elementos em cada uma destas classes. Assim, quando estamos
trabalhando com um grande conjunto de dados, poderemos visualiz-lo sem precisar
levar em conta os nmeros individuais. Uma distribuio de freqncia pode ser
apresentada sob a forma de uma tabela ou de um grfico.
Estudaremos agora como apresentar um resumo dos dados atravs de tabelas.
Para fins ilustrativos, faremos uso das informaes dispostas no Quadro 2.1.
10


Quadro 2.1: Informaes sobre sexo, idade (medida em anos), altura (medida em
metros), peso (medido em quilogramas), estado civil, renda (medida em reais), zona
da cidade em que mora, naturalidade (somente o estado de nascimento), time que
torce e pretenso salarial ao se formar (medida em reais) de 45 alunos do curso de
econometria do CETAM, Manaus 09/2010.
Gnero
Idade
(anos)
Altura
(m)
Peso
(kg)
Estado
civil
Renda
individual
(R$)
Zona
residencial
Naturalidade
(estado)
Time
Pret. Sal.
ao se
formar
Tipo
Sanguneo
F 33 1,54 51 solt 1.000,00 oeste amazonas Brasil 5.000,00 O +
M 21 1,70 56 solt 800,00 centro-oeste piaui Corinthias 13.500,00 O +
F 19 1,62 48 solt leste par Flamengo 5.000,00 A +
M 27 1,73 74 solt 1.200,00 oeste amazonas So paulo 4.500,00 A -
M 25 1,75 72 solt 880,00 centro-oeste amazonas Vasco 5.000,00 O +
M 19 1,73 70 solt 600,00 oeste amazonas Grmio 3.000,00 A
F 19 1,60 51 solt 800,00 centro-oeste amazonas - 50.000,00 -
M 20 1,88 87 solt 800,00 centro-oeste amazonas Corinthias 3.000,00 O +
M 32 1,73 64 solt 1.200,00 leste amazonas - 5.000,00 O +
M 25 1,65 61 solt 350,00 sul amazonas Flamengo 5.000,00 A +
F 36 1,65 76 solt 1.800,00 sul amazonas - 5.000,00 A +
F 32 1,70 90 cas 1.100,00 - amazonas Corinthias 3.500,00 O +
F 22 1,65 58 solt oeste amazonas Flamengo 4.000,00 O +
M 21 1,73 75 solt 600,00 centro-oeste amazonas Flamengo 7.000,00 A +
F 24 1,60 53 cas 1.100,00 oeste amazonas Flamengo 5.000,00 O +
F 19 1,60 60 solt 400,00 centro-oeste amazonas Palmeiras 1.500,00 O +
F 34 1,63 50 solt 490,00 oeste amazonas Nenhum 25.000,00 -
F 54 1,68 75 solt 940,00 sul amazonas Nenhum 15.000,00 A +
M 38 1,72 99,8 cas 1.200,00 centro-oeste amazonas Vasco 2.000,00 O +
F 22 1,55 58 solt 700,00 norte amazonas Vasco 3.000,00 A+
F 24 1,54 46 solt 800,00 oeste amazonas Palmeiras 3.500,00 A +
M 33 1,75 75 cas 500,00 oeste amazonas Fluminense 2.500,00 O +
F 31 1,60 57 solt 1.200,00 oeste amazonas Vasco 4.000,00 A -
F 20 1,47 42 solt 420,00 centro-sul amazonas Vasco 10.000,00 O +
M 43 1,62 64 cas 1.500,00 oeste amazonas Vasco 6.000,00 AB +
F 26 1,62 60 cas 300,00 oeste amazonas Nenhum 2.000,00 O +
F 54 1,30 54 divorc. 3.200,00 norte amazonas Flamengo 2.400,00 A +
F 44 1,57 68 divorc. 2.000,00 centro-oeste paraba Flamengo 5.000,00 A +
F 45 1,68 73 cas 1.200,00 sul amazonas Flamengo 1.800,00 B +
F 37 1,51 56 cas 1.000,00 centro-oeste amazonas Palmeiras 4.000,00 A +
F 31 1,58 56 cas 700,00 leste amazonas Nenhum - A +
F 21 1,60 58 solt 600,00 oeste amazonas Palmeiras 20.000,00 A +
M 43 1,70 66 cas 3.000,00 oeste amazonas Vasco 8.000,00 O +
M 21 1,83 74 solt 350,00 sul amazonas Vasco 4.000,00 -
F 18 1,55 55 solt 450,00 oeste amazonas Nenhum 2.000,00 O +
M 25 1,82 71 solt 650,00 norte goias Corinthias 3.500,00 O +
M 36 1,73 100 cas 1.800,00 - amazonas Flamengo - O +
F 34 1,60 47 solt 1.500,00 norte amazonas Vasco 3.000,00 A+
F 57 1,56 95 cas 3.500,00 - amazonas Brasil 25.000,00 A +
F 40 1,51 50 solt 2.900,00 oeste amazonas So paulo 6.000,00 O +
F 19 1,62 62 solt 360,00 sul amazonas Flamengo 6.000,00 O +
F 36 1,55 50 cas 1.500,00 oeste amazonas Flamengo 7.000,00 O +
F 34 1,58 60 cas 636,00 leste roraima Brasil 20.000,00 O +
F 25 1,58 52 solt 660,00 norte amazonas Flamengo 2.500,00 B +
F 23 1,60 53 solt 600,00 oeste amazonas Flamengo 8.000,00 A +

FONTE: PESQUISA DE CAMPO
11



2.2.1 - Elaborao de tabelas

Alguns rigores so exigidos na construo de tabelas:

necessrio saber previamente com que tipo de varivel se deseja
trabalhar (quantitativa ou qualitativa);
necessrio definir quantas e quais classes devero ser utilizadas
de acordo com um objetivo pr-determinado;
Se a varivel for quantitativa, necessrio determinar a amplitude
das classes (quando for conveniente);
Toda tabela deve ter significado prprio, dispensando consultas ao
texto;
Toda tabela deve apresentar um ttulo;
Toda tabela deve informar a fonte dos dados e o texto que contem tal
informao deve ser apresentado em tamanho inferior aos demais textos
da tabela e deve estar em caixa alta;
Nunca se fecha uma tabela nas laterais, esse procedimento objetiva
permitir a entrada ou retiradas de informaes;
A tabela deve ser colocada em posio vertical, para facilitar a leitura
dos dados. No caso em que isso seja impossvel, deve ser colocada em
posio horizontal, com o ttulo voltado para a margem esquerda da folha;
Se a tabela ou quadro no couber em uma pgina, deve ser
continuado na pgina seguinte. Neste caso o final no ser delimitado por
trao horizontal na parte inferior e o cabealho ser repetido na pgina
seguinte;
No devem ser apresentadas tabelas nas quais a maior parte das
classes indiquem inexistncia do fenmeno.

Para exemplificarmos, tomaremos as variveis sexo (qualitativa nominal) e
idade (quantitativa contnua). Assim poderemos resumir o conjunto de informaes
acerca dessas variveis disposto no Quadro 2.1 em tabelas que nos daro idia do
todo.

12



Tabela 2.1: Freqncias e porcentagens dos 45 alunos do curso de econometria do
CETAM segundo o sexo setembro de 2010.
Sexo Freqncia simples Freqncia relativa (%)
Masculino 15 33,33
Feminino 30 66,67
Total 45 100,0

FONTE: DADOS HIPOTTICOS.

Tabela 2.2: Freqncias e porcentagens dos 45 alunos do curso de econometria do
CETAM segundo a idade setembro de 2010.
Idade
Freqncia
simples
Freqncia
relativa (%)
Freqncia
acumulada
Freqncia
acumulada relativa
(%)
18 24 15 33,33 15 33,33
24 30 08 17,78 23 51,11
30 40 14 31,11 37 82,22
40 50 05 11,11 42 93,33
50 60 03 06,67 45 100,0
Total 45 100,0

FONTE: DADOS HIPOTTICOS.

Quando estudamos a varivel sexo s temos duas alternativas possveis. Cada
indivduo da populao em estudo ou do sexo masculino ou do sexo feminino.
Podemos considerar cada uma dessas possibilidades como uma categoria, ou
ainda, uma classe. Sendo assim, a Tabela 2.1 se apresenta com duas classes:
masculino e feminino. Observamos que 30 alunos do total de 45 so do sexo
feminino e que este grupo representa 66,67% do total. Encontramos o nmero 30
como freqncia simples da segunda classe contando o nmero de pessoas que
afirmaram ser do sexo feminino. O valor 66,67% obtido quando dividimos a
quantidade de pessoas do sexo feminino pelo total de pessoas e em seguida
multiplicando esse resultado por cem. Assim, podemos concluir que o percentual
atribudo a cada classe dado pela freqncia relativa vezes cem. A equao da
freqncia relativa dada por:

13




Para as variveis quantitativas podemos proceder de duas formas. A primeira
repetir o processo usado na construo da tabela 2.1, ou seja, identificar todas as
classes (alternativas possveis) e verificar a freqncia associada a cada uma
dessas classes. Esse processo pode ser invivel se a varivel em estudo possuir um
nmero muito grande de possibilidades de respostas e/ou a populao em estudo
for muito numerosa. Para solucionar este problema apresentamos um outro
procedimento. Reuni-se em uma nica classe vrias possibilidades de respostas. Se
a varivel em estudo a idade, ento podemos reunir em uma nica classe todas as
idades no intervalo de 18 a 24 anos, por exemplo.

A tabela 2.2 apresenta a varivel idade dividida em cinco classes. A primeira
classe tem como limite inferior o nmero 18 e como limite superior o nmero 24. O
sinal apresentado entre esses nmeros nos da idia do tipo de intervalo usado.
Neste caso, dizemos que o intervalo da primeira classe fechado em 18 e aberto
em 24, ou seja, a primeira classe envolve todas as idades iguais ou maiores que 18
anos e menores que 24. Note que no entrar nesta classe uma observao igual a
24. L-se a classe 18 24 da seguinte forma: de 18 anos inclusive at 24 anos
exclusive. possvel termos classes dos tipos 1824 (de 18 anos exclusive at 24
anos inclusive) ou 1824 (de 18 anos inclusive at 24 anos inclusive).

A diferena entre o maior valor observado e o menor valor observado
chamado de amplitude total, geralmente representado por A
t
. A diferena entre o
limite superior e o limite inferior de cada classe recebe o nome de amplitude de
classe, geralmente representado por h. possvel encontrar na literatura autores
que definam equaes para determinar o nmero de classes e a amplitude que cada
classe deve ter. Por exemplo, para determinar o nmero K de classes: ou K
= 1 + 3,33 log n . Em que o n o nmero total de observaes. Feito isso ser
possvel determinar a amplitude da classe atravs da equao:

necessrio atentar para o fato de que quando temos muitas observaes
esses caminhos se tornam inviveis por determinarem um nmero muito grande de
classes. Observe ainda que procedendo desta maneira todas as classes tero a
14


mesma amplitude, o que pode contrariar o objetivo do estudo. Por exemplo, se o
interesse verificar a quantidade de crianas, adolescentes, jovens, adultos e
idosos de uma populao composta de 900 pessoas, usando a varivel idade, onde
a menor idade observada 1 ano e a maior 81 anos. Usando as equaes acima,
teramos entre 24 a 30 classes e cada classe possuiria uma amplitude igual a 3 ou 4.
Isso geraria uma tabela muito carregada e possivelmente no explicitaria o objetivo
do estudo.

A melhor maneira de determinar o nmero de classes e a amplitude de cada
classe usar o bom senso. Ainda com o objetivo de verificar a quantidade de
crianas, adolescentes, jovens, adultos e idosos de uma populao, usando a
varivel idade, podemos dividi-la em apenas cinco classes de amplitudes diferente e
atender de forma bastante satisfatria o objetivo do estudo, por exemplo: 0 12,
12 18, 18 24, 24 65, 65 120.

Podemos ter como interesse resumir simultaneamente os dados de duas
variveis. Neste caso usamos tabelas de dupla entrada (ou tabelas de contingncia),
onde devero aparecer as freqncias simples e/ou as freqncias relativas que
pertencem simultaneamente a classes de uma e outra varivel. Quando
consideramos duas variveis podemos ter trs situaes:

As duas variveis so qualitativas;
As duas variveis so quantitativas;
Uma varivel qualitativa e a outra quantitativa.

A seguir discutiremos acerca de uma tabela de dupla entrada para uma varivel
quantitativa versus uma varivel quantitativa. Para tanto, usaremos as variveis
usadas para construir as tabelas 2.1 e 2.2 (sexo e idade).

Deve ficar claro que um dos principais objetivos de se construir uma
distribuio conjunta (uma tabela de dupla entrada, por exemplo) de duas variveis
medir o grau de dependncia entre elas, de modo que possamos prever o melhor
resultado de uma delas quando conhecemos a realizao da outra.

15


Construiremos uma tabela de dupla entrada a fim de verificar se existe ou no
associao entre as variveis sexo e idade usando as observaes dispostas no
quadro 2.1.

Tabela 2.3: Distribuio conjunta das variveis sexo e idade dos alunos do curso de
econometria do CETAM setembro de 2010.
Sexo
Idade (anos)
Feminino Masculino
Total
18 24 10 5 15
24 30 4 4 8
30 40 10 4 14
40 50 3 2 5
50 60 3 0 3
Total 30 15 45

FONTE: DADOS HIPOTTICOS.

Esse tipo de tabela nos trs boas informaes. Podemos observar, por
exemplo, que existem dez alunos do sexo feminino com idade entre 30 (inclusive) e
40 anos (exclusive). Observamos ainda que, independente da idade, existem 30
alunos do sexo feminino e 15 do sexo masculino.

Perceba que os totais marginais para a varivel sexo so iguais s freqncias
simples dispostas na tabela 2.1 e que os totais marginais para a varivel idade so
iguais s freqncias simples dispostas na tabela 2.2.

Esta forma de apresentao, atravs de freqncia simples, pode dificultar o
entendimento uma vez que no temos uma idia clara de cada informao em
relao ao todo. Para tanto poderamos ter essas informaes expressas em termos
percentuais.

Tabela 2.4: Distribuio conjunta das propores das variveis sexo e idade dos
alunos do curso de econometria do CETAM setembro de 2010.
Sexo
Idade (anos)
Feminino Masculino
Total
18 24 22,22 % 11,11 % 33,33 %
24 30 08,89 % 08,89 % 17,78 %
30 40 22,22 % 08,89 % 31,11 %
40 50 06,67 % 04,44 % 11,11 %
50 60 06,67 % 00,00 % 06,67 %
Total 66,67 % 33,33 % 100,00 %

FONTE: DADOS HIPOTTICOS.

16


Observe que no existem alunos do sexo masculino com idade superior a 50
anos. Os maiores percentuais (22,22%) so de alunos do sexo feminino com idades
no intervalo de 18 a 24 anos ou no intervalo de 30 a 40 anos. Veja que,
independente do sexo, existem 33,33% de alunos com idade entre 18 e 24 anos e
apenas 6,67% de alunos com idade superior ou igual a 50 anos.

Perceba que os totais marginais para a varivel sexo so iguais s freqncias
relativas dispostas na tabela 2.1 e que os totais marginais para a varivel idade so
iguais s freqncias relativas dispostas na tabela 2.2.

Uma outra forma de apresentao de tabelas de dupla entra seria exibir em
uma nica tabela as freqncias relativas e percentuais. Para exemplificar,
observemos a Tabela 2.5.

Tabela 2.5: Distribuio conjunta dos valores absolutos e proporcionais das variveis
sexo e idade dos alunos do curso de econometria do CETAM - setembro de 2010

Sexo
Idade (anos)
Feminino Masculino
Total
10 5 15
18 24
22,22 % 11,11 % 33,33 %
4 4 8
24 30
8,89 % 8,89 % 17,78 %
10 4 14
30 40
22,22 % 8,89 % 31,11 %
3 2 5
40 50
6,67 % 4,44 % 11,11 %
3 0 3
50 60
6,67 % 0,0 % 6,67 %
30 15 45
Total
66,67 % 33,33 % 100,00 %
FONTE: DADOS HIPOTTICOS.
EM CADA ENTRADA, ENCONTRA-SE A FREQNCIA SIMPLES SOBRE A FREQNCIA RELATIVA.


Assim podemos observar que existem dez alunos do sexo feminino com idade
entre 30 (inclusive) e 40 anos (exclusive) e que esses dez alunos representam
22,22% do total. Observamos ainda que, independente da idade, 66,67%, ou 30
alunos, so do sexo feminino e 33,33%, ou 15 alunos, so do sexo masculino.



17


2.2.2. Elaborao de grficos

Uma outra forma de apresenta um resumo dos dados atravs de grficos. A
representao grfica de uma distribuio de uma varivel tem a vantagem de,
rpida e concisamente, informar sobre sua variabilidade. Existem vrios grficos que
podem ser utilizados e abordaremos aqui os mais simples.

Para representar variveis qualitativas existem vrios tipos de grficos que
obedecem o mesmo principio, logo nos limitaremos a apresentar trs deles: grficos
de barras, colunas e setores circular (pizza).

O grfico em colunas consiste em construir tantos retngulos conforme o
nmero de classes de seu interesse, em que a altura de cada um desses retngulos
(classes) est relacionada diretamente com a freqncia (simples ou relativa). Essas
colunas esto dispostas paralelamente umas s outras, no sentido vertical. No
grfico em barras so construdos tantos retngulos conforme o nmero de classes
de seu interesse, em que o comprimento de cada um desses retngulos (classes)
est relacionado diretamente com a freqncia (simples ou relativa). Essas barras
esto dispostas paralelamente umas s outras, no sentido horizontal.

Ao construirmos um grfico, independente do tipo, devemos atentar para o tipo
de varivel com a qual estamos trabalhando. necessrio verificar se a varivel em
estudo continua ou no. Se a varivel for contnua, devemos demonstrar isso no
grfico, ou seja, as classes (barras, colunas ou setores) devero ser apresentadas
justapostas. Se a varivel no for contnua as classes devero ser apresentadas
separadamente. Uma outra observao a ser feita que usualmente o titulo da
figura deve ser apresentado em baixo da figura.

Apesar de termos as duas convenes supracitadas, muito comum
encontrarmos em revistas, peridicos, livros e em outros meios de informao,
grficos fugindo desses padres. Isso torna esses erros comuns, mas no
aceitveis.

Para exemplificar, tomaremos a varivel qualitativa estado civil e a varivel
quantitativa idade. Nas figuras 2.1, 2.2 e 2.3 temos, respectivamente, grfico em
colunas, grfico em setores circular e grfico em barras para a varivel estado civil.
18


Nas figuras 2.4, 2.5 e 2.6 temos, respectivamente, grfico em colunas, grfico em
setores circular e grfico em barras para a varivel idade. As observaes usadas
para a elaborao desses grficos foram retiradas do quadro 2.1.


Figura 2.1: Grfico em colunas para a varivel estado civil dos
alunos do curso de econometria do CETAM - setembro de
2010



Figura 2.2: Grfico em setores circular para a varivel estado
civil dos alunos do curso de econometria do CETAM -
setembro de 2010

19



Figura 2.3: Grfico em barras para a varivel estado civil dos
alunos do curso de econometria do CETAM - setembro de
2010



Figura 2.4: Grfico em colunas para a varivel idade dos
alunos do curso de econometria do CETAM - setembro de
2010


20



Figura 2.5: Grfico em setores circular para a varivel idade
dos alunos do curso de econometria do CETAM - setembro de
2010



Figura 2.6: Grfico em barras para a varivel idade dos alunos
do curso de econometria do CETAM - setembro de 2010

Podemos ter como interesse resumir simultaneamente os dados de duas
variveis em um nico grfico. A exemplo das tabelas de dupla entrada (ou tabelas
de contingncia), nos grficos devero aparecer as freqncias simples ou as
21


freqncias relativas que pertencem simultaneamente a classes de uma e outra
varivel. Para ilustrar, temos as figuras 2.7 e 2.8.


Figura 2.7: Grfico em colunas para a distribuio conjunta das
variveis sexo e idade dos alunos do curso de econometria do
CETAM - setembro de 2010


Figura 2.8: Grfico em barras para a distribuio conjunta das
variveis sexo e idade dos alunos do curso de econometria do
CETAM - setembro de 2010


22


2.3 - MEDIDAS

At agora vimos que possvel resumir os dados e apresent-los em forma de
tabelas e grficos. Contudo, quando estamos diante de um banco de dados
conveniente tentar resumi-lo atravs do clculo de algumas medidas que a
caracterizam. Estas medidas, quando bem interpretadas, podem fornecer-nos
informaes muito valiosas com respeito a este conjunto de dados.

Em suma, podemos reduzi-lo a alguns valores, cuja interpretao fornece-nos
uma compreenso bastante precisa de todo o conjunto de observaes. Alguns
destes valores so as medidas de tendncia central outros so as medidas de
disperso.


2.3.1. Medidas de tendncia central

So valores intermedirios do conjunto de dados, ou seja, valores
compreendidos entre o menor e o maior valor da srie. So tambm valores em
torno dos quais os elementos do conjunto de dados esto distribudos. A medida de
tendncia central procura estabelecer um nmero no eixo horizontal em torno do
qual a srie se concentra.
As principais medidas de tendncia central so: mdia, mediana e moda.


2.3.1.1. Mdia

Do ponto de vista terico, vrios tipos de mdia podem ser calculados para
uma massa de dados. Ressaltamos que a mdia aritmtica a mais usada, portanto
a mais comum. Apresentaremos ainda as mdias geomtricas e harmnicas.

Mdia aritmtica simples:
Para uma seqncia numrica X: x1, x2, x3, ..., xn , a mdia aritmtica simples,
que designaremos por X definida por:
n
x
X
i
=
23



Mdia aritmtica ponderada:
Para uma seqncia numrica X: x
1
, x
2
, x
3
, ..., x
n
, afetados de pesos p
1
, p
2
, p
3
,
..., p
n
, respectivamente, a mdia aritmtica ponderada, que designaremos por
p
X ,
definida por:

=
i
i i
p
p
p x
X

Mdia geomtrica simples
Para uma seqncia numrica X: x
1
, x
2
, x
3
, ..., x
n
, a mdia geomtrica simples,
que designaremos por
g
X , definida por:
n
n g
x x x x X ...
3 2 1
=

Mdia geomtrica ponderada
Para uma seqncia numrica X: x
1
, x
2
, x
3
, ..., x
n
, afetados de pesos p
1
, p
2
, p
3
,
..., p
n
, respectivamente, a mdia geomtrica ponderada, que designaremos por
gp
X , definida por:

=
i n
p p
n
p p p
gp
x x x x X ...
3 2 1
3 2 1


Mdia harmnica simples
Para uma seqncia numrica de elementos no nulos X: x
1
, x
2
, x
3
, ..., x
n
, a
mdia harmnica simples, que designaremos por
h
X , definida por:
n
h
x x x x
n
X
1
...
1 1 1
3 2 1
+ + + +
= ou

=
i
h
x
n
X
1

Note que a mdia harmnica o inverso da mdia aritmtica dos inversos dos
elementos.

Mdia harmnica ponderada
Para uma seqncia numrica de elementos no nulos X: x
1
, x
2
, x
3
, ..., x
n
,
afetados de pesos p
1
, p
2
, p
3
, ..., p
n
, respectivamente, a mdia harmnica ponderada
que designaremos por
hp
X definida por:
24



n
n
i
hp
x
p
x
p
x
p
x
p
p
X
+ + + +
=

...
3
3
2
2
1
1
ou

=
i
i
i
hp
x
p
p
X

A mdia harmnica aplica-se naturalmente quando se quer a obteno de uma
mdia cuja unidade de medida seja o inverso da unidade de medida dos
componentes da seqncia original.

A mdia geomtrica s indicada para representar uma srie de valores
aproximadamente em progresso geomtrica.

Os casos anteriores no so muito freqentes nas aplicaes. Vamos restringir
o desenvolvimento de mdias ao caso de mdia aritmtica, que a mdia mais
utilizada nas aplicaes.


2.3.1.2. Clculo da Mdia Aritmtica

Dados brutos ou rol
Neste caso, devemos utilizar uma mdia aritmtica simples:
n
x
X
i
=
Dados tabelados
Se os dados esto apresentados na forma de uma tabela, utilizaremos a mdia
aritmtica ponderada, considerando as freqncias simples f
i
como sendo as
ponderaes dos elementos x
i
correspondentes.
A equao da mdia que originalmente era

=
i
i i
p
p x
X passa a ser escrita
como:

=
i
i i
f
f x
X
Obs: Para tabelas de variveis continuas, o valor de x
i
o ponto mdio da
classe i.


25


2.3.1.3. Mediana

um valor real que separa o rol em duas partes deixando sua esquerda o
mesmo nmero de elementos que a sua direita. Portanto, a mediana um valor que
ocupa a posio central em um conjunto de dados. A mediana ser denotada por
md.

2.3.1.4. Clculo da Mediana

Dados brutos ou rol
Inicialmente devemos ordenar os elementos caso sejam dados brutos, obtendo
o Rol. Em seguida determinamos o nmero n de elementos do Rol. Se n impar, o
Rol admite apenas um termo central que ocupa a posio
|

\
| +
2
1 n
. O valor do
elemento que ocupa esta posio a mediana. Se n par, o rol admite dois termos
centrais que ocupam as posies
|

\
|
2
n
e
|

\
|
+1
2
n
. A mediana convencionada
como sendo a mdia dos valores que ocupam estas posies centrais.
Quando lidamos com um conjunto de dados muito grande, a quantidade de
elementos esquerda direita aproximadamente 50% do total de
elementos, o que conduz a seguinte interpretao genrica para a mediana:
"50% dos valores do conjunto de dados so valores menores ou iguais a
mediana e 50% dos valores do conjunto de dados so valores maiores ou
iguais a mediana".

Dados tabelados - varivel discreta
Se os dados esto apresentados na forma de uma varivel discreta, eles j
esto naturalmente ordenados. Assim, basta verificar se o nmero de elementos da
srie mpar ou par e aplicar o mesmo raciocnio do caso anterior.

Dados tabelados - varivel contnua
Se a dados so apresentados na forma de uma varivel contnua, o raciocnio
anterior no pode ser utilizado, uma vez que mesmo identificada a posio da
mediana no conjunto de dados, o valor do elemento da srie que ocupa esta
posio no identificvel. Assim, para determinar a mediana temos a
equao:
26


h
f
F
n
l m
d
d
m
ant
m d

+ =
2

em que:
1
md
= limite inferior da classe mediana.
n = nmero de elementos do conjunto de dados.
F
ant
= freqncia acumulada da classe anterior classe mediana.
f
md
= freqncia simples da classe mediana.
h = amplitude do intervalo de classe.

COMENTRIO: Devido s condies impostas na obteno da frmula da
mediana, fica evidente que o valor obtido pela frmula um valor aproximado do
verdadeiro valor da mediana do conjunto de dados.
De modo geral, todas as medidas calculadas para uma varivel contnua sero
valores aproximados para estas medidas, uma vez que ao agruparmos os dados
segundo uma varivel contnua, h perda de informaes quanto identidade dos
dados.

2.3.1.5. Moda

o valor de maior freqncia em um conjunto de dados. Notao: A moda ser
denotada por mo.


2.3.1.6. Clculo da Moda

Dados brutos ou rol
Basta identificar o elemento de maior freqncia. Se a maior freqncia for
atribuda a um nico valor, dizemos que o conjunto de dados unimodal. Se a maior
freqncia for atribuda a valores distintos, dizemos que o conjunto de dados
bimodal. Poderemos encontrar seqncias trimodais, tetramodais e assim
sucessivamente. Estes conjuntos de observaes sero chamados de forma
genrica por seqncias polimodais.
Se todos os valores do conjunto de dados apresentam a mesma freqncia,
dizemos que o conjunto de dados amodal.

27


Dados tabelados - varivel discreta
Este caso ainda mais simples. Note que na apresentao da varivel discreta,
as freqncias j esto computadas. Basta identificar o elemento de maior
freqncia.

Dados tabelados - varivel contnua
Para determinar a moda de uma varivel contnua, podemos optar por vrios
processos. Daremos destaque para a moda de Pearson, de King e de Czuber.

Moda de Pearson:
Segundo PEARSON, a moda de uma varivel contnua pode ser obtida atravs
do valor da mdia e da mediana:
X m m
d o
2 3 =

Moda de King
KING levou em considerao, em sua frmula, a freqncia simples da classe
anterior e a freqncia simples da classe posterior classe modal.
h
f f
f
l m
post ant
post
m o
o
+
+ =
em que:
l
mo
= limite inferior da classe modal
f
post
= freqncia simples da classe posterior classe modal
f
ant
= freqncia simples da classe anterior classe modal
h = amplitude do intervalo de classe

Moda de CZUBER
CZUBER levou em considerao, em sua frmula a freqncia simples da
classe anterior, a freqncia simples da classe posterior, alm da freqncia simples
da classe modal. , portanto, uma frmula mais completa que a frmula de King.
h
f f f
f f
l m
post ant m
ant m
m o
o
o
o
) ( 2 +

+ =
em que:
l
mo
= limite inferior da classe modal
f
mo
= freqncia simples da classe modal.
28


f
post
= freqncia simples da classe posterior classe modal
f
ant
= freqncia simples da classe anterior classe modal
h = amplitude do intervalo de classe

COMENTRIO: A frmula de Pearson tem normalmente interesse terico. Se
no dispusermos da mdia e da mediana da distribuio, a frmula de Pearson a
mais trabalhosa. A frmula de King a mais simples delas, mas no a mais
precisa. A frmula de Czuber mais precisa que a frmula de King, pois leva
tambm em considerao a freqncia da classe modal.

2.3.2. Utilizao das Medidas de Tendncia Central

Na maioria das situaes, no necessitamos calcular as trs medidas de
tendncia central. Normalmente precisamos de apenas uma das medidas para
caracterizar o centro da srie. Surge, ento, a questo: qual medida deve ser
utilizada?

A medida ideal em cada caso aquela que melhor representa a maioria dos
dados da srie. Quando todos os dados de uma srie estatstica so iguais, a mdia,
a mediana e a moda coincidiro com este valor e, portanto qualquer uma delas
representar bem a srie. No entanto, este caso dificilmente ocorrer na prtica.

Na maioria das vezes, teremos valores diferenciados para a srie e
conseqentemente a medida ir representar bem, apenas os dados da srie que se
situam prximos a este valor. Os dados muito afastados em relao ao valor da
medida no sero bem representados por ela.

Desta forma, se uma srie apresenta forte concentrao de dados em sua rea
central, a mdia, a mediana e a moda ficam tambm situadas em sua rea central
representando bem a srie. Como a mais conhecida a mdia, optamos por esta
medida de tendncia central. Concluindo, devemos optar pela mdia, quando houver
forte concentrao de dados na rea central da srie.

Se uma srie apresenta forte concentrao de dados em seu incio, a mediana
e a moda estaro posicionadas mais no incio da srie, representando bem esta
29


concentrao. A mdia que fortemente afetada por alguns valores posicionados no
final da srie se deslocar para a direita desta concentrao no a representando
bem.

Como a mais conhecida entre mediana e moda a mediana, esta ser a
medida indicada neste caso. A mesma situao ocorre se a srie apresenta forte
concentrao de dados em seu final. Concluindo, devemos optar pela mediana,
quando houver forte concentrao de dados no incio ou no final da srie.

A moda deve ser a opo como medida de tendncia central apenas em sries
que apresentam um elemento tpico, isto , um valor cuja freqncia muito superior
freqncia dos outros elementos da srie.

2.3.3. Exemplos do uso de medidas de tendncia central

Como exemplo tomaremos as notas atribudas aos alunos da stima serie do
Centro Educacional Elisa Bessa (CEEB) nas disciplinas de Portugus, Matemtica,
Historia e Geografia. Vale ressaltar que o CEEB possui uma poltica de diferenciao
de disciplinas atribuindo um grau de importncia (ou peso) diferente para cada
disciplina.

O Quadro 2.3, mostra a nota dos alunos em cada disciplina sem levar em conta
o peso atribudo a cada disciplina. O Quadro 2.2 apresenta os pesos atribudos a
cada disciplina.

Quadro 2.2: Pesos atribudos s disciplinas do Centro Educacional Elisa Bessa
Disciplinas Pesos
Portugus 3
Matemtica 1
Historia 2
Geografia 2
Total 8

FONTE: SECRETRIA DO CEEB.

30


Na tentativa de fazer uma avaliao da turma, o centro pedaggico do CEEB
utilizou algumas medidas de tendncia central.

A primeiro passo foi calcular a mdia de cada aluno da turma, para tanto foram
somadas as notas das quatro disciplinas e dividido por quatro. Esses resultados
esto apresentados no Quadro 2.4.

Quadro 2.3: Notas dos alunos da stima srie do Centro Educacional Elisa Bessa
Nmero do
aluno Portugus Matemtica Histria Geografia
1 7,7 3,5 3,3 8,3
2 6,7 7,4 5,8 7,1
3 8,7 5,7 9,6 8,7
4 9,2 4,3 6,9 7,4
5 4,3 5,3 7,2 5,2
6 6,3 3,9 8,5 7,9
7 7,5 5,3 6,6 5,2
8 6,9 4,0 9,9 9,4
9 4,7 5,6 8,2 8,0
10 8,7 7,1 9,1 6,1
11 8,3 4,2 7,6 9,8
12 8,4 5,6 7,7 8,1
13 7,5 9,4 9,0 8,7
14 9,1 5,0 7,9 7,3
15 5,4 9,9 9,0 5,4
16 9,0 6,9 6,8 7,1
17 9,3 7,0 6,9 5,9
18 7,2 5,1 7,1 8,7
19 8,8 4,5 6,9 7,5
20 4,1 7,2 6,8 3,0
Mdia 7,4 5,8 7,5 7,2

FONTE: SECRETRIA DO CEEB.


31


Quadro 2.4: Mdia individual dos alunos da stima srie do CEEB
Nmero do aluno Clculo da mdia Resultado
1 (7,7 + 3,5 + 3,3 + 8,3) / 4 = 5,70
2 (6,7 + 7,4 + 5,8 + 7,1) / 4 = 6,75
3 (8,7 + 5,7 + 9,6 + 8,7) / 4 = 8,18
4 (9,2 + 4,3 + 6,9 + 7,4) / 4 = 6,93
5 (4,3 + 5,3 + 7,2 + 5,2) / 4 = 5,52
6 (6,3 + 3,9 + 8,5 + 7,9) / 4 = 6,64
7 (7,5 + 5,3 + 6,6 + 5,2) / 4 = 6,13
8 (6,9 + 4,0 + 9,9 + 9,4) / 4 = 7,52
9 (4,7 + 5,6 + 8,2 + 8,0) / 4 = 6,63
10 (8,7 + 7,1 + 9,1 + 6,1) / 4 = 7,74
11 (8,3 + 4,2 + 7,6 + 9,8) / 4 = 7,49
12 (8,4 + 5,6 + 7,7 + 8,1) / 4 = 7,45
13 (7,5 + 9,4 + 9,0 + 8,7) / 4 = 8,67
14 (9,1 + 5,0 + 7,9 + 7,3) / 4 = 7,31
15 (5,4 + 9,9 + 9,0 + 5,4) / 4 = 7,43
16 (9,0 + 6,9 + 6,8 + 7,1) / 4 = 7,43
17 (9,3 + 7,0 + 6,9 + 5,9) / 4 = 7,28
18 (7,2 + 5,1 + 7,1 + 8,7) / 4 = 7,03
19 (8,8 + 4,5 + 6,9 + 7,5) / 4 = 6,92
20 (4,1 + 7,2 + 6,8 + 3,0) / 4 = 5,28

Com base na mdia aritmtica, 3 alunos possuram mdia final abaixo de 6.
Com tudo, interesse da instituio ponderar as disciplinas. Sendo assim, um novo
32


clculo foi feito (Quadro 2.5) e novas mdias foram encontradas. Agora, 2 alunos
apresentavam mdia abaixo de 6.

Quadro 2.4: Mdia ponderada individual dos alunos da stima srie do CEEB
Nmero do aluno Clculo da mdia Resultado
1 (7,7 x 3 + 3,5 x 1 + 3,3 x 2 + 8,3 x 2) / 8 = 6,23
2 (6,7 x 3 + 7,4 x 1 + 5,8 x 2 + 7,1 x 2) / 8 = 6,65
3 (8,7 x 3 + 5,7 x 1 + 9,6 x 2 + 8,7 x 2) / 8 = 8,56
4 (9,2 x 3 + 4,3 x 1 + 6,9 x 2 + 7,4 x 2) / 8 = 7,55
5 (4,3 x 3 + 5,3 x 1 + 7,2 x 2 + 5,2 x 2) / 8 = 5,39
6 (6,3 x 3 + 3,9 x 1 + 8,5 x 2 + 7,9 x 2) / 8 = 6,94
7 (7,5 x 3 + 5,3 x 1 + 6,6 x 2 + 5,2 x 2) / 8 = 6,41
8 (6,9 x 3 + 4,0 x 1 + 9,9 x 2 + 9,4 x 2) / 8 = 7,89
9 (4,7 x 3 + 5,6 x 1 + 8,2 x 2 + 8,0 x 2) / 8 = 6,52
10 (8,7 x 3 + 7,1 x 1 + 9,1 x 2 + 6,1 x 2) / 8 = 7,94
11 (8,3 x 3 + 4,2 x 1 + 7,6 x 2 + 9,8 x 2) / 8 = 8,00
12 (8,4 x 3 + 5,6 x 1 + 7,7 x 2 + 8,1 x 2) / 8 = 7,80
13 (7,5 x 3 + 9,4 x 1 + 9,0 x 2 + 8,7 x 2) / 8 = 8,43
14 (9,1 x 3 + 5,0 x 1 + 7,9 x 2 + 7,3 x 2) / 8 = 7,82
15 (5,4 x 3 + 9,9 x 1 + 9,0 x 2 + 5,4 x 2) / 8 = 6,88
16 (9,0 x 3 + 6,9 x 1 + 6,8 x 2 + 7,1 x 2) / 8 = 7,70
17 (9,3 x 3 + 7,0 x 1 + 6,9 x 2 + 5,9 x 2) / 8 = 7,57
18 (7,2 x 3 + 5,1 x 1 + 7,1 x 2 + 8,7 x 2) / 8 = 7,30
19 (8,8 x 3 + 4,5 x 1 + 6,9 x 2 + 7,5 x 2) / 8 = 7,46
20 (4,1 x 3 + 7,2 x 1 + 6,8 x 2 + 3,0 x 2) / 8 = 4,89

33


O centro pedaggico do CEEB observou que a menor mdia entre as
disciplinas era a de matemtica com um valor igual a 5,8. A fim de obter mais
informaes sobre esse conjunto de dados (notas de matemtica), a o centro
pedaggico construiu um Rol para esses dados e em seguida calculou a mediana, a
moda e apresentou um resumo dos dados na Tabela 2.6.
Rol:
3,5; 3,9; 4,0; 4,2; 4,3; 4,5; 5,0; 5,1; 5,3; 5,3;
5,6; 5,6; 5,7; 6,9; 7,0; 7,1; 7,2; 7,4; 9,4; 9,9.
Para o clculo da mediana, foram tomados o 10 e o 11 elementos e em
seguida foi calculada a media desses dois nmeros.
45 , 5
2
6 , 5 3 , 5
=
+
=
d
m

Para determinar a moda, foi observada a maior freqncia entre as
observaes. Chegando a concluso de que a serie e bimodal, pois os valores 5,3 e
5,6 apresentam a mesma freqncia.

Tabela 2.6: Diviso da 7 srie do CEEB quanto nota de matemtica
Notas de matemtica Freqncia simples Freqncia acumulada
3,0 |-- 4,5 5 5
4,5 |-- 6,0 8 13
6,0 |-- 7,5 5 18
7,5 |-- 9,0 0 18
9,0 |-- 10,0 2 20
Total 20

FONTE: SECRETARIA DO CEEB

Data a tabela acima possvel calcular a mediana e moda.
44 , 5 5 , 1
8
5 10
5 , 4
2
=

+ =

+ = h
f
F
n
l m
d
d
m
ant
m d

25 , 5 5 , 1
5 5
5
5 , 4 =
+
+ =
+
+ = h
f f
f
l m
post ant
post
m o
o



34


2.3.4. Medidas de disperso

So necessrios dois tipos de medidas para descrever adequadamente um
conjunto de dados. Alm da informao quanto ao "meio" de um conjunto de
nmeros, conveniente dispormos tambm de um mtodo que nos permita exprimir
a disperso. As medidas de disperso indicam se os valores esto relativamente
prximos uns dos outros, ou separados.
Consideraremos quatro medidas de disperso: o desvio mdio, a varincia,
desvio padro e o coeficiente de variao. Todas elas tm na mdia o ponto de
referncia. Em cada caso, o valor zero indica ausncia de disperso; a disperso
aumenta proporo que aumenta o valor da medida (desvio, varincia, etc.).


2.3.4.1. Desvio mdio absoluto

O desvio mdio absoluto (DMA) mede o desvio mdio dos valores em relao
mdia do grupo, ignorando o sinal do desvio. Calcula-se subtraindo a mdia de cada
valor do grupo e desprezando o sinal (+ ou -) do desvio, e tomando a mdia em
seguida. Ao calcular o desvio mdio, necessrio levar em conta o fato de que a
soma dos desvios positivos e negativos a contar da mdia ser sempre (por
definio) igual a zero. A converso das diferenas a valores absolutos (todos os
valores so considerados como desvios positivos) antes de se proceder soma
resolve o problema. Calcula-se ento o desvio mdio absoluto pela seguinte
equao:
n
X x
DMA
i

=
Em que n o nmero de observaes no conjunto de dados.
Apesar de ser relativamente fcil calcular e entender o DMA, esse no muito
utilizado por haver outras medidas que apresentam propriedades matemticas mais
interessantes. O DMA possui algumas aplicaes no controle de inventrios.

2.3.4.2. Varincia e desvio-padro

A varincia uma mdia aritmtica calculada a partir dos quadrados dos
desvios obtidos entre os elementos do conjunto de dados e a sua mdia. O desvio
padro a raiz quadrada positiva da varincia.
35


Em particular, para estas medidas levaremos em considerao o fato de a
seqncia de dados representar toda uma populao ou apenas uma amostra de
uma populao.
Notaes: Quando a seqncia de dados representa uma Populao a
varincia ser denotada por ) (
2
X e o desvio padro correspondente por ) ( X .
Quando a seqncia de dados representa uma amostra, a varincia ser denotada
por S
2
(X) e o desvio padro correspondente por S(X).


2.3.4.3. Clculo da varincia e do desvio padro

Dados brutos ou Rol
Se o conjunto de dados representa uma Populao, a varincia calculada
pela equao:
( )
n
X x
X
i

=
2
2
) (
Conseqentemente, o desvio-padro ser dado por:
( )
n
X x
X X
i

= =
2
2
) ( ) (
Se o conjunto de dados representa uma amostra, a varincia calculada pela
equao:
( )
1
) (
2
2

=

n
X x
X S
i

Conseqentemente, o desvio-padro ser dado por:
( )
1
) ( ) (
2
2

= =

n
X x
X S X S
i


Dados tabelados varivel discreta
Como h repeties de elementos no conjunto de dados, definimos a varincia
como sendo uma media aritmtica ponderada dos quadrados dos desvios dos
elementos do conjunto de dados.
Varincia para populao:
( )


=
i
i i
f
f X x
X
2
2
) (
36


Desvio padro para populao:
( )


= =
i
i i
f
f X x
X X
2
2
) ( ) (
Varincia para amostra:
( )

=
1
) (
2
2
i
i i
f
f X x
X S
Desvio padro para amostra:
( )

= =
1
) ( ) (
2
2
i
i i
f
f X x
X S X S

Dados tabelados varivel contnua
Novamente, por desconhecer os particulares valores de x
i
do conjunto de
dados, substituiremos nas equaes anteriores estes valores pelos pontos mdios
da classe.
Varincia para populao:
( )


=
i
i i
f
f X x
X
2
2
) ( onde x
i
o ponto mdio da classe i.

Varincia para amostra:
( )

=
1
) (
2
2
i
i i
f
f X x
X S onde x
i
o ponto mdio da classe i.

COMENTRIOS: No clculo da varincia, quando elevamos ao quadrado a
diferena ( ) X x
i
, a unidade de medida da srie fica tambm elevada ao quadrado.
Portanto, a varincia dada sempre no quadrado da unidade de medida da srie.
Se os dados so expressos em metros, a varincia expressa em metros
quadrados. Em algumas situaes, a unidade de medida da varincia nem faz
sentido. o caso, por exemplo, em que os dados so expressos em litros. A
varincia ser expressa em litros quadrados. Portanto, o valor da varincia no pode
ser comparado diretamente com os dados da srie, ou seja: varincia no tem
interpretao. Exatamente para suprir esta deficincia da varincia que se define o
desvio padro.

37



2.3.4.4. Coeficiente de variao (C.V.)

Em trabalhos experimentais, atravs deste parmetro, comprovamos a preciso
alcanada, embora no seja apenas esta a sua finalidade. Este coeficiente
expresso em percentagem, sendo utilizado em trabalhos cientficos. calculado pela
equao:

( )
X
X
X CV
) (
=


2.3.4.5. Exemplos do uso de medidas de tendncia central

Observamos anteriormente que a mdia da turma de matemtica da stima
srie do CEEB era igual a 5,8, a mediana igual a 5,45 e as modas iguais a 5,3 e 5,6.
Estas caractersticas nos do alguma idia sobre a populao em estudo. Outras
caractersticas que podem melhorar a idia de como a turma se comporta, so a
varincia, o desvio-padro e o coeficiente de variao. Para calcularmos estas trs
ultimas medidas, utilizaremos o mesmo Rol utilizado anteriormente (o rol da turma
de matemtica).
Rol:
3,5; 3,9; 4,0; 4,2; 4,3; 4,5; 5,0; 5,1; 5,3; 5,3;
5,6; 5,6; 5,7; 6,9; 7,0; 7,1; 7,2; 7,4; 9,4; 9,9.

Varincia
( )
94199 , 2
20
) 8 , 5 9 , 9 ( ... ) 8 , 5 9 , 3 ( ) 8 , 5 5 , 3 (
) (
2 2 2
2
2
=
+ + +
=

=

n
X x
X
i


Desvio-padro
7 , 1 ) ( ) (
2
= = X X

Coeficiente de variao
( ) % 31 , 29 2931 , 0
8 , 5
7 , 1 ) (
ou
X
X
X CV = = =


38



Tomando como fonte a Tabela 2.6, os clculos para a varincia, o desvio-
padro e o coeficiente de variao, so:
Varincia
( )
2,76625
20
2 5,8) (9,5 ... 8 5,8) (5,25 5 5,8) (3,75
f
f X x
(X)
2 2 2
i
i
2
i 2
=
+ + +
=

Desvio-padro
6632 , 1 ) ( ) (
2
= = X X

Coeficiente de variao
( ) % 68 , 28 2868 , 0
8 , 5
6632 , 1 ) (
ou
X
X
X CV = = =






2.4 - ASSIMETRIA DAS DISTRIBUIES


Identificar se a distribuio de uma varivel quantitativa em um determinado
conjunto de dados simtrica ou assimtrica pode ser de grande valia por vrios
motivos:
Se os dados so provenientes de uma amostra, identificar a simetria ou no
da distribuio pode ser necessrio para selecionar o modelo probabilstico
mais adequado para descrever a varivel na populao.
No caso de um experimento, em que todas as causas de variao
indesejadas so suprimidas, a ocorrncia de assimetria quando era esperada
simetria, ou o contrrio, pode ser indicar que houve algum erro de
planejamento ou de medio.
Nos casos em que so comparadas distribuies da mesma varivel
quantitativa em situaes diferentes a identificao de um comportamento
assimtrico ou simtrico, inesperado ou diferenciado, pode alertar para
aspectos anteriormente despercebidos, ou existncia de erros.

39


Alguns programas computacionais calculam uma medida de assimetria
(skewness): quando este valor exatamente igual a zero a distribuio em questo
perfeitamente simtrica. Mas a forma ideal de analisar a simetria de uma
distribuio combinar a avaliao das medidas e de um grfico, seja um
histograma ou um diagrama em caixas. As figuras 2.9 a 2.11 iro apresentar grficos
de distribuies que poderiam ser ajustados a histogramas.

Mdia
Mediana
Moda
freq

Figura 2.91 - Distribuio assimtrica negativa (assimtrica para a esquerda)

Observe que o "pico" da distribuio, identificado pela moda, est direita do
grfico, indicando que "falta algo" esquerda, justificando a denominao
"assimtrica esquerda". Observe tambm que a mediana maior do que a mdia.
H uma medida estatstica de assimetria que calcula a diferena entre mdia e
mediana: quando a diferena negativa (mediana maior do que a mdia) a
distribuio "assimtrica negativa". Este tipo de distribuio no muito comum na
prtica, pois mais difcil obter valores excepcionalmente pequenos ( esquerda)

Moda
Mediana
Mdia
freq.

Figura 2.10 - Distribuio assimtrica positiva (assimtrica para a direita)
40



Observe que o "pico" da distribuio, identificado pela moda, est esquerda do
grfico, indicando que "falta algo" direita, justificando a denominao "assimtrica
direita". Observe tambm que a mdia maior do que a mediana. Agora a
diferena entre mdia e mediana ser positiva: quando a diferena positiva a
distribuio "assimtrica negativa". Este tipo de distribuio razoavelmente
comum na prtica, pois fcil obter valores excepcionalmente altos, sendo o caso
mais tpico a varivel renda.


Moda = Mdia = Mediana
freq.

Figura 2 - Distribuio simtrica

Observe que as trs medidas de posio coincidem. E que aproximadamente
metade dos dados esto abaixo do centro e a outra metade acima, ou seja a
distribuio "simtrica" em relao s suas medidas de posio. A diferena entre
mdia e mediana igual a zero. Muitas variveis apresentam distribuio simtrica,
especialmente aquelas resultantes de medidas corpreas, mas no somente.


A seguir apresentamos histogramas de distribuies assimtricas e simtrica.
f
x

Figura 2.12 - Histograma de distribuio simtrica
41



f
x

Figura 2.13 - Histograma de distribuio assimtrica para a direita (negativa)

f
x

Figura 3.14 - Histograma de distribuio assimtrica para a esquerda (positiva)

Alm das medidas de posio podemos utilizar as separatrizes para avaliar no
s a simetria, mas tambm a disperso de um conjunto de dados. O procedimento
para verificar a existncia de assimetria consiste em avaliar a diferena existente
entre os quartis e a mediana: se os quartis inferior e superior estiverem mesma
distncia da mediana, a distribuio do conjunto pode ser considerada simtrica. A
avaliao da disperso depende da existncia de um padro para comparao, seja
um outro conjunto de dados ou alguma especificao. Um conjunto de dados
apresentar maior disperso do que outro se os seus quartis estiverem mais
distantes da mediana. Observe as figuras a seguir.

Simtrico
Md Qi Qs
25% 25% 25% 25%

Figura 4.15 - Quartis de uma distribuio simtrica - 1
o
caso
Observe que a diferena Qs - Md igual
diferena Md - Qi, o que indica a simetria
do conjunto. importante lembrar que os
quartis dividem o conjunto em 4 partes
iguais (25% dos dados).
42




Simtrico, com
maior disperso
Qi Qs Md
25% 25% 25% 25%

Figura 5 - Quartis de uma distribuio simtrica - 2
o
caso

Mas agora a disperso do conjunto maior, quando comparada ao 1
o
caso: os
quartis esto mais distantes da mediana (as diferenas Qs - Md e Md - Qi sero
maiores do que as obtidas no 1
o
caso).

Assimtrico para
a direita
Qi Qs Md
25% 25%
25% 25%

Figura 6.17 - Quartis de uma distribuio assimtrica para a direita

O conjunto apresenta uma disperso mais elevada nos valores maiores. Isso fez
com que o quartil superior aumentasse de valor ("deslocando-o para a direita"), e
ficasse mais distante da mediana do que o inferior, significando assimetria para a
direita (ou positiva).

Assimtrico para
a esquerda
Qi Qs Md
25% 25%
25% 25%

Figura 7.18 - Quartis de uma distribuio assimtrica para a esquerda

Neste caso ocorre o oposto da figura 26. H maior disperso nos valores mais
baixos, fazendo com que o quartil inferior aumentasse de valor, e ficasse mais
distante da mediana do que o superior, significando assimetria para a esquerda (ou
negativa).

A avaliao da assimetria atravs dos quartis tambm pode ser em um
diagrama em caixas.

Observe que a diferena
Qs - Md continua igual
diferena Md - Qi, o que
indica a simetria do conjunto.
Na figura 26 fcil perceber
diferenas so claramente
desiguais: h assimetria. E
como Qs - Md maior do que
Md - Qi para a direita.
Na figura 27 novamente as
diferenas so claramente
desiguais: h assimetria. E
como Md - Qi maior do que
Qs - Md para a esquerda.
43


2.5 - DIAGRAMA EM CAIXAS

O Diagrama em Caixas, tambm chamado de Desenho Esquemtico, Box-
plot ou Box & Whisker plot um grfico que permite avaliar facilmente os valores
tpicos, a assimetria, a disperso e os dados discrepantes de uma distribuio de
dados de uma varivel QUANTITATIVA. indicado para grandes conjuntos de
dados.
A construo do Diagrama em Caixas exige que sejam calculados
previamente os valores da Mediana, Quartil Inferior e Quartil Superior do conjunto de
dados, bem como a identificao dos extremos superior (maior valor) e inferior
(menor valor). Traam-se dois retngulos (duas caixas): um representa a distncia
entre o Quartil Inferior e a Mediana e o outro a distncia entre a Mediana e o Quartil
Superior. A partir dos Quartis Inferior e Superior so desenhadas linhas verticais at
os ltimos valores no discrepantes tanto abaixo quanto acima.
Valores discrepantes (ou outliers) so aqueles que tm valores:
- maiores do que a expresso Qs + 1,5 x (Qs - Qi)
1
ou
- menores do que a expresso Qi - 1,5 x (Qs - Qi)
Todos os valores discrepantes so marcados para posterior estudo individual.
O Diagrama em Caixas tpico seria:














Figura 8.19 - Diagrama em Caixas - Esquema

1
O valor Qs - Qi chamado de desvio interquartlico.
Qs + 1,5x(Qs - Qi)
Qi - 1,5x(Qs - Qi)
Md
Qs
Qi
*
*
*
*
Valores discrepantes superiores
Valores discrepantes inferiores
Na caixa superior esto 25%
dos dados, h outros 25% na
caixa inferior, outros 25%
acima do Qs e outros 25%
abaixo do Qi: se houvesse
100 dados 25 estariam na
caixa superior, 25 na
inferior, 25 abaixo do Qi e
25 acima do Qs.
44



Se as duas caixas tiverem alturas semelhantes (Qs - Md Md - Qi) a
distribuio dita simtrica (ver seo 2.4). Quanto maiores as alturas das caixas
[maiores (Qs - Md ) e (Md - Qi)] maior a disperso do conjunto. O valor tpico do
conjunto ser a Mediana (Md), cujas caractersticas foram vistas anteriormente. A
dimenso horizontal das caixas irrelevante.

A seguir o roteiro para construo do Diagrama em Caixas.
Passos:
Ordenar os dados.
Calcular Mediana, Quartil Inferior e Quartil Superior.
Identificar Extremos.
Construir os retngulos (Qs - Md, Md - Qi).
A partir dos retngulos, para cima e para baixo, seguem linhas at o ltimo
valor no discrepante.
Marcar as observaes discrepantes.

Exemplo 2.22 - Foram medidas as alturas de 35 homens adultos, cujos resultados
esto abaixo.
Sejam as alturas de homens adultos a seguir.
181 174 145 150 168 173 163 184 178 165 173 165 166 205 167 168 169 170
174 170 172 198 177 173 179 180 169 181 169 183 142 183 163 204 165
Construa o diagrama em caixas para as alturas, avaliando valor tpico, assimetria,
disperso e valores discrepantes.

1)Ordenar os dados crescentemente:
142 145 150 163 163 165 165 165 166 167 168 168 169 169 169 170 170 172 173
173 173 174 174 177 178 179 180 181 181 183 183 184 198 204 205

2) Calcular Mediana, Quartil Inferior e Quartil Superior
H 35 medidas: n = 35
Posio da mediana = (n + 1) /2 = 36 / 2 = 18
a
=> valor que est na 18
a
posio
Md = 172

45


Posio do quartil inferior = (n + 1) / 4 = 36 /4 = 9
a
=> valor que est na 9
a
posio
Qi = 166

Posio do quartil superior = 3 x (n + 1) / 4 = 336 /4 = 275
a
=> valor que est na
27
a
posio Qs = 180

3) Identificar extremos
O maior valor do conjunto (extremo superior) Es = 205
O menor valor do conjunto (extremo inferior) Ei = 142

4) Retngulos
Qs - Md = 180 - 172 = 8 (os valores so aproximadamente iguais:
distribuio
Md - Qi = 172 - 166 = 6 pode ser considerada simtrica)

5) Identificao dos valores discrepantes
Qs - Qi = 180 - 166 = 14 1,5 x (Qs - Qi) = 1,5 14 = 21
Qi - 1,5 x (Qs - Qi) = 166 - 21 = 145
Valores menores do que 145 cm de altura sero discrepantes: s h um valor abaixo
de 145 (142), ento h apenas um valor discrepante inferior. Assim a linha vertical
inferior ir at o ltimo valor no discrepante, que vale 145 cm.

Qs + 1,5 x (Qs - Qi) = 180 + 21 = 201
Valores maiores do que 201 cm de altura sero discrepantes: h dois valores acima
de 201 (204 e 205), ento h dois valores discrepantes superiores. A linha vertical
superior ir at o ltimo valor no discrepante, no caso 198.

Todos os passos anteriores so feitos internamente pelo computador quando se usa
um programa estatstico para construir um Diagrama em Caixas, resultando no
grfico a seguir
2
:


2
O Diagrama em Caixas foi feito utilizando o pacote Statistica. Algumas medidas podem ter resultados
ligeiramente diferentes dos clculos manuais devido aos arredondamentos.
46


Box Plot das Alturas
130
140
150
160
170
180
190
200
210
ALTURA

Figura 9.20 - Diagrama em caixas

O valor tpico do conjunto a mediana que vale 172 cm. Esse valor pode ser
alto ou no, dependendo do objetivo (para selecionar jogadores de vlei e basquete
pode ser baixo, para jqueis pode ser alto), exigindo conhecimentos mais
aprofundados para ser interpretado.

As duas caixas tm alturas semelhantes, indicando simetria ou "leve
assimetria". Quanto disperso no h muito o que se comentar pois no h um
padro para comparao.

H apenas um valor discrepante inferior, e dois superiores. Estes valores
talvez merecessem um estudo individual: primeiramente verificar se no houve erro
de medio, se constatada a correo da medida identificar os indivduos, estudar
seu histrico mdico, etc.)
3
.

Como TODA ferramenta estatstica o Diagrama em Caixas de nada vale se o
usurio no tiver conhecimentos especficos sobre a varivel retratada para
interpretar os resultados.

3
Para que o estudo de pontos individuais seja possvel importante que sejam registrados onde, quando e em
que condies as observaes foram feitas.
47


2.5.1 - Diagrama em Caixas Mltiplo

bastante comum querer comparar vrios conjuntos de dados, para avaliar
seus valores tpicos, disperso, assimetria, e valores discrepantes. Por exemplo, no
caso do Exemplo 2.22 poderamos ter interesse em comparar vrios conjuntos de
alturas, provenientes de diferentes grupos. Para tanto precisamos construir um
diagrama mltiplo, em que todos tenham a mesma escala, para possibilitar a
comparao (diversos programas estatsticos permitem fazer isso).

Exemplo 2.23 - O diagrama em caixas mltiplo abaixo apresenta as notas finais de
estudantes de disciplinas de Estatstica em trs cursos diferentes da UFSC, em
1997. Faa a anlise dos diagramas: valor tpico, disperso, assimetria, valores
discrepantes. Algum dos cursos destaca-se?

-1.2
0.0
1.2
2.4
3.6
4.8
6.0
7.2
8.4
9.6
Box-plot das notas
TURMAS
N
O
T
A
S
Cincias Biolgicas Engenharia Mecnica Engenharia de Produo

Figura 2.21 - Diagrama em caixas mltiplo de notas por curso

Quanto aos valores tpicos (medianas) os trs cursos so bem semelhantes: 6,5, 6,5
e 6,75.
48


Quanto assimetria, apenas o conjunto da Engenharia de Produo apresenta
simetria (as alturas das caixas so semelhantes), enquanto os outros dois so
assimtricos.

Quanto disperso, parece ser maior na Engenharia Mecnica, pois suas caixas
so maiores (Quartis mais distantes da Mediana).

H valores discrepantes nos trs conjuntos, mas apenas inferiores, 2 em Cincias
Biolgicas, 4 em Engenharia Mecnica e 3 em Engenharia de Produo.

O curso de Engenharia Mecnica destaca-se ligeiramente, por apresentar
Quartil Superior e Extremo Superior acima dos demais, mas no uma grande
diferena, e trata-se do curso com maior disperso nas notas.

Exemplo 2.24 - A ONU realizou uma pesquisa registrando os crescimentos
demogrficos e mdias de calorias dirias ingeridas em vrios pases. Os pases
foram agrupados em seis regies: OECD (EUA, Canad, Austrlia, Nova Zelndia e
Europa Ocidental), frica, Amrica Latina, Oriente Mdio, Europa Oriental, e
Pacfico/sia. Os diagramas em caixa das variveis esto abaixo. Faa a anlise
dos dois diagramas no que tange aos valores tpicos, assimetria, disperso e valores
discrepantes. Qual a sua opinio sobre a qualidade de vida nestas seis regies?

Figura 2.2210 - Diagramas em caixa mltiplos: crescimento demogrfico e mdia
diria de calorias ingeridas
49



Crescimento demogrfico
Valores tpicos: Oriente Mdio e frica tm os maiores valores tpicos, medianas de
cerca de 3,0% ao ano. E os menores esto na Europa Oriental e OECD, prximos
de zero.
Assimetria: os conjuntos de frica e Europa Oriental poderiam ser considerados
simtricos, Amrica Latina, OECD e Pacfico/sia ligeiramente assimtricos, e o
Oriente Mdio assimtrico.
Disperso: o conjunto com maior disperso o Oriente Mdio, e os menos dispersos
so a Europa Oriental e OECD (demonstrando uma certa homogeneidade
demogrfica nestas duas regies).
Valores discrepantes: frica e Amrica Latina tm discrepantes inferiores, OECD
tem um superior, e as demais regies no apresentam valores discrepantes.

Mdia de calorias
Valores tpicos: Europa Oriental e OECD tm os maiores valores, na faixa de 3500
calorias dirias, enquanto que a frica tm o menor valor, por volta de 2200.
Assimetria: todos os conjuntos so assimtricos, mas Oriente Mdio, Pacfico/sia e
Europa Oriental (onde Qs = Md) so mais do que os outros, a frica tem a menor
assimetria.
Disperso: Europa Oriental apresenta a menor disperso ("caixas" menores),
enquanto Pacfico/sia apresenta a maior.

interessante observar o contraste entre os dois diagramas: a frica tem um dos
maiores valores tpicos de crescimento demogrfico, e o menor valor tpico de
calorias ingeridas (indicando um cenrio de misria e fome), enquanto a Europa
Oriental e a OECD tm uma situao inversa (o que indica condies scio-
econmicas mais favorveis). Impressiona tambm a alta taxa de crescimento
demogrfico no Oriente Mdio.

50


3 - ANLISE BIDIMENSIONAL




comum haver interesse em saber se duas variveis quaisquer esto
relacionadas, e o quanto esto relacionadas, seja na vida prtica, seja em trabalhos
de pesquisa, por exemplo:
- se o sexo dos funcionrios de uma empresa est relacionado com a funo
exercida;
- o quanto o a temperatura ambiente em uma regio influencia as vendas de
refrigerante;
- se o nvel de escolaridade de um grupo de empreendedores est relacionado com
o grau de sucesso por eles alcanado.

Muitas vezes queremos verificar se h uma relao de causa e efeito entre as
duas variveis (se as variveis so dependentes ou no), se possvel estudar uma
das variveis atravs da outra (que mais fcil de medir)- prever os valores de uma
atravs dos valores da outra, ou calcular uma medida de correlao ou de
dependncia entre as variveis.

A Anlise Bidimensional
4
prope-se a tentar responder as perguntas do
pargrafo anterior. As duas variveis abordadas podem ser qualitativas ou
quantitativas, e para cada tipo haver tcnicas apropriadas.

Para variveis qualitativas vamos estudar: tabelas de contingncia, estatstica
Qui-Quadrado e o Coeficiente de Contingncia Modificado
5
. Para variveis
quantitativas vamos abordar: diagramas de disperso, anlise de correlao, anlise
de regresso linear simples, coeficiente de determinao e anlise de resduos. As
prximas sees trataro de cada tpico.



4
Se mais de duas variveis estiverem envolvidas ser necessrio empregar tcnicas de anlise multidimensional,
ou ANLISE MULTIVARIADA.
5
No Captulo 6 iremos estudar o teste de independncia do Qui-Quadrado, uma outra forma de avaliar a
associao entre duas variveis qualitativas.
51


3.1 - ANLISE BIDIMENSIONAL DE VARIVEIS QUALITATIVAS

A anlise bidimensional de variveis qualitativas foi vista anteriormente, mas
seria interessante relembrar alguns pontos.

Variveis Qualitativas so as variveis cujas realizaes so atributos,
categorias. Como exemplo de variveis qualitativas tem-se: sexo de uma pessoa
(duas categorias, masculino e feminino), grau de instruo (analfabeto, primeiro grau
incompleto, etc.), opinio sobre um assunto (favorvel, desfavorvel, indiferente),
etc.

Em estudos sobre variveis qualitativas extremamente comum registrar as
freqncias de ocorrncia de cada valor que as variveis podem assumir, e quando
h duas variveis envolvidas comum registrar-se a freqncia de ocorrncia dos
cruzamentos entre valores: por exemplo, quantas pessoas do sexo masculino so
favorveis a uma certa proposta de lei, quantas so desfavorveis, quantas pessoas
do sexo feminino so favorveis, etc. E, para facilitar a anlise dos resultados estes
resultados costumam ser dispostos em uma Tabela de Contingncias (fazendo uma
dupla classificao). A Tabela de Contingncias relaciona os possveis valores de
uma varivel qualitativa com os possveis valores da outra, registrando quantas
ocorrncias foram verificadas de cada cruzamento.


Exemplo 3.1 - Vamos analisar a tabela de contingncias para as variveis Sexo e
Funo.
Funo
Sexo Escritrio Servios gerais Gerncia Total
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474

52


Podemos apresentar os percentuais calculados em relao aos totais das
colunas:
Funo
Sexo Escritrio Servios gerais Gerncia Total
Masculino 43,25% 100% 88,10% 54%
Feminino 56,75% 0% 11,90% 46%
Total 100% 100% 100% 100%

Seria interessante saber se as duas variveis so estatisticamente
dependentes, e o quo forte esta associao. Repare que os percentuais de
homens e mulheres em cada funo so diferentes dos percentuais marginais (de
homens e mulheres no total de funcionrios), sendo que em duas funes as
diferenas so bem grandes.

A tabela de contingncias tambm chamada de distribuio conjunta das
duas variveis. Permite descrever o grau de associao existente entre as duas
variveis: possvel avaliar a "fora" do relacionamento, e caso haja uma
associao forte pode-se prever os valores de uma varivel atravs dos da outra. Se
as variveis forem independentes (ou seja a associao entre elas for fraca), as
freqncias na tabela de contingncias devem distribuir-se de forma aleatria,
seguindo o padro dos totais marginais. Se, porm, houver uma associao entre as
variveis, elas forem dependentes, as freqncias devero seguir algum padro,
diferente daquele apresentado pelos totais marginais.

Precisamos de uma estatstica que relacione as freqncias OBSERVADAS
na tabela de contingncias com as freqncias ESPERADAS se as duas variveis
fossem independentes (se as freqncias nos cruzamentos dos valores das
variveis seguissem os padres dos totais marginais). E quais sero os valores das
freqncias esperadas?

Exemplo 3.2 - Calcule as freqncias esperadas sob a condio de independncia
entre Sexo e Funo para a tabela de contingncias do Exemplo 3.1.
Se as variveis so independentes as freqncias de homens e mulheres em cada
funo devem ter a mesma proporo que homens e mulheres tm no total de
funcionrios. Lembrando que h 54% de homens e 46% de mulheres, esperamos
53


que esses percentuais mantenham-se em cada funo, se as variveis so
independentes.
- Em Escritrio, h 363 pessoas nesta funo, sob a condio de independncia
deveriam haver:
Homens => 54% de 363 = 197,58 Mulheres => 46% de 363 = 165,42
- Em Servios Gerais, h 27 pessoas, sob a condio de independncia deveriam
haver:
Homens => 54% de 27 = 14,70 Mulheres => 46% de 27 = 12,30
- Em Gerncia, h 84 pessoas, sob a condio de independncia deveriam haver:
Homens => 54% de 84 = 45,72 Mulheres => 46% de 84 = 38,28

Como as freqncias observadas esto razoavelmente distantes das esperadas sob
a condio de independncia. H indcios de que as duas variveis esto
relacionadas.
Podemos calcular as freqncias esperadas para todas as clulas da tabela
de contingncias diretamente, utilizando a seguinte frmula:
geral total
j coluna da total i linha da total
E
ij

=


Onde E
ij
a freqncia esperada, sob a condio de independncia entre as
variveis, em uma clula qualquer da tabela de contingncias. As freqncias
esperadas so necessrias para que possamos compar-las com as observadas,
sendo essa comparao materializada em uma estatstica, chamada de Qui-
Quadrado: 2. A expresso est descrita abaixo:

( )

= = (
(


=
L
1 i
C
1 j
ij
2
ij ij 2
E
E O


Onde L o nmero total de linhas da tabela de contingncias (nmero de valores
que uma das variveis pode assumir), C o nmero total de colunas da tabela
(nmero de valores que a outra varivel pode assumir), e O
ij
a freqncia
observada em uma clula qualquer da tabela de contingncias. Ento, para cada
clula da tabela de contingncias calcula-se a diferena entre a freqncia
observada e a esperada. Para evitar que as diferenas positivas anulem as
54


negativas as diferenas so elevadas ao quadrado. E para evitar que uma diferena
grande em termos absolutos, mas pequena em termos relativos, "inflacione" a
estatstica, ou que uma diferena pequena em termos absolutos, mas grande em
termos relativos, tenha sua influncia reduzida, divide-se o quadrado da diferena
pela freqncia esperada. Somam-se os valores de todas as clulas e obtm-se o
valor da estatstica.

Exemplo 3.3 - Calcule a estatstica Qui-Quadrado para a tabela de contingncias do
Exemplo 3.1.
Funo
Sexo Escritrio Servios gerais Gerncia Total
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474


Calculando as freqncias esperadas de acordo com a frmula vista anteriormente:

Masculino Escritrio E = (258 363)/ 474 = 197,58
Masculino - Servios Gerais E = (258 27)/ 474 = 14,70
Masculino - Gerncia E = (258 84)/ 474 = 45,72
Feminino - Escritrio E = (216 363)/ 474 = 165,42
Feminino - Servios Gerais E = (216 27)/ 474 = 12,30
Feminino - Gerncia E = (216 84)/ 474 = 38,28


Agora podemos calcular as diferenas entre as freqncias e as demais operaes,
que sero mostradas nas tabelas a seguir.

O E Funo
Sexo Escritrio Servios gerais Gerncia
Masculino 157 - 197,58 27 - 14,70 74 - 45,72
Feminino 206 - 165,42 0 - 12,30 10 - 38,28


55


(O-E)
2
Funo
Sexo Escritrio Servios gerais Gerncia
Masculino 1646,921 151,383 799,672
Feminino 1646,921 151,383 799,672

Finalmente:
(O-E)
2
/E Funo
Sexo Escritrio Servios gerais Gerncia
Masculino 8,336 10,301 17,490
Feminino 9,956 12,304 20,891

Agora podemos somar os valores:
2 = 8,336 + 10,301 + 17,490 + 9,956 + 12,304 + 20,891 = 79,227

Quanto maior for o valor de 2 maior ser o grau de associao entre as
variveis. Futuramente aprenderemos a usar esta estatstica em um teste sobre a
independncia entre as variveis. Neste Captulo vamos utilizar outra estatstica, a
partir do 2 para mensurar a fora do relacionamento entre as variveis: o
Coeficiente de Contingncia Modificado.

3.1.1 - Coeficiente de Contingncia Modificado

O Coeficiente de Contingncia Modificado permite quantificar a associao
(grau de dependncia) entre duas variveis QUALITATIVAS, a partir da estatstica
2 vista anteriormente. Sua equao:

1 k
k
N
* C
2
2

=

Onde:
- 2 a estatstica Qui-Quadrado, calculada a partir das freqncias observadas e
esperadas (sob a condio de independncia) a partir da tabela de contingncias.
- N o nmero total de observaes da tabela de contingncias.
- k o menor nmero entre o nmero de linhas e colunas da tabela de
contingncias.
56



O Coeficiente de Contingncia Modificado varia de zero (completa
independncia) at 1 (associao perfeita). Usualmente C* acima de 0,5 indicaria
uma associao de moderada para forte, o que bastaria para considerar que existe
associao estatstica entre as variveis. CUIDADO, porm, com as generalizaes,
associao estatstica no significa relao de causa e efeito!

Exemplo 3.4 - Calcule o Coeficiente de Contingncia Modificado para os dados do
Exemplo 3.3.
O valor de 2 foi calculado, a varivel Sexo pode assumir 2 valores, e Funo
pode assumir 3. O total de observaes igual a 474.
Ento: 2 = 79,227 N = 474 k = 2 (porque o menor valor entre 2 e 3).

54 , 0
1 2
2
474 227 , 79
227 , 79
1 k
k
N
* C
2
2

+
=

=


Ento a associao pode ser considerada de moderada para forte. O resultado
coerente com a tabela de contingncias, pois h grandes diferenas entre as
freqncias esperadas e observadas.


3.2 - ANLISE BIDIMENSIONAL DE VARIVEIS QUANTITATIVAS

Muitas vezes tambm estamos interessados em avaliar o relacionamento
entre variveis QUANTITATIVAS, sejam elas discretas ou contnuas. Basicamente
dois tipos de anlise podem ser realizados: Anlise de Correlao e Anlise de
Regresso.

Na anlise de correlao e regresso h interesse em, a partir de dados de
uma amostra aleatria, verificar SE e COMO duas ou mais variveis quantitativas
6

relacionam-se entre si em uma populao.


6
H possibilidade de avaliar o relacionamento entre duas variveis qualitativas nominais (atravs do Coeficiente
de Contingncia Modificado, que foi visto anteriormente) e entre duas variveis qualitativas ordinais (atravs dos
coeficientes de correlao por postos, que no sero abordados nesta disciplina).
57


A Anlise de Correlao fornece um nmero que resume o relacionamento entre as
variveis, indicando a fora e a direo do relacionamento.

A Anlise de Regresso fornece uma equao matemtica que descreve a natureza
do relacionamento entre as duas variveis, permitindo inclusive que sejam feitas
previses dos valores de uma delas em funo dos valores das outras.

Quando h apenas duas variveis envolvidas a Anlise de Regresso chamada
Simples. Quando h mais de duas variveis temos a Anlise de Regresso Mltipla.

Uma das suposies bsicas da Anlise de Correlao e Regresso que h
alguma teoria (ou evidncia emprica) que permita levantar hipteses sobre a
relao de dependncia entre as variveis, ou seja, que permita identificar variveis
dependente e independente(s)
7
. A teoria deve mostrar se esperamos associao
positiva ou negativa e em que grau. Por exemplo, ao avaliarmos o relacionamento
entre renda mensal em reais e rea em m
2
da residncia de uma famlia, esperamos
um relacionamento positivo entre ambas: para maior renda (independente)
esperamos maior rea (dependente).

Uma ou mais das variveis so chamadas de Independente(s): podem ser
uma ou mais variveis que o pesquisador manipulou para observar o efeito em
outra, ou mesmo variveis cuja medio possa ser feita de maneira mais fcil ou
precisa, sendo ento suposta sem erro.

H uma outra varivel, chamada de Dependente, seus valores seriam
resultado da variao dos valores das variveis Independentes
8
. Esta denominao
costuma levar a m interpretao do significado da correlao entre variveis: se
h correlao entre variveis significa que os seus valores variam em uma mesma
direo, ou em direes opostas, com uma certa fora, no significando
necessariamente que uma varivel depende das outras. Para tal concluso seria
necessrio a existncia de evidncias no estatsticas dessa dependncia, ou que
os valores fossem o resultado de um experimento estatstico (adequadamente

7
Na Anlise de Regresso Mltipla podem haver vrias variveis independentes mas apenas UMA dependente.
8
Veja as definies de variveis na seo 2.1.
58


planejado e executado) em que todas as outras causas da variao tivessem sido
eliminadas.

Para que seja possvel realizar uma Anlise de Correlao e/ou Regresso os
dados devem provir de observaes emparelhadas e em condies semelhantes. Se
estamos avaliando a correlao existente entre a altura e o peso de um determinado
grupo de crianas, por exemplo, o peso de uma determinada criana deve ser
medido e registrado no mesmo instante em que medida e registrada a sua altura.
Renda e rea da residncia da mesma famlia, no mesmo momento. Se houver mais
de duas variveis todas devem ser medidas no mesmo instante.

Outro aspecto s vezes negligenciado a quantidade suficiente de dados. Se
apenas alguns poucos dados foram coletados podemos chegar a algumas
concluses errneas:
- podemos descartar a correlao entre as variveis, embora ela realmente exista,
porque os dados foram insuficientes para mostr-la;
- podemos concluir que h correlao, que na realidade no significativa, porque
os dados mostraram apenas uma pequena parte do conjunto total, onde, talvez por
acaso, a correlao exista.

Por razes didticas vamos limitar nosso estudo ao relacionamento entre
duas variveis apenas, e aos casos de relacionamento linear (em que o
relacionamento pode ser descrito por uma equao de reta
9
). Se estamos
trabalhando com apenas duas variveis nosso primeiro passo construir um grfico
que mostre o relacionamento entre as variveis, um diagrama de disperso.

3.2.1 - Diagrama de Disperso

Se estamos analisando duas variveis quantitativas, cujas observaes
constituem pares ordenados, chamando estas variveis de X (independente) e Y
(dependente), podemos plotar o conjunto de pares ordenados (x,y) em um diagrama
cartesiano, que chamado de Diagrama de Disperso.


9
Ou linearizvel, que atravs de transformaes apropriadas transforme-se em uma reta.
59


Atravs do diagrama de disperso possvel ter uma idia inicial de como as
variveis esto relacionadas: a direo da correlao (isto , o que ocorre com os
valores de Y quando os valores de X aumentam, eles aumentam tambm ou
diminuem), a fora da correlao (em que taxa os valores de Y aumentam ou
diminuem em funo de X) e a natureza da correlao (se possvel ajustar uma
reta, parbola, exponencial, etc., aos pontos).

Vejamos os seguintes diagramas de disperso:

Figura 11 - Diagrama de disperso 1
o
caso

No diagrama ao lado percebemos dois aspectos bsicos:
- medida que a varivel X aumenta, os valores de Y tendem a aumentar tambm.
- seria perfeitamente possvel ajustar uma reta crescente que passasse por entre os
pontos (obviamente a reta no poderia passar por todos eles).
Conclumos ento que h correlao linear (porque possvel ajustar uma reta aos
dados) positiva (porque as duas variveis aumentam seus valores conjuntamente).



Figura 12.2 - Diagrama de disperso 2
o
caso
No diagrama ao lado percebemos dois aspectos bsicos:
- medida que a varivel X aumenta, os valores de Y tendem a diminuir.
60


- seria perfeitamente possvel ajustar uma reta decrescente que passasse por entre
os pontos.
Conclumos ento que h correlao linear (porque possvel ajustar uma reta aos
dados) negativa (porque quando uma das variveis aumenta seus valores e a outra
diminui).


Figura 13.3 - Diagrama de disperso 3
o
caso

No caso do diagrama ao lado bvio que h alguma espcie de correlao entre as
variveis: os pontos apresentam claramente um padro, semelhante a um crculo.
Contudo, no se trata de uma relao linear, pois seria totalmente inadequado
ajustar uma reta aos dados (os resduos seriam muito grandes). Assim, h
correlao, mas no linear.


Figura 144 - Diagrama de disperso 4
o
caso

No caso do diagrama ao lado bvio temos uma situao totalmente diversa dos
casos anteriores. NO H padro nos pontos, linear ou no linear, os pontos
parecem distribuir-se de forma aleatria. Ento, conclui-se que NO H
CORRELAO entre as duas variveis.
61



3.2.2 - Coeficiente de Correlao Linear de Pearson

Atravs do diagrama de disperso possvel identificar se h correlao
linear, e se a correlao linear positiva ou negativa. Quanto mais o diagrama de
disperso aproximar-se de uma reta mais forte ser a correlao linear.

interessante notar que alguns erroneamente confundem inexistncia de
correlao linear com inexistncia de correlao entre as duas variveis. Duas
variveis podem apresentar uma forte correlao no-linear, conforme visto na
seo anterior.

Se aps observar o diagrama de disperso decidir-se que razovel
considerar que as variveis possuem um relacionamento linear possvel mensurar
a direo e a fora desse relacionamento atravs de um coeficiente de correlao: o
coeficiente de correlao linear de Pearson. Este coeficiente chamado de
quando so usados dados da populao, e de r quando usados dados de uma
amostra (mais comum).

Trata-se de um coeficiente adimensional, amostral, que pode ser expresso por:

( ) ( )
Y X
n
1 i
i i
Y X
s s
1 n
y y x x
s s
) Y , X ( Cov
r

=
(1)

O numerador da expresso (1) chamado de Covarincia de X e Y, que permite
mensurar o relacionamento entre as variveis. A Covarincia dividida pelos
desvios padres de X e Y para que seja eliminado o efeito que uma varivel com
maiores valores numricos causaria no resultado.

A covarincia permite mensurar o relacionamento entre X e Y:
- quando os valores de X e Y so ambos grandes ou ambos pequenos (as distncias
em relao s mdias tm o mesmo sinal) a covarincia ser grande e positiva.
62


- quando o valor de X alto e o de Y baixo (ou vice-versa) a covarincia ser
grande e negativa.
dividindo-a por n-1 o seu valor no ser mais afetado pelo tamanho da amostra.

Apesar de vlida, a expresso (1) costuma levar a resultados que apresentam
substanciais erros de arredondamento. A forma do coeficiente de correlao linear
de Pearson mais utilizada (inclusive em calculadoras, programas estatsticos e
planilhas eletrnicas) :
( )
( ) ( )
(
(

\
|

(
(

\
|


=


= = = =
= = =
2
n
1 i
i
n
1 i
2
i
2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
y y n x x n
y x y x n
r
(2)

Para fazer os clculos preciso calcular a soma dos valores de X, a soma
dos valores de Y, a soma dos valores do produto XY, a soma dos quadrados dos
valores de X, a soma dos quadrados dos valores de Y e o nmero de valores da
amostra (n).

O coeficiente de correlao linear de Pearson pode variar de -1 a +1
(passando por zero), e adimensional
10
: se r = -1 significa que h uma correlao
linear negativa perfeita entre as variveis; se r = +1 significa que h uma correlao
linear positiva perfeita entre as variveis; e se r = 0 significa que no h correlao
linear entre as variveis. Admite-se que se |r| > 0,7 a correlao linear pode ser
considerada forte.

Novamente, um alto coeficiente de correlao linear de Pearson (prximo a
+1 ou a -1) no significa uma relao de causa e efeito entre as variveis, apenas
que as duas variveis apresentam aquela tendncia de variao conjunta.

Exemplo 3.5 - Estamos avaliando as mdias de 15 estudantes no 2
o
grau (ensino
mdio), relacionando-as com os ndices dos mesmos estudantes no seus cursos
universitrios. As mdias no segundo grau podem variar de 0 a 100, e os ndices na
universidade de 0 a 4. Construa um diagrama de disperso e calcule o coeficiente

10
Sem unidade.
63


de correlao linear de Pearson para os dados a seguir. Interprete os resultados
encontrados.
Mdia no 2
o

grau
ndice na
Universidade
80,0 1,0
82,0 1,0
84,0 2,1
85,0 1,4
87,0 2,1
88,0 1,7
88,0 2,0
89,0 3,5
90,0 3,1
91,0 2,4
91,0 2,7
92,0 3,0
94,0 3,9
96,0 3,6
98,0 4,0

Construindo o diagrama de disperso (h vrias planilhas eletrnicas e programas
estatsticos que podem fazer isso) obtemos:

Figura 155 - Diagrama de disperso: mdias no 2grau e ndices na universidade
Nosso primeiro passo definir qual varivel
independente (X) e qual a dependente (Y). Quem
pode ter influenciado quem? razovel imaginar
que a mdia no 2
o
grau dos estudantes tenha
influenciado de algum modo o ndice por eles obtidos
na universidade, simplesmente pelo fato de que
preciso cursar o 2
o
grau antes da universidade.
Assim sendo, X ser a mdia no 2
o
grau (varivel
independente) e Y ser o ndice na universidade
(varivel dependente).
Como ser o relacionamento entre estas
variveis? Novamente, o bom senso nos indica que a
valores altos de mdias no 2
o
grau devem
corresponder ndices altos na universidade:
esperamos uma correlao positiva.
64


Observando o diagrama da figura 3.5 conseguimos claramente vislumbrar que
h uma correlao positiva entre as duas variveis: de uma maneira geral, quanto
maior o valor da mdia no 2
o
grau maior o ndice na universidade. Alm disso,
podemos pensar em ajustar uma reta aos dados, que passasse por entre os pontos,
e tal reta seria crescente (pois a correlao positiva). Ento, por ser possvel
ajustar uma reta aos dados, e os valores das variveis caminham na mesma
direo, h uma correlao linear positiva entre mdia no 2
o
grau e ndice na
universidade, ao menos para este conjunto de dados.

A correlao linear forte? Quanto mais os pontos estiverem prximos da
reta hipottica ajustada aos dados mais forte ser a correlao. No diagrama da
figura 36 os pontos esto prximos uns dos outros, estariam a pouca distncia de
uma reta que passasse entre eles. Conclumos ento que a correlao linear deve
ser forte, o que resultar em um coeficiente de correlao linear de Pearson prximo
de 1. Vamos calcular o coeficiente, obtendo os somatrios necessrios.
Mdia no 2
o

grau X
ndice na
Universidade Y
X
2
Y
2
XY
80,0 1,0 6400 1,0 80,0
82,0 1,0 6724 1,0 82,0
84,0 2,1 7056 4,41 176,4
85,0 1,4 7225 1,96 119,0
87,0 2,1 7569 4,41 182,7
88,0 1,7 7744 2,89 149,6
88,0 2,0 7744 4,0 176,0
89,0 3,5 7921 12,25 311,5
90,0 3,1 8100 9,61 279,0
91,0 2,4 8281 5,76 218,4
91,0 2,7 8281 7,29 245,7
92,0 3,0 8464 9,0 276,0
94,0 3,9 8836 15,21 366,6
96,0 3,6 9216 12,96 345,6
98,0 4,0 9604 16,0 392,0

Sabe-se que n = 15 (h 15 alunos).
65


0 , 1335 x
15
1 i
i
=

=
5 , 37 y
15
1 i
i
=

=
( ) 0 , 119165 x
15
1 i
2
i
=

=
( ) 8 , 107 y
15
1 i
2
i
=

=

( ) 5 , 3400 y x
15
1 i
i i
=

=


Substituindo os valores na equao do coeficiente de correlao linear de Pearson:
( )
( ) ( )
[ ] ( ) [ ] ( )
2 2 2
n
1 i
i
n
1 i
2
i
2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
5 , 37 8 , 107 15 1335 119165 15
) 5 , 37 1335 ( 5 , 3400 15
y y n x x n
y x y x n
r


=
(
(

\
|

(
(

\
|


=


= = = =
= = =

r = 0,9

Corroborando nossas concluses anteriores, o coeficiente de correlao
linear de Pearson teve resultado positivo, e prximo de 1, indicando forte correlao
linear positiva entre a mdia no 2
o
grau e o ndice na universidade ao menos para
estes estudantes
11
.

O passo lgico seria obter uma equao que permitisse expressar o
relacionamento das variveis, de maneira que seja possvel fazer previses sobre a
varivel dependente a partir dos valores da varivel independente.

3.2.3 - Anlise de Regresso

A Anlise de Regresso tem por finalidade obter uma funo de regresso:
uma funo matemtica que exprima o relacionamento entre duas ou mais variveis.
Se apenas duas variveis esto envolvidas chama-se de regresso simples, se h
mais de uma varivel independente (e apenas uma dependente) chama-se de
regresso mltipla.

A funo de regresso explica grande parte da variao de Y com X. Uma
parcela da variao permanece sem ser explicada, e atribuda ao acaso. As
mesmas suposies gerais utilizadas na anlise de correlao so necessrias: a
existncia de uma teoria que "explique" o relacionamento entre as variveis, o

11
Na prtica no devemos utilizar uma quantidade de dados to pequena.
66


pareamento dos dados, a quantidade suficiente de dados, etc. Alm desses, para
realizar a Anlise de Regresso, seja linear (reta), exponencial, logartmica,
polinomial, etc., alguns pressupostos bsicos so necessrios:
- supe-se que h uma funo que justifica em mdia, a variao de uma varivel
em funo da variao da outra;
- os pontos experimentais (os pares x,y) tero uma variao em torno da linha
representativa desta funo, devido a uma variao aleatria adicional, chamada de
varincia residual ou resduo;
- a varivel X (varivel INDEPENDENTE) suposta sem erro.
- a varivel Y (varivel DEPENDENTE) ter uma variao nos seus valores
dependente
12
de X se houver regresso.
- a funo de regresso ser: Y = (X) + onde (X) a funo de regresso
propriamente dita e a componente aleatria de Y, devida ao acaso (e que
SEMPRE existir).
- a variao residual de Y em torno da linha terica de regresso segue uma
distribuio normal com mdia zero e desvio padro constante (independente dos
valores de X).


Figura 16 - Variao residual em torno da linha terica de regresso


12
Foi colocado entre aspas porque a existncia de regresso NO IMPLICA necessariamente em que Y
depende de X, apenas que elas tm uma variao relacionada, que pode ser causada por uma outra varivel.
67


- para se decidir pela utilizao de um modelo de regresso devem existir evidncias
NO ESTATSTICAS que indiquem relao causal entre as variveis (alguma lei da
fsica por exemplo, como a Lei de Hook).

Uma vez conhecida a forma da linha de regresso o problema resume-se a
estimar seus parmetros.



3.2.4 - Anlise de Regresso Linear Simples

Restringe-se a anlise a apenas DUAS variveis, e supe-se que a linha
terica de regresso uma reta. Este modelo bastante difundido porque muitos
relacionamentos entre variveis podem ser descritos atravs de uma reta, seja
utilizando os dados originais, seja aps aplicar alguma transformao (logartmica,
exponencial, etc.) a eles que cause a linearizao da curva.

A reta terica ser Y = + X e os coeficientes e sero estimados
atravs dos valores amostrais a e b respectivamente:
$
Y a bX = == = + ++ + , onde
$
Y a
estimativa de Y, b o coeficiente angular da reta (a sua inclinao), e a o
coeficiente linear (o ponto onde a reta toca o eixo Y).

A melhor reta ser encontrada pelo mtodo dos mnimos quadrados: so
encontrados os coeficientes a e b que minimizam os quadrados dos desvios de cada
ponto do diagrama de disperso em relao a uma reta terica. Temos os seguintes
valores de a e b:
( )
( )
2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
x x n
y x y x n
b
|

\
|


=


= =
= = =

n
x b y
a
n
1 i
i
n
1 i
i
= =

=


Muitas calculadoras j tm estas frmulas programadas em um mdulo
estatstico (juntamente com a frmula do coeficiente de correlao linear de
68


Pearson). Alm disso, planilhas eletrnicas e programas estatsticos tambm fazem
tais clculos.

Exemplo 3.6 - Calcule os coeficientes da reta de mnimos quadrados para os dados
do Exemplo 3.5.

Conforme visto no Exemplo 3.5 as variveis mdia no 2
o
grau e ndice na
universidade apresentam alta correlao linear positiva, o que mostrado pelo
diagrama de disperso e pelo coeficiente de correlao linear de Pearson. Ajustar
uma reta aos dados parece ser uma boa idia, e todos os somatrios necessrios
foram calculados no Exemplo 3.5, a saber:

0 , 1335 x
15
1 i
i
=

=
5 , 37 y
15
1 i
i
=

=

( ) 0 , 119165 x
15
1 i
2
i
=

=
( ) 5 , 3400 y x
15
1 i
i i
=

=

n = 15

Substituindo os valores nas equaes de b e a:
( )
( )
( )
18 , 0
1335 119165 15
) 5 , 37 1335 ( 5 , 3400 15
x x n
y x y x n
b
2 2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
=


=
|

\
|


=


= =
= = =


52 , 13
15
1335 18 , 0 5 , 37
n
x b y
a
n
1 i
i
n
1 i
i
=

=

=

= =


A equao da reta ser ento: X 18 , 0 52 , 13 Y

+ =
Vejamos como ficaria o diagrama de disperso com a reta acima traada sobre ele.

69


80 82 84 86 88 90 92 94 96 98 100
0.90
1.22
1.54
1.86
2.18
2.50
2.82
3.14
3.46
3.78
4.10
Y = -13.520 + (.180 * X)
Mdias dos estudantes no 2o grau

n
d
ic
e

d
o
s

e
s
t
u
d
a
n
t
e
s

n
a

u
n
iv
e
r
s
id
a
d
e

Figura 17 - Diagrama de disperso: mdia no 2 grau e ndice na universidade - reta
ajustada
Diversos programas estatsticos e mesmo planilhas eletrnicas (como o
Microsoft Excel) permitem obter os coeficientes de mnimos quadrados para vrios
modelos de regresso: linear, polinmios de vrios graus, logartmico, exponencial,
potncia, entre outros.
Neste ponto interessante apresentar alguns argumentos a favor da
quantidade suficiente de dados em estudos de correlao e regresso. Observe
atentamente as figuras a seguir.



Figura 3.8 - Diagrama de disperso - poucos dados - 1
o
caso
H apenas seis pontos neste
diagrama, e por sua disposio
possvel perceber que h forte
correlao linear entre as variveis.
O coeficiente de correlao
linear de Pearson foi calculado, est
no canto superior da figura, e igual a
0,9945, quase igual a 1, indicando
fortssima correlao linear positiva.
A reta traada por entre os
pontos quase passa por todos eles, e
trata-se de uma reta crescente
(coeficiente angular igual a 0,440, no
canto superior direito da figura).
Mas, a quantidade de dados
muito pequena, e se ocorresse um
valor discrepante. Veja o que acontece
na figura 3.9.
70




Figura 3.9 - Diagrama de disperso - poucos dados - 2
o
caso

Imagine agora uma situao em que fosse possvel coletar uma grande
quantidade de dados, para as mesmas duas variveis, e um diagrama de disperso
fosse construdo, tal como o da figura 3.10.




Foi acrescentado apenas um
ponto ao conjunto mostrado na figura
3.8. Mas este ponto discrepante, no
canto inferior direito da figura, e seu
efeito foi devastador, devido
pequena quantidade de dados.
O coeficiente de correlao
linear caiu para -0,044, indicando
correlao linear quase nula, e a reta
que era crescente passou a ser
decrescente (coeficiente angular igual
a -0,031). Decises tomadas a partir
deste conjunto poderiam ser
tremendamente prejudicadas,
simplesmente devido pequena
quantidade de dados.
71



Figura 3.10 - Diagrama de disperso com muitos dados - 1
o
caso


Figura 3.1118 - Diagrama de disperso com muitos dados - 2
o
caso

Sempre que possvel devemos coletar a maior quantidade possvel de dados,
seja regresso simples ou mltipla, para que o modelo obtido seja robusto e no
sofra grandes alteraes devido aos valores discrepantes.
Pela disposio dos dados
fcil perceber que h correlao linear
positiva entre as variveis. H uma
"nuvem" de pontos que indica que a
medida que aumentam os valores de X
aumentam os de Y.
O coeficiente de correlao
linear de Pearson vale 0,9395,
indicando forte correlao linear
positiva.
A reta ajustada aos dados
crescente, com o coeficiente angular
valendo 0,3894.
Devido grande quantidade de
dados mesmo que ocorram alguns
valores discrepantes seu efeito no
ser to marcante quanto foi no caso
mostrado na figura 3.9. Veja a figura
3.11.
Apesar do valor discrepante
(no canto inferior direito da figura
3.11), no houve grande mudana na
equao da reta e no coeficiente de
correlao linear de Pearson.
O coeficiente de correlao
linear de Pearson caiu de 0,9395 para
0,8001, ainda indicando forte
correlao linear positiva, um visvel
contraste com o que ocorreu na figura
3.9.
J o coeficiente angular da reta
caiu menos ainda, de 0,3894 para
0,3545, indicando robustez no modelo.
72


3.2.5 - Coeficiente de Determinao

Alguns novos conceitos precisam ser introduzidos:

Y a mdia aritmtica dos valores observados de Y.
$
Y constitui um valor genrico predito de Y atravs do modelo de regresso
(qualquer modelo).
( ) Y Y
2
: medida da variabilidade total dos dados em torno da mdia de Y.
(
$
) Y Y
2
: medida da parcela da variabilidade dos dados em torno da mdia de
Y explicada pela regresso.
(
$
) Y Y
2
: medida da parcela da variabilidade dos dados em torno da mdia de
Y no explicada pela regresso, chamada tambm de variao residual.
E: ( ) Y Y
2
= (
$
) Y Y
2
+ (
$
) Y Y
2
(a soma da variao
explicada com a
variao residual resulta na variao total).

Neste ponto interessante introduzir coeficiente de determinao r
2
. Este
coeficiente descreve a proporo da variabilidade mdia de Y que explicada pela
variao de X atravs do modelo de regresso (QUALQUER modelo). Sua frmula
geral :
( )
( )
total incia var
explicada varincia
y y
y y
r
n
1 i
2
i
n
1 i
2
i
2
=

=
=


Para o caso linear o coeficiente de determinao ser simplesmente o
quadrado do coeficiente de correlao linear de Pearson (r), e como ele ser um
valor adimensional, mas pode variar apenas de 0 a +1.O coeficiente de
determinao uma boa medida da aderncia do modelo de regresso aos dados,
quanto mais prximo de +1 maior a parcela da variabilidade mdia total de Y que
explicada pela variao de X atravs do modelo.

73


A partir de que valor o modelo de regresso adequado? Para coeficientes
de determinao superiores a 0,5 (mais de 50% da variabilidade mdia total de Y
explicada pela variao de X atravs do modelo de regresso). Para o caso linear
isso significa que o mdulo do coeficiente de correlao linear deve ser maior do que
0,7 para que a regresso linear seja uma boa opo.

Exemplo 3.7 - Calcule e interprete o resultado do coeficiente de determinao para o
modelo linear ajustado no Exemplo 3.6.
Como se trata de um modelo linear, podemos obter o coeficiente de
determinao elevando o coeficiente de correlao linear de Pearson (calculado no
Exemplo 3.5) ao quadrado.
r
2
= 0,9
2
= 0,81
Em mdia 81% da variabilidade de Y pode ser "explicada" pela variabilidade de X
atravs do modelo linear X 18 , 0 52 , 13 Y

+ = .

O valor do r
2
substancialmente maior do que 0,5, indicando que o modelo
linear apropriado para os dados (corroborando as concluses dos Exemplos 3.5 e
3.6).

Embora til, o coeficiente de determinao no suficiente para avaliar se um
modelo de regresso apresenta bom ajuste aos dados. Precisamos fazer uma
anlise dos resduos do modelo.


3.2.6 - Anlise de resduos

Idealmente a adequao de um modelo de regresso realizada atravs da
anlise dos seus resduos. Os resduos so as diferenas entre os valores
observados da varivel independente e os valores preditos da varivel independente
atravs do modelo de regresso. Para tornar a anlise mais confivel, sem que as
grandezas dos resduos venham a prejudic-la recomenda-se padronizar os
resduos: calcula-se o desvio padro dos resduos e divide-se cada um deles pelo
desvio padro.

74


Para fazer a anlise de resduos precisamos construir pelo menos dois diagramas de
disperso:
- um que relacione os resduos padronizados com os prprios valores preditos da
varivel independente;
- outro que relacione os resduos padronizados com os valores da varivel
independente
13
.

Se o modelo de regresso adequado os resduos padronizados no podem
apresentar quaisquer padres, eles devem distribuir-se de forma aleatria nos dois
diagramas, atendendo os seguintes critrios:
- a quantidade de resduos padronizados positivos deve ser aproximadamente igual
quantidade de negativos.
- a grandeza dos resduos padronizados positivos deve ser aproximadamente igual a
dos negativos, para todos os valores preditos da varivel dependente, e para todos
os valores da varivel independente.
- no pode haver padres no aleatrios (tendncias crescentes ou decrescentes,
curvas, etc.) em nenhum dos diagramas.
Somente se todas estas condies forem satisfeitas que podemos considerar o
modelo de regresso apropriado. Se houver dois ou mais modelos apropriados
escolhemos o mais simples, ou aquele que apresentar o mais alto coeficiente de
determinao. Os diagramas deveriam ser como a figura 3.12.
Resduos padronizados
Valores
preditos
ou X

Figura 3.1219 - Formato esperado dos resduos se modelo apropriado

Exemplo 3.8 - Estamos avaliando o relacionamento entre as variveis venda de
refrigerantes e temperatura ambiente nos meses de vero. Na figura 3.13 vemos o
diagrama de disperso das duas variveis (temperatura a independente e vendas

13
Se houver mais de uma varivel independente faz-se um diagrama de disperso para cada uma delas.
75


a dependente), com dois modelos ajustados atravs do Microsoft Excel: reta e
parbola (polinmio de 2
o
grau). Queremos saber qual dos dois modelos mais
apropriado atravs da anlise de seus resduos. As figuras 3.14 e 3.15 apresentam
os diagramas de disperso dos resduos padronizados (em funo da temperatura e
dos valores preditos pelo modelo de regresso) para a reta, e as figuras 3.16 e 3.17
apresentam os respectivos diagramas para a parbola.
a) Faa a anlise do diagrama de disperso das variveis. Na sua opinio qual dos
modelos apresenta o melhor ajuste aos dados?
b) Faa a anlise dos resduos para o modelo da reta.
c) Faa a anlise dos resduos para o modelo da parbola.
d) Com base nas respostas anteriores, qual dos dois modelos parece ser o mais
apropriado para descrever o relacionamento entre as variveis?
e) Utilizando o modelo escolhido no item d, faa a previso de vendas para os
seguintes valores de temperatura:
e.1 - 27
o
C e.2 - 32
o
C e.3 - 38
o
C
y = 248.67x - 6668.2
R
2
= 0.8049
y = 26.477x
2
- 1438.6x + 20112
R
2
= 0.8631
0
500
1000
1500
2000
2500
3000
3500
25 27 29 31 33 35 37 39
Temperatura
V
e
n
d
a
s

Figura 3.1320 - Diagrama de disperso vendas por temperatura: ajuste de reta e
parbola

a) Observando o diagrama podemos ver que a parbola (polinmio de 2
o
grau)
aparenta ter melhor ajuste aos dados, pois ela "segue" melhor o seu comportamento
do que a reta. Os resduos do modelo de parbola provavelmente sero menores do
que os da reta, o que pode ser constatado tambm pelo seu coeficiente de
determinao (0,8631), que maior do que o da reta (0,8049). Ambos os modelos,
76


porm, conseguem "explicar" grande parte da variao mdia das vendas, pois seus
coeficientes de determinao so substancialmente maiores do que 0,5.

Resduos para reta
-4
-3
-2
-1
0
1
2
3
4
25 30 35 40
Temperatura
R
e
s

d
u
o
s

p
a
d
r
o
n
i
z
a
d
o
s

Figura 3.14 - Resduos da reta por temperatura
Resduos para reta
-4
-3
-2
-1
0
1
2
3
4
-500 0 500 1000 1500 2000 2500 3000
Valores preditos
R
e
s

d
u
o
s

p
a
d
r
o
n
i
z
a
d
o
s

Figura 3.1521 - Resduos da reta por valores preditos
b) Devemos levar em conta os trs aspectos mencionados anteriormente.
- Nmero de resduos positivos e negativos. Aparentemente a quantidade de
resduos padronizados positivos e negativos semelhante (deveramos cont-los
77


por meio de algum procedimento computacional), a linha do zero parece "dividir" o
nmero de pontos em duas partes iguais em ambos os diagramas.
- Grandeza dos resduos positivos e negativos. A maioria esmagadora dos pontos
positivos concentra-se abaixo de 2 desvios padres (linha do 2), e maioria dos
negativos tambm (acima da linha -2), em ambos os diagramas.
- Existncia de padres. H claramente padro em ambos os diagramas. Para
valores menores de temperatura e valores preditos os resduos so positivos e
maiores. medida que a temperatura e os valores preditos vo aumentando os
valores dos resduos vo diminuindo, tornando-se negativos, at que passam a subir
novamente. Em outras palavras, o comportamento dos resduos do modelo da reta
NO ALEATRIO.

Resduos para parbola
-4
-3
-2
-1
0
1
2
3
4
25 30 35 40
Temperatura
R
e
s

d
u
o
s

p
a
d
r
o
n
i
z
a
d
o
s

Figura 3.1622 - Resduos da parbola por temperatura
78


Resduos para parbola
-4
-3
-2
-1
0
1
2
3
4
500 1000 1500 2000 2500 3000
Valores preditos
R
e
s

d
u
o
s

p
a
d
r
o
n
i
z
a
d
o
s

Figura 3.1723 - Resduos da parbola por valores preditos

c) Para o caso da parbola vamos avaliar novamente os trs aspectos.
- Nmero de resduos positivos e negativos. A quantidade de resduos positivos e
negativos aparentemente bastante semelhante em ambos os diagramas (a linha
do zero divide os pontos em duas "metades" similares).
- Grandeza dos resduos positivos e negativos. Em ambos os diagramas os resduos
positivos e negativos tm grandezas semelhantes, distantes no mximo a 2 desvios
padres do zero, para a maioria dos pontos.
- Existncia de padres. Em ambos os diagramas NO so identificados padres, os
pontos parecem distribuir-se de forma aleatria, formando uma "nuvem".

d) Com base na anlise de resduos o modelo da parbola (polinmio de 2
o
grau) o
mais apropriado para descrever o relacionamento entre vendas de refrigerante e
temperatura ambiente, porque os seus resduos distribuem-se aleatoriamente, tanto
em funo dos valores da varivel independente quanto dos valores preditos pelo
prprio modelo.

e) O modelo de parbola estimado pelo Microsoft Excel (ver figura 3.13, sendo Y =
Vendas e X = Temperatura):
79


Vendas = 26,477Temperatura
2
- 1438,6 Temperatura + 20112
Para fazer as previses basta substituir os valores da temperatura na equao
acima.
e.1 - 27
o
C: Vendas = 26,477 (27)
2
- 1438,6 27 + 20112 = 571,533
e.2 - 32
o
C: Vendas = 26,477 (32)
2
- 1438,6 32 + 20112 = 1189,248
e.3 - 38
o
C: Vendas = 26,477 (38)
2
- 1438,6 38 + 20112 = 3677,988


Exemplo 3.9 - A figura 3.18 apresenta o diagrama de disperso dos resduos
padronizados por valores preditos para o modelo ajustado no Exemplo 3.6. Faa a
anlise dos resduos. O modelo adequado?
0.700 1.050 1.400 1.750 2.100 2.450 2.800 3.150 3.500 3.850
-3.0
-2.4
-1.8
-1.2
-0.6
0.0
0.6
1.2
1.8
2.4
Resduos de ndice (Y)
Valores preditos
R
e
s

d
u
o
s

P
a
d
r
o
n
i
z
a
d
o
s

Figura 3.1824 - Resduos padronizados por valores preditos: ndices na universidade
x mdias no 2
o
grau

Este exemplo contm apenas 15 dados, o que torna a anlise dos seus resduos
menos conclusiva que a do Exemplo 3.8.
- Nmero de resduos positivos e negativos. H 5 resduos positivos e 10 negativos.
- Grandeza dos resduos. Excetuando um nico ponto discrepante positivo todos os
resduos encontram-se a 1,2 desvios padres de zero.
- Existncia de padres. Aparentemente no h padres nos pontos, mas torna-se
difcil uma concluso final devido pequena quantidade de dados.
80


O modelo da reta pode ser considerado adequado, no obstante a diferena entre o
nmero de resduos positivos e negativos, devido pequena quantidade de pontos,
e o fato de que apesar de tudo no h um padro nos pontos.

81


4 - ANLISE DE SRIES TEMPORAIS


Srie Temporal um conjunto de observaes sobre uma varivel, ordenado
no tempo, e registrado em perodos regulares. Podemos enumerar os seguintes
exemplos de sries temporais: temperaturas mximas e mnimas dirias em uma
cidade, vendas mensais de uma empresa, valores mensais do IPC-A, valores de
fechamento dirios do IBOVESPA, resultado de um eletroencefalograma, grfico de
controle de um processo produtivo.

A suposio bsica que norteia a anlise de sries temporais que h um
sistema causal mais ou menos constante, relacionado com o tempo, que exerceu
influncia sobre os dados no passado e pode continuar a faz-lo no futuro. Este
sistema causal costuma atuar criando padres no aleatrios que podem ser
detectados em um grfico da srie temporal, ou mediante algum outro processo
estatstico.

O objetivo da anlise de sries temporais identificar padres no aleatrios
na srie temporal de uma varivel de interesse, e a observao deste
comportamento passado pode permitir fazer previses sobre o futuro, orientando a
tomada de decises.
Vamos ver alguns grficos de sries temporais.
Companhia area
Meses
N

m
e
r
o

d
e

p
a
s
s
a
g
e
i
r
o
s
0
100
200
300
400
500
600
700
0
100
200
300
400
500
600
700
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150

Figura 4.125 - Nmero de passageiros transportados
82



Que padres no aleatrios podemos identificar na figura 4.1?
- observe que h uma tendncia crescente no nmero de passageiros transportados.
- h uma sucesso regular de "picos e vales" no nmero de passageiros
transportados, isso deve ser causado pelas oscilaes devido a feriados, perodos
de frias escolares, etc., que esto geralmente relacionados s estaes do ano, e
que se repetem todo ano (com maior ou menor intensidade).

Em outras palavras, identificamos dois padres que podem tornar a ocorrer
no futuro: crescimento no nmero de passageiros transportados, flutuaes
sazonais. Tais padres poderiam ser incorporados a um modelo estatstico,
possibilitando fazer previses que auxiliaro na tomada de decises.
Grfico de Controle p - amostras com 300 elementos
Amostras
0.00000
.017467
.040157
1 5 10 15 20 25

Figura 4.226 - Grfico de controle: frao de defeituosos

Na figura 4.2 temos uma srie temporal particular, trata-se de um grfico de
controle de frao de defeituosos, bastante utilizado em Controle Estatstico da
Qualidade para avaliar se um processo produtivo est estvel, e portanto previsvel.
Neste caso, no queremos que haja padres no aleatrios, se eles existirem o
processo est fora de controle estatstico, instvel e imprevisvel, e no podemos
garantir a qualidade dos produtos resultantes: precisamos atuar sobre o processo e
fazer as correes necessrias.

83


O problema fundamental utilizar um modelo que permita incluir os vrios
tipos de padres, possibilitando realizar previses. O ponto de partida realizar a
decomposio da srie em padres.




4.1 - MODELO CLSSICO DAS SRIES TEMPORAIS


Segundo o modelo clssico todas as sries temporais so compostas de
quatro padres:
- tendncia (T), que o comportamento de longo prazo da srie, que pode ser
causada pelo crescimento demogrfico, ou mudana gradual de hbitos de
consumo, ou qualquer outro aspecto que afete a varivel de interesse no longo
prazo;
- variaes cclicas ou ciclos (C), flutuaes nos valores da varivel com durao
superior a um ano, e que se repetem com certa periodicidade
14
, que podem ser
resultado de variaes da economia como perodos de crescimento ou recesso, ou
fenmenos climticos como o El Nio (que se repete com periodicidade superior a
um ano);
- variaes sazonais ou sazonalidade (S), flutuaes nos valores da varivel com
durao inferior a um ano, e que se repetem todos os anos, geralmente em funo
das estaes do ano (ou em funo de feriados ou festas populares, ou por
exigncias legais, como o perodo para entrega da declarao de Imposto de
Renda);
- variaes irregulares (I), que so as flutuaes inexplicveis, resultado de fatos
fortuitos e inesperados como catstrofes naturais, atentados terroristas como o de
11 de setembro de 2001, decises intempestivas de governos, etc.

Chamando a varivel de interesse de Y, a equao de sua srie temporal
seria: Y = f(T,C,S,I)



14
Alguns autores no incluem as variaes cclicas no modelo clssico da srie temporal.
84


Podemos observar as componentes nas figuras 4.3 e 4.4.

Vendas e tendncia linear
0
200
400
600
800
1000
1200
1400
janeiro-65 janeiro-70 janeiro-75 janeiro-80 janeiro-85 janeiro-90 janeiro-95 janeiro-00
Vendas
Tendncia

Figura 4.327 - Srie original e tendncia linear

Na figura 4.3 podemos observar uma srie temporal de vendas (em milhes
de dlares), e a componente tendncia, no caso uma reta (tendncia linear), que
mostra um crescimento no longo prazo.

Na figura 4.4 podemos observar as trs outras componentes. Observe que a
cada 5 ou 6 anos ocorre um ciclo, uma mudana nos valores da varivel (a linha
azul). H tambm variaes sazonais, que se repetem todos os anos, devido
provavelmente s estaes (a linha vermelha). Por fim, h variaes errticas, que
no apresentam regularidade, mas que talvez relacionem-se com eventos
inesperados ocorridos no perodo, as variaes irregulares (linha verde).

85


Variaes cclicas, sazonais e irregulares
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
janeiro-65 janeiro-70 janeiro-75 janeiro-80 janeiro-85 janeiro-90 janeiro-95 janeiro-00
Ciclos
Sazonais
Irregulares

Figura 4.428 - Componentes cclicas, sazonais e irregulares

A questo crucial do modelo clssico decidir como ser a equao que
relaciona as componentes com a varivel. H duas opes: o modelo aditivo ou o
modelo multiplicativo.
No modelo aditivo o valor da srie (Y) ser o resultado da soma dos valores
das componentes (que apresentam a mesma unidade da varivel):

Y = T + C + S + I ou Y = T + C + I (se os dados forem registrados anualmente)

Na prtica no temos como incluir a componente irregular no modelo, pois ela
resultado de fatos fortuitos.

O modelo aditivo, embora simples, no apresenta bons resultados na prtica,
fazendo com que fosse preterido em funo do modelo multiplicativo, no qual o
produto das componentes resultar na varivel da srie:

Y = T C S I ou Y = T C I (se os dados forem registrados anualmente)

Novamente, no inclumos a componente irregular. H, porm, uma diferena
crucial: apenas a tendncia tem a mesma unidade da varivel. As demais
86


componentes tm valores que modificam a tendncia: assumem valores em torno de
1 (se maiores do que 1 aumentam a tendncia, se menores diminuem a tendncia,
se exatamente iguais a 1 no causam efeito). Volte figura 4.4, observe a escala
vertical do grfico das componentes cclicas, sazonais e irregulares: so valores
prximos de 1, enquanto a escala da figura 4.3 temos a mesma escala para o valor
original da srie e a tendncia (em milhes de dlares). Isso ocorreu porque
decompusemos a srie temporal usando um modelo multiplicativo.

Vamos ento obter as componentes da srie temporal atravs do modelo
multiplicativo.



4.2 - OBTENO DA TENDNCIA


A tendncia descreve o comportamento da varivel retratada na srie
temporal no longo prazo. H dois objetivos bsicos na sua identificao: avaliar o
seu comportamento para utiliz-lo em previses, ou remov-la da srie para facilitar
a visualizao das outras componentes. A obteno da tendncia pode ser feita de
duas formas: atravs de um modelo de regresso (como o modelo linear - reta) ou
atravs de mdias mveis.

4.2.1 - Obteno de tendncia linear

Utiliza o mtodo dos mnimos quadrados para obter os coeficientes da reta
que melhor se ajusta aos dados. A diferena aqui que a varivel independente
ser sempre o tempo (mensurado diretamente, por exemplo anos de 1970, 1971, ou
atravs de contagem de perodos, 1, 2, 3). importante ressaltar que atravs de
programas estatsticos, ou mesmo uma planilha eletrnica como o Microsoft Excel
possvel ajustar outros modelos que no o linear.

Para o caso linear, a reta de tendncia : T = a + bt

87


Onde T o valor da tendncia, t o valor do tempo, b o coeficiente angular
da reta (se positivo indica tendncia crescente, se negativo a tendncia
decrescente) e a o coeficiente linear da reta. As equaes dos coeficientes esto
expressas a seguir.

( )
( )
2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
t t n
y t y t n
b
|

\
|


=


= =
= = =

n
t b y
a
n
1 i
i
n
1 i
i
= =

=

Onde y
i
um valor qualquer da varivel registrada na srie temporal, t
i
o
perodo associado a y
i
, e n o nmero de perodos da srie. Para encontrar os
coeficientes basta calcular os somatrios (tal como em anlise de regresso linear
simples).

Exemplo 4.1 - Os dados abaixo apresentam o patrimnio lquido (em milhes de
reais) de um banco de 1985 a 1995. Supondo que o modelo linear seja apropriado
para descrever a tendncia da srie, encontre os coeficientes da reta de mnimos
quadrados. Faa a previso de tendncia para os anos de 1996 e 1997.
Ano Patrimnio
(R$1.000.000)
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
30
32
32
35
37
38
42
41
44
46
47
A varivel dependente o saldo de vendas: ser o Y. H 11 perodos: n = 11.
O prximo passo encontrar os somatrios necessrios para obter os coeficientes.
Mas ao invs de usarmos os anos, o que poderia complicar nossos clculos, vamos
88


trabalhar com perodos, sendo 1985 o perodo 1, 1986 o 2 e assim por diante. A
tabela ficaria ento (j incluindo as colunas t y e t
2
):
Ano Patrimnio (Y)
(R$1.000.000)
Tempo (t) t.Y t
2

1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
30
32
32
35
37
38
42
41
44
46
47
1
2
3
4
5
6
7
8
9
10
11
30
64
96
140
185
228
294
328
396
460
517
1
4
9
16
25
36
49
64
81
100
121
Soma 424 66 2768 506
Substituindo os valores nas equaes:
( )
( )
76 , 1
) 66 ( 506 11
424 66 2768 11
t t n
y t y t n
b
2 2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
=


=
|

\
|


=


= =
= = =

96 , 27
11
) 66 76 , 1 ( 424
n
t b y
a
n
1 i
i
n
1 i
i
=

=

=

= =

Ento a equao de tendncia : T = 27,96 + 1,76 t
O ano de 1996 corresponder ao perodo 12, e 1997 ao perodo 13 da srie
temporal. Substituindo estes valores na equao acima:
T
1996
= 27,96 + (1,76 12) = 49,08
T
1997
= 27,96 + (1,76 13) = 50,84
Podemos ento apresentar um grfico (feito no Microsoft Excel) da srie original, a
reta de tendncia e a projeo para os anos de 1996 e 1997.
89


25
30
35
40
45
50
55
85 86 87 88 89 90 91 92 93 94 95 96 97
ano
p
a
t
r
i
m

n
i
o

(
U
S
$
1
.
0
0
0
.
0
0
0
,
0
0
)

srie
projeo
tendncia

Figura 4.529 - Patrimnio lquido de um banco: srie anual, tendncia linear e
projeo

4.2.2 - Obteno de tendncia por mdias mveis

Quando a tendncia de uma srie no linear
15
podemos obt-la por mdias
mveis. Calcula-se a mdia dos primeiros n perodos da srie, colocando o resultado
no perodo exatamente no centro deles. Progressivamente, vamos acrescentando
um perodo seguinte e desprezando o primeiro da mdia imediatamente anterior, e
calculando novas mdias, que vo se movendo at o fim da srie. O nmero de
perodos (n) chamado de ordem da srie.

Exemplo 4.2 - Considere os dados do Exemplo 4.1. Obtenha a tendncia da srie
por mdias mveis de 3 perodos.
Ano
Patrimnio
(R$1.000.000)
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
30
32
32
35
37
38
42
41
44
46
47


15
No possvel ajustar uma reta, ou outra curva que possa ser linearizada (como logartmica, exponencial, etc.).
90


Devemos juntar os perodos de 3 em 3, sempre acrescentando o prximo e
desprezando o primeiro do grupo anterior, colocando o resultado no perodo central
(2
o
perodo):
1985 - 1986 - 1987 com resultado em 1986; 1986 - 1987 - 1988 com resultado em
1987;
1987 - 1988 - 1989 com resultado em 1988; 1988 - 1989 - 1990 com resultado em
1989;
1989 - 1990 - 1991 com resultado em 1990; 1990 - 1991 - 1992 com resultado em
1991;
1991 - 1992 - 1993 com resultado em 1992; 1992 - 1993 - 1994 com resultado em
1993;
1993 - 1994 - 1995 com resultado em 1994.

A tabela com os resultados:
Ano Saldo (Y)
(R$1.000.000)
Total Mvel 3
perodos
Mdia Mvel 3
perodos
1985 30 - -
1986 32 94 31,33
1987 32 99 33
1988 35 104 34,67
1989 37 110 36,67
1990 38 117 39
1991 42 121 40,33
1992 41 127 42,33
1993 44 131 43,67
1994 46 137 45,67
1995 47 - -

Observe que ao calcularmos mdias mveis alguns perodos ficam sem
tendncia, porque os resultados das mdias so postos no centro dos perodos. Se
a mdia mvel fosse de 5 perodos o resultado seria colocado no 3
o
perodo.
91


E o que aconteceria se o nmero de perodos fosse par? Se pudermos
escolher, devemos escolher um nmero mpar de perodos, para que o resultado
seja colocado em um perodo central que tem correspondente na srie temporal.

Contudo, se a srie temporal for registrada trimestralmente, e queremos obter
a sua tendncia por mdias mveis, devemos utilizar mdias mveis de 4 perodos
(porque h 4 trimestres no ano), para que possamos obter a tendncia sem
influncia da sazonalidade. Se a srie for registrada mensalmente, devemos utilizar
mdias mveis de 12 perodos. Nestes dois casos os perodos "centrais" (que
comeariam em 2,5
o
e 6,5
o
respectivamente) no tm correspondente na srie
original, o que tornar impossvel remover a tendncia da srie para observar outras
componentes e tornar no mnimo questionveis as projees feitas. As mdias
mveis precisam ser centralizadas: calculam-se novas mdias mveis, a partir
daquelas calculadas com 4 ou 12 perodos, mas agora de 2 perodos, fazendo com
que seus resultados sejam colocados em perodos que tm correspondentes na
srie.

Exemplo 4.3 - Uma corretora de seguros est avaliando os contratos obtidos ao
longo de vrios anos. A srie foi registrada trimestralmente. Obtenha a tendncia da
srie utilizando mdias mveis.

Trimestre
Ano I II III IV
1993
1994
1995
24
20
15
21
20
14
11
7
5
9
6
6


Como a srie registrada trimestralmente, e a tendncia deve ser obtida por mdias
mveis, preciso calcular mdias mveis de 4 perodos, pois h 4 trimestres no ano.
Contudo, como este nmero de perodos par, mdias mveis de 2 perodos,
calculadas a partir daquelas de 4 perodos, precisam ser obtidas para obter
resultados centrados.

92


Trimestre
No. de
Contratos
Total Mvel
4 perodos
Total Mvel 2
perodos
(centrado)
Mdia Mvel 2
perodos (centrada)
1993 I 24

1993 II 21
65
1993 III 11 126 15,75
61
1993 IV 9 121 15,125
60
1994 I 20 116 14,5
56
1994 II 20 109 13,625
53
1994 III 7 101 12,625
48
1994 IV 6 90 11,25
42
1995 I 15 82 10,25
40
1995 II 14 80 10
40
1995 III 5

1995 IV 6


As linhas mais escuras na tabela acima indicam os perodos "centrais" das
mdias mveis de ordem 4, que no tm correspondente na srie original. Para
facilitar o nosso trabalho calculamos apenas os totais mveis de 4 perodos,
acompanhe:
93


- os primeiros 4 perodos so os 4 trimestres de 1993: 1993 I, 1993 II, 1993 III, 1993
IV; o total mvel deles (igual a 65) deve ficar no centro destes perodos, ou seja
entre 1993 II e 1993 III, que um perodo inexistente na srie original;
- em seguida desprezamos 1993 I e inclumos 1994 I: 1993 II, 1993 III, 1993 IV,
1994 I; o total mvel (igual a 61) deve ficar entre 1993 III e 1993 IV, novamente
inexistente na srie original;
- prosseguimos at os 4 ltimos perodos: 1995 I, 1995 II, 1995 III, 1995 IV; o total
mvel (igual a 40) deve ficar entre 1995 II e 1995 III.

Agora precisamos centralizar obter as mdias mveis centradas.
Primeiramente calculamos os totais mveis de 2 perodos, juntando 2 totais mveis
de 4 perodos calculados anteriormente:
- o total mvel de 4 perodos que est entre 1993 II e 1993 III, com o que est entre
1993 III e 1993 IV, cujo resultado (126) dever ficar em 1993 III (passando a ter
correspondente na srie original);
- o total mvel de 4 perodos que est entre 1993 III e 1993 IV, com o que est entre
1993 IV e 1994 I, cujo resultado (121) dever ficar em 1993 IV (passando a ter
correspondente na srie original);
- prosseguimos at os ltimos 2 totais mveis de 4 perodos: entre 1995 I e 1995 II, e
entre 1995 II e 1995 III, cujo resultado (80) dever ficar em 1995 II.

Dividimos os totais mveis de 2 perodos por oito (porque agrupamos dois
conjuntos de 4 perodos), e obtemos as mdias mveis centradas. Repare que
faltam mdias mveis para exatamente 2 perodos no incio da srie e para
exatamente 2 no final, porque as mdias mveis iniciais envolvem 4 perodos
(porque h 4 trimestres no ano). Se a srie fosse mensal faltariam 6 perodos no
incio e 6 no final.
Vamos ver como ficam a srie original e a tendncia em um grfico:
94


0
5
1 0
1 5
2 0
2 5
9 3 9 4 9 5
a n o
n

m
.

d
e

c
o
n
t
r
a
t
a

e
s



Figura 4.630 - Nmero de contratos: srie original e mdias mveis de 4 perodos
(centradas)

interessante observar que a tendncia do nmero de contratos
decrescente. Supondo que fossem dados atuais e desejssemos fazer previses
para o futuro, trata-se de um inquietante sinal para a corretora de seguros. Se o
mercado encontra-se retrado o mau desempenho seria explicvel, mas mesmo
assim preocupante que no longo prazo o nmero de contratos est caindo, a no
ser que o valor dos contratos compense esta reduo.

Uma vez identificada a tendncia, seja por equaes ou por mdias mveis,
ela pode ser removida da srie, para facilitar a visualizao das outras componentes
(supondo um modelo multiplicativo):
I S C
T
Y
=

Vejamos como ficaria a srie mostrada na figura 51 com a remoo da tendncia
(naquele caso linear):
95



Figura 4.731 - Srie temporal de vendas (figura 4.3) com tendncia removida

Observe a escala do grfico, com valores em torno de 1: a tendncia foi
removida, restaram apenas as componentes cclicas, sazonais e irregulares que
modificam a tendncia em um modelo multiplicativo.


4.3 - OBTENO DAS VARIAES SAZONAIS

Conforme visto na seo 4.1 as variaes sazonais so oscilaes de curto
prazo, que ocorrem sempre dentro do ano, e que repetem-se sistematicamente ano
aps ano. Obviamente uma srie temporal registrada anualmente (ou seja os valores
dos dias, meses, trimestres, so resumidos em um valor anual) no tem componente
sazonal.
No modelo multiplicativo as variaes sazonais so representadas pelos
ndices sazonais, um para cada perodo em que o ano dividido (se a srie
registrada mensalmente h 12 ndices, se trimestralmente h 4 ndices, etc.). Os
ndices sazonais modificam a tendncia: se todos os ndices sazonais forem
aproximadamente iguais a 1 ento as componentes sazonais parecem no exercer
grande efeito sobre a srie; se os ndices forem substancialmente diferentes de 1,
pelo menos 5% acima ou abaixo em alguns dos meses ou trimestres, o valor da
tendncia ser modificado por eles, indicando que as componentes sazonais afetam
a srie.
96


H vrios mtodos para a obteno dos ndices sazonais, entre eles o mtodo
da razo para a mdia mvel (ou mtodo da mdia mvel percentual). Ele consiste
em:
1) obter mdias mveis de ordem igual ao nmero de perodos sazonais (4 se a
srie trimestral, 12 se mensal);
2) obter mdias mveis de 2 perodos, centradas, a partir das mdias mveis
calculadas no passo 1;
3) obter os ndices sazonais para cada perodo, dividindo os valores originais da
srie pelas mdias mveis centradas calculadas no passo 2;
4) obter as medianas dos ndices sazonais de cada perodo (por exemplo, a
mediana dos ndices sazonais de todos os janeiros existentes na srie).
Os passos 1 e 2 so virtualmente idnticos ao procedimento para obteno de
tendncia por mdias mveis visto na seo 4.2.2 (quando o nmero de perodos
par).

Exemplo 4.4 - Obtenha os ndices sazonais para a srie de contratos de seguros
apresentada no Exemplo 4.3. Interprete os resultados encontrados.
Trimestre No. de
Contratos
Totais
Mveis
4 perodos
Totais Mveis 2
perodos
(centrados)
Mdias Mveis 2
perodos
(centradas)
ndices
sazonais
1993 I 24

1993 II 21
65
1993 III 11 126 15,75 0,698
61
1993 IV 9 121 15,125 0,595
60
1994 I 20 116 14,5 1,379
56
1994 II 20 109 13,625 1,468
53
1994 III 7 101 12,625 0,554
48
1994 IV 6 90 11,25 0,533
42
1995 I 15 82 10,25 1,463
40
1995 II 14 80 10 1,400
40
1995 III 5

1995 IV 6
97


Temos que encontrar 4 ndices sazonais, j que h 4 trimestres no ano. Como
a srie registrada trimestralmente, e a tendncia deve ser obtida por mdias
mveis, preciso calcular mdias mveis de 4 perodos, pois h 4 trimestres no ano.
Contudo, como este nmero de perodos par, mdias mveis de 2 perodos,
calculadas a partir daquelas de 4 perodos, precisam ser obtidas para obter
resultados centrados. O procedimento inicial semelhante ao feito no Exemplo 4.3,
at a obteno das mdias mveis de 2 perodos centradas.

Para obter os ndices sazonais devemos dividir os valores originais da srie
pelas mdias mveis centradas, a partir de 1993 III at 1995 II, cujos resultados
esto na ltima coluna da tabela acima. Os ndices para cada trimestre sero:
Trimestre I => 1,379 1,463
Trimestre II => 1,468 1,400
Trimestre III=> 0,698 0,554
Trimestre IV=> 0,595 0,533

Os ndices somente foram calculados para os perodos em que havia mdias
mveis de 2 perodos centradas.
Precisamos calcular a mediana de cada trimestre. Neste caso, como h apenas 2
valores a mediana ser igual a mdia aritmtica simples dos valores. Ento os
ndices sazonais sero:
Trimestre I = 1,421
Trimestre II = 1,434
Trimestre III = 0,626
Trimestre IV = 0,564

Observe que h uma diferena considervel entre os ndices. No primeiro
trimestre do ano o nmero de contratos aumenta cerca de 42,1% ([1,421 - 1] 100),
no segundo aumenta 43,4%, no terceiro trimestre sofre uma queda de 37,4% ([0,626
- 1] 100), e no quarto a queda de 43,6%. Estas oscilaes so grandes demais
para ter ocorrido por acaso, h influncia da sazonalidade na srie de contratos. O
resultado da soma dos valores dos ndices ser aproximadamente igual a 4, porque
h 4 trimestres no ano.

98


Podemos remover a sazonalidade da srie, dividindo os valores originais de
cada perodo por seu respectivo ndice sazonal, e podemos ver o resultado em um
grfico:

Figura 4.832 - Srie com a sazonalidade removida

Trimestre Y S T x C x I = Y/ S
1993 I 24 1,421 16,890
1993 II 21 1,434 14,644
1993 III 11 0,626 17,572
1993 IV 9 0,564 15,957
1994 I 20 1,421 14,074
1994 II 20 1,434 13,947
1994 III 7 0,626 11,182
1994 IV 6 0,564 10,638
1995 I 15 1,421 10,556
1995 II 14 1,434 9,763
1995 III 5 0,626 7,987
1995 IV 6 0,564 10,638


Figura 4.933 - ndices Sazonais trimestrais

E ao lado um grfico dos prprios ndices
sazonais.
99


4.4 - OBTENO DE VARIAES CCLICAS E IRREGULARES
16



Geralmente as variaes cclicas e irregulares so avaliadas em conjunto.
Conforme visto anteriormente as variaes cclicas so padres de longo prazo
(superiores a um ano), como por exemplo perodos de crescimento e recesso da
economia. J as variaes irregulares so resultado de fatos fortuitos, inesperados.

As variaes cclicas e irregulares so obtidas atravs da remoo das
componentes tendncia e sazonalidade (esta ltima apenas se os dados no forem
anuais). No modelo multiplicativo:
( ) S T
Y
CI

= , onde Y o valor original da srie, T a tendncia, e S a componente


sazonal.

costume construir um grfico de linhas com as variaes cclicas e
irregulares, atravs do qual podemos identificar se os ciclos realmente influenciam a
srie, qual sua periodicidade, e ainda se o efeito das variaes irregulares muito
grande (e se possvel relacion-lo com fatos especficos). s vezes as variaes
irregulares tornam difcil a visualizao dos ciclos, o que pode exigir a aplicao de
mdias mveis s variaes cclicas e irregulares para "alis-la", de modo a facilitar
a sua identificao.

Para identificar se os ciclos da srie os seguintes padres devem ser
observados no grfico das variaes cclicas e irregulares:
- h alternncia sistemtica entre valores maiores e menores do que 1 ao longo dos
perodos;
- os valores permanecem predominantemente maiores/menores do que 1 durante
pelo menos 1 anos (por exemplo: 2 anos acima de 1, seguido por 3 abaixo de 1, e
assim sucessivamente).

O valor 1 o ponto neutro no modelo multiplicativo, se as variaes no se
afastarem muito de 1 elas no causaro modificaes tangveis na tendncia, e

16
Embora todos os autores concordem com a presena das componentes irregulares no modelo clssico das
sries temporais, no h unanimidade sobre as componentes cclicas. Assim, o leitor pode encontrar referncias
sobre sries temporais que desconsideram por completo os ciclos.
100


portanto no influenciaro na srie. A alternncia sistemtica precisa ser
identificada, caso contrrio o efeito dos ciclos ou inexistente ou inferior ao das
componentes irregulares, podendo ento ser desprezado no processo de previso.

Se os ciclos influenciam na srie temporal eles precisam ser levados em
considerao no modelo. Precisamos calcular ndices para os ciclos tambm, para
os perodos de baixa e de alta, havendo dois procedimentos:
- calcula-se a mediana
17
das variaes cclicas e irregulares para todos os perodos
de alta (e baixa) existentes na srie; este procedimento agrega informaes de toda
a srie
- calcula-se a mediana apenas para o ltimo perodo de alta (e baixa); este
procedimento privilegia as informaes mais recentes, que podem ser mais teis em
previses.
Tambm podemos observar os efeitos das variaes irregulares, basta
identificar eventuais quedas e altas no grfico e relacionar tais eventos com fatos
ocorridos no mesmo perodo. importante observar que muitas vezes tais
acontecimentos no causam efeito imediato, ou mesmo no causam efeito algum, o
que pode surpreender o analista desavisado.
Na figura 4.10 podemos observar novamente a srie temporal da figura 4.3.
Na figura 4.11 temos esta srie aps a remoo da tendncia e sazonalidade,
resultando apenas as variaes cclicas e sazonais.

Figura 4.1034 - Srie temporal de vendas (figura 51)


17
Usamos a mediana ao invs da mdia para evitar que valores discrepantes, causados por variaes irregulares,
distoram os resultados.
101


Dados aps a remoo da tendncia e sazonalidade (apenas variaes cclicas e
irregulares)
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
jan/65 jan/69 jan/73 jan/77 jan/81 jan/85 jan/89 jan/93 jan/97

Figura 4.1135 - Srie temporal de vendas - apenas variaes cclicas e irregulares

Com alguma ateno conseguimos identificar a existncia de ciclos,
relativamente longos. Observe a alternncia sistemtica de valores menores e
maiores do que 1, por perodos superiores a 1 ano: janeiro de 1965 a dezembro de
1971 baixa, de janeiro de 1972 a dezembro de 1978 alta, etc. Contudo, se o efeito
das variaes irregulares fosse suavizado a visualizao seria mais fcil. Aplicando
mdias mveis de 12 perodos, posteriormente centradas, temos a figura 4.12:
Mdias mveis das variaes cclicas e irregulares (centradas)
0.8
0.85
0.9
0.95
1
1.05
1.1
1.15
1.2
1.25
1.3
jan/65 jan/69 jan/73 jan/77 jan/81 jan/85 jan/89 jan/93 jan/97

Figura 4.1236 - Srie temporal de vendas - mdias mveis de 12 perodos das
variaes cclicas e irregulares.

Exemplo 4.5 - Os dados a seguir representam as vendas lquidas (em bilhes
de dlares), e a tendncia (obtida por uma equao de reta) da Kodak. Supondo um
modelo multiplicativo, remova a tendncia da srie. Voc identifica variaes
cclicas?
102


Ano Vendas Tendncia CI =
Vendas/Tendncia
1978 1,60 0,743587 2,15173
1979 2,00 1,566462 1,27676
1980 2,70 2,389338 1,13002
1981 3,70 3,212213 1,15185
1982 4,60 4,035089 1,14
1983 4,62 4,857964 0,95102
1984 5,00 5,68084 0,88015
1985 5,78 6,503715 0,88872
1986 6,30 7,326591 0,85988
1987 8,00 8,149466 0,98166
1988 10,25 8,972342 1,1424
1989 10,50 9,795217 1,07195
1990 11,90 10,61809 1,12073
1991 10,20 11,44097 0,89153
1992 10,60 12,26384 0,86433
1993 10,60 13,08672 0,80998
1994 11,50 13,90959 0,82677
1995 13,30 14,73247 0,90277
1996 17,00 15,55535 1,09287
1997 18,40 16,37822 1,12344
1998 18,90 17,2011 1,09877
1999 18,90 18,02397 1,0486
2000 18,94 18,84685 1,00494
Como a srie anual NO H
influncia da sazonalidade. Podemos
simplesmente dividir as Vendas pela
Tendncia, obtendo as componentes
CI.
Os resultados ao lado permitem
observar os valores da srie com a
tendncia linear removida. Observe
que h alternncia entre valores
maiores e menores do que 1 ao longo
dos anos. Contudo tal constatao
pode se tornar difcil para sries
maiores. preciso construir o
grfico das variaes cclicas e
irregulares.
103



Figura 4.1337 - Vendas lquidas da Kodak - variaes cclicas e irregulares

possvel identificar uma variao sistemtica: nos anos de 1978 a 1982 (5
anos) tm valores MAIORES DO QUE 1 para as variaes CI. De 1983 a 1987
(outros 5 anos), os valores de CI so MENORES DO QUE 1. Em 1988 ocorre outra
inverso, valores maiores do que 1 at 1990. Em 1991, as variaes CI voltam a
ficar menores do que 1, permanecendo assim at 1995 (5 anos). No ano de 1996
ocorre a ltima inverso da srie, com os valores tornando a ser maiores do que 1
at o ano 2000. Conclui-se ento que H VARIAO CCLICA nesta srie, pois
pode-se perceber uma alternncia entre valores maiores e menores do que 1(das
variaes CI) a cada 5 anos.

Como h variaes cclicas na srie elas devem ser levadas em conta na previso
que ser feita. Observando o grfico das variaes CI acima, o ano de 2000 parece
ser o ltimo de um ciclo de alta. razovel imaginar que os anos de 2001 a 2005
sero anos de baixa: a tendncia precisar ser multiplicada pelos ndices de ciclos
de baixa. Mas quais ndices de ciclos de baixa escolher? Observe que tanto nos
ciclos de alta quanto nos de baixa NO H grande variao entre os valores de CI:
se calcularmos a mediana dos valores de CI para um grupo de cinco anos (referente
a um ciclo de baixa) teremos uma boa estimativa da componente CI para utilizar na
previso. Devemos utilizar o ltimo ciclo de baixa disponvel, que vai de 1991 a
1995, com os seguintes valores: 0,8915; 0,8643; 0,8100; 0,8268; 0,9028. Ordenando
104


os 5 valores e calculando a mediana obtemos 0,8643: este dever ser o valor de CI
que ser multiplicado pela tendncia da srie.


4.5 - RECOMPOSIO


A recomposio consiste em agregar todas as componentes identificadas na
anlise de sries temporais, para que seja possvel realizar a melhor previso
possvel. No modelo multiplicativo:
Y = T S C

Onde T a tendncia (definida por uma equao ou mdias mveis - seo
4.2), S a componente sazonal (definida pelos ndices sazonais - seo 4.3), e C
a componente cclica (definida por ndices - seo 4.4).

Exemplo 4.6 - Faa a recomposio da srie a seguir, supondo um modelo
multiplicativo.
Multiplicativo: Y = T x C x S
T C S
90 0,70 0,90
94 0,70 0,92
98 0,70 0,92
102 0,70 0,86
106 0,70 0,82
110 0,80 0,94
114 0,80 0,95
118 0,80 1,10
122 0,80 1,10





Para fazer a recomposio da srie devemos
multiplicar as componentes da srie, j que um
modelo multiplicativo.
O resultado est na tabela a seguir.
105


Multiplicativo: Y = T x C x S
T C S Y
90 0,70 0,90 56,7
94 0,70 0,92 60,5
98 0,70 0,92 63,1
102 0,70 0,86 61,4
106 0,70 0,82 60,8
110 0,80 0,94 82,8
114 0,80 0,95 86,6
118 0,80 1,10 103,8
122 0,80 1,10 107,4

Exemplo 4.7 Os dados abaixo contm os valores trimestrais de vendas (em milhes
de reais) de um fabricante de eletrodomsticos. Usando o modelo multiplicativo
obtenha os componentes da srie, interprete os resultados e faa a previso de
vendas para os quatro trimestres seguintes.
Perodo Trimestre Vendas Perodo Trimestre Vendas
1 I 20 13 I 32
2 II 18 14 II 29
3 III 22 15 III 35
4 IV 24 16 IV 38
5 I 24 17 I 36
6 II 22 18 II 32
7 III 26 19 III 40
8 IV 29 20 IV 43
9 I 28 21 I 40
10 II 25 22 II 36
11 III 31 23 III 44
12 IV 34 24 IV 48

O primeiro passo construir um grfico para os dados da srie.
Para fazer previses para perodos futuros
basta obter os valores de tendncia, aplicar os
ndices sazonais apropriados (se houver influncia
da sazonalidade), e os ndices das variaes
cclicas (se houver influncia delas) identificando
se os perodos para os quais desejamos fazer as
previses sero de alta ou baixa.

106


Vendas: dados originais e tendncia linear
15
20
25
30
35
40
45
50
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV

Figura 4.1438 - Vendas de eletrodomsticos - srie original

plenamente vivel pensar em ajustar uma reta aos dados. Ento podemos
obter os coeficientes da reta de mnimos quadrados: T = a + b t.
Sabemos que n = 24 (h 24 perodos na srie).
Os somatrios necessrios:
300 t
24
1 i
i
=

=
756 y
24
1 i
i
=

=
( ) 4900 t
24
1 i
2
i
=

=
( ) 10694 y t
24
1 i
i i
=

=


Substituindo nas equaes:
( )
( )
082 , 1
) 300 ( 4900 24
756 300 10694 24
t t n
y t y t n
b
2 2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
=


=
|

\
|


=


= =
= = =


978 , 17
24
) 300 082 , 1 ( 756
n
t b y
a
n
1 i
i
n
1 i
i
=

=

=

= =


107


Ento T = 17,978 + 1,082 t

Podemos calcular as tendncias para cada perodo da srie existente:
Perodo Equao Tendncia
1 T = 17,978 + (1,082 1) 19,060
2 T = 17,978 + (1,082 2) 20,142
3 T = 17,978 + (1,082 3) 21,223
4 T = 17,978 + (1,082 4) 22,305
5 T = 17,978 + (1,082 5) 23,387
6 T = 17,978 + (1,082 6) 24,469
7 T = 17,978 + (1,082 7) 25,550
8 T = 17,978 + (1,082 8) 26,632
9 T = 17,978 + (1,082 9) 27,714
10 T = 17,978 + (1,082 10) 28,796
11 T = 17,978 + (1,082 11) 29,877
12 T = 17,978 + (1,082 12) 30,959
13 T = 17,978 + (1,082 13) 32,041
14 T = 17,978 + (1,082 14) 33,123
15 T = 17,978 + (1,082 15) 34,204
16 T = 17,978 + (1,082 16) 35,286
17 T = 17,978 + (1,082 17) 36,368
18 T = 17,978 + (1,082 18) 37,450
19 T = 17,978 + (1,082 19) 38,531
20 T = 17,978 + (1,082 20) 39,613
21 T = 17,978 + (1,082 21) 40,695
22 T = 17,978 + (1,082 22) 41,777
23 T = 17,978 + (1,082 23) 42,858
24 T = 17,978 + (1,082 24) 43,940

Agora iremos obter os ndices sazonais. Como a srie trimestral teremos que
calcular mdias mveis de 4 perodos, e depois centr-las. Vamos apresentar
apenas os totais mveis de 4 perodos, os totais mveis de 2 perodos (calculados a
108


partir dos de 4 perodos), as mdias mveis de 2 perodos, centradas, e os ndices
sazonais. O procedimento basicamente o mesmo visto no Exemplo 4.4.


Trimestre Vendas Totais mveis
de 4 perodos
Totais mveis de
2 perodos
(centrados)
Mdias mveis de
2 perodos
(centradas)
ndices
Sazonais
I 20
II 18
III 22 84 172 21,5 1,02326
IV 24 88 180 22,5 1,06667
I 24 92 188 23,5 1,02128
II 22 96 197 24,625 0,8934
III 26 101 206 25,75 1,00971
IV 29 105 213 26,625 1,0892
I 28 108 221 27,625 1,01357
II 25 113 231 28,875 0,8658
III 31 118 240 30 1,03333
IV 34 122 248 31 1,09677
I 32 126 256 32 1,00000
II 29 130 264 33 0,87879
III 35 134 272 34 1,02941
IV 38 138 279 34,875 1,08961
I 36 141 287 35,875 1,00348
II 32 146 297 37,125 0,86195
III 40 151 306 38,25 1,04575
IV 43 155 314 39,25 1,09554
I 40 159 322 40,25 0,99379
II 36 163 331 41,375 0,87009
III 44 168
IV 48
Os ndices sazonais por trimestre (j ordenados) sero:
Trimestre I => 0,994 1,000 1,003 1,013 1,021 e sua mediana ser igual a
1,003.
109


Trimestre II => 0,862 0,866 0,870 0,879 0,893 e sua mediana ser igual a 0,870.
Trimestre III => 1,010 1,023 1,029 1,033 1,046 e sua mediana ser igual a 1,029.
Trimestre IV => 1,067 1,089 1,090 1,096 1,097 e sua mediana ser igual a 1,090.
Como alguns dos ndices distanciam-se substancialmente de 1, H influncia da
sazonalidade.
Interpretando os ndices sazonais: no trimestre I as vendas aumentam cerca de
0,3% em relao mdia anual, no trimestre II as vendas caem 13%, no trimestre III
as vendas aumentam 2,9%, e no trimestre IV as vendas aumentam 9% em relao
mdia anual.

Para obter as variaes cclicas e irregulares ns precisamos dividir os valores
originais da srie pelos respectivos valores de tendncia e ndices sazonais: CI =
Vendas/ (T S)
Trim. Vendas T S
Apenas
CI
Trim. Vendas T S
Apenas
CI
I 20 19,060 1,003 1,046 I 32 32,041 1,003 0,995
II 18 20,142 0,870 1,027 II 29 33,123 0,870 1,006
III 22 21,223 1,029 1,007 III 35 34,204 1,029 0,994
IV 24 22,305 1,090 0,987 IV 38 35,286 1,090 0,988
I 24 23,387 1,003 1,023 I 36 36,368 1,003 0,986
II 22 24,469 0,870 1,033 II 32 37,450 0,870 0,982
III 26 25,550 1,029 0,989 III 40 38,531 1,029 1,008
IV 29 26,632 1,090 0,999 IV 43 39,613 1,090 0,996
I 28 27,714 1,003 1,007 I 40 40,695 1,003 0,980
II 25 28,796 0,870 0,998 II 36 41,777 0,870 0,990
III 31 29,877 1,029 1,008 III 44 42,858 1,029 0,997
IV 34 30,959 1,090 1,008 IV 48 43,940 1,090 1,003
O grfico das variaes cclicas e irregulares mostrado a seguir:

110


Vendas: apenas variaes cclicas e irregulares
0.970
0.980
0.990
1.000
1.010
1.020
1.030
1.040
1.050
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV

Figura 4.1539 - Vendas trimestrais - apenas variaes cclicas e irregulares

Podemos observar na figura 4.15 que NO H alternncia sistemtica entre
valores maiores e menores, ou seja no conseguimos identificar a existncia de
ciclos. Ento podemos desprezar o efeito das variaes cclicas na srie temporal:
muito provavelmente ou no h realmente ciclos, ou a influncia das variaes
irregulares suplanta os seus efeitos.

A previso para os prximos 4 trimestres (25, 26, 27 e 28) incluir apenas a
tendncia (por meio da equao linear) e os ndices sazonais, resultando:
Y
25
= [(1,082 x 25) + 17,978] 1,003 = 45
Y
26
= [(1,082 x 26) + 17,978] 0,870 = 40
Y
27
= [(1,082 x 27) + 17,978] 1,029 = 49
Y
28
= [(1,082 x 28) + 17,978] 1,090 = 53
111




4.6 - Outros modelos de sries temporais

Alm do modelo clssico diversos outros modelos de sries temporais foram
desenvolvidos nos ltimos anos, para lidar com outras situaes.

Entre estes modelos devem ser citados os modelos Auto-Regressivos (AR),
os modelos de Mdias Mveis Auto-Regressivos de (ARMA) e os modelos de
Mdias Mveis Integrados Auto-Regressivos (ARIMA). Tais tpicos geralmente so
vistos em cursos de ps-graduao.



112


5 - NMEROS NDICES

Nmeros ndices so usados para indicar variaes relativas em
quantidades, preos ou valores de um artigo (ou artigos) durante certo perodo de
tempo. Eles sintetizam as modificaes na condies econmicas ocorridas em um
espao de tempo, atravs de uma razo. Se apenas um item computado trata-se
de um nmero ndice simples. Se, porm, vrios itens (produtos) tm suas variaes
computadas tem-se um nmero ndice composto.


5.1 - NMEROS NDICES SIMPLES

Os nmeros ndices simples podem ser chamados (como tambm os
compostos) de relativos de base fixa ou relativos de ligao.

5.1.1 - Nmeros ndices Simples - Relativos de base fixa

Neste caso um perodo escolhido como referncia, ou base, e todos os
ndices so computados em relao aos registros deste perodo especfico.
Usualmente no perodo base o ndice recebe o valor 100. Os nmeros ndices
simples podem ser de preo (quando calcula-se a razo entre o preo observado de
um artigo em um perodo qualquer e o preo do mesmo artigo no perodo base), de
quantidade (quando calcula-se a razo entre a quantidade observada de um artigo
em um perodo qualquer e a quantidade no perodo base), e de valor (quando a
razo calculada pelo produto de preo e quantidade do artigo em um perodo
qualquer e o produto de preo e quantidade do mesmo artigo no perodo base).
Vejamos as equaes:
Preo Quantidade Valor
100
p
p
p
0
t
t , 0
=

100
q
q
q
0
t
t , 0
=

100
q p
q p
v
0 0
t t
t , 0

=


113


Onde p
0
o preo do artigo no perodo base, p
t
o preo do artigo em um perodo
qualquer, q
0
quantidade do artigo no perodo base e q
t
a quantidade do artigo em
um perodo qualquer.

Exemplo 5.1 - Uma siderrgica produz chapas de ao. No ano de 1998 a chapa
custava R$ 45, e em 1999 R$ 47,5. Em 1998 a empresa produziu 1500 toneladas, e
em 1999 1567 toneladas. Calcular os nmeros ndices de preo, quantidade e valor
para a chapa de ao tomando o ano de 1998 como base.

O perodo base (0) 1998, ento: p
0
= 45 q
0
= 1500.
J o perodo "atual" (t) 1999, ento: p
t
= 47,5 q
t
= 1567

Os ndices de preo, quantidade e valor so:
56 , 105 100
45
5 , 47
100
p
p
p
100
p
p
p
98
99
99 , 98
0
t
t , 0
= == = = == = = == =
= == =

47 , 104 100
1500
1567
100
q
q
q
100
q
q
q
98
99
99 , 98
0
t
t , 0
= == = = == = = == =
= == =

27 , 110 100
1500 45
1567 5 , 47
100
q p
q p
v
100
q p
q p
v
98 98
99 99
99 , 98
0 0
t t
t , 0
= == =


= == =


= == =



= == =


Se tivssemos dados de 2000, 2001 e 2002, poderamos obter as flutuaes dos
preos, quantidades e valores em relao a 1998.

5.1.2 - Nmeros ndices Relativos de Ligao
18


Provavelmente devido cultura inflacionria existente no Brasil no
costumamos encontrar ndices em valores absolutos, tais como os calculados no
Exemplo 5.1. bastante comum nos depararmos com os Nmeros ndices Relativos
de Ligao, que sintetizam as variaes econmicas entre dois perodos

18
Tambm podemos calcul-los para os Nmeros ndices Compostos.
Houve um aumento de 5,56% (105,56 - 100) nos
preos da chapa de ao de 1998 para 1999.




Houve um aumento de 4,47% (104,47 - 100) nas
quantidades de chapas produzidas de 1998 para
1999.
Houve um aumento de 10,27% (110,27
- 100) nos valores de vendas das chapas
de ao de 1998 para 1999.
114


consecutivos. Quando o IBGE divulga o IPC - A de determinado ms apresentada
apenas a variao percentual em relao ao ms imediatamente anterior
19
.

Para obter os nmeros ndices relativos de ligao de um perodo basta dividir
o ndice do perodo de interesse pelo do perodo imediatamente anterior.

Exemplo 5.2 - Encontre os ndices relativos de ligao para a tabela a seguir.
Ms ndice de preo (base fixa) ndice de preo (relativo de ligao)
Janeiro 100 -
Fevereiro 101,5 (101,5/100) 100 = 101,5
Maro 100,6 (100,6/101,5) 100 = 99,11
Abril 105,4 (105,4/100,6) 100 = 104,77

De janeiro a fevereiro houve um aumento de 1,5% (101,5 - 100) no preo. De
fevereiro a maro houve uma queda de 0,89% (99,11 - 100) no preo. De maro a
abril houve um aumento de 4,77% (104,77 - 100) no preo.

Usualmente, conhecemos apenas as variaes de um ndice e no o prprio
ndice. Neste caso, podemos facilmente criar o ndice da forma mostrada no
exemplo a seguir e trabalhar com ele normalmente.

Tomando-se o ICV/DIEESE e fixando-se agosto/95 como base, os ndices de
setembro e outubro ficam:

Ms Ago Set Out Nov Dez Jan Fev Mar
ICV (variao em %) - 0,0185 0,0150 0,0279 0,0189 0,0459 0,0005 0,0104
ICV (ndice criado) 1,0000 1,0185 1,0338 1,0626 1,0827 1,1324 1,1330 1,1447

I
set
= I
ago
(1+
set
) = 1(1+0,0185) = 1,0185
I
out
= I
set
(1+
out
) = 1,0185(1+0,0150) = 1,0338

preciso multiplicar depois os ndices por 100.


19
Ou no mximo compara-se com o ndice do mesmo ms no ano anterior.
115


5.2 - NMEROS NDICES COMPOSTOS

Os nmeros ndices compostos expressam variaes no preo, quantidade ou
valor de um grupo de itens. So chamados de agregados simples quando atribuem a
mesma ponderao para todos os itens, desconsiderando a importncia relativa de
cada um. J os ndices agregados ponderados atribuem ponderaes diferentes
para os itens, o que pode permitir dar maior nfase s variaes em determinado
item, sendo a forma mais utilizada.

Os ndices compostos mais utilizados so:
- ndice de Laspeyres (poca bsica): ponderao feita em funo dos preos ou
quantidades do perodo base. Podem ser calculados ndices de preo e quantidade.
- ndice de Paasche (poca atual): ponderao feita em funo dos preos ou
quantidades do perodo atual. Podem ser calculados ndices de preo e
quantidade.
- Outros ndices: Fischer, Marshall - Edgeworth, Drobish, Divisia, e os ndices de
preos normalmente utilizados no Brasil (IGP-M, INPC, IPC-A, ICV do DIEESE, IPC
da FIPE).

5.2.1 - ndice de Laspeyres

No ndice de Laspeyres a ponderao feita em funo dos preos e quantidades
do perodo base. Por causa disso ele tende a exagerar a alta, por considerar as
quantidades (ou preos) iguais aos do perodo base. As equaes:


ndice de preos
( )
( )
100
q p
q p
L
n
1 i
i , 0 i , 0
n
1 i
i , 0 i , t
t , 0
p

=
=



ndice de quantidades
( )
( )
100
p q
p q
L
n
1 i
i , 0 i , 0
n
1 i
i , 0 i , t
t , 0
q

=
=

116


Onde n o nmero de itens, p
t,i
o preo de um item qualquer no perodo "atual",
p
0,i
o preo de um item qualquer no perodo base, q
t,i
a quantidade de um item
qualquer no perodo atual, e q
0,i
a quantidade de um item qualquer no perodo
base.

Exemplo 5.3 - Com os dados da tabela a seguir, e usando 1996 como base, obter
ndices de Laspeyres de preo e quantidade.
1996 1997 1998 Artigos
Preo Quantidade Preo Quantidade Preo Quantidade
1 2 4 2 5 3 6
2 3 3 4 2 6 3
3 5 2 6 5 8 6

Devemos usar as frmulas do ndice de Laspeyres sabendo que o perodo base
1996. Ento os denominadores dos ndices sero o resultado da soma dos produtos
dos preos e quantidades de cada item no perodo base, 1996. Os numeradores
utilizaro as quantidades (ou preos) de 1996 como ponderao.
( (( ( ) )) )
( (( ( ) )) )
52 , 118 100
) 2 5 ( ) 3 3 ( ) 4 2 (
) 2 6 ( ) 3 4 ( ) 4 2 (
100
q p
q p
L
3
1 i
i , 96 i , 96
3
1 i
i , 96 i , 97
97 , 96
p
= == =
+ ++ + + ++ +
+ ++ + + ++ +
= == =


= == =


= == =
= == =

Os preos dos artigos aumentaram 18,52% (118,52 - 100) de 1996 a 1997.

( (( ( ) )) )
( (( ( ) )) )
37 , 170 100
) 2 5 ( ) 3 3 ( ) 4 2 (
) 2 8 ( ) 3 6 ( ) 4 3 (
100
q p
q p
L
3
1 i
i , 96 i , 96
3
1 i
i , 96 i , 98
98 , 96
p
= == =
+ ++ + + ++ +
+ ++ + + ++ +
= == =


= == =


= == =
= == =

Os preos dos artigos aumentaram 70,37% (170,37 - 100) de 1996 a 1998.

( (( ( ) )) )
( (( ( ) )) )
85 , 151 100
) 5 2 ( ) 3 3 ( ) 2 4 (
) 5 5 ( ) 3 2 ( ) 2 5 (
100
p q
p q
L
3
1 i
i , 96 i , 96
3
1 i
i , 96 i , 97
97 , 96
q
= == =
+ ++ + + ++ +
+ ++ + + ++ +
= == =


= == =


= == =
= == =

As quantidades dos artigos aumentaram 51,85% (151,85 - 100) de 1996 a 1997.
117


( (( ( ) )) )
( (( ( ) )) )
89 , 188 100
) 5 2 ( ) 3 3 ( ) 2 4 (
) 5 6 ( ) 3 3 ( ) 2 6 (
100
p q
p q
L
3
1 i
i , 96 i , 96
3
1 i
i , 96 i , 98
98 , 96
q
= == =
+ ++ + + ++ +
+ ++ + + ++ +
= == =


= == =


= == =
= == =

As quantidades dos artigos aumentaram 88,89% (188,89 - 100) de 1996 a 1998.


5.2.2 - ndice de Paasche

No ndice de Paasche a ponderao feita em funo dos preos e
quantidades do perodo atual. Por causa disso ele tende a exagerar a baixa, por
considerar as quantidades (ou preos) iguais aos do perodo atual. A mudana
constante da poca atual pode encarecer a pesquisa para identificar os pesos. Por
essa razo os ndices de preos, que costumam fazer as ponderaes dos diversos
itens com base em pesquisas de oramentos familiares, geralmente utilizam a
frmula de Laspeyres (ou alguma modificao dela).


ndice
de
preos
( )
( )

=
=

=
n
1 i
i , t i , 0
n
1 i
i , t i , t
t , 0
q p
q p
P
p



ndice de
quantidade
s
( )
( )

=
=

=
n
1 i
i , t i , 0
n
1 i
i , t i , t
t , 0
p q
p q
P
q


Onde n o nmero de itens, p
t,i
o preo de um item qualquer no perodo "atual",
p
0,i
o preo de um item qualquer no perodo base, q
t,i
a quantidade de um item
qualquer no perodo atual, e q
0,i
a quantidade de um item qualquer no perodo
base.

Exemplo 5.4 - Utilizando os dados do Exemplo 5.3, e usando 1996 como base,
obtenha os ndices de Paasche de preos e quantidades.
1996 1997 1998
Artigos
Preo Quantidade Preo Quantidade Preo Quantidade
1 2 4 2 5 3 6
2 3 3 4 2 6 3
3 5 2 6 5 8 6
118


Devemos usar as frmulas do ndice de Paasche sabendo que o perodo base
1996. Ento os numeradores dos ndices sero o resultado da soma dos produtos
dos preos e quantidades de cada item no perodo atual, que ir mudar medida
que os anos passam. Os numeradores utilizaro os preos (ou quantidades) de
1996, ponderadas pelas quantidades (ou preos) do perodo atual.
( (( ( ) )) )
( (( ( ) )) )
07 , 117 100
) 5 5 ( ) 2 3 ( ) 5 2 (
) 5 6 ( ) 2 4 ( ) 5 2 (
100
q p
q p
P
3
1 i
i , 97 i , 96
3
1 i
i , 97 i , 97
97 , 96
p
= == =
+ ++ + + ++ +
+ ++ + + ++ +
= == =


= == =


= == =
= == =

Os preos dos artigos aumentaram 17,07% de 1996 a 1997.

( (( ( ) )) )
( (( ( ) )) )
71 , 164 100
) 6 5 ( ) 3 3 ( ) 6 2 (
) 6 8 ( ) 3 6 ( ) 6 3 (
100
q p
q p
P
3
1 i
i , 98 i , 98
3
1 i
i , 98 i , 98
98 , 96
p
= == =
+ ++ + + ++ +
+ ++ + + ++ +
= == =


= == =


= == =
= == =

Os preos dos artigos aumentaram 64,71% de 1996 a 1997.

( (( ( ) )) )
( (( ( ) )) )
00 , 150 100
) 6 2 ( ) 4 3 ( ) 2 4 (
) 6 5 ( ) 4 2 ( ) 2 5 (
100
p q
p q
P
3
1 i
i , 97 i , 96
3
1 i
i , 97 i , 97
97 , 96
q
= == =
+ ++ + + ++ +
+ ++ + + ++ +
= == =


= == =


= == =
= == =

As quantidades dos artigos aumentaram 50% de 1996 a 1997.

( (( ( ) )) )
( (( ( ) )) )
61 , 182 100
) 8 2 ( ) 6 3 ( ) 3 4 (
) 8 6 ( ) 6 3 ( ) 3 6 (
100
p q
p q
P
3
1 i
i , 98 i , 96
3
1 i
i , 98 i , 98
98 , 96
q
= == =
+ ++ + + ++ +
+ ++ + + ++ +
= == =


= == =


= == =
= == =

As quantidades dos artigos aumentaram 82,61% de 1996 a 1997.

Observe que os valores apresentam a mesma ordem de grandeza que os ndices de
Laspeyres, mas obviamente so diferentes.


119


5.3 - MUDANA DE BASE DE UM NMERO NDICE

A escolha da base de um nmero ndice muitas vezes uma tarefa difcil.
preciso escolher um perodo relativamente estvel, o mais "tpico" possvel, quando
a atividade econmica no estiver sendo afetada por variaes estruturais
ocasionais. No Brasil, onde a economia parece estar sendo sempre sacudida em
maior ou menor grau por flutuaes e crises de todo tipo a escolha da base torna-se
ainda mais controvertida: talvez por isso haja tanta predileo pelos ndices relativos
de ligao.

De qualquer forma, independente do ndice, pode ser interessante, ou
necessrio, mudar a base de um nmero ndice por duas razes:
- para atualizar a base, tornando-a mais prxima da realidade atual (por este motivo,
periodicamente o IBGE realiza pesquisas de oramento familiar, com a finalidade de
incluir as mudanas nos hbitos de consumo nas ponderaes dos seus ndices.
- para permitir a comparao de duas sries de ndices que tenham bases
diferentes.

O procedimento extremamente simples: basta dividir toda a srie de
nmeros ndices originais pelo nmero ndice do perodo escolhido como nova base.
Isso preservar as diferenas relativas entre eles.

Exemplo 5.5 - Mudar a base da srie de nmeros ndices abaixo para 1997.
Ano 1995 1996 1997 1998 1999 2000
ndice 100 109,12 113,86 116,69 126,53 133,20
Novo ndice 87,83 95,84 100 102,49 111,13 116,99

Para o ano de 1995 teremos: novo ndice = (100/113,86) 100 = 87,83
Para o ano de 1996 teremos: novo ndice = (109/113,86) 100 = 95,84
Para o ano de 1997 teremos: novo ndice = (113,86/113,86) 100 = 100
Para o ano de 1998 teremos: novo ndice = (116,69/113,86) 100 = 102,49
Para o ano de 1999 teremos: novo ndice = (126,53/113,86) 100 = 111,13
Para o ano de 2000 teremos: novo ndice = (133,20/113,86) 100 = 116,99

120


5.4 - Deflao de uma srie temporal

As variaes de preo, causadas por inflao ou deflao, podem obscurecer
as variaes de quantidade. Isso significa que s vezes o que parece ser um
crescimento de vendas, ou aumento na participao no mercado (por apresentar
maior faturamento) deve-se mais a flutuaes de preos, ou desvalorizaes
cambiais, do que realmente a acrscimos nas quantidades vendidas. Este problema
torna-se mais grave se examinamos longas sries temporais, incluindo vrios anos
(considerando, no caso do Brasil, as grandes mudanas estruturais que a economia
sofreu, o problema torna-se ainda mais srio).

preciso fazer a deflao da srie temporal. Em outras palavras, remover o
efeito da inflao nos valores da srie temporal. Devemos procurar um nmero
ndice apropriado para isso:
- se trata-se de uma empresa que vende diretamente ao consumidor final, no varejo,
devemos utilizar como deflator um ndice de preos ao consumidor (como o IPC-A
do IBGE, o IPC da FIPE, etc.);
- se a empresa vender bens de capital, ou realizar vendas no atacado, devemos
utilizar um ndice que retrate as flutuaes de tal mercado (como o IGP-M da
Fundao Getlio Vargas, do qual 60% deve-se ao ndice de Preos por Atacado,
calculado pela mesma instituio);
- se a empresa exporta, seria interessante incluir tambm a flutuao da taxa de
cmbio do pas (ou pases de destino).

importante ressaltar que preciso ter os nmeros ndices de base fixa. Se
apenas os relativos de ligao forem disponveis necessrio aplicar o
procedimento visto na seo 5.1.2 para obter os nmeros ndices de base fixa.

Independente do deflator (ndice) escolhido o procedimento similar:

Valor deflacionado = (valor original/ndice) x 100

Exemplo 5.6 - A tabela abaixo contm os gastos mdios com alimentao (em
dlares) de famlias, e os ndices de Preos ao Consumidor, nos EUA (Fonte: U.S.
121


Department of Labor, Bureau of Labor Statistics, U.S. Department of Agriculture
Economics and Statistics System).

Faa a deflao da srie temporal e avalie os resultados encontrados.
Ano Valores (US$) IPC Srie deflacionada
1983 207132,00 100 (207132/100) 100 = 207132
1984 218937,00 103,9 (218937/103,9) 100 = 210718,96
1985 228689,00 107,6 (228689/107,6) 100 = 212536,24
1986 237246,00 109,6 (237246/109,6) 100 = 216465,33
1987 247093,26 113,6 (247093,26/113,6) 100 = 217511,67
1988 259915,57 118,3 (259915,57/118,3) 100 = 219708,85
1989 278894,69 124 (278894,69/124,0) 100 = 224915,07
1990 303903,31 130,7 (303903,31/130,7) 100 = 232519,75
1991 317292,42 136,2 (317292,42/136,2) 100 = 232960,66
1992 319253,17 140,3 (319253,17/140,3) 100 = 227550,37
1993 325125,40 144,5 (325125,40/144,5) 100 = 225000,28
1994 341287,19 148,2 (341287,19/148,2) 100 = 230288,25
1995 354122,30 152,4 (354122,30/152,4) 100 = 232363,71
1996 369334,17 156,9 (369334,17/156,9) 100 = 235394,63

Percebemos claramente que os valores aps a deflao esto substancialmente
abaixo dos valores originais, indicando que o aumento nos gastos anuais com
alimentao no foi muito grande. Vejamos o grfico da srie acima, incluindo os
valores de 1971 a 1982 tambm.
122


0.00
50000.00
100000.00
150000.00
200000.00
250000.00
300000.00
350000.00
400000.00
1
9
7
1


1
9
7
3


1
9
7
5


1
9
7
7


1
9
7
9


1
9
8
1


1
9
8
3


1
9
8
5


1
9
8
7


1
9
8
9


1
9
9
1


1
9
9
3


1
9
9
5
Alimentao Alimentao Deflacionada

Figura 5.140 - Gastos com alimentao nos EUA: dados originais e deflacionados

5.5 - NDICES BRASILEIROS E INTERNACIONAIS

Apresentaremos agora uma sntese de alguns nmeros ndices utilizados no
Brasil e no exterior. No h a pretenso de esgotar o assunto, o leitor interessado
poder encontrar mais detalhes sobre os ndices citados, e sobre outros, nas
referncias apresentadas no final desta seo ou em outras fontes.

Vamos abordar onze ndices: INPC e IPCA do IBGE, IPC da FIPE, IGP-M e
IGP-DI da Fundao Getlio Vargas, ICV do DIEESE, CUB, IPC do ITAG,
IBOVESPA, mdia industrial Dow Jones, e ndice Nasdaq composto. Sero
apresentados tambm grficos mostrando a flutuao destes ndices nos ltimos
anos.

5.5.1 - ndice Nacional de Preos ao Consumidor INPC

a) Definio
Medida sntese do movimento de preos de um conjunto de mercadorias, chamado "Cesta
de Mercadorias", representativo de um determinado grupo populacional, em um certo
perodo de tempo. Mede a variao do custo de vida das famlias com rendimento
assalariado mensal de 1 a 8 salrios mnimos, que residem na rea urbana das
regies pesquisadas. Dados disponveis (ndice nacional) desde 1981.
Observe como as duas
linhas tm inclinaes
diferentes: os gastos
com alimentao
subiram bastante de
1971 a 1996, no
porque o povo dos
EUA esteja realmente
consumindo mais
produtos, mas porque
houve uma inflao
considervel no
perodo.
123


b) Instituio responsvel
Fundao Instituto Brasileiro de Geografia e Estatstica IBGE.
c) Abrangncia geogrfica: regies metropolitanas do Rio de Janeiro, Porto Alegre,
Belo Horizonte, Recife, So Paulo, Belm, Fortaleza, Salvador e Curitiba, alm do
Distrito Federal e do municpio de Goinia.
d) Metodologia
Os ndices so calculados para cada regio. Os preos obtidos so os efetivamente
cobrados ao consumidor, para pagamento vista. A Pesquisa realizada em
estabelecimentos comerciais, prestadores de servios, domiclios e concessionrias
de servios pblicos. A partir dos preos coletados mensalmente, obtm-se, na
primeira etapa de sntese, as estimativas dos movimentos de preos referentes a
cada produto pesquisado. Tais estimativas so obtidas atravs do clculo da mdia
aritmtica simples de preos dos locais da amostra do produto que, comparadas em
dois meses consecutivos, resultam no relativo das mdias. Agregando-se os
relativos dos produtos atravs da mdia geomtrica calculada a variao de
preos de cada subitem, que se constitui na menor agregao do ndice que possui
ponderao explcita. Os itens integrantes:

TIPO DE GASTOS PESO % DO GASTO
Alimentao 33,10
Despesas Pessoais 13,36
Vesturio 13,16
Habitao 12,53
Transporte e comunicao 11,44
Artigos de residncia 8,85
Sade e cuidados pessoais 7,56
TOTAL 100,00

A partir da aplicada a frmula Laspeyres, obtendo-se todos os demais nveis de
agregao da estrutura item, subgrupo, grupo e, por fim, o ndice geral da regio.
Os ndices nacionais - INPC so calculados a partir dos resultados dos ndices
regionais, utilizando-se a mdia aritmtica ponderada. A varivel de ponderao do
INPC a "populao residente urbana" (Contagem Populacional 1996) e a do IPCA
"rendimento total urbano" (Pesquisa Nacional por Amostra de Domiclios -
PNAD/96).
124


e) Atualidade da pesquisa
Pesquisa de Oramentos Familiares POF: Realizada no perodo compreendido
entre 01 de outubro de 1995 a 30 de setembro de 1996. Forneceu as estruturas de
ponderao das populaes-objetivo. Atualmente est em curso uma nova Pesquisa
de Oramentos Familiares, prevista para ser finalizada em 2003.
Pesquisa de Locais de Compra PLC: realizada no perodo de maio a junho de
1988. Forneceu o cadastro de informantes da pesquisa, cuja manuteno
contnua.
Pesquisa de Especificao de Produtos e Servios PEPS: realizada na poca de
implantao de cada uma das regies para todos os produtos e servios constantes
da estrutura de ponderaes. Forneceu o cadastro de produtos e servios
pesquisado, que permanentemente atualizado com o objetivo de acompanhar a
dinmica de mercado.
f) Perodo de coleta: ms calendrio.

5.5.2 - ndice Nacional de Preos ao Consumidor Amplo IPCA

a) Definio
Medida sntese do movimento de preos de um conjunto de mercadorias, chamado "Cesta
de Mercadorias", representativo de um determinado grupo populacional, em um certo
perodo de tempo. Reflete a variao dos preos das cestas de consumo das famlias com
recebimento mensal de 1 a 40 salrios mnimos, qualquer que seja a fonte. utilizado pelo
Banco Central do Brasil para o acompanhamento dos objetivos estabelecidos no sistema
de metas de inflao, adotado a partir de julho de 1999, para o balizamento da poltica
monetria.
b) Instituio responsvel
Fundao Instituto Brasileiro de Geografia e Estatstica IBGE.
c) Abrangncia geogrfica: regies metropolitanas do Rio de Janeiro, Porto Alegre,
Belo Horizonte, Recife, So Paulo, Belm, Fortaleza, Salvador e Curitiba, alm do
Distrito Federal e do municpio de Goinia.
d) Metodologia
Os ndices so calculados para cada regio. Os preos obtidos so os efetivamente
cobrados ao consumidor, para pagamento vista. A Pesquisa realizada em
estabelecimentos comerciais, prestadores de servios, domiclios e concessionrias
de servios pblicos. A partir dos preos coletados mensalmente, obtm-se, na
125


primeira etapa de sntese, as estimativas dos movimentos de preos referentes a
cada produto pesquisado. Tais estimativas so obtidas atravs do clculo da mdia
aritmtica simples de preos dos locais da amostra do produto que, comparadas em
dois meses consecutivos, resultam no relativo das mdias. Agregando-se os
relativos dos produtos atravs da mdia geomtrica calculada a variao de
preos de cada subitem, que se constitui na menor agregao do ndice que possui
ponderao explcita. A ponderao dos itens diferente da do INPC, porque a
populao objetivo tem uma maior abrangncia de renda. Os itens integrantes:

Tipo de Gasto Peso % do Gasto
Alimentao 25,21
Transportes e comunicao 18,77
Despesas pessoais 15,68
Vesturio 12,49
Habitao 10,91
Sade e cuidados pessoais 8,85
Artigos de residncia 8,09
Total 100,00

Para a obteno dos ndices dos itens, exceto para os sazonais alimentcios (para os
quais usada a frmula de Paasche), emprega-se a frmula de Laspeyres. O ndice
de Laspeyres, para medida do movimento de preos entre dois momentos t (perodo
de referncia) e o (perodo base), tal como no INPC.
Os ndices nacionais - IPCA so calculados a partir dos resultados dos ndices
regionais, utilizando-se a mdia aritmtica ponderada. Para o IPCA, at maio de
1989, os pesos basearam-se nos dados de despesa total corrente da pesquisa
ENDEF. Aps a redefinio da estrutura de ponderaes, em junho de 1989, os
pesos basearam-se na varivel rendimento total urbano de cada rea, obtida atravs
da PNAD/87. A partir de janeiro de 1994, os pesos utilizados tiveram como base os
dados obtidos atravs da PNAD/90. O critrio utilizado para definio da
abrangncia geogrfica dos pesos o mesmo adotado para o INPC.
e) Atualidade da pesquisa
Pesquisa de Oramentos Familiares POF: Realizada no perodo compreendido
entre 01 de outubro de 1995 a 30 de setembro de 1996. Forneceu as estruturas de
126


ponderao das populaes-objetivo. Atualmente est em curso uma nova Pesquisa
de Oramentos Familiares, prevista para ser finalizada em 2003.
Pesquisa de Locais de Compra PLC: realizada no perodo de maio a junho de
1988. Forneceu o cadastro de informantes da pesquisa, cuja manuteno
contnua.
Pesquisa de Especificao de Produtos e Servios PEPS: realizada na poca de
implantao de cada uma das regies para todos os produtos e servios constantes
da estrutura de ponderaes. Forneceu o cadastro de produtos e servios
pesquisado, que permanentemente atualizado com o objetivo de acompanhar a
dinmica de mercado.
f) Perodo de coleta: ms calendrio.

5.5.3 - ndice de Preos ao Consumidor da FIPE IPC FIPE

a) Definio
Mede a variao do custo de vida das famlias com renda de 1 a 20 salrios mnimos
do municpio de So Paulo.
b) Instituio responsvel
FIPE - Fundao Instituto de Pesquisas Econmicas
c) Abrangncia geogrfica: apenas o municpio de So Paulo.
d) Metodologia
Para o clculo das variaes quadrissemanais, leva-se em considerao a amostra
total do IPC mensal de aproximadamente 110.000 tomadas de preos, que
subdividida em quatro subamostras, cada uma delas pesquisadas em um perodo de
no mnimo 07 e no mximo 08 dias, que constituem a SEMANA de coleta. O sistema
de clculo sempre abrange um perodo total de 08 SEMANAS e as variaes so
obtidas fazendo-se a diviso dos preos mdios das 4 SEMANAS de referncia
pelos preos mdios das 4 SEMANAS anteriores (base). Desta forma, para se obter
uma srie sequencial de ndices quadrissemanais, considera-se sempre 8
SEMANAS incluindo-se no clculo as informaes sobre os preos coletados na
ltima SEMANA automaticamente, eliminando-se da operao os dados referentes
SEMANA mais antiga. So apresentadas, portanto, 3 prvias durante o ms, sendo
a 4 quadrissemana o resultado definitivo do ms.

127


5.5.4 - ndice Geral de Preos de Mercado da Fundao Getlio Vargas IGPM
FGV

a) Definio
Foi criado com o objetivo de ser um indicador confivel para as operaes
financeiras, especialmente as de longo prazo, sendo utilizado para correes de
Notas do Tesouro Nacional (NTN) dos tipos B e C e para os CDB ps-fixados com
prazos acima de um ano. Mede a variao de preos no mercado de atacado, de
consumo e construo civil. Este ndice formado pela soma ponderada de outros
trs ndices: IPA-M (ndice de preos ao atacado) com peso de 60 por cento; IPC-M
(ndice de preos ao consumidor) com peso de 30 por cento; e INCC-M (ndice
nacional de construo civil) com peso de 10 por cento. O IGP-M considera todos os
produtos disponveis no mercado, inclusive o que importado. Difere do IGP-DI pelo
perodo de coleta.

b) Instituio
Fundao Getlio Vargas.

c) Abrangncia geogrfica: o IPA-M e INCC-M so pesquisados nas principais
capitais do pas, enquanto que o IPC-M abrange os municpios do Rio de Janeiro e
So Paulo.

d) Metodologia
Os preos pesquisados pertencem a uma cesta de consumo de famlias com renda
de at trinta e trs salrios mnimos. Para elaborao do IGP-M, a coleta de preos
realizada entre o dia 21 do ms anterior e o dia 20 do ms de referncia. A
apurao do ndice efetuada em trs etapas: 1 decndio, 2 decndio e 3
decndio. O 1o decndio compara os preos dos primeiros 10 dias do perodo e os
preos dos 30 dias do perodo anterior. O 2o decndio compara os preos dos
primeiros 20 dias do perodo e os 30 dias do perodo anterior. O 3o decndio
compara os preos dos 30 dias do perodo e os 30 dias do perodo anterior.
Portanto, os dois primeiros decndios so considerados resultados parciais, e o 3o
o resultado definitivo do ndice do ms. Maiores detalhes da metodologia somente
so disponveis mediante pagamento.

128


5.5.5 - ndice Geral de Preos Disponibilidade Interna da Fundao Getlio Vargas
IGP DI FGV

a) Definio
O IGP-DI/FGV foi institudo em 1.944 com a finalidade de medir o comportamento de
preos em geral da economia brasileira. a mdia ponderada de seus trs ndices
componentes (IPA-DI, IPC e INCC, com pesos de 60%, 30% e 10%,
respectivamente). Difere do IGP-M especialmente pela periodicidade de coleta, que
aqui coincide com o ms calendrio.

b) Instituio
Fundao Getlio Vargas

c) Abrangncia geogrfica: o IPA-M e INCC-M so pesquisados nas principais
capitais do pas, enquanto que o IPC-M abrange os municpios do Rio de Janeiro e
So Paulo.

d) Metodologia
DI ou Disponibilidade Interna a considerao das variaes de preos que afetam
diretamente as atividades econmicas localizadas no territrio brasileiro. No se
considera a variao de preos dos produtos exportada que considerado somente
no caso da variao no aspecto de Oferta Global. O chamado IGP-10, mede a
variao entre os dias 11 de um ms ao dia 10 (inclusive) do ms subseqente. Mas
no vlido como ndice mensal por englobar clculos de dois meses. mais
utilizado para estudos econmicos e outras atividades correlatas. O IGP-DI mede a
variao dos preos conforme acima descrito no perodo do primeiro ao ltimo dia de
cada ms de referncia. Portanto este ndice mede a variao de preos de um
determinado ms por completo. O IGP-DI/FGV calculado mensalmente pela FGV.
Maiores detalhes da metodologia somente so disponveis mediante pagamento.


No quadro a seguir podemos observar a variao e influencia de alguns itens
do IPA no ms de maro de 2002:

129


Especificao Variao % Influncia
SOJA -13.28 -0.2708
AVES -3.86 -0.1037
OLEO DE SOJA REFINADO -7.43 -0.0939
ARROZ BENEFICIADO -5.47 -0.0661
ARROZ EM CASCA -6.83 -0.0623
LARANJA -13.53 -0.0611
BOVINOS -0.81 -0.0492
SUINOS -4.61 -0.0458
MANDIOCA (AIPIM) -5.03 -0.0280
OLEOS COMBUSTIVEIS -2.03 -0.0274
TRIGO -3.15 -0.0271
CELULOSE -4.39 -0.0260
ACUCAR CRISTAL -5.78 -0.0259
TECIDOS DE ALGODAO -1.53 -0.0176
AVES ABATIDAS E FRIGORIFICADAS -4.01 -0.0130
LEITE "IN NATURA" 7.90 0.2292
OVOS 7.34 0.1228
GASOLINA 3.65 0.0673
CAIXAS DE PAPELAO CORRUGADO 6.81 0.0315
CAFE EM COCO 3.20 0.0277
MELAO 89.55 0.0247
PAPELAO CORRUGADO 17.36 0.0210
CHAPAS FINAS DE ACO COMUM, A FRIO 3.82 0.0206
UVA 20.49 0.0202
OLEO DIESEL 0.51 0.0187
ALGODAO (EM CAROCO) 10.56 0.0164
MILHO 1.04 0.0158
FEIJAO 3.11 0.0150
PNEUS P/ AUTOMOVEIS 3.83 0.0144
FERRO GUSA PARA FUNDICAO 2.96 0.0129
Fonte : Centro de Estudos de Preos - IBRE/FGV

130


Na tabela abaixo podemos observar a variao e influencia de alguns itens do IPC
no ms de maro de 2002:
Especificao Variao % Influncia
ARROZ BRANCO -3.59 -0.0157
GAS DE BUJAO -1.06 -0.0122
MACA NACIONAL -11.07 -0.0120
OLEO DE SOJA -2.61 -0.0085
ALIMENTOS PRONTOS E CONGELADOS DE MASSAS -3.30 -0.0084
LARANJA LIMA -13.01 -0.0078
CHUCHU -26.13 -0.0075
IOGURTE -2.15 -0.0061
TERNO MASCULINO -5.92 -0.0053
CONTRA FILE -1.75 -0.0050
ARROZ PARBOLIZADO -2.37 -0.0045
VESTIDO -1.45 -0.0045
PERA -5.97 -0.0045
MOVEIS PARA RESIDENCIA -0.33 -0.0044
BACALHAU -1.81 -0.0044
GASOLINA 2.73 0.0880
LEITE TIPO LONGA VIDA 6.06 0.0708
ELETRICIDADE RESIDENCIAL 0.49 0.0215
TAXA DE AGUA E ESGOTO RESIDENCIAL 1.18 0.0208
TOMATE 6.72 0.0186
MANGA 25.05 0.0181
PROFISSIONAIS PARA REPAROS DE RESIDENCIA 1.60 0.0178
REFEICOES EM RESTAURANTES 1.09 0.0176
CENOURA 8.80 0.0133
MELAO 32.12 0.0131
OVOS DE GALINHA 4.47 0.0129
CURSO DE SEGUNDO GRAU 1.07 0.0123
DENTISTAS 1.07 0.0108
PERFUMES 4.20 0.0106
SABAO EM PO 2.16 0.0104
Fonte : Centro de Estudos de Preos - IBRE/FGV
131



Na tabela abaixo podemos observar a variao e influencia de alguns itens do INCC
no ms de maro de 2002
Especificao Variao % Influncia
TAPETE VINILICO/CARPETE -0.23 -0.0032
PISO CERAMICO -0.72 -0.0019
AZULEJO -0.18 -0.0017
CHUVEIRO ELETRICO - SIMPLES -0.35 -0.0012
CONDUTORES ELETRICOS (FIO/CABO) -0.32 -0.0010
ESQUADRIAS DE ALUMINIO -0.02 -0.0009
AJUDANTE ESPECIALIZADO 0.74 0.1011
SERVENTE 0.74 0.0574
CARPINTEIRO (FORMA E ESQUADRIA) 0.81 0.0335
PEDREIRO 0.69 0.0296
ELETRICISTA 0.75 0.0238
BOMBEIRO 0.75 0.0227
REFEICAO PRONTA NO LOCAL DE TRAB. 0.37 0.0188
ENGENHEIRO 0.77 0.0180
MADEIRA PARA TELHADOS 1.02 0.0178
PINTOR 0.82 0.0170
ENCARREGADO 0.75 0.0167
GESSEIRO 0.77 0.0162
TIJOLO/TELHA CERAMICA 0.54 0.0125
PERNA 3X3/ESTRONCA DE 3 0.91 0.0123
OPERADOR DE MAQUINAS E EQUIPAMENTOS 0.77 0.0123
Fonte : Centro de Estudos de Preos - IBRE/FGV

5.5.6 - ndice de Custo de Vida do DIEESE ICV

a) Definio
um nmero ndice que tem como objetivo medir o movimento dos preos de um
conjunto de bens e servios que formam uma cesta de consumo fixa, com itens e
quantidades apurada atravs de uma pesquisa de oramento familiar POF, nos
seus segmentos finais de comercializao, entre um ms civil e o seu anterior. Sua
132


principal utilidade medir apurar o poder de compra destes bens e servios pelos
trabalhadores (levando-se em considerao diferentes faixas salariais) e servir de
base para negociaes de melhores salrios, ou ainda para o clculo da inflao. A
populao objetivo composta por famlias com renda entre 1 e 30 salrios
mnimos.

b) Instituio
Departamento Intersindical de Estatstica e Estudos Scio-Econmicos, DIEESE,
mantido por cerca de 1000 participantes, incluindo as trs grandes centrais sindicais.

c) Abrangncia geogrfica: apenas o municpio de So Paulo.

d) Metodologia
Utiliza a frmula de Laspeyres, supondo que no h substituio de bens. As
quantidades apuradas, quando da realizao da POF, so mantidas constantes. A
cesta de consumo fixa obtida na POF mantm-se, portanto, inalterada, at que nova
pesquisa domiciliar seja realizada. Supe-se rigidez nos hbitos de consumo. A atual
composio dos grupos de despesas para o clculo do ndice o seguinte:
alimentao (27,44%), habitao (23,52%), equipamentos domsticos (6,13%),
transporte (13,62%), vesturio (7,87%), educao e leitura (6,91%), sade (8,18%),
recreao (2,08%), despesas pessoais (3,96%) e despesas diversas (0,28%).
e) Atualidade da pesquisa
A ltima pesquisa de oramentos familiares foi realizada em 1994/1995.

5.5.7 - Custo Unitrio Bsico da construo civil CUB

a) Definio
Determina o custo global da obra para fins de cumprimento do estabelecido na lei de
incorporao de edificaes habitacionais em condomnio, assegurando aos
compradores em potencial um parmetro comparativo realidade dos custos.
Atualmente, a variao percentual mensal do CUB tem servido como mecanismo de
reajuste de preos em contratos de compra de apartamentos em construo e at
mesmo como ndice setorial.
b) Instituio
133


O Custo Unitrio Bsico (CUB) calculado mensalmente pelos Sindicatos da
Indstria da Construo Civil de todo o pas.
c) Abrangncia geogrfica: Estadual.
d) Metodologia
Os salrios e preos de materiais e mo-de-obra, previstos na NBR-12.721, so
obtidos atravs do levantamento de informaes junto a uma amostra de cerca de
40 empresas da construo. Agindo desta maneira, o universo da pesquisa se d
sob a tica do comprador, eliminando uma srie de distores em relao ao
fornecimento de dados. Como o indicador a ser calculado refere-se a custo e no a
preo, mais correta a pesquisa junto ao comprador, que no caso so as
construtoras e no junto aos distribuidores ou vendedores. O clculo do custo bsico
por metro quadrado a somatria das combinaes preos x pesos dos insumos,
para cada especificao. Referidas especificaes so classificadas, por padro de
acabamento, nmero de quartos e nmero de pavimentos:
Pavimentos: 1, 4, 8 e 12
Nmero de quartos: 2 e 3
Padro de acabamento: baixo, normal e alto.
Assim, os tipos de CUB previstos na norma atingem 24 especificaes. Cada projeto
composto de 45 itens de insumos (39 para materiais e 6 para mo-de-obra).

5.5.8 - ndice de Preos ao consumidor do ITAG

a) Definio
O ndice de Preos ao Consumidor produzido pelo ITAG, constitui uma estimativa da
evoluo mdia dos preos de 319 bens e servios, componentes da cesta de
consumo tpica das famlias residentes no municpio de Florianpolis e pertencentes
faixa de renda de 1 a (+) de 20 salrios mnimos.
b) Instituio
ITAG Instituto Tcnico de Administrao e Gerncia, vinculado ao Centro de
Cincias da Administrao da UDESC. O ITAG iniciou a publicao de sua
estimativa do IPC-Fpolis, em JULHO de 1968.
c) Abrangncia geogrfica: municpio de Florianpolis.
d) Metodologia
134


A pesquisa de Oramento, bem como, o clculo do ndice mensal, esto
organizados em quatro diferentes nveis de agregao, o maior deles corresponde
s grandes categorias de consumo familiar:
ALIMENTAO (59,0939%) Alimentao no domiclio, Alimentao fora do
domiclio.
PRODUTOS NO ALIMENTARES (18,3883%) Vesturio, Artigos de residncia,
Produtos de assistncia sade e higiene, Produtos de uso pessoal.
SERVIOS PBLICOS (4,3751%) Servios pblicos, transportes.
OUTROS SERVIOS (18,1427%) Servios de residncia, Habitao, Servios de
assistncia sade, Servios de carter pessoal.
O clculo do IPC-Fpolis se baseia no cmputo de aproximadamente 14.000 mil
preos coletados mensalmente. O perodo de coleta de preos abrange do primeiro
ao ltimo dia do ms de referncia. Neste intervalo, so aplicados, atravs de uma
equipe de 15 (quinze) pesquisadores e 1 (um) repesquisador, cerca de 254
questionrios a uma amostra de 126 estabelecimentos comerciais e de prestao de
servios. A pesquisa de preos para o "Sub-grupo"ALIMENTAO DO DOMICLIO
realizada semanalmente, isto , os estabelecimentos pesquisados neste sub-grupo
recebem de 4 (quatro) a 5 (cinco) visitas dos coletadores ao longo do mesmo
perodo de coleta. Os demais estabelecimentos cobertos pela pesquisa so
visitados apenas uma vez a cada perodo de coleta. No clculo do IPC-Fpolis,
utilizada a frmula de Laspeyres modificada, de base mvel, com correo das
ponderaes pelo custo do ms anterior.
e) Atualidade da pesquisa
A estrutura de ponderaes presentemente utilizada, foi obtida, a partir de
Pesquisas de Oramentos Familiares, realizadas no decorrer do ano de 1987 junto a
382 famlias, escolhidas aleatoriamente.

5.5.9 - ndice IBOVESPA da Bolsa de Valores do Estado de So Paulo

a) Definio
O ndice Bovespa o valor atual, em moeda corrente, de uma carteira terica de
aes, constituda em 02/01/1968, a partir de uma aplicao hipottica. Supe-se
no ter sido efetuado nenhum investimento adicional, considerando-se somente a
reinverso dos dividendos recebidos e do total apurado com a venda dos direitos de
subscrio, alm da manuteno , em carteira, das aes recebidas a ttulo de
135


bonificao. Representa fielmente no s o comportamento mdio dos preos das
principais aes, servindo como orientao para o mercado, como tambm o perfil
das negociaes a vista observadas nos preges da Bolsa de Valores de So Paulo
Bovespa, sendo calculado em tempo real.
b) Instituio
A Bolsa de Valores de So Paulo uma entidade auto-reguladora que opera sob a
superviso da Comisso de Valores Mobilirios (CVM). Atualmente, a BOVESPA o
maior centro de negociao com aes da Amrica Latina, destaque que culminou
com um acordo histrico para a integrao de todas as bolsas brasileiras em torno
de um nico mercado de valores - o da BOVESPA.
c) Abrangncia geogrfica: nacional, pois aes de companhias abertas que operam
em todo o pas so negociadas e podem vir a fazer parte do ndice.
d) Metodologia
O ndice Bovespa nada mais do que o somatrio dos pesos (quantidade terica da
ao multiplicada pelo ltimo preo da mesma) das aes integrantes da sua
carteira terica. Assim sendo, pode ser apurado, a qualquer momento, por meio da
seguinte frmula:
n
Ibovespa T= Pi,t . Qi,t
i=1

Onde : Ibovespa T = ndice Bovespa no instante T; n = nmero total de aes
componentes da carteira terica; P = ltimo preo da ao i no instante T; Q =
quantidade terica da ao i na carteira no instante T.
Para que uma ao seja includa no ndice Bovespa necessrio que ela atenda,
simultaneamente, aos seguintes parmetros, sempre com relao aos 12 (doze)
meses anteriores: estar includa em uma relao de aes resultantes da soma, em
ordem decrescente, dos ndices de negociabilidade at 80% do valor da soma de
todos os ndices individuais; apresentar participao, em termos de volume, superior
a 0,1% do total; ter sido negociada em mais de 80% do total de preges do perodo.
Quadrimestralmente feita a recomposio da participao de cada papel no ndice
IBOVESPA.



136


Empresas que fazem parte do ndice:
Ao
Quantidade
Terica
(%) Ao
Quantidade
Terica
(%)
ACESITA 148,923851 0,757 IPIRANGA PET 1,721850 0,160
AMBEVE 0,437076 1,515 ITAUBANCO 1,997360 2,588
ARACRUZ 21,156855 0,609 ITAUSA 91,148137 1,429
BRADESCO 54,854293 5,050 KLABIN S/A 31,228004 0,225
BRADESPAR 162,008357 0,943 LIGHT 0,356682 0,322
BRASIL ON 3,862496 0,301 PETROBRAS ON 7,669278 2,965
BRASIL PN 15,30926 1,397 PETROBRAS PN 24,164498 9,103
BRASIL T PAR ON 6,206282 0,816 PETROBRAS BR 1,809450 0,449
BRASIL T PAR PN 24,247139 3,252 SABESP 0,738199 0,718
BRASIL TELEC 29,105352 2,830 SID NACIONAL 3,407190 0,916
CELESC 138,874087 0,471 SID TUBARO 2,428066 0,385
CEMIG ON 0,852795 0,198 SOUZA CRUZ 6,580238 0,683
CEMIG PN 10,370980 2,521 TEF DATA BRA 15,460114 0,108
CESP 8,498479 0,939 TELE CL SUL 22,640243 0,495
COMGAS 1,183787 0,798 TELE CL SUL 49,243828 1,287
COPEL 10,070412 1,246 TELE CTR OES 38,209282 1,500
COPENE 0,101161 0,345 TELE LEST CL 121,301543 0,867
CRT CELULAR 0,333650 1,208 TELE NORD CL 58,937584 1,388
ELETROBRAS ON 6,568227 1,549 TELEMAR ON 5,722681 1,286
ELETROBRAS PN 15,652071 3,285 TELEMAR PN 48,715775 13,096
ELETROPAULO 1,234286 0,709 TELEMAR N L 3,094387 1,367
EMBRAER ON 14,182975 1,307 TELEMIG PART 48,994795 1,512
EMBRAER PN 17,643317 1,715 TELESP 3,369224 0,730
EMBRATEL PAR ON 21,086055 1,693 TELESP CL PA 90,928157 5,692
EMBRATEL PAR PN 63,256224 4,612 TRAN PAULIST 14,712158 0,704
GERASUL 9,345176 0,266 USIMINAS 27,469447 1,317
GERDAU 4,801157 0,719 V C P 0,679661 0,404
GLOBO CABO 662,732965 3,954 VALE R DOCE 7,539908 2,982
INEPAR 26,132695 0,320
QUANTIDADE
TERICA TOTAL
2.209,299238 100,00

5.5.10 - Mdia Industrial Dow Jones

a) Definio
Objetiva representar aes de empresas sediadas nos EUA, empresas slidas e
rentveis, excluindo os setores de transportes e servios pblicos. Srie iniciada em
1896.
b) Instituio
Dow Jones Indexes, empresa responsvel pelo clculo e divulgao do ndice.
c) Abrangncia geogrfica: EUA, mas seu valor afeta os negcios ao redor do
mundo.
d) Metodologia
137


Apenas 30 empresas so computadas no ndice (28 negociadas na Bolsa de Nova
Iorque e 2 na Nasdaq), sua influncia no valor sendo computado de acordo com o
preo de suas aes em tempo real (hora de Nova Iorque, durante o perodo de
funcionamento das Bolsas). Abaixo as empresas e seus pesos no ndice, tal como
em 29 de junho de 2001
Empresa Setor Peso
ALCOA Inc. Materiais bsicos (alumnio) 2,52%
American Express Co, Financeiro 2,48%
AT&T Corp, Telecomunicaes 1,41%
Boeing Co, Industrial (aeroespacial) 3,55%
Caterpillar Inc, Industrial (mquinas) 3,20%
Citigroup Inc, Financeiro 3,38%
Coca-Cola Co, Alimentcio 2,87%
E,I, DuPont de Nemours & Co, Materiais bsicos (plsticos) 3,08%
Eastman Kodak Co, Fotogrfico 2,98%
Exxon Mobil Corp, Energia (petrleo) 5,58%
General Electric Co, Industrial 3,11%
General Motors Corp, Industrial (automobilstico) 4,11%
Hewlett-Packard Co, Tecnologia 1,83%
Home Depot Inc, Materiais domsticos 2,97%
Honeywell International Inc, Industrial 2,24%
Intel Corp, Tecnologia 1,87%
International Business Machines Corp, Tecnologia 7,22%
International Paper Co, Materiais bsicos (papel) 2,28%
J,P, Morgan Chase & Co, Financeiro 2,85%
Johnson & Johnson Farmacutico e higiene 3,19%
McDonald's Corp, Alimentcio (fast-food) 1,73%
Merck & Co, Inc, Farmacutico 4,08%
Microsoft Corp, Tecnologia 4,66%
Minnesota Mining &Manufacturing Co(3M) Industrial 7,29%
Philip Morris Cos, (Altria) Fumo 3,24%
Procter & Gamble Co, Farmacutico, higiene e limpeza 4,08%
SBC Communications Inc, Telecomunicaes 2,56%
United Technologies Corp, Industrial 4,68%
Wal-Mart Stores Inc, Lojas de departamento 3,12%
Walt Disney Co, Entretenimento 1,85%


5.5.11 - NASDAQ composto

a) Definio
No h apenas um nico ndice Nasdaq, mas vrios, dependendo do setor
envolvido: composto, ndice 100, ndice 100 para bancos, financeiro, industrial,
biotecnologia, informtica, seguros, entre outros, Alguns comearam a ser
138


registrados em 1971, O mais importante o Nasdaq composto, que reflete as
cotaes de cerca de 4000 empresas dos EUA e de outros pases, negociadas na
bolsa Nasdaq,
b) Instituio
Bolsa Nasdaq, mercado de aes que comeou a operar em 1971, Atualmente,
utilizando redes de computadores e telecomunicaes, sem se limitar a um nico
local de negociao,
c) Abrangncia geogrfica: Mundial
d) Metodologia. O ndice mais importante o Nasdaq composite (Nasdaq
composto), um ndice ponderado por capitalizao (e no por preo como o Dow
Jones), sendo baseado no valor de mercado de todos os papis que compem o
ndice, O ndice tambm uma razo, baseada no relacionamento entre o valor total
do mercado que compe o ndice atualmente e o valor total no primeiro dia em que o
ndice foi calculado, Para obter o valor do ndice divide-se o valor atual de mercado
(soma do produto do preo pelo total de aes de cada papel) pelo valor de mercado
no primeiro dia do ndice.

5.5.12 - Grficos dos principais ndices

-1.50
-1.00
-0.50
0.00
0.50
1.00
1.50
2.00
2.50
3.00
3.50
a
g
o
/
9
4
d
e
z
/
9
4
a
b
r
/
9
5
a
g
o
/
9
5
d
e
z
/
9
5
a
b
r
/
9
6
a
g
o
/
9
6
d
e
z
/
9
6
a
b
r
/
9
7
a
g
o
/
9
7
d
e
z
/
9
7
a
b
r
/
9
8
a
g
o
/
9
8
d
e
z
/
9
8
a
b
r
/
9
9
a
g
o
/
9
9
d
e
z
/
9
9
a
b
r
/
0
0
a
g
o
/
0
0
d
e
z
/
0
0
a
b
r
/
0
1
a
g
o
/
0
1
d
e
z
/
0
1
INPC IPCA ICV DIEESE

Figura 5.241 - Variaes percentuais mensais do INPC, IPCA e ICV do DIEESE de
agosto de 1994 a maro de 2002

139



-2
-1
0
1
2
3
4
5
6
a
g
o
/
9
4
d
e
z
/
9
4
a
b
r
/
9
5
a
g
o
/
9
5
d
e
z
/
9
5
a
b
r
/
9
6
a
g
o
/
9
6
d
e
z
/
9
6
a
b
r
/
9
7
a
g
o
/
9
7
d
e
z
/
9
7
a
b
r
/
9
8
a
g
o
/
9
8
d
e
z
/
9
8
a
b
r
/
9
9
a
g
o
/
9
9
d
e
z
/
9
9
a
b
r
/
0
0
a
g
o
/
0
0
d
e
z
/
0
0
a
b
r
/
0
1
a
g
o
/
0
1
d
e
z
/
0
1
ICV DIEESE IPC ITAG

Figura 5.3 - Variaes percentuais mensais do ICV do DIEESE e do IPC do ITAG de
agosto de 1994 a maro de 2002



IBOVESPA: julho de 1994 a maro de 2002
y = 1376.3x - 2E+06
0
20000
40000
60000
80000
100000
120000
140000
160000
180000
200000
a
g
o
/
9
4
d
e
z
/
9
4
a
b
r
/
9
5
a
g
o
/
9
5
d
e
z
/
9
5
a
b
r
/
9
6
a
g
o
/
9
6
d
e
z
/
9
6
a
b
r
/
9
7
a
g
o
/
9
7
d
e
z
/
9
7
a
b
r
/
9
8
a
g
o
/
9
8
d
e
z
/
9
8
a
b
r
/
9
9
a
g
o
/
9
9
d
e
z
/
9
9
a
b
r
/
0
0
a
g
o
/
0
0
d
e
z
/
0
0
a
b
r
/
0
1
a
g
o
/
0
1
d
e
z
/
0
1

Figura 5.442 - ndice IBOVESPA de julho de 1994 a maro de 2002
140



Mdia Industrial Dow Jones - 1981-2003
0
2000
4000
6000
8000
10000
12000
14000
j
a
n
/
8
1
s
e
t
/
8
1
m
a
i
/
8
2
j
a
n
/
8
3
s
e
t
/
8
3
m
a
i
/
8
4
j
a
n
/
8
5
s
e
t
/
8
5
m
a
i
/
8
6
j
a
n
/
8
7
s
e
t
/
8
7
m
a
i
/
8
8
j
a
n
/
8
9
s
e
t
/
8
9
m
a
i
/
9
0
j
a
n
/
9
1
s
e
t
/
9
1
m
a
i
/
9
2
j
a
n
/
9
3
s
e
t
/
9
3
m
a
i
/
9
4
j
a
n
/
9
5
s
e
t
/
9
5
m
a
i
/
9
6
j
a
n
/
9
7
s
e
t
/
9
7
m
a
i
/
9
8
j
a
n
/
9
9
s
e
t
/
9
9
m
a
i
/
0
0
j
a
n
/
0
1
s
e
t
/
0
1
m
a
i
/
0
2
j
a
n
/
0
3
Meses
M

d
i
a

I
n
d
u
s
t
r
i
a
l

D
o
w

J
o
n
e
s

Figura 5.543 - Mdia industrial Dow Jones de janeiro de 1981 a maro de 2003


Figura 5.644 - ndice Nasdaq composto de junho de 1999 a abril de 2003
141



REFERNCIAS
DONAIRE, Denis e MARTINS, Gilberto de Andrade. Princpios de Estatstica.
4 Edio. Ed. Atlas. So Paulo, 1998.
HOFFMANN, Ronaldo e VIEIRA, Sonia. Elementos de estatstica. 4 Edio.
Ed. Atlas. So Paulo, 2003.
MARTINS, Gilberto de Andrade. Estatstica geral e aplicada. 3 Edio. Ed.
Atlas. So Paulo, 2005.
MARTINS, Gilberto de Andrade e FONSECA, Jairo Simon. Curso de
Estatstica. 6 Edio. Ed. Atlas. So Paulo,1996.
Morettin, Pedro e Bussab, Wilton. Estatstica Bsica. 5 Edio. Ed Saraiva.
So Paulo, 2002.
SILVA, Ermes Medeiros; SILVA, Elio Medeiros; GONALVES, Valter; MUROLO,
Afrnio Carlos. Estatstica para os cursos de Economia, Administrao e
Cincias Contbeis. 3 Edio. Ed. Atlas. So Paulo, 1999.
SILVER, Mick. Estatstica para administrao. 1 Edio. Ed. Atlas. So Paulo,
2000.
SMAILES, Joanne e MCGRANE, ngela. Estatstica aplicada administrao
com Excel. 1 Edio. Ed. Atlas. So Paulo, 2002.
TOLEDO, Geraldo Luciano e OVALLE, Ivo Izidoro. Estatstica Bsica. 2
Edio. Ed. Atlas. So Paulo.

Pginas na Internet:
Indicadores econmicos: http://www.indicadores.hpg.com.br/
ndices financeiros brasileiros: http://www.portalbrasil.eti.br/indices.htm/
FIPE Fundao Instituto de Pesquisas Econmicas: http://www.fipe.com/
FGV Fundao Getlio Vargas: http://www.fgv.br/ibre/CEP/index.cfm
IBOVESPA ndice da Bolsa de Valores de So Paulo:
http://www.bovespa.com.br/
IBGE Instituto Brasileiro de Geografia e Estatstica:
http://www.sidra.ibge.gov.br/
ITAG Instituto Tcnico de Administrao e Gerncia:
http://www.esag.udesc.br/itag/itag.htm
SINDUSCON PR: http://www2.visywork.com.br/empresas/sinduscon/
Bolsa NASDAQ: http://www.nasdaq.com/
142


ndices Dow Jones: http://www.djindexes.com/

Você também pode gostar