Você está na página 1de 473

ESTATSTICA

USANDO EXCEL
Preencha a ficha de cadastro no final deste
livro e receba gratuitamente
informaes sobre os lanamentos
e as promoes da Elsevier.

Consulte nosso catlogo completo,


ltimos lanamentos e servios no site
www.elsevier.com.br
ESTATSTICA
USANDO EXCEL
2005, Juan Carlos Lapponi

Todos os direitos reservados e protegidos pela Lei no 9.610 de 19/12/1998.


Nenhuma parte deste livro, sem autorizao prvia por escrito da editora,
poder ser reproduzida ou transmitida sejam quais forem os meios empregados:
eletrnicos, mecnicos, fotogrficos, gravao ou quaisquer outros.

Editorao Eletrnica: Estdio Castellani


Copidesque: Lgia Paixo
Reviso Grfica: Roberto Mauro Facce e Carlos Maurcio da Silva Neto

Projeto Grfico
Elsevier Editora Ltda.
Conhecimento sem Fronteiras
Rua Sete de Setembro, 111 16 andar
20050-006 Centro Rio de Janeiro RJ Brasil

Rua Quintana, 753 8 andar


04569-011 Brooklin So Paulo SP Brasil

Servio de Atendimento ao Cliente


0800-0265340
sac@elsevier.com.br

ISBN 978-85-352-1574-8

Nota: Muito zelo e tcnica foram empregados na edio desta obra. No entanto, podem ocorrer erros de digitao, im-
presso ou dvida conceitual. Em qualquer das hipteses, solicitamos a comunicao ao nosso Servio de Atendimento
ao Cliente, para que possamos esclarecer ou encaminhar a questo.
Nem a editora nem o autor assumem qualquer responsabilidade por eventuais danos ou perdas a pessoas ou
bens, originados do uso desta publicao.

CIP-Brasil. Catalogao na fonte.


Sindicato Nacional dos Editores de Livros, RJ

L322e
Lapponi, Juan Carlos
Estatstica usando Excel / Juan Carlos Lapponi.
Rio de Janeiro: Elsevier, 2005 8a reimpresso.
il.

Inclui bibliografia
ISBN 978-85-352-1574-8

1. Excel (Programa de computador). 2. Estatstica.


I. Ttulo.

04-2744. CDD 005.369


CDU 004.42
V

O Autor

JUAN CARLOS LAPPONI


Engenheiro pela Faculdade de Engenharia da Universidade de Buenos Aires e
Doutor em Engenharia pela Escola Politcnica da Universidade de So Paulo.
Professor dos cursos de MBA em Finanas Corporativas e MBA em Gesto
Empresarial da FGV Management da Fundao Getulio Vargas e do MBA em
Administrao para Engenheiros do IMTInstituto Mau de Tecnologia.
VI

Obras do Autor

Matemtica Financeira com Aplicaes em Microcomputadores e Planilha de Clculo, Ebrs 1987.

As seguintes obras foram publicadas pela Editora Lapponi


Lotus 1-2-3 em Modelos para Avaliao Econmica de Projetos de Investimento, 1989.
Novas Funes Financeiras para Lotus 1-2-3, 1991.
Matemtica Financeira Usando Excel, verso 4, 1993.
Matemtica Financeira Usando Excel 4 e 5, 1994.
Estatstica Usando Excel 4 e 5, 1995.
Matemtica Financeira Uma Abordagem Moderna, terceira edio 1995.
Avaliao de Projetos de Investimento Modelos em Excel, 1996.
Matemtica Financeira Usando Excel 5 e 7, 1996.
Estatstica Usando Excel 5 e 7, 1997.
Matemtica Financeira, 1998.
Excel & Clculos Financeiros Introduo Modelagem Financeira, 1999.
Estatstica Usando Excel, 2000.

Todas as obras anteriores esto esgotadas.

A seguir a relao das obras atuais da Editora Lapponi.


Projetos de Investimento Construo e Avaliao do Fluxo de Caixa, 2000.
Matemtica Financeira Usando Excel Como Medir Criao de Valor, 2002.

Edio da Editora Elsevier Campus


Modelagem Financeira com Excel, Elsevier - Campus, primeira edio 2004.
Estatstica Usando Excel, Elsevier - Campus, quarta edio 2005.
XV

Prefcio

E statstica Usando Excel ensina Estatstica e explica como aplicar os conceitos e analisar resultados
por meio de exemplos resolvidos com os procedimentos tradicionais de clculo e o Excel. Nesta
quarta edio de Estatstica Usando Excel, boa parte dos temas da edio anterior foi reescrita e amplia-
da, melhorando a sequncia e a compreenso dos temas. Novos temas foram adicionados, ampliando
os conceitos estatsticos como, por exemplo, a tabela de probabilidades conjuntas e totais, os clculos
inversos com a distribuio normal, o poder do teste de hipteses, a anlise de varincia com dois fato-
res, a regresso linear mltipla, a projeo por ajuste de polinmio, taxa mdia e reta de regresso, a
construo de um ou mais boxplot com os recursos prprios do Excel, e outros temas mais.
Nesta nova edio, os exemplos em sua maioria foram resolvidos integrando os conceitos, os proce-
dimentos de clculo e a anlise dos resultados. No desenvolvimento dos exemplos, so explicados os
conceitos, os procedimentos de clculo utilizando as frmulas, as tabelas estatsticas, as funes e as
ferramentas de anlise estatsticas do Excel e as planilhas, os modelos e os simuladores desenvolvidos
pelo autor. Essa integrao torna o aprendizado de Estatstica eficaz e mostra que h diversos caminhos
para alcanar o mesmo resultado, incluindo a superposio de recursos do Excel.
A maioria das planilhas, modelos e simuladores da edio anterior ganhou um novo layout a fim de
facilitar a compreenso dos conceitos, a realizao de clculos e a anlise dos resultados. Foram adicio-
nadas novas planilhas, novos modelos e novos simuladores em Excel, por exemplo, os modelos Amos-
tragem sem reposio, construo de Histogramas e Anlise estatstica numrica sem limitao de tama-
nho de amostra. Tambm, os modelos da Distribuio amostral, da visualizao das Propriedades da m-
dia, do Teste de hipteses com novo grfico descritivo da deciso para cada um dos trs procedimentos,
do Ajuste manual da reta de regresso, do Grfico das distribuies apresentadas com visualizao cont-
nua do comportamento da curva em funo dos parmetros, e outros modelos mais. Os simuladores do
Lanamento de uma moeda com at 10.000 lanamentos, do Coeficiente de correlao visualizando sua
relao com o grfico dos pontos das amostras, do Teorema central do limite variando o tamanho da
amostra e o nmero de repeties, do Intervalo de confiana etc. Ao mesmo tempo, o leitor aprende a
utilizar recursos do Excel, por exemplo, a construo de grficos e histogramas, o registro de uma fun-
o e de uma frmula como matriz, as ferramentas de anlise, os comandos Atingir Meta, Linha de ten-
dncia, Solver e outras funes e comandos como a Formatao condicional etc.
Nesta nova edio foi mantido o objetivo de facilitar o autodesenvolvimento do leitor por meio de
exemplos resolvidos, integrando procedimentos de clculo e mais problemas propostos com respos-
tas. Temas complementares de Estatstica e de Excel foram adicionados em apndices de captulos para
no interferir no aprendizado. Alguns deles podem ser utilizados como trabalhos extras, por exemplo,
as demonstraes de frmulas, os modelos para combinao linear de variveis aleatrias com apli-
caes em finanas, a varivel aleatria do VPL de um investimento e a formao de uma carteira de
investimento utilizando o Solver, a determinao dos coeficientes de regresso utilizando o Solver e
outros mais.
XVI E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Todas as planilhas, os modelos estatsticos e os simuladores desenvolvidos em Excel 2002, compat-


veis com as verses 2000 e 2003, bem como parte dos exemplos e problemas resolvidos esto includos
na pgina do livro, no site da Editora.
O contedo deste livro ser til para:
l Estudantes que cursam Estatstica nas diversas reas do conhecimento e em diferentes nveis de gra-
duao como, em ordem alfabtica, Administrao, Biologia, Contabilidade, Economia, Engenha-
ria, Finanas, Marketing, Medicina etc.
l Estudantes que necessitam aprimorar ou complementar seus conhecimentos de Estatstica utilizan-
do o Excel.
l Profissionais das diversas reas que utilizam os conceitos de Estatstica e necessitam, ou gostariam,
de utilizar as funes estatsticas, as ferramentas de anlise, planilhas, modelos e simuladores de es-
tatstica em Excel.
l Todos aqueles que podero utilizar as planilhas, os modelos e os simuladores de estatstica em Excel
da forma como esto na pgina do livro, no site da Editora, ou modificando-os, para atender s suas
necessidades.
l Alunos de reas correlatas que utilizaro estatstica e desejam antecipar seu aprendizado e agregar
valor ao seu conhecimento visando ao mercado de trabalho.
l Usurios de Excel que desejam conhecer e aprender a utilizar os recursos de Estatstica disponveis.
Queremos agradecer a todos os professores e alunos que utilizaram as edies anteriores deste livro
e que, com seu apoio, nos estimularam para apresentar esta quarta edio de Estatstica Usando Excel.
Agradecemos tambm a todos aqueles que participam de nosso constante desenvolvimento.

JUAN CARLOS LAPPONI


Agosto 2004
Captulo 1
DADOS, VARIVEIS
E AMOSTRAS

U m exemplo de Estatstica o Censo 2000 realizado pelo IBGE cujo primeiro resultado mostra que
a populao do Brasil no ano 2000 era de 169.799.170 pessoas. Depois, a populao nos anos
1980, 1990, 1996 e 2000 classificadas por sexo, por grandes grupos de idade e por situao de domic-
lio em % est registrada na tabela1 da Figura 1.1.

POPULAO TOTAL E PROPORO DA POPULAO POR SEXO,


GRANDES GRUPOS DE IDADE E SITUAO DE DOMICLIO
1980 1990 1996 2000
Populao total 119.002.706 146.825.475 157.070.163 169.799.170
Por sexo (%)
Homens 49,68 49,36 49,3 49,22
Mulheres 50,31 50,63 50,69 50,78
Por grandes grupos de idade (%)
0-14 anos 38,2 34,72 31,54 29,6
15-64 anos 57,68 60,45 62,85 64,55
65 e mais 4,01 4,83 5,35 5,85
Por situao do domiclio (%)
Urbana 67,59 75,59 78,36 81,25
Rural 32,41 24,41 21,64 18,75

FIGURA 1.1 Resultados do Censo 2000 realizado pelo IBGE.

Dos resultados registrados na tabela da Figura 1.1 pode-se deduzir como essas propores evolu-
ram com o passar do tempo, as tendncias de crescimento, mas no permitem medir a fora dessas ten-
dncias. Uma forma de analisar essas tendncias medir a variao desses crescimentos durante os

1 Informaes obtidas em Brasil em Sntese no site www.ibge.gov.br do IBGE Instituto Brasileiro de Geografia e Estatstica.
2 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

anos definidos nas colunas da tabela. Na planilha Censo 2000 includa na pasta Captulo 1 foi calcula-
da a taxa de crescimento de cada item utilizando o procedimento de mdia geomtrica como mostra a
tabela da Taxa de Crescimento Figura 1.2. Por exemplo, a mdia geomtrica anual da populao entre
1
146.825.475 10
os anos 1980 e 1990 2,12% resultado obtido com a seguinte frmula 1 = 0,0212.
119.002.706
Esse procedimento de clculo foi utilizado para obter os resultados restantes da tabela da Figura 1.2.2

Taxa de crescimento Mdia geomtrica anual


1990/1980 1996/1990 2000/1996 2000/1980 2000/1990
2,12% 1,13% 1,97% 1,79% 1,46%

0,065% 0,020% 0,041% 0,047% 0,028%


0,063% 0,020% 0,044% 0,047% 0,030%

0,95% 1,59% 1,57% 1,27% 1,58%


0,47% 0,65% 0,67% 0,56% 0,66%
1,88% 1,72% 2,26% 1,91% 1,93%

1,12% 0,60% 0,91% 0,92% 0,72%


2,79% 1,99% 3,52% 2,70% 2,60%

FIGURA 1.2 Taxa de crescimento utilizando a mdia geomtrica anual.

Anlise dos resultados


Os resultados da tabela da Figura 1.2 mostram que:

l A populao total continua crescendo, entretanto a mdia geomtrica da taxa de crescimento anual
diminui, pois durante os anos 1980 e 1990 a mdia geomtrica foi de 2,12% ao ano e durante os anos
1990 e 2000 foi de 1,5% ao ano.
l Quanto classificao por sexo, a populao de mulheres continua sendo maior que a dos homens
com tendncia de aumentar essa diferena. De 1980 a 2000 a populao de homens tem diminudo
com taxa mdia geomtrica de 0,047% ao ano, e a populao de mulheres tem aumentado, curiosa-
mente, com taxa mdia geomtrica +0,047% ao ano.
l Quanto classificao por grandes grupos de idade entre 1980 e 2000, a populao entre 0 e 14 anos
diminuiu com taxa mdia geomtrica de 1,27% ao ano, a populao entre 15 e 64 anos aumentou
com taxa mdia geomtrica de 0,56% ao ano, e a populao com mais de 65 anos aumentou com taxa
mdia geomtrica 1,91% ao ano.
l Quanto classificao por situao de domiclio 1980 e 2000, a populao com domiclio urbano
aumentou com taxa mdia geomtrica de crescimento positiva de 0,9% ao ano e a populao com
domiclios rurais diminuiu com taxa mdia geomtrica de crescimento negativa de 2,7% ao ano.

Voc pode conhecer a estimativa da populao do Brasil e do Mundo minuto a minuto. Enquanto re-
digamos esta seo, da pgina do IBGE na Internet copiamos a informao registrada a seguir:

2 O procedimento de projeo pela taxa mdia geomtrica apresentado no Captulo 16.


C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 3

Estimativas da Populao
no dia 16/7/2004 s 14 horas e 46 minutos
Somos agora no Brasil: 179.203.116 habs.
Somos agora no Mundo: 6.160.714.635 habs.

Projees
A anlise desses resultados no se esgota nas poucas medidas que realizamos na planilha Censo 2000,
pois a partir desses resultados surgem perguntas relacionadas, primeiro, com as causas que vm provo-
cando esses resultados e, depois, com as projees futuras que se podem extrair desses resultados. Por
exemplo, enumerando as causas que vm provocando a diminuio da populao jovem e aumentan-
do a populao adulta com destaque s pessoas com mais de 65 anos e, olhando para o futuro, tambm
poderiam ser enumeradas as possveis consequncias dessas tendncias. Um resultado rpido das con-
sequncias futuras pode-se resumir da seguinte forma: em longo prazo a populao ser mais velha e
crescer menos como mostra a projeo da Figura 1.3.3

FIGURA 1.3 Projeo


de Indicadores Sociais
realizadas pelo IBGE.

Decises
Os resultados estatsticos ajudam a tomar decises com base em poucos dados.4 O processo estatstico
de amostragem ou censo gera informaes que auxiliam na realizao de previses ou projees e , ou
deve ser, uma das preocupaes das atividades de negcios e governamentais. Nas empresas necess-
rio prever as vendas, os estoques, os custos, o fluxo de caixa etc. para um determinado perodo como
o oramento anual do prximo ano. Na administrao pblica faz-se necessrio prever o nmero de
habitantes, a arrecadao, os custos dos servios prestados etc. Voltando ao Censo 2000, o seguinte
trecho um exemplo do que dizemos ...O estadista tem o dever de governar com olho no futuro, anteci-
pando-se em dar respostas a problemas que explodiro depois de seu mandato....5

3 Do artigo de Nilson Brando Jr. e Alexandre Rodrigues: Populao:mais velha e crescendo menos, publicado no jornal O Estado de
So Paulo em 14/04/2004.
4 O primeiro relato de um esforo ambicioso e influente de utilizao do processo estatstico de amostragem foi realizado em 1664
em Londres por John Graunt que passara toda sua vida adulta como mercador de aviamentos. Veja Bernstein P. Desafio aos Deuses A
Fascinante Histria do Risco Editora Campus, 1997.
5 Da coluna de Suely Caldas A Previdncia pede socorro!- Com a populao idosa crescendo a galope, multiplica-se o dficit previdenci-
rio. Publicado no jornal O Estado de So Paulo em 18/04/2004.
4 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Nas empresas que desejarem continuar crescendo no mercado em que atuam os desafios no so
muito diferentes. As tendncias dos ndices mostram riscos, oportunidades e desafios. Enquanto o
cliente dos servios da administrao pblica formado praticamente por todos os habitantes do pas, o
cliente das empresas privadas uma parte desses habitantes. Por exemplo, o gerente de marketing ne-
cessita determinar o tamanho do mercado de seu novo produto, mas a populao desse produto nem
sempre coincide com a populao do pas, como descreve o seguinte trecho de um editorial: Que a
afirmao, repetida exausto, de que o Brasil um mercado constitudo por 170 milhes de consumidores
uma falcia no novidade. ... 40 milhes de pessoas, ou 23,5% da populao do Pas, com rendas mdia e
alta, que participam plenamente do mercado consumidor. ... Do consumo depende o crescimento sustentado
da economia. As pessoas com rendas mdia e alta, segundo a pesquisa, j atingiram o limite de sua capacida-
de de consumo. A expanso das atividades dependeria, portanto, dos 130 milhes de pessoas que compem
as faixas mais baixas de rendimento ...6

A disciplina Estatstica
O Censo 2000 nos deu a oportunidade de apresentar a utilizao da Estatstica sem entrar nos detalhes
dos procedimentos de amostragem, resumo e anlise dos dados e inferncia, destacando algumas pos-
sveis consequncias futuras dessas projees referentes a uma pequena parte das variveis pesquisa-
das. Note que a anlise realizada partiu do resumo das informaes coletadas em questionrios com-
postos de vrias pginas utilizadas no censo.

EXEMPLO 1.1
No seu primeiro dia de trabalho, o novo gerente geral Ricardo pediu ao chefe de vendas Carlos o relatrio de
vendas do ms anterior. No mesmo dia, Carlos entregou o relatrio solicitado contendo 65 pginas com 32
registros de vendas dirias em cada pgina. Carlos explicou que era um relatrio completo onde cada regis-
tro de venda diria continha a data, o nome do comprador, o valor bruto, o desconto, o valor lquido, o pra-
zo para pagamento e outras informaes relevantes sobre a venda como o nome do vendedor etc.
Da forma como esto apresentadas as informaes no ser possvel obter concluses sobre as vendas do
ms anterior seno for realizada alguma classificao desses dados. Para uma anlise inicial, Ricardo definiu o
valor das vendas dirias e suas datas como os dados relevantes, as variveis da anlise. Depois de resumir os da-
dos dessas duas variveis, Ricardo constatou que 38% das vendas dirias representam 70% das vendas do
ms, e que 73% das vendas foram realizadas nos primeiros quinze dias do ms.

O Exemplo 1.1 mostra a necessidade de resumir as informaes, pois da forma como os dados dis-
ponveis esto apresentados no ser possvel obter concluses. Algumas vezes os dados disponveis
so resumidos como os do Censo 2000 apresentado anteriormente, ou as informaes disponveis no
so as requeridas, ou a quantidade de informaes disponveis tambm um desafio para obter resulta-
dos. Resumir as informaes do Exemplo 1.1 necessrio devido variabilidade ou falta de uniformi-
dade dos dados. Se, por exemplo, os valores das vendas da empresa forem constantes as respostas se-
riam obtidas de forma simples sem necessidade de realizar anlises estatsticas e, consequentemente, a
necessidade de estudar estatstica seria bem menor.
Para obter as respostas requeridas foi necessrio, primeiro, estabelecer quais indivduos, pessoas,
objetos ou coisas deveriam ser analisados e, depois, definir as caractersticas que deveriam ser medidas
para obter as respostas procuradas.

6 Do Editorial A falcia do mercado de consumo publicado no jornal O Estado de So Paulo em 8/12/2003.


C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 5

O objetivo da Estatstica Descritiva organizar, resumir, analisar e interpretar


observaes disponveis.

Para alguns estudiosos a estatstica uma arte; para outros a estatstica a simples aplicao do bom
senso. Em qualquer caso, a estatstica ajuda a tomar decises com informaes incompletas, tendo pre-
sente que o sucesso da deciso depender da habilidade do analista para compreender os resultados das
informaes contidas nos dados. A primeira parte do processo decisrio a estatstica descritiva e a ou-
tra a inferncia estatstica.

O objetivo da Inferncia Estatstica obter respostas corretas de questes


especficas, atendendo a um determinado grau de acerto.

Origem dos dados


A Estatstica lida com dados, nmeros dentro de um contexto. Entretanto, a utilizao de estatstica
mais do que trabalhar com nmeros, pois embora a organizao dos nmeros e a construo de grfi-
cos possa ser mecanizada com softwares e modelos, as ideias e bons julgamentos, por enquanto, no
podem ser automatizados. O analista deve ter o hbito de perguntar, por exemplo, o que mostram os
resultados dentro de um determinado contexto? Quais as respostas que os dados podem dar a pergun-
tas especficas?
Tenha em mente que durante a apresentao da disciplina Estatstica realizada uma anlise expla-
natria de dados conhecidos, no havendo, em geral, nenhuma pergunta in mente, salvo situaes
como a do Censo 2000 apresentado na qual voc consegue vivenciar os resultados apresentados. Entre-
tanto, na prtica diria da estatstica so procuradas respostas a perguntas especficas, por exemplo,
quais indivduos (pessoas, animais, taxas de juros e outras coisas) devem ser estudados? Que variveis
devem ser medidas? Nesses casos, em geral, os dados devem ser gerados.
Os dados requeridos pela anlise so obtidos pesquisando dados disponveis, ou gerando novos da-
dos. Em geral, os dados disponveis so gerados e divulgados por instituies e empresas para muitas
finalidades, as pesquisas do IBGE, de anurios, Internet, jornais, revistas etc. A procura dessas infor-
maes toma bastante tempo, porm com pouco desembolso de dinheiro. Entretanto, na gerao de
novos dados as respostas desejadas sero obtidas de amostras cujos indivduos respondero a pergun-
tas bem elaboradas e registradas num questionrio. A procura dessas novas informaes toma bastante
tempo exigindo maior desembolso de dinheiro.
Depois de coletados, os dados podero ter a necessidade de serem ajustados, pois nem sempre os da-
dos coletados estaro no formato correto. Por exemplo, as vendas em $ podem refletir variaes
combinadas de quantidade e de preo, devendo ser necessrio retirar um desses efeitos, ou os dois,
ajustando as quantidades considerando o crescimento da populao e ajustando os preos para moeda
constante deflacionando os dados com um ndice adequado. Outro caso so as rentabilidades de inves-
timentos que refletem mudanas econmicas como a inflao e os prazos diferentes, devendo ser ne-
cessrio retirar esses efeitos.
Os dados ajustados so representativos do processo sob anlise; entretanto, as unidades dos dados
podem ser difceis de analisar, por exemplo, o histograma do faturamento em $ de uma empresa, ou a
anlise simultnea de vrias sries de dados com unidades diferentes. Uma forma de facilitar a anlise
transformar as sries de dados nas suas respectivas sries de taxas de crescimento, de forma unitria ou
percentual, seja um grupo de sries de dados com unidades diferentes ou uma nica srie. Nesse proce-
dimento, em geral, perde-se o primeiro dado.
6 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Dados e variveis
Quanto a sua origem, os dados ou observaes podem ser obtidos de:

l Respostas de Pesquisas. Quem aplica a pesquisa no tem nenhum controle intencional sobre os fa-
tores que influenciam as respostas: a contagem de habitantes de um pas, o cadastro dos clientes de
um banco, a aceitao de um produto por um determinado tipo de consumidor etc.
l Respostas de Experimentos. Quem aplica o experimento tem controle intencional sobre os fatores
que influenciam as respostas: o teste de estabilidade de produtos perecveis frente a diferentes valo-
res de temperatura e umidade, o desgaste de componentes de equipamentos mecnicos em condi-
es especificadas e fora de elas etc.

Unidade elementar qualquer pessoa, objeto ou coisa que faa parte de uma
populao.
Dado o resultado de investigao, clculo ou pesquisa, do dicionrio Houaiss.
Varivel toda caracterstica que pode assumir diversos valores conforme pessoa,
objeto ou coisa.

As respostas de uma pesquisa ou um experimento so a matria-prima da anlise estatstica em que


os dados ou observaes so obtidos medindo as caractersticas de uma pessoa, objeto ou coisa. O con-
junto dessas respostas ou observaes forma uma unidade elementar que, em geral, est composta de
uma ou mais caractersticas denominadas variveis. Por exemplo, cada questionrio do Censo 2000
uma unidade e cada resposta dentro desse questionrio uma varivel.

EXEMPLO 1.2
A tabela seguinte registra parte do Cadastro de Funcionrios de uma empresa.

Nome Idade Cargo Sexo Peso Escolaridade


Joo 27 Supervisor M 62 kg 2o Grau
Alex 38 Chefe M 78 kg 1o Grau
Estela 34 Gerente F 65 kg 3o Grau
Ana 32 Secretria F 58 kg 3o Grau

Quais so as unidades elementares e as variveis deste cadastro? Cada uma das seis variveis de cada fun-
cionrio da empresa, Nome, Idade, Cargo, Sexo, Peso e Escolaridade, compem uma unidade elementar, ten-
do a tabela quatro unidades elementares.

Nmero de variveis
A unidade elementar de informao pode conter qualquer nmero de variveis e a anlise estatstica
pode ser classificada de acordo com esse nmero de variveis, por exemplo:

l Uma nica varivel. So exemplos deste tipo de informao:


l As vendas mensais de uma loja.
l As projees realizadas por 20 analistas financeiros sobre o valor da taxa de juros nos prximos
12 meses.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 7

l O lucro lquido trimestral de uma empresa.


l O saldo mdio dos clientes de um banco comercial etc.
Os mtodos estatsticos para resumir cada uma dessas variveis so: o histograma, a mdia, o desvio
padro etc.
l Duas variveis7. So exemplos deste tipo de informao:
l Os valores mensais do faturamento e do lucro lquido da empresa.
l A rentabilidade diria de uma ao e a rentabilidade diria do ndice da carteira terica da Bolsa de
Valores.
l A rentabilidade anual de um investimento e a taxa anual de inflao.
l O salrio e a idade dos entrevistados numa pesquisa de clientes potenciais de um fabricante de re-
frigerantes etc.
Alm dos mtodos estatsticos para resumir cada uma dessas variveis h tambm o objetivo de
utilizar mtodos estatsticos para verificar e medir a fora da relao entre duas variveis, a proje-
o de uma varivel em funo da outra etc.8
l Trs ou mais variveis9. So exemplos deste tipo de informao:
l A relao entre o PIB e duas ou mais variveis econmicas.
l Cadastro dos clientes de um banco: idade, escolaridade, profisso, nmero de bancos que opera,
residncia etc.
l Cadastro dos funcionrios de uma empresa: nome, sexo, escolaridade, tempo de casa, cargo etc.
l Resultados da colheita de um determinado tipo de cultura: rea cultivada, regio, umidade e tipo
do solo, clima durante o cultivo, quantidade e qualidade do fertilizante usado, tipo de preparao
da terra, cuidados e qualidade da mo de obra etc.

Neste caso, alm dos mtodos estatsticos para resumir cada uma dessas variveis h tambm o obje-
tivo de utilizar mtodos para verificar a existncia de relao entre uma e as restantes variveis, o grau
de relao entre as variveis, a projeo de uma varivel em funo das restantes etc.

Classificao dos dados


Como o procedimento estatstico a ser aplicado depender da natureza dos dados10 ou das observaes
de cada varivel, deve-se desenvolver a habilidade de distinguir os tipos de dados possveis e suas uni-
dades de medida. Quanto a sua natureza, as observaes ou dados se classificam em quantitativas dis-
cretas e contnuas, qualitativas nominais e ordinais, de corte transversal e sries temporais.

l Dados quantitativos. Refere-se a quantidades medidas numa escala numrica, em geral, acompa-
nhadas de alguma unidade de medida e podem ser de dois tipos:
l Dados discretos. Referem-se aos valores numricos que assumem somente nmeros inteiros po-
sitivos 0, 1, 2, 3 .... Os dados discretos resultam, em geral, de contagens: a quantidade de vendas
dirias de uma empresa, o nmero de filhos das famlias de uma regio do pas, o nmero de mo-
vimentos da conta corrente dos clientes de um banco comercial, a quantidade de peas defeituo-
sas em um lote de produo, o nmero de transaes financeiras com erro de lanamentos, o n-
mero de acidentes nas estradas durante as frias anuais de vero etc.

7 Denominado como anlise bidimensional.


8 As variveis so classificadas em dependentes e independentes conforme a situao, podendo uma mesma varivel, em pocas dife-
rentes, assumir um dos dois tipos.
9 Denominado como anlise multidimensional.
10 Do dicionrio Houaiss, dado o resultado de investigao, clculo ou pesquisa.
8 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l Dados contnuos. Referem-se aos valores numricos que assumem qualquer valor do conjunto
dos nmeros reais. Os dados contnuos resultam, em geral, de medies que podem ter grande
preciso: o valor das vendas dirias de uma empresa, a estatura dos alunos da terceira srie, o valor
dos depsitos e retiradas da conta corrente dos clientes de um banco comercial, o consumo mensal
de energia eltrica, o tempo necessrio para realizar uma tarefa repetitiva, o tempo de espera para
ser atendido em um servio de sade pblica etc.
l Dados qualitativos. Refere-se s observaes no numricas e so classificados em nominais e ordinais:
l Dados nominais. Esses dados no tm ordenamento nem hierarquia. Por exemplo, o sexo dos
funcionrios registrados no cadastro da empresa, o estado civil, o nome das empresas que tm
aes negociadas na Bolsa de Valores, cidade de residncia do respondente etc.
l Dados ordinais. Esses dados so equivalentes aos nominais, porm incluindo uma ordem, uma
hierarquia. Por exemplo, o cargo dos funcionrios registrados no cadastro da empresa: presiden-
te, diretor, gerente etc.; a resposta a um questionrio de pesquisa onde h uma escala para esco-
lher: bom, regular e ruim; as posies das cinquenta maiores empresas por vendas durante um
ano: primeira, segunda etc.

Escala de medio dos dados


Da forma como foi apresentada a classificao dos dados das variveis no suficiente. As seguintes
quatro escalas de classificao adicionam novas informaes s anteriores.
l Escala Nominal. Valores numricos numa escala nominal apenas do nome a uma categoria ou clas-
se; os nmeros so utilizados somente para diferenciar os objetos, categorias ou nomes. Por exem-
plo, numa pesquisa de mercado realizada nas regies Sul e Sudeste do Brasil, o varivel estado de nas-
cimento do entrevistado foi codificada da seguinte forma: 1=Rio Grande do Sul, 2=Santa Catarina,
3=Paran, 4=So Paulo e 5=Rio de Janeiro. Embora o cdigo tenha transformado um nome em um
nmero, este nmero no mantm todas as propriedades dos nmeros; por exemplo, no se podem
estabelecer relaes como 3>2 ou 1+2=3 ou 3 2=1 como o leitor pode confirmar substituindo cada
nmero pelo estado correspondente.
l Escala Ordinal. Valores numa escala ordinal do nome e ordem a um objeto, categoria ou classe; os
nmeros se utilizam para diferenciar em ordem de superioridade seguindo algum critrio de hierar-
quia. Em uma pesquisa a varivel instruo do entrevistado foi codificada assim: 1=Sem Instruo,
2=Primeiro Grau, 3=Segundo Grau, 4=Terceiro Grau, 5=Mestre e 6=Doutor. Neste caso, na trans-
formao de um nome em um nmero, o nmero mantm algumas propriedades dos nmeros; por
exemplo, podem ser estabelecidas relaes do tipo 3>2 (o grau de instruo 3 maior que o grau de
instruo 2), porm no se podem estabelecer relaes do tipo 2+3=5 como o leitor pode confirmar
substituindo cada nmero pelo grau de instruo correspondente. Ao estudar as medidas de orde-
namento percentil e quartil se poder ver que so medidas na escala ordinal, pois elas mostram o de-
sempenho de cada elemento de uma varivel com relao aos outros elementos sem preocupao de
determinar quanto melhor ou pior foi o desempenho.
l Escala de Intervalos. Valores numa escala de intervalos eliminam a limitao da escala ordinal, esta-
belecendo intervalos iguais onde possvel ordenar as medies e, ao mesmo tempo, explicar em
quanto difere uma observao de outra. Por exemplo, o aumento de temperatura de ontem para hoje
de cinco graus, de 20 para 25 graus centgrados. Podemos dizer que hoje est mais quente do que
ontem. Essa escala de medida tem uma unidade de medida, um zero arbitrrio11 e a distncia entre
duas medies nessa escala tem um significado preciso. Outro exemplo de escala de intervalos so
os tempos dos calendrios gregorianos e outros tipos.

11 O zero da escala de graus centgrados o ponto de congelamento da gua no nvel do mar; entretanto, essa temperatura medida na
escala de graus Fahrenheit 32 graus.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 9

l Escala Proporcional. Valores numa escala proporcional eliminam a limitao da escala intervalar
estabelecendo um zero da prpria categoria, denominado como zero absoluto. Por exemplo, peso
zero claramente significa falta de peso, o peso de uma caixa de 86 kg o dobro do de uma caixa de 43
kg, e 33 peas rejeitadas de um lote de produo representam o triplo do lote de produo com onze
peas rejeitadas.

Tipos de variveis
As variveis podem ser obtidas de duas formas.

l Sries temporais. As observaes so dados de uma mesma varivel em diferentes perodos de tem-
po: o valor do PIB anual de um pas, a taxa mensal de desemprego numa regio, as cotaes dirias de
uma ao, a rentabilidade mensal de uma empresa, a demanda de energia eltrica diria na regio Su-
deste medida s 18h etc.
l Corte transversal numa data ou perodo. Se na coleta dos dados no for considerada a sequncia
temporal; por exemplo, amostras da quantidade produzida e do preo mdio dos produtos, ou das
vendas e do investimento em propaganda, a mdia de apartamentos vendidos durante o ltimo ms
pelas primeiras dez imobilirias da cidade, o nmero de operaes fechadas por cinco aes numa
determinada data etc.

Populao e amostra
A contagem da populao em 2000 realizada pelo IBGE foi de 169.799.170. Em termos estatsticos, a
contagem do censo foi realizada consultando a populao do Brasil. Outro exemplo, a partir de uma
amostra das contas de energia eltrica dos consumidores residenciais do Brasil, o consumo de energia
eltrica pode ser relacionado com as condies scioeconmicas dos consumidores.

Populao o conjunto total unidades elementares de pessoas, objetos ou coisas


sobre as quais se querem obter informaes.

Um subconjunto de unidades elementares selecionadas de uma populao


denominado amostra.

Uma populao pode ser formada por todos os habitantes de um pas, ou de um estado, ou de um
municpio etc. Um exemplo de pesquisa de uma populao completa o censo demogrfico do Brasil
realizado pelo IBGE. A anlise das vendas de um segmento da economia, por exemplo, o de monta-
doras de carros, durante o mesmo ano outro exemplo de populao. Entretanto, nem sempre con-
veniente obter informaes de todas as pessoas, objetos ou coisas de uma populao. Os resultados de
uma pesquisa de inteno de voto de todos os eleitores do pas numa eleio presidencial no conse-
guiriam captar do que os partidos polticos necessitam, pois o tempo necessrio para coletar todas as
opinies comprometeria os resultados, alm de ser muito cara para a finalidade que se prope. Em al-
guns casos, a restrio de consultar toda a populao econmica, como o caso da determinao da
vida til das lmpadas que obrigaria a testar todas as lmpadas produzidas, no restando nenhuma
para venda! Dessa maneira, o procedimento recomendado escolher uma amostra representativa de
um lote de lmpadas produzidas.
Deve-se ter presente que nem sempre um censo oferecer melhores resultados do que uma amostra.
Em muitos casos a obteno de informaes de uma amostra da populao mais adequada, pois ela
10 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

mais rpida de ser aplicada, concluda, de obter e utilizar os resultados e, consequentemente, tem custo
menor. Os erros possveis de serem cometidos na realizao de uma amostragem podem ser evitados
ou corrigidos aplicando tcnicas adequadas e estabelecendo resultados com estimativa de erro, por
exemplo, um intervalo de confiana.

Uma amostra representativa tem as mesmas caractersticas da populao de onde


foi retirada.

Muitas aplicaes de estatstica utilizam amostras retiradas de uma populao da qual se deseja ob-
ter respostas, tendo presente que a amostra um subconjunto representativo da populao.

EXEMPLO 1.3
O objetivo estimar o nmero de palavras contidas neste livro de estatstica, considerando apenas as pginas
dos captulos, sem considerar o Sumrio, o ndice etc.

Soluo. H diversas formas de estimar o nmero de palavras contidas no livro. A seguir apresentamos qua-
tro procedimentos diferentes.
1. O primeiro procedimento comea pela escolha de uma pgina do livro e a contagem do nmero de linhas
dessa pgina. Depois, selecionamos trs linhas da pgina escolhida e contamos o nmero de palavras con-
tidas nas trs linhas. Em sequncia, calculamos a mdia de palavras por linha e, com esse valor, calculamos
o nmero de palavras por pgina, utilizando o nmero de linhas j definido. Finalmente, multiplicando o
nmero estimado de palavras por pgina pelo nmero total de pginas obtemos uma estimativa do nme-
ro de palavras do livro. Antes de o leitor fazer reparos quanto a este procedimento, sugerimos que continue
com os outros dois procedimentos.
2. O segundo procedimento comea pela escolha de uma pgina, segue com a contagem do nmero de pa-
lavras contidas na pgina escolhida e termina com a multiplicao deste valor pelo nmero de pginas do
livro.
3. O terceiro procedimento, um pouco melhor que o anterior, comea pela escolha de cinco pginas diferen-
tes do livro. Segue com o clculo da mdia de palavras por pgina. Finalmente, o nmero de palavras do li-
vro estimado como o resultado da multiplicao da mdia de palavras por pgina pelo nmero de pgi-
nas do livro.
4. O ltimo procedimento a contagem de todas as palavras do livro de estatstica, pgina por pgina. o
caso de realizar o censo de palavras do livro.

As estimativas do nmero de palavras do livro dos trs primeiros procedimentos do Exemplo 1.3 de-
vero ser diferentes, sendo que a estimativa da amostra de maior tamanho ser mais prxima do resul-
tado da contagem de todas as palavras no quarto procedimento. Estendendo essas concluses, pode-se
atestar confiana na estimativa de uma amostra se os elementos da amostra forem escolhidos assegu-
rando que todos os participantes que formam a populao tenham a mesma oportunidade ou chance
de serem escolhidos. A amostra de uma populao retirada dessa forma denominada amostra aleat-
ria de tamanho n cujas premissas so:

1. Cada unidade elementar da populao tem a mesma probabilidade de ser escolhida numa amostra
de tamanho n, sendo que cada unidade elementar ser escolhida de forma independente das outras
unidades.
2. Todas as amostras extradas possveis de tamanho n de uma populao tm a mesma probabilidade
de serem selecionadas.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 11

Uma amostra aleatria de tamanho n retirada de uma populao uma das muitas
possveis e igualmente provveis combinaes de n unidades elementares que
podem ser retiradas de uma populao. Portanto, qualquer amostra de tamanho n
tem a mesma probabilidade de ser selecionada.

Dgitos e nmeros aleatrios


As expresses nmeros aleatrios e dgitos aleatrios so utilizadas como sinnimos, entretanto h
uma diferena entre essas duas expresses que importante conhecer.

l Os nmeros aleatrios so independentes e distribudos uniformemente no intervalo de nmeros


reais entre 0 e 1, ou de forma mais tcnica no intervalo (0, 1).
l Os dgitos aleatrios so os nmeros do conjunto {0, 1, 2, 3, ..., 9} distribudos uniformemente.

O agrupamento de vrios dgitos aleatrios forma um nmero aleatrio. Por exemplo, na Tabela de
Nmeros Aleatrios apresentada no captulo Tabelas no final do livro, os nmeros aleatrios so forma-
dos com dgitos aleatrios.
Os nmeros aleatrios so o ingrediente bsico e necessrio no procedimento de simulao da
maioria dos sistemas discretos. Em geral, as linguagens de programao tm uma sub-rotina ou funo
para gerar um nmero aleatrio. O Excel dispe de duas funes e uma ferramenta de anlise para ge-
rar nmeros aleatrios. Os nmeros aleatrios gerados por esses meios so tambm conhecidos como
pseudonmeros aleatrios, pois eles so gerados atravs de um procedimento que pode ser reproduzi-
do o que pode introduzir um desvio da premissa dos nmeros aleatrios serem independentes e uni-
formemente distribudos. H testes que medem os desvios dos nmeros aleatrios gerados por esses
procedimentos.

Funes do Excel
O Excel dispe das funes matemticas ALEATRIO e ALEATRIOENTRE para gerar nmeros alea-
trios e da ferramenta de anlise Amostragem para extrair amostras com reposio de uma populao e
da ferramenta de anlise Gerao de Nmero Aleatrio que ser apresentada em um captulo posterior.
Tentando evitar aborrecimentos ao leitor provenientes de uma instalao incompleta do Excel, su-
gerimos que veja o Apndice 1 deste captulo Preparando o Excel para Comear. Da mesma maneira,
sugerimos que veja o Apndice 2 Como Registrar uma Funo na Planilha Excel.

Aleatrio( )
A funo matemtica ALEATRIO12 retorna um grupo de nmeros aleatrios entre 0,00...0 e
1,00...0 com a quantidade de casas decimais depois da vrgula definida pelo leitor, por exemplo,
0,236; 0,86945 etc. Se o nome da funo for inserido sem o acento ortogrfico, o Excel aceita e regis-
trar a funo com letras maisculas e com o acento ortogrfico. Na clula C4 da planilha Funes
includa na pasta Captulo_1 foi registrada a frmula =ALEATRIO( ). importante ter presente
que toda vez que a planilha for recalculada a funo ALEATRIO gerar um novo grupo de nmeros
entre 0,00...0 e 1,00...0.

12 Em ingls, a funo ALEATRIO RAND.


12 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Em alguns casos ser necessrio gerar nmeros aleatrios inteiros entre dois limites, um inferior e o
outro superior, por exemplo, entre 000 e 999. Para esses casos podem ser utilizadas frmulas matem-
ticas como mostraremos numa seo posterior, ou utilizar a funo matemtica ALEATRIOENTRE
do Excel.

Aleatrioentre(inferior; superior)
A funo estatstica ALEATRIOENTRE13retorna um nmero aleatrio inteiro entre os valores dos
argumentos14 inferior e superior definidos na funo. O argumento inferior e o argumento superior so,
respectivamente, o menor inteiro e o maior inteiro que a funo ALEATRIOENTRE retornar. Dife-
rente da funo ALEATRIO, se o nome dessa funo for inserido sem o acento ortogrfico o Excel
no aceitar a funo retornando o valor de erro #NOME? na clula.
Inserindo a frmula =ALEATRIOENTRE(0;599)15 numa clula vazia de uma planilha, o Excel re-
tornar um nmero inteiro entre 000 e 599, valores dos argumentos inferior e superior, respectiva-
mente. Toda vez que a planilha for recalculada a funo ALEATRIOENTRE gerar um novo nmero
aleatrio dentro do mesmo intervalo. Na clula C5 da planilha Funes includa na pasta Captulo_1
foi registrada a frmula =ALEATRIOENTRE(0;599) como mostra a Figura 1.4. No Apndice 1 Como
Registrar um Funo no Excel o leitor encontrar os procedimentos de registro de funes numa plani-
lha de Excel.

FIGURA 1.4 Funes


ALEATRIO e
ALEATRIOENTRE.

Antecipando um pouco o conhecimento de distribuies de frequncias, os grupos de nmeros ge-


rados pelas duas funes apresentadas tm distribuio uniforme, sendo que com a funo ALEA-
TRIO ser gerada uma distribuio uniforme contnua e com a funo ALEATRIOENTRE, uma
distribuio uniforme discreta.

Frmulas com a funo Aleatrio do Excel


Como foi antecipado, possvel gerar nmeros aleatrios entre dois limites utilizando frmulas. As
trs frmulas seguintes geram nmeros aleatrios entre os limites inferior e superior utilizando a fun-
o geradora de nmeros aleatrios ALEATRIO. Os exemplos seguintes esto registrados na planilha
NA com frmulas includa na pasta Captulo 1.
l =ALEATRIO( )*(superior-inferior)+inferior
Essa frmula gera nmeros aleatrios com decimais entre o limite superior e o limite inferior infor-
mados. Por exemplo, na clula E5 foi registrada a frmula =ALEATRIO( )*(C4-C3)+C3 que gera
nmeros aleatrios com decimais entre 0 e 599, valores informados nas clulas C3 e C4. O resultado
da clula E5 foi formatado com duas casas decimais como se pode ver na Figura 1.5.

13 Em ingls, a funo ALEATRIOENTRE RANDBETWEEN.


Argumentos so os valores que uma funo usa para realizar operaes e clculos. Os argumentos desta funo so: mnimo e mximo.
15 Se esta funo no estiver disponvel e retornar o erro #NOME?, instale e carregue o suplemento Ferramentas de anlise. Veja o
Apndice 1 deste captulo.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 13

l =INT(ALEATRIO( )*(superior-inferior)+inferior
A frmula geradora de nmeros aleatrios a frmula anterior. Nesta nova frmula foi includa a
funo matemtica INT.
l INT(nmero)
A funo INT retorna o valor registrado no argumento nmero arredondado para baixo at o n-
mero inteiro mais prximo.
Por exemplo, a frmula =INT(ALEATRIO( )*(C4-C3)+C3) registrada na clula E6 gera nmeros
aleatrios sem decimais entre 0 e 599, valores informados nas respectivas clulas C3 e C4. O resulta-
do da clula E6 foi formatado sem casas decimais.

FIGURA 1.5 Gerao


de nmeros aleatrios
com frmulas e a
funo ALEATRIO( ).

l =TRUNCAR(ALEATRIO( )*(superior-inferior)+inferior; nm_dgitos)


A frmula geradora de nmeros aleatrios a frmula anterior adicionada da funo matemtica
TRUNCAR.
l TRUNCAR(nm;nm_dgitos)
A funo matemtica TRUNCAR16 retorna o valor do argumento nm truncado com a quantida-
de de dgitos especificados no argumento nm_dgitos. Se nm_dgitos for igual a zero, o resultado
da funo TRUNCAR equivalente ao da funo INT.

Simulao da retirada de um nmero de uma urna


Os nmeros gerados pelas duas funes apresentadas tm distribuio uniforme, sendo que a funo
ALEATRIO gerar uma distribuio uniforme contnua e a funo ALEATRIOENTRE uma distri-
buio uniforme discreta. O que significa isso? Considere que uma urna tenha dez bolas pequenas nu-
meradas de 0 a 9. A seguir suponha que voc retira uma bola, verifica o nmero que identifica a bola,
por exemplo, o nmero 3, registra esse nmero numa coluna de uma planilha Excel e por ltimo retor-
na a bola para a urna. A seguir, mexe as bolas dentro da urna, retira uma nova bola e repete o procedi-
mento anterior. Suponha que continua com esse procedimento at completar um nmero bastante
grande de extraes. Como resultado, em longo prazo os dez nmeros que formam o conjunto {0, 1, 2,
3, ..., 9} tero sido retirados o mesmo nmero de vezes, ou seja, cada um dos nmeros dever ter sido
retirado 10% do total de retiradas ou amostras. Tecnicamente, todos os dez nmeros tero a mesma fre-
quncia e, representando os dez nmero em um diagrama de barras verticais, observe que todas as bar-
ras tm a mesma altura, pois se trata de uma distribuio uniforme discreta.
Esse procedimento poder ser simulado no Excel gerando nmeros aleatrios do conjunto {0, 1, 2, 3,
..., 9} com a frmula =ALEATRIOENTRE(0,9), repetindo essa frmula o nmero de vezes necessrias.

16 Em ingls, a funo TRUNCAR TRUNC. Como informao adicional, a funo ARRED(nm;nm_dgitos), em ingls ROUND, d
um resultado equivalente ao da funo TRUNCAR, porm, arredondando no lugar de truncar o resultado. O Excel dispe de outras fun-
es: ARREDONDAR.PARA.BAIXO, ARREDONDAR.PARA.CIMA e ARREDMULTB, em ingls, respectivamente, ROUNDDOWN,
ROUNDUP e MROUND.
14 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Tecnicamente declaramos que do conjunto de nmeros {0, 1, 2, 3, ..., 9} retiramos um determinado n-


mero adequado de amostras aleatrias de tamanho n=1 com reposio. O longo prazo no um valor de-
terminado ou finito e, na prtica, esse valor pode ser 500 como utilizamos na simulao seguinte, ou
1.000 ou maior que esse valor. Deve-se entender que quanto menor for o nmero de amostras da simula-
o, maior ser o desvio dos valores das frequncias observadas em comparao com os valores das fre-
quncias esperadas. A Figura 1.6 mostra o grfico de barras verticais do resultado de uma simulao de
500 retiradas com reposio de uma bola de uma urna contendo dez bolas numeradas de zero a nove
onde se pode ver que, nesse caso, duas bolas alcanaram o valor 50; 10% do nmero de retiradas.
Na planilha Simulao includa na pasta Captulo 1 foi construdo o modelo que gera 500 nmeros
aleatrios ou amostras do conjunto {0, 1, 2, 3, ..., 9}, conta os resultados e constri o grfico de barras ver-
ticais denominado histograma. Vejamos o procedimento de construo do modelo:

l Na clula B4 foi registrada a frmula =ALEATRIOENTRE(0;9) que gera um nmero aleatrio en-
tre 0 e 9.
l Depois, essa frmula foi copiada at a clula B503. Os resultados de cada uma das 500 clulas do
intervalo B4:B503 uma amostra aleatria com reposio de tamanho n=1 retirada da populao
{0, 1, 2, 3,..., 9}.
l No intervalo D4:E14, oculto detrs do grfico, foi construda a tabela de frequncias absolutas, tema
que ser apresentado no Captulo 2.

Pressionando a tecla de funo F9 a planilha ser recalculada, novas amostras sero geradas, uma
nova tabela de distribuio de frequncias absolutas ser registrada e o histograma ser atualizado.

FIGURA 1.6
Simulao de 500
retiradas
de uma bola com
reposio.

Analisando as frequncias absolutas observadas na Figura 1.6, barras pintadas de cor mais escura,
verificamos que seus valores se situam ao redor de 50. Entretanto, a frequncia esperada de cada um
dos dez nmeros 50, barras pintadas de cor mais claro no histograma. A diferena entre as frequn-
cias observadas e as frequncias esperadas correspondentes pode ser atribuda variabilidade amos-
tral, a falhas do gerador de nmeros aleatrios ou ao reduzido tamanho da amostra.17

17 Pela lei dos grandes nmeros, 500 amostras representam um nmero pequeno, tema tratado no Captulo 5.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 15

Amostragem
Seguindo alguns critrios de seleo, o subconjunto escolhido de uma populao denominado amos-
tra. H dois tipos de amostras quanto forma de serem extradas da populao, a amostra probabilsti-
ca e as restantes que no so probabilsticas. Na amostra probabilstica todos os componentes da popu-
lao tm alguma chance de serem selecionados, escolhidos. Como nas amostras no probabilsticas
alguns componentes da populao no tm nenhuma chance de serem selecionados, dever ser
definido algum critrio de escolha.
Um exemplo de amostra probabilstica, tambm denominada amostragem aleatria, a amostragem
realizada na seo anterior quando simulamos a retirada de uma bola de uma urna contendo dez bolas,
repondo a bola extrada depois de registrar seu resultado. Porm, esse tipo de amostragem tem mais
uma caracterstica, pois todos os elementos da populao tm a mesma chance de serem selecionados.
Esse procedimento de amostragem denominado amostragem probabilstica simples. Entretanto,
pode ocorrer que uma amostra desse tipo no seja representativa da populao.18 Por exemplo, em
uma populao formada por 50% de mulheres e 50% de homens, a amostragem probabilstica simples
pode resultar numa amostra de 65% de mulheres e 35% de homens. Nesse caso a amostra continua sen-
do aleatria mas no representativa.
Na descrio da simulao da retirada de um nmero de uma urna foi registrado o procedimento
que repetimos: retira uma bola da urna, registra o nmero da bola numa coluna de uma planilha Excel
e por ltimo retorna a bola para a urna. Em vez de voltar a bola para a urna, o procedimento poderia ser
o de manter as bolas retiradas fora do processo de seleo. A primeira amostra denominada amostra
probabilstica simples com reposio, ou simplesmente amostra com reposio, e a outra amostra pro-
babilstica simples sem reposio ou amostra sem reposio. Resumindo:

l Na amostragem com reposio, a unidade selecionada retorna para a populao. Portanto, em cada
nova seleo a populao mantm a mesma quantidade de unidades elementares.
l Na amostragem realizada sem reposio, a unidade selecionada no retorna para a populao. Por-
tanto, em cada seleo a populao reduzida de uma unidade elementar.

Observe que, em geral, as amostragens so realizadas sem reposio e os clculos estatsticos nos
dois tipos de amostragens so os mesmos. Por exemplo, numa pesquisa de inteno de voto para esco-
lha do governador do estado se espera que cada pessoa seja entrevistada apenas uma vez. Se o tamanho
da populao for suficientemente maior que o tamanho da amostra, recomendado mais de vinte vezes,
os resultados estatsticos das amostras com e sem reposio no sero muito diferentes, pois a chance
de escolher o mesmo elemento muito pequena. Contudo, deve-se tomar cuidado com populaes pe-
quenas quando comparadas com o tamanho da amostra a ser extrada.

Gerao de amostras probabilsticas simples


Como deve ser gerada uma amostra probabilstica simples? Os exemplos a seguir mostram procedi-
mentos e ferramentas.

EXEMPLO 1.4
O objetivo do diretor da escola primria avaliar o conhecimento de matemtica adquirido pelos alunos da
sexta srie no final do primeiro semestre. No lugar de aplicar um teste aos 35 alunos, ele prefere aplicar o teste
numa amostra de seis alunos. Qual o procedimento adequado de amostragem?

18 Almeida A.C. Como so Feitas as Pesquisas Eleitorais e de Opinio, Editora FGV, 2002.
16 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Soluo. Os 35 alunos da sexta srie esto registrados no caderno de presena diria identificados pelo nome
em ordem alfabtica. O procedimento de amostragem probabilstica simples de seis alunos parecido com o
procedimento de um sorteio que a seguir descrevemos:
1. Comeamos por preparar 35 pequenos papis iguais, por exemplo, uma folha de papel quadrada com trs
a quatro centmetros de lado.
2. Em cada papel registramos o nome completo de cada aluno.
3. Depois, os 35 papis com os nomes registrados so colocados numa urna adequada, porm sem dobrar os
pequenos papis.
4. Iniciamos o sorteio remexendo os papis dentro da urna antes de retirar o primeiro papel sorteado.
5. Continuamos com esse procedimento at completar a retirada dos seis papis planejados.
6. Divulgamos o nome dos seis alunos escolhidos para serem avaliados.

A amostragem do Exemplo 1.4 sem reposio. Na instruo da amostragem foi estabelecido que os
35 papis com os nomes dos alunos registrados sejam depositados numa urna adequada sem nenhuma
dobra. Deixamos para voc analisar as caractersticas da extrao dos papis no dobrados comparan-
do com o caso dos mesmos papis dobrados, por exemplo, em quatro partes. Analise se nos dois proce-
dimentos, papis com e sem dobra, atende-se premissa de que cada unidade elementar da populao
tenha a mesma probabilidade de ser escolhida numa amostra de tamanho 6.
Quando a populao for muito grande o procedimento do Exemplo 1.4 no adequado, pois a se-
leo dos papis ser mais difcil de realizar e a amostra extrada se afastar das premissas de amostra
aleatria. Nesse caso deve-se utilizar a Tabela de Nmeros Aleatrios19 apresentada em Tabelas no fi-
nal deste livro. O Exemplo 1.5 mostra a descrio do procedimento de amostragem sem repetio. O
Exemplo 1.6 mostra o trabalho direto com a tabela.

EXEMPLO 1.5
O objetivo da auditoria interna da empresa verificar se o Setor de Contas a Pagar cumpre com as rotinas esta-
belecidas pela empresa para pagamento de fornecedores. Deve-se estabelecer o procedimento de seleo de
quinze processos dos ltimos 600 realizados.

Soluo. A amostragem que deve ser realizada do tipo probabilstico simples e sem reposio, pois interes-
sa analisar somente quinze processos diferentes. No processo de seleo dos componentes da amostra utili-
zada a Tabela de Nmeros Aleatrios apresentada no captulo Tabelas no final deste livro. O procedimento de
amostragem :
1. Numerar os ltimos 600 processos de pagamento de 000 at 599. Os processos escolhidos sero analisa-
dos de trs para a frente das aprovaes, comeando pela ltima aprovao que autorizou o pagamento.
2. Escolher um nmero aleatrio qualquer na Tabela de Nmeros Aleatrios e tomar nota dos trs ltimos al-
garismos.
3. Deslocar-se na tabela por linha ou por coluna ou pulando entre elas at escolher o prximo nmero aleat-
rio e tomar nota dos trs ltimos algarismos.
4. Repetir o procedimento anterior at completar a seleo dos quinze nmeros aleatrios contendo trs al-
garismos diferentes. Os trs algarismos que formarem nmeros maiores a 599 ou serem repetidos no se-
ro considerados durante a seleo.
5. Separar os quinze processos de pagamento identificados pelos quinze nmeros aleatrios escolhidos.

H casos em que necessrio extrair amostras de uma populao identificada por dados qualita-
tivos, observaes no numricas classificadas em nominais e ordinais, como mostra o exemplo se-
guinte.
19 Apenas como comentrio, a lista telefnica de assinantes uma boa geradora de dgitos aleatrios, considerando apenas os quatro
ltimos dgitos.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 17

EXEMPLO 1.6
A professora de artes quer analisar o resultado de pintar uma figura geomtrica qualquer dividida em oito par-
tes utilizando quatro cores escolhidas aleatoriamente da populao formada pelas seguintes quatro cores
{amarelo, vermelho, azul, verde} e utilizando o Excel.
Soluo. A figura seguinte mostra a soluo registrada na planilha Pintura includa na pasta Captulo 1.

A amostragem que deve ser realizada do tipo probabilstico simples com reposio, pois interessa analisar
o arranjo de quatro cores em oito partes de uma figura geomtrica. O resultado mostrado em cada clula do
intervalo E4:E11 da planilha Pintura a cor resultante para cada uma das oito partes de uma figura geomtri-
ca qualquer. Os resultados de cada uma das oito clulas desse intervalo tm duas partes diferentes, a primeira
se relaciona com a seleo aleatria do nome da cor e a segunda com a formatao da cor da clula correspon-
dente ao nome da cor.

Seleo da cor de cada uma das oito partes da figura geomtrica.


No intervalo B4:B7 foram registrados os nomes das quatro cores pintando cada clula com a cor correspon-
dente ao nome registrado.
A frmula =NDICE($B$4:$B$7;ALEATRIOENTRE(1;4)) foi registrada na clula E4 e depois foi copiada
at a clula E11. Essa frmula seleciona de forma aleatria uma das quatro cores utilizando as funes
NDICE e ALEATRIOENTRE. Toda vez que a planilha for recalculada a funo ALEATRIOENTRE selecio-
na um dos quatro nmeros {1, 2, 3, 4}. Com essa informao a funo NDICE seleciona a cor correspon-
dente registrada no intervalo B4:B7 da planilha, sendo que o nmero 1 corresponde cor registrada na
clula B4 (Amarelo), o nmero 2 corresponde cor registrada na clula B5 (Vermelho) e da mesma forma
com os nmeros 3 e 4.
NDICE(matriz; nm_linha; nm_coluna)
A funo NDICE20 retorna um valor ou a referncia a um valor do argumento matriz, tabela ou intervalo
que neste caso o intervalo $B$4:$B$7 que recebeu os cifres para facilitar a cpia da frmula em todo o
intervalo E4:E11.
O argumento nm_linha seleciona a linha na matriz a partir da qual um valor dever ser retornado, se
nm_linha for omitido, o argumento nm_coluna ser obrigatrio. Neste caso, a seleo da linha reali-
zada pela frmula ALEATRIOENTRE(1;4).
O argumento nm_coluna seleciona a coluna na matriz a partir da qual um valor dever ser retor-
nado; se nm_coluna for omitido, nm_linha ser obrigatrio. Neste caso, este argumento foi
omitido.

20 Em ingls, a funo NDICE INDEX.


18 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Formatar a cor da clula com o nome da cor registrada na clula.


A formatao da cor da clula correspondente ao nome da cor realizada com o comando Formatao con-
dicional do Excel procedendo como segue:

Selecione o intervalo E4:E11 e pinte as clulas de cor amarela forte e a fonte de cor preta com negrito.
Clique na clula E4 e no menu Formatar selecione Formatao condicional.
Na Condio 1 selecione A frmula e ao lado registre a frmula =E4="Vermelho" como mostra a figura
na pgina seguinte. Isso indica que sempre que a condio E4="Vermelho" for verdadeira o Excel formatar
a clula E4 como especificado a seguir; caso contrrio, a clula continuar com a cor amarela forte e fonte de
cor preta com negrito.
Clique no boto Formatar e selecione as seguintes alternativas.
Fonte. Mantendo o corpo, escolher Negrito com cor branca.
Borda. No realizar nenhuma seleo.
Padres. Escolher a cor vermelha para a clula.
Na Condio 2 selecione A frmula e ao lado registre a frmula =E4="Azul" como mostra a figura aci-
ma. Depois proceda como na Condio 1 mudando apenas a cor da clula para azul e a cor da fonte para
branco.
Na Condio 3 selecione A frmula e ao lado registre a frmula =E4="Verde" como mostra a figura
anterior. Depois proceda como na Condio 1 mudando apenas a cor da clula para verde sem necessidade
de mudar a cor da fonte.
Por ltimo pressione o boto OK. Para conferir o resultado pressione a tecla de funo F9 e verifique a sele-
o do nome da cor e a formatao da cor da clula.

Para copiar a formatao condicional da clula E4 no intervalo E5:E11 proceda como segue:

Selecione a clula E4.


No menu Editar selecione Copiar ou pressione as teclas Control+C, ou pressione o cone copiar .
Selecione no intervalo E5:E11.
No menu Editar selecione Colar especial. No grupo Colar da caixa de dilogo Copiar especial selecio-
ne Formatos.
Para terminar pressione o boto OK.

A figura seguinte mostra outra forma de utilizar a funo NDICE, registrada a partir da clula J1 da planilha
Pintura includa na pasta Captulo 1. Neste caso no utilizada a base de dados do intervalo E4:E11, sendo
os quatro elementos da populao de cores {"Amarelo";"Vermelho";"Azul";"Verde"} registrados como matriz
na prpria frmula como a da clula M4:

=NDICE({"Amarelo";"Vermelho";"Azul";"Verde"}; ALEATRIOENTRE(1;4))
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 19

que depois foi copiada at a clula M11. Para terminar, as clulas do intervalo E4:E11 receberam a formatao
condicional copiada da clula E4.

Nos dois casos, pressionando a tecla de funo F9 sero obtidas novas combinaes de cores.

A frmula do segundo procedimento do Exemplo 1.6 deve ser utilizada em populaes pequenas,
pois em populaes grandes o registro de todos os nomes pode ser muito trabalhoso, sujeito a erros de
registro e at a estourar a capacidade de armazenamento das clulas do Excel. O exemplo seguinte
mostra outra forma de realizar uma amostragem probabilstica com reposio.

EXEMPLO 1.7
A tabela seguinte registra a relao das 50 Maiores Empresas Privadas por Vendas do Brasil no ano 2002.21 O
objetivo retirar uma amostra aleatria sem reposio de tamanho 10 utilizando a tabela de nmeros alea-
trios. A tabela das maiores empresas est registrada na planilha 50 Maiores 2002 includa na pasta Captu-
lo 1 no material disponibilizado no site da editora.

Ordem Empresa Ramo Vendas Ordem Empresa Ramo Vendas

1 TELEMAR Telecomunicaes $ 6.303,7 26 GERDAU Siderurgia e metalurgia $ 2.078,9

2 TELEFNICA Telecomunicaes $ 5.480,5 27 LIGHT Servios pblicos $ 2.003,6

3 CBB/AMBEV Alimentos, bebidas e fumo $ 5.329,8 28 USIMINAS Siderurgia e metalurgia $ 1.891,8

4 VOLKSWAGEN Automotivo $ 5.295,2 29 REFAP Qumica e petroqumica $ 1.886,1

5 PETRLEO IPIRANGA Atacado e $ 4.214,1 30 VARIG Servios de transporte $ 1.868,6


comrcio exterior

6 SHELL Atacado e comrcio exterior $ 4.096,8 31 BRASKEM Qumica e petroqumica $ 1.793,3

7 GENERAL MOTORS Automotivo $ 4.092,7 32 SADIA Alimentos, bebidas e fumo $ 1.760,4

8 CARREFOUR Comrcio varejista $ 4.044,9 33 TELESP CELULAR Telecomunicaes $ 1.752,1

9 BRASIL TELECOM Telecomunicaes $ 3.975,9 34 CASAS BAHIA Comrcio varejista $ 1.690,7

10 GRUPO PO DE ACAR Comrcio $ 3.837,5 35 IBM Tecnologia e computao $ 1.591,8


varejista

11 EMBRATEL Telecomunicaes $ 3.668,3 36 DAIMLERCHRYSLER Automotivo $ 1.557,2

12 VALE DO RIO DOCE Minerao $ 3.418,0 37 CPFL Servios pblicos $ 1.551,2

13 BUNGE ALIMENTOS Alimentos, bebidas $ 3.158,1 38 COPERSUCAR Atacado e comrcio $ 1.550,5


e fumo exterior

14 FIAT Automotivo $ 3.121,4 39 SIEMENS Eletroeletrnico $ 1.528,8

15 ELETROPAULO METROPOLITANA Servios $ 3.078,0 40 COPESUL Qumica e petroqumica $ 1.465,8


pblicos

21 Revista Exame Melhores e Maiores 2002.


20 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Ordem Empresa Ramo Vendas Ordem Empresa Ramo Vendas

16 EMBRAER Automotivo $ 2.945,3 41 TAM Servios de transporte $ 1.397,0

17 TEXACO Atacado e comrcio exterior $ 2.805,2 42 BASF Qumica e petroqumica $ 1.355,1

18 NESTL Alimentos, bebidas e fumo $ 2.762,7 43 COSIPA Siderurgia e metalurgia $ 1.340,0

19 CARGILL Alimentos, bebidas e fumo $ 2.709,1 44 PERDIGO AGROINDUSTRIAL Alim., beb. $ 1.336,2
e fumo

20 ESSO Atacado e comrcio exterior $ 2.688,5 45 NOKIA Eletroeletrnico $ 1.300,0

21 ITAIP BINACIONAL Servios pblicos $ 2.529,6 46 BUNGE FERTILIZANTES Qumica e $ 1.297,5


petroqumica

22 UNILEVER Farmacutico, higiene e $ 2.456,9 47 SONAE Comrcio varejista $ 1.156,5


cosmticos

23 FORD MOTOR Automotivo $ 2.387,6 48 KLABIN PAPEL CELULOSE Papel e celulose $ 1.155,1

24 SOUZA CRUZ Alimentos, bebidas e fumo $ 2.375,9 49 PONTO FRIO Comrcio varejista $ 1.153,3

25 CSN Siderurgia e metalurgia $ 2.160,4 50 MAKRO Atacado e comrcio exterior $ 1.127,2

Soluo. Comeando em qualquer ponto da tabela, a escolha dos nmeros aleatrios pode ser realizada por
coluna, por linha ou pulando entre elas. Escolhemos como ponto de partida o nmero aleatrio 0617 da colu-
na 2 da linha 11, como mostra a seguinte tabela parcial de nmeros aleatrios.

8395 0617 4946 5390 8008 2785 7629 3176 5114 1410
3069 5769 3617 1149 0276 5783 2837 7487 8159 3478
1859 8790 3106 7156 5673 6967 0812 1603 1330 5588
9645 7574 2954 5940 6263 6559 9450 2281 1362 3000
1136 6008 0598 8617 2380 0960 4412 7829 2840 8729

Como a populao tem 50 elementos ou empresas para realizar as selees sero utilizados os dois ltimos
algarismos de cada nmero aleatrio da tabela acima.

Do nmero 0617 so escolhidos 17.


Do nmero 4946 os algarismos 46.
A seguir deveramos selecionar o nmero 5390, mas como 90 maior que 50 continuamos at o nmero
8008 escolhendo 08.
Continuamos este procedimento de escolha at completar a amostra de tamanho 10 identificada com a seguin-
te relao de nmeros de ordem da tabela das 50 empresas: 17, 46, 08, 29, 14, 10, 30, 03, 12 e 50.

Com os nmeros aleatrios selecionados foi construda a tabela seguinte.

Amostra Nmeros Empresa Ramo Vendas


1 17 TEXACO Atacado e comrcio exterior $ 2.805,2
2 46 BUNGE FERTILIZANTES Qumica e petroqumica $ 1.297,5
3 08 CARREFOUR Comrcio varejista $ 4.044,9
4 29 REFAP Qumica e petroqumica $ 1.886,1
5 14 FIAT Automotivo $ 3.121,4
6 10 GRUPO PO DE ACAR Comrcio varejista $ 3.837,5
7 30 VARIG Servios de transporte $ 1.868,6
8 03 CBB/AMBEV Alimentos, bebidas e fumo $ 5.329,8
9 12 VALE DO RIO DOCE Minerao $ 3.418,0
10 50 MAKRO Atacado e comrcio exterior $ 1.127,2
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 21

EXEMPLO 1.8
Construa um modelo para extrair uma amostra probabilstica simples com reposio de dez empresas da ta-
bela das cinquenta primeiras empresas privadas por vendas no ano 2002.

Soluo. Nas colunas B, C e D da planilha Amostragem com Reposio includa no Captulo 1 foram re-
gistradas a Ordem, a Empresa Ramo e as Vendas das 50 maiores empresas por vendas no ano 2002, da-
dos copiados da planilha 50 Maiores 2002. A partir da clula F5 foi construda a tabela que extrair as amos-
tras aleatrias de tamanho dez utilizando a funo ALEATRIOENTRE com limite inferior 1 e limite superior
50. Para facilitar o controle, na coluna F foi registrada a ordem da amostragem.

Na coluna G so gerados os nmeros aleatrios entre os limites 1 e 50. Na clula G5 foi registrada a frmula
=ALEATRIOENTRE(1;50) que depois foi copiada at a clula G14.
A frmula registrada na clula H5 =PROCV($G5;$B$4:$D$53;2) foi copiada at a clula H14. A partir dos
nmeros aleatrios gerados na coluna G, estas frmulas procuram o nome da empresa amostrada na tabela
das 50 empresas. No Apndice 3 deste captulo est descrita a funo PROCV de procura vertical e sua equi-
valente funo PROCH para procura horizontal.
Finalizando, a frmula =PROCV($G5;$B$4:$D$53;3) registrada na clula I6 procura o valor das vendas da
empresa amostrada; depois essa frmula foi copiada at a clula I15.
Cada vez que for pressionada a tecla de funo F9 ser obtido um novo grupo de 10 amostras que poder
conter mais de uma vez uma mesma empresa. Sugerimos que o leitor se familiarize com este procedimento
e com o significado da amostragem probabilstica simples com reposio retirando amostras sucessivas
com F9.

Como complemento, a partir da linha 18 da planilha Amostragem com Reposio foi construda outra
tabela de amostragem utilizando a funo NDICE apresentada no Exemplo 1.6. A frmula geradora de nme-
ros aleatrios ALEATRIOENTRE(1;50) no pode ser utilizada dentro da funo NDICE, pois com o mesmo
nmero aleatrio sero extrados dois dados da tabela da populao, os campos Empresa Ramo e Vendas.

Das dez empresas amostradas no Exemplo 1.8 trs delas foram selecionadas duas vezes, pois to-
das as amostras extradas com esse procedimento so realizadas com reposio. Para tentar sele-
cionar amostras sem reposio com o mesmo modelo anterior e de forma manual, a planilha dever
ser recalculada tantas vezes quanto seja necessrio at conseguir uma amostra com dez empresas
diferentes.

Ferramentas de anlise do Excel


At esta parte do livro utilizamos algumas das muitas funes estatsticas da planilha Excel22 sendo que
algumas delas esto sempre disponveis quando o aplicativo Excel carregado, e as outras funes fi-
cam disponveis depois de instalar o suplemento Ferramentas de anlise como mostrado no Apndice
1 deste captulo.

22 O Excel tambm dispe de funes financeiras, matemticas, de engenharia etc.


22 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

O Excel tambm dispe de um conjunto de ferramentas para anlise de dados denominadas de for-
ma genrica como Ferramentas de anlise. Essas ferramentas apresentam solues integradas de an-
lises estatsticas. Para ver a relao de ferramentas de anlise disponveis dentro da planilha Excel,
depois de selecionar Anlise de dados dentro do menu Ferramentas o Excel apresentar a caixa de
dilogo da Figura 1.7.

l Pressionando o boto Ajuda dessa caixa de dilogo o Excel apresentar a pgina Sobre as ferramentas
de anlise estatstica pertencente Ajuda do Excel.

FIGURA 1.7 Caixa


de dilogo das
Ferramentas
de anlise.

Na caixa de dilogo Anlise de dados selecione o nome da ferramenta de anlise que deseja utilizar,
por exemplo, Amostragem e depois pressione o boto OK. A seguir o Excel apresentar uma caixa de
dilogo com o nome da ferramenta selecionada, Amostragem, onde voc informar os dados requeri-
dos e definir, em geral, as opes de anlise e de resultados desejados. As caixas de dilogos das ferra-
mentas incluem um boto de Ajuda onde podero ser obtidas algumas informaes sobre as opes das
anlises. Se a opo Anlise de dados no estiver disponvel, voc precisar carregar o programa suple-
mentar de Ferramentas de anlise como mostrado no Apndice 1 deste captulo.

Ferramenta de anlise Amostragem


O Excel dispe da ferramenta de anlise Amostragem para extrair amostras probabilsticas simples com
reposio de uma populao de valores numricos com distribuio uniforme e discreta. Tambm dis-
pe da ferramenta de anlise Gerao de Nmero Aleatrio para extrair amostras probabilsticas simples
com reposio de uma populao de valores numricos com outros tipos de distribuies, incluindo a
uniforme, tema apresentado no Apndice 1 do Captulo 8. Antes de utilizar a ferramenta Amostragem23
deve-se preparar uma planilha com os dados numricos da populao que ser amostrada e registrados
numa coluna de onde ser retirada a amostra. Para compreender o uso da ferramenta Amostragem, o
Exemplo 1.8 foi resolvido na planilha Ferramenta Amostragem includa na pasta Captulo 1. Depois
de copiar os dados da planilha 50 Maiores 2002 proceda como segue:

l Depois de selecionar Anlise de dados dentro do menu Ferramentas o Excel apresentar a caixa de
dilogo Anlise de dados com todas as ferramentas de anlise disponveis, Figura 1.7.
l Escolhendo a ferramenta Amostragem e depois pressionando o boto OK voc receber a caixa de
dilogo Amostragem mostrada na Figura 1.8, depois de selecionadas algumas opes.
l Pressionando o boto Ajuda dessa caixa de dilogo, o Excel apresentar a pgina Sobre a caixa de
dilogo Amostragem pertencente Ajuda do Excel.

23 Em ingls, a ferramenta de anlise AMOSTRAGEM SAMPLING.


C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 23

As informaes que devem ser registradas no quadro Entrada da caixa de dilogo da ferramenta
Amostragem, como mostra a Figura 1.8, so:

l Intervalo de entrada: Informar o intervalo de clulas da planilha onde os dados esto registrados,
neste caso o intervalo D3:D53 que inclui a clula onde foi registrado o ttulo Vendas, ou rtulo no
Excel.
l Rtulos. Selecionamos este item, pois o intervalo informado D3:D53 inclui o ttulo Vendas.

No quadro Mtodo de amostragem h duas escolhas:

l Escolhendo Peridico e informando o Perodo, sero retiradas amostras com perodo constante.
Por exemplo, informando 5 na caixa Perodo, a ferramenta Amostragem retirar 10 amostras com
periodicidade 5, comeando pelo quinto dado da tabela. De outra maneira, retirar o primeiro dado
do quinto lugar da tabela, depois o dado na posio 10 e assim sucessivamente at o dado registrado
na posio 50.
l Escolhendo Aleatrio sero retiradas amostras probabilsticas simples at completar o nmero de
amostras registrado na caixa Nmero de amostras, neste caso 10.

FIGURA 1.8 Caixa de


dilogo Amostragem
probabilstica simples.

No quadro Opes de sada deve ser obrigatoriamente informado um endereo, a partir do qual a
ferramenta Amostragem registrar os resultados. H trs alternativas excludentes de informar esse en-
dereo, identificadas por trs botes de opo que aceitam a escolha de uma nica alternativa:
l Intervalo de sada. Os resultados sero apresentados na mesma planilha a partir da clula informa-
da, neste caso F4. Depois de clicar com o boto esquerdo do mouse dentro da caixa correspondente,
o endereo pode ser registrado digitando F4, ou clicando com o boto esquerdo do mouse na clula
F4, neste caso ser registrado o endereo com os dois cifres, $F$4. Esse endereo o da clula supe-
rior esquerda da tabela que a ferramenta construir. Tambm, o Excel automaticamente definir o
tamanho da rea dos resultados e exibir uma mensagem se a tabela de sada estiver prestes a substi-
tuir dados existentes.
l Nova planilha. Os resultados sero apresentados a partir da clula A1 de uma nova planilha da mes-
ma pasta.
l Se no for informado nenhum endereo, a ferramenta inserir uma nova planilha com o nome
Plan seguido de um nmero sequencial. Ao escolher essa alternativa na pasta Captulo 1, a ferra-
menta inserir a planilha Plan1.
24 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l H a alternativa de informar o nome da planilha na caixa desta alternativa. Ao registrar o nome


Teste a ferramenta inserir na mesma pasta uma nova planilha com o nome Teste.
l Nova pasta de trabalho. Os resultados sero apresentados numa nova pasta e a partir da clula A1 da
planilha Plan1.

A Figura 1.9 mostra uma amostragem probabilstica simples de tamanho dez extrada com a ferra-
menta Amostragem. Cada vez que for ativada a ferramenta Amostragem ser extrada, em geral, uma
amostra diferente. Essa ferramenta til para gerar amostras aleatrias com reposio de tamanho de-
terminado pelo leitor e a partir de uma lista de dados; entretanto, a ferramenta extrai somente valores
numricos.

FIGURA 1.9
Amostragem
probabilstica simples
com a ferramenta
Amostragem.

A Figura 1.10 mostra a caixa de dilogo Amostragem com os dados para selecionar uma amostra pe-
ridica com periodicidade cinco na populao das 50 maiores empresas.

FIGURA 1.10 Caixa de


dilogo Amostragem
peridica com
periodicidade cinco.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 25

Nas dez amostras registradas a partir da clula F17, Figura 1.9, observe que a primeira amostra retira-
da corresponde ao valor da quinta posio do intervalo D3:D53. A amostra seguinte ao valor da posio
dez e assim sucessivamente at a ltima amostra que corresponde ao ltimo registro da tabela, a posio
dez, como se pode verificar comparando os valores extrados com os valores extrados com as vendas da
populao. Se a amostragem for repetida com os mesmos dados as amostras sero as mesmas. O procedi-
mento de seleo desta ferramenta no acompanha a recomendao tcnica de realizar uma amostragem
probabilstica simples nos cinco primeiros dados da tabela que correspondem periodicidade cinco. A
partir desse primeiro resultado ser aplicada a periodicidade desejada. Tambm se deve tomar cuidado
com a periodicidade escolhida, pois esse valor definir o tamanho da amostra; por exemplo, se for esco-
lhida a periodicidade dez no nosso exemplo ser recebida uma amostragem de tamanho cinco.

Amostragens aleatrias sem reposio


Para selecionar amostras sem reposio com os procedimentos de amostragem com reposio, a plani-
lha dever ser recalculada tantas vezes quanto seja necessrio at conseguir uma amostra com dez em-
presas diferentes. Para facilitar o procedimento de amostragem sem reposio foi construdo o modelo
do qual se pode extrair de duas a vinte amostras sem reposio da tabela das 50 primeiras empresas,
como mostra o Exemplo 1.9.

EXEMPLO 1.9
Construa um modelo para extrair uma amostra probabilstica simples sem reposio de dez empresas da tabe-
la das 50 primeiras empresas privadas por vendas no ano 2002.

Soluo. Comeamos por preparar a planilha denominada Amostragem sem Reposio includa na pas-
ta Captulo 1, com o mesmo layout da planilha utilizada para extrair amostras com reposio. A diferena
com aquela planilha est na escolha dos nmeros aleatrios da coluna Ordem que no podem ser repetidos.
Como a seleo de nmeros aleatrios no repetidos no pode ser realizada com os recursos da planilha foi
construdo um procedimento combinando os recursos da planilha Excel com macros em VBA. A macro princi-
pal ativada com o boto Nova Amostragem e a operao do modelo a seguinte:
Depois de pressionar o boto Nova Amostragem o modelo apresenta a caixa de entrada de dados Gera-
dor de amostras sem reposio solicitando a informao do tamanho da amostra, valor entre 2 e 20
com ambos limites includos, como mostra a figura seguinte depois de informar o valor 10 que tambm o
valor default dessa caixa.

Depois de pressionar o boto OK ativada a macro que selecionar as dez amostras desejadas, como mos-
tra a figura seguinte.
26 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

As caractersticas desse modelo de amostragem sem reposio so:

Toda vez que for pressionado o boto Nova Amostragem dever ser informado o tamanho da amostra
desejada, um valor entre 2 e 20 com ambos extremos includos. Se for informado um valor fora desse inter-
valo o modelo apresentar uma caixa de dilogo informando esse dado incorreto. Se o valor informado for
correto o modelo selecionar uma nova amostra sem repetio, em geral, diferente da anterior.
No intervalo de clulas da planilha K4:K25 realizado o controle da macro para a seleo das amostras sem
reposio.
O cdigo da macro pode ser visto dentro do Editor de VBA, pressionando simultaneamente as teclas ALT +
F11 dentro da planilha Excel.

No Apndice 4 voc encontra um modelo para retirada de amostras sem reposio que tem a vanta-
gem de poder selecionar qualquer informao contida na clula, incluindo valores no numricos.

Outros tipos de amostragens


Na caixa de dilogo da ferramenta de anlise Amostragem pode-se escolher um dos dois mtodos de
amostragem includos, Peridico e Aleatrio. Para realizar as amostragens apresentadas na Figura 1.9,
escolhemos o procedimento Aleatrio para a amostra registrada a partir da clula F4 e o procedimento
Peridico para a amostra registrada a partir da clula F17 com periodicidade cinco, comeando pela ob-
servao da populao na quinta posio, sendo esse tipo de amostragem denominado amostragem sis-
temtica. Uma variante recomendada desse tipo de amostragem escolher a primeira observao de
forma aleatria. Por exemplo, antes de iniciar a amostragem com reposio da tabela das 50 Primeiras
Empresas por Vendas o nmero de empresas cinquenta dividido pelo tamanho da amostra dez, obten-
do cinco grupos contendo dez empresas cada um. Do primeiro grupo de dez empresas uma delas sele-
cionada de forma aleatria, por exemplo, a amostra da posio seis, e em sequncia so extradas as em-
presas das posies 16, 26, 36 e 46. Em alguns casos a amostragem sistemtica pode ser melhor que a
simples amostragem aleatria, pois essa amostragem colhe observaes em toda a extenso da popula-
o. Em outros casos, este tipo de amostragem pode colher eventos peridicos com o mesmo perodo
da amostragem e comprometer a amostra. Por exemplo, se da mquina de produzir comprimidos com
36 punes retirarmos um comprimido a cada 36 comprimidos produzidos, a variabilidade dos com-
primidos da amostra ser menor que o da populao.
Se algumas caractersticas da populao forem conhecidas antes da amostragem ser possvel dividir a
populao em camadas sem superposio,24 ou estratos, e extrair uma amostra aleatria com melhores re-
sultados com representatividade de cada camada ou estrato. Na amostragem por conglomerado, em vez de
sortear a populao so sorteados territrios desde os estados, municpios, bairros e domiclios at a pessoa
que ser entrevistada. Outro procedimento a amostragem por cotas em que no h sorteio, apenas se to-
mam amostras proporcionais ao tamanho de cada grupo previamente definido, homem, mulher etc.

24 Sem superposio significa que a interseo dos conjuntos vazia.


C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 27

Como so feitas as pesquisas25


O Datafolha no tem como ouvir todos os eleitores no Brasil. Assim, utiliza mtodos estatsticos para
aferir a inteno de voto de modo que os entrevistados representem o conjunto do eleitorado.

A Pesquisa
Antes de iniciar uma pesquisa, o Datafolha sabe quantas pessoas vai ouvir e o perfil de cada grupo, para
que o conjunto do eleitorado seja representado na mostra de forma proporcional. Antes de sair s ruas,
os entrevistadores sabem quantas pessoas em cada lugar tm de ouvir e quais so os lugares. Estando l,
o entrevistador escolhe aleatoriamente os entrevistados, sempre respeitando as faixas de sexo e de ida-
de que compem o conjunto do eleitorado.

Amostra
O Datafolha faz estudos prvios para saber como composto o conjunto do eleitorado. O objetivo que
a amostra seja representativa do total de eleitores. Dessa forma, os resultados obtidos na pesquisa po-
dem ser, estatisticamente, ampliados para os milhes de eleitores no Brasil (ou, os eleitores de cada
Estado pesquisado).

Como feito o estudo prvio?


Antes de fazer uma pesquisa, o Datafolha colhe informaes nos TREs dos Estados para saber, no con-
junto dos eleitores, quantos so homens, quantos so mulheres, quantos esto em cada faixa de idade
pesquisada, quantos moram na capital e quantos moram no interior.

Margem de erro
Como no possvel ouvir todos os eleitores, os resultados obtidos na pesquisa so aproximados. Cha-
ma-se margem de erro o intervalo para mais ou para menos que deve ser considerado para os dados
divulgados; por exemplo, a margem de erro de dois pontos percentuais para So Paulo. Qualquer va-
lor dentro desse intervalo deve ser considerado correto. Na pesquisa para os Estados, a margem de erro
da pesquisa tambm de dois pontos percentuais para Rio, Minas e Rio Grande do Sul. Para o Distrito
Federal, de trs pontos.

Voto espontneo
aquele em que no h estmulo. O entrevistador pergunta: Em quem voc gostaria de votar no segun-
do turno da eleio?

Voto estimulado
Neste tipo de pergunta, o entrevistado estimulado. O pesquisador pergunta: Se a eleio para gover-
nador fosse hoje, em quem voc votaria: X ou Y. O entrevistador diz, e a resposta anotada.

Urna eletrnica
As eleies com urnas eletrnicas podem alterar o resultado final em relao inteno de voto. Na vo-
tao manual, o eleitor recebe a cdula em que constam os nomes e os nmeros dos candidatos ao go-

25 Adaptado do caderno Eleies do jornal Folha de So Paulo, 18/10/1998.


28 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

verno. Ele marca um X no seu candidato. Na votao eletrnica, o eleitor precisa saber o nmero de
seu candidato (e no apenas seu nome). A urna pede que ele digite o nmero. Se ele no souber, pode
errar o voto. Assim mesmo que ele tenha a inteno de votar num candidato (e a pesquisa captou essa
inteno) ele pode errar no momento da votao e acabar votando em outro candidato ou anular seu
voto.

Votos vlidos
So aqueles obtidos sem computar as abstenes (nmero de eleitores que no votaram), os votos
brancos e os nulos. Quando o primeiro colocado numa eleio consegue 50% mais um voto dos votos
vlidos, no h segundo turno.

As pesquisas e os votos vlidos


Os institutos de pesquisa usam o critrio votos vlidos apenas no final do perodo eleitoral. Isso por-
que o nmero de indecisos no incio do processo eleitoral normalmente to grande que esse grupo
certamente ter um peso no resultado final. Ou seja, uma parte dos que dizem no ter candidato vai
acabar escolhendo algum. No final, o nmero de pessoas sem candidatos est mais consolidado (so
aqueles que devem anular ou votar em branco).

Esclarecendo os mtodos do ibope26


GZM. Quais so os critrios para escolha desses domiclios na coleta de ndices (de audincia)?

Dora. Quando se desenha uma amostra de audincia preciso representar a situao da cidade onde
voc est pesquisando. Ns nos baseamos em dados do IBGE para sabermos quantos domiclios exis-
tem na Grande So Paulo, como eles esto divididos por regies, qual o percentual de pessoas por sexo,
por faixa etria, presena de crianas no domiclio etc. A partir da, a gente faz a seleo do domiclio.
S que o IBGE no tem um levantamento de classe socioeconmica, e o Ibope passou a fazer o Levanta-
mento Socioeconmico (LSE). Com isso, agregamos mais uma varivel. Para fazer parte de uma amos-
tra, o domiclio precisa preencher todos esses requisitos. Quanto mais representativa for a amostra,
mais prximo voc est de um resultado real.

26 Trecho da entrevista da diretora do Ibope Dora Cmara ao jornalista Gonalo Junior publicada no jornal Gazeta Mercantil,
14/01/2000.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 29

Apndice 1
Preparando o Excel antes de comear

No livro sero utilizadas funes e ferramentas de anlise disponveis no Excel que nem sempre so in-
corporadas ao iniciar o Excel. Tentando evitar aborrecimentos provenientes de uma instalao incom-
pleta do Excel, sugerimos que o leitor realize a verificao a seguir.

Excel verso 2000


l No menu Ferramentas escolha Suplementos. O Excel apresentar a caixa de dilogo Suplementos
com os Suplementos disponveis.
l Os suplementos Ferramentas de anlise e Ferramentas de anlise-VBA devem estar selecionados
como mostra a Figura 1.11.
l Aproveite e tambm selecione o suplemento Solver que ser utilizado neste livro.

FIGURA 1.11 Caixa de


mensagem Suplementos.

Excel verses 2002 e 2003


l No menu Ferramentas escolha Suplementos. O Excel apresentar a caixa de dilogo Suplementos
com os Suplementos disponveis.
l Os suplementos Ferramentas de anlise e Ferramentas de anlise-VBA devem estar selecionados
como mostra a Figura 1.12. Depois de pressionar o boto OK as ferramentas de anlise, bem como as
funes especiais, estaro sempre disponveis quando o aplicativo Excel for carregado.
l Aproveite e tambm selecione o suplemento Solver que ser utilizado neste livro.

Para todas as verses do Excel


Se os suplementos Ferramentas de anlise, Ferramentas de anlise-VBA e Solver no aparecerem na
caixa de dilogo Suplementos, ento os dois suplementos no foram instalados junto com o Excel.
Voc dever instalar esses arquivos includos no programa de instalao do Excel ou Microsoft Office
correspondente.
30 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

FIGURA 1.12 Caixa de


mensagem Suplementos.

Apndice 2
Como registrar uma funo
na planilha Excel

Uma funo do Excel pode ser registrada numa clula da planilha utilizando um dos trs procedimen-
tos seguintes:
l Digitando a frmula, comeando pelo sinal = seguido do nome da funo requerida e os argumentos
entre parnteses. Este procedimento exige que se lembre o nome da funo, os argumentos necess-
rios e sua sequncia.
l Copiando a frmula de outra clula onde a funo tenha sido usada anteriormente. Este procedi-
mento facilita a digitao, porm exige que se lembre o significado dos argumentos necessrios.
l Utilizando o procedimento Colar funo do Excel que elimina as desvantagens dos dois procedi-
mentos anteriores.
O procedimento Colar funo para registrar a funo matemtica ALEATRIOENTRE entre os li-
mites 0 e 599 o seguinte:
l Posicionar o cursor na clula onde ser registrada a funo.
l No menu Inserir escolher Funo. O Excel apresentar a caixa de dilogo Colar funo. No lugar de
utilizar o menu Inserir se pode ativar a caixa de dilogo Colar funo diretamente pressionando o
boto que deve ser incorporado na Barra de Ferramentas Padro,27 acompanhando o procedi-
mento de Adio de botes.

27 Outra forma de ativar a caixa de dilogo Colar funo abrir o menu Inserir e depois escolher Funo.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 31

l Na caixa ou Selecione uma categoria: escolha Matemtica e trigonomtrica, Figura 1.13.


l Na caixa Selecione uma funo escolher ALEATRIOENTRE.
l Depois de pressionar o boto OK aparecer a caixa de dilogo Argumentos da funo ALEA-
TRIOENTRE onde sero preenchidos os dados, Figura 1.14.

FIGURA 1.13
Selecionando a funo
ALEATRIOENTRE.

Perceba que ao mesmo tempo em que os dados so registrados:

l A caixa de dilogo descreve a funo escolhida bem como cada argumento que est sendo registrado
e direita de cada campo apresentado o valor informado.
l Depois de informar os argumentos da funo ALEATRIOENTRE, na linha seguinte ao ltimo
dado apresentado o resultado do clculo da funo ALEATRIOENTRE, neste caso 175, valor que
deveria ser repetido na ltima linha Resultado da frmula que neste caso 559. Acreditamos que
esta diferena seja provocada pelo resultado de outra rodada de clculo, pois cada vez que o Excel
for recalculado o resultado da funo ALEATRIOENTRE, em geral, ser diferente.
l Durante o preenchimento dos dados, na barra de frmulas do Excel construda a frmula
=ALEATRIOENTRE(0;599) que ser inserida na clula escolhida. Finalmente, pressionando o
boto OK o resultado da funo aparecer na clula onde foi registrada a frmula.

FIGURA 1.14 Caixa


de dilogo da funo
ALEATRIOENTRE.
32 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Apndice 3
A funo PROCV

Numa tabela com vrias colunas, 1, 2, 3, ..., n, a funo PROCV primeiro localizar um valor determina-
do na primeira coluna da esquerda da tabela e, depois, selecionar e retornar um valor registrado na
mesma linha de uma coluna especificada direita da primeira coluna da tabela. A sintaxe dessa funo :

PROCV(procura;tabela;coluna;tipo_de_procura)

Analisemos os quatro argumentos da funo:

l No argumento procura deve ser informado o valor a ser localizado na primeira coluna do argumento
tabela. Este argumento pode ser um valor numrico, uma referncia ou uma sequncia de caracteres
de texto.
l Se o valor registrado no argumento procura for menor do que o menor valor registrado na primei-
ra coluna da tabela, a funo PROCV retornar o valor de erro #N/D.
l No argumento tabela deve ser informada o intervalo de clulas da tabela, recomendando-se utilizar
um nome de intervalo. Os valores na primeira coluna de tabela podem ser texto, nmeros ou valores
lgicos. Textos em maisculas e minsculas so equivalentes.
l Se o argumento tipo_de_procura for VERDADEIRO, os valores na primeira coluna de tabela deve-
ro ser registrados em ordem ascendente, pois do contrrio, a funo PROCV poder no retor-
nar o valor correto:
l Sendo valores numricos, na ordem: 2, 1, 0, 1, 2, ... ,
l Sendo caracteres de texto na, ordem de A a Z.
l Sendo valores lgicos, ordem: FALSO, VERDADEIRO.
l Se tipo_de_procura for FALSO, no ser necessrio ordenar a tabela.
l O argumento coluna o nmero da coluna da tabela onde ser selecionado e retornado o valor pro-
curado, sendo a primeira coluna da tabela a nmero um.
l Se coluna=1, a funo PROCV retornar o valor na primeira coluna da tabela.
l Se coluna=2, a funo retornar o valor na segunda coluna da tabela.
l Se coluna for menor do que 1, PROCV retornar o valor de erro #VALOR!; e se coluna for maior
do que o nmero de colunas da tabela a funo PROCV retornar o valor de erro #REF!.
l O argumento tipo_de_procura um dos dois valores lgicos, FALSO ou VERDADEIRO, e especifica
o tipo de correspondncia, exata ou aproximada.
l Se o argumento tipo_de_procura for VERDADEIRO ou omitido, a funo PROCV retornar
uma correspondncia aproximada. De outra maneira, se no for encontrada uma correspon-
dncia exata, a funo selecionar o menor valor mais prximo do valor informado no argu-
mento procura.
l Se o argumento tipo_de_procura for FALSO, a funo PROCV procurar uma correspondncia
exata. Se nenhuma correspondncia for encontrada, a funo PROCV retornar o valor de erro
#N/D. Se a funo PROCV no localizar o valor registrado no argumento procura e tipo_de_procu-
ra for FALSO, a funo retornar o valor #N/D.
C A P T U L O 1 / DADOS, VARIVEIS E AMOSTRAS 33

A Funo PROCH
O Excel dispe tambm da funo PROCH equivalente funo apresentada, porm procurando valo-
res localizados em linhas. Numa tabela com vrias linhas, 1, 2, 3, ..., n, a funo PROCH primeiro loca-
lizar um valor determinado na primeira linha superior da tabela e, depois, selecionar e retornar um
valor registrado na mesma coluna de uma linha especificada mais abaixo da primeira linha da tabela. A
sintaxe desta funo :

PROCH(procura;tabela;linha;tipo_de_procura)

O significado dos argumentos equivalente ao da funo PROCV, porm operando com linhas.

Apndice 4
Outro modelo para amostragem
sem reposio

Na planilha Apndice 4 includa na pasta Captulo 1 foi construdo um procedimento de amostragem


sem reposio que se pode aplicar a planilhas que contenham sries de dados de onde se deve extrair
uma amostra sem reposio. Proceda como segue, Figura 1.15:

l Nas colunas B, C e D foram repetidos os dados j utilizados e referentes as 50 primeiras empresas pri-
vadas. Sero extradas amostras sem reposio das vendas do intervalo D4:D53.
l Na clula F4 foi registrada a frmula =ALEATRIO( ) que depois foi copiada at a clula F53. Per-
ceba que o nmero de clulas com a frmula =ALEATRIO( ) o mesmo que o da populao
D4:D53. Lembre-se tambm de que cada vez que for recalculada a planilha ser gerada uma nova s-
rie de nmeros aleatrios.

FIGURA 1.15
Amostragem sem
reposio,
utilizando
a funo
ALEATRIO.

l A frmula =NDICE($D$4:$D$53;ORDEM(F4;$F$4:$F$53)) foi registrada na clula I4 e depois


copiada at completar o tamanho da amostra, neste caso dez, clula I13. Essa frmula utiliza a fun-
o NDICE, que j foi apresentada neste captulo, e a funo ORDEM.
34 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l ORDEM(valor; amostra; ordem)


A funo estatstica ORDEM28 retorna a posio do argumento valor da amostra considerando a
ordem informada:
l Se ordem for igual a 0 ou omitida, os valores da amostra sero classificados em ordem decrescente.
l Se ordem for diferente de 0, igual a 1, os valores da amostra sero classificados em ordem cres-
cente.
l Se o argumento amostra tiver valores repetidos a funo ORDEM informar a posio do pri-
meiro valor que encontrar na sua procura, considerando o ordenamento escolhido.
Por exemplo, o objetivo da frmula ORDEM(F4;$F$4:$F$53) definir a posio do nmero
aleatrio da clula F4 dentro do intervalo F4:F53, a posio 17, um resultado do grupo de 1 a
50. Depois, a funo NDICE selecionar as vendas da empresa localizada na posio 5, neste
caso, a empresa TEXACO.
l A frmula =NDICE($C$4:$C$53;ORDEM(I4;$D$4:$D$53)) foi registrada na clula H4 e
depois copiada at completar o tamanho da amostra, neste caso dez, clula H13. Ento, deve
ser utilizada a funo ORDEM porque a funo NDICE reconhece somente valores numri-
cos e no ttulos. Ademais, amarrar a frmula com a resposta da clula F4 garante que se trata
da mesma seleo, como foi mostrado no Exemplo 1.8.

Entende-se que a funo ALEATRIO gerar a quantidade de nmeros aleatrios diferentes que for
necessria,29 que neste exemplo so 50 nmeros aleatrios diferentes, premissa que no foi totalmente
confirmada pelo autor.

28 Em ingls, a funo ORDEM RANK.


29 O procedimento apresentado foi baseado na informao registrada no site http://www.staff.city.ac.uk/r.j.gerrard/excelfaq/faq.html
#sample. Nesse endereo h outras informaes teis navegando-se atravs de seus links.
Captulo 2
DESCRIO DE AMOSTRAS
COM TABELAS E GRFICOS

A obteno de informao faz parte da gesto dos negcios. Por exemplo, o gerente de produo
est interessado em monitorar continuamente a qualidade do produto produzido, comparan-
do-o com os padres estabelecidos; o gerente de produtos est interessado em conhecer a aceitao de
um novo produto distribuindo amostras grtis e registrando os retornos dos consumidores etc. Para
tentar conhecer uma ou mais caractersticas dessa populao, extrada uma amostra de uma popula-
o, conforme orientado no Captulo 1. Quando o tamanho da amostra grande, maior do que 15 a 20
observaes, a simples inspeo das observaes no ser suficiente para obter as concluses deseja-
das. Esses dados coletados devem ser organizados ou resumidos com o objetivo de facilitar a anlise e a
interpretao das observaes. Neste captulo, voc aprender a agrupar os dados em tabelas de fre-
quncias e histogramas, procedimentos que fazem parte da Estatstica Descritiva.

EXEMPLO 2.1
O gerente do departamento de uma instituio financeira deseja analisar o nmero dirio de operaes fecha-
das nos ltimos dois anos por um operador de seu departamento de opes de aes negociadas na Bolsa de
Valores. Na tabela a seguir foi registrada uma amostra probabilstica simples de tamanho 26, extrada das ope-
raes dirias fechadas pelo Operador B nos ltimos dois anos. O objetivo obter as possveis concluses dos
registros dessa tabela.

14 12 13 11 12 13 16 14 14 15 17 14 11
13 14 15 13 12 14 13 14 13 15 16 12 12

Soluo. Aplicando inicialmente apenas o bom senso, pode-se constatar que:


O nmero de operaes fechadas por dia um nmero do conjunto {11, 12, 13, 14, 15, 16, 17}.
O Operador B fechou entre 11 e 17 operaes por dia.
O nmero dirio mximo de operaes fechadas pelo Operador B 17, e o nmero mnimo 11.
O intervalo ou range das operaes fechadas por dia seis, valor obtido como resultado da subtrao
1711=6. Embora o intervalo mostre que o nmero de negcios fechados por dia varivel, esse mesmo valor
no consegue mostrar nada sobre a frequncia do nmero dirio de negcios. Se o nmero dirio de opera-
es fechadas fosse constante, no seria necessrio aplicar conceitos estatsticos para obter respostas. Entre-
tanto, como os valores da varivel no so constantes, o primeiro passo pesquisar a origem das variaes.
36 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Embora tenham sido obtidas algumas concluses, o simples ordenamento dos dados no permite ob-
ter maiores concluses, pois ainda nos deparamos com a mesma quantidade de dados. Necessitamos
agrupar os dados de alguma maneira, tendo em mente que esse procedimento no deve interferir na ob-
teno de concluses. Uma forma prtica e eficiente agrupar os dados de acordo com suas frequncias
de repetio, cujo procedimento d origem s tabelas de frequncias ou distribuies de frequncias.

Tabelas de frequncias de dados quantitativos discretos


Iniciamos este tema com a construo de tabelas de frequncias de uma amostra com dados quantitati-
vos discretos que, em geral, medem contagens representadas por nmeros inteiros positivos 0, 1, 2, 3,
..., n, por exemplo, o nmero de pessoas atendidas em um determinado perodo, o nmero de transa-
es financeiras realizadas pela Internet em um determinado banco, a quantidade de peas defeituosas
em um lote de produo etc. Depois ser tratada a construo de tabelas de frequncias de uma amostra
com dados quantitativos contnuos que podem assumir qualquer valor do conjunto dos nmeros reais,
por exemplo, o peso dos alunos da quarta srie dos alunos da rede escolar de uma determinada regio,
as vendas dirias de uma empresa, o consumo mensal de energia eltrica, a rentabilidade diria das
aes mais negociadas na Bolsa de Valores etc. Embora a classificao dos dados quantitativos parea
fcil, a separao entre discretas e contnuas nem sempre clara.

Tabela de frequncias absolutas


Se as observaes da amostra do nmero dirio de operaes fechadas do Exemplo 2.1 forem agrupadas
considerando as repeties de cada observao, poderemos obter mais informaes dessa amostra.1

A frequncia do valor de uma varivel o nmero de repeties desse valor.


A tabela de frequncias absolutas de uma varivel uma funo formada pelos
valores da varivel e suas respectivas frequncias; conhecida tambm como
distribuio de frequncias absolutas.

O par formado por cada valor da varivel e sua frequncia correspondente determina a tabela de fre-
quncias absolutas da varivel ou distribuio de frequncias absolutas.

EXEMPLO 2.2
Continuando com o Exemplo 2.1. Construa a tabela de frequncias absolutas do nmero de operaes fecha-
das por dia pelo operador B.
Soluo. Para realizar a classificao de forma manual, no necessrio, previamente, ordenar os valores da
varivel de forma crescente. Na primeira coluna da tabela a seguir, foram registrados os valores do nmero de
operaes fechadas por dia e em ordem crescente: 11, 12, 13, 14, 15, 16 e 17. Na segunda coluna, foi realiza-
da a seleo manual da ocorrncia de cada um dos valores da primeira coluna da tabela. Por exemplo, o pri-
meiro nmero 14 da amostra foi registrado com a marca I na linha 14 da segunda coluna da tabela, o segundo
nmero 12 foi registrado com a marca I na linha 12 da segunda coluna da tabela, e assim sucessivamente at o
ltimo valor 12 da amostra. Para facilitar a contagem, o quinto valor selecionado de cada valor representado
por uma linha transversal definindo um grupo de cinco selees do mesmo nmero. Uma nova seleo do
mesmo valor inicia um novo grupo, como se pode ver nas linhas dos valores 13 e 14. Para completar a tabela,
na ltima linha da ltima coluna, registrada a soma das frequncias absolutas cujo resultado 26 deve ser
igual ao nmero de observaes da amostra, tambm 26.

1 A varivel pode pertencer a uma amostra ou uma populao.


C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 37

Operaes Seleo Frequncias


fechadas por dia absolutas
11 II 2
12 IIII 5
13 IIII I 6
14 IIII II 7
15 III 3
16 II 2
17 I 1
Total 26

Essa tabela de frequncias absolutas foi construda na planilha Tabelas de Frequncias, includa na pasta
Captulo 2.

EXEMPLO 2.3
Analisar os resultados da tabela de frequncias absolutas do Exemplo 2.2.

Soluo. Da tabela de frequncias absolutas do Exemplo 2.2 podemos chegar s seguintes concluses:
O nmero mximo 17 de operaes dirias fechadas pelo Operador B aconteceu em apenas um dia da
amostragem.
Entretanto, o valor mnimo 11 repetiu-se em dois dias.
Em seis dias da amostragem, o Operador B fechou 13 operaes por dia, e, em sete dias da amostragem, fe-
chou 14 operaes por dia.
Os valores das frequncias de cada observao mostram um contorno crescente da observao 11 at a 14 e
decrescente desde esse valor at o 17.

A tabela de frequncias absolutas resume uma srie de valores numricos em uma simples classifica-
o de frequncias muito til para descrever caractersticas importantes do conjunto de dados da
amostra. As duas tabelas de frequncias seguintes possibilitaro incluir outras caractersticas no mos-
tradas pela primeira tabela.

Tabela de frequncias relativas


A tabela de frequncias do Exemplo 2.2 agrupa valores absolutos que permitem chegarmos a conclu-
ses como, em cinco dias da amostra, o Operador B fechou 12 operaes. Esse tipo de resultado no
permite avaliar, por exemplo, se essa frequncia doze alta ou baixa, pois nesse resultado no h ne-
nhuma informao sobre o tamanho da amostra. Conseguiremos extrair mais informao da varivel
se suas frequncias forem expressas como porcentagem do tamanho da amostra.

A frequncia relativa do valor de uma varivel o resultado de dividir sua


frequncia absoluta pelo tamanho da amostra.
A tabela de frequncias relativas de uma varivel uma funo formada pelos
valores da varivel e suas respectivas frequncias relativas; conhecida como
distribuio de frequncias relativas.
38 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

O par formado por cada valor da varivel e sua frequncia relativa correspondente determina a tabe-
la de frequncias relativas da varivel ou distribuio de frequncias relativas, em valores unitrios ou
percentagem.

EXEMPLO 2.4
Continuando com o Exemplo 2.1. Primeiro construa a tabela de frequncias relativas da varivel nmero de
operaes fechadas por dia pelo operador B e, depois, analise os resultados.

Soluo. As duas primeiras colunas da tabela seguinte repetem a tabela das frequncias absolutas construda
no Exemplo 2.2. Na terceira coluna, foi registrado o resultado da diviso do valor de cada frequncia absoluta
por 26, o tamanho da amostra. Para completar a tabela, foi adicionada uma linha onde foi registrado o total de
cada coluna de frequncia. Os resultados dessa ltima linha devem ser iguais ao nmero de observaes da
amostra, 26, na coluna de frequncias absolutas, e 100%, na coluna de frequncias relativas, pois o resultado
100% indica que todas as observaes da amostra esto contidas nessas frequncias.

Operaes Frequncias Frequncias


fechadas por dia absolutas relativas %
11 2 7,69%
12 5 19,23%
13 6 23,08%
14 7 26,92%
15 3 11,54%
16 2 7,69%
17 1 3,85%
Total 26 100,00%

Essa tabela de frequncias absolutas foi construda a partir da linha 14 da planilha Tabelas de Frequn-
cias, includa na pasta Captulo 2. Da tabela de frequncias relativas, chegamos a estas concluses:

Em 3,85% dos 26 dias amostrados, o Operador B fechou 17 negcios por dia.


Em 7,69% dos dias amostrados, o Operador B fechou 11 negcios por dia.
Durante 26,92% dos dias da amostra, o Operador B fechou 14 negcios.

Um ponto importante que precisa ser ressaltado que analisando o procedimento do Exemplo 2.4,
observamos que a construo da tabela de frequncias relativas realizada com os dados registrados na
tabela de frequncias absolutas. No sentido inverso, a construo da tabela de frequncias absolutas
poder ser realizada com os dados registrados na tabela de frequncias relativas se for conhecido o ta-
manho da amostra.

Tabela de frequncias acumuladas


As distribuies de frequncias absolutas e relativas apresentadas so muito teis para organizar e re-
sumir os dados das observaes em forma de tabela, permitindo detectar as caractersticas relevantes
dos valores da varivel amostrada. Em alguns casos, o interesse da anlise reside em conhecer os valo-
res da varivel menores ou maiores a um determinado valor, por exemplo, o nmero de dias em que o
Operador B fechou menos do que 15 operaes por dia etc.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 39

A frequncia acumulada do valor de uma varivel a soma das frequncias


absolutas ou relativas desde o valor inicial da varivel.
A tabela de frequncias acumuladas ou distribuio de frequncias acumuladas de
uma varivel uma funo formada pelos valores da varivel e suas respectivas
frequncias acumuladas.

Por exemplo, se conhecermos a distribuio das peas rejeitadas por lote de produo, poderemos
conhecer o nmero de lotes que tiveram uma rejeio maior ou menor do que um determinado nme-
ro de peas. Essa informao pode ser obtida da distribuio de frequncias acumuladas, ou ogiva,2 for-
mada pela acumulao dos valores absolutos ou relativos da distribuio inicial.

EXEMPLO 2.5
Continuando com o Exemplo 2.1. Construa a tabela de frequncias acumuladas da varivel nmero de opera-
es fechadas por dia pelo operador B.

Soluo. Na primeira coluna da tabela seguinte, foram registrados os valores do nmero de operaes fecha-
das por dia e em ordem crescente: 11, 12, 13, 14, 15, 16 e 17. Para cada valor da varivel:
Na segunda coluna, foram acumuladas as frequncias absolutas do Exemplo 2.2 desta forma:
A frequncia acumulada absoluta at 12 negcios fechados por dia igual a 7=2+5.
A frequncia acumulada absoluta at 13 negcios fechados por dia igual a 13=2+5+6. Repetindo esse
procedimento at a ltima linha da tabela, completamos a distribuio de frequncias acumuladas abso-
lutas.
A frequncia acumulada absoluta da ltima linha dever sempre ser igual ao tamanho da amostra, nesse
caso, 26.
Na terceira coluna, foram acumuladas as frequncias relativas do Exemplo 2.4 desta forma:
A frequncia acumulada relativa at 12 negcios fechados por dia igual a 26,92%=7,69%+19,23%.
A frequncia acumulada relativa at 13 negcios fechados por dia igual a 50%=7,69%+19,23%+23,08%.
Repetindo esse procedimento at a ltima linha da tabela, completamos a distribuio de frequncias acu-
muladas relativas.
A frequncia acumulada absoluta da ltima linha dever sempre ser igual a 100%, pois o resultado 100%
indica que todas as observaes da amostra esto contidas nessas frequncias

Operaes Frequncias acumuladas


fechadas por dia Absolutas Relativas %
11 2 7,69%
12 7 26,92%
13 13 50,00%
14 20 76,92%
15 23 88,46%
16 25 96,15%
17 26 100,00%

Essa tabela de frequncias absolutas foi construda a partir da linha 25 da planilha Tabelas de Frequn-
cias includa na pasta Captulo 2.

2 Como a distribuio de frequncias acumuladas sempre crescente, quando a distribuio representada com uma poligonal, o
desenho se assemelha ogiva de um foguete.
40 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Das tabelas de frequncias acumuladas absolutas e relativas do Exemplo 2.5, temos as seguintes
concluses:

l Ao afirmar que o operador B fechou 14 ou menos operaes por dia em 76,92% dos dias da amos-
tra, foi includo nessa afirmativa o fechamento de 14 operaes por dia. Diferente das seguintes
declaraes:
l O operador B fechou menos de 14 operaes por dia em 50% dos dias da amostra; o fechamento
de 14 operaes no est includo.
l O operador B fechou menos de 15 operaes por dia em 76,92% dos dias da amostra; o fechamen-
to de 15 operaes por dia no est includo.
l Ao afirmar que em 23,08% dos dias o operador B fechou 15 ou mais operaes por dia, est includo
nesse resultado o fechamento de 15 operaes por dia. Verifique que esse ltimo resultado (23,08%)
o complemento do operador ter fechado menos de que 15 operaes por dia (76,92%), pois o re-
sultado da soma desses dois valores 100%.
l Ao afirmar que em 61,54% dos dias o operador B fechou entre 13 e 15 operaes, incluindo esses va-
lores, estamos realizando os seguintes clculos:
l Em 88,46% dos dias, o operador B fechou 15 ou menos operaes.
l Em 26,92%, fechou 12 ou menos operaes, ou fechou menos de 13 operaes.
l Portanto, em 61,54%=88,46% 26,92% dos dias o operador B fechou entre 13 e 15 operaes, in-
cluindo esses valores.

Outro ponto importante a ser destacado que, analisando o procedimento do Exemplo 2.5, obser-
vamos que:

l A construo da tabela de frequncias acumuladas absolutas realizada com os dados registrados na


tabela de frequncias absolutas. No sentido inverso, a construo da tabela de frequncias absolutas
poder ser realizada com os dados registrados na tabela de frequncias acumuladas absolutas. E da
mesma maneira para as frequncias relativas.
l A construo da tabela de frequncias acumuladas relativas pode ser realizada com os dados regis-
trados na tabela de frequncias acumuladas absolutas se for conhecido o tamanho da amostra. No
sentido inverso, a tabela de frequncias acumuladas absolutas poder ser construda com os dados
registrados na tabela de frequncias acumuladas relativas se for conhecido o tamanho da amostra.

A funo Frequncia do Excel


O Excel dispe de muitas funes estatsticas que reduzem o tempo de clculo e asseguram resultados
exatos. O Apndice 1 registra algumas dessas funes relacionadas com a determinao do valor mxi-
mo, do valor mnimo e a contagem de observaes de uma amostra. A funo estatstica FREQUNCIA
do Excel de grande ajuda na construo das tabelas de frequncias de uma amostra.

FREQUNCIA(matriz_dados; matriz_bin)
A funo estatstica FREQUNCIA3 retorna uma matriz vertical contendo a distribuio de frequn-
cias da amostra definida no argumento matriz_dados de acordo com a seleo registrada no argumento
matriz_bin. Portanto:

l No argumento matriz_dados, deve ser informado o intervalo da planilha em que foram registradas as
observaes da amostra.

3 Em ingls, a funo FREQUNCIA FREQUENCY.


C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 41

l No argumento matriz_bin, deve ser informado o intervalo da planilha dos valores definidos pelo
usurio para selecionar, ou agrupar, as observaes da amostra.
l Ao realizar a seleo dos valores da varivel, a funo FREQUNCIA no considera as clulas vazias
ou com texto.
Um detalhe importante: se o nome da funo FREQUNCIA for inserido com letras minsculas ou
maisculas ou sem os acentos ortogrficos, felizmente, o Excel aceitar e registrar a funo com letras
maisculas e com os acentos ortogrficos.
Com essa funo, possvel construir a tabela de frequncias absolutas e acumuladas absolutas, de
acordo com a forma de registrar essa funo:
l Se for registrada como matriz coluna, a funo FREQUNCIA retornar a tabela da distribuio de
frequncias absolutas, apresentada como matriz coluna.
l Se for registrada como frmula, a funo FREQUNCIA retornar a tabela de frequncias acumula-
das absolutas.
A descrio da funo FREQUNCIA mostra que h duas formas de registr-la na planilha Excel,
obtendo, nos dois casos, resultados estatsticos diferentes, ambos importantes e de nosso interesse.
Para compreender como deve ser utilizada, ser novamente resolvido o Exemplo 2.1 utilizando a fun-
o FREQUNCIA, repetindo o enunciado.

EXEMPLO 2.6
O gerente do departamento de uma instituio financeira quer analisar o nmero dirio de operaes fecha-
das nos ltimos dois anos por um operador de seu departamento de opes de aes negociadas na Bolsa de
Valores. Na tabela a seguir, foi registrada uma amostra probabilstica simples de tamanho 26 e extrada das
operaes dirias fechadas pelo Operador B nos ltimos dois anos. Construa tabela de frequncias absolutas
do nmero de operaes fechadas por dia pelo operador B utilizando a funo FREQUNCIA do Excel.

14 12 13 11 12 13 16 14 14 15 17 14 11
13 14 15 13 12 14 13 14 13 15 16 12 12

Soluo. A amostra do nmero de operaes fechadas por dia foi registrada no intervalo B4:B29 da planilha
Funo Frequncia includa na pasta Captulo 2. Para a construo da tabela de frequncias absolutas, se-
ro utilizados os valores do nmero de operaes fechadas por dia em ordem crescente: 11, 12, 13, 14, 15, 16
e 17; esses valores foram registrados no intervalo D4:D10. Na descrio, foi visto que funo FREQUNCIA re-
tornar a tabela da distribuio de frequncias absolutas apresentada como matriz coluna. Para trabalhar com
registros em forma de matriz, devemos proceder desta forma:

Posicionar o mouse na clula E4 e selecionar o intervalo E4:E11. Observe que o intervalo selecionado con-
tm uma linha a mais do que o intervalo em que esto registrados os valores do argumento a matriz_bin, in-
tervalo D4:D10.
42 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

A seguir, digite a frmula =frequencia(B4:B29;D4:D10) sem pressionar a tecla Enter, como mostra a figura
anterior. Note que o nome da funo foi inserido com letras minsculas e sem os acentos ortogrficos, pois
felizmente o Excel aceitar e registrar a funo com letras maisculas e com os acentos ortogrficos. Em vez
de digitar a frmula, voc pode utilizar o assistente do Excel Colar funo apresentado no Apndice 2 do Ca-
ptulo 1, que possui mais vantagens em comparao digitao direta na clula.
Para inserir essa funo como matriz, pressione simultaneamente as trs teclas Ctrl + Shift + Enter. Man-
tendo pressionada a tecla Ctrl, pressione e mantenha pressionada a tecla Shift e, por ltimo, pressione a
tecla Enter. Depois de pressionar as trs teclas simultaneamente, obtemos os resultados apresentados na
prxima figura, na qual as frmulas receberam as chaves { }. Voc pode usar esse procedimento se utilizar o
assistente do Excel Colar funo.

Podemos notar que as frmulas do intervalo E4:E11 so todas iguais a {=FREQUNCIA(B4:B29;D4:D10)},


sendo que as chaves { } indicam que as frmulas fazem parte da mesma matriz. Por ltimo, o valor zero na clu-
la E11 informa que nenhum dos valores da varivel deixou de ser classificado. De outra maneira, o objetivo da
ltima clula E11 informar quantos valores da varivel no foram classificados.4 Como exerccio, verifique
que a partir das frequncias absolutas possvel construir a tabela de frequncias acumuladas absolutas da
mesma amostra, como foi realizado no intervalo I4:I10 da planilha Funo Frequncia includa na pasta Ca-
ptulo 2 desta forma:

Na clula I4 foi registrada a frmula =E4, pois ambas as frequncias tm o mesmo valor.
Na clula I5 foi registrada a frmula =I4+E5, que depois foi copiada at a clula I10.

Compare os resultados.

Utilizando a funo FREQUNCIA como matriz coluna, obtemos a tabela de frequncias absolutas
da srie de dados, adicionando a vantagem de controlar a quantidade de dados que no foram classifi-
cados.

EXEMPLO 2.7
Continuando com o Exemplo 2.6. Construa a tabela de frequncias acumuladas absolutas do nmero de ope-
raes fechadas por dia pelo operador B utilizando a funo FREQUNCIA do Excel.
Soluo. A partir da linha 13 da planilha Funo Frequncia includa na pasta Captulo 2, foi construda a
tabela de frequncias acumuladas absolutas da amostra registrada no intervalo B4:B29. Se a funo
FREQUNCIA for registrada como frmula nica, a funo dar como resultado a frequncia acumulada dos
valores iguais ou menores do que o valor informado no argumento matriz_bin. Como exemplo, se numa clu-
la vazia da planilha referida for registrada a frmula =FREQUNCIA(B4:B29;12), a funo retornar o valor 7, a
frequncia do nmero de negcios fechados iguais ou menores a doze.

4 Sugerimos que voc procure se informar sobre o uso das matrizes na ajuda on-line do Excel, incluindo as rotinas para modificao
das frmulas.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 43

Para obter a tabela de frequncias acumuladas absolutas da amostra registrada no intervalo B4:B29, faa o
seguinte:

Registre os valores do nmero de operaes fechadas por dia em ordem crescente: 11, 12, 13, 14, 15, 16 e
17 no intervalo D15:D21.
Na clula E15, registre a frmula =FREQUNCIA($B$4:$B$29;D15) que dever ser copiada at a clula D21.
Sobre os cifres registrados nos endereos do intervalo B4:B29, veja o Apndice 2 deste captulo.
Depois de pressionar Enter, a funo retornar o valor 2. A seguir, copie essa frmula at a clula D21.

A figura mostra a tabela de frequncias acumuladas absolutas construda com a funo FREQUNCIA cons-
truda a partir da linha 13 da planilha Funo Frequncia includa na pasta Captulo 2. Como exerccio, ve-
rifique que a partir das frequncias acumuladas absolutas possvel construir a tabela de frequncias absolutas
da mesma amostra, como foi realizado no intervalo F15:F21 da planilha Funo Frequncia includa na pas-
ta Captulo 2, procedendo desta forma:

Na clula F15, foi registrada a frmula =E15, pois ambas as frequncias tm o mesmo valor.
Na clula F16, foi registrada a frmula =E16 E15 e, depois, foi copiada at a clula F11.

Compare os resultados.

Construo das tabelas de frequncias numa planilha Excel


Na planilha Resultados de Frequncias includa na pasta Captulo 2, foram construdas as tabelas de
frequncias. No intervalo B5:B30, foi registrada a amostra do Exemplo 2.1, com os dados ordenados de
forma crescente. O ordenamento crescente dos dados foi realizado apenas para visualizar o procedi-
mento de clculo da funo FREQUNCIA quando registrada em uma nica clula.
A partir das frequncias acumuladas absolutas, possvel, tambm, construir as tabelas de frequn-
cias absolutas, relativas e acumuladas relativas da amostra como foi realizado na planilha Resultados
de Frequncias, Figura 2.1:

l No intervalo D5:D11, foram registrados os valores do nmero de operaes fechadas por dia em or-
dem crescente: 11, 12, 13, 14, 15, 16 e 17.
l Na clula E5, foi registrada =FREQUNCIA($B$5:$B$30;D5) e, depois, foi copiada at a clula
E11. Como resultado, no intervalo E5:E11 esto registradas as frequncias acumuladas procu-
radas.
l As frequncias absolutas so registradas no intervalo F5:F11 a partir das frequncias acumuladas
absolutas registradas no intervalo E5:E11.
l Na clula F5, foi registrada a frmula =E5, pois ambas as frequncias tm o mesmo valor.
l Na clula F6, foi registrada a frmula =E6-E5 e depois foi copiada at a clula F11.
l As frequncias relativas so registradas no intervalo G5:G11 a partir das frequncias absolutas regis-
tradas no intervalo F5:F11 e da contagem de valores do intervalo B5:B30. Na clula G5, foi registra-
da a frmula =F5/CONT.NM($B$5:$B$30) e copiada at a clula G11.
44 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l As frequncias acumuladas relativas so registradas no intervalo H5:H11 a partir das frequncias re-
lativas registradas no intervalo G5:G11.
l Na clula H5, foi registrada a frmula =G5, pois as ambas frequncias tm o mesmo valor.
l Na clula H6, foi registrada a frmula =H5+G6, que depois foi copiada at a clula H11.

No intervalo D13:F15 da planilha, foi construdo um modelo que, na clula F15, retorna, a partir do
valor observado registrado na clula D14, o resultado da frequncia selecionada na clula E14. Por
exemplo, registrando 15 na clula D14, obteremos o valor 11,54% se na clula E14 for selecionado Re-
lativa, uma das quatro frequncias possveis de selecionar, como mostra a Figura 2.1.

FIGURA 2.1
Construo de tabelas
de frequncias.

As colunas de frequncias construdas na planilha Excel esto em uma ordem diferente da utilizada
durante sua apresentao. Depois de construdas, as colunas das frequncias podem ser permutadas na
ordem desejada. Tambm, a construo das tabelas com Excel poderia comear pela construo inicial
da tabela de frequncias absolutas, tarefa que deixamos para voc, lembrando que a planilha Resulta-
dos de Frequncias foi protegida, sem senha, exceto nas clulas D14 e E14.

Tabelas de frequncias de dados quantitativos contnuos


A construo das tabelas de frequncias do Exemplo 2.1 foi relativamente fcil, pois os dados da vari-
vel so quantitativos e discretos, que resultam de contagens, com uma quantidade pequena de observa-
es e a maior parte delas repetidas. Entretanto, se os dados da varivel forem contnuos, que resultam
de medies que podem ter grande preciso, a aplicao do procedimento anterior ser trabalhosa e de
baixa eficincia, pois poucos ou at nenhum dos dados podero apresentar frequncia. Nesse caso, o
procedimento recomendado para variveis com valores contnuos trabalhar com classes de valores. O
mtodo comea pela definio da quantidade, dos limites e da amplitude das classes onde sero sele-
cionados os valores da varivel.
Na construo da tabela de frequncias, leve em considerao que:

l No h uma regra exata para determinar o nmero de classes, apenas orientaes prticas para o
analista. Por exemplo, para uma amostra de tamanho n, a quantidade de classes k recomendada pode
ser obtida de:
l k = n , arredondando o resultado para o valor inteiro menor ou maior.

l k = 1 + 3,322 log(n), arredondando o resultado para o valor inteiro menor ou maior.


C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 45

l O nmero de classes o menor valor inteiro k, que satisfaz condio 2 k n. Na realidade, essa
frmula igual frmula anterior na condio 2 k = n.
l A determinao da quantidade de classes tem um pouco do procedimento de tentativa e erro na pro-
cura da distribuio que melhor represente os valores da varivel. A quantidade de classes para di-
versos valores do tamanho de amostra utilizando as trs frmulas apresentada no intervalo B3:E24
da planilha Quantidade de Classes, includa na pasta Captulo 2. Informando o tamanho de amos-
tra na clula B27, a planilha apresenta os resultados pelos trs mtodos no intervalo C27:E27.
l Ao trabalhar com classes, a tabela de frequncias no retm a identidade de cada observao indivi-
dual, provocando perda de informao. Os valores da varivel so transformados em uma nova va-
rivel cujos novos valores so os limites dos intervalos das classes.

O exemplo a seguir mostra como proceder para construir tabelas de frequncia absolutas utilizando
classes.

EXEMPLO 2.8
As vendas dirias em milhares de uma empresa esto registradas na tabela a seguir. O objetivo construir a ta-
bela de frequncias absolutas e relativas e as respectivas frequncias acumuladas.

280 305 320 330 310 340 330 341 369 355 370 360 370
365 280 375 380 400 371 390 400 370 401 420 430

Soluo. O procedimento para construir a tabela de frequncias absolutas utilizando classes o seguinte:
Determinao da quantidade de classes
Como premissa inicial, conveniente que todas as classes tenham a mesma largura, denominado tambm de
intervalo ou amplitude da classe. A quantidade de classes deve ser fixada de forma que as classes representem
adequadamente a distribuio de valores da varivel sob estudo. Um nmero pequeno de classes gera ampli-
tudes de classes grandes e vice-versa, podendo gerar distores indesejveis. Como vimos, no h uma regra
nica para escolher a quantidade de classes, apenas regras prticas que orientam o analista. Nesse caso, apli-
cando qualquer uma das trs frmulas apresentadas, o nmero de classes sugerido para uma amostra de ta-
manho 25 igual a cinco, k = 5.
Determinao da amplitude das classes
Os valores mximo e mnimo da amostra so, respectivamente, 430 e 280, e o intervalo de variao 150, re-
sultado da diferena entre os valores mximo e mnimo da amostra 150=430-280. A amplitude das cinco clas-
ses igual a 30, valor obtido como resultado da diviso do intervalo de variao pela quantidade de classes,
430 280
= 30.
5

Preparao da tabela de seleo


Com os resultados anteriores, construda a tabela de seleo com trs colunas: a primeira, que identifica a
classe, de um a cinco, as duas ltimas, que registram o limite inferior e o limite superior das cinco classes, res-
pectivamente.

Classe Limite inferior Limite superior


1 280 310
2 310 340
3 340 370
4 370 400
5 400 430
46 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Analisemos os limites das classes dessa tabela:

Da forma como foram registrados os limites, parece que o limite superior de uma classe igual ao limite in-
ferior da classe seguinte. O valor 310 da amostra deve ser classificado na primeira classe, com os limites
280-310, ou na segunda classe com os limites 310-340? O valor 310 deve ser classificado na classe 310-340,
pois o limite superior de cada classe no inclui o prprio valor; o limite superior aberto, com exceo da l-
tima classe.
Como prtica corrente, o limite inferior da primeira classe deve conter a observao de menor valor da
amostra e o limite superior da ltima classe, o maior. Nada impede utilizar os valores mnimo e mximo da
amostra, respectivamente, como limite inferior da primeira classe e o limite superior da ltima classe.

Seleo dos dados e construo das tabelas de frequncias


A seleo dos valores da varivel nas classes estabelecidas executada da forma como foi realizada com os da-
dos discretos, obtendo as seguintes distribuies de frequncias absolutas e relativas cujos resultados foram
obtidos na planilha Exemplo 2.8, includa na pasta Captulo 2.

Classe Frequncias Frequncias Frequncias Frequncias


absolutas relativas acum. abs. acum. rel.
280-310 3 12,00% 3 12,00%
310-340 4 16,00% 7 28,00%
340-370 6 24,00% 13 52,00%
370-400 7 28,00% 20 80,00%
400-430 5 20,00% 25 100,00%
Total 25 100%

importante ressaltar que os dados do Exemplo 2.8 facilitaram a obteno das classes, bem
como seus limites, pois, em geral, a determinao da quantidade de classes e amplitudes um pro-
cesso de tentativa e erro, procurando o equilbrio entre a quantidade e a amplitude das classes para
conseguir a distribuio de frequncias que melhor represente a amostra. Quando cada classe esti-
ver formada por apenas um valor, por exemplo, a quantidade de operaes fechadas do Exemplo
2.1, diz-se que no h perda de informao. Entretanto, no caso do Exemplo 2.8, h perda de infor-
mao, pois os valores das vendas dirias no so considerados individualmente; eles esto agru-
pados em classes. O Exemplo 2.9 mostra como utilizar a funo FREQUNCIA para obter as tabe-
las de frequncias.

EXEMPLO 2.9
Continuando com o Exemplo 2.8. O objetivo construir a tabela de frequncias absolutas e relativas e as res-
pectivas frequncias acumuladas utilizando a funo FREQUNCIA do Excel.
Soluo. Antes de utilizar a funo FREQUNCIA com classes, devemos rever a forma de seleo dessa fun-
o. Se a funo FREQUNCIA for registrada como frmula nica:
A funo retornar a frequncia acumulada dos valores iguais ou menores ao valor informado no argumen-
to matriz_bin da funo, considerando o limite superior da classe como fechado. De outra maneira, o limite
superior de cada classe inclui o prprio valor.
Tecnicamente, o limite superior aberto, com exceo da ltima classe. De outra maneira, o limite superior
de cada classe no inclui o prprio valor.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 47

Para operar com o Excel mantendo o limite superior da classe aberto, o limite superior utilizado na funo
FREQUNCIA dever ser menor do que o limite terico. A diminuio do valor do limite superior depender
dos valores dos dados, por exemplo, se todos os valores da amostra forem nmeros inteiros, a diminuio de
0,1 ser suficiente. Contudo, se alguns valores da amostra forem nmeros com uma casa decimal, dever ser
utilizada uma diminuio de 0,01.
Na planilha Exemplo 2.9, includa na pasta Captulo 2, foram construdas as quatro tabelas de fre-
quncias do Exemplo 2.9 partindo da tabela de frequncias absolutas. Na primeira coluna Tec. Superior, fo-
ram registrados os limites superiores de cada classe em ordem crescente a partir da primeira classe. Na coluna
Excel, tambm foram listados os limites superiores de cada classe, porm ligeiramente menores do que seus
equivalentes tericos, subtraindo 0,10 de cada limite terico, com exceo da ltima classe que permanece
com o mesmo limite

Histograma
As quatro tabelas de frequncias apresentadas resumem os valores de uma amostra, ajudando na sua
anlise e permitindo inferir sobre a populao de onde foi extrada a amostra. O Histograma visualiza a
tabela de frequncias de uma amostra, ou varivel, em um grfico de barras verticais, aumentando a
compreenso dos resultados e anlises.

Histograma o grfico de barras verticais das frequncias dos valores de uma


amostra ou varivel.

Vejamos algumas caractersticas gerais da construo dos histogramas. As barras verticais do histo-
grama tm a mesma largura, e o comprimento ou altura das barras proporcional frequncia de cada
valor ou classe representada. Na forma do contorno do histograma, reconheceremos distribuies si-
mtricas e no simtricas, e essa particularidade ajudar no processo de inferncia que ser realizado.
O histograma construdo a partir da tabela de frequncias correspondente, que dever ser previa-
mente construda. Em vez de mostrar a construo manual do histograma, a seguir mostraremos como
construir um histograma com o Excel. Depois ser apresentada a ferramenta de anlise Histograma,
que constri automaticamente o histograma e, ao mesmo tempo, pode apresentar outras respostas
conforme a escolha prvia do leitor.
48 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Construo do histograma com Excel


Comeamos com a construo do histograma de frequncias absolutas de uma amostra com dados
quantitativos discretos utilizando a amostra do Exemplo 2.1, deixando para depois a construo do
histograma de frequncias de uma amostra com dados quantitativos contnuos.

FIGURA 2.2 Assistente


de grfico etapa 1 de
4 tipo de grfico.

O primeiro passo a preparao da planilha Construo Histograma, includa na pasta Captulo 2,


contendo a amostra e a tabela de frequncias absolutas calculadas na mesma planilha. Para facilitar a
preparao dessa planilha, pode-se economizar tempo copiando a planilha Funo Frequncia com o
procedimento apresentado no Apndice 3 deste captulo. Na planilha copiada, so removidos os regis-
tros desnecessrios mantendo apenas a tabela de frequncias absolutas.
Depois de preparar a tabela de frequncias absolutas, o prximo passo construir o histograma cor-
respondente. Uma forma rpida de construir o grfico a seguinte:

l Selecione as clulas das frequncias absolutas que sero utilizadas no grfico, intervalo E3:E10, in-
cluindo o ttulo da coluna.
l Clique no cone assistente de grfico e siga as instrues da caixa de dilogo Assistente de grfi-
co. Na etapa 1 de 4 tipo de grfico do assistente, mantenha-se na pgina Tipos padro e selecione
o tipo de grfico Colunas e o subtipo de grfico Colunas agrupadas, como mostra a Figura 2.3.
l Ao pressionar o boto Manter pressionado para exibir exemplo, voc ver o grfico esperado, po-
rm com os valores da amostra apenas a sequncia de nmeros 1, 2, ..., 7, que identifica as sete barras
verticais.
l Depois de pressionar o boto Avanar, ser exibida a caixa de dilogo Assistente de grfico etapa 2
de 4 dados de origem do grfico, com duas pginas com os nomes Intervalo de dados e Sequncia.
l Na guia Intervalo de dados, dever estar selecionado Colunas, e na caixa Intervalo de dados apare-
cer o endereo do intervalo previamente selecionado com a referncia do nome da planilha da pas-
ta, nesse caso, Construo Histograma, Figura 2.3 esquerda.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 49

FIGURA 2.3 Assistente de grfico etapa 2 de 4 dados de origem.

l Selecione a guia Sequncia com a construo do grfico e:


l Na caixa de listagem Sequncias, exibido o ttulo Freq. Absolutas registrado no intervalo da
planilha E3:E10, Figura 2.3 direita.
l Na caixa Nome, est registrada a clula $E$3 com a referncia do nome da planilha da pasta, neste
caso, Construo Histograma.
l Na caixa Valores, est registrada a frmula do intervalo da planilha E4:E10 referente ao eixo de
ordenadas ou frequncias.
l A caixa Rtulos do eixo das categorias (X) est em branco e deve ser preenchida com os dados do
intervalo D4:D10. Para isso proceda desta forma:
l Posicione o cursor do mouse nessa caixa vazia.
l Depois, com o mouse, apenas selecione o intervalo D4:D10. A Figura 2.3 direita mostra o in-
tervalo D4:D10 depois de ser registrado e depois de os valores desse intervalo serem registra-
dos no grfico. Agora o grfico mostrado o histograma que queremos.

FIGURA 2.4 Assistente


de grfico etapa 3
de 4 opes de
grfico.
50 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Novamente, depois de pressionar o boto Avanar, o Excel exibir a caixa de dilogo Assistente de
grfico etapa 3 de 4 opes de grfico contendo seis pginas e o grfico desenhado na prpria caixa
de dilogo. Essa etapa do assistente permitir realizar mudanas na apresentao do grfico, Figura
2.4. Uma caracterstica interessante dessa etapa que, conforme voc muda as configuraes, elas apa-
recem no grfico da prpria caixa de dilogo.

l Na primeira pgina Ttulo, procedemos como segue:


l Ttulo do grfico. Aparece o nome Freq. Absolutas, pois o nome da coluna dos valores informa-
dos. Substitumos esse nome pelo nome Histograma.
l Eixo das categorias (X). Registramos Operaes fechadas.
l Eixo dos valores (Y). Registramos Frequncias absolutas.
Observe que medida que for registrando as letras dos ttulos, o grfico da caixa de dilogo vai in-
corporando essas letras. A Figura 2.4 mostra a caixa de dilogo com o grfico depois de completar
os registros. Nas outras cinco pginas, possvel realizar outras mudanas e, ao mesmo tempo,
visualizar seus resultados no grfico.
l Na pgina Eixos, possvel modificar as escalas dos dois eixos, bem como alterar o tipo de informa-
o includa no eixo X.
l Na pgina Linhas de grade, possvel adicionar ou retirar linhas de grade nos dois eixos. Nesse caso,
mantemos somente as linhas de grade principais dos valores Y e desmarcamos todas as demais
opes.
l A pgina Legenda refere-se legenda Freq. Absolutas, posicionada direita do grfico. Nesse caso,
desmarcamos a opo Mostrar legenda. A legenda desaparece e o grfico fica maior.
l Na pgina Rtulo de dados, possvel incluir os valores das ordenadas ou das abscissas.
l Na pgina Tabela de dados, possvel incluir a tabela dos dados combinada com os valores do eixo
de abscissas, alternativa que deixamos para o leitor verificar.

Antes de continuar verifique a visualizao do grfico para certificar-se de que est como deseja.
Completadas as escolhas anteriores, pressionando o boto Avanar, o Excel exibir a caixa de dilogo
Assistente de grfico etapa 4 de 4 local do grfico, Figura 2.5:

l Posicione o grfico Como nova planilha. Escolhendo essa opo, o Excel criar a planilha de grfico
Graf1 ou com o nome que voc registrar nessa caixa.

l Posicione o grfico Como objeto em. Escolhendo essa opo, o Excel construir o grfico na plani-
lha de clculo registrada, nesse caso Construo Histograma, ou em outra planilha que escolher.

FIGURA 2.5 Assistente


de grfico etapa 4 de
4 local do grfico.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 51

Pressionando o boto Concluir, o Excel construir o grfico na planilha Construo Histograma


mostrada na Figura 2.6.

FIGURA 2.6
Histograma de
frequncias
absolutas
do Exemplo 2.1.

Todos os histogramas numa nica planilha


Seguindo o roteiro apresentado anteriormente, possvel construir os outros trs histogramas, de fre-
quncias relativas, de frequncias acumuladas absolutas e de frequncias acumuladas relativas. De-
ve-se cuidar para construir corretamente as tabelas de frequncias correspondentes. Tambm impor-
tante lembrar que as formas dos histogramas de frequncias absolutas e frequncias relativas so a mes-
ma, mudando apenas a escala de ordenadas dos grficos, situao que tambm ocorre com os histogra-
mas de frequncias acumuladas absolutas e frequncias acumuladas relativas. Essa semelhana ajuda-
r na construo de todos os histogramas em uma nica planilha.
O primeiro passo a preparao da planilha Histogramas Exemplo 2.1, includa na pasta Captulo 2,
contendo a amostra e as quatro tabelas de frequncias calculadas na mesma planilha. Para facilitar a prepa-
rao dessa planilha, pode-se fazer uma cpia da planilha Construo Histograma e, depois, construir as
trs tabelas de frequncias restantes, a partir da tabela de frequncias absolutas. Por ltimo, os ttulos de-
vem ser adequados, mantendo o grfico de frequncias absolutas. Uma alternativa de construo do histo-
grama de frequncias relativas repetir o procedimento apresentado na seo anterior, assunto que deixa-
mos por sua conta. Outra forma fazer uma cpia do histograma j construdo procedendo assim:

l Selecione o histograma de frequncias absolutas e no menu Editar selecione Copiar, ou com as te-
clas Control+C, ou pressionando o cone copiar .
l Depois, selecione uma clula vazia da mesma planilha e no menu Editar, selecione Colar ou com as
teclas Control+V, ou pressionando o cone colar .
l A seguir, clique com o boto esquerdo do mouse em cima do grfico copiado para selecion-lo. Com
o cursor em cima do novo grfico, clique com o boto direito do mouse e, no menu apresentado, se-
lecione Dados de origem.
52 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l Na caixa de dilogo Dados de origem apresentada pelo Excel:


l Selecione a pgina Intervalo de dados. Na caixa Intervalo de dados estar selecionado o interva-
lo do grfico de frequncias absolutas. Para substituir esse intervalo com o cursor do mouse, sele-
cione o intervalo F3:F10 correspondente s frequncias relativas.
l Escolha a pgina Sequncia e, na caixa Rtulos do eixo das categorias (X), que dever estar va-
zia, com o cursor do mouse, selecione o intervalo D4:D10.
l Pressione o boto OK para concluir.

FIGURA 2.7
Histograma de
frequncias relativas
do Exemplo 2.1.

Como o nome do grfico permaneceu o mesmo do grfico copiado, ser necessrio mudar esse
nome. H dois procedimentos.

l Clicar com o boto esquerdo do mouse em cima do ttulo do histograma e selecionar a palavra que
dever ser substituda, Absolutas neste caso. A seguir, digite Relativas e, para sair, clique com o boto
esquerdo em qualquer lugar da planilha.
l Ou clicar com o boto esquerdo do mouse em cima do grfico copiado para selecion-lo e, depois,
com o cursor em cima do novo grfico, clicar com o boto direito do mouse e, no menu apresenta-
do, selecionar Opes de grfico. Na pgina Ttulo, escolher a pgina Ttulo do grfico na qual
aparece Histograma de Frequncias Absolutas. A seguir, substituir Absolutas por Relativas e pressio-
nar o boto OK.

O procedimento anterior repetido para os dois ltimos histogramas de frequncias acumuladas,


absolutas e relativas. A Figura 2.7 mostra a planilha Histogramas, Exemplo 2.1, com os quatro histo-
gramas.
Qualquer um dos histogramas poder receber modificaes; por exemplo, voc poder mudar a cor
de fundo das barras, ou a cor das prprias barras escolhendo cores nicas ou mesclas de cores:

l Para mudar a cor da rea do histograma, clique com o boto esquerdo do mouse em cima da rea do
histograma e depois com o boto direito para selecionar Formatar rea de plotagem. Na caixa de
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 53

FIGURA 2.8 Mudando a largura das barras verticais.

dilogo apresentada pelo Excel Formatar rea de plotagem na pgina Padres, possvel escolher
Borda ou rea e, dentro desta ltima, incluir efeitos de preenchimento na rea do histograma pres-
sionando o boto com o mesmo nome.
l Para mudar a cor das barras ou colunas do histograma, clique com o boto esquerdo do mouse em
cima de uma das colunas do histograma e depois com o boto direito para selecionar Formatar se-
quncia de dados. Na caixa de dilogo apresentada pelo Excel Formatar sequncia de dados na p-
gina Padres, possvel escolher Borda ou rea para mudar as cores procedendo de forma parecida
apresentada anteriormente.
l Na pgina Opes, possvel aumentar a largura das barras ou colunas. Por exemplo, pressionan-
do o boto giratrio at registrar o valor zero na caixa Largura do espaamento, consegue-se au-
mentar as barras do histograma at no ficar nenhum vazio, como mostra a Figura 2.8. Um histo-
grama sem espaos vazios entre as barras ou colunas bem aceito. Sugerimos que voc teste as
outras opes desta pgina, por exemplo, a escolha de Variar cores por pontos.

Grfico poligonal ogiva


As barras ou colunas verticais dos histogramas construdos podem ser substitudas por uma linha, re-
cebendo o nome de poligonal. Esse tipo de representao interessante no caso do histograma de fre-
quncias acumuladas. Por exemplo, a poligonal da distribuio de frequncias acumuladas do
Exemplo 2.1, que se acostuma denominar ogiva, foi construda na planilha Histogramas, Exemplo 2.1,
includa na pasta Captulo 2, procedendo como segue, Figura 2.8:

l Faa uma cpia do grfico Frequncias Acumuladas Absolutas.


Clique no grfico e depois de clicar com o boto direito do mouse selecione Tipo de grfico. Na cai-
xa Tipo de grfico, selecione a guia Tipos padro e depois, na caixa Tipo de grfico, primeiro
selecione o grfico Linha e depois selecione o grfico Linhas com marcadores exibidos a cada valor
de dado e, para terminar, pressione OK.
l O grfico construdo o apresentado na Figura 2.8 depois de mudar algumas formataes e ttulos,
como j explicado.
54 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Freqncias Acumuladas Absolutas


30
25
20
FIGURA 2.9 Poligonal
15
das frequncias
10
acumuladas. 5
0
11 12 13 14 15 16 17
Operaes fechadas

Histograma combinado
Os recursos do Excel permitem tambm construir o histograma combinado de frequncias relativas e
frequncias acumuladas absolutas, ou outra combinao adequada, como foi realizado na planilha
Histogramas Exemplo 2.1, includa na pasta Captulo 2, procedendo como segue.

l Selecione as clulas das frequncias absolutas que sero utilizados no grfico, intervalo F3:F10 e
G3:G10, incluindo o ttulo de cada coluna. Para selecionar dois intervalos ao mesmo tempo, primei-
ro selecione um dos intervalos e, a seguir, mantendo pressionada a tecla Ctrl, selecione o segundo
intervalo.
l Clique no cone assistente de grfico e siga as instrues da caixa de dilogo Assistente de grfi-
co. Na etapa 1 de 4 tipo de grfico do assistente, selecione a pgina Tipos personalizados e o tipo
de grfico Lins. Cols. em dois eixos, Figura 2.10, que mostra o grfico que ser construdo pelo
Excel.

FIGURA 2.10
Escolha de Tipo
personalizado
de grfico.

Depois de pressionar o boto Avanar, ser exibida a caixa de dilogo Assistente de grfico etapa
2 de 4 dados de origem do grfico contendo duas pginas com os nomes Intervalo de dados e Se-
quncia.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 55

l Na guia Intervalo de dados, dever estar selecionado Colunas e, na caixa Intervalo de dados, apare-
cer o endereo do intervalo previamente selecionado com a referncia do nome da planilha da pas-
ta, neste caso, Histogramas Exemplo 2.1.
l Selecione a guia Sequncia com a construo do grfico e:
l Na caixa de listagem Sequncias, aparecero os ttulos registrados no intervalo da planilha
F3:F10 e G3:G10, os nomes Relativas e Absolutas, Figura 2.11.
l Na caixa Nome, est registrada a clula $F$3 com a referncia do nome da planilha da pasta, neste
caso, Histogramas Exemplo 2.1.
l Na caixa Valores, est registrada a frmula do intervalo da planilha F4:F10 referente ao eixo de
ordenadas ou frequncias.
l A caixa Rtulos do eixo das categorias (X) est em branco e deve ser preenchida com os dados do
intervalo D4:D10.
l A caixa Rtulos do eixo das segundas categorias (X) est em branco e deve ser preenchida, tam-
bm, com os dados do intervalo D4:D10.

Pode-se verificar que o grfico mostrado no assistente o histograma que esperamos, Figura 2.11.

FIGURA 2.11
Assistente de grfico
etapa 2 de 4 dados
de origem.

Depois de pressionar o boto Avanar, o Excel exibir a caixa de dilogo Assistente de grfico
etapa 3 de 4 opes de grfico contendo seis pginas e o grfico desenhado na prpria caixa de di-
logo. Essa etapa do assistente permitir realizar mudanas na apresentao do grfico da mesma for-
ma como j foi apresentado, porm para dois eixos de ordenadas. Tenha em mente que uma caracte-
rstica interessante dessa etapa que, conforme voc muda essas configuraes, elas aparecem no
grfico da prpria caixa de dilogo. Portanto, antes de continuar, verifique a visualizao do grfico
para certificar-se de que est como deseja. A Figura 2.12 mostra o histograma concludo depois de al-
guns ajustes, espessura da linha, aumento da largura das colunas ou barras, ajuste dos corpos das
fontes dos ttulos etc.
56 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Histogramas
30,0% 30
25,0% 25

Freqncias

Freqncias
acumuladas
absolutas
relativas
20,0% 20
FIGURA 2.12 Histograma 15,0% 15

combinado. 10,0% 10
5,0% 5
0,0% 0
11 12 13 14 15 16 17
Operaes fechadas

Histograma com dados quantitativos contnuos


Agora ser apresentada a construo do histograma de uma amostra contendo dados quantitativos
contnuos. O procedimento de construo do histograma o mesmo, o que muda a forma de preparar
os limites das classes para trabalhar corretamente com a planilha Excel. O primeiro passo a prepara-
o da planilha Histograma Exemplo 2.8, includa na pasta Captulo 2, contendo a amostra e a tabela
de frequncias absolutas e relativas calculadas na mesma planilha. Para facilitar a preparao dessa pla-
nilha, pode-se fazer uma cpia da planilha Exemplo 2.9 com o procedimento apresentado no Apndice
3 deste captulo. Depois de copiada, na nova planilha, so apagados os registros desnecessrios man-
tendo apenas as tabelas de frequncias absolutas. Vimos que, para utilizar o Excel e manter o limite
superior da classe aberto, o limite superior dever ser inferior ao limite terico, como apresentado no
Exemplo 2.9 e repetido no intervalo D3:F10 da planilha Histograma Exemplo 2.8, Figura 2.13.

FIGURA 2.13
Histograma dados
quantitativos
contnuos.

Nas duas primeiras colunas da tabela apresentada na Figura 2.13, foram registrados o limite inferior
e superior de cada classe em ordem crescente a partir da primeira classe. Como a mnima variao dos
valores da amostra uma unidade, na terceira coluna, denominada Excel, foi registrado o limite
superior de cada classe igual ao limite superior registrado na segunda coluna subtrado do valor 0,1,
com exceo da ltima classe. Para construir o histograma de frequncias absolutas, utilizamos o pro-
cedimento j apresentado utilizando as colunas Excel e Frequncias Absolutas da tabela. Analisemos o
histograma de frequncias absolutas da Figura 2.13, na qual os valores do eixo de abscissas se referem
ao limite superior de cada classe.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 57

l A barra vertical com o valor 369,9 e frequncia absoluta 6 indicam que a frequncia dos valores me-
nores ou iguais a 369,9 e maiores do que 339,9 6. Da mesma maneira, o nmero de valores maiores
ou iguais a 340 e menores do que 370 6.
l Considerando a variao mnima igual a 1 entre os valores da amostra Vendas dirias e a reduo
0,10 utilizada para definir os limites superiores das classes para construir o histograma com o Excel,
poderamos formatar a escala de abscissas sem a parte decimal e representar o histograma com os li-
mites tericos como mostra a Figura 2.14. Nesse caso, a barra vertical com o valor 370 e frequncia
absoluta 6 indicam que a frequncia dos valores menores ou iguais a 370 e maiores do que 340 seis.
l Como todos os valores da amostra esto distribudos entre o valor mnimo 280 e mximo 430, de-
ve-se entender que no h nenhum vazio entre as barras do histograma; as classes preenchem todo o
espao, como mostra a Figura 2.14.

Histograma
8
Frequncias
absolutas

6
4 FIGURA 2.14 Histograma
2 com barras mais largas.
0
310 340 370 400 430
Vendas dirias (000)

O aumento da largura das colunas do histograma da Figura 2.14 foi realizado com o procedimento j
apresentado do Excel e a seguir resumido:

l Clicando com o boto esquerdo do mouse em cima de uma barra qualquer do grfico, todas as barras
sero automaticamente selecionadas.
l Com o mouse em uma barra qualquer do grfico, pressione o boto direito do mouse e, no menu, se-
lecione Formatar sequncia de dados.
l A caixa de dilogo Formatar sequncia de dados tem seis pginas. Selecione a pgina Opes e, de-
pois, na caixa Largura do espaamento, registre o valor zero. Para finalizar, pressione o boto OK.
l Nas outras cinco caixas de dilogo, voc poder realizar outras modificaes, por exemplo, mudar a
cor das barras, do fundo do grfico etc.

Ferramenta de anlise Histograma


A partir de uma amostra registrada em uma planilha Excel, uma srie de valores de uma amostra regis-
trados em uma ou mais colunas contguas, a ferramenta de anlise Histograma retornar solues inte-
gradas das tabelas de frequncias e histogramas, registrados a partir do endereo informado pelo usu-
rio. A amostra que ser analisada com a ferramenta de anlise Histograma deve estar registrada em uma
planilha, como a de nome Ferramenta Histograma, includa na pasta Captulo 2, onde:

l No intervalo B3:B29, foram registrados os valores numricos da amostra do Exemplo 2.1, incluindo
o nome Amostra na clula B3. Os valores da amostra podem ser registrados em uma linha, uma colu-
na ou combinando linhas e colunas, contanto que sejam contguos e possveis de identific-los com
um nico intervalo.
l No intervalo D4:D10, foram registrados os valores de seleo utilizados no Exemplo 2.1, incluindo
o nome Seleo na clula D3.
58 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Para utilizar a ferramenta Histograma:5


l Depois de selecionar Anlise de dados dentro do menu Ferramentas, o Excel exibir a caixa de di-
logo Anlise de dados com todas as ferramentas de anlise disponveis, Figura 1.7 do Captulo 1.
l Escolhendo a ferramenta Histograma e depois pressionando o boto OK, ser exibida a caixa de di-
logo Histograma mostrada na Figura 2.15 depois de selecionadas algumas opes.
l Pressionando o boto Ajuda dessa caixa de dilogo, o Excel exibir a pgina Sobre a caixa de dilo-
go Histograma pertencente Ajuda do Excel.

FIGURA 2.15 Caixa de


dilogo da ferramenta
Histograma.

As informaes que devem ser registradas no quadro Entrada da caixa de dilogo da ferramenta His-
tograma so:
l Intervalo de entrada. Informar o intervalo de clulas da planilha na qual os dados esto registrados,
nesse caso, o intervalo B3:B29 que inclui a clula onde foi registrado o ttulo Amostra, ou rtulo no
Excel.
l Intervalo do bloco. A informao deste intervalo opcional, porm com resultados diferentes,
como ser mostrado. Nesse momento, foi registrado o intervalo D3:D10, que inclui a clula onde foi
registrado o ttulo Seleo.
l Se no for informado nenhum intervalo do bloco, o Excel definir os limites das classes, tendo
presente que, em qualquer caso, a ferramenta Histograma considera os limites superiores das
classes como fechados, de forma coerente com a funo FREQUNCIA.
l Rtulos. Selecionamos este item, pois os intervalos informados B3:B29 e D3:D10 incluem ttulos,
respectivamente, Amostra Seleo.
Na primeira parte do quadro Opes de sada, deve ser obrigatoriamente informado um endereo a par-
tir do qual a ferramenta Histograma registrar os resultados. H trs alternativas excludentes de informar
esse endereo, identificadas por trs botes de opo que aceitam a escolha de uma nica alternativa:
l Intervalo de sada. Os resultados sero apresentados na mesma planilha a partir da clula informa-
da, nesse caso F3. Depois de clicar com o boto esquerdo do mouse dentro da caixa correspondente,
o endereo pode ser registrado digitando F3, ou clicando com o boto esquerdo do mouse na clula
F3. Nesse caso, ser registrado o endereo com os dois cifres, $F$3. Esse endereo o da clula su-
perior esquerda da tabela de frequncias que a ferramenta construir. Tambm, o Excel automatica-
mente definir o tamanho da rea dos resultados e exibir uma mensagem se a tabela de sada estiver
prestes a substituir dados existentes.

5 Em ingls, a ferramenta HISTOGRAMA HISTOGRAM.


C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 59

l Nova planilha. Os resultados sero apresentados a partir da clula A1 de uma nova planilha da mes-
ma pasta.
l Se no for informado nenhum endereo, a ferramenta inserir uma nova planilha com o nome
Plan, seguido de um nmero sequencial. Escolhendo essa alternativa na pasta Captulo 2, a ferra-
menta inserir a planilha Plan1.
l H a alternativa de informar o nome da planilha na caixa desta alternativa. Registrando o nome Tes-
te, a ferramenta inserir na mesma pasta uma nova planilha com o nome Teste.
l Nova pasta de trabalho. Os resultados sero apresentados em uma nova pasta e a partir da clula A1
da planilha Plan1.
Em continuao, no quadro Opes de sada, h trs alternativas no excludentes de resultados
possveis, sendo possvel selecionar qualquer combinao delas, incluindo a alternativa de no selecio-
nar nenhuma. Essas selees so realizadas em trs caixas de seleo. Se no for selecionada nenhuma
das trs alternativas, a ferramenta Histograma apresentar a tabela de frequncias absolutas, em ordem
crescente de valores da amostra.
l Pareto (histograma classificado). Essa alternativa deve ser selecionada quando se deseja construir o
grfico de frequncias absolutas em ordem decrescente de valores de frequncias. O diagrama de Pa-
reto tratado com mais detalhe mais adiante neste captulo.
l Porcentagem cumulativa. Selecionando essa alternativa, a ferramenta adicionar tabela de fre-
quncias absolutas, que sempre ser construda, a coluna da tabela de frequncias acumuladas rela-
tivas.
l Resultado do grfico. Selecionando essa alternativa, a ferramenta construir o grfico das tabelas de
frequncias escolhidas. Se desejar incluir no histograma que a ferramenta construir a poligonal das
frequncias acumuladas relativas, selecione a alternativa anterior.
Depois de pressionar o boto OK, a ferramenta Histograma apresentar os resultados solicitados nas
selees realizadas, como mostra a Figura 2.16. importante destacar que o layout da planilha foi me-
lhorado, ajustando a largura de algumas colunas, mudando as dimenses do grfico, as cores, o corpo
da fonte dos ttulos etc.

FIGURA 2.16
Histograma do Exemplo
2.1 com a ferramenta
Histograma.
60 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Como escolher o intervalo de seleo


Talvez voc esteja estranhando a ltima linha Mais da coluna Seleo com frequncia zero, construda
pela ferramenta Histograma, bem como a ltima seleo Mais do histograma sem coluna. Da forma como
foi selecionado o intervalo Seleo, a ferramenta adicionou, por sua conta, o valor Mais nas tabelas de fre-
quncias e no grfico. isso a! Se for informada a tabela completa de seleo de valores, a ferramenta adi-
cionar mais um valor que denomina Mais. Para que a ferramenta de anlise Histograma construa os mes-
mos grficos que obtivemos utilizando somente os recursos da funo FREQUNCIA e os grficos do
Excel, no se deve informar o maior valor de seleo, nesse caso registrado na clula D10.
Informando o intervalo D3:D9 no Intervalo do bloco, mantendo selecionadas Porcentagem cumu-
lativa e Resultado do grfico e escolhendo a clula F25 da planilha Ferramenta Histograma para regis-
trar as tabelas de frequncias, a ferramenta Histograma apresentou os resultados mostrados na Figura
2.17. A ferramenta continua apresentando a ltima barra com Mais, porm agora se refere aos valores
superiores a 16, que, nesse exemplo, o prprio valor 17, pois o limite superior de cada classe consi-
derado fechado ou o limite superior de cada classe inclui o prprio valor registrado.

FIGURA 2.17
Grfico com
intervalo reduzido.

Sem informar o intervalo de seleo


Dissemos que a informao no Intervalo do bloco opcional, porm com resultados diferentes. Omi-
tindo apenas essa informao, a partir da linha 36, a ferramenta Histograma construir um grfico
usando critrios prprios e semelhantes aos apresentados na construo de distribuies de fre-
quncias com classes. Portanto, omitindo a informao na caixa Intervalo do bloco, mantendo selecio-
nadas Porcentagem cumulativa e Resultado do grfico e escolhendo a clula F37 da planilha Ferra-
menta Histograma para registrar as tabelas de frequncias, a ferramenta Histograma apresentou os re-
sultados a partir dessa clula, como mostrado na Figura 2.18. Como no foi informado o intervalo de
seleo, a ferramenta apresentou seus resultados de seleo na coluna de ttulo Bloco, clula F37.

FIGURA 2.18
Ferramenta Histograma,
omitindo o intervalo
de seleo.

Analisemos os resultados da Figura 2.18. A ferramenta Histograma formou seis classes construdas
como segue, concluses baseadas na observao de resultados utilizando a ferramenta Histograma.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 61

l Como a amostra tem 26 observaes, as trs frmulas apresentadas para determinao do nmero
de classes recomendam escolher cinco classes. O nmero de classes escolhido pela ferramenta de
anlise Histograma igual ao resultado de somar um ao valor cinco obtido por uma das trs frmu-
las. Entretanto, como o limite superior da primeira classe o valor mnimo da amostra, podemos
concluir que a ferramenta Histograma cria seis colunas, porm com amplitudes correspondentes a
cinco classes.
l O intervalo de variao seis, resultado da diferena entre o valor mximo observado e o mnimo,
6=17-11.
l As cinco ltimas classes tm a mesma amplitude igual a 1,20, valor obtido como resultado de divi-
dir o intervalo de variao seis pelo nmero cinco.
l O limite superior da segunda classe 12,2=11+1,2 e os limites superiores das trs classes seguintes
so obtidos de forma equivalente.
l O limite superior da sexta e ltima classe o maior valor da amostra.
Comparando o histograma da Figura 2.17 com o da Figura 2.18, a forma da distribuio de frequn-
cias do primeiro histograma representa a amostra de forma mais adequada, pois tanto o perfil da subida
quanto o da descida mais contnuo, enquanto no segundo histograma aparece um patamar constante
nos ltimos dois valores. Entendemos que as ferramentas de anlise do Excel devem ser utilizadas da
forma como foram desenvolvidas, salvo que seus resultados apresentem erros. Sugerimos que a ferra-
menta de anlise Histograma seja utilizada sem especificar o Intervalo do bloco. Voc dever analisar
se os resultados da ferramenta esto dentro de sua expectativa de aceitao. Se no for assim, lembre-se
de que o que fornece a ferramenta Histograma pode ser conseguido, como foi mostrado, com os recur-
sos das funes estatsticas e dos grficos do Excel.

Grfico de Pareto
Terminando o sculo XVIII, o economista italiano Vilfredo Pareto mostrou que 80% da terra na Itlia
pertencia a 20% da populao, confirmao socioeconmica que posteriormente teve aplicao uni-
versal.6 Por exemplo, 80% dos estoques de uma empresa so preenchidos por 20% dos produtos; 20%
dos clientes so responsveis por 80% das vendas, 80% das informaes de que os usurios precisam
esto nos primeiros 20% dos resultados das pginas de busca de Internet etc. Sobre defeitos e perdas,
verifica-se que no so muitos os fatores que realmente causam desvios indesejveis.
O que o grfico de Pareto? As barras ou colunas do histograma de frequncias absolutas so desenha-
das com os valores das observaes ordenadas de forma crescente. No grfico de Pareto, as barras ou co-
lunas do histograma de frequncias absolutas esto desenhadas com as frequncias ordenadas de forma
decrescente, primeiro a coluna de maior frequncia e por ltimo a de menor frequncia. Na planilha Gr-
fico de Pareto, includa na pasta Captulo 2, foi construdo o grfico de Pareto utilizando a ferramenta de
anlise Histograma. A Figura 2.19 mostra as tabelas e o grfico de Pareto tendo informado o intervalo de
seleo D3:D9 e selecionado as trs alternativas, Pareto, Porcentagem cumulativa e Resultado do grfi-
co. A ferramenta Histograma apresenta a tabela de frequncias absolutas, acumuladas absolutas e, em
continuao, a tabela da distribuio de Pareto absoluta e acumulada (intervalo I4:K11).

Modelo histogramas
A determinao da quantidade de classes tem um pouco do procedimento de tentativa e erro na procu-
ra da distribuio que melhor represente os valores da amostra ou varivel. Realizar esse processo de
aproximao de forma manual muito trabalhoso. O uso de planilhas do Excel diminui um pouco esse
trabalho, sobretudo com a ferramenta de anlise Histograma. Todavia, esse procedimento no prti-

6 Hitoshi Kume Mtodos Estatsticos para a Melhoria da Qualidade Editora Gente, 1993.
62 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

co, pois devem ser informados outros dados como o intervalo de seleo para construir um histograma
com outra quantidade de classes. Esses inconvenientes so eliminados no Modelo Histograma constru-
do pelo autor na pasta Modelo Histogramas, que pode ser encontrada na pgina do livro, no site da
Editora. A Figura 2.20 mostra esse modelo para uma amostra de tamanho n=1.000.

FIGURA 2.19
Grfico de Pareto
com a ferramenta
Histograma.

FIGURA 2.20 Modelo


Histogramas.

O Modelo Histogramas constri trs histogramas, frequncias absolutas, frequncias relativas e fre-
quncias relativas acumuladas, a partir das respectivas tabelas tambm construdas na planilha. Para
operar o modelo:
l Recomenda-se zerar os dados e resultados pressionando o boto Limpar Dados.
l Informe a srie de valores numricos a partir da clula B5. No h limite de tamanho da amostra, apenas
os limites impostos pela planilha Excel e a memria do microcomputador que est sendo utilizando.
l Depois de informar a amostra, pressione o boto Calcular. O modelo fornecer os resultados do in-
tervalo F5:F10 e construir as tabelas de frequncias e os histogramas. A quantidade de classes de-
terminada com a frmula k = n , utilizando a parte inteira do resultado.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 63

l Querendo testar um nmero de classes diferente do sugerido pelo modelo, deve-se, primeiro, informar o
novo valor na clula G9 e depois pressionar o boto Calcular. O modelo realizar todos os clculos e mos-
trar os novos resultados do intervalo F5:F10 e construir as tabelas de frequncias e os histogramas. Que-
rendo voltar para o clculo automtico, deve-se limpar a clula G9 e depois pressionar Calcular.
l Preste ateno aos avisos que o modelo apresenta na clula mesclada E3.

Dados qualitativos
O procedimento com dados qualitativos mais simples do que com dados quantitativos. Considere-
mos os resultados populacionais do Censo 2000 apresentados no Captulo 1. Consideremos a classi-
ficao por grandes grupos de idade no ano 2000, cuja planilha Censo 2000 da pasta Captulo 1 foi
copiada na pasta Captulo 2, mantendo o mesmo nome da planilha Censo 2000. O intervalo I3:J6 re-
gistra a populao por trs grandes grupos de idade no ano 2000, resultados ligados na mesma planilha
Censo 2000. Analisemos os grficos da Figura 2.21.

FIGURA 2.21
Populao por trs
grandes grupos de
idade, ano 2000.

l O grfico denominado Pizza representa a frequncia dos grupos de idades como setores de um cilin-
dro da pequena altura. Selecionando Opes de grfico, possvel mudar as formataes do grfico
incluindo ttulos e legendas.
l O grfico de barras verticais representa a frequncia dos grupos de idades como altura das barras. Sele-
cionando Opes de grfico, possvel mudar as formataes do grfico incluindo ttulos e legendas.
Considerando que os temas apresentados neste captulo permitiro navegar pelos tipos de grficos,
bem como alterar as formataes, deixamos por conta do leitor as tentativas de mudar os tipos dos gr-
ficos da Figura 2.21 utilizando dados qualitativos.

Problemas
Na planilha Problemas, includa na pasta Captulo 2, esto registrados problema com seus enunciados
e solues.
64 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Apndice 1
Funes estatsticas do Excel

Algumas medidas realizadas em uma amostra do resultados intermedirios de um procedimento de


clculo estatstico, por exemplo, a contagem da quantidade de dados de uma amostra, seu valor mni-
mo etc. Alguns desses resultados podem ser obtidos utilizando funes estatsticas do Excel, como
mostrado na planilha Funes estatsticas, includa na pasta Captulo 2, aplicadas na amostra do
Exemplo 2.1, Figura 2.22.
Uma caracterstica comum das funes que sero apresentadas, exceto a funo CONTAR.VAZIO,
so os 30 argumentos (nm1; nm2; ... ; nm30) utilizados para registrar os valores de intervalos. Na
apresentao da primeira funo MXIMO, ser mostrado como utilizar esses argumentos, procedi-
mentos que se repetem com as demais funes com o mesmo tipo de argumentos. As sintaxes dessas
funes estatsticas so apresentadas a seguir.

MXIMO(nm1; nm2; ... ; nm30)


A funo estatstica MXIMO7 retorna o valor mximo dos valores numricos nm1; nm2; ... ;nm30.
Cada um desses nm pode ser um intervalo de clulas de uma planilha contendo valores numricos ou
assemelhados.8 Se o nome da funo MXIMO for inserido com letras minsculas ou maisculas sem
o acento ortogrfico, o Excel aceitar e registrar a funo com letras maisculas e com o acento orto-
grfico. Por exemplo, a funo MXIMO aplicada na amostra do Exemplo 2.1 dar como resultado 17.
Para obter esse resultado, a funo MXIMO pode ser utilizada das seguintes maneiras, Figura 2.22:

l Registrando os valores da amostra em um intervalo de clulas da planilha.


l Se os valores da varivel estiverem registrados em um nico intervalo, ou intervalos contguos,
apenas ser necessrio informar um nico intervalo no argumento num1. Por exemplo, registran-
do a frmula =MXIMO(B4:C16)
l Se os valores da varivel estiverem registrados em intervalos no adjacentes, ser necessrio in-
formar o endereo de cada intervalo em cada argumento nm1; nm2; ... ; nm30. Por exemplo, na
clula F6, a frmula =MXIMO(B4:B11;B12:B16;C4:C6;C7:C16) registra trs intervalos nos trs
primeiros argumentos da funo MXIMO nm1; nm2; nm3
l Registrando os valores da amostra como matriz na prpria frmula da funo, evitando registrar os
valores da amostra em um intervalo de clulas da planilha.
l Na clula G6, os valores foram registrados em uma nica matriz:
=MXIMO({14;12;13;11;12;13;16;14;14;15;17;14;11;
13;14;15;13;12;14;13;14;13;15;16;12;12})
l Na clula G7, os valores foram registrados em quatro matrizes:
=MXIMO({14;12;13;11;12;13;16};{14;14;15;17;14};
{11;13;14;15;13;12;14;13;14;13;15;16};{12;12})

7 Em ingls, a funo MXIMO MAX.


8 Assemelhados so os intervalos definidos por nomes, clulas vazias, valores lgicos, representaes em forma de texto de nmeros,
por exemplo, VALOR("10")=10. Os argumentos que so valores de erro ou texto que no podem ser traduzidos em nmeros geram
erros.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 65

MNIMO(nm1; nm2; ... ; nm30)


A funo estatstica MNIMO9 retorna o valor mnimo dos valores numricos nm1; nm2; ... ; nm30.
Cada um desses nm pode ser um intervalo de clulas da planilha contendo valores numricos ou asse-
melhados. Se o nome da funo MNIMO for inserido com letras minsculas ou maisculas sem o
acento ortogrfico, o Excel aceitar e registrar a funo com letras maisculas e com o acento ortogr-
fico. A funo MNIMO pode ser registrada de diversas formas equivalentes s descritas na funo
MXIMO descrita anteriormente, Figura 2.22.

FIGURA 2.22 Como


utilizar as funes
de estatstica no
Exemplo 2.1.

MXIMOA(nm1; nm2; ... ; nm30)


A funo estatstica MXIMOA10 equivalente funo anterior MXIMO. A diferena est relaciona-
da com os valores registrados nos argumentos nm1; nm2; ... ;nm30 que, nesta funo, alm de n-
meros, podem ser valores lgicos e de texto, como VERDADEIRO e FALSO. Deixamos que voc pes-
quise na Ajuda do Excel.

MNIMOA(nm1; nm2; ... ; nm30)


A funo estatstica MNIMOA11 equivalente funo anterior MNIMO. A diferena est relaciona-
da com os valores registrados nos argumentos nm1; nm2; ... ;nm30 que, nesta funo, alm de n-
meros, podem ser valores lgicos e de texto, como VERDADEIRO e FALSO. Deixamos que voc pes-
quise na Ajuda do Excel.

CONT.NM(valor1; valor2; ... ; valor30)


A funo estatstica CONT.NM12 retorna a quantidade de valores numricos das observaes valor1;
valor2; ... ; valor30. Cada um dos argumentos valor pode conter ou fazer referncia a vrios tipos de da-
dos; entretanto, apenas os valores numricos sero considerados na contagem. Se o nome da funo
CONT.NM for inserido com letras minsculas ou maisculas sem o acento ortogrfico, o Excel acei-

9 Em ingls, a funo MNIMO MIN.


10 Em ingls, a funo MXIMOA MAXA.
11 Em ingls, a funo MNIMOA MINA.
12 Em ingls, a funo CONT.NM COUNT.
66 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

tar e registrar a funo com letras maisculas e com o acento ortogrfico. A funo CONT.NM
pode ser registrada de diversas formas equivalentes s descritas na funo MXIMO tratada anterior-
mente, Figura 2.22.

CONT.VALORES(valor1; valor2; ... ; valor30)


A funo estatstica CONT.VALORES13 retorna a quantidade de observaes no vazias contidas em
valor1; valor2; ... ; valor30. Cada um dos argumentos valor pode ser qualquer tipo de informao, inclu-
indo texto vazio (""), porm excluindo as clulas em branco. A funo CONT.VALORES pode ser re-
gistrada de diversas formas equivalentes s descritas na funo MXIMO tratada anteriormente, Figu-
ra 2.22.

CONTAR.VAZIO(intervalo)
A funo CONTAR.VAZIO14 retorna o nmero de clulas vazias contidas no intervalo informado. C-
lulas com frmulas que forneam um texto vazio () tambm so contadas; entretanto, clulas com
valores nulos no so contadas. Aplicando a funo CONTAR.VAZIO para, obter o nmero de clulas
vazias da srie do Exemplo 2.1 dar como resultado 0, como mostra a Figura 2.22.

Apndice 2
Fixando o endereo de clulas

Na clula E15 da planilha Funo Frequncia, foi registrada a frmula =FREQUNCIA($B$4:$B$29;D15)


que depois foi copiada at a clula D21. Se o intervalo da amostra fosse registrado sem os dois cifres em
cada endereo de clula, no teria sido possvel copiar a frmula de forma correta, pois o intervalo B4:B29
mudaria o endereo em cada clula que fosse copiada. Portanto, os cifres utilizados no intervalo fixam as
duas clulas do intervalo $B$4:$B$29, que facilitar a cpia da frmula at a clula D21. Vejamos as quatro
possibilidades de referenciar uma clula em uma frmula:

l $B$4 Tanto a linha quanto a coluna so absolutas. Se a frmula que contm essa referncia for co-
piada em qualquer clula da planilha, o endereo $B$4 permanecer inalterado.
l B$4 A linha absoluta e a coluna relativa. Se a frmula que contm essa referncia for copiada em
qualquer clula da planilha, o endereo ser alterado mantendo a linha inalterada e adotando a colu-
na da nova clula.
l $B4 A coluna absoluta e a linha relativa. Se a frmula que contm essa referncia for copiada em
qualquer clula da planilha, o endereo ser alterado mantendo a coluna inalterada e adotando a li-
nha da nova clula.
l B4 A linha relativa e a coluna relativa. Se a frmula que contm essa referncia for copiada em
qualquer clula da planilha, as duas coordenadas do endereo sero alteradas.

13 Em ingls, a funo CONT.VALORES COUNTA.


14 Em ingls, a funo CONTAR.VAZIO COUNTBLANK. Na Ajuda do Excel, a funo CONTAR.VAZIO classificada como fun-
o de informao; entretanto, no menu Inserir classificada como funo Estatstica.
C A P T U L O 2 / DESCRIO DE AMOSTRAS COM TABELAS E GRFICOS 67

A escolha do tipo de referncia de uma clula pode ser facilmente includa no endereo de uma clu-
la utilizando a tecla de funo [F4] como segue:
l Em uma clula qualquer da planilha digite, por exemplo, =E13 sem inserir a frmula na planilha.
l Depois, pressionando a tecla de funo [F4], a frmula passa a ser =$E$13; pressionando novamen-
te a tecla, obtemos =E$13, e pressionando novamente a tecla =$E13.
Esse procedimento tambm pode ser utilizado, dentro de uma frmula j construda durante sua
edio.

Apndice 3
Cpia de uma planilha

Para realizar a cpia de uma planilha na mesma ou em outra pasta proceda desta forma:
l Posicione o cursor em qualquer clula da planilha que ser copiada, por exemplo, a clula F1 da pla-
nilha Quantidade de Classes.
l No menu Editar, selecione Mover ou copiar planilha. O Excel apresentar a caixa de dilogo da Fi-
gura 2.23. Nessa caixa de dilogo foram selecionadas:
l Para pasta. Escolhemos a prpria pasta. Voc poder escolher qualquer pasta que estiver aberta
ou uma nova pasta.
l Antes da planilha. Escolhemos Exemplo 2.8. Essa escolha significa que a cpia da pasta ser po-
sicionada depois da pasta Quantidade de Classes.
l Criar uma cpia. Deve-se selecionar para copiar a planilha, pois, do contrrio, o Excel simples-
mente mover a planilha atual para a nova posio.
l Pressionando o boto OK, o Excel criar uma nova planilha idntica planilha Quantidade de Clas-
ses, porm com o nome Quantidade de Classes (2).
l Para concluir, mude o nome da planilha procedendo assim:
l Selecione a planilha Quantidade de Classes (2).
l Clique com o boto direito do mouse. No menu, selecione Renomear e, a seguir, digite o novo
nome da planilha. Como alternativa, consegue-se o mesmo efeito clicando duas vezes seguidas
em cima da guia da planilha selecionada.

FIGURA 2.23 Caixa


de Dilogo de Mover
ou copiar.
Captulo 3
MEDIDAS DE TENDNCIA
CENTRAL

P ara tentar conhecer uma ou mais caractersticas de uma populao, extramos uma amostra des-
sa populao, conforme descrito no Captulo 1. Em geral, quando o tamanho da amostra gran-
de, maior do que quinze dados, a simples inspeo das observaes no ser suficiente para obter as
caractersticas relevantes desses valores. Para facilitar a anlise e a interpretao, esses dados devem
ser organizados ou resumidos, por exemplo, em tabelas de frequncias e histogramas, como foi apre-
sentado no Captulo 2. As medidas de ordenamento e as medidas de posio so os mtodos numricos
para resumir e analisar os valores de uma srie de dados numricos, seja uma amostra ou a prpria
populao, denominados como medidas de tendncia central. No Captulo 4, sero apresentadas as
medidas de disperso.

Ordenamento de dados
Em algumas situaes, o objetivo conhecer a posio de um determinado valor numrico em relao
aos demais valores da amostra; por exemplo, qual a posio de um determinado candidato a trainee
comparando seu QI com os QIs dos outros candidatos que concorrem? O QI desse candidato baixo ou
alto? Quantos candidatos tm QI maior do que o candidato sob anlise? Ou, quo maior o QI do can-
didato? Outro exemplo, o retorno de 15% ao ano baixo ou alto quando comparado com as rentabili-
dades das aplicaes do mercado financeiro durante o mesmo perodo? Quantos retornos do mercado
financeiro so maiores do que 15%?
Para responder a perguntas desse tipo, primeiro, os valores da srie de dados devem estar ordenados
em ordem crescente ou decrescente. Depois, deve-se estabelecer um critrio que permita definir a posi-
o de um determinado valor da srie dentro da prpria srie de valores numricos.

EXEMPLO 3.1
Ordene de forma crescente os valores da amostra registrada na tabela a seguir:

31 38 19 27 24 42 32 18 43 15 39
70 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Soluo. Depois de ordenar de forma crescente os onze valores numricos da amostra, a seguir so associa-
dos os nmeros 1, 2, ..., 11 aos valores ordenados como mostra esta tabela:

Amostra 15 18 19 24 27 31 32 38 39 42 43

Ordem 1 2 3 4 5 6 7 8 9 10 11

Agora, o valor 15 tem a posio 1, o 19 a posio 3 e o 43 a posio final 11.

De forma geral, o Exemplo 3.1 mostra que os n valores numricos de uma amostra ordenada de for-
ma crescente foram associados srie dos nmeros naturais 1,2, 3, ... at n. Foi estabelecida uma rela-
o de ordem entre os valores numricos da amostra.

EXEMPLO 3.2
Determine a ordem de cada valor da amostra seguinte:

27 32 64 65 58 62 59 54 29 30 26 48 47
46 43 38 29 32 35 37 31 43 45 42 37 36

Soluo. Depois de ordenar os valores da amostra de forma crescente, foi associada a srie de nmeros 1, 2,
..., 26 aos valores como mostra a tabela seguinte.

Amostra 26 27 29 29 30 31 32 32 35 36 37 37 38

Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13

Amostra 42 43 43 45 46 47 48 54 58 59 62 64 65

Ordem 14 15 16 17 18 19 20 21 22 23 24 25 26

O procedimento de ordenamento em ordem crescente utilizado no Exemplo 3.2 foi o mesmo que o
do Exemplo 3.1. No primeiro exemplo, o trabalho manual foi facilitado pelo pequeno tamanho da
amostra. No ltimo exemplo, o ordenamento manual menos eficiente, pois mais trabalhoso e est
sujeito a erro de seleo dos valores da amostra. O comando de classificao do Excel ajudar a ordenar
sries de valores em ordem crescente ou decrescente.

EXEMPLO 3.3
Ordene de forma crescente os dados do Exemplo 3.2 utilizando o Excel.

Soluo. Primeiro, os dados da amostra do Exemplo 3.2 foram registrados na coluna B da planilha Exemplo
3.3, includa na pasta Captulo 3. A seguir, o intervalo B4:B30 foi copiado no intervalo C4:C30, adicionando
o ttulo Amostra ordenada como se pode ver na figura a seguir. O ordenamento dos valores da amostra
pode ser realizado na prpria coluna B; entretanto, a amostra foi copiada na coluna C para manter a amostra
inicial e destacar o procedimento de ordenamento do Excel.
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 71

Para ordenar a amostra da coluna C procedemos assim:

Selecione o intervalo C4:C30, incluindo o ttulo Ordenada da clula C4.


Depois de escolher Classificar no menu Dados, o Excel apresentar a caixa de dilogo que detecta outros
valores ao redor do intervalo selecionado, mostrando duas opes Expandir a seleo e Continuar com
a seleo atual; selecione esta ltima opo e depois pressione o boto Classificar....
Em vez de utilizar o menu Dados Classificar, possvel pressionar o cone para classificar em or-
dem crescente, e o cone para classificar em ordem decrescente.
Em sequncia, o Excel exibir a caixa de dilogo Classificar com as seguintes escolhas: no grupo Minha
lista tem a opo Linha de cabealho, na caixa Classificar por foi selecionado Ordenada, a opo
Crescente e o intervalo C5:C30 estar selecionado, como mostra a figura esquerda. Verifique que a clu-
la C4 foi retirada da seleo do intervalo, pois informamos que o intervalo C4:C30 contm uma linha de ca-
bealho. Essas escolhas esto de acordo com o intervalo da amostra informado.
Como teste, se no grupo Minha lista tem for selecionada a opo Nenhuma linha de cabealho,
mantendo a opo Crescente, na caixa Classificar por aparecer Coluna C e o intervalo C4:C30 esta-
r selecionado. Nesse caso, a clula C4 foi includa na seleo do intervalo, pois informamos que o inter-
valo C4:C30 no contm uma linha de cabealho.

Depois de pressionar o boto OK, os valores da amostra so ordenados de forma crescente no mesmo in-
tervalo C5:C30 da planilha, como mostra a figura direita. Para obter mais informaes sobre o comando
classificar, na ajuda do Excel, procure Classificar uma lista, onde encontrar suporte para realizar classificaes
em mais de uma coluna, classificando valores numricos ou nomes e assemelhados na ordem crescente (A at
Z ou 0 at 9) ou ordem decrescente (Z at A) ou (9 at 0).

Percentil
Os Exemplos 3.1 e 3.2 mostram o mesmo procedimento de ordenamento para duas listas de valores
numricos com quantidade de valores diferentes, sendo que h amostras com quantidades maiores de
dados. conveniente dispor de um procedimento que, mantendo o ordenamento crescente dos dados
da amostra e a associao com os nmeros naturais, tenha uma mesma medida e permita realizar com-
paraes. A Figura 3.1 mostra uma relao entre a srie de nmeros naturais 0, 1, 2, ... n no eixo de abs-
cissas com uma escala de 0% a 100% no eixo de ordenadas, sendo que 0% corresponde ao primeiro
dado da amostra ordenada de forma crescente, e 100% ao ltimo dado da amostra ordenada.
72 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Percentil
100%

FIGURA 3.1 Ordenamento p


dos n valores de uma
amostra.

0% Ordem
1 2 x n

Os valores da escala de ordenadas so denominados percentil, sendo que o menor valor do percentil
0% e o maior valor 100%; dessa maneira, qualquer dado da amostra estar sempre entre o percentil
0% e 100%, como se pode ver na Figura 3.1, na qual o valor com ordem x corresponde ao percentil p. A
relao entre as ordens dos n dados da amostra ou varivel e todos os valores de percentil entre 0% a
100% regida pela seguinte relao geomtrica:

n1 x 1
=
100% 0% p 0%

Nessa relao, n a quantidade de dados da amostra, x a ordem de um determinado dado da amos-


tra ordenada de forma crescente, e p o percentil correspondente em porcentagem. Dessa relao, ob-
temos as frmulas de p e x.
l O percentil p em porcentagem do dado da amostra ou varivel com ordem x obtido com a frmula:
x 1
p= 100%. Qual o significado do resultado p? O dado de ordem x maior do que os primei-
n1
ros p dados da amostra e, ao mesmo tempo, menor do que os restantes (1p) dados da amostra.
l Da mesma maneira, conhecido o percentil p de um dado da amostra, sua ordem x calculada com a
p
frmula: x = (n 1) + 1.
100
Resumindo, agora dispomos de uma relao entre uma escala de 0% a 100% (eixo de ordenadas) e a
srie de nmeros naturais 0, 1, 2, ... n que representam uma srie de dados quantitativos ou amostra or-
denada de forma crescente (eixo de abscissas), sendo que 0% (percentil 0%) corresponde ao primeiro
dado da amostra, e 100% (percentil 100%) corresponde ao ltimo dado da amostra.

EXEMPLO 3.4
Calcule o percentil dos dados da amostra do Exemplo 3.1.

Soluo. A partir da ordem de cada dado da amostra do Exemplo 3.1 foi calculado o percentil corresponden-
te. Por exemplo, o dado 18 tem ordem x=2 e percentil p=10%, resultado obtido com a frmula:

x 1
p= 100%
n 1
2 1
p= 100% = 10%
11 1

Repetindo esse procedimento de clculo, foi construda a tabela a seguir:

Amostra 15 18 19 24 27 31 32 38 39 42 43
Percentil 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 73

O percentil do dado 32 do Exemplo 3.4 60%. Qual o significado do resultado p=60%? O percentil
60% significa que o dado ordenado 32 maior do que os primeiros 60% dos dados ordenados de forma
crescente da amostra e, ao mesmo tempo, menor do que os demais 40% dos dados da amostra. Sem d-
vida que a quantidade exata de dados da amostra do Exemplo 3.1 facilitou o clculo do percentil de
cada dado, pois um mltiplo de 10%.

EXEMPLO 3.5
Determine a ordem do percentil 10%, 50% e 80% da amostra do Exemplo 3.1.

Soluo. Para p=50%, obtemos a ordem x=6 como resultado da frmula:


p
x = (n 1) +1
100
50
x = (11 1) + 1= 6
100

Portanto, consultando a tabela de dados ordenados do Exemplo 3.1, a posio 6 est ocupada pelo valor
31. Continuando com o exemplo:

Para p=10%, a ordem x=2, que se refere ao valor 18.


Para p=80%, a ordem x=9, que se refere ao valor 39.

Tenha em mente que h diversas formas de relacionar um conjunto de dados ordenados de forma cres-
cente com o respectivo percentil. A forma apresentada a utilizada pelas funes estatsticas do Excel.

EXEMPLO 3.6
Determine a ordem dos dados da amostra do Exemplo 3.2, depois, para cada ordem, calcule o percentil corres-
pondente e, por ltimo e a partir desse resultado, obtenha a ordem utilizando o Excel e as frmulas apresentadas.

Soluo. Primeiro foi feita uma cpia da planilha Exemplo 3.3 que recebeu o nome Exemplo 3.6. A seguir:
Na coluna D, foi registrada a ordem de cada dado ordenado da coluna C, do nmero um at o 26. Esse pre-
enchimento pode ser realizado de duas formas:
Registre os nmeros 1 e 2, respectivamente, nas clulas D5 e D6. Depois, com o mouse, selecione as duas
clulas e arraste a ala de preenchimento das clulas selecionadas at a clula D30. Essa alternativa
pode provocar mudanas das formataes de clulas que recebero a cpia dos valores.
A alternativa a seguinte: registrar o nmero 1 na clula D5, no menu Editar, selecionar Preencher e, a
seguir, Sequncia que apresentar a caixa de dilogo Sequncia, cuja figura mostrada a seguir de-
pois de preencher os dados necessrios para registrar os nmeros 1 a 26. Depois de pressionar OK, esse
comando preenche os valores solicitados. Essa alternativa tambm pode provocar mudanas das forma-
taes de clulas que recebero a cpia dos valores.
74 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Continuando, na clula E5, foi registrada a frmula =(D5-1)/($D$30 -1) que calcula o percentil do dado da
amostra com ordem igual a um. Depois, essa frmula foi copiada at a clula E30, completando o clculo do
percentil da ordem dos dados restantes da amostra.
Na coluna F, foi calculada a ordem de cada percentil registrado na coluna E. Na clula F5, foi registrada a fr-
mula: =($D$30-1)*E5+1, que, depois, foi copiada at a clula F30.
A prxima figura mostra a Planilha 3.6 depois de completar o registro das frmulas.

EXEMPLO 3.7
Continuando com os dados e resultados do Exemplo 3.2, quais os dados da amostra com percentil 50% e
77%?

Soluo. Para o percentil p=50%, obtemos a ordem x=13,50, resultado obtido com a frmula:
50
x = (26 1) + 1 = 13,50
100
Na tabela do Exemplo 3.2 ou do Exemplo 3.6 ou na planilha Excel correspondente, observa-se que no h or-
dem 13,50. Entretanto, tendo presente que na definio de percentil foi estabelecida uma relao linear com a
ordem, possvel realizar uma interpolao linear entre as ordens definidas. Dessa maneira, se para x=13 o dado
da amostra 38 e para x=14 42, a ordem x=13,50 corresponder ao dado 40=38+(4238)0,50, valor que
tambm no pertence amostra. Com o mesmo procedimento, para o percentil p=77%, obtm-se a ordem
x=20,25 e o dado correspondente 49,50=48+(5448)0,25, que tambm no pertence amostra.

EXEMPLO 3.8
Os retornos acumulados nos ltimos doze meses dos primeiros vinte fundos de investimento esto registrados
em ordem crescente na segunda coluna da tabela da figura a seguir. Nessa tabela, foi adicionada uma coluna
com a ordem dos retornos, de um a vinte. Calcule o percentil de cada retorno e, a partir dele, verifique a or-
dem desse retorno utilizando funes estatsticas do Excel.
Soluo. As funes estatsticas ORDEM.PERCENTUAL e PERCENTIL do Excel retornam, respectivamente, o
percentil e a ordem. Comecemos por conhecer as sintaxes dessas duas funes
ORDEM.PORCENTUAL(matriz; valor; nm_ decimais)
A funo estatstica ORDEM.PORCENTUAL1 retorna o percentil do argumento valor, considerando a ma-
triz ordenada de forma crescente. Se a matriz tiver valores repetidos, a funo informar o percentil do pri-
meiro valor que encontrar. O argumento nm_decimais define o nmero de casas decimais do resultado;
se omitido, o resultado ter trs casas decimais. Perceba que no ser necessrio ordenar previamente os
dados da amostra, pois a funo ORDEM.PORCENTUAL ordena os dados da amostra de forma crescente
antes de calcular.

1 Em ingls, a funo ORDEM.PORCENTUAL PERCENTRANK.


C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 75

A frmula =ORDEM.PORCENTUAL($C$4:$C$23;C4;6) foi registrada na clula D4 e depois copiada at a


clula D23. Agora, no intervalo D4:D23 est registrado o percentil de cada retorno do intervalo C4:C23. Os ci-
fres no intervalo da matriz foram adicionados para poder copiar essa frmula at o ltimo dado da amostra, e
o nmero seis de casas decimais foi para comparar esses resultados. A funo ORDEM.PORCENTUAL tambm
pode ser registrada como matriz em uma coluna da planilha:

Selecione o intervalo G4:G23.


Digite a frmula =ORDEM.PORCENTUAL(C4:C23;C4:C23;6) sem pressionar a tecla Enter.
Para inserir essa funo como matriz, pressione simultaneamente as trs teclas Ctrl + Shift + Enter; man-
tendo pressionada a tecla Ctrl, pressione e mantenha pressionada a tecla Shift e, por ltimo, pressione a
tecla Enter. Depois de pressionar as trs teclas simultaneamente, obtemos os mesmos resultados do inter-
valo D4:D23 no qual as frmulas receberam as chaves { }. As frmulas matriciais no utilizam cifres e ocu-
pam menos memria da unidade de processamento comparada a com o registro individual de frmulas.

PERCENTIL(matriz; k)
A funo estatstica PERCENTIL2 retorna o valor que divide a matriz em duas partes, uma menor do que o
argumento k e a outra maior do que k. O argumento k um valor entre 0 e 1, correspondendo respectiva-
mente a 0% e 100% da quantidade de dados da matriz. Observe que no ser necessrio ordenar previa-
mente os dados da amostra, pois a funo PERCENTIL ordenar os dados da amostra de forma crescente
antes de calcular. Nem sempre o resultado da funo percentil um valor da amostra. Por exemplo, o va-
lor correspondente ao percentil 75% da amostra do Exemplo 3.1 38,50, resultado obtido por interpola-
o linear a partir da relao linear entre a ordem e o percentil de cada valor da amostra, como vimos no
Exemplo 3.7.

A frmula =PERCENTIL($C$4:$C$23;D4) foi registrada na clula E4 e depois copiada at a clula E23.


Agora, no intervalo E4:E23 est registrado o retorno do percentil registrado no intervalo D4:D23. Os cifres no
intervalo da matriz foram adicionados para poder copiar essa frmula at o ltimo dado da amostra. A funo
PERCENTIL pode ser tambm registrada como matriz em uma coluna da planilha:

Selecione o intervalo H4:H23.


Digite a frmula =PERCENTIL(C4:C23;D4:D23) sem pressionar a tecla Enter.

2 Em ingls, a funo PERCENTIL PERCENTILE.


76 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Para inserir essa funo como matriz, pressione simultaneamente as trs teclas Ctrl + Shift + Enter. De-
pois de pressionar as trs teclas simultaneamente, obtemos os mesmos resultados do intervalo E4:E23, no
qual as frmulas receberam as chaves { }.

Outras funes estatsticas relacionadas com esse tema podem ser encontradas no Apndice 1 deste cap-
tulo.

Se o administrador de um fundo equivalente no listado na tabela afirma que o retorno acumulado


nos ltimos doze meses de seu fundo foi 30,2%, ento seu percentil p=57,9% e, consequentemente, o
retorno do seu fundo maior do que 57,9% dos primeiros fundos da tabela e menor do que os 42,1%
dos demais fundos. Observe que um fundo com retorno de 32,52% tem percentil 80%; dessa maneira, o
retorno desse fundo maior do que 80% dos fundos da amostra e menor do que os restantes 20% dos
fundos com seus retornos ordenados de forma crescente. Note que, enquanto o percentil 80% uma
medida relativa, pois somente avalia o desempenho do fundo em relao aos outros fundos, o retorno
do fundo de 32,52% uma medida absoluta. O ordenamento com percentil no representa uma escala
intervalar constante, pois trata apenas com posies de valores ordenados.

Quartil
Na relao entre a escala de 0% a 100% e a srie de nmeros naturais 0, 1, 2, ... n que representam uma
srie de dados de uma amostra ordenada de forma crescente, o primeiro dado da amostra o percentil
0%, e o ltimo dado da amostra o percentil 100%. Tambm h outras formas de definir referncias fi-
xas, por exemplo, cada 10% ou decil, ou cada 12,5% ou octil, ou cada 25% ou quartil que ser apresenta-
do a seguir. Dividindo os valores ordenados da varivel em quatro quartos iguais, obtm-se um quartil
para cada quarto definido desta forma:
l O primeiro quartil Q1 o percentil 25%. O valor da amostra do primeiro quartil Q1 maior do que
25% dos valores menores e menor do que 75% dos demais valores maiores.
l O segundo quartil3 Q2 o percentil 50%. O valor da amostra do segundo quartil Q2 maior do que
50% dos valores menores e menor do que 50% dos demais valores maiores. O segundo quartil tam-
bm a mediana que divide a rea da distribuio de frequncias em duas partes iguais a 50%.
l O terceiro quartil Q3 o percentil 75%. O valor da amostra do terceiro quartil Q3 maior do que 75%
dos valores menores e menor do que 25% dos demais valores maiores.
Da frmula do percentil, obtm-se as frmulas dos trs quartis utilizadas pelo Excel, como mostrado
a seguir.
l Conhecido o percentil p de um dado da amostra ordenada, sua ordem x calculada com a
p
frmula x = (n 1) + 1. No primeiro quartil, p=25% ou 1/4, a frmula passa a ser
100
1 n+3
x = (n 1) + 1 =
4 4
n+1
l A frmula da ordem no segundo quartil p=50% x = .
2
3n+1
l A frmula da ordem no terceiro quartil p=75% x = .
4
Se o resultado de x no for um nmero inteiro, o valor do dado da amostra ou varivel ser obtido
com interpolao linear como j apresentado.

3 A mediana divide a rea da distribuio de frequncias em duas partes iguais a 50%.


C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 77

EXEMPLO 3.9
Calcule o primeiro, segundo e terceiro quartis dos retornos do Exemplo 3.8.

Soluo. A funo estatstica QUARTIL do Excel retorna o valor do quartil informado. Comecemos por co-
nhecer a sintaxe dessa funo.
QUARTIL(matriz; quarto)
A funo estatstica QUARTIL4 retorna o dado da matriz ordenada correspondente ao argumento quarto
identificado da seguinte maneira:
Se quarto=0, a funo retornar o primeiro ou menor valor da matriz.
Se quarto=1, 2 ou 3, a funo retornar o valor da matriz correspondente e respectivamente, ao primeiro,
segundo ou terceiro quartis.
Se quarto=4, a funo retornar o ltimo ou maior valor da matriz.
Enquanto a funo QUARTIL fornece resultados de posies definidas na amostra ordenada, a funo
PERCENTIL d os resultados para qualquer posio de 0 a 1, ou 0% a 100%. No entanto, nem sempre o retor-
no da funo QUARTIL um dado da amostra.
A prxima figura mostra o clculo de todos os resultados da funo QUARTIL utilizando os retornos dos
fundos de investimento da planilha Exemplo 3.8 a partir da linha 26.

Analisemos os cinco resultados da funo estatstica QUARTIL, lembrando que nem sempre o retorno um
dado da amostra.

Os resultados da funo QUARTIL para o argumento quarto igual a zero ou quatro coincide, respectivamen-
te, com o primeiro (menor) ou ltimo (maior) dado da amostra ordenada.
O retorno do primeiro quartil 24,775%, valor que no consta na srie de retornos. Nesse caso, o valor do quartil
foi obtido com a interpolao linear 0,24775=0,2470+(0,24800,2470)(0,250,21053)/(0,263160,21053).
Os retornos do segundo e do terceiro quartil foram obtidos da mesma forma que o do segundo quartil.

Ferramenta de anlise Ordem e Percentil


A partir de uma amostra quantitativa discreta registrada em uma planilha Excel, uma srie de valores
registrados em uma ou mais colunas contguas, a ferramenta de anlise Ordem e percentil retornar, a
partir do endereo informado pelo usurio, uma tabela com a posio ordinal e percentual de cada
dado da amostra, permitindo analisar a posio relativa dos valores em um conjunto de dados.
Para utilizar a ferramenta de anlise Histograma Ordem e Percentil,5 a amostra que ser analisada
deve estar registrada em uma planilha como a Ferramenta Ordem e Percentil includa na pasta Cap-
tulo 3, sendo que:
l No intervalo B3:B29 foram registrados os valores numricos da amostra do Exemplo 3.2, incluindo
o nome Amostra na clula B3. Os valores da amostra podem ser registrados em uma linha, uma colu-
na ou combinando linhas e colunas, contanto que sejam contguos e possveis de identific-los com
um nico intervalo.

4 Em ingls, a funo QUARTIL QUARTILE.


5 Em ingls, a ferramenta ORDEM E PERCENTIL RANK AND PERCENTILE.
78 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l Selecione o intervalo B3:B29.


l Depois de selecionar Anlise de dados dentro do menu Ferramentas, o Excel apresentar a caixa de
dilogo Anlise de dados com todas as ferramentas de anlise disponveis, como mostrado na Figu-
ra 1.7 do Captulo 1 do livro.
l Escolhendo a ferramenta Ordem e percentil, depois de pressionar o boto OK, voc receber a caixa
de dilogo Ordem e percentil mostrada na Figura 3.2, depois de selecionadas algumas opes.
l Pressionando o boto Ajuda dessa caixa de dilogo, o Excel apresentar a pgina Sobre a caixa de
dilogo Ordem e percentil pertencente Ajuda do Excel.

FIGURA 3.2 Caixa de


dilogo da ferramenta
Ordem e percentil.

As informaes que devem ser registradas no quadro Entrada da caixa de dilogo da ferramenta Or-
dem e percentil so:

l Intervalo de entrada. Informe o intervalo de clulas da planilha no qual os dados esto registrados;
nesse caso, o intervalo B3:B29 que inclui a clula onde foi registrado o ttulo Amostra, ou rtulo no
Excel.
l Agrupado por. Selecionamos Colunas, pois a amostra foi registrada em uma coluna. Em geral, o
Excel selecionar automaticamente depois de ter informado o intervalo da amostra.
l Rtulos na primeira linha. Tendo escolhido Colunas no item anterior, necessariamente seleciona-
remos Rtulos na primeira linha, pois na primeira clula da srie foi includo o nome Amostra.

FIGURA 3.3
Ferramenta Ordem
e Percentil
resolvendo
o Exemplo 3.6.

No quadro Opes de sada, deve ser obrigatoriamente informado um endereo a partir do qual a
ferramenta de anlise registrar os resultados. H trs alternativas excludentes de informar esse ende-
reo, identificadas por trs botes de opo que aceitam a escolha de uma nica alternativa:
l Intervalo de sada. Os resultados sero apresentados na mesma planilha a partir da clula informa-
da, nesse caso, D3, que o endereo da clula superior esquerda da tabela de respostas que a ferra-
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 79

menta construir. Tambm, o Excel automaticamente definir o tamanho da rea dos resultados e
exibir uma mensagem se a tabela de sada estiver prestes a substituir dados existentes. Podem ser
encontradas mais informaes no Captulo 1 ou na Ajuda do Excel.
l Nova planilha. Os resultados sero apresentados a partir da clula A1 de uma nova planilha da mes-
ma pasta.
l Nova pasta de trabalho. Os resultados sero apresentados em uma nova pasta e a partir da clula A1
da planilha Plan1.

Depois de pressionar o boto OK, a ferramenta Ordem e percentil apresentar os resultados solicita-
dos nas selees realizadas, como mostra a Figura 3.3. A partir da clula D3 da planilha, a ferramenta
registra a tabela de resultados cuja anlise realizada a seguir.

l Na coluna E (Amostra) da tabela, a ferramenta registrou os dados da amostra ordenados de forma de-
crescente.
l Na coluna D (Ponto), foi registrada a posio de cada dado da coluna E registrado na coluna B. Por
exemplo, o valor 62 registrado na clula E6 tem a posio 6 (clula D6) na amostra da coluna B, ou o
valor 62 o sexto dado da amostra da coluna B, clula B9.
l Na coluna F (Ordem), foi registrada a ordem de cada dado da amostra registrada na coluna E da tabe-
la. Se na amostra h valores repetidos, a classificao manter ordem do primeiro valor no repetido.
A ordem calculada com a funo estatstica ORDEM, apresentada no Apndice 1 do Captulo 3.
l Na coluna G (Porcentagem), foi registrado o percentil de cada dado da amostra ordenada de forma
decrescente. Esses valores foram calculados com a funo estatstica ORDEM.PORCENTUAL j
apresentada.

Medidas de tendncia central


No Captulo 2, mostramos como apresentar dados numricos de forma agrupada utilizando tabelas de
frequncias e histogramas. A parte inicial deste Captulo 3 mostrou como trabalhar com as posies re-
lativas dos dados ordenados de uma amostra utilizando percentil e quartil. Os exemplos desenvolvidos
no Captulo 2 mostram que os dados tendem a se agrupar ao redor de um ponto central, mostrando a
oportunidade de definir novas medidas que podem representar toda a amostra ou varivel. A mediana
uma das medidas de tendncia central cuja definio coincide com o percentil 50%, ou o segundo quar-
til, de uma srie de dados ordenados de forma crescente. As outras medidas de tendncia central so a
moda e a mdia aritmtica ou simplesmente mdia.

Mediana
A mediana Md uma medida de tendncia central cuja definio coincide com o percentil 50%, ou o se-
gundo quartil, de uma srie de dados ordenados de forma crescente. A mediana Md um valor localiza-
do na posio central, tal que 50% dos valores so menores do que Md, e os demais 50% so maiores.

Depois de ordenar os n valores da varivel de forma crescente, a Md determinada


de acordo com o tipo do nmero n:
Se n for um nmero mpar, a Md ser o valor da varivel situado na posio (n+1)/2.
Se n for um nmero par, a Md ser igual ao resultado da diviso por dois da soma dos va-
lores das posies (n/2) e (n/2)+1. Nesse caso, a Md poder no ser um valor da varivel.
80 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Note que a quantidade de dados da amostra acima de Md igual quantidade de dados da amostra
abaixo dele, seja n par ou mpar. De outra maneira, a mediana Md divide a rea da distribuio de fre-
quncias em duas partes iguais a 50%.

EXEMPLO 3.10
Calcule a mediana da amostra do Exemplo 3.1.

Soluo. Para facilitar o trabalho, os dados da amostra so repetidos a seguir.

31 38 19 27 24 42 32 18 43 15 39

A tabela a seguir mostra os 11 valores da amostra ordenados de forma crescente, identificando o valor da
mediana dentro de um crculo.

15 18 19 24 27 31 32 38 39 42 43

Como a quantidade de dados da amostra n=11 um nmero mpar, o valor da mediana Md=31, que cor-
responde ao dado da posio 6=(11+1)/2. O mesmo resultado foi obtido com a funo MED do Excel, como
mostra a figura a seguir, referente planilha Clculo da Mediana da pasta Captulo 3.

A mediana foi obtida com a frmula =MED(B4:B14) registrada na clula E4.

MED(nm1; nm2; ... ; nm30)


A funo estatstica MED(nm1; nm2; ... ; nm30) retorna a mediana dos valores numricos nm1; nm2;
... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha contendo valores num-
ricos ou assemelhados. Nesse exemplo, a amostra do intervalo B4:B14 foi registrada no primeiro argumen-
to nm1. Mais informaes sobre essa funo e outras formas de utiliz-la esto disponveis no Apndice 1
deste captulo.

EXEMPLO 3.11
Calcule a mediana da amostra do Exemplo 3.2.

Soluo. Para facilitar o trabalho, os dados da amostra so repetidos a seguir.

27 32 64 65 58 62 59 54 29 30 26 48 47
46 43 38 29 32 35 37 31 43 45 42 37 36

A tabela a seguir mostra os 26 valores da amostra ordenados de forma crescente, identificando os valores
que fazem parte do clculo da mediana dentro de um crculo.

26 27 29 29 30 31 32 32 35 36 37 37 38
42 43 43 45 46 47 48 54 58 59 62 64 65
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 81

Como a quantidade de dados n=26 um nmero par, o valor da mediana ser igual ao resultado da diviso
por dois da soma dos valores das posies (n/2)=13 e (n/2)+1=14. O valor da mediana Md=40, resultado ob-
tido de (38+42)/2. O mesmo resultado foi obtido com a funo MED do Excel, como mostra a figura a seguir
referente planilha Clculo da Mediana da pasta Captulo 3.

Analisando os resultados dos exemplos anteriores, podemos chegar a algumas concluses interes-
santes:

l Na amostra do Exemplo 3.10, acima da Md=31, h cinco dados da amostra e, abaixo dela, tambm h
cinco dados, e a mediana um valor da amostra.
l Da mesma forma, na amostra do Exemplo 3.11, acima da Md=40, h 13 dados da amostra e, abaixo
dela, tambm h 13 dados; entretanto, a Md no um valor da amostra.
l A mediana divide a distribuio de frequncias em duas reas iguais, ou duas reas com a mesma
quantidade de valores ordenados da amostra ou varivel ou, de outra maneira, a mediana Md divide
a rea da distribuio de frequncias em duas partes iguais a 50%.
l Se o maior valor da amostra for duplicado, o valor Md no ser alterado, pois est relacionado apenas
com a ordem da srie de valores. A mediana uma medida, resistente, ela menos sensvel presen-
a de valores suspeitos, dados bastante diferentes da maioria dos dados coletados na mesma amos-
tra. A eliminao de dados suspeitos no dever afetar a mediana, o que no ocorrer com a mdia
que ser afetada.

Moda
A tabela de frequncias absolutas do Exemplo 2.1 do Captulo 2 mostra que o nmero de operaes
dirias fechadas pelo Operador B com maior frequncia da srie de dados dessa amostra 14 operaes.
Essa a medida de tendncia central denominada moda Mo, nesse exemplo Mo=14.

Moda o valor da amostra ou varivel que mais se repete; ou valor com mais
frequncia.

EXEMPLO 3.12
Calcule a moda Mo da amostra do nmero de operaes fechadas diariamente pelo Operador B do Exemplo
2.1, cujos dados repetimos.

14 12 13 11 12 13 16 14 14 15 17 14 11
13 14 15 13 12 14 13 14 13 15 16 12 12
82 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Soluo. A tabela de frequncias absolutas do Exemplo 2.1 mostra que Mo=14, o nmero de operaes di-
rias fechadas pelo Operador B com maior frequncia. O mesmo resultado foi obtido com a funo MODO do
Excel, como mostra a figura a seguir referente planilha Clculo da Moda da pasta Captulo 3.

O valor da moda foi obtido com a frmula registrada na clula C12 =MODO(B4:B10;C4:C10;D4:D10;E4:E8).

MODO(nm1; nm2; ... ; nm30)


A funo estatstica MODO(nm1; nm2; ... ; nm30) retorna a moda dos valores numricos nm1; nm2;
... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha contendo valores num-
ricos ou assemelhados. Nesse exemplo, a amostra foi registrada nos quatro primeiros argumentos nm1,
nm2, nm3 e nm4. Mais informaes sobre essa funo e outras formas de utiliz-la esto disponveis no
Apndice 1 deste captulo.

EXEMPLO 3.13
Determine a moda Mo da amostra do Exemplo 3.2.

Soluo. Para facilitar a determinao da moda, os dados ordenados de forma crescente da amostra so re-
petidos e identificados a seguir.

26 27 29 29 30 31 32 32 35 36 37 37 38
42 43 43 45 46 47 48 54 58 59 62 64 65

Na amostra da tabela apresentada detectamos quatro modas, com dois dados cada uma com reas pinta-
das, Mo=29, 32, 37 e 43. O resultado obtido com a funo MODO do Excel na planilha Clculo da Moda da
pasta Captulo 3 32.

As amostras ou variveis com valores quantitativos contnuos costumam no apresentar moda; por
exemplo, a srie das 50 maiores empresas privadas por venda mostrada no Captulo 1 no tem moda. A
amostra ou varivel com uma nica moda denominada unimodal, com duas modas bimodal etc. A
moda tambm uma medida resistente, pois est relacionada apenas com a frequncia de um ou mais
dados da amostra. Por exemplo, a mudana de um dado da amostra poder no afetar a moda Mo.

Mdia
A medida de posio mais utilizada a mdia aritmtica ou simplesmente mdia de uma amostra ou va-
rivel.
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 83

Mdia X o resultado da diviso da soma dos valores das observaes ou dados


X1 , X2 , , Xi , , X n da amostra X pela quantidade de dados n:
n
Xi 1 n
X = i =1
n
= Xi
n i =1

As caractersticas importantes da mdia so:

l A unidade de medida da mdia a mesma que a dos valores da amostra.


l O resultado da multiplicao da mdia X pela quantidade n de valores da amostra X igual soma
dos n valores da amostra.

No Apndice 3 voc encontra informaes e como utilizar o smbolo somatria .

EXEMPLO 3.14
Calcule a mdia da amostra do Exemplo 3.1.

Soluo. A mdia da amostra igual a X, resultado obtido com a frmula e tambm resolvido na planilha
Clculo da Mdia da pasta Captulo 3.

O clculo da mdia da amostra realizado de trs formas diferentes.

De forma manual, utilizando a frmula que define a mdia da amostra.


Com funes do Excel equivalentes frmula que define a mdia da amostra utilizando a frmula
=SOMA(B4:B14)/CONT.NM(B4:B14) registrada na clula E13.
SOMA(nm1; nm2; ... ; nm30)
A funo matemtica SOMA(nm1; nm2; ... ; nm30) retorna a soma dos valores numricos nm1;
nm2; ... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha contendo valo-
res numricos ou assemelhados. Mais informaes sobre essa funo e outras formas de utiliz-la esto
disponveis no Apndice 1 deste captulo.
Com a funo estatstica MDIA do Excel utilizando a frmula =MDIA(B4:B14) registrada na clula E14.
MDIA(nm1; nm2; ... ; nm30)
A funo estatstica MDIA(nm1; nm2; ... ; nm30) retorna a mdia aritmtica dos valores numricos
nm1; nm2; ... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha conten-
do valores numricos ou assemelhados. Nesse exemplo, a amostra do intervalo B4:B14 foi registrada no
primeiro argumento nm1. Se o nome da funo MDIA for inserido com letras minsculas ou maiscu-
84 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

las ou sem o acento ortogrfico, o Excel aceitar e registrar a funo com letras maisculas e com o acen-
to ortogrfico. Mais informaes sobre essa funo e outras formas de utiliz-la esto disponveis no
Apndice 1 deste captulo.

EXEMPLO 3.15
Calcule a mdia da amostra de operaes dirias fechadas pelo Operador B e explicar seu significado, Exemplo
2.1.

Soluo. Aplicando a definio de mdia da populao temos o resultado obtido com a seguinte frmula.

1 26 1 352
X = Xi = 26 (14 + 12 +  + 12) = 26
26 i =1

X = 13,54

Qual o significado da mdia igual a 13,54?

A mdia tem a mesma unidade de medida que os valores da amostra.


A mdia 13,54 a quantidade equivalente de operaes fechadas diariamente pelo operador B, pois o resul-
tado da multiplicao da mdia pelo nmero 26 igual a 352, a soma dos 26 valores da varivel.

Propriedades da mdia
A mdia a medida de posio mais utilizada porque tem propriedades importantes, como as que sero
apresentadas. Para mostrar essas propriedades, necessitamos utilizar algumas expresses matemti-
cas. Suponha uma amostra ou varivel X com n dados ou observaes, no necessariamente ordenados,
e identificados pela sequncia de valores X 1 , X 2 , , X i , , X n , onde X 1 o primeiro dado, X 2 o se-
gundo dado, X i um dado qualquer da amostra, e assim sucessivamente at o ltimo dado X n . Deno-
mina-se desvio de um dado Xi de uma amostra o resultado da diferena entre Xi e a mdia X da amostra X.
Em termos matemticos = X i X .

Primeira propriedade
A soma dos desvios de uma amostra ou varivel sempre igual a zero.

n
(X i X ) = 0
i =1

Essa propriedade til para verificar ou confirmar o resultado do clculo da mdia de uma amostra
ou varivel, como tambm no desenvolvimento de provas matemticas que apresentam a soma de des-
vios com relao mdia. A primeira propriedade da mdia tambm pode ser utilizada para determinar
a mdia de uma amostra, como mostra o Exemplo 3.16.

EXEMPLO 3.16
Determine o valor da mdia da amostra do Exemplo 3.1 aplicando a primeira propriedade da mdia e utilizan-
do o Excel.

Soluo. No intervalo B3:B14 da planilha Mdia com Atingir Meta, includa na pasta Captulo 3, foi re-
gistrada a amostra do Exemplo 3.1. Depois foram adicionados os registros mostrados na prxima figura.
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 85

Na clula E5 ser determinado o valor da mdia da amostra.


Na clula C4 foi registrada a frmula =B4-$E$5 que calcula o desvio do dado da amostra registrado na clula
B4 com relao mdia registrada na clula E5. Depois essa frmula foi copiada at a clula C14.
Na clula C15 foi registrada a frmula =SOMA(C4:C14) que retorna a soma de todos os desvios.

Pela primeira propriedade da mdia, verificamos que o valor 10 registrado na clula E5 no o valor da m-
dia da amostra, pois a soma dos desvios diferente de zero. Da forma como foi preparada a planilha, podere-
mos encontrar o valor da mdia de forma manual, registrando diferentes valores na clula E5 at conseguir ze-
rar o valor da clula E5, procedimento trabalhoso e cansativo. Essa resposta pode ser encontrada rapidamente
utilizando o comando Atingir Meta da seguinte forma:

Posicione o cursor do Excel na clula C15.


No menu Ferramentas do Excel, selecione Atingir meta. Ser exibida a caixa de dilogo Atingir meta.
Nessa caixa de dilogo, informe os dados, como mostra a figura a seguir.
Definir clula. Nessa caixa registrado o endereo da clula que contm a frmula cujo resultado ser
definido na caixa seguinte. Posicionando o cursor do Excel na clula C15, nessa caixa aparecer esse en-
dereo. A clula C15 deve obrigatoriamente conter uma frmula.
Para valor. Nessa caixa, registramos o resultado desejado na clula C15 endereo definido em Definir
clula, nesse caso o valor 0. Para acessar a caixa Para valor, basta pressionar a tecla Tab ou clicar na
caixa.
Alternando clula. Nessa caixa registrado o endereo da clula que dever ser alterada para que a c-
lula C15 atinja o valor desejado 0, ou o endereo da clula que contm o valor que se deseja ajustar. Esse
dado pode ser registrado, depois de posicionar o cursor nesta caixa, clicando na prpria clula E5, ou di-
gitando o endereo da clula E5 na prpria caixa.
Depois de completar as informaes, clique em OK, e o comando Atingir Meta inicia o processo de busca da
86 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

soluo desejada. Concludo o processo de busca, o Excel apresentar a caixa de dilogo Status do
comando atingir meta, informando que foi encontrada uma soluo, o Valor de destino 0 registrado na
caixa Para valor e o Valor atual encontrado na clula C15.

Segunda propriedade
A soma dos quadrados dos desvios com relao prpria mdia de uma varivel ou amostra sempre
um valor mnimo.
n
(X i X ) 2 mnimo
i =1

No Captulo 4 ser mostrado como medir a variabilidade dos dados de uma amostra utilizando os
desvios dos dados com relao mdia, onde a soma dos quadrados dos desvios utilizada na definio
de varincia.

Visualizao das propriedades


No caminho ficou a pergunta: qual o significado de mnimo? A resposta est, inicialmente, na prpria
declarao da propriedade. Que a soma dos quadrados dos desvios com relao mdia da prpria va-
rivel ou amostra seja um valor mnimo significa que se os desvios fossem calculados com relao a
qualquer outro valor diferente da mdia da amostra, a nova soma dos quadrados dos desvios seria
maior do que a primeira. Demonstra-se que somente a prpria mdia da amostra ou varivel satisfaz
condio de mnimo, como se pode ver no Apndice 3 deste captulo. Tambm h a possibilidade de
compreender essa propriedade de forma visual com a planilha Visualizao Propriedades includa na
pasta Captulo 3, como mostra a Figura 3.4, utilizando a amostra do Exemplo 3.1.

l No intervalo B5:B15 foi registrada a amostra do Exemplo 3.1.


l Na clula D26 foi calculada e registrada a verdadeira mdia da amostra utilizando a funo estatsti-
ca MDIA.
l No intervalo D21:D24, foi includo o controle giratrio , recurso disponvel no Excel para au-
mentar ou diminuir o valor da clula D17, as possveis mdias da amostra. Para aumentar o valor do
parmetro da clula D17, clique na seta para cima do controle e, para diminuir, clique na seta para
baixo.
l No intervalo C5:C15, foram calculados os desvios dos valores da amostra com relao ao valor regis-
trado na clula D17. A soma dos desvios foi registrada na clula D18.
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 87

l No intervalo D5:D15 foram calculados os quadrados dos desvios cuja soma foi registrada na clula
D19.

Na planilha, foram construdos dois grficos que permitem visualizar o que ocorre quando informa-
mos valores arbitrrios da mdia da amostra. No primeiro grfico, Ajuste manual do valor da Mdia, cli-
cando na seta para cima ou na seta para baixo do controle giratrio, a reta se desloca no sentido vertical
do grfico. Esse ajuste pode ser visualizado de duas formas:

l O primeiro procedimento comparar os comprimentos das retas tracejados verticais entre os pon-
tos acima e os pontos abaixo da reta horizontal, que representa a possvel mdia da amostra. Consi-
derando positivos os comprimentos dos valores situados acima da reta horizontal, e negativos os va-
lores abaixo da mesma reta, a soma desses comprimentos tem de ser igual a zero, de acordo com a
primeira propriedade.
l O segundo procedimento acompanhar a variao do valor da soma dos quadrados dos desvios re-
gistrada na clula D19.
O segundo grfico, Soma quadrado dos desvios Vs. Mdias, mostra a parbola dos valores da soma dos
quadrados dos desvios para diversos valores arbitrrios da mdia. O valor de mdia registrado na clula

FIGURA 3.4
Visualizao
das propriedades
da mdia.

D17 destacado nessa parbola, facilitando a compreenso do procedimento de procura do mnimo.


Resumindo, ao clicar na seta para cima ou na seta para baixo do controle giratrio, um novo valor arbi-
trrio de mdia registrado, a reta do primeiro grfico se desloca na vertical, o ponto que representa o
novo valor arbitrrio de mdia se desloca na parbola e os valores dos desvios mudam, intervalo
D18:D19. Uma reta horizontal de espessura fina localizada na parte inferior da parbola a tangente
curva no ponto de mnimo.
88 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Anlise do resultado da mdia


Analisando o procedimento de clculo da mdia, pode-se concluir que:
l Todos os valores da varivel so includos no clculo da mdia.
l A mdia um valor nico.
l A mdia est posicionada de forma equilibrada entre os valores ordenados da amostra. De outra ma-
neira, os valores da amostra se distribuem ao redor da mdia. Os grficos da planilha Visualizao
Propriedades ajudam a compreender o que descrevemos.
l A mdia no uma medida resistente, como a mediana ou a moda, pois ela sensvel presena de
dados suspeitos ou extremos; dados com valores bastante diferentes da maioria dos dados coletados
na mesma amostra. Nesse caso, a mdia ser uma medida distorcida da tendncia dos valores da
amostra, como mostra o Exemplo 3.17. Ao mesmo tempo, a eliminao de dados suspeitos dever
tambm afetar a mdia.
l Nas amostras ou variveis com histograma simtrico, os valores da mediana, a moda e a mdia, coin-
cidem, seus valores so iguais. Sugerimos que voc tenha em mente essa representao ao analisar a
formao da mdia e as variaes ou disperses dos valores da varivel ao redor da mdia, tema que
ser apresentado no Captulo 4.
Voc deve ter percebido que alguns termos foram utilizados como sinnimos, ou quase. Por exem-
plo, dados e observaes, amostra e varivel etc. Poucas vezes nos referimos amostra e populao
como sinnimos, embora o procedimento de clculo e o resultado da mdia, e apenas ela, sejam os
mesmos. Entretanto, no caso de populao e amostra deve-se manter essa separao para identificar a
origem das variveis, pois:
l Parmetros so as medidas numricas de uma populao, identificados com letras gregas, para a
mdia e para o desvio padro (tema do prximo captulo).
l Estatsticas so as medidas numricas de uma amostra, identificadas com letras do nosso alfabeto, X
para a mdia e S para o desvio padro.

Mdia da populao X o resultado da diviso da soma dos valores


X1 , X2 , , Xi , , X n da varivel X pela quantidade de valores N:
N
Xi 1 N
X = i =1
N
= Xi
N i =1

EXEMPLO 3.17
A tabela a seguir registra uma amostra ordenada de 28 retornos de diversos investimentos no mesmo perodo.
Analise a mdia dessa amostra e detecte dados suspeitos.

2,1% 10,1% 10,6% 16,3% 16,3% 20,4% 21,0%


23,6% 24,7% 24,8% 26,2% 26,6% 27,0% 27,8%
28,6% 30,2% 30,3% 30,7% 32,0% 32,5% 32,6%
34,3% 35,5% 36,7% 52,9% 59,5% 76,2% 114,7%

Soluo. Na planilha Exemplo 3.17 includa na pasta Captulo 3, foram calculadas a mediana e a mdia
dos retornos de diversos investimentos no mesmo perodo, respectivamente, Md = 28,17% e X=32,31%. Ana-
lisando a srie de retornos desses diversos investimentos ordenados verificamos que:
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 89

A srie de retornos tem valores extremos, por exemplo, o primeiro retorno igual a 2,1% e o ltimo igual a
+114,7%. Recalculando a mdia sem considerar os dois valores extremos, temos X=30,27%, retorno mais
prximo da mediana.
Recalculando a mdia sem considerar o penltimo valor da srie 76,2%, temos X=28,44%, prximo da me-
diana.

Anlise das medidas de tendncia central


Embora mdia, mediana e moda sejam medidas importantes de tendncia central por serem fceis de
serem obtidas e teis para obter informaes sobre uma amostra, elas devem ser utilizadas de acordo
com a anlise desejada. Analisemos, primeiro, as principais vantagens e desvantagens dessas medidas.

MODA
Vantagens Desvantagens

Fcil de calcular. Pode estar afastada do centro dos dados.

No afetada pelos dados extremos da amostra. Difcil de incluir em funes matemticas.

Pode ser aplicada em qualquer escala: nominal, No utiliza todos os dados da amostra.
ordinal, intervalar e proporcional.

A amostra pode ter mais de uma moda.

Algumas amostras podem no ter moda.

MEDIANA
Vantagens Desvantagens

Fcil de calcular. Difcil de incluir em funes matemticas.

No afetada pelos dados extremos da amostra. No utiliza todos os dados da amostra.

um valor nico.

Pode ser aplicada nas escalas: ordinal, intervalar e


proporcional.

MDIA
Vantagens Desvantagens

Fcil de compreender e aplicar. afetada pelos dados extremos da amostra.

Utiliza todos os dados da amostra. necessrio conhecer todos os dados da amostra.

um valor nico.

Fcil de incluir em funes matemticas.

Pode ser aplicada nas escalas: intervalar e proporcional.

Agora comparemos os valores dessas medidas em trs formas diferentes do contorno de uma distri-
buio de frequncias de uma amostra ou varivel. A distribuio da esquerda da Figura 3.5 mostra
uma distribuio de frequncias simtrica ao redor da mdia. Na distribuio simtrica de frequncias,
os valores de mdia, mediana e moda coincidem. As outras duas distribuies da Figura 3.5 no so si-
90 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

mtricas, e as medidas de tendncia central tm posies relativas diferentes entre si, antecipando a
forma da distribuio de frequncias da amostra ou varivel:

l Na figura do meio a distribuio tem inclinao para a direita, simplesmente inclinao direita ou po-
sitiva. A moda est na posio do pico da distribuio, e a mediana, que divide a distribuio em duas
reas iguais, situa-se direita da moda, pois a distribuio tem inclinao para a cauda direita.
Como a mdia uma medida afetada pelos dados extremos da amostra, ela estar situada direita da
mediana. Utilizando os valores das medidas, verifica-se a seguinte relao Mdia > Mediana > Moda.
Como nem sempre uma amostra ou varivel ter moda, a anlise da forma de distribuio poder ser
realizada com as outras duas medidas, Mdia > Mediana. Ou seja, se a mdia maior do que a media-
na, a distribuio deve ter inclinao para a direita.
l De forma equivalente, na distribuio da direita da Figura 3.5, a distribuio tem inclinao para a
esquerda, simplesmente inclinao esquerda ou negativa. A moda est na posio do pico da distri-
buio, e a mediana, que divide a distribuio em duas reas iguais, est situada esquerda da moda,
pois a distribuio tem inclinao para a cauda esquerda. Como a mdia uma medida afetada pelos
dados extremos da amostra, ela estar situada esquerda da mediana. Utilizando os valores das me-
didas, verifica-se a seguinte relao Mdia < Mediana < Moda. Como nem sempre uma amostra ou va-
rivel ter moda, a anlise da forma de distribuio poder ser realizada com as outras duas medidas,
Mdia < Mediana. Ou seja, se a mdia menor do que a mediana, a distribuio deve ter inclinao
esquerda.

Simtrica Inclinao direita Inclinao esquerda


FIGURA 3.5
Distribuies de
Moda Mediana Mediana Moda
frequncias,
Mdia Mdia
simtrica
e inclinada.
Moda=Mediana=Mdia

Qual das trs medidas de tendncia central utilizar? A escolha da medida depende da aplicao.

l Quando procuramos conhecer valores totais, ser utilizada a mdia. Por exemplo, em controle de
qualidade, a mdia utilizada para determinar se o processo opera ao redor de um valor esperado ou
alvo. D-se preferncia mdia pelas suas propriedades matemticas.
l Se a amostra apresentar valores extremos, uma distribuio com acentuada inclinao, a mediana
ser mais adequada, pois no afetada pelos dados extremos, como a mdia. Se quisermos conhecer
o valor tpico dos salrios de uma determinada categoria de trabalhadores, ser utilizada a mediana.
Por exemplo, se os salrios pesquisados da categoria so $500, $1.800, $2.000, $2.200 e $2.500, a
mediana $2.000 e a mdia $1.800. Portanto, o valor da mdia tende na direo dos valores extre-
mos e a mediana no afetada por esses valores extremos.
l A moda um valor tpico de uma amostra ou varivel. Por exemplo, na distribuio do consumo de
um mesmo produto com diferentes apresentaes, a moda mostra a apresentao mais consumida,
como o caso do nmero de calados, o tamanho de calas etc.

Mdia ponderada
O clculo da mdia de uma amostra realizado com todos os dados da amostra. Todos os dados rece-
bem a mesma importncia ou o mesmo peso; eles tm uma distribuio uniforme e discreta. Contudo,
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 91

os valores repetidos poderiam ser agrupados como mostra o clculo da mdia do Exemplo 3.15 que re-
petimos.

1
X= (2 11 + 5 12 + 6 13 + 7 14 + 3 15 + 2 16 + 1 17 )
26

Realizando a operao indicada nessa expresso:

2 5 6 7 3 2 1
X= 11 + 12 + 13 + 14 + 15 + 16 + 17
26 26 26 26 26 26 26

X = 0,0769 11 + 0,1923 12 + 0,2308 13 + 0,2692 14 +  + 0,0385 17

X = 13,54

O agrupamento dos dados repetidos formam a mdia ponderada, que a distribuio de frequncias
relativas de X, veja Exemplo 2.4 do Captulo 2.

A mdia ponderada X da amostra ou varivel X obtida com:


n
w i Xi
i =1
X = n
wi
i =1

Nessa expresso, X i o dado repetido e wi seu peso ou frequncia.

Algumas concluses importantes:

l O clculo da mdia ponderada um caso particular do clculo da mdia aritmtica.


l Os pesos formam a distribuio de frequncias relativas da varivel.
l No clculo da mdia aritmtica, a quantidade de dados da varivel conhecida; entretanto, no caso
da mdia ponderada, a quantidade de valores da varivel no explcita.
l Uma vantagem do procedimento da mdia ponderada poder definir os pesos de cada dado numa
previso, lembrando que a soma dos pesos deve ser sempre igual a um ou 100%.

EXEMPLO 3.18
O capital da empresa foi captado de trs fontes, aes, financiamentos de longo prazo e debntures, cada um
com seu prprio custo definido por uma taxa anual de juros. O objetivo calcular o custo mdio ponderado
do capital captado pela empresa, considerando as informaes na tabela a seguir:

Capital da empresa Participao Taxa de juros


Acionistas $1.000.000 12%
Financiamentos $600.000 8%
Debntures $400.000 14%
92 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Soluo. O capital da empresa $2.000.000, obtido como resultado da soma dos trs capitais. O custo m-
dio anual CM do capital da empresa 11,20%.
3
w i Xi
CM = i =1
3
wi
i =1

1000000
. . 12% + 600000
. 8% + 400000
. 14%
CM = = 1120
, %
1000000
. . + 600000
. + 400000
.

Na planilha Exemplo 3.18, includa na pasta Captulo 3, so apresentadas outras formas de clculo utili-
zando diversos recursos do Excel.

O resultado do custo mdio de capital CM foi obtido da seguinte forma:

Na clula C8, foi registrada a frmula =B4*C4+B5*C5+B6*C6


Na clula C11, foi registrada =SOMARPRODUTO(B4:B6;C4:C6)6.
Na clula C14, foi registrada a frmula =SOMA(B4:B6*C4:C6), inserida como matriz.
A frmula =MATRIZ.MULT(C17:E17;B18:B20)7 foi registrada na clula E20.

Problemas
Problema 1
Determine a quantidade de valores e os valores mnimo e mximo da amostra:

5 7 3 4 2 8 9 12

R: n=8, Mnimo=2 e Mximo=12

6 Em ingls, a funo SOMARPRODUTO SUMPRODUCT.


7 Em ingls, a funo MATRIZ.MULT MMULT.
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 93

Problema 2
Continuando com o Problema 1, determine a ordem e o percentil do valor 7.
R: Ordem=5 e Percentil=57,1%

Problema 3
Continuando com o Problema 1, qual o valor da amostra com percentil 85,7%?
R: Valor=9

Problema 4
Continuando com o Exemplo 3.2, determine o percentil das observaes cujas ordens so x=1, 4, 10 e 22.
R: p=0%, 12% e 84%.

Problema 5
Continuando com o Problema 4, qual o valor da amostra com p=32%?
R: x=9.

Problema 6
Repita os Problemas 1, 2 e 3 considerando a amostra a seguir: voc escolhe o valor do segundo.

15 16 12 18 22 21 17 16
12 16 18 21 19 18 16

Problema 7
Continuando com o Problema 6, quais os valores do primeiro quartil, do segundo quartil e do terceiro
quartil?
R: Q1=16; Q2=17 e Q3=18,50

Problema 8
Calcule os quartis da amostra registrada na prxima tabela.

10 15 14 23 21 18 11 12 14 15 23 12 15

R: Q1=12 Q2=15 e Q3=18

Problema 9
Continuando com o Problema 8, qual o percentil do valor 15?
R: p(15)=50%

Problema 10
Continuando com o Problema 8, qual o percentil dos valores 10 e 21?
R: p(10)=0% e p(21)=83%

Problema 11
Continuando com o Problema 8, qual o valor com percentil 35% e 63%?
R: X(p=35%)=14 e X(p=63%)=15

Problema 12
A tabela a seguir registra uma amostra do nmero de gerentes operacionais que respondem diretamen-
te a um diretor em empresas do ramo qumico. Calcule:
94 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

a. Os quartis da amostra.
b. Quais os percentis dos valores 8 e 11?
c. Quais os valores com percentis 40% e 75%?

7 7 9 8 7 13 10 14 8 9 8 6
9 9 10 11 7 8 9 6 8 11 12 10

R: a) Q1=7,75 Q2=9 e Q3=9,75 b) p(8)=26% e p(11)=82%


c) (p=40%)=8 e X(p=75%)=10

Problema 13
A tabela a seguir registra os retornos das aplicaes mais tradicionais do mercado financeiro. Calcule a
ordem e o percentil de cada retorno.

Ouro 1,74%

Inflao 0,10%

Curto prazo 0,52%

Dlar paralelo 0,87%

CDB para <$5.000 1,15%

Caderneta de poupana 1,16%

FRF 30 dias 1,30%

FRF 60 dias 1,49%

CDB para >$100.000 1,58%

Bolsa RJ 2,12%

Bolsa SP 2,99%

Problema 14
Continuando com o Problema 13. No mesmo ms, o retorno do produto financeiro FourA foi 1,85% ao
ms. Qual o percentil do retorno 1,85%? Explique o significado desse percentil.
R: O produto FourA tem percentil p=83,3%. O retorno desse produto maior do que os 83,3% primei-
ros retornos da tabela, e menor do que os 16,7% restantes.

Problema 15
Continuando com o Problema 13. Para que o gerente de produtos do Banco possa afirmar que o retorno de
fundo TREAL maior do que os 75% primeiros produtos da tabela, qual deve ser o retorno desse produto?
R: 1,54% ao ms

Problema 16
A tabela seguinte registra o salrio bruto mensal dos operadores de oito empresas do mesmo ramo.
Qual o percentil e o significado do salrio $1.050?

$1.250 $980 $1.050 $1.165 $1.175 $1.220 $1.100 $1.050

R: p=14,0%
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 95

Problema 17
Continuando com o Problema 16. Quando Carlos reivindicou aumento de salrio o chefe afirmou que
nada podia fazer, pois seu salrio est entre o segundo e o terceiro quartis de sua categoria. Qual deve
ser o salrio de Carlos?
R: O salrio de Carlos est no intervalo de $1.132,50 (Q2) at $1.186,30 (Q3).

Problema 18
Calcular a mdia da varivel do Exemplo 3.2 considerada como populao.
R: =42,11

Problema 19
Calcule a mdia, a moda e a mediana da amostra registrada na tabela seguinte.

10 15 14 23 21 18 11 12 14 15 23 12 18 16 15

R: X =15,62 Mo=15 e Md=15

Problema 20
Calcule a mdia, a moda e a mediana das notas finais da Turma C da disciplina Estatstica registradas na
tabela a seguir.

89,5 74,7 99,4 84,9 96,5 82,1 77,7 92,7 59,1 74,7 91,0 100,0 77,6 98,5 2,2 60,8
83,1 20,1 84,2 70,1 90,8 97,5 78,2 31,7 98,1 99,0 94,3 73,4 85,7 94,1 61,0 77,8

R: X=78,1 Mo=74,7 e Md=83,7

Problema 21
Calcule a mdia, a moda e a mediana da srie de dados do Problema 13.
R: X=1,05% Mo=No tem e Md=1,16%

Problema 22
Calcule a mdia, a moda e a mediana dos dados da relao das 50 maiores empresas listadas na pasta
Captulo 1.
R: X =$2.550,5 Mo=No tem e Md=$2.119,7

Problema 23
A tabela a seguir registra o lucro bruto em $milhares no primeiro trimestre do ano dos vinte maiores
hotis. Calcular a mdia, a moda e a mediana do lucro.

619,7 475,5 356,5 338,5 336 310,5 258 223 209,7 198,4

190,5 189,3 176,9 162,4 155,5 155,5 149 143 141,9 136,6

R: X=$246,3 Mo=$155,5 e Md=$194,5

Problema 24
Continuando com o Problema 23, calcule os trs quartis.
R: Q1=$155,5 Q2=$194,5 Q3=$316,9
96 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problema 25
Com os resultados do Problema 23, explique a forma da distribuio do lucro bruto dos vinte maiores
hotis.
R: Como os resultados do Problema 23 verificam a condio >Md, a distribuio do lucro tem inclina-
o positiva.

Problema 26
O hotel TRI no participa do grupo de hotis do Problema 23. Se no mesmo perodo o lucro bruto foi
igual a $190, determine o percentil do lucro dessa empresa e explique o significado desse valor.
R: O lucro da empresa TRI tem percentil p=45%; portanto, o lucro da empresa maior do que as 45%
primeiras empresas listadas em ordem crescente de lucro, e menor do que as 55% demais empresas
listadas.

Problema 27
Continuando com o Problema 23. Para que seja possvel afirmar que o lucro bruto de um hotel foi
maior do que o lucro das 60% primeiras empresas listadas, qual dever ser o lucro desse hotel?
R: Lucro=$215,1 milhares

Problema 28
Mensalmente a empresa fabrica 40 lotes de 100.000 parafusos cada um. Ao escolher uma amostra
aleatria de oito lotes, o controle de qualidade verificou o seguinte nmero de parafusos com defeito
em cada lote:

1 2 3 4 5 6 7 8

300 550 480 980 1.050 350 450 870

Estime o nmero de parafusos com defeito em um ms de trabalho.


R: A mdia de defeitos 628,75 parafusos por lote, isto , 0,62875% de cada lote de 100.000 parafusos.
Como durante um ms de produo sero produzidos 4.000.000 de parafusos, a projeo mensal do
nmero de parafusos com defeitos ser igual a 25.150 por ms.

Problema 29
A revista de negcios de maior circulao informou que os salrios anuais de seus leitores tm mdia de
$2.200.000 e mediana $800.000.
a. Desenhe a distribuio de frequncias dos salrios anuais dos leitores.
b. Explique a forma dessa curva.

Problema 30
Na empresa de contabilidade trabalham sete funcionrios e o dono da empresa. No ano passado, o ren-
dimento anual dos dois contadores seniores foi de $60.000 cada um e dos cinco contadores juniores foi
de $25.000 cada um. Se o rendimento anual do dono da empresa de contabilidade foi $255.000:
a. Calcule a mdia, a moda e a mediana dos rendimentos anuais.
b. Desenhe a curva da distribuio das frequncias dos rendimentos anuais e explique sua forma.
R: Mdia=R$62.500 e Mediana=R$25.000
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 97

Problema 31
As duas tabelas seguintes registram a remunerao total dos executivos das empresas brasileiras in-
cluindo o salrio fixo, a remunerao varivel e os seguintes benefcios quantificados: assistncia m-
dica, assistncia odontolgica, automvel, previdncia privada e alimentao.8

Empresas com faturamento mensal acima de $100 milhes

Presidente Dir. financeiro Dir. comercial Dir. industrial Dir. de RH Dir. marketing

Primeiro quartil $30.911 $18.973 $14.750 $15.084 $13.944 $12.703

Mediana $37.328 $20.521 $17.974 $19.991 $15.235 $18.026

Terceiro quartil $40.538 $21.663 $20.116 $20.638 $19.118 $18.582

Empresas com faturamento mensal entre $25 e $100 milhes

Presidente Dir. financeiro Dir. comercial Dir. industrial Dir. de RH Dir. marketing

Primeiro quartil $25.998 $13.305 $12.746 $13.523 -- $11.250

Mediana $29.654 $15.225 $14.762 $13.940 -- $12.765

Terceiro quartil $31.282 $18.026 $15.801 $15.902 -- $16.579

Analise os resultados registrados acima e responda s seguintes perguntas:


a. Que percentagem dos entrevistados de cada categoria pesquisada se encontram entre o primeiro e o
terceiro quartis?
b. Por que o intervalo entre a mediana e o primeiro quartil de remunerao da categoria Presidente
diferente do intervalo entre o terceiro quartil e a mediana? Explique essa diferena.
c. Repita a comparao anterior com as outras categorias.
d. Apresente os resultados das empresas com faturamento mensal acima de $100 milhes em um gr-
fico e analise sua forma.

Problema 32
A rede de restaurantes AQUIeAGORA, especializada em almoos pelo sistema refeio por quilo, tem 30
lojas distribudas em diversos bairros de So Paulo, todas com o mesmo padro e capacidade de atendi-
mento. A tabela a seguir apresenta o nmero de refeies servidas pelas 30 lojas em um dia tpico.

290 243 295 275 216 253

266 232 256 224 252 298

316 247 234 278 270 280

226 233 298 278 266 278

252 269 239 325 240 295

Pede-se realizar uma anlise dos dados, considerando que a experincia no gerenciamento desse tipo
de negcio mostra que o ponto de equilbrio de uma loja de 250 refeies por dia.

8 Revista Exame de 15/12/1999 de uma pesquisa da consultoria Arthur Andersen.


98 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Apndice 1
Funes de procura e ordenamento
do Excel

O clculo das medidas de ordenamento utilizando o Excel pode ser realizado utilizando expresses
matemticas e procedimentos combinados com os recursos da planilha, as funes estatsticas e a fer-
ramenta de anlise Ordem e Percentil do Excel. Na planilha Funes de Ordenamento, includa na pas-
ta Captulo 3, est registrada a utilizao de cada funo utilizando a amostra do Exemplo 3.1, como se
pode ver na Figura 3.6. As sintaxes dessas funes estatsticas so apresentadas a seguir.

CORRESP(valor; matriz; tipo)


A funo de procura e referncia CORRESP9 retorna a posio relativa do argumento valor especifica-
do no argumento matriz de valores em uma ordem especfica. A procura realizada conforme o argu-
mento tipo:

l Se tipo=1, ento a funo CORRESP selecionar o menor valor da matriz que for maior ou igual ao
valor em uma matriz previamente ordenada de forma decrescente.
l Se tipo=0, ento a funo CORRESP selecionar o primeiro valor da matriz que for exatamente igual
ao valor especificado, sem necessidade de a matriz estar ordenada.
l Se tipo=1, ento a funo CORRESP selecionar o maior valor da matriz que for menor ou igual ao
valor especificado, em uma matriz previamente ordenada de forma crescente.

A funo CORRESP parecida com as funes PROCV e PROCH com a diferena de retornar a posi-
o de um valor em um intervalo em vez do valor propriamente dito. O argumento matriz pode ser in-
formado como um intervalo de clulas no qual foi registrada previamente a amostra, por exemplo, o in-
tervalo B4:B14 da Figura 3.6; ou pode ser informado declarando todos os valores da amostra
{31;38;19;27;24;42;32;18;43;15;39}.

ORDEM(valor; amostra; ordem)


A funo estatstica ORDEM10 retorna a posio do argumento valor da amostra, considerando a ordem
informada:

l Se ordem for igual a 0 ou omitida, os valores da amostra sero classificados em ordem decrescente.
l Se ordem for diferente de 0, igual a 1, os valores da amostra sero classificados em ordem crescente.

Se o argumento amostra tiver valores repetidos, a funo ORDEM informar a posio do primeiro
valor que encontrar na sua procura, considerando o ordenamento escolhido.

9 Em ingls, a funo CORRESP MATCH.


10 Em ingls, a funo ORDEM RANK.
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 99

ORDEM.PORCENTUAL( matriz; valor; nm_ decimais)


A funo estatstica ORDEM.PORCENTUAL11 retorna o percentil do argumento valor, considerando a
matriz ordenada de forma crescente. Se a matriz tiver valores repetidos, a funo informar o percentil
do primeiro valor que encontrar. O argumento nm_decimais define o nmero de casas decimais do re-
sultado; se for omitido, o resultado ter trs casas decimais. O argumento matriz pode ser informado
em qualquer ordem, pois a funo ORDEM.PORCENTUAL ordena os valores da amostra de forma
crescente antes de calcular. O argumento matriz pode ser informado como um intervalo de clulas
onde previamente foi registrada a amostra, por exemplo, o intervalo B4:B14 da Figura 3.6; ou pode ser
informado declarando todos os valores da amostra {31;38;19;27;24;42;32;18;43;15;39}.

PERCENTIL(matriz; k)
A funo estatstica PERCENTIL12 retorna o valor que divide a matriz em duas partes, uma menor do
que o argumento k e a outra maior do que k. O argumento k um valor entre 0 e 1,0% e 100%, ou o valor
do percentil em que a matriz ordenada ser dividida. A funo PERCENTIL ordena os valores da ma-
triz de forma crescente antes de calcular. Nem sempre o resultado da funo percentil um valor da
amostra. O argumento matriz pode ser informado como um intervalo de clulas no qual previamente
foi registrada a amostra, por exemplo, o intervalo B4:B14 da Figura 3.6; ou pode ser informado como
{31;38;19;27;24;42;32;18;43;15;39}, declarando todos os valores da amostra.

QUARTIL(matriz; quarto)
A funo estatstica QUARTIL13 retorna o valor da matriz correspondente ao argumento quarto identi-
ficado da seguinte maneira:

l Se quarto=0, a funo retornar o primeiro ou menor valor da matriz.


l Se quarto=1, 2 ou 3, a funo retornar o valor da matriz correspondente e, respectivamente, ao pri-
meiro, segundo ou terceiro quartil.
l Se quarto=4, a funo retornar o ltimo ou maior valor da matriz.

A funo QUARTIL ordena os valores da matriz de forma crescente antes de calcular. Enquanto a fun-
o QUARTIL fornece resultados de posies definidas na amostra ordenada, a funo PERCENTIL re-
torna os resultados para qualquer posio de 0 a 1, ou 0% a 100%. No entanto, nem sempre o retorno da
funo QUARTIL um dado da amostra. O argumento matriz pode ser informado como um intervalo de
clulas no qual previamente foi registrada a amostra, por exemplo, o intervalo B4:B14 da Figura 3.6; ou
pode ser informado declarando todos os valores da amostra {31;38;19;27;24;42;32;18;43;15;39}.

MENOR(matriz; k-simo)
A funo estatstica MENOR14 retorna o k-simo menor valor da matriz ordenada de forma crescente.
Para uma mesma matriz, o resultado dessa funo depender do valor do argumento k-simo:

l Se k-simo=1, ento o menor valor ser o primeiro valor da matriz ordenada de forma crescente.
l Se k-simo=2, ento o menor valor ser o segundo valor da matriz ordenada de forma crescente e as-
sim sucessivamente, at o ltimo valor da matriz.

11 Em ingls, a funo ORDEM.PORCENTUAL PERCENTRANK.


12 Em ingls, a funo PERCENTIL PERCENTILE.
13 Em ingls, a funo QUARTIL QUARTILE.
14 Em ingls, a funo MENOR SMALL.
100 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

FIGURA 3.6 Como


utilizar as funes de
ordenamento.

Na funo MENOR, no necessrio informar a srie ordenada de forma crescente. O argumento


matriz pode ser informado como um intervalo de clulas no qual previamente foi registrada a amostra,
por exemplo, o intervalo B4:B14 da Figura 3.6; ou pode ser informado declarando todos os valores da
amostra {31;38;19;27;24;42;32;18;43;15;39}.

MAIOR(matriz; k-simo)
A funo estatstica MAIOR15 d o k-simo maior valor da matriz ordenada de forma crescente. Para
uma mesma matriz, o resultado dessa funo depender do valor do argumento k-simo:

l Se k-simo=1, ento o maior valor da matriz ser o ltimo valor da matriz ordenada de forma cres-
cente.
l Se k-simo=2, ento o maior valor da matriz ser o penltimo valor da matriz e assim sucessivamen-
te, at o primeiro valor da matriz.

O argumento matriz pode ser informado como um intervalo de clulas no qual previamente foi re-
gistrada a amostra, por exemplo, o intervalo B4:B14 da Figura 3.6; ou pode ser informado declarando
todos os valores da amostra {31;38;19;27;24;42;32;18;43;15;39}. Na funo MAIOR, no necessrio
informar a srie ordenada de forma crescente.

15 Em ingls, a funo MAIOR LARGE.


C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 101

Apndice 2
O smbolo somatrio

Suponha uma amostra ou varivel X com n dados ou observaes identificados pela sequncia de valo-
res X 1 , X 2 , , X i , , X n , onde X1 o primeiro dado, X2 o segundo dado, Xi um dado qualquer da
amostra, e assim sucessivamente, at o ltimo dado Xn.
A soma desses valores representada com X 1 + X 2 +  + X i +  + X n se pode expressar simbolica-
n n
mente com X i , pois X i = X 1 + X 2 +  + X i +  + X n . A letra grega , sigma maiscula, indica
i =1 i =1
que devem ser somadas expresses da forma Xi comeando com i=1 at i=n.
4
Outro exemplo: a expresso simblica da soma R = 21 + 2 2 + 23 + 2 4 R = X i =21 + 2 2 + 23 + 2 4 .
i =1
Vejamos algumas propriedades de interesse, tendo presente que as propriedades se aplicam sempre
nos dois sentidos da igualdade.

l O resultado de somar n vezes a constante c o resultado do produto de n vezes a constante c. Com o


n
smbolo somatrio c = n c.
i =1
l Se cada valor da sequncia X 1 , X 2 , , X i , , X n for multiplicado pela constante c, o resultado dessa
n n
soma ser cX i = c X i .
i =1 i =1
l A soma algbrica das sequncias X 1 , X 2 , , X i , , X n e Y1 , Y 2 , , Y i , , Y n
n n n
(X i Yi ) = X i Yi . H casos em que as propriedades anteriores do somatrio so combi-
i =1 i =1 i =1
n n n n n
nadas (cX i + Y 2 i ) = cX i + Y 2 i = c X i + Y 2 i .
i =1 i =1 i =1 i =1 i =1
l Somatrios mltiplos. A seguinte expresso formada por trs somatrios.
3 3 3 3 3
X i , j = X i ,1 + X i , 2 + X i ,3
i =1 j =1 i =1 i =1 i =1

Essa expresso desenvolvida :


3 3
X i , j = X 1,1 + X 1, 2 + X 1,3 + X 2 ,1 + X 2 , 2 + X 2 ,3 + X 3,1 + X 3, 2 + X 3,3
i =1 j =1

Essas expresses representam a soma dos dados da seguinte tabela, onde i representa a linha e j a co-
luna.

X1,1 X1,2 X1,3

X2,1 X2,2 X2,3

X3,1 X3,2 X3,3


102 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Apndice 3
Prova do mnimo da soma
dos quadrados dos desvios

Denominando o desvio como D e z a qualquer nmero possvel de ser a mdia da amostra X, a soma dos
n
quadrados dos desvios ser medida com a expresso D = ( X i z) 2 . Para calcular o mnimo dessa
i =1
funo, primeiro deve-se calcular a primeira derivada da funo D.

n
D = ( X i2 2 zX i + z 2 )
i =1

dD d n 2 d n d n 2
= i dz i dz z
dz dz i =1
X 2 zX +
i =1 i =1

Depois, a primeira derivada deve ser igualada a zero.

n n
dD
= 0 2 X i + 2 z = 0
dz i =1 i =1

n
Na ltima expresso simplificada X i + nz = 0, reconhecemos que a segunda parcela a soma
i =1
n
Xi
i =1
dos dados da amostra. O valor de z o prprio valor da amostra de X j definido como z = . O va-
n
lor encontrado realmente um mnimo, pois sua segunda derivada positiva, como mostrado a seguir:

d2D d2 n

= X i + 2nz
2
dz 2 dz 2 i =1

d2D
= 2n > 0
dz 2
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 103

Apndice 4
Funes de tendncia
central do Excel

O clculo das medidas de tendncia central utilizando o Excel pode ser realizado utilizando expresses
matemticas e procedimentos combinados com os recursos da planilha e funes estatsticas. Na plani-
lha Funes de Tendncia Central, includa na pasta Captulo 3, est registrada a utilizao de cada
funo utilizando a amostra do Exemplo 3.15, como se pode ver na Figura 3.7. Uma caracterstica co-
mum das funes a seguir, exceto a funo MDIA.INTERNA, so os 30 argumentos (nm1; nm2; ... ;
nm30) utilizados para registrar os valores de intervalos. Na apresentao da primeira funo SOMA,
ser mostrado como utilizar esses argumentos, procedimentos que se repetem com as demais funes
com o mesmo tipo de argumentos. As sintaxes dessas funes estatsticas so apresentadas a seguir.

SOMA(nm1; nm2; ... ; nm30)


A funo matemtica SOMA16 retorna a soma dos valores numricos nm1; nm2; ... ; nm30. Cada um
desses nm pode ser um intervalo de clulas de uma planilha contendo valores numricos ou asseme-
lhados.17 Por exemplo, a funo SOMA aplicada aos valores da amostra do Exemplo 3.15 d como re-
sultado 352. Para obter esse resultado, a funo SOMA pode ser utilizada das seguintes maneiras, Figu-
ra 3.7:

l Registrando os valores da amostra em um intervalo de clulas da planilha.


l Se os valores da varivel estiverem registrados em um nico intervalo, ou intervalos contguos,
apenas ser necessrio informar um nico intervalo no argumento num1. Por exemplo, na clula
F6 foi registrada a frmula =SOMA(B4:C17), Figura 3.7.
l Se os valores da varivel estiverem registrados em intervalos no adjacentes, ser necessrio in-
formar o endereo de cada intervalo no lugar de cada nm de nm1; nm2; ... ; nm30, at um m-
ximo de 30. Por exemplo, a frmula =SOMA(B4:C8;B9:B17;C9:C15) registrada na clula F7 tem
trs intervalos nos trs primeiros argumentos da funo SOMA nm1; nm2; nm3.
l Registrando os valores da amostra como matriz na prpria frmula da funo, evitando registrar os
valores da amostra em um intervalo de clulas da planilha.
l Na clula G6, os valores foram registrados em uma nica matriz:
=SOMA({14;12;13;11;12;13;16;14;14;15;17;14;11;13;14;15;
13;12;14;13;14;13;15;16;12;12})
l Na clula G7, os valores foram registrados em quatro matrizes:
=SOMA({14;12;13;11};{12;13;16;14;14;15;17;14;11;13};
{14;15;13;12;14;13;14;13;15};{16;12;12})
correspondentes aos quatro primeiros argumentos da funo SOMA nm1; nm2; nm3; nm4.

16 Em ingls, a funo SOMA SUM.


17 Assemelhados so os intervalos definidos por nomes, valores lgicos, representaes em forma de texto de nmeros; por exem-
plo, com a funo de texto VALOR("10")=10.
104 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

MDIA(nm1; nm2; ... ; nm30)


A funo estatstica MDIA18 retorna a mdia aritmtica dos valores numricos nm1; nm2; ... ;
nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha contendo valores num-
ricos ou assemelhados. Um detalhe importante: se o nome da funo MDIA for inserido com letras
minsculas ou maisculas sem o acento ortogrfico, o Excel aceitar e registrar a funo com letras
maisculas e com o acento ortogrfico. A funo MDIA pode ser registrada de diversas formas equi-
valentes s descritas na funo SOMA menciona anteriormente, Figura 3.7.

MDIAA(nm1; nm2; ... ; nm30)


A funo estatstica MEDIAA19 equivalente funo anterior MDIA. A diferena est relacionada
com os valores registrados nos argumentos nm1; nm2; ... ; nm30 que, nesta funo, alm de nme-
ros, podem ser valores lgicos e de texto, como VERDADEIRO e FALSO. Deixamos para o leitor pes-
quisar na Ajuda do Excel.

FIGURA 3.7 Como


utilizar as funes de
tendncia central.

MED(nm1; nm2; ... ; nm30)


A funo estatstica MED20 retorna a mediana dos valores numricos nm1; nm2; ... ; nm30. Cada um
dos nm pode ser um intervalo de clulas de uma planilha contendo valores numricos ou assemelha-
dos. A funo MED pode ser registrada de diversas formas equivalentes s descritas na funo SOMA
anteriormente, Figura 3.7.

MODO(nm1; nm2; ... ; nm30)


A funo estatstica MODO21 retorna o modo dos valores numricos nm1; nm2; ... ; nm30. Cada um
desses nm pode ser um intervalo de clulas de uma planilha que contm valores numricos ou asseme-

18 Em ingls, a funo MDIA AVERAGE.


19 Em ingls, a funo MEDIAA AVERAGEA.
20 Em ingls, a funo MED MEDIAN.
21 Em ingls, a funo MODO MODE.
C A P T U L O 3 / MEDIDAS DE TENDNCIA CENTRAL 105

lhados. Quando a srie tem mais de uma moda, a funo reconhece apenas uma delas. A funo MOD
pode ser registrada de diversas formas equivalentes s descritas na funo SOMA anteriormente, Figu-
ra 3.7.

MDIA.GEOMTRICA(nm1; nm2; ... ; nm30)


A funo estatstica MDIA.GEOMTRICA22 retorna a mdia geomtrica dos valores da amostra. Cada
um dos nm pode ser um intervalo de clulas de uma planilha que contm valores numricos ou asse-
melhados. A mdia geomtrica Mg definida como Mg = ( X 1 X 2  X n )1 n com os valores Xi mai-
ores do que zero. Comparando com a mdia aritmtica:

l A mdia geomtrica menos afetada por valores extremos.


l A mdia geomtrica uma medida mais central quando os valores da varivel apresentam uma taxa
constante de crescimento.
l Para um mesmo grupo de valores, a mdia geomtrica sempre menor do que a mdia aritmtica.

A funo MDIA.GEOMTRICA pode ser registrada de diversas formas equivalentes s descritas na


funo SOMA anteriormente, Figura 3.7. Uma aplicao frequente da mdia geomtrica o clculo da
taxa equivalente de juros de uma operao financeira formada por n operaes com taxas de juros dife-
rentes, como mostrado no Captulo 16, utilizando a frmula:

(
Mg = (1 + i1 ) (1 + i2 )  (1 + in )1 n )
i = Mg 1

MDIA.HARMNICA(nm1; nm2; ... ; nm30)


A funo estatstica MDIA.HARMNICA23 retorna a mdia harmnica dos valores da amostra. Cada
um dos nm pode ser um intervalo de clulas de uma planilha que contm valores numricos ou asse-
melhados. A mdia harmnica uma medida til quando os valores se referem a mudanas de uma mag-
nitude, e seu valor sempre menor do que o da mdia geomtrica do mesmo conjunto de valores.
1
l A mdia harmnica a inversa da mdia aritmtica das inversas dos valores da amostra: Mh = .
1 n 1

n i =1 X i
l De outra maneira, a inversa da mdia harmnica Mh a mdia da inversa dos valores da amostra:
1 1 n 1
= .
Mh n i =1 X i

A funo MDIA.HARMNICA pode ser registrada de diversas formas equivalentes s descritas na


funo SOMA anteriormente, Figura 3.7.

MDIA.INTERNA(matriz; porcentagem)
A funo estatstica MDIA.INTERNA24 retorna a mdia aritmtica da matriz de valores, tendo previa-
mente excludo, de ambos extremos da matriz, uma porcentagem de valores informada como valor uni-
trio. uma mdia reduzida til para remover dados extremos, suspeitos, de uma amostra.

22 Em ingls, MDIA.GEOMTRICA GEOMEAN.


23 Em ingls, MDIA.HARMNICA HARMEAN.
24 Em ingls, MDIA.INTERNA TRIMMEAN.
Captulo 4
MEDIDAS DE DISPERSO

N o Captulo 3, foi mostrado que a mdia e a mediana determinam um valor central de uma amostra
ou varivel. Enquanto a mediana localiza a posio do dado ou observao situada no centro da
amostra ordenada de forma crescente, e sem considerar os valores da varivel, a mdia determina o va-
lor central considerando todos os valores da varivel. Por exemplo, as amostras X={28, 29, 30, 31, 32} e
Y={21, 25, 29, 34, 41} tm o mesmo nmero de dados e, tambm, a mesma mdia 30. Entretanto, os
desvios so diferentes, pois os desvios da varivel X so 2, 1, 0, 1 e 2, e os desvios da varivel Y so 9,
5, 1, 4 e 11. A comparao dessas duas amostras aponta a variabilidade ou disperso de seus dados
com relao mdia como uma medida importante para descrever uma amostra ou varivel. Esse ra-
ciocnio poderia ser repetido em variveis com medianas iguais, porm com menor aplicao do que a
mdia.
Voc deve ter em mente que, se no houver variabilidade, a maior parte das medidas estatsticas
no teria utilidade. H vrias formas de medir a variabilidade dos dados de uma varivel. Uma pri-
meira tentativa medir o intervalo ou range de variao, definido como o resultado da diferena
entre os valores mximo e mnimo da amostra ou varivel, como apresentado no Exemplo 2.1 do
Captulo 2.

EXEMPLO 4.1
Determine o intervalo de variao da seguinte amostra:

31 38 19 27 24 42 32 18 43 15 39

Soluo. Os valores mnimo e mximo so, respectivamente, 15 e 43. O intervalo ou range de variao dos
dados da amostra 28=4315.

O resultado do Exemplo 4.1 mostra que os dados da amostra se distribuem dentro do intervalo de
variao igual a 28. O conhecimento desse intervalo no auxilia muito na tentativa de medir a disper-
so dos dados da varivel, pois seu clculo envolve apenas os valores extremos, deixando de considerar
os demais valores da varivel que tambm so importantes.
108 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Desvio absoluto mdio


No Captulo 3, vimos que os desvios dos dados de uma amostra ou varivel medem sua disperso ao re-
dor de sua mdia. Portanto, a tentativa inicial de quantificar a variabilidade seria calcular a soma de to-
n
dos os desvios, isto ( X i X ). No entanto, pela primeira propriedade da mdia, a soma dos desvios
i =1
sempre igual a zero. Tentando manter o conceito desvio como medida de variabilidade, pode-se utili-
zar a mdia dos valores absolutos1 dos desvios, procedimento denominado desvio absoluto mdio ou
simplesmente DAM.2

O Desvio absoluto mdio-DAM obtido da expresso:

DAM =
1
n
(
| X1 X | + | X2 X | +  + | X n X | )
1 n
DAM = | Xi X |
n i =1

onde X i um valor genrico e X a mdia da varivel ou amostra.

EXEMPLO 4.2
Calcule o desvio absoluto mdio da amostra do Exemplo 4.1.

Soluo. A resposta foi obtida na planilha Exemplo 4.2, includa na pasta Captulo 4, como mostra a figura
a seguir.
No intervalo B4:B14 foi registrada a amostra.
Na clula G5, foi calculada a mdia da amostra com =MDIA(B4:B14), retornando o valor 29,82.
Na clula C6 foi calculado o desvio do dado 31 da amostra registrando a frmula =B4-$G$5, retornando o
valor 1,18. Depois, essa frmula foi copiada at a clula C14.
O valor de mdia que mostra a clula G5 29,82, valor arredondado com duas casas decimais. Entretan-
to, o valor exato e registrado na memria do Excel 29,8181818181818. Ao mesmo tempo, no clculo
dos desvios, o Excel utiliza o valor exato da mdia. Portanto, voc poder encontrar diferenas entre o re-
sultado final do DAM obtido manualmente com a mdia e os desvios arredondados e o obtido com o
Excel sem arredondar nenhum resultado intermedirio.
Na clula D4, foi calculado o valor absoluto do desvio do dado 31, calculado na clula C4, registrando a fr-
mula =ABS(C4) que retornou o valor 1,18. Depois essa frmula foi copiada at a clula D14.
Em vez de utilizar duas colunas para calcular o desvio absoluto, poderia ter sido utilizada uma nica co-
luna registrando na clula C4; por exemplo, a frmula combinada =ABS(B4-$G$5) que depois seria co-
piada.
A funo matemtica ABS(nmero)3 retorna o valor absoluto do argumento nmero que pode ser qual-
quer nmero do campo real. Pode-se dizer que o valor absoluto de um nmero o prprio nmero sem o
respectivo sinal, seja positivo ou negativo.
Na clula G6 foi registrada a frmula =SOMA(D4:D14) que retorna o resultado da soma dos desvios absolu-
tos igual a 92,18.

1 O valor absoluto de um nmero o valor desse nmero considerado positivo.


2 Este procedimento apenas um registro, pois o DAM no ajuda na compreenso da disperso, nem apresenta as vantagens matem-
ticas da varincia e do desvio padro.
3 Em ingls, a funo ABS ABS.
C A P T U L O 4 / MEDIDAS DE DISPERSO 109

Com os resultados parciais obtidos, pode-se calcular o DAM=8,38:


11
| Xi X |
92,18
Manualmente a frmula DAM = i =1 = 8,38 =
11 11
Registrando a frmula =G6/CONT.NM(D4:D14) na clula G7 da planilha.

Uma forma direta de obter o resultado desejado utilizar a funo estatstica DESV.MDIO do Excel que retorna o
desvio absoluto mdio da amostra informada. Na clula G9 foi registrada a frmula =DESV.MDIO(B4:B14). No Apn-
dice 1, voc encontrar a descrio completa dessa e de outras funes que sero apresentadas neste captulo.

Comparado com a tentativa de medir a variabilidade com o intervalo, o DAM a mdia dos desvios
absolutos e utiliza todos os valores da varivel ou amostra. Entretanto, o valor absoluto dos desvios
um resultado difcil de compreender e no aceita tratamento matemtico com as propriedades, por
exemplo, do quadrado do desvio que ser utilizado a seguir.

Varincia
Mantendo os desvios para medir a variabilidade de uma varivel, o procedimento recomendado utili-
zar a soma dos quadrados dos desvios, pois seu resultado um valor mnimo, como mostrou a segunda
propriedade da mdia apresentada no Captulo 3.

Seja a varivel X = X1 , X2 , , XN uma populao. Define-se varincia 2X da varivel X


da populao contendo N dados:

2X =
1
N
(
( X1 X )2 + ( X2 X )2 +  + ( X n X )2 )
1 N
2X =
N i =1
( Xi X )2

Seja a varivel X = X1 , X2 , , X n uma amostra. Define-se a varincia S 2X da varivel X


da amostra contendo n dados:

S 2X =
1
n 1
(
( X1 X )2 + ( X2 X )2 +  + ( X n X )2 )
1 n
S 2X = ( Xi X )2
n 1 i =1
110 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

EXEMPLO 4.3
Calcule a varincia da amostra e da populao do Exemplo 4.1 utilizando as frmulas e as funes estatsticas
do Excel.

Soluo. A resposta foi obtida na planilha Exemplo 4.3, includa na pasta Captulo 4, como mostra a figura
seguinte e tendo presente as caractersticas de arredondamento dos resultados intermedirios e finais j co-
mentadas.
No intervalo B4:B14 foi registrada a amostra, na clula G4 foi calculada quantidade de dados da amostra e
na clula G5 foi calculada a mdia da amostra utilizando a frmula =MDIA(B4:B14).
No intervalo C4:C14 foram calculados os desvios e no intervalo D4:D14, os quadrados dos desvios come-
ando por registrar a frmula =C4^2 na clula D4. Depois essa frmula foi copiada at a clula D14.
Na clula G8 foi calculada e registrada a soma dos quadrados dos desvios igual a 997,64 com a frmula
=SOMA(D4:D14).
Utilizando a funo matemtica SOMAQUAD no necessrio construir a coluna dos quadrados dos des-
vios. A frmula =SOMAQUAD(C4:C14) registrada na clula G9 retorna a soma dos quadrados dos valores
registrados no intervalo C4:C14. No Apndice 1, voc encontrar a descrio completa dessa e de outras
funes que sero apresentadas.

Clculo da varincia da amostra. Com os resultados parciais obtidos, pode-se calcular o valor da varincia
da amostraS2X = 99,76, utilizando:
11
( Xi X )2
997,64
Manualmente a frmula S2X = i =1 = = 99,76
11 1 10
Registrando a frmula =G8/(G4-1) na clula G12 da planilha.
Utilizando a funo estatstica VAR, registrando a frmula =VAR(B4:B14) na clula G13.

Clculo da varincia da populao. Com os resultados parciais obtidos, pode-se calcular o valor da va-
rincia da amostra 2X = 90,69, utilizando:
11
( Xi X)2
997,64
Manualmente a frmula 2X = i =1 == 90,69
11 11
Registrando a frmula =G8/G4 na clula G16 da planilha.
Utilizando a funo estatstica VARP, registrando na clula G17 a frmula =VARP(B4:B14).
C A P T U L O 4 / MEDIDAS DE DISPERSO 111

O procedimento de clculo manual da varincia bastante trabalhoso quando comparado com a utiliza-
o das funes estatsticas do Excel; entretanto, essas funes apenas auxiliam o clculo e podem obscure-
cer o conceito. O Apndice 3 deste captulo mostra como utilizar doze funes para banco de dados ou lis-
tas de valores, conhecidas genericamente como BDfunes(banco_dados; campo; critrios). Algumas dessas
doze funes so equivalentes s apresentadas. Ademais, esse apndice apresenta tambm as funes
SUBTOTAL, CONT.SE e SOMASE teis para realizar operaes com bancos de dados ou listas de valores.

Relao entre as varincias


A partir das definies das varincias da amostra e da populao, o Exemplo 4.3 mostra os procedimen-
tos de clculo, incluindo as funes estatsticas VAR e VARP. Verifique que uma das varincias pode
ser obtida da outra se o tamanho da amostra tambm for conhecido. Para facilitar a relao entre as va-
rincias da populao e da amostra repetimos a seguir suas frmulas.

N
(X i X ) 2 = N 2X
i =1

n
(X i X ) 2 = (n 1) S X2
i =1

Como os dois primeiros membros dessas expresses so iguais, possvel igualar os dois segundos
membros, o que nos leva seguinte igualdade:

N 2X = (n 1) S X2

Portanto, conhecida uma das varincias, possvel calcular a outra, sendo necessrio tambm co-
nhecer o tamanho da amostra.

(n 1) N
2X = S X2 e S X2 = X2
N n1

EXEMPLO 4.4
Calcule a varincia da populao a partir da varincia da amostra do Exemplo 4.3, sabendo que o tamanho da
amostra 11.

Soluo. A varincia da populao 2X = 90,69 pode ser obtida com a frmula:

n 1 2
2X = SX
N
10
2X = 99,76 = 90,69
11

Em vez de tentar memorizar a frmula de transformao entre as varincias, recomenda-se ter pre-
sente a seguinte orientao:
l A varincia da amostra foi obtida como resultado da diviso da soma dos quadrados dos desvios pela
quantidade de valores da amostra (n1). Para obter o valor da varincia da populao, ser necess-
rio multiplicar a varincia da amostra por (n1) e, em sequncia, dividi-la por n.
l A varincia da amostra ser o resultado da multiplicao da varincia da populao por n e, em se-
quncia, divida-a por (n1).
112 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Caractersticas da varincia
O procedimento de clculo utilizando a soma dos quadrados dos desvios bastante trabalhoso. No
Apndice 2, mostramos um procedimento de clculo da varincia que utiliza somente os dados da
amostra e os quadrados desses dados, no sendo necessrio utilizar a mdia e os desvios. Contudo, esse
procedimento de clculo perde fora quando comparado com a utilizao das funes estatsticas do
Excel. A frmula e o resultado da varincia tm caractersticas importantes.

l A varincia sempre um nmero positivo.


l As frmulas para a amostra e para a populao tm o mesmo numerador, a soma dos quadrados dos
desvios.
l A varincia de uma varivel considerada como populao a mdia aritmtica dos quadrados dos
desvios.
l A varincia de uma varivel considerada como amostra tambm um tipo de mdia, pois a soma dos
quadrados dos desvios dividida pela quantidade de dados da varivel menos um.4
l Para a mesma amostra de tamanho n, a varincia da amostra sempre maior do que a da populao.
Na medida em que o tamanho n da amostra aumenta, para n maior do que 30, o valor da varincia da
amostra se aproxima do valor da varincia da populao.
l Da mesma forma que a mdia, a varincia afetada pelos valores extremos da varivel, ela no uma
medida resistente.
l Uma desvantagem da varincia sua unidade de medida, o quadrado da unidade de medida dos da-
dos da amostra ou varivel; outra desvantagem operar com os valores dos desvios ampliados, pois
os desvios so elevados ao quadrado.

Regras operacionais da varincia


H propriedades operacionais muito prticas. Para evitar muitos smbolos nas frmulas, as varincias
sero representadas como Var(X). Sendo a, b e c constantes, sempre se verifica:

l Se Y = a, Var(Y) = 0
l Se Y = aX, Var(Y) = a2 Var(X)
l Se Y = X + a, Var(Y) = Var(X)
l Se Y = X + Z, Var(Y) = Var(X) + Var(Z) + 2 Cov(X, Z)
l Se Y = aX + bZ, Var(Y) = a2 Var(X) + b2 Var(Z) + 2 ab Cov(X, Z)

Desvio padro
Para definir da varincia nos valemos da segunda propriedade da mdia: a soma dos quadrados dos des-
vios sempre um valor mnimo, como foi apresentado no Captulo 3. Uma desvantagem da varincia
sua unidade de medida, o quadrado da unidade de medida dos dados da amostra ou varivel; outra des-
vantagem ampliar os desvios, pois so elevados ao quadrado. Por exemplo, se a amostra do Exemplo
4.3 se refere a peas rejeitadas por lote, a unidade de medida da varincia da amostra ser 99,76 peas
rejeitadas ao quadrado, o que no faz muito sentido. Como a unidade de medida da varincia no expli-
ca nada sobre as caractersticas dos valores da amostra, definido o desvio padro que mantm a unida-
de de medida dos valores da varivel.

4 No clculo da varincia da amostra S2, deve-se dividir por (n-1) em vez de n para corrigir a tendncia de S2 subestimar 2; para que

S2 seja um estimador no viesado.


C A P T U L O 4 / MEDIDAS DE DISPERSO 113

O desvio padro da varivel X a raiz quadrada positiva de sua varincia. Dessa maneira:
O desvio padro considerado como populao : X = + 2X .
O desvio padro considerado como amostra : S X = + S 2X .

Essas definies mostram que para determinar o desvio padro necessrio conhecer o valor da va-
rincia correspondente, da amostra ou da populao.

EXEMPLO 4.4
Calcular o desvio padro da amostra e da populao do Exemplo 4.1 utilizando as frmulas e as funes esta-
tsticas do Excel.

Soluo. A resposta foi obtida na planilha Exemplo 4.4, includa na pasta Captulo 4, como mostra a figura
a seguir e tendo presente as caractersticas de arredondamento dos resultados intermedirios e finais j co-
mentadas. O registro da amostra, os clculos dos resultados intermedirios e a obteno dos valores das va-
rincias da amostra e da populao foram realizados da mesma forma como foi apresentado no Exemplo 4.3.
Esse procedimento necessrio para mostrar o clculo do desvio padro a partir de sua definio, ou a partir
do conhecimento da varincia correspondente, amostra ou populao. No entanto, esse procedimento de
clculo perde fora quando comparado com a utilizao das funes estatsticas do Excel.

Clculo do desvio padro da amostra. O valor do desvio padro da amostraSX = 9,99 pode ser obtido:
Manualmente a frmula SX = + S2X = + 99,76 = 9,99
Registrando a frmula =RAIZ(G7) na clula G11 da planilha.
A funo matemtica RAIZ(nmero)5 retorna a raiz quadrada positiva do argumento nmero que deve
ser qualquer nmero positivo.
Utilizando a funo estatstica DESVPAD ao registrar na clula G12 a frmula =DESVPAD(B4:B14).

Clculo do desvio padro da populao. O valor da desvio padro da populao X = 9,52 pode ser obtido:

Manualmente pela frmula X = + 2X = + 90,69 = 9,52


Registrando a frmula =RAIZ(G8) na clula G15 da planilha.
Utilizando a funo estatstica DESVPADP ao registrar na clula G16 a frmula =DESVPADP(B4:B14).

5 Em ingls, a funo RAIZ SQRT.


114 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Se a amostra do Exemplo 4.4 se refere quantidade mensal de peas rejeitadas, o desvio padro da
amostra ser 9,99 peas rejeitadas, pois o desvio padro tem a mesma unidade dos dados da amostra ou
varivel. Da mesma maneira, o desvio padro da populao X = + 90,69 = 9,52 peas rejeitadas. O
procedimento de clculo manual do desvio padro bastante trabalhoso quando comparado com a uti-
lizao das funes estatsticas do Excel; entretanto, essas funes apenas auxiliam o clculo e podem
obscurecer o conceito.

Relao entre os desvios padro


A partir das definies dos desvios padro da amostra e da populao, o Exemplo 4.4 mostra os proce-
dimentos de clculo, incluindo as funes estatsticas DESVPAD e DESVPADP. Nesse caso, tambm,
verifica-se que um dos desvios padro pode ser obtido do outro se o tamanho da amostra tambm for
conhecido. Em alguns casos necessrio operar com os valores do desvio padro da populao e do
desvio padro da amostra de uma varivel, tentando sempre usar uma forma prtica de obter um
valor do outro. Da mesma forma como foi mostrada a relao entre a varincia da amostra e a varincia
da populao, as expresses a seguir mostram a relao entre os desvios padro da populao e da
amostra.

n1 N
X = SX e SX = X
N n1

O procedimento recomendado para obter o valor de um desvio padro em funo do outro , pri-
meiro, realizar essa operao com as varincias equivalentes, evitando carregar uma frmula com o
smbolo de raiz quadrada. Da mesma forma que a varincia, as caractersticas do desvio padro so:

l O desvio padro sempre um nmero positivo.


l Se os dados de uma varivel forem iguais, o desvio padro ser zero.
l O desvio padro no uma medida resistente, pois afetada pelos valores extremos da varivel.

Significado do desvio padro


O desvio padro depende da soma dos quadrados dos desvios dos dados da varivel com relao a sua
mdia. Portanto, quanto menor for o desvio padro, mais os valores da varivel se aproximaro de sua
mdia. Analisando a expresso do desvio padro, podemos chegar a concluses importantes:

l Qualquer dado da amostra ou varivel com desvio menor do que o desvio padro da varivel estar
mais prximo da mdia do que qualquer outro valor com desvio maior.
l Quanto mais os dados se afastarem da mdia, maior sero os desvios e, consequentemente, maior
ser o desvio padro da varivel.
l Duas variveis com mdias iguais e desvios padro diferentes tm distribuies de frequncias com
formas diferentes. A distribuio da varivel com maior desvio padro ser mais aberta do que a da
varivel com menor desvio padro.

Qual a proporo de dados includos em um intervalo de desvios padro ao redor da mdia de uma
varivel ou amostra? O Teorema de Chebyshev d uma resposta para uma varivel com qualquer tipo de
distribuio de frequncias.
C A P T U L O 4 / MEDIDAS DE DISPERSO 115

Teorema de Chebyshev. Para qualquer conjunto de dados de uma amostra ou


populao, a proporo mnima de valores que se encontram dentro de k desvios
1
padro ao redor da mdia pelo menos igual a 1 2 , sendo k uma constante
k
maior do que 1.

A prxima tabela mostra a proporo mnima de dados dentro de k desvios padro ao redor da m-
dia. Por exemplo, 75% dos dados de uma amostra ou varivel esto distribudos no intervalo de dois
desvios padro ao redor da mdia; entre menos dois e mais dois desvios padro ao redor da mdia.

1,5 2 2,5 3 3,5 4

0,56 0,75 0,84 0,89 0,92 0,94

Outro exemplo, pelo menos sete dos onze dados da amostra do Exemplo 4.1 esto distribudos no
intervalo de dois desvios padro ao redor da mdia 29,8; isto , entre menos dois desvios padro
(9,8=29,829,99) e mais dois desvios padro (49,8=29,8+29,99) ao redor da mdia. Verifique que no
Exemplo 4.1 todos os dados esto distribudos no intervalo de dois desvios padro ao redor da mdia.

Regra prtica
Pelo teorema de Chebyshev, possvel determinar a proporo mnima de dados de uma varivel
dentro de um determinado nmero de desvios padro ao redor da mdia. A partir da mdia X e o
desvio padro SX de uma amostra ou varivel X, a Regra Prtica permite estabelecer a proporo de
valores distribudos no intervalo X k S X , considerando a forma da distribuio de frequncias
da varivel X.

Regra Prtica

A varivel X tem n dados com mdia X e desvio padro S X .


X 1 S X . Em uma distribuio simtrica com forma de sino, a porcentagem de da-
dos contidos no intervalo de um desvio padro ao redor da mdia 68%. Para uma
distribuio assimtrica com acentuada inclinao para um lado, essa porcentagem
se aproxima de 90%.
X 2 S X . Em uma distribuio simtrica com forma de sino, a porcentagem de da-
dos contidos no intervalo de dois desvios padro ao redor da mdia 95%. Para uma
distribuio assimtrica com acentuada inclinao para um lado, a porcentagem se
aproxima de 100%.
X 3 S X . Para todas as distribuies, a porcentagem de dados contidos no intervalo
de trs desvios padro ao redor da mdia ser prxima de 100%.

A Regra Prtica atende maioria das distribuies; entretanto, h casos em que ser necessrio cons-
truir o histograma para conhecer a forma da distribuio da amostra. A partir das concluses obtidas
da aplicao da Regra Prtica, ser possvel determinar a forma do histograma, da distribuio de fre-
quncias dos dados como mostra o Exemplo 4.5.
116 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

EXEMPLO 4.5
Determine a porcentagem dos dados da amostra do Exemplo 4.1 includos no intervalo de um, dois e trs des-
vios padro ao redor da mdia.
Soluo. Na planilha Exemplo 4.5, includa na pasta Captulo 4, foram determinadas as quantidades de
dados includos nos intervalos de um, dois e trs desvios padro ao redor da mdia, como mostra a figura se-
guinte.
Na clula H5, foi calculada a quantidade de dados, na clula H6, a mdia e, na clula H7, o desvio padro da
amostra utilizando as funes estatsticas correspondentes.
No intervalo H10:J11, foram calculados os valores dos limites inferiores e superiores dos intervalos de um,
dois e trs desvios padro ao redor da mdia, acompanhando a expresso X k SX cujas frmulas do pri-
meiro intervalo so as seguintes:
Com a frmula =H6-H7 registrada na clula H10, foi calculado o limite inferior do intervalo de um desvio
padro.
Com a frmula =H6+H7 registrada na clula H11, foi calculado o limite superior do intervalo de um des-
vio padro. Para os demais limites, procede-se da mesma forma, considerando o nmero de desvios pa-
dro adequados.

Com os limites estabelecidos, nas colunas do intervalo C4:E14, so selecionados os dados contidos em
cada intervalo utilizando as seguintes frmulas:

Um desvio padro ao redor da mdia, coluna C. Na clula C4 foi registrada a frmula


=SE(E(B4>=$H$10;B4<=$H$11);1;0), que depois foi copiada at a clula C14.
Dois desvios padro ao redor da mdia, coluna D. Na clula D4 foi registrada a frmula
=SE(E(B4>=$I$10;C4<=$I$11);1;0), que depois foi copiada at a clula D14.
Trs desvios padro ao redor da mdia, coluna E. Na clula E4 foi registrada a frmula
=SE(E(B4>=$J$10;D4<=$J$11);1;0), que depois foi copiada at a clula E14.

Para terminar, no intervalo H12:J12 so contados os dados contidos no intervalo de um, dois e trs desvios
padro ao redor da mdia, e no intervalo H13:J13 so calculadas as respectivas porcentagens, obtendo os se-
guintes resultados X 1 SX=73%, X 2 SX=91% e X 3 SX=100%. Portanto, 73%, 91% e 100% dos da-
dos ou observaes se distribuem, respectivamente, no intervalo de um, dois e trs desvios padro ao redor da
mdia.

Medida relativa de disperso


O desvio padro tem duas caractersticas importantes:6

6 A varincia tambm tem essas duas caractersticas.


C A P T U L O 4 / MEDIDAS DE DISPERSO 117

l Considera que os desvios se distribuem de forma homognea ao redor da mdia.


l uma medida absoluta.

A comparao da disperso de duas ou mais distribuies pelo simples confronto de seus desvios pa-
dro nem sempre suficiente, pois as amostras ou populaes podem ter unidades diferentes ou, tendo
a mesma unidade, seus valores de mdia podem estar bastante afastados.

O coeficiente de variao CV o resultado de dividir o desvio padro da varivel


pela sua mdia:
X SX
CV pop = CV amo =
X X

A medida relativa de disperso coeficiente de variao CV permite a comparao de distribuies,


pois seu resultado o desvio padro por unidade de mdia. Em alguns casos, o resultado do CV apre-
sentado multiplicado por 100, em porcentagem. Comparando duas variveis, a varivel que tiver me-
nor CV tem menor disperso ou variabilidade.

EXEMPLO 4.6
A tabela a seguir registra os retornos mensais dos investimentos A e B durante os ltimos seis meses. Interessa
conhecer qual dos dois investimentos apresentou maior disperso.

Soluo. Na planilha Exemplo 4.6, includa na pasta Captulo 4, foi resolvido o exemplo, comeando pelo
clculo das mdias e dos desvios padro dos retornos dos dois investimentos e terminando pelo clculo do co-
eficiente de variao de cada investimento.

Como o CV do investimento A maior do que o CV do investimento B, a variabilidade7 do investimento A


foi maior do que a do investimento B.

Anlise da forma da distribuio de uma amostra


Como nem todas as amostras ou variveis tm moda ou um nico valor de moda, a mediana e a mdia
so as medidas mais usuais de tendncia central. Em uma distribuio simtrica de frequncias, a m-
dia e a mediana tm o mesmo valor. Se os valores da mdia e da mediana forem diferentes, a distribui-
o ser assimtrica e quanto mais os valores da mdia e da mediana se afastarem, maior ser a inclina-

7 Em finanas, a variabilidade o risco do investimento; o investimento A apresentou mais risco do que o investimento B.
118 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

o da distribuio na direo de uma das caudas. Por exemplo, se um ou mais dados da amostra forem
valores maiores do que a maioria dos demais dados, ento a mdia ser maior do que a mediana e a dis-
tribuio de frequncias ter inclinao direita ou positiva, conforme mostra a Figura 4.1. Da mesma
forma, possvel analisar para o lado esquerdo. A inclinao de uma distribuio medida pelo coefi-
ciente de inclinao da distribuio.

FIGURA 4.1
Distribuies de
frequncias, simtrica
e inclinada. Simtrica Inclinao direita Inclinao esquerda

Apesar de duas amostras ou variveis apresentarem a mesma disperso e inclinao, essas caracte-
rsticas no sero suficientes para supor que as duas distribuies tenham a mesma forma, atributo de-
nominado curtose. A curtose medida pelo coeficiente de curtose que compara a distribuio de fre-
quncias da amostra com a distribuio normal.

EXEMPLO 4.7
A tabela a seguir registra uma amostra ordenada de 28 retornos de diversos investimentos no mesmo perodo.
Calcule e analise a forma da distribuio dessa amostra.

2,1% 10,1% 10,6% 16,3% 16,3% 20,4% 21,0%


23,6% 24,7% 24,8% 26,2% 26,6% 27,0% 27,8%
28,6% 30,2% 30,3% 30,7% 32,0% 32,5% 32,6%
34,3% 35,5% 36,7% 52,9% 59,5% 76,2% 114,7%

Soluo. Na planilha Exemplo 4.7, includa na pasta Captulo 4, foi analisada a forma da distribuio da
amostra anterior registrada no intervalo B4:C17, como mostra a figura seguinte. Analisemos os resultados re-
gistrados nessa planilha.
O histograma foi construdo utilizando a ferramenta de anlise Histograma, depois de ajustar a formata-
o do grfico, os ttulos e as escalas. O histograma mostra que a distribuio apresenta inclinao para
a direita.
No intervalo F14:F15, foram calculadas a mdia e a mediana, respectivamente iguais a 32,1% e 28,2%.
Como a mdia maior do que a mediana, a distribuio tem inclinao para a direita.
O coeficiente de inclinao igual a 2,24 foi calculado com a funo estatstica DISTORO do Excel, regis-
trando a frmula =DISTORO(B4:C17) na clula F16. O resultado positivo mostra que a distribuio tem
inclinao para a direita. Se o resultado fosse negativo, a inclinao seria negativa, e se fosse igual a zero, a
distribuio seria simtrica.
DISTORO (nm1; nm2; ... ; nm30)
A funo estatstica DISTORO (nm1; nm2; ... ; nm30) retorna o coeficiente de inclinao dos valo-
res numricos nm1; nm2; ... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma
planilha contendo valores numricos ou assemelhados. Nesse exemplo, a amostra do intervalo B4:C17
foi registrado no primeiro argumento nm1. Mais informaes sobre essa funo e outras formas de utili-
z-la esto disponveis no Apndice 1deste captulo.
C A P T U L O 4 / MEDIDAS DE DISPERSO 119

O coeficiente de curtose igual a 6,94 foi calculado com a funo estatstica CURT do Excel registrando a fr-
mula =CURT(B4:C17) na clula F17. O resultado positivo mostra que a distribuio de frequncias ser con-
centrada ao redor da mdia, distribuio com pico. Se o resultado fosse negativo, a distribuio seria acha-
tada, plana, e se fosse igual a zero, a distribuio de frequncias seria a prpria distribuio normal.
CURT (nm1; nm2; ... ; nm30)
A funo estatstica CURT (nm1; nm2; ... ; nm30) retorna o coeficiente de curtose dos valores numricos
nm1; nm2; ... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha conten-
do valores numricos ou assemelhados. Nesse exemplo, a amostra do intervalo B4:C17 foi registrada no
primeiro argumento nm1. Mais informaes sobre essa funo e outras formas de utiliz-la esto dispo-
nveis no Apndice 1 deste captulo.

Modelo anlise numrica


A determinao isolada de medidas estatsticas numricas leva obteno de respostas parciais. O conjunto
dessas medidas melhora a compreenso e a visualizao das medidas numricas em um grfico comple-
menta a anlise da amostra. Realizar esse processo de medio de forma manual muito trabalhoso; entre-
tanto, utilizando a planilha Excel, consegue-se diminuir um pouco esse trabalho. O conjunto desses resul-
tados apresentado no Modelo Anlise Numrica construdo pelo autor na pasta Modelo Anlise Numrica
que est disponvel na pgina do livro, no site da Editora. A Figura 4.2 mostra esse modelo para uma amos-
tra de tamanho n=77, incluindo o grfico que destaca as medidas numricas mais importantes.
O Modelo Anlise Numrica calcula as medidas mais importantes e constri um grfico com os dados
da amostra, os intervalos de um, dois e trs desvios padro ao redor da mdia, a identificao de uma li-
nha (no eixo de abscissas) com as cinco medidas estatsticas que ajudam a descrever a forma da distri-
buio de frequncias, e a identificao de linhas verticais da mdia e do primeiro, segundo e terceiro
quartis. Para operar o modelo:
l Recomenda-se zerar os dados da amostra diretamente na planilha.
l Informar a srie de valores numricos a partir da clula B4. No h limite de tamanho da amostra,
apenas os limites impostos pela planilha Excel e a memria do microcomputador utilizada.
l Depois de informar a amostra, pressione o boto Calcular. O modelo fornecer os resultados do in-
tervalo F4:F24 e construir ou atualizar o grfico.
l No intervalo E9:F11, possvel obter respostas especficas para um dado da amostra quanto sua
posio no intervalo E9:F9, ao seu percentil no intervalo E10:F10 e ao dado referente a um determi-
nado percentil no intervalo E11:F11.
l Preste ateno ao aviso de reclculo que o modelo apresenta na clula mesclada H2.
120 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

FIGURA 4.2 Modelo


Anlise Numrica.

Ainda, no intervalo D26:F29, no mostrado na Figura 4.2, o modelo apresenta a contagem e a pro-
poro de dados dentro de um, dois e trs desvios padro ao redor da mdia.

Ferramenta de anlise Estatstica Descritiva


A partir de uma amostra quantitativa discreta registrada em uma planilha Excel, a ferramenta de anli-
se Estatstica descritiva retornar uma tabela com um grupo de resultados estatsticos. Para utilizar a
ferramenta de anlise Estatstica descritiva,8 a amostra que ser analisada deve estar registrada em uma
planilha como a Ferram. Estatstica Descritiva, includa na pasta Captulo 4, com a amostra do Exem-
plo 4.1, onde:

l No intervalo B3:B14 foram registrados os valores numricos da amostra, incluindo o nome Amostra
na clula B3. Os valores da amostra devem ser registrados em uma coluna identificados com um ni-
co intervalo. Essa ferramenta de anlise pode gerar tabelas para mais de uma amostra simultanea-
mente com a condio de terem o mesmo tamanho e serem registradas em intervalos contguos.
l Depois de selecionar Anlise de dados dentro do menu Ferramentas, o Excel apresentar a caixa de
dilogo Anlise de dados com todas as ferramentas de anlise disponveis, como mostrado na Figu-
ra 1.7 do Captulo 1 deste livro.
l Escolhendo a ferramenta Estatstica descritiva e depois pressionando o boto OK, voc receber a cai-
xa de dilogo Estatstica descritiva mostrada na Figura 4.3 depois de selecionadas algumas opes.
l Pressionando o boto Ajuda dessa caixa de dilogo, o Excel apresentar a pgina Sobre a caixa de
dilogo Estatstica descritiva pertencente Ajuda do Excel.
As informaes que devem ser registradas no quadro Entrada da caixa de dilogo da ferramenta
Estatstica descritiva so, conforme apresentado na Figura 4.3:
l Intervalo de entrada: Informe o intervalo de clulas da planilha, no qual os dados esto registrados, nes-
se caso, o intervalo B3:B14 que inclui a clula onde foi registrado o ttulo Amostra, ou rtulo no Excel.

8 Em ingls, a ferramenta ESTATSTICA DESCRITIVA DESCRIPTIVE STATISTICS.


C A P T U L O 4 / MEDIDAS DE DISPERSO 121

l Agrupado por: Selecionamos Colunas, pois a amostra foi registrada em uma coluna. Em geral, o
Excel selecionar automaticamente depois de ter informado intervalo da amostra.
l Rtulos na primeira linha. Tendo escolhido Colunas no item anterior, necessariamente seleciona-
remos Rtulos na primeira linha, pois na primeira clula da srie foi includo o nome Amostra.

FIGURA 4.3 Caixa de


dilogo da ferramenta
Estatstica descritiva.

Na primeira parte do quadro Opes de sada, deve ser obrigatoriamente informado um endereo a
partir do qual a ferramenta Estatstica descritiva registrar os resultados. H trs alternativas nas quais
no necessrio informar esse endereo, identificadas por trs botes de opo que aceitam a escolha de
uma nica alternativa:

l Intervalo de sada: Os resultados sero apresentados na mesma planilha a partir da clula informa-
da, nesse caso D3. Depois de clicar com o boto esquerdo do mouse dentro da caixa correspondente,
o endereo pode ser registrado digitando D3, ou clicando com o boto esquerdo do mouse na clula
D3; nesse caso, ser registrado o endereo com os dois cifres, $D$3. Esse endereo o da clula su-
perior esquerda da tabela de respostas que a ferramenta construir. Tambm, o Excel automatica-
mente definir o tamanho da rea dos resultados e exibir uma mensagem se a tabela de sada estiver
prestes a substituir dados existentes.
l Nova planilha: Os resultados sero apresentados a partir da clula A1 de uma nova planilha da mes-
ma pasta.
l Se no for informado nenhum endereo, a ferramenta inserir uma nova planilha com o nome
Plan seguido de um nmero sequencial; por exemplo, escolhendo essa alternativa na pasta Cap-
tulo 4, a ferramenta inserir a planilha Plan1.
l H a alternativa de informar o nome da planilha na caixa dessa alternativa; por exemplo, re-
gistrando o nome Teste, a ferramenta inserir na mesma pasta uma nova planilha com o nome
Teste.
l Nova pasta de trabalho. Os resultados sero apresentados em uma nova pasta e a partir da clula A1
da planilha Plan1.

Em continuao, no quadro Opes de sada, h quatro alternativas no excludentes de resultados


possveis. Nelas possvel selecionar qualquer combinao marcando nas quatro caixas de seleo,
com a condio de selecionar pelo menos uma delas.
122 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

FIGURA 4.4
Resumo estatstico
da ferramenta
Estatstica Descritiva.

l Resumo estatstico: Marcando este item, a ferramenta de anlise apresentar o resumo estatstico
completo, conforme apresentada na Figura 4.4.
l Nvel de confiabilidade p/a mdia: A resposta dessa seleo ser compreendida ao estudar Estima-
o no Captulo 11 deste livro. Neste caso, registramos 95, que representa 95% de intervalo de
confiana.
l Ensimo maior: escolhendo este item e informando o valor 1, a ferramenta fornecer o maior valor
da Amostra ordenada de forma crescente. Se for informado o valor 2, ento a ferramenta apresentar
o penltimo valor da amostra, e assim sucessivamente. Ensimo maior retorna o mesmo resultado
da funo estatstica MAIOR, apresentada no Captulo 3.
l Ensimo menor: Escolhendo este item e informando o valor 1, a ferramenta fornecer o menor valor
da Amostra ordenada de forma crescente. Se for informado o valor 2, ento a ferramenta apresentar
o segundo elemento da srie, e assim sucessivamente. Ensimo menor retorna o resultado da funo
estatstica MENOR, apresentada no Captulo 3.

Depois de realizar as escolhas e pressionar o boto OK, a ferramenta registra os resultados a partir da
clula D3, Figura 4.4.

Anlise dos resultados


No intervalo G5:G20, foram registrados os mesmos resultados do intervalo E5:E20 da ferramenta de
anlise, porm calculados com frmulas e funes estatsticas, algumas delas j conhecidas. Nem todos
os resultados registrados na tabela da Figura 4.4 foram apresentados at o momento no livro; por
exemplo, Erro padro e Nvel de confiana (95%), mas que a seguir feita uma introduo.

l Erro padro. O Erro padro o erro amostral S e estudado na Distribuio Amostral, no Captulo
10 deste livro. O valor de S e calculado com a expresso, tambm registrado na clula G6 da
planilha Ferram. Estatstica Descritiva:

SX 9,988175
Se = = = 3,0011548
n 11
C A P T U L O 4 / MEDIDAS DE DISPERSO 123

l Nvel de confiana(95%). O Nvel de confiana estudado no Captulo 11, sendo 95% o percentual de acer-
to da estimativa da mdia da populao. O resultado 6,710148 da clula E20 o erro de estimao com dis-
tribuio t, t( 1 0, 95) 2 S e = 2,228139 3,011548 = 6,710148. Esse resultado foi calculado na clula
G20 com a funo estatstica INVT e a frmula =INVT(0,05;10)*G7, que ser apresentada no Captulo 11.

EXEMPLO 4.8
Analise as distribuies de frequncias das amostras A e B registradas na tabela seguinte utilizando a ferramen-
ta de anlise Estatstica descritiva.

A 100 120 120 120 120 120 120 140 140 140 140 160 160 180

B 88,6 108,5 108,6 128,5 128,6 128,5 128,6 148,6 148,5 148,6 148,6 148,6 148,6 168,6

Soluo. As amostras A e B e os resultados da ferramenta de anlise foram registrados na planilha Exemplo


4.8, includa na pasta Captulo 4, como mostra a figura seguinte depois de ajustar as larguras das colunas e a
formatao dos resultados. Analisando os resultados das medidas estatsticas, verificamos que as amostras A e
B tm o mesmo valor de mdia igual a 134,29, medianas diferentes, respectivamente, 130 e 138,55, e desvio
padro praticamente iguais, respectivamente, 21,38 e 21,39. Comparando somente as mdias e os desvios
padro, aparentemente, parece que as amostras tm a mesma forma de distribuio. Entretanto, a diferena
de medianas mostra que no assim.
Como a mdia da amostra A maior do que a mediana, pode-se deduzir que a distribuio de frequncias
da amostra A tem inclinao positiva. Essa inclinao tambm confirmada pelo resultado Assimetria igual a
0,67 que, por ser positivo, indica a inclinao positiva da distribuio.

No caso da amostra B, ocorre o contrrio: ela tem inclinao para a esquerda, como confirmado tambm
pelo resultado Assimetria igual a 0,66 que, por ser negativo, indica a inclinao negativa da distribuio.

Para facilitar a confirmao da anlise anterior, com a ferramenta de anlise Histograma, foram construdos
os histogramas a partir da linha 20 da planilha Exemplo 4.8. Analisando os histograma, verifica-se que as dis-
tribuies so diferentes, pois enquanto a distribuio de frequncias da amostra A tem inclinao para a direi-
ta, a da amostra B para a esquerda.

Amostra A Amostra B
8 8
Frequncia
Frequncia

6 6
4 4
2 2
0 0
100 127 153 Mais 89 115 142 Mais
124 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

EXEMPLO 4.9
Continuando com o Exemplo 4.8. Analise as distribuies das amostras A e B considerando as seguintes cinco
medidas de posio, mnimo, primeiro quartil, mediana, terceiro quartil e mximo.

Soluo. As amostras A e B e os resultados da ferramenta de anlise foram registrados na planilha Exemplo


4.9, includa na pasta Captulo 4, como mostra a prxima figura. No intervalo F6:G10, esto registrados os
resultados: Mnimo, Q1, Mediana, Q3 e Mximo de cada amostra. Note que essas cinco medidas esto registra-
das em ordem crescente dos resultados. Analisando esses resultados, obtemos:
As duas amostras tm o mesmo intervalo igual a 80=180100=168,888,6.
A diferena entre o terceiro quartil e o primeiro quartil das duas amostras o mesmo valor e igual a 20. Esse
resultado mostra que 50% dos dados em cada amostra se distribuem entre os dois quartis.
A mediana de cada amostra est situada no centro de Q1 e Q3.
A diferena entre o Q1 e o Mnimo da amostra A 20, enquanto a da amostra B 39,9.
Da mesma maneira, a diferena entre o Mximo e o Q3 da amostra A 40, e a da amostra B 20.

Intervalo entre Q1 e Q3
Os resultados do Exemplo 4.9 ajudaro a compreender o intervalo entre o primeiro quartil e o terceiro
quartil, denominado IEQ,9 e as vantagens do diagrama Boxplot que ser apresentado em sequncia. O
primeiro quartil, a mediana e o terceiro quartil avaliam a forma da parte central e a variabilidade da dis-
tribuio de frequncias da amostra. O IEQ o resultado da diferena entre o terceiro quartil Q3 e o pri-
meiro quartil Q1:

IEQ = Q3 Q1

As caractersticas importantes do IEQ so:

l uma medida simples, fcil de ser calculada e automatizada.


l Mede a distribuio da metade dos dados da amostra situados ao redor da mediana.
l uma medida resistente, pois no afetado pelos dados extremos da amostra ou varivel.
l parecido com o intervalo; entretanto, essas trs medidas Q1, mediana e Q3 do mais informaes.

9 Em ingls, IEQ IQR InterQuartile Range.


C A P T U L O 4 / MEDIDAS DE DISPERSO 125

l Contudo, essa medida no suficiente para avaliar a variabilidade de uma amostra ou varivel, pois
envolve apenas os valores centrais, deixando de considerar os valores extremos que tambm so im-
portantes, os restantes 50% dos dados.

Boxplot
Embora os trs resultados Q1, mediana e Q3 mostrem a forma da distribuio de 50% dos valores ao re-
dor da mediana de uma amostra ou varivel, o conjunto formado por esses cinco resultados:10 mnimo,
Q1, mediana, Q3 e mximo permitiro obter muitas informaes sobre a forma da distribuio de fre-
quncias.
O boxplot11 a forma grfica para mostrar o conjunto dos cinco resultados estatsticos e obter infor-
maes diretas sobre a forma da distribuio de frequncias da amostra ou varivel. O boxplot da Figura
4.5, planilha esquerda, mostra que a inclinao da amostra A positiva ou para a direita, confirmando
o resultado obtido no Exemplo 4.9. O boxplot da Figura 4.5, planilha direita, mostra que a inclinao
da amostra B negativa ou para a esquerda, confirmando tambm o resultado obtido no Exemplo 4.9.
No grfico do boxplot, foi includa uma linha (no eixo de abscissas) com as cinco medidas estatsticas
que ajudam a descrever a forma da distribuio de frequncias, como mostrado no Modelo Anlise
Numrica. Observe que cada amostra tem um boxplot diferente que registra:

l Uma medida de tendncia central, a mediana.


l Duas medidas de variabilidade ou disperso, o intervalo e o IEQ.
l O tipo de inclinao por comparao da mediana com relao aos valores extremos.
l Os possveis dados suspeitos.

FIGURA 4.5 Boxplot das amostras A e B, Exemplo 4.9.

10 Em ingls, conhecido como Five-number Summary.


11 Preferimos manter o nome boxplot em ingls.
126 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Dado suspeito
denominado dado suspeito12 o dado de uma amostra extremamente diferente da maioria dos dados da
amostra. Como qualquer amostra pode conter dados suspeitos, importante estar preparado para de-
tect-lo e analisar sua causa.

l Se o dado suspeito tiver sua origem em um erro de registro; por exemplo, o valor medido 135 foi re-
gistrado como 2.135. Nesse caso, o erro pode ser corrigido e a caracterstica suspeita pode ser elimi-
nada do dado amostrado.
l O que fazer se o dado suspeito foi corretamente amostrado e registrado? Se a populao est sendo
amostrada atravs de uma pesquisa de indivduos de uma determinada populao, um dado suspei-
to poder ser originado por um individuo que no pertence populao definida. O dado suspeito
tambm pode ser evidncia de um acontecimento extraordinrio ou uma variabilidade no esperada
da varivel. Em qualquer caso, os dados suspeitos sem causa aparente associada populao devem
ser retirados da amostra, registrando esse evento.

O valor X de uma varivel considerado possvel suspeito se estiver no intervalo


Q1 3 IEQ < X < Q1 15
, IEQ ou no intervalo Q3 + 15
, IEQ < X < Q3 + 3 IEQ.
O valor X de uma varivel considerado suspeito se X < Q1 3 IEQ ou X > Q3 + 3 IEQ.

Uma estratgia para tratar dados suspeitos e outras irregularidades utilizar mtodos numricos re-
sistentes que pouco so afetados pelos dados suspeitos. Uma das aplicaes do IEQ a deteco de va-
lores suspeitos de uma varivel. Embora o IEQ ajude a retirar um dado da amostra por consider-lo sus-
peito, essa deciso deve ser acompanhada de um criterioso julgamento.

EXEMPLO 4.10
Calcule o IEQ das amostras A e B do Exemplo 4.9 e verifique a existncia de dados suspeitos.

Soluo. A figura a seguir mostra a resoluo deste exemplo na planilha Exemplo 4.10, includa na pasta
Captulo 4. A primeira parte dos resultados igual ado Exemplo 4.9, adicionando o intervalo F11:G11 para o
clculo do IEQ de cada amostra. Depois, no intervalo E13:I15, foram calculados os limites dos dados suspeitos
indicados nesta tabela.

12 Em ingls, dados suspeitos so outliers.


C A P T U L O 4 / MEDIDAS DE DISPERSO 127

Amostra A.
Na cauda inferior da distribuio, so suspeitos os valores menores do que 60, e os valores entre 60 e 90
so possveis suspeitos. Como o valor mnimo 100, essa amostra no tem valores suspeitos nessa regio.
Na cauda superior da distribuio, so suspeitos os valores maiores do que 200, e os valores entre 170 e
200 so possveis suspeitos. O nico valor possvel de suspeita o valor mximo 180.
Amostra B.
Na cauda inferior da distribuio, so suspeitos os valores menores do que 68,2. Os valores entre 68,2 e
98,4 so possveis suspeitos como o valor mnimo 88,6.
Na cauda superior da distribuio, so suspeitos os valores maiores do que 208,9, e os valores entre 178,8
e 208,9 so possveis suspeitos. Nenhum valor deve ser considerado suspeito.

Os intervalos de deteco de valores suspeitos foram adicionados ao boxplot da planilha Boxplot,


como mostram as planilhas da Figura 4.5 referentes s amostras A e B. Verifique que:

l Nos extremos da distribuio, so representados os segmentos dos valores potencialmente suspei-


tos, linhas de cor vermelha.
l A amostra A no tem valores suspeitos na cauda inferior; entretanto, pode ter valores suspeitos na
cauda superior da distribuio.
l A amostra B tem valores suspeitos na cauda inferior; entretanto, pode no ter valores suspeitos na
cauda superior da distribuio.

Boxplot com Excel


O boxplot de uma amostra tambm pode ser construdo utilizando os recursos grficos do Excel. Na
planilha Boxplot com Excel, includa na pasta Captulo 4, foram repetidos os dados e os resultados da
planilha Exemplo 4.9, fazendo uma cpia dessa planilha. Depois, as posies dos resultados dos cinco
nmeros, mnimo, Q1, mediana, Q3 e mximo foram mudadas para a nova sequncia dos cinco resulta-
dos, Q1, mnimo, mediana, mximo e Q3.

Construo de um Boxplot
Depois de ter mudado as posies dos cinco resultados na planilha Boxplot com Excel proceda assim:13

l Selecione o intervalo E5:F10 da planilha Boxplot com Excel.


l Clique no cone assistente de grfico e, na pgina Tipos padro de grficos, selecione o tipo de
grfico Linha e o subtipo de grfico Linhas com marcadores exibidos a cada valor de dado.
l Depois, clique no boto Avanar. Na guia Intervalo de dados voc dever selecionar Linhas apesar
de os dados estarem registrados em colunas, como mostra a Figura 4.6, esquerda. Depois clique no
boto Concluir.

Agora temos um grfico como o mostrado na Figura 4.6, esquerda. Para construir a forma do box-
plot proceda desta forma:
l Clique duas vezes seguidas com o boto esquerdo do mouse em cima de um dos pontos do grfico
construdo. Aparecer a caixa de dilogo Formatar sequncia de dados.
l Na caixa de dilogo Formatar sequncia de dados, selecione a guia Opes. Nessa pgina, marque
as caixas Linhas de mximo/mnimo e Barras superiores/inferiores como mostrado na Figura 4.6,
direita.

13 Adptado de Hunt N. Boxplots in Excel em http://www.mis.coventry.ac.uk/~nhunt/boxplot.htm.


128 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l Para terminar, ajuste a formatao do grfico da forma que achar mais conveniente, mudando a po-
sio da legenda, a cor do fundo do grfico, a identificao dos cinco pontos etc.

FIGURA 4.6 Construo de um boxplot com Excel.

Construo de dois ou mais Boxplot


O procedimento parecido com o de um boxplot anterior e pode ser utilizado para mais de dois boxplot:

l Selecione o intervalo E5:G10 da planilha Boxplot com Excel.


l Clique no cone assistente de grfico e, na pgina Tipos padro de grficos, selecione o tipo de
grfico Linha e o subtipo de grfico Linhas com marcadores exibidos a cada valor de dado.
l Depois clique no boto Avanar. Na guia Intervalo de dados, dever selecionar Linhas, apesar de os
dados estarem registrados em colunas, como mostrado na Figura 4.7, esquerda. Depois clique no
boto Concluir.

Agora temos um grfico como o mostrado na Figura 4.7, esquerda. Para construir a forma de dois
boxplot, siga este procedimento:

l Clique duas vezes seguidas com o boto esquerdo do mouse na primeira linha do grfico construdo.
Ser exibida a caixa de dilogo Formatar sequncia de dados.
l Na caixa de dilogo Formatar sequncia de dados, selecione a guia Padres e, no quadro Linha,
marque Nenhuma e depois pressione OK. Verifique se, com essa instruo, a linha que ligava os dois
pontos foi removida.
l Repita o procedimento anterior com as quatro linhas restantes.
l Na caixa de dilogo Formatar sequncia de dados, selecione a guia Opes. Nessa pgina, marque
as caixas Linhas de mximo/mnimo e Barras superiores/inferiores como mostra a Figura 4.7, di-
reita.
l Para terminar, ajuste a formatao do grfico da forma que achar mais conveniente, mudando a po-
sio da legenda, a cor do fundo do grfico, a identificao dos cinco pontos etc.
C A P T U L O 4 / MEDIDAS DE DISPERSO 129

FIGURA 4.7 Construo de dois boxplot com Excel.

Problemas
Problema 1
Calcule a varincia e o desvio padro da amostra registrada na tabela seguinte:

10 15 14 23 21 18 11 12 14 15 23 12 15

R: S2=19,09 e S=4,37

Problema 2
Calcule a varincia e o desvio do Problema 1, considerando, como populao.
R: 2=17,62 e =4,20

Problema 3
Repita o Problema 2, calculando a varincia e o desvio padro da populao a partir da varincia e do
desvio padro da amostra e utilizando as frmulas.

Problema 4
A tabela a seguir registra uma amostra do nmero de gerentes operacionais que respondem diretamen-
te a um diretor em empresas do ramo qumico. Calcule a mdia e o desvio padro do nmero de geren-
tes por empresa:

7 7 9 8 7 13 10 14 8 9 8 6

9 9 10 11 7 8 9 6 8 11 12 10

R: X=9 e S=2,09
130 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problema 5
Calcule a varincia e o desvio padro da amostra registrada na tabela:

10 15 14 23 21 18 11 12 14 15 23 12 18 16 15

R: S2=16,74 e S=4,09

Problema 6
A tabela seguinte registra as notas finais de um grupo de alunos da disciplina Estatstica. Calcule a va-
rincia e o desvio padro da amostra.

89,5 74,7 99,4 84,9 96,5 82,1 77,7 92,7 59,1 74,7 91,0 100 77,6 98,5 2,2 60,8

83,1 20,1 84,2 70,1 90,8 97,5 78,2 31,7 98,1 99,0 94,3 73,4 85,7 94,1 61,0 77,8

R: X=78,14 e S=23,15

Problema 7
Continuando com Problema 6. Calcule a mediana da amostra e analise a inclinao da distribuio.
R: Md =83,65. A distribuio tem inclinao para a esquerda, pois X <Md, como mostra o coeficiente de
inclinao igual a 1,87.

Problema 8
Continuando com o Problema 6, determine a porcentagem das notas finais do grupo de alunos que es-
to includos em um, dois e trs desvios padro.
R: X 1 S=91%; X 2 S=91% e X 3 S=97%.

Problema 9
Repita o Problema 8, excluindo as observaes 2,2; 20,1; e 31,7.
R: X 1 S=66%; X 2 S=97% e X 3 S=100%.

Problema 10
Calcule a varincia e o desvio padro dos retornos da tabela seguinte.

Aplicao Retorno mensal %

Ouro 1,74%

Curto prazo 0,52%

Dlar paralelo 0,87%

CDB para <$5.000 1,15%

Caderneta de poupana 1,16%

FRF 30 dias 1,30%

FRF 60 dias 1,49%

CDB para >$100.000 1,58%

Bolsa RJ 2,12%

Bolsa SP 2,99%

R: S2=0,00015 e S=1,22%
C A P T U L O 4 / MEDIDAS DE DISPERSO 131

Problema 11
Continuando com o Problema 10, determine a porcentagem dos retornos includos em um, dois e trs
desvios padro.
R: X 1 S=80%; X 2 S=90% e X 3 S=100%.

Problema 12
Calcule o coeficiente de variao dos retornos do Problema 10.
R: CV=1,07

Problema 13
Os retornos anuais das aes X e Y durante os ltimos cinco anos esto registrados na tabela seguinte.
Qual dos dois retornos tem maior disperso?

X Y

12% 12%

15% 16%

12% 15%

11% 9%

14% 13%

R: A disperso do retorno da ao Y maior do que a disperso da ao X.

Problema 14
Continuando com o Problema 13. Calcule os coeficientes de variao de X e Y. Qual a ao com maior
risco?
R: CVX=0,13 e CVY=0,21

Problema 15
As taxas de juros cobradas nos emprstimos para compra de eletrodomsticos em oito das maiores lo-
jas da cidade esto registradas na tabela seguinte. Calcule a mdia, a varincia e o desvio padro das ta-
xas de juros.

6,00% 4,80% 5,30% 4,75% 4,10% 5,40% 3,90% 5,20%

R: X=4,93% S2=0,0000482 e S=0,69%

Problema 16
A tabela seguinte registra uma amostra do tempo que os caixas do banco gastam para realizar as transa-
es dos clientes. Calcule a mdia, a varincia e o desvio padro da amostra.

2,5 8,0 4,5 7,5 2,0 11,0 4,0 5,0 8,0 6,5 3,5

R: X=5,68 minutos, S2=7,61 e S=2,76 minutos

Problema 17
Para conhecer o nmero de horas por semana que os principais executivos das maiores empresas do
pas trabalham, a empresa de consultoria realizou uma pesquisa com doze executivos escolhidos alea-
132 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

toriamente dentre as 500 maiores empresas. Calcule a mdia, a varincia e o desvio padro da amostra
registrada na tabela a seguir.

60 66 64 62 58 62 62 60 62 60 64 66

R: X=62,17 hs/sem. S2=6,15 e S=2,48 hs/sem.

Problema 18
Ao comparar os retornos de duas aes, a ao que apresentar maior coeficiente de variao ter maior
risco. A tabela seguinte registra os retornos da Ao A e da Ao B durante cinco anos. Determine a ao
com maior risco.

9,00% 12,00%

10,00% 10,50%

12,00% 9,50%

10,50% 11,00%

9,50% 12,50%

R: A Ao A teve maior coeficiente de variao e, portanto, maior risco.

Problema 19
Calcule a varincia e o desvio padro da amostra das notas finais da Turma C da disciplina Estatstica
registradas no Problema 6.
R: Var=535,90 e S=23,15

Problema 20
Determine os cinco nmeros: mnimo, Q1, mediana, Q3 e mximo da amostra do Problema 19.
R: Min=2,20; Q1=74,38; Med=83,65; Q3=94,15; Max=100

Problema 21
Construa o boxplot do Problema 19.

Problema 22
Com os resultados do Problema 21, analise a distribuio de frequncias dessa amostra.

Problema 23
Repita o Problema 22 utilizando o Modelo Anlise Numrica.

Problema 24
Verifique a existncia de dados suspeitos na amostra do Problema 19.

Problema 25
Construa o boxplot da amostra do Problema 10, analise a distribuio e verifique a existncia de dados
suspeitos.
C A P T U L O 4 / MEDIDAS DE DISPERSO 133

Problema 26
A rede de restaurantes AQUIeAGORA, especializada em almoos pelo sistema refeio por quilo, tem 30
lojas distribudas em diversos bairros de So Paulo, todas com o mesmo padro e capacidade de atendi-
mento. A tabela seguinte apresenta o nmero de refeies servidas pelas 30 lojas em um dia tpico.

290 243 295 275 216 253


266 232 256 224 252 298
316 247 234 278 270 280
226 233 298 278 266 278
252 269 239 325 240 295

Construa o boxplot, analise a distribuio e verifique a existncia de dados suspeitos.

Problema 27
Repita o Problema 26 utilizando as vendas das 50 primeiras empresas por vendas em 2002, cujos dados
esto registrados na planilha Problemas deste captulo.
134 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Apndice 1
Funes de medida de disperso
do Excel

O clculo das medidas de disperso utilizando o Excel pode ser realizado utilizando expresses mate-
mticas e procedimentos combinados com os recursos da planilha e funes estatsticas. Na planilha
Funes de Disperso, includa na pasta Captulo 4, est registrada a utilizao de cada funo utili-
zando a amostra do Exemplo 4.1, como se pode ver na Figura 4.8. Uma caracterstica comum das fun-
es a seguir so os 30 argumentos (nm1; nm2; ... ; nm30) utilizados para registrar os valores de in-
tervalos. Na apresentao da primeira funo DESV.MDIO, ser mostrado como utilizar esses argu-
mentos, procedimentos que se repetem com as demais funes com o mesmo tipo de argumentos. As
sintaxes dessas funes estatsticas so apresentadas a seguir.

DESV.MDIO(nm1; nm2; ... ; nm30)


A funo estatstica DESV.MDIO14 retorna o desvio absoluto mdio dos valores numricos nm1;
nm2; ... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha contendo va-
lores numricos ou assemelhados.15 Por exemplo, a funo DESV.MDIO aplicada aos valores do
Exemplo 4.1 retorna o resultado 8,38. Para obter esse resultado, a funo DESV.MDIO pode ser utili-
zada das seguintes maneiras:

l Registrando os valores da amostra em um intervalo de clulas da planilha.


l Se os valores da varivel estiverem registrados em um nico intervalo, ou intervalos contguos,
apenas ser necessrio informar um nico intervalo no argumento num1. Por exemplo, na clula
E6 foi registrada a frmula =DESV.MDIO(B4:B14), conforme apresenta a Figura 4.8.
l Se os valores da varivel estiverem registrados em intervalos no adjacentes, ser necessrio informar
o endereo de cada intervalo no lugar de cada nm de nm1; nm2; ... ; nm30, at um mximo de 30;
por exemplo, na clula E7 foi registrada a seguinte frmula =DESV.MDIO(B4:B7;B8:B12;B13:B14).
l Registrando os valores da amostra como matriz na prpria frmula da funo, evitando registrar os
valores da amostra em um intervalo de clulas da planilha.
l Na clula F6, os valores foram registrados em uma nica matriz:
=DESV.MDIO({31;38;19;27;24;42;32;18;43;15;39})
l Na clula F7, os valores foram registrados em trs matrizes:
=DESV.MDIO({31;38;19};{27;24;42;32;18;43};{15;39}) correspondentes aos trs primei-
ros argumentos da funo DESV.MDIO nm1; nm2; nm3.

DESVQ(nm1; nm2; ... ; nm30)


A funo estatstica DESVQ16 retorna a soma dos quadrados dos desvios dos valores numricos nm1;
nm2; ... ; nm30 com relao mdia. Cada um desses nm pode ser um intervalo de clulas de uma

14 Em ingls, a funo DESV.MDIO AVEDEV.


15 Assemelhados so os intervalos definidos por nomes, valores lgicos, representaes em forma de texto de nmeros, por exem-
plo, com a funo de texto VALOR("10")=10.
16 Em ingls, a funo DESVQ DEVSQ.
C A P T U L O 4 / MEDIDAS DE DISPERSO 135

planilha contendo valores numricos ou assemelhados. A funo DESVQ pode ser registrada de diver-
sas formas equivalentes s descritas na funo DESV.MDIO, mencionada anteriormente, conforme
mostrado na Figura 4.8.

VARP(nm1; nm2; ... ; nm30)


A funo estatstica VARP17 retorna a varincia da populao dos valores numricos nm1; nm2; ... ;
nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha contendo valores num-
ricos ou assemelhados. A funo VARP pode ser registrada de diversas formas equivalentes s descritas
na funo DESV.MDIO citada anteriormente.

VAR(nm1; nm2; ... ; nm30)


A funo estatstica VAR18 retorna a varincia da amostra dos valores numricos nm1; nm2; ... ;
nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha que contm valores nu-
mricos ou assemelhados. A funo VAR pode ser registrada de diversas formas equivalentes s descri-
tas na funo DESV.MDIO definida anteriormente.

DESVPADP(nm1; nm2; ... ; nm30)


A funo estatstica DESVPADP19 retorna o desvio padro da populao dos valores numricos nm1;
nm2; ... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha que contm
valores numricos ou assemelhados. A funo DESVPADP pode ser registrada de diversas formas equi-
valentes s descritas na funo DESV.MDIO mencionada anteriormente.

DESVPAD(nm1; nm2; ... ; nm30)


A funo estatstica DESVPAD20 retorna o desvio padro da amostra dos valores numricos nm1;
nm2; ... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha que contm
valores numricos ou assemelhados. A funo DESVPADP pode ser registrada de diversas formas equi-
valentes s descritas na funo DESV.MDIO detalhada anteriormente.

VARPA(nm1; nm2; ... ; nm30)


A funo estatstica VARPA21 equivalente funo anterior VARP. A diferena est relacionada com
os valores registrados nos argumentos nm1; nm2; ... ; nm30 que, nesta funo, alm de nmeros, po-
dem ser valores lgicos e de texto, como VERDADEIRO e FALSO.

VARA(nm1; nm2; ... ; nm30)


A funo estatstica VARPA22 equivalente funo anterior VAR. A diferena est relacionada com os
valores registrados nos argumentos nm1; nm2; ... ; nm30 que, nesta funo, alm de nmeros, po-
dem ser valores lgicos e de texto, como VERDADEIRO e FALSO.

17 Em ingls, a funo VARP VARP.


18 Em ingls, a funo VAR VAR.
19 Em ingls, a funo DESVPADP STDEVP.
20 Em ingls, a funo DESVPAD STDEV.
21 Em ingls, a funo VARPA VARPA.
22 Em ingls, a funo VARA VARA.
136 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

FIGURA 4.8 Aplicando


as funes de medidas
de disperso no
Exemplo 4.1.

DESVPADPA(nm1; nm2; ... ; nm30)


A funo estatstica DESVPADPA23 equivalente funo anterior DESVPADP. A diferena est rela-
cionada com os valores registrados nos argumentos nm1; nm2; ... ; nm30 que, nesta funo, alm de
nmeros, podem ser valores lgicos e de texto, como VERDADEIRO e FALSO.

DESVPADA(nm1; nm2; ... ; nm30)


A funo estatstica DESVPADA24 equivalente funo anterior DESVPAD. A diferena est relacio-
nada com os valores registrados nos argumentos nm1; nm2; ... ; nm30 que, nesta funo, alm de n-
meros, podem ser valores lgicos e de texto, como VERDADEIRO e FALSO.

DISTORO(nm1; nm2; ... ; nm30)


A funo estatstica DISTORO25 retorna o coeficiente de inclinao dos valores numricos nm1;
nm2; ... ; nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha que contm
valores numricos ou assemelhados. A frmula utilizada pela funo DISTORO para calcular o coe-
ficiente de inclinao :

3
n n
Xi X
Coeficiente de Inclinao =
(n 1) (n 2) i =1 S X

23 Em ingls, a funo DESVPADPA STDEVPA.


24 Em ingls, a funo DESVPADA STDEVA.
25 Em ingls, a funo DISTORO SKEW.
C A P T U L O 4 / MEDIDAS DE DISPERSO 137

O coeficiente de inclinao o resultado da comparao da distribuio de frequncias dos valores


informados com a distribuio normal, apresentada no Captulo 8, e seu resultado deve ser interpreta-
do como segue. Se o coeficiente de inclinao for igual a zero, ento a distribuio de frequncias si-
mtrica, se for negativo, a distribuio de frequncias ter inclinao para a esquerda ou negativa, e se
for positivo, a distribuio de frequncias ter inclinao para a direita ou positiva. A funo
DISTORO pode ser registrada de diversas formas equivalentes s descritas na funo DESV.MDIO,
definida anteriormente.

CURT(nm1; nm2; ... ; nm30)


A funo estatstica CURT26 retorna o coeficiente de curtose dos valores numricos nm1; nm2; ... ;
nm30. Cada um desses nm pode ser um intervalo de clulas de uma planilha que contm valores nu-
mricos ou assemelhados. A frmula utilizada pela funo CURT para calcular o coeficiente de curtose
a seguinte:

n(n + 1) n
X i X
4
3(n 1) 2
Coeficiente de Curtose =
(n 1)(n 2)(n 3) i =1 S X (n 2)(n 3)

O coeficiente de curtose o resultado da comparao da distribuio de frequncias dos valores in-


formados com a distribuio normal apresentada no Captulo 8, e seu resultado deve ser interpretado
como segue. Se o coeficiente de curtose for igual a zero, ento a distribuio de frequncias ser a pr-
pria distribuio normal; se for negativo, a distribuio ser achatada, plana; e se for positivo, a distri-
buio de frequncias ser concentrada ao redor da mdia, distribuio com pico. A funo CURT
pode ser registrada de diversas formas equivalentes s descritas na funo DESV.MDIO mencionada
anteriormente.

Apndice 2
Outra forma de calcular a varincia

O clculo da varincia da varivel X pode ser realizado utilizando apenas os valores da varivel, sem ne-
cessidade de calcular a mdia e os desvios da varivel. Se na frmula da soma dos quadrados dos des-
vios desenvolvemos o quadrado do binmio indicado, obtemos a seguinte igualdade:

N N
(X i X ) 2 = (X i2 2X X + 2X )
i =1 i =1

Continuando com o desenvolvimento algbrico, obtemos:

N N N N
(X i X ) 2 = X i2 2 X X i + X2
i =1 i =1 i =1 i =1

26 Em ingls, a funo CURT KURT.


138 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

N N
No segundo membro dessa expresso reconhecemos que X i = N X e 2X = N X2 . Dessa manei-
i =1 i =1
N N
ra, o segundo membro pode ser reescrito da seguinte forma: X i2 2 X N X + 2X = X i2 N 2X .
i =1 i =1
Voltando primeira frmula, formamos a igualdade que nos interessa:

N N
(X i X ) 2 = X i2 N X2
i =1 i =1

2
N
X i
i =1
Ainda, pela definio de mdia da populao 2X = . Substituindo essa relao na expres-
N2
so da soma dos quadrados dos desvios, teremos:
2
N
X i
N N
i =1
(X i X ) 2 = X i2 N = N2
i =1 i =1

Agora, o clculo da soma dos quadrados dos desvios depende somente dos dados da amostra e dos
quadrados desses dados. Dessa maneira, as expresses das varincias so:

N
2

i X
1N i =1
l Da populao: 2X = X i2
N i =1 N

n
2

X i
1 n 2 i =1
Da amostra: S X = X i
2
l
n 1 i =1 n

Para calcular a varincia, ser necessrio gerar a srie dos quadrados dos valores da varivel, no
sendo necessrio calcular a mdia nem os desvios. Na realidade, esse procedimento de clculo perde
sua fora quando comparado com a utilizao das funes estatsticas do Excel, como mostra a plani-
lha Apndice 2, includa na pasta Captulo 4. Essa expresso da varincia ser utilizada no Apndice 1
do Captulo 9.
C A P T U L O 4 / MEDIDAS DE DISPERSO 139

Apndice 3
Funes para banco de dados
do Excel

As funes estatsticas apresentadas at este momento foram utilizadas para obter alguma medida esta-
tstica de uma amostra ou varivel, atendendo a algumas especificaes dessas funes:

l Os dados foram registrados em um intervalo de clulas da planilha e a frmula com a funo em ou-
tra clula fora daquele intervalo.
l Os dados da amostra foram registrados como matriz na prpria frmula da funo em uma nica c-
lula da planilha.

H situaes em que os dados ou variveis para anlise fazem parte de uma tabela contendo outras
variveis. Por exemplo, os resultados mensais significativos de uma empresa durante um ano esto re-
gistrados na planilha Funes Banco de Dados, includa na pasta Captulo 4, conforme apresenta a Fi-
gura 4.9. Os resultados esto registrados em uma tabela com as colunas identificadas com os nomes
Ms, Vendas, Custos, Lucro Bruto e Lucro Lquido. A tabela com os resultados da empresa denominada
banco de dados, e cada uma de suas colunas denominada campo; em termos tcnicos, cada linha da ta-
bela uma unidade elementar de informao que contm quatro variveis. Para essas situaes, o
Excel dispe de funes denominadas genericamente BDfunes e equivalentes a algumas das funes
apresentadas neste captulo.

FIGURA 4.9 Resultados


mensais da empresa.

EXEMPLO 4.11
Calcule a mdia, o desvio padro e o valor mximo das Vendas da empresa durante o primeiro ms dos quatro
trimestres do ano 2004, e cujos resultados esto registrados na tabela da Figura 4.9.

Soluo. Os resultados foram obtidos de diversas formas, a partir da clula H1 da planilha Funes Banco
de Dados, includa na pasta Captulo 4, como mostra a figura seguinte. A mdia das vendas da empresa nos
primeiros meses dos quatro trimestres do ano 2004 igual a $6.215,50, resultado obtido:
140 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Calculando com a funo estatstica MDIA, registrando na clula K4 a frmula =MDIA(C4;C7;C10;C13).


Calculando com a funo estatstica SUBTOTAL, registrando na clula K5 a frmula =SUBTOTAL
(1;C4;C7;C10;C13). Com a funo SUBTOTAL, possvel obter 11 resultados diferentes informando
um nmero de 1 a 11 no primeiro argumento da funo, como ser apresentado mais adiante neste
apndice.
Calculando com a funo estatstica para banco de dados BDMDIA, registrando na clula K6 a frmula
=BDMDIA(B3:F15;C3;I3:I7). A funo BDMDIA uma das doze funes para listas ou banco de dados dis-
ponveis no Excel e denominadas genericamente BDfunes, pois todas elas utilizam a mesma sintaxe,
BDFuno(banco_dados; campo; critrios).
No argumento banco_dados, deve ser informado o intervalo do banco de dados incluindo a primeira li-
nha com os ttulos, neste exemplo B3:F15.
No argumento campo, deve ser informado o nome da coluna do banco de dados onde ser aplicada a
funo. Neste exemplo, pode ser informado o texto Vendas, entre aspas duplas, ou o endereo da c-
lula C3.
No argumento critrios, deve ser registrada a especificao da escolha dos dados. Neste exemplo, no
intervalo I3:I7 foi construda a tabela de meses, ou linhas, que identificam os valores correspondentes
da coluna Vendas o argumento campus da funo. Como alternativa, pode-se utilizar a frmula
=BDMDIA(B3:F15; ;Vendas;I3:I7) para obter o mesmo resultado Ou, como um nmero que represen-
te a posio da coluna dentro da lista, comeando com 1 para a primeira coluna, 2 para a segunda coluna
e assim sucessivamente, at esgotar as colunas do banco de dados.

A partir das linhas 8 e 13 da planilha Funes Banco de Dados, foram calculados, respectivamente, o
desvio padro e o valor mximo das Vendas da empresa durante o primeiro ms dos quatro trimestres do ano
2004, utilizando as trs funes apresentadas e adequadas para esses clculos.

Incluindo outros critrios


Com as funes para banco de dados operamos a distncia sem necessidade de definir intervalos den-
tro do banco de dados. A tabela de critrios pode incluir condies lgicas nos campos do banco de da-
dos. Sem esgotar este assunto, a seguir mostraremos outra forma de incluir critrios.
C A P T U L O 4 / MEDIDAS DE DISPERSO 141

EXEMPLO 4.12
Calcule a mdia das vendas da empresa durante o primeiro ms dos quatro trimestres do ano 2004, conside-
rando somente os meses com lucro lquido maior ou igual a $1.600.
Soluo. Para calcular a mdia das vendas dos primeiros meses dos quatro trimestres do ano 2004, consideran-
do apenas as vendas dos meses com Lucro Lquido igual ou maior do que $1.600, no intervalo O3:P7, foi cons-
truda a tabela com os campos Ms e Lucro Lquido, sendo que, neste ltimo clculo, foram registradas as restri-
es de seleo de cada ms, a frmula >=1600. A mdia das vendas da empresa durante o primeiro ms dos
quatro trimestres do ano 2004, considerando somente os meses com lucro lquido maior ou igual a $1.600
igual a $6.289,67, resultado obtido com =BDMDIA(B3:F15;C3;O3:P7), frmula registrada na clula R4.

Resumo das funes de banco de dados do Excel


O Excel dispe de doze funes orientadas para banco de dados, denominadas genericamente BDfun-
es, pois cada uma dessas funes tem os mesmos trs argumentos: banco de dados, campo e critrios.
Sua sintaxe geral :

BDfuno(banco_dados; campo; critrios)


l O argumento banco_dados o intervalo de clulas que delimita a tabela com as informaes, que
pode ser uma lista ou um banco de dados. Um banco de dados uma lista de dados na qual cada linha
um registro formado por um ou mais campos identificados por um nome na primeira linha de cada
coluna. O argumento banco_dados pode ser informado como um intervalo de clulas ou como um
nome representando o intervalo.
l O argumento campo define o nome da coluna do banco de dados que ser utilizada para realizar um
clculo ou uma seleo, podendo ser informado:
l Como texto, por exemplo, Vendas ou Lucro Lquido.
l Como endereo da clula onde est registrado nome do campo.
l Como um nmero que represente a posio da coluna dentro da lista, comeando com 1 para a
primeira coluna, 2 para a segunda coluna e assim sucessivamente, at esgotar as colunas do banco
de dados.
l O argumento critrios o intervalo de clulas que especifica a forma de seleo. Pode ser informado
qualquer intervalo, sempre que ele incluir pelo menos um ttulo de coluna e ao menos uma clula
abaixo desse ttulo que especifique alguma condio para seleo nessa coluna.

A seguir, so apresentadas as sintaxes das doze funes para bancos de dados disponveis no Excel.
As primeiras onze funes foram registradas com o mesmo argumento (B3:F15;C3;I3:I7) no intervalo
K23:L34 da planilha Funes Banco de Dados, includa na pasta Captulo 4, cujos resultados so mos-
trados na Figura 4.10.
142 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

BDMDIA(banco_dados; campo; critrios)


A funo BDMDIA27 retorna a mdia dos valores da coluna campo do banco_dados que coincide com
os critrios especificados.

BDCONTAR(banco_dados; campo; critrios)


A funo BDCONTAR28 retorna a quantidade de clulas contendo nmeros da coluna campo do ban-
co_dados que coincide com os critrios especificados.

BDCONTARA(banco_dados; campo; critrios)


A funo BDCONTARA29 retorna a quantidade de clulas no vazias da coluna campo do banco_dados
que coincide com os critrios especificados

BDMX(banco_dados; campo; critrios)


A funo BDMX30 retorna o valor mximo da coluna campo do banco_dados que coincide com os cri-
trios especificados.

BDMN(banco_dados; campo; critrios)


A funo BDMN31 retorna o valor mnimo da coluna campo do banco_dados que coincide com os crit-
rios especificados.

BDMULTIPL(banco_dados; campo; critrios)


A funo BDMULTIPL32 retorna o resultado da multiplicao dos valores da coluna campo do ban-
co_dados que coincide com os critrios especificados.

BDEST(banco_dados; campo; critrios)


A funo BDEST33 retorna o desvio padro da amostra dos valores da coluna campo do banco_dados que
coincide com os critrios especificados.

BDDESVPA(banco_dados; campo; critrios)


A funo BDDESVPA34 retorna o desvio padro da populao dos valores da coluna campo do ban-
co_dados que coincide com os critrios especificados.

BDSOMA(banco_dados; campo; critrios)


A funo BDSOMA35 retorna a soma dos valores da coluna campo do banco_dados que coincide com os
critrios especificados.

27 Em ingls, a funo BDMDIA DAVERAGE.


28 Em ingls, a funo BDCONTAR DCOUNT.
29 Em ingls, a funo BDCONTARA DCOUNTA.
30 Em ingls, a funo BDMX DMAX.
31 Em ingls, a funo BDMN DMIN.
32 Em ingls, a funo BDMULTIPL DPRODUCT.
33 Em ingls, a funo BDEST DSTDEV.
34 Em ingls, a funo BDDESVP DSTDEVP.
35 Em ingls, a funo BDSOMA DSUM.
C A P T U L O 4 / MEDIDAS DE DISPERSO 143

FIGURA 4.10
Aplicao das
BDfunes.

BDVAREST(banco_dados; campo; critrios)


A funo BDVAREST36 retorna a varincia da amostra dos valores da coluna campo do banco_dados que
coincide com os critrios especificados.

BDVARP(banco_dados; campo; critrios)


A funo BDVARP37 retorna a varincia da populao dos valores da coluna campo do banco_dados que
coincide com os critrios especificados.

BDEXTRAIR(banco_dados; campo; critrios)


A funo BDEXTRAIR38 extrai do banco_dados um nico registro da coluna campo que coincide com os
critrios especificados. A seguir, apresentamos como se deve utilizar essa funo:
l A frmula =BDEXTRAIR(B3:F15;C3;I23:I27) registrada na clula L36 retorna como resultado o va-
lor de erro #NUM!, conforme mostrado na Figura 4.10. Isso ocorre porque a funo BDEXTRAIR
no consegue identificar um valor nico no intervalo I23:I27, no qual h quatro datas possveis.
l A frmula =BDEXTRAIR(B3:F15;C3;I23:I24) registrada na clula L37 retorna o resultado $6.423,
pois no intervalo I23:I24 h apenas uma nica data Jan/2004.

Outras funes do Excel


O Excel dispe tambm das funes matemticas SUBTOTAL, CONT.SE e SOMASE que realizam ope-
raes equivalentes s apresentadas para banco de dados.

SUBTOTAL(nmero_funo; ref1; ref2; ...; ref29)


A funo SUBTOTAL39 retorna o resultado das primeiras onze funes do grupo de BDfunes. O ar-
gumento nmero_funo um nmero de 1 a 11 que identifica a funo que dever ser utilizada no cl-
culo de subtotais do banco de dados, de uma lista ou grupo de valores, como mostra a Figura 4.11. Os
argumentos ref1; ref2; ...; ref29 so intervalos de clulas de uma planilha, ou referncias, sobre os quais
ser calculado o subtotal.
36 Em ingls, a funo BDVAREST DVAR.
37 Em ingls, a funo BDVARP DVARP.
38 Em ingls, BDEXTRAIR DGET.
39 Em ingls, SUBTOTAL SUBTOTAL.
144 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

1 MDIA
2 CONT.NM
3 CONT.VALORES
4 MXIMO
5 MNIMO
6 MULT
7 DESVPAD
8 DESVPADP
9 SOMA
10 VAR
11 VARP

FIGURA 4.11 Significado do argumento nmero_ funo.

A Figura 4.12 mostra os onze resultados possveis da funo SUBTOTAL, registrados a partir da clula
J39 da planilha Funes Banco de Dados, includa na pasta Captulo 4. Por exemplo, para calcular a mdia
das vendas da empresa do Exemplo 4.11 referentes aos primeiros meses dos quatro trimestres do ano 2004,
na clula L42 foi registrada a frmula =SUBTOTAL(1;C4;C7;C10;C13), cujo resultado $6.215,50.
O leitor atento deve ter percebido que a funo SUBTOTAL pode ser utilizada como substituta de al-
gumas das funes bsicas apresentadas nos Captulos 3 e 4 do livro. Como ajuda, a partir da clula
H10 da planilha Funes de Disperso, includa na pasta Captulo 4, foram registradas frmulas utili-
zando a funo SUBTOTAL ao lado da funo equivalente original. Uma vantagem da utilizao da
funo SUBTOTAL que com um nico nome de funo poderamos agrupar onze funes, com a des-
vantagem de ter de lembrar a tabela de equivalncia da Figura 4.11, que tambm no muito amigvel.

FIGURA 4.12
Resultados com a funo
SUBTOTAL.

CONT.SE(intervalo; critrios)
A funo CONT.SE40 retorna o nmero de clulas no vazias da srie de dados definida no argumento
intervalo e que atendem a critrios definidos em forma de texto. Por exemplo, gostaramos de conhecer,
na tabela de resultados da Figura 4.9, em quantos meses do ano 2004 o lucro lquido da empresa foi
igual ou maior do que $1.500. O resultado foi obtido com a funo CONT.SE, registrando a frmula

40 Em ingls, CONT.SE COUNTIF.


C A P T U L O 4 / MEDIDAS DE DISPERSO 145

=CONT.SE(F4:F15;">=1500") na clula K57 da planilha Funes Banco de Dados. Portanto, em oito


meses do ano 2004, a empresa registrou lucro lquido igual ou maior do que $1.500.

SOMASE(intervalo; critrios; intervalo_soma)


A funo SOMASE41 retorna a soma de valores das clulas que atendem a um determinado critrio.

l No argumento intervalo registrado o intervalo de clulas utilizado para aplicar o critrio de seleo.
l No argumento critrios registrado um nmero, expresso ou texto, que define como as clulas se-
ro selecionadas.
l No argumento intervalo_soma registrado o intervalo das clulas que podero ser somadas, sendo
somadas somente as clulas correspondentes ao argumento intervalo que atendam ao argumento
critrios. Se intervalo_soma for omitido, sero somadas as clulas do argumento intervalo.

Por exemplo, gostaramos de conhecer, da empresa cujos resultados esto registrados na tabela de
resultados da Figura 4.9, o total das vendas com lucro lquido igual ou maior do que $2.000 durante o
ano 2004. O resultado foi obtido com a frmula =SOMASE(F4:F15;">=2000";C4:C15) registrada na
clula K62 da planilha Funes Banco de Dados. Portanto, o total das vendas com lucro lquido igual
ou maior do que $2.000 durante o ano 2004 foi $12.809.

41 Em ingls, SOMASE SUMIF.


Captulo 5
PROBABILIDADE

O s quatro primeiros captulos apresentaram os temas amostragem, descrio grfica de amostras e


medidas numricas de posio, de tendncia central e de disperso ou variabilidade. Esses con-
hecimentos permitem analisar sries de dados e obter algumas concluses sobre como esses dados se
distribuem em todo seu intervalo de variao ou ao redor de sua mdia. O tema deste captulo ajudar a
descrever a informao amostrada, facilitar a apresentao desses resultados e outorgar uma ferra-
menta til para realizar inferncias sobre a populao de onde foi extrada a amostra.
Pela prpria experincia de vida, sabemos que o resultado do lanamento de uma moeda pode ser
cara ou coroa, descartando a moeda falsa com duas caras, ou duas coroas, ou aquela que possa ficar de
p apoiada na sua borda. Tambm, periodicamente recebemos informaes como a seguinte: na pes-
quisa de inteno de voto para o segundo turno da eleio para governador, 43% dos eleitores da amos-
tra preferem o candidato A, 37% dos eleitores preferem o candidato B e os demais 20% dos eleitores no
sabem. Qual a caracterstica comum do lanamento de uma moeda e da pesquisa de inteno de voto?
O resultado no pode ser previsto com antecedncia! Por qu? Porque o resultado variar toda vez que
lanarmos uma moeda ou extrairmos outra amostra para a pesquisa de inteno de voto.
Entretanto, se o lanamento da moeda for repetido um nmero muito grande de vezes, percebere-
mos uma tendncia dos resultados. O grfico da Figura 5.1, um dos muitos grficos possveis, repre-
senta a proporo de caras em uma simulao de 1.500 lanamentos de uma moeda. O resultado dessa
simulao em particular mostra que a proporo de caras tende a 50%, lembrando que esse grfico foi
especialmente escolhido para essa apresentao, pois, tecnicamente, a simulao de 1.500 lanamen-
tos um nmero pequeno de tentativas.

56%
54%
52%
50% FIGURA 5.1 Proporo
48% de caras no lanamento
46% de uma moeda 1.500
44% vezes.
42%
40%
0 200 400 600 800 1.000 1.200 1.400
148 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Da mesma maneira, se a pesquisa de inteno de voto fosse repetida para um nmero muito grande
de amostras diferentes, tambm perceberemos uma tendncia dos resultados do candidato A e do can-
didato B. Nos exemplos apresentados, destacam-se dois pontos:

l O lanamento da moeda e a pesquisa de inteno de voto so experimentos aleatrios. Embora os


resultados de um experimento aleatrio sejam incertos, a longo prazo os resultados tm uma dis-
tribuio de frequncias definida.
l Depois de repetir um experimento aleatrio um nmero muito grande de vezes, a proporo de
ocorrncia de um dos resultados denominada probabilidade.1

A determinao da probabilidade de um dos resultados possveis de um experimento repetindo-o


um nmero muito grande de vezes no um procedimento geral, alm de ser trabalhoso e dispendioso.
O primeiro passo ser apresentar o resumo dos conceitos que ajudaro a estabelecer regras gerais.

Experimentos e eventos
Todo processo desenvolvido para realizar observaes e obter dados com um determinado objetivo
denominado experimento. O conjunto formado por todos os resultados possveis de um experimento
denominado espao amostral do experimento. Um experimento aleatrio quando pode resultar em
um dos resultados do espao amostral sem que se seja possvel predizer com certeza qual resultado ser
observado.

Se apesar de conhecer todos os resultados de um experimento no for possvel


antecipar seu resultado, esse experimento denominado experimento aleatrio.
Espao amostral o conjunto de todos os possveis e diferentes resultados de um
experimento aleatrio.

A anlise de um experimento aleatrio comea pela identificao de todos os resultados possveis.


Por exemplo, no experimento do lanamento de duas moedas seu espao amostral formado pelos
quatro resultados possveis CaCa, CaCo, CoCa e CoCo, ou o conjunto S dos resultados possveis
S={CaCa, CaCo, CoCa, CoCo}. Cada resultado desse espao amostral S denominado ponto amostral.

Eventos
O diagrama de Venn uma forma grfica de representar o espao amostral S. A Figura 5.2 mostra o dia-
grama de Venn do espao amostral S do lanamento de duas moedas, o conjunto S={CaCa, CaCo,
CoCa, CoCo}

FIGURA 5.2 Diagrama Ca Ca Ca Co S


de Venn do lanamento
Co Ca Co Co
de duas moedas.

1 Do dicionrio Houaiss. Probabilidade: 1. perspectiva favorvel de que algo venha a ocorrer; possibilidade, chance. 2. grau de segu-
rana com que se pode esperar a realizao de um evento, determinado pela frequncia relativa dos eventos do mesmo tipo numa s-
rie de tentativas.
C A P T U L O 5 / PROBABILIDADE 149

Do lanamento de duas moedas, sempre ser obtido um nico resultado denominado evento elemen-
tar do espao amostral S. Os quatro elementos do espao amostral S so eventos elementares, pois ne-
nhum deles pode ser particionado ou dividido.

Evento elementar um resultado nico do espao amostral.


Evento um subconjunto formado por um ou mais resultados do espao amostral.

Um subconjunto do espao amostral S denominado evento. Por exemplo, o evento dos resultados
que tm exatamente apenas uma cara descrito pelo subconjunto do espao amostral A={CaCo, CoCa},
como mostra o diagrama de Venn da Figura 5.3. Tenha em mente que um evento pode ser particionado,
dividido, em seus eventos elementares.

A
Ca Ca Ca Co S
FIGURA 5.3 Diagrama
Co Ca Co Co de Venn do evento A.

Operaes com eventos


A primeira operao e o complemento de um evento. Por exemplo, o complemento do evento A o sub-
conjunto B formado pelos elementos do espao amostral no includos no evento A. Dessa maneira, o
complemento do evento A={CaCo, CoCa} o evento B=~A={CaCa, CoCo}, como mostra o diagrama de
Venn da Figura 5.4.

~A S
Ca Ca Ca Co FIGURA 5.4 Diagrama
de Venn do
Co Ca Co Co
complemento de A.

Outras duas operaes importantes so a unio e a interseo. Dois ou mais eventos do mesmo espa-
o amostral podem ser agrupados em operaes de unio e interseo, como mostra a Figura 5.5. Nos
eventos A e B pertencentes ao mesmo espao amostral S:

l A operao interseo dos eventos A e B gera um novo evento formado pelos elementos comuns aos
dois conjuntos. Essa operao representada com AB, onde o smbolo representa a operao in-
terseo.
l A operao unio dos eventos A e B gera um novo evento formado pelos elementos comuns e no
comuns dos dois conjuntos. Essa operao representada com AB, onde o smbolo representa a
operao unio.

Interseo A B Unio A B

S S
FIGURA 5.5 Operaes
A B A B
com eventos.
150 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Algumas concluses das operaes com eventos:


l A unio de um evento A e seu complemento ~A o prprio espao amostral S, ou com smbolos
A ~A = S.
l A interseo de um evento A e seu complemento ~A o conjunto vazio , ou com smbolos A ~A = .

Eventos mutuamente excludentes e coletivamente exaustivos


Os resultados possveis do lanamento de uma moeda so apenas dois, os eventos elementares Cara-Ca
e Coroa-Co. Pela prpria caracterstica do experimento, se o resultado de um lanamento for cara, esse
resultado no poder ser coroa ao mesmo tempo, pois so eventos mutuamente excludentes. A unio de
eventos elementares forma o espao amostral, pois so eventos coletivamente exaustivos. Portanto, veri-
fica-se que os eventos A e B pertencentes ao mesmo espao amostral S:
l So mutuamente excludentes se sua interseo for vazia: AB=, pois os dois eventos no tm ne-
nhum elemento em comum.
l So coletivamente exaustivos se a unio dos eventos formarem o espao amostral: AB=S, onde
cada evento pode ter elementos repetidos no outro evento.

EXEMPLO 5.1
Analise os resultados do lanamento de uma moeda.

Soluo. Como o espao amostral do lanamento de uma moeda tem apenas dois eventos, os eventos ele-
mentares Ca e Co so eventos mutuamente excludentes, eventos complementares e eventos coletivamente
exaustivos.

EXEMPLO 5.2
A nota final do curso de estatstica pode ser: conceito A, conceito B ou conceito C. Analise os resultados dessas
notas.

Soluo. O espao amostral da nota final de estatstica formado por trs eventos elementares: conceito A,
conceito B e conceito C. Os trs conceitos so eventos mutuamente excludentes e coletivamente exaustivos,
pois quando agrupados formam o espao amostral de todos os conceitos. No so eventos complementares,
pois o complemento do conceito A a unio do conceito B e do conceito C.

Probabilidade
Depois de apresentar os conceitos de experimento e eventos, o objetivo dirigido para a avaliao do
sucesso de ocorrer um determinado evento do espao amostral de um experimento aleatrio. Por
exemplo, no lanamento de uma moeda, um nmero muito grande de vezes, o sucesso de ocorrer o
evento Cara medido pela probabilidade P(Cara), um valor dentro do intervalo (0, 1), incluindo am-
bos os limites.

A probabilidade de sucesso P(A) do evento A um nmero entre zero e um. Tendo


presente que a probabilidade P(A) est associada proporo de sucessos do evento A:
Se P(A)=0, o evento A nunca ocorrer, pois um evento impossvel.
Se P(A)=1, o evento A sempre ocorrer, pois um evento certo.
C A P T U L O 5 / PROBABILIDADE 151

O valor da probabilidade P(A) de um evento A no intervalo (0, 1) deve ser interpretado como mostra
a tabela seguinte, considerando que o experimento aleatrio repetido um nmero grande de vezes.

P(A) Significado de P(A)

1 Sempre ocorre

0,90 Ocorre 90% das vezes e no ocorre em 10% das vezes

0,50 Ocorre 50% das vezes e no ocorre em 50% das vezes

0,15 Ocorre 15% das vezes e no ocorre em 85% das vezes

0 Nunca ocorre

Essa tabela mostra que:


l A soma das probabilidades de todos os possveis resultados de um experimento aleatrio sempre
igual a um.
l A probabilidade de um evento ocorrer igual ao complemento desse mesmo evento no ocorrer. Se
P(A) a probabilidade de ocorrer o evento A, ento a probabilidade desse evento no ocorrer ser o
complemento (1P(A)).
l Por exemplo, se depois de repetir um nmero muito grande de vezes um experimento aleatrio
com espao amostral {C, D}, o evento C ocorreu em 68% das vezes, o que significa que o evento C
no ocorreu em 32% das vezes, que a probabilidade de ocorrer o evento D.
l Esse resultado mostra que a probabilidade do evento C ocorrer igual probabilidade comple-
mentar de ocorrer o evento D, isto , (1P(D))=10,68=0,32 ou 32%.
Conhecido o significado de probabilidade de um evento, o prximo passo mostrar como determi-
nar a probabilidade de um evento. Tradicionalmente h trs formas de determinar a probabilidade de
um evento, o procedimento terico (probabilidade clssica ou a priori), o procedimento de frequncia
relativa (probabilidade a posteriori) e o procedimento de probabilidade subjetiva.

Probabilidade terica de eventos


A probabilidade terica de um evento obtida utilizando procedimento de contagem. Por exemplo,
qual a probabilidade de obter cara no lanamento de uma moeda? Nesse caso, o espao amostral tem
apenas dois eventos elementares mutuamente excludentes, cara e coroa. Considerando que os eventos
cara e coroa so igualmente provveis e no h nenhuma condio que estabelea que um dos dois re-
sultados tenha alguma preferncia nem que um seja mutuamente dependente do outro, a probabilida-
de terica de obter cara obtida como resultado de dividir o nmero de eventos que atendem condi-
o cara pelo nmero total de eventos possveis:

Nmero de eventos favorveis


P(caras) =
Nmero de eventos possveis

Ento, a probabilidade de obter cara ser 0,5 ou 50%, resultado obtido de:

1
P(caras) = = 0,50 ou 50%
2

Esse resultado mostra que a probabilidade de obter coroa tambm 0,5, resultado obtido como o
complemento (1P(cara))=10,50=0,50 ou 50%.
152 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Qual a probabilidade terica de obter o nmero dois no lanamento de um dado? O espao amostral
do lanamento de um dado tem seis eventos elementares mutuamente excludentes {1, 2, 3, 4, 5, 6}.
Como os seis resultados so igualmente provveis, a probabilidade terica de obter qualquer um dos
eventos elementares 1/6. Resumindo:
l Quando os eventos de um experimento so igualmente provveis, a probabilidade de qualquer
evento pode ser obtida como um clculo terico de contagem. Em geral, se o nmero de eventos ele-
mentares for m, a probabilidade de qualquer evento elementar ser 1/m.
l A probabilidade terica de um evento o limite de sua frequncia relativa, assunto a ser tratado a se-
guir. Pela lei dos grandes nmeros, ao aumentar o nmero de experimentos, a frequncia relativa de
cada evento se aproximar de seu valor terico.

Frequncia relativa
Citando Peter Bernstein, ... Apenas em raros casos a vida imita os jogos de azar, em que podemos determinar
as probabilidades de um resultado antes que um evento chegue a ocorrer a priori, nas palavras de Jacob Ber-
noulli. Na maioria dos casos, temos de estimar as probabilidades com base no que aconteceu aps o fato a
posteriori. A prpria noo de a posteriori implica a experimentao e graus de crenas mutveis. ...2
A probabilidade P(A) de ocorrer o evento A de um experimento aleatrio pode ser obtida como a porcen-
tagem de ocorrncia do evento A, depois de repetir o experimento um nmero muito grande de vezes. Por
exemplo, repetindo um nmero muito grande de vezes o lanamento de uma moeda, a frequncia relativa
do evento cara ser obtida como resultado de dividir o nmero de caras observadas pelo nmero de repeti-
es do experimento. Nesse caso, a frequncia relativa do evento cara a prpria probabilidade P(Cara).

Nmero de caras observadas


P(caras) =
Nmero de repeties do experimento

Experimentalmente, pode-se observar que medida que o nmero de repeties do experimento au-
menta, a frequncia relativa de um evento tende a chegar a um determinado valor que definimos como
probabilidade desse evento, como possvel observar experimentalmente utilizando o modelo da plani-
lha Simulao deste captulo, mudando o nmero de lanamentos de uma moeda. A probabilidade teri-
ca de um evento seria o limite de sua frequncia relativa e, pela lei dos grandes nmeros, ao aumentar o
nmero de experimentos, a frequncia relativa de cada evento se aproximar de seu valor terico.
Nem sempre os eventos de um experimento so igualmente provveis; por exemplo, o preo de uma
ao daqui a um ano, comparado com o preo de hoje, poder subir ou baixar, incluindo neste ltimo
evento o evento permanecer constante. Na construo do espao amostral de eventos no igualmente
provveis, devem ser atendidas as seguintes condies.
l Os eventos do espao amostral devem ser mutuamente excludentes e coletivamente exaustivos. O
espao amostral do preo da ao daqui a um ano contm dois eventos mutuamente excludentes
com probabilidades diferentes.
l A soma das probabilidades dos eventos deve ser igual a um; por exemplo, se a probabilidade do
evento subir for 70%, a probabilidade do evento baixar dever ser 30%.

Simulador lanamento de uma moeda


Na planilha Simulao, includa na pasta Captulo 5, foi construdo o modelo que simula o lanamen-
to de uma moeda. Para facilitar a compreenso dos resultados, o modelo permite escolher um das trs

2 Desafio aos Deuses A Fascinante Histria do Risco, Editora Campus, 1997.


C A P T U L O 5 / PROBABILIDADE 153

quantidades de lanamentos programados, 1.500, 3.000 e 10.000 vezes, como mostra a Figura 5.6. Na
simulao do lanamento da moeda, foram utilizados a ferramenta de anlise Gerao de nmero alea-
trio e o tipo de distribuio discreta que gera os nmeros aleatrios 0 e 1 com probabilidade de 50%
para cada um. Esses valores representam, respectivamente, os eventos coroa e cara. Todo o procedi-
mento de simulao, da amostragem construo do grfico, passando pelas tabelas de acumulao do
nmero de caras, foi mecanizado utilizando macros do VBA3 Excel.
Os resultados importantes so dois: o nmero acumulado de lanamentos da moeda e a porcenta-
gem de caras acumuladas ou a frequncia relativa do evento cara representado pelo nmero 1. O mode-
lo deve ser utilizado da seguinte forma:

l Na caixa de grupo Nmero de lanamentos da moeda, selecione o nmero de lanamentos deseja-


dos clicando no boto de opo correspondente.
l Pressione o boto Nova Simulao para ativar a macro que realizar a simulao completa do lana-
mento de uma moeda a quantidade de vezes selecionada.

FIGURA 5.6 Simulao


de 1.500 lanamentos
de uma moeda.

Anlise dos resultados da simulao


A probabilidade terica de obter cara no lanamento de uma moeda 0,50 ou 50%. Entretanto, esse re-
sultado no significa que depois de lanar uma moeda, por exemplo, cem, mil, dez mil ou mais vezes
seguidas ocorrero exatamente 50% de caras e 50% coroas. Os grficos registrados nas Figuras 5.1, 5.6
e 5.7 mostram a frequncia relativa do evento cara para simulaes com 1.500, 5.000 e 10.000 lana-
mentos de uma moeda.

l O grfico das frequncias relativas de caras da Figura 5.1 comea ao redor de 54%, segue com oscila-
es abaixo de 50% e termina com um valor um pouco abaixo de 50% depois de completar 1.500
lanamentos.
l O da Figura 5.6 comea ao redor de 64% e continua diminuindo com pequenas oscilaes at con-
cluir ao redor de 52% depois de completar 1.500 lanamentos.
l O primeiro grfico da Figura 5.7, para 5.000 lanamentos, comea com 44%, permanece oscilan-
do a maior parte da simulao abaixo de 50% e termina com um valor ao redor de 51%. O segundo

3 VBA Visual Basic for Applications.


154 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

grfico, de 10.000 lanamentos, comea com 60% e permanece acima de 50% nos primeiros 5.500
lanamentos aproximadamente, depois permanece abaixo de 50% at concluir com um valor ao
redor de 49%.

52%

50%

48%

46%

44%

42%

FIGURA 5.7 40%


Frequncias relativas 0 1.000 2.000 3.000 4.000 5.000

de 5.000 e 10.000
lanamentos de 65%

uma moeda. 60%

55%

50%

45%

40%
0 2.000 4.000 6.000 8.000 10.000

Sugerimos que voc realize vrias simulaes seguidas para cada quantidade de lanamentos pro-
gramados e tente se sensibilizar com os resultados, primeiro em cada grupo de lanamentos, 1.500,
5.000 e 10.000, e depois tentando comparar os resultados entre esses grupos. Tente perceber que a pro-
babilidade terica de um evento seria o limite de sua frequncia relativa e, pela lei dos grandes nme-
ros, ao aumentar o nmero de experimentos a frequncia relativa de cada evento se aproximar do seu
valor terico. Contudo, os exemplos obtidos com o modelo de simulao mostram que 1.500 ou
10.000 lanamentos podem apresentar resultados parecidos, o que nos faz pensar que a quantidade de
lanamentos no tem tamanho ou h algum conceito que est fugindo ao nosso raciocnio. Voltemos
para Peter Bernstein ... Suponha que voc atire uma moeda repetidamente. A lei dos grandes nmeros no
diz que a mdia de suas jogadas se aproximar de 50% medida que voc aumentar o nmero de jogadas; a
matemtica elementar diz isto, poupando-lhe a tediosa tarefa de atirar a moeda repetidamente. Pelo contr-
rio, a lei enuncia que aumentar o nmero de jogadas aumentar igualmente a probabilidade de que a razo
entre as caras e o total de jogadas se desviar de 50% abaixo de uma quantidade especificada, por menor que
seja. ... No se est em busca da mdia real de 50%, mas da probabilidade de que o erro entre a mdia obser-
vada e a mdia real seja inferior a, digamos, 2% em outras palavras, de que o aumento do nmero de joga-
das aumenta a probabilidade de que a mdia observada no se desvie em mais de 2% da mdia real. ... Isso
no significa que no haver erro aps um nmero infinito de jogadas .... Tudo que a lei nos informa que a
mdia de um grande nmero de jogadas diferir por menos de que certa quantidade especificada da mdia
real mais provavelmente do que a mdia de um pequeno nmero de jogadas. Alm disso, sempre haver uma
possibilidade de que o resultado observado difira da mdia real por uma quantidade maior do que o limite es-
pecificado. ... Esse conceito est presente na Estimao da mdia da populao a partir de uma amostra
representativa, tema tratado no Captulo 11 deste livro. Apenas como ideia instigante, s vezes se diz
que se o nmero de experimentos tender a infinito, a frequncia relativa tender ao valor terico; no
entanto, parece que tambm pode no ser suficiente.
C A P T U L O 5 / PROBABILIDADE 155

Lei de Benford
Neste momento, tomamos um desvio do tema que estamos tratando para mostrar uma aplicao inte-
ressante da anlise de 0s e 1s da srie de resultados gerados pelo modelo construdo na planilha Simula-
o. Em continuao, reproduzimos parte de um artigo de jornal.4

O professor Dr. Theodore P. Hill pede sempre uma lio de casa especial para seus alunos de matemtica,
no Instituto de Tecnologia da Gergia. Parte deles deve lanar uma moeda duzentas vezes e registrar fiel-
mente seu resultado, enquanto a outra simplesmente deve fingir que jogou a moeda e inventar um resulta-
do para os duzentos supostos arremessos. No dia seguinte, para espanto dos alunos, Hill consegue, com
uma breve olhada nos trabalhos, apontar quase todos os que fraudaram os lanamentos. A verdade, disse
ele em uma entrevista, que a maioria das pessoas no sabe quais so as reais probabilidades de um exerccio
como esse e, portanto, no consegue inventar dados convincentes. ... As previses de probabilidades so muitas
vezes surpreendentes. No caso da experincia com o lanamento da moeda ... em algum ponto de uma srie
de duzentos arremessos de moeda, ou cara ou coroa aparecer seis ou mais vezes seguidas. Aqueles que
fraudaram um resultado no sabiam disso e evitaram simular longas sequncias de caras ou coroas, porque,
erroneamente, pensaram ser improvvel.

Primeiro sugerimos que voc verifique a afirmao do professor Hill na coluna B do modelo Simula-
o. Depois que continue com o artigo.

... Hill integra o cada vez maior contingente de estatsticos, contadores e matemticos que esto conven-
cidos do poder assombroso do teorema matemtico conhecido como Lei de Benford. O teorema uma ma-
neira poderosa e relativamente simples de apontar o dedo da suspeita para fraudadores, autores de desfal-
ques, sonegadores de impostos, contadores negligentes e at bugs de computador....

Essa linha de trabalho faz parte da Lei de Benford em homenagem ao Dr. Frank Benford que em 1938
divulgou a constatao de que as pginas da tabela de logaritmos dos nmeros comeando com o alga-
rismo 1 estavam mais sujas e desgastadas, acreditando que esse resultado no era de nenhuma prefe-
rncia pessoal por esses nmeros da tabela. Numa anlise de 20.229 conjuntos de nmeros de diferen-
tes categorias de informaes, todos esses registros seguiam o mesmo padro de probabilidade do pri-
meiro algarismo. Para explicar essa constatao, considerando que certeza absoluta definida como 1
e a impossibilidade absoluta como 0, Benford apresentou a seguinte frmulalog 10 (1 + 1 d), que retorna
a probabilidade do algarismo d=1, 2, ..., 9 ser o primeiro de um grupo de algarismos. Aplicando essa
frmula, a frequncia do algarismo 1 30,6%, a frequncia do algarismo 2 17,6% e a frequncia dos
demais algarismos continua decrescendo at 4,6% para o algarismo 9, resultados constatados em di-
versas pesquisas.5 Observe que as informaes pesquisadas no so respostas de eventos aleatrios,
nos quais todos os algarismos tm a mesma probabilidade de ocorrncia, como mostrado no Captulo 1
com a gerao de nmeros aleatrios e a planilha Simulao deste captulo.

rvore de possibilidades
A rvore de possibilidades a representao grfica dos eventos elementares de um espao amostral.
Essa representao muito til para organizar os clculos e os resultados de experimentos com mais de
uma etapa, por exemplo, o lanamento de uma moeda trs vezes seguidas. Em cada um dos trs lana-

4 Aplicao do teorema pode indicar fraudes de Malcom, W. Browne artigo publicado no jornal O Estado de So Paulo em 9/8/1998.
5 Mais informao sobre a Lei de Benford podem ser obtidas no site http://www.rexswain.com/benford.html com o artigo completo
de Malcom W. Browne publicado no jornal The New York Times em 4/8/1998. Tambm em outros endereos conseguidos pelo Goo-
gle ou outro mecanismo de busca equivalente.
156 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

mentos, h duas possibilidades de resultados, cara e coroa. Ao analisar a sequncia dos trs lanamen-
tos, deve-se raciocinar da seguinte forma:

l Os resultados do segundo lanamento sero combinados com os resultados do primeiro. O resulta-


do cara do primeiro se combinar com os dois resultados do segundo e, da mesma forma, o resultado
coroa do primeiro. Dessas combinaes resultam quatro eventos elementares.
l Os resultados do terceiro lanamento sero combinados com os quatro resultados dos dois primei-
ros lanamentos, resultando oito eventos elementares.

A rvore de possibilidades da Figura 5.8 mostra os oito eventos elementares do espao amostral S re-
ferente ao lanamento de uma moeda trs vezes seguidas: S={E1, E2, . . . , Ei , . . , E8}. Repetindo o experi-
mento um nmero muito grande de vezes, a frequncia relativa dos oito eventos ser prxima de 1/8,
pois, no limite, quando o nmero de experimentos tender a infinito, a frequncia relativa dos eventos
ser 1/8. De outra maneira, os oito eventos tm a mesma probabilidade 1/8, pois so eventos igualmen-
te provveis.
Ca Ca Ca
E1
Co
E2
Co Ca E3
Co E4
FIGURA 5.8 rvore de
possibilidades. Co Ca Ca E5
Co E6
Co Ca E7
Co E8

Regra da soma
Os eventos de um mesmo espao amostral podem ser combinados aplicando as regras das operaes
unio e interseo de conjuntos. Ao mesmo tempo, a probabilidade de uma combinao de eventos
pode ser obtida das probabilidades dos eventos, como mostra a regra da soma de eventos mutuamente
excludentes.

Sejam dois eventos mutuamente excludentes A e B com probabilidades P(A) e P(B).


A probabilidade P(A ou B) de ocorrer A ou B igual soma das probabilidades dos
eventos: P(A ou B)=P(A)+P(B).

EXEMPLO 5.3
Calcule a probabilidade de ocorrer apenas uma cara no lanamento de uma moeda trs vezes seguidas.

Soluo. Analisando os resultados da rvore de possibilidades da Figura 5.8, podemos ver que apenas os
eventos elementares E4, E6 e E7 tm uma cara. Pela regra da soma de eventos mutuamente excludentes, a pro-
babilidade de acontecer E4 ou E6 ou E7 igual 37,5%, resultado obtido da soma das probabilidades desses
eventos:
P(E4 ou E6 ou E7) = P(E4) + P(E6) + P(E7)
P(E4 ou E6 ou E7) = 1/8 + 1/8 + 1/8 = 3/8 = 0,375 ou 37,50%
C A P T U L O 5 / PROBABILIDADE 157

EXEMPLO 5.4
Continuando com o lanamento de uma moeda trs vezes seguidas. Qual a probabilidade de ocorrerem duas
ou mais caras?

Soluo. Analisando os resultados da rvore de possibilidades, verificamos que os eventos elementares E1, E2,
E3 e E5 tm duas ou mais cara. A probabilidade de ocorrerem duas ou mais caras 50%, resultado obtido de:
P(E1 ou E2 ou E3 ou E5) = P(E1) + P(E2) + P(E3) + P(E5)
P(E1 ou E2 ou E3 ou E5) = 1/8 + 1/8 + 1/8 + 1/8 = 4/8 = 0,50 ou 50%

Probabilidade condicional
As probabilidades estudadas at este momento so denominadas probabilidades incondicionais por-
que as nicas condies estabelecidas se referem ao experimento, resultados igualmente provveis etc.
Em alguns casos, interessa rever a probabilidade de um evento, pois h informaes adicionais que po-
dem afetar o resultado. Por exemplo, dentro do mesmo espao amostral, a probabilidade de que acon-
tea o evento X tendo acontecido, ou sabendo que aconteceu, o evento Y obtida a partir do espao
amostral reduzido, definido pelo evento Y. A probabilidade P(X/Y) denominada probabilidade condi-
cional.

EXEMPLO 5.5
Sabendo que no lanamento de trs moedas no aconteceram duas nem trs coroas, qual a probabilidade
que as trs moedas sejam cara?

Soluo. Comeamos por lembrar que a probabilidade de obter trs caras no lanamento de uma moeda
trs vezes seguidas 1/8 ou 12,50%. Qual a vantagem da informao de que no aconteceram nem duas
nem trs coroas? Ao tomar conhecimento antecipado dessa informao que denominamos evento Y, deduzi-
mos que o evento Y est formado pelos eventos elementares: {E1, E2, E3, E5}. O evento que os trs sejam cara
que denominamos X est formado por um nico evento elementar X={E1}. Portanto, a probabilidade de que
acontea X sabendo que aconteceu Y a probabilidade condicional P(X/Y)=25%, obtida com a frmula:

1
P(X Y ) = = 0,25
4

Observe que ao tomar conhecimento do evento Y do Exemplo 5.5, o espao amostral inicial formado
por oito eventos elementares foi reduzido para quatro eventos elementares. Portanto, ao tomar conhe-
cimento antecipado do evento Y, o espao amostral foi reduzido e, consequentemente, a probabilidade
das trs moedas serem cara aumentou de 12,50% para 25%.

A probabilidade condicional P(X/Y) entre os eventos X e Y pode ser obtida como


resultado da diviso da probabilidade conjunta P(X e Y) pela probabilidade do
P ( XeY )
evento Y : P ( X Y ) = .
P (Y )

EXEMPLO 5.6
Uma urna contm trs bolas, duas verdes V e uma branca B. Duas bolas so retiradas em sequncia, uma por
vez, e sem reposio. Calcule a probabilidade de que a segunda bola seja verde sabendo que a primeira tam-
bm foi verde.
158 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Soluo. O objetivo determinar a probabilidade condicional P(X/Y), onde Y o evento primeira bola de cor
verde e o evento X segunda bola de cor verde. O espao amostral inicial S={VV, VB, BV}. Ao tomar conhecimen-
to de que a primeira bola foi verde, o espao amostral do evento Y passa a ser: Y={VV, VB}. Desses dois possveis
resultados, apenas nos interessa um, o evento VV. Portanto, a probabilidade condicional P(Y/X) igual a 50%,
1
obtida com a frmula: P ( X Y ) = = 0,50.
2

Probabilidades conjunta e total


Um mesmo espao amostral pode ser analisado de diversas formas. Por exemplo, das respostas de
1.000 funcionrios a uma pesquisa interna da empresa de servios, na tabela seguinte foram registra-
dos os resultados do hbito de fumar dos funcionrios classificados por sexo, mulher e homem.

68 82

462 388

Para analisar as informaes dessa tabela melhor construir a tabela a seguir com os mesmos resul-
tados, porm considerando a populao de 1.000 funcionrios, registrando os valores unitrios ou
como percentagens. primeira tabela, foram adicionados outros resultados obtidos dos anteriores e
registrados nas novas coluna e linha adicionadas.

Mulher Homem Total

Fuma 0,068 0,082 0,15

No fuma 0,462 0,388 0,85

Total 0,53 0,47 1,00

A tabela construda denominada tabela de probabilidades conjuntas e marginais e uma forma prtica
de calcular a probabilidade condicional de dois eventos. Entretanto, analisemos primeiro os resultados:
l O primeiro resultado 0,068 indica que 6,8% das mulheres fumam. Esse resultado representa a pro-
babilidade conjunta: Fuma e Mulher.
l Da mesma forma, 38,8% dos homens no fumam. Esse resultado representa a probabilidade conjun-
ta: no Fuma e Homem.
l O total 0,15 da coluna Total o resultado da soma das probabilidades conjuntas 0,068 mais 0,082. O
resultado 0,15 ou 15% a probabilidade total, ou marginal, de Fuma ou, de outra maneira, 15% dos
que responderam tem o hbito de fumar.
l Da mesma forma, o total 0,53 da linha Total o resultado da soma das probabilidades conjuntas
0,068 mais 0,462. O resultado 0,53 ou 53% a probabilidade total de Mulher ou, de outra maneira,
53% dos que responderam so mulheres.
l Como controle, a soma das quatro probabilidades conjuntas deve ser sempre igual a 1 ou 100% e, da
mesma maneira, a soma das probabilidades da linha Total e da coluna Total deve ser sempre igual a 1
ou 100%.
Com os resultados dessa tabela possvel obter probabilidades condicionais, por exemplo, a proba-
bilidade de que o respondente da pesquisa seja mulher sabendo que no fuma. Essa pergunta pode ser
representada da seguinte forma P(Mulher/No fuma).
C A P T U L O 5 / PROBABILIDADE 159

Mulher Homem Total

Fuma 0,068 0,082 0,15

No fuma 0,462 0,388 0,85

Total 0,53 0,47 1,00

Como o evento conhecido No fuma, primeiro, na tabela selecionamos a linha No fuma, que re-
presenta o espao amostral reduzido, depois de ter tomado conhecimento do evento No fuma. Depois,
calculamos a probabilidade P(Mulher/No fuma)=0,5435 ou 54,35%, dividindo a probabilidade con-
junta 0,462 pela probabilidade total 0,85. Esse mesmo resultado pode ser obtido diretamente com a
frmula, utilizando os resultados da ltima tabela.

P( XeY )
P( X Y ) =
P(Y )

0,462
P(Mulher/NoFuma) = = 0,5435
0,85

Deixamos para o leitor verificar que a probabilidade de o respondente da pesquisa no fumar saben-
do que mulher P(No fuma/Mulher)=0,8717 ou 87,17%. H outras possveis perguntas, por exem-
plo, a probabilidade condicional P(Homem/Fuma) ou a P(Fuma/Homem) etc.

EXEMPLO 5.7
Dos eventos C e D de um mesmo espao amostral so conhecidas as probabilidades P(C e D)=0,125,
P(C)=0,50 e P(D)=0,25. Construa a tabela de probabilidades conjuntas e marginais e depois calcular a proba-
bilidade condicional P(No C/D).

Soluo. Comeamos por registrar os dados dos eventos C e No C, e D e No D, na tabela seguinte.

D No D Total
C 0,125 0,50
No C
Total 0,25 1,00

Sabendo que a soma das probabilidades da linha Total e da coluna Total devem ser sempre igual a 1 ou
100%, completamos os resultados que faltam nessa linha e nessa coluna. Da mesma maneira, as probabilida-
des conjuntas que faltam podem ser obtidas aplicando as regras das somas, lembrando que a soma das proba-
bilidades conjuntas deve ser sempre igual a 1 ou 100%. Dessa maneira, obtemos a tabela seguinte de probabi-
lidades conjuntas e totais.

D No D Total
C 0,125 0,375 0,50
No C 0,125 0,375 0,50
Total 0,25 0,75 1,00

A probabilidade condicional P(No C/ D) calculada da seguinte forma. Como o evento conhecido D, pri-
meiro, na tabela selecionamos a coluna D que representa o espao amostral reduzido. Depois, calculamos a pro-
babilidade P(No C/ D)=0,50 ou 50% dividindo a probabilidade conjunta 0,125 pela probabilidade total 0,25.
160 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

importante destacar que a tabela de probabilidades conjuntas e marginais pode ter mais de duas li-
nhas ou colunas, dependendo dos valores possveis de cada evento.

Regra do produto
Da frmula da probabilidade condicional, obtm-se a importante regra do produto das probabilidades
P( XeY ) = P( X Y ) P(Y ).

EXEMPLO 5.8
Repetindo o enunciado do Exemplo 5.6, uma urna contm trs bolas, duas verdes V e uma branca B. Duas bolas
so retiradas em sequncia, uma por vez. Calcule a probabilidade conjunta de que as duas bolas sejam verdes.

Soluo. Embora no seja necessrio, comeamos por construir a tabela das probabilidades conjuntas e
totais. Os ttulos das duas linhas da tabela se referem primeira retirada de uma bola, e os ttulos das duas
colunas se referem segunda retirada de uma bola. No miolo da tabela, esto registrados os resultados pos-
sveis depois das duas retiradas seguidas sem reposio de uma bola da urna.

Verde Branca
Verde 2 2
Branca 2 0

A probabilidade conjunta de que as duas bolas sejam verdes, ou P(X e Y)=2/6=1/3, est registrada na pri-
meira clula desta tabela.

Verde Branca Total


Verde 2/6=1/3 1/6 4/6=2/3
Branca 2/6=1/3 0 2/6=1/3
Total 4/6=2/3 1/6 6

Repetindo o clculo da probabilidade de que a segunda bola seja verde sabendo que a primeira tambm foi
verde, Exemplo 5.6, da tabela anterior obtemos o valor 0,50 como resultado da diviso de 2/6 por 4/6.

Regra do produto Eventos Independentes


Se um evento no depender da ocorrncia de outro evento anterior, os eventos so definidos como
eventos independentes. Nesse caso, se os eventos X e Y so independentes, ento a probabilidade con-
dicional de um evento ser dada pela expresso P( X ) = P( X Y ), e a probabilidade do produto de dois
eventos independentes ser P( XeY ) = P( X ) P(Y ), que a regra do produto de eventos independentes.

EXEMPLO 5.9
Qual a probabilidade de ocorrerem trs caras no lanamento de trs moedas?

Soluo. A probabilidade de cada lanamento 0,50. A probabilidade de ocorrerem trs caras ser 12,50%,
obtida da frmula:

P ( XeYeZ ) = P ( X) P (Y ) P (Z )

P ( XeYeZ ) = 0,50 0,50 0,50 = 0,125


C A P T U L O 5 / PROBABILIDADE 161

Vejamos algumas concluses:6


P( XeY )
l A probabilidade condicional entre dois eventos X e Y regida pela expresso P( X Y ) = ,
P(Y )
onde P(Y) 0.
l Se os eventos X e Y forem mutuamente excludentes, ento P(X e Y) = 0 e, consequentemente,
P(X/Y)=0. Portanto, P(X/Y) P(X) e os eventos sero necessariamente dependentes.
l Se os eventos X e Y verificarem que P(X e Y) 0, os dois eventos podero ser independentes, pois no
podemos afirmar que sejam independentes salvo que se verifique a igualdade P(X e Y) = P(X) P(Y)
para cada par de valores.

Tcnicas de contagem
Listar e contar os eventos elementares do experimento aleatrio lanamento de uma moeda trs vezes
seguidas um procedimento simples, pois o nmero de resultados do espao amostral desse experi-
mento pequeno. Entretanto, se o experimento fosse o lanamento de um dado trs vezes seguidas ou
o lanamento de uma moeda oito vezes seguidas, o procedimento de listar e contar todos os possveis
resultados seria trabalhoso. As tcnicas de contagem7 ajudam a determinar, sem necessidade de enu-
merao direta, o nmero de resultados possveis de um espao amostral. Para facilitar o procedimento
de clculo, as tcnicas de contagem sero apresentadas combinadas com as funes matemticas e esta-
tsticas do Excel.

EXEMPLO 5.10
Determine o nmero de resultados possveis do lanamento de um dado trs vezes seguidas.

Soluo. A contagem realizada em trs passos:


Cada lanamento de um dado tem seis resultados possveis {1, 2, 3, 4, 5. 6}.
Os seis resultados do segundo lanamento sero combinados com cada um dos seis resultados do primeiro
lanamento totalizando 36 possveis resultados.
Os seis resultados do terceiro lanamento sero combinados com cada um dos 36 resultados acumulados
dos dois lanamentos anteriores, totalizando 216 resultados.

O Exemplo 5.10 mostra o procedimento de contagem realizado com a frmula da multiplicao, se


de uma determinada ocorrncia h m resultados e, em sequncia, de outra ocorrncia h n resultados,
ento h mn resultados associados. Utilizando os dados do Exemplo 5.10, conclumos que o nmero
de resultados do lanamento de um dado trs vezes seguido 6 6 6 = 63 = 216

EXEMPLO 5.11
A placa dos carros que circulam em todo o pas formada por trs letras seguidas de quatro algarismos de zero
a nove. Determinar o nmero de placas possveis considerando que podem ser utilizadas 22 letras em cada
posio, e o primeiro algarismo no pode ser zero.

Soluo. O nmero de placas possveis 9.583.200 obtido com a frmula:

22 22 22 9 10 10 = 223 9 102 = 9583200


. .

6 Voc pode passar este assunto, sem perda de continuidade com o resto do livro.
7 Conhecidas tambm como Anlise Combinatria.
162 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Permutaes
Os resultados dos Exemplos 5.10 e 5.11 mostram que a frmula da multiplicao retorna o nmero de
resultados associados de dois ou mais grupos. A frmula da permutao d o nmero de arranjos de um
mesmo grupo.

EXEMPLO 5.12
Calcule o nmero de permutaes das cinco letras a, b, c, d e e tomadas trs a trs, quatro a quatro e cinco a
cinco.

Soluo. Para contar o nmero de permutaes procedemos assim:


A primeira letra pode ser qualquer uma das cinco letras a, b, c, d e e.
A segunda letra pode ser qualquer uma das quatro letras restantes.
A terceira letra pode ser qualquer uma das trs letras restantes.
O nmero de permutaes das cinco letras a, b, c, d e e tomadas trs a trs 60, h 60 palavras de trs letras
distintas, resultado obtido com a frmula da multiplicao 60=543. Esse resultado pode ser obtido com a
funo PERMUT do Excel.
PERMUT(n; r)
A funo estatstica PERMUT8 retorna o nmero de arranjos de n elementos tomados em grupos de r. Os
valores de n e r so nmeros inteiros positivos; entretanto, a funo PERMUT aceita nmeros fracionrios
que so truncados para nmeros inteiros antes de calcular os fatoriais.
Neste exemplo, a frmula =PERMUT(5;3) registrada em uma clula vazia de uma planilha Excel retorna o
resultado 60. Na planilha Funes para Contagem, includa na pasta Captulo 5, esto registradas as
formas de utilizar a funo PERMUT como as que sero apresentadas a seguir.
A quarta letra pode ser qualquer uma das duas letras restantes.
O nmero de permutaes das cinco letras a, b, c, d e e, tomadas quatro a quatro, 120, resultado obtido
com a frmula da multiplicao 120=5432. Com a frmula =PERMUT(5;4), tem-se o resultado 120.
A quinta letra a ltima letra restante.
O nmero de permutaes das cinco letras a, b, c, d e e, tomadas cinco a cinco, tambm 120, resultado
obtido com a frmula da multiplicao 120=54321. Com a frmula =PERMUT(5;5), tem-se 120.

Os resultados do Exemplo 5.12 correspondem ao nmero de permutaes de cinco letras tomadas


trs a trs, quatro a quatro e cinco a cinco. De forma geral, o nmero P(n,r) de permutaes de n objetos
associados em grupos de r calculado com a frmula:

P(n, r ) = n (n 1)  (n r + 1)

Tendo presente que o fatorial do nmero natural n o produto de todos os n primeiros nmeros in-
teiros e positivos e representado pelo smbolo n ! = n (n 1) (n 2)  3 2 1, definindo que
0!=1, a frmula do nmero de permutaes pode ser escrito com fatoriais:

n!
P(n, r ) =
(n r )!

Aplicando esta ltima frmula para calcular o resultado do Exemplo 5.12:

5!
P(5,3) =
(5 3)! = 60

8 Em ingls, a funo PERMUT PERMUT.


C A P T U L O 5 / PROBABILIDADE 163

Esse resultado pode ser obtido com a funo FATORIAL do Excel.

l FATORIAL(n)
A funo matemtica FATORIAL9 retorna o fatorial do nmero n sendo n um nmero no negativo. Se
n no for inteiro, ser truncado para um nmero inteiro antes de realizar o clculo.10 Por exemplo:
l O fatorial de n=5 5!=54321=120, resultado que tambm pode ser obtido com a frmula
=FATORIAL(5) digitada em qualquer clula vazia da planilha Excel.
l Para resolver a primeira questo do Exemplo 5.12, a frmula =FATORIAL(5)/FATORIAL(5-3)
registrada numa clula do Excel retornar o nmero de permutaes 60.

Na planilha Funes para Contagem, includa na pasta Captulo 5, esto registradas as formas de
utilizar a funo FATORIAL e as outras funes do Excel utilizadas neste captulo.
Vejamos um caso especial da permutao. Se x=r, o nmero de permutaes ser igual a
n!
P(n, n) = = n !, que a prpria expresso do fatorial de n, que representa o nmero de permuta-
(n n)!
es de n objetos tomados todos ao mesmo tempo, como mostrado no Exemplo 5.12. Essa condio
mostra que a frmula =PERMUT(5;5) equivalente a =FATORIAL(5).

Combinaes
O resultado b, c, d como os resultados c, b, d e d, c, b fazem parte dos 60 resultados da permutao de
cinco objetos identificados pelas letras, a, b, c, d e e tomados trs a trs do Exemplo 5.12. Como esses
trs resultados tm as mesmas letras b, c e d, deduzimos que, na contagem das permutaes, a ordem
dos objetos importante. H casos em que o que interessa o prprio objeto sem interessar a ordem de
como foi obtido; nesse caso, o tipo de contagem denominada combinao.
Por exemplo, vimos que o nmero de permutaes de cinco letras a, b, c, d e e tomadas trs a trs sem
considerar a ordem das letras igual a 60. Mas nesse resultado esto includas todas as permutaes
possveis de trs letras que igual a 6=321. O nmero de combinaes ser igual a 10, resultado obti-
do da diviso do nmero de permutaes pelo nmero de permutaes de trs letras, como mostra a
frmula:

P(5,3)
= 10
3!

De forma geral, o nmero C(n,r) de combinaes de n objetos associados em grupos de r calculado


com a frmula:

n!
C (n, r ) =
r !(n r )!

Portanto, o resultado da combinao de cinco letras associadas em grupos de trs letras


5!
C(5,3) = = 10.
3!(5 3)!
Esse resultado pode ser obtido com a funo COMBIN do Excel.

9 Em ingls, a funo FATORIAL FACT.


10 O Excel dispe tambm das funes FACTDOUBLE e MULTINOMIAL, em ingls FACTDOUBLE e MULTINOMIAL.
164 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l COMBIN(n; x)
A funo matemtica COMBIN11 retorna o nmero de combinaes de x objetos tomados x a x, con-
siderando que a ordem dos objetos no interessa. Os valores de n e x so nmeros inteiros positivos;
entretanto, a funo COMBIN aceita nmeros fracionrios que so truncados para nmeros inteiros
antes de calcular os fatoriais. Por exemplo, o nmero de combinaes de cinco objetos tomados trs
a trs dez, valor obtido registrando a frmula =COMBIN(5;3) numa clula vazia do Excel. Verifi-
que que:
l A frmula =FATORIAL(5)/(FATORIAL(5-3)*FATORIAL(3)) registrada numa clula vazia de
Excel retorna o resultado 10.
P( x , r )
l Das frmulas P(n,r) e C(n,r), obtm-se a igualdadeC (n, r ) = . Da mesma forma, pode-se ver
r!
PERMUT (n; x)
que COMBIN (n; x) = .
FATORIAL ( x)

Na planilha Funes para Contagem, includa na pasta Captulo 5, esto registradas as formas de
utilizar a funo COMBIN e as outras funes do Excel utilizadas neste captulo.

Problemas
Problema 1
No lanamento de uma moeda dez vezes seguidas ocorreram dez coroas. Se a moeda for lanada mais
uma vez, qual a probabilidade de que seja cara? Por qu?
R: P(cara)=50%

Problema 2
Suponha que depois de lanar uma moeda dez vezes seguidas, a frequncia relativa do evento cara seja
70%. razovel aceitar esse resultado? Por qu?
R: Sim.

Problema 3
Jogue um dado e observe o resultado. Se o experimento for repetido um nmero muito grande de ve-
zes, que proporo do total de lanamentos ter o resultado observado no primeiro lanamento do
dado? Por qu?
R: 1/6

Problema 4
Se depois de lanar um dado doze vezes seguidas, a frequncia relativa do resultado cinco for 75% ra-
zovel aceitar esse resultado? Por qu?
R: Sim.

Problema 5
Continuando com o lanamento de uma moeda trs vezes seguidas, qual a probabilidade de obter pelo
menos duas coroas?
R: P(pelo menos duas coroas)=50%

11 Em ingls, a funo COMBIN COMBIN.


C A P T U L O 5 / PROBABILIDADE 165

Problema 6
Suponha que depois de lanar uma moeda cem mil vezes seguidas a frequncia relativa do evento cara
seja igual a 0,70. razovel aceitar esse resultado? Por qu?
R: Sim, porm com baixssima probabilidade de ocorrer.

Problema 7
Qual a probabilidade de ocorrerem trs coroas no lanamento de trs moedas?
R: P(as trs moedas com coroa)=12,50%

Problema 8
Continuando com o lanamento de uma moeda trs vezes seguidas, qual a probabilidade de obter as
trs moedas com a mesma face?
R: P(as trs moedas com a mesma face)=25%

Problema 9
No lanamento de um dado, qual a probabilidade de obter: a) um nmero menor do que cinco e b) um
nmero par?
R: a) P(nmero menor do que cinco)=4/6 b) P(um nmero par)=3/6=1/2

Problema 10
Uma moeda lanada duas vezes seguidas. Sabendo que o resultado de uma das moedas foi cara, qual a
probabilidade que a outra moeda seja tambm cara?
R: P=1/3

Problema 11
Um homem tinha dois gatos, um preto e um branco. O branco era macho. Qual a probabilidade de
que o outro fosse macho?12
R: P=1/2

Problema 12
Um homem tinha dois gatos. Um deles, pelo menos, era macho. Qual a probabilidade de que os dois
fossem machos?13
R: P=1/3. Analise como o Problema 8.

Problema 13
Semanalmente so sorteados seis nmeros de um grupo de 60 nmeros. Quantos so os resultados
possveis de um sorteio semanal?
R: Resultados possveis: 50.063.860

Problema 14
Continuando com o Problema 13. Se voc concorrer nesse sorteio, qual a probabilidade de acertar o
prmio?
R: P=1/50.063.860, considerando todos os resultados igualmente provveis.

12 Exemplo de O Enigma de Sherazade de Raymond Smullyan, Jorge Zahar Editor, 1997.


13 Veja nota de rodap 12.
166 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problema 15
Semanalmente so sorteados cinco nmeros de um grupo de 80 nmeros. Quantos so os resultados
possveis de um sorteio semanal e qual a probabilidade de acertar o prmio?
R: Resultados possveis: 24.040.016 P=1/24.040.016, considerando todos os resultados igualmente
provveis.

Problema 16
Um fabricante de microcomputadores decidiu vender pela Internet unidades padronizadas definidas
pelo comprador. Para comear, estabeleceu as seguintes alternativas: dois tipos de CPU, duas mem-
rias RAM, trs capacidades de discos rgidos e quatro tipos de monitores. Quantas configuraes so
possveis de montar?
R: 48 configuraes

Problema 17
A probabilidade de um estudante obter o conceito mximo A no primeiro teste de estatstica 25%, e a
probabilidade de obter o mesmo conceito A no segundo teste tambm 25%. Sabendo que a probabili-
dade de obter A nos dois testes 15%, qual a probabilidade do estudante obter menos do que A no se-
gundo teste, sabendo que no primeiro teste obteve o conceito A?
R: P(No A/A)=0,10/0,25=40%

Problema 18
Continuando com o Problema 17. Qual a probabilidade do estudante obter menos do que A nos dois testes?
R: P(No A e No A)=0,10/0,25=40%

Problema 19
Uma pesquisa de mercado mostrou que 80% das casas pesquisadas tm um aparelho de TV em cores e
que 30% das casas pesquisadas tm um forno de micro-ondas. A pesquisa mostrou tambm que 20%
das casas pesquisadas tm um aparelho de TV em cores e um forno de micro-ondas. Qual a porcenta-
gem das casas pesquisadas que no tm nenhum dos dois?
R: 10%

Problema 20
Qual a porcentagem das casas pesquisadas que no tm um aparelho de TV em cores, porm tem um
forno de micro-ondas?

Problema 21
O gerente do departamento de atendimento de uma revendedora de carros agrupou as reclamaes dos
clientes no ltimo ms em: Cliente Atendido e No Atendido, e Cliente Exigente e Normal, como registra-
do tabela seguinte:

3 56

17 24

Escolhendo aleatoriamente um cliente, calcule a probabilidade de que:


a. O cliente tenha sido atendido sabendo que um cliente Exigente.
b. O cliente no tenha sido atendido sabendo que um cliente Normal.
R: a) P(Atendido/Exigente)=15% b) P(No Atendido/Normal)=30%
C A P T U L O 5 / PROBABILIDADE 167

Problema 22
A gerncia de vendas da rede de Magazines classificou as compras de 100 clientes por tipo de produto
comprado e por idade do comprador e os resultados esto registrados na tabela seguinte:

<30 30-40 41-50 >50

Eletrodomsticos 12 10 11 14

Vestirio 10 7 8 6

Lazer 1 3 5 13

Determine:
a. A probabilidade de que um cliente tenha mais que 40 anos.
b. A probabilidade de um cliente ter mais que 50 anos, sabendo que comprou um produto de lazer.
c. A probabilidade de um cliente ter mais que 40 anos, sabendo que comprou um produto de vestirio.
R: a) 57% b) 59,1% c) 45,2%

Problema 23
Em uma simulao de 1.000 lanamentos de uma moeda realizada com o modelo da planilha Simula-
o, qual das duas sequncias de 1s seguintes tm mais chance de ocorrer, A ou B? Por qu?

A={... 0 0 1 1 1 0 1 1 1 1 1 1 0 1 1 0 0....}
B={... 0 1 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1....}
Captulo 6
CORRELAO

A t este momento, foram analisados os dados de uma amostra ou varivel pertencente a uma popu-
lao. Outra anlise importante determinar como uma varivel se relaciona com outras variveis
da mesma populao. Neste captulo, ser mostrada uma forma de medir quanto e de que maneira se
relacionam duas variveis. H muitos exemplos de relaes entre amostras, por exemplo, geralmente
os meios de comunicao divulgam informaes de variveis relacionadas obtidas de resultados de
pesquisas como:

l Nas Instituies de Ensino Superior IES h uma relao direta entre a qualidade do ensino e a taxa
de inadimplncia. A taxa de inadimplncia das IES que obtiveram conceitos A e B no Provo
12,1%, nas que obtiveram C 16% e nas que obtiveram D e E a inadimplncia de 21,9%.1
l O frio est para o setor farmacutico como o Dia das Mes est para o comrcio. As vendas de medi-
camentos no controlados, como analgsicos, antigripais e vitaminas, disparam.2
l O faturamento das empresas de energia nos Estados Unidos diretamente influenciado pela tempe-
ratura, especialmente no inverno. Um inverno brando reduz a demanda de energia para calefao e
pode diminuir drasticamente o lucro.3

A partir desses exemplos, voc poder encontrar outras relaes como, por exemplo, reduzindo o
custo, o preo do produto ser reduzido e ser possvel aumentar a quantidade vendida, ou funcionrio
com maior escolaridade ter mais chance de crescer na empresa etc. Em qualquer caso, importante
lembrar que a informao recebida nem sempre corretamente exposta, como no caso da relao dire-
ta entre qualidade do ensino das IES e a taxa de inadimplncia que, na realidade, mantm uma relao
inversa, pois a instituio com maior conceito corresponde menor taxa de inadimplncia.
Os grficos de disperso da Figura 6.1 mostram dois tipos de relao entre as variveis X e Y. O grfi-
co de disperso da esquerda mostra uma relao direta ou positiva, tendncia destacada pela declivida-
de positiva da elipse tracejada, enquanto o grfico de disperso da direita mostra uma relao inversa
ou negativa, tendncia tambm destacada pela declividade negativa da elipse tracejada.

1 A Presso da inadimplncia, artigo de P. de Athayde publicado na revista Carta Capital de 15/10/2003.


2 Frio chega e venda de remdios dispara, artigo de C. Silva publicado no jornal O Estado de So Paulo de 25 de maio de 2004.
3 Alugue o sol artigo de Cludio Gradilone publicado na revista Exame em 6/2/2002. Divulga a proteo financeira com derivativos de
clima ou weather derivatives.
170 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Coeficiente de correlao = 0,81 Coeficiente de correlao = 0,81


3 4

2 3
2
1
Y 1

Y
0
0
1 1
2 2
3 3
3 2 1 0 1 2 3 3 2 1 0 1 2 3
X X

FIGURA 6.1 Dois tipos de relaes entre duas variveis.

EXEMPLO 6.1
O diretor de vendas da rede de varejo nacional est analisando a relao entre o investimento em propaganda
e as vendas da empresa utilizando os dados registrados no intervalo B3:C13, incluindo os ttulos, da planilha
Exemplo 6.1, includa na pasta Captulo 6. Analise a relao entre essas duas amostras.

Soluo. Com os dados da tabela, foi construdo o grfico de disperso como, mostra a figura a seguir. Os re-
gistros dos dez pares de valores investimento e vendas mostram uma clara relao direta ou positiva, pois
medida que o investimento em propaganda aumenta, as vendas tambm aumentam, e vice-versa. Esse grfi-
co mostra que as duas variveis esto correlacionadas de forma positiva.

EXEMPLO 6.2
Os retornos anuais durante os ltimos seis anos da Ao A e da Ao B negociadas na Bolsa de Valores esto re-
gistrados na planilha Exemplo 6.2, includa na pasta Captulo 6. Realize uma anlise estatstica desses retor-
nos e da relao entre eles.
Soluo. No intervalo B3:D9 foram registrados os retornos das aes. No intervalo F4:H9 foram calculadas e
registradas as medidas estatsticas mediana, mdia, desvio padro, coeficiente de variao e coeficiente de in-
clinao, como mostra a prxima figura.
C A P T U L O 6 / CORRELAO 171

As medidas estatsticas dos retornos das duas aes so parecidas, exceto o coeficiente de inclinao, que
indica formas diferentes das distribuies dos retornos como fica confirmado pelos histogramas construdos
com a ferramenta de anlise Histograma. Os histogramas dos retornos mostram que essas duas amostras tm
particularidades que as medidas estatsticas no conseguem capturar. Para ver a diferena entre os retornos
das duas aes, na mesma planilha foi construdo o grfico de disperso que mostra a relao negativa entre
os retornos das duas aes. Analisemos o grfico de disperso:

Partindo do ano 1999, retornos 9% e 12%, respectivamente Ao A e Ao B, no ano 2000, o retorno da


Ao A aumentou para 10%, enquanto o retorno da Ao B diminuiu para 10,50%. No ano 2001, os retor-
nos mantiveram a mesma tendncia do ano 2000.
Nos anos 2002 e 2003, os retornos inverteram a tendncia anterior. Enquanto o retorno da Ao A diminuiu,
o retorno da Ao B aumentou.
No ano 2004, os retornos das aes A e B inverteram novamente a tendncia dos dois anos anteriores.

As medidas estatsticas dos retornos anuais das aes A e B do Exemplo 6.2 so parecidas, porm o
grfico de disperso mostra que os retornos tm tendncias opostas. A covarincia e o coeficiente de
correlao medem a tendncia e a fora da relao linear entre as duas variveis ou amostras.

Covarincia
O coeficiente de correlao pode ser calculado diretamente com a frmula do coeficiente de Pearson;
entretanto, preferimos iniciar este assunto definindo primeiro a covarincia de duas variveis, apre-
sentao parecida realizada com o desvio padro, definindo primeiro a varincia.

A covarincia XY das variveis X = X1 , X2 , , XN e Y = Y1 ,Y2 , ,YN , consideradas como


populao : 4
1 N
XY = (Xi X ) (Yi Y )
N i =1

4 Quando necessrio, as variveis so separadas com vrgula, X,Y e SX,Y.


172 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

A covarincia S XY das variveis X = X1 , X2 , , X n e Y = Y1 ,Y2 , ,Y n , consideradas como


amostra :
1 n
S XY = ( Xi X ) (Yi Y )
n 1 i =1

EXEMPLO 6.3
Calcule a covarincia das variveis do Exemplo 6.1.

Soluo. Os dados desse exemplo foram registrados na planilha Exemplo 6.3, includa na pasta Captulo
6, como mostra a figura seguinte incluindo os resultados. O primeiro resultado necessrio e o valor das mdias
das duas variveis, calculadas e registradas nas clulas D16 e D17. Depois:
Na clula D4, foi registrada a frmula =B4-$D$16 que calcula o desvio do primeiro dado da varivel Propa-
ganda. Essa frmula foi copiada at a clula D13. O mesmo procedimento foi utilizado para calcular e regis-
trar os desvios da varivel Vendas.
Na clula F4 foi registrada a frmula =D4*E4 que retorna o produto dos desvios do primeiro dado. Essa fr-
mula foi copiada at a clula D13.

No intervalo de resultados:

Na clula D18 foi registrada a frmula =SOMA(F4:F13) que calcula a soma dos produtos dos desvios.
Com a frmula =D18/CONT.NM(B4:B13), registrada na clula D19, calculada a covarincia da popula-
o XY=985,50. E na clula D20 foi registrada a frmula =D18/(CONT.NM(B4:B13)-1) que calcula a co-
varincia da amostra SXY=1.095,00.

O resultado da covarincia da populao tambm pode ser obtido com a funo COVAR do Excel, regis-
trando a frmula =COVAR(B4:B13;C4:C13) na clula D22. A sintaxe da funo COVAR a seguinte:

COVAR(matriz1; matriz2)
A funo estatstica COVAR5 retorna a covarincia da populao dos valores registrados nos argumentos
matriz1 e matriz2. Esses argumentos podem ser registrados como intervalos de uma planilha, como j mos-

5 Em ingls, COVAR COVAR.


C A P T U L O 6 / CORRELAO 173

trado, tomando o cuidado de verificar que as duas variveis tenham a mesma quantidade de dados. Tam-
bm possvel registrar os argumentos como matriz na prpria frmula da funo, evitando registrar os va-
lores da amostra num intervalo de clulas da planilha como foi feito na clula D29, registrando a frmula
=COVAR({30;21;35;42;37;20;8;17;35;25};
{430;335;520;490;470;210;195;270;400;480})

Caractersticas da covarincia
A covarincia mede a tendncia e a fora da relao linear entre duas variveis. Das expresses da cova-
rincia para populao e para amostra temos seguintes caractersticas:

l As duas amostras ou variveis devem ter o mesmo nmero de dados.


l Os pares de dados ocorrem ao mesmo tempo, so pares casados. Embora possa parecer redundante,
tenha presente que no se pode mudar a ordem de uma nica varivel; a mudana de ordem dever
ser realizada nas duas amostras sem descasar os pares de dados.
l A covarincia a mdia dos produtos dos desvios das duas amostras ou variveis, obtida como resul-
tado da diviso:
l No caso de populao, da soma dos produtos dos desvios pela quantidade de dados das variveis.
l No caso de amostra, da soma dos produtos dos desvios pela quantidade de dados das variveis
menos um.6
l Os numeradores das expresses da covarincia para populao e para amostra so iguais, o resulta-
do da soma dos produtos dos desvios.

700 14%
27 10,3%
600
13%
Vendas

500
Ao B

400 380 12%


300 11% 10,8%
200
10%
100
0 9%
0 10 20 30 40 50 60 Ao A
8%
Propaganda 8% 9% 10% 11% 12% 13%

FIGURA 6.2 Anlise dos grficos de disperso dos Exemplos 6.1 e 6.2.

l A covarincia pode assumir qualquer valor do conjunto dos nmeros reais, pois pode ser nula, nega-
tiva ou positiva. Baseada na definio dos produtos dos desvios,7 uma explicao intuitiva que a
covarincia a medida do afastamento simultneo das respectivas mdias. Se ambas as variveis
aleatrias tendem a estar simultaneamente acima, ou abaixo, de suas respectivas mdias, ento a co-
varincia tender a ser positiva e, nos outros casos, poder ser negativa, como mostram os grficos
de disperso da Figura 6.2.
l O grfico da esquerda mostra que a maioria dos pares de valores do Exemplo 6.1 tem os dois valo-
res acima de sua mdia correspondente, provocando a covarincia positiva, resultado que pode
ser confirmado no Exemplo 6.3.
l O grfico da direita mostra que a maioria dos pares de valores do Exemplo 6.2 tem um valor acima
da mdia e o outro abaixo da mdia correspondente, provocando a covarincia negativa, como
poder ser confirmado no Exemplo 6.4.
l Da mesma forma que a varincia, a covarincia afetada pelos valores extremos da varivel, ela no
uma medida resistente.

6 Equivalente ao caso da varincia da amostra S2, Captulo 4.


7 Copeland T. Opes Reais, Editora Campus 2001.
174 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l A unidade de medida o resultado do produto das unidades dos valores das variveis; no caso do
Exemplo 6.1, a unidade o binmio vendas e investimento e, no Exemplo 6.2, o binmio % e %, am-
bas sem nenhum significado prtico.

Regras operacionais da covarincia


As propriedades8 mais importantes da covarincia so:

l Outra forma de calcular a covarincia com a seguinte frmula para a populao que tem a vantagem
de no ter de calcular os desvios. No Apndice 1 voc encontra a demonstrao desta frmula:

N
1
XY =
N
X i Yi X Y
i =1

l O Exemplo 6.3 mostra como calcular a covarincia da populao e a covarincia da amostra, proce-
dimentos que diferem apenas no valor do divisor da soma dos produtos dos desvios. De forma equi-
valente ao realizado com as varincias da populao e da amostra, a partir das expresses das cova-
rincias, pode-se estabelecer a seguinte igualdade:

N
(X i X ) (Yi Y ) = XY N = S XY (n 1)
i =1

Portanto, a expresso de equivalncia entre as duas covarincias :

N
S XY = XY
n1

A covarincia da amostra do Exemplo 6.3 pode ser obtida a partir do valor da covarincia da popula-
o com a frmula:

10
S XY = (985,5) = 1095
. ,00
10 1

l A covarincia de uma varivel, e ela mesma, a prpria varincia da varivel, seja no caso de popula-
o ou amostra. Como Y = X, ento:

N N
(X i X ) (X i Y ) (X i X ) 2
i =1 i =1
XX = = = 2X
N N

l A permutao das variveis no altera o resultado da covarincia, se os pares de valores no forem al-
terados: XY = YX .
l H outras propriedades operacionais muito prticas. Por exemplo, representando a covarincia
como Cov(X,Y) e sendo a, b e c constantes, sempre se verifica:
l Cov(X, a) = 0
l Cov(X, Y) = Cov(X, Y)
l Cov(aX, Y) = a Cov(X, Y)

8 Estas propriedades aplicadas com a covarincia considerada como populao tambm se aplicam com a covarincia considerada
como amostra.
C A P T U L O 6 / CORRELAO 175

l Cov(aX+b, cY+d) = ac Cov(X, Y)


l Cov(X+Z, Y) = Cov(X, Y) + Cov(Z, Y)
l Se as variveis X e Y forem estatisticamente independentes, ento a covarincia dessas variveis ser
igual a zero. Entretanto, se o resultado da covarincia das variveis X e Y for igual a zero, no se poder
afirmar que as duas variveis sejam estatisticamente independentes. Para confirmar essa independn-
cia, deve-se verificar se todos os pares de valores de X e Y cumprem a condio: P( XeY ) = P( X ) P(Y ).

Coeficiente de correlao
A covarincia pode ser positiva, nula ou negativa, com a unidade de medida referente ao produto das
unidades de medida das duas variveis, que no tem nenhum significado prtico.

Coeficiente de correlao rXY das variveis X e Y um valor nico calculado com a


seguinte frmula:
XY
Se os dados referem-se populao: r XY =
X Y
S XY
Se os dados referem-se amostra: r XY =
S X SY

Para facilitar a relao entre duas variveis e evitar a unidade de medida da covarincia, foi definido
o coeficiente de correlao rXY que tem as seguintes propriedades:
l Os valores de rXY esto limitados entre os valores 1 e +1, 1 rXY +1, e sem nenhuma unidade de
medida.
l um valor nico para populao ou amostra, tomando o cuidado de utilizar dados coerentes no
procedimento de clculo.
Tenha em mente que da frmula do coeficiente de correlao pode-se obter, tambm, a covarincia
das mesmas variveis quando conhecidos os desvios padro correspondentes:

XY = rXY X Y

EXEMPLO 6.4
Calcule o coeficiente de correlao dos retornos do Exemplo 6.2.

Soluo. Este exemplo est resolvido na planilha Exemplo 6.4 da pasta Captulo 6, como mostra a prxi-
ma figura. No intervalo B3:D9, foram registrados os dados e a partir da clula F3 foram calculados e registra-
dos os resultados.
176 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Para mostrar a diferena de procedimento entre resultados de populao e amostra dos dados:

No intervalo G5:H5 foram calculados e registrados os desvios padro, dos retornos considerando-os como
populao. Depois, no intervalo G6:H6 os desvios padro considerando os retornos como amostras.
No intervalo G7:G8 foi calculada a covarincia, primeiro, como populao utilizando a funo COVAR do
Excel, e depois como amostra, a partir do primeiro resultado.
No intervalo G9:G10 foi calculado o coeficiente de correlao, primeiro, utilizando os resultados parciais de
populao, e depois como amostra, utilizando tambm os resultados parciais, porm como amostra. Com
esse clculo, verifica-se o mesmo valor de coeficiente de correlao r=-0,9203.
Utilizando os dados como a populao, temos rAB =0,9203 da seguinte forma:

0,00010694
rAB = = 0,9203
0,009860 0,011785

Utilizando os dados como a amostra, tambm se obtm rAB=0,9203 da seguinte forma:

0,00012833
rAB = = 0,9203.
0,010801 0,012910

O coeficiente de correlao pode ser obtido com a funo CORREL do Excel registrando na clula G12 a fr-
mula =CORREL(C4:C9;D4:D9). A sintaxe da funo CORREL a seguinte:

CORREL(matriz1; matriz2)
A funo estatstica CORREL9 retorna o coeficiente de correlao dos valores registrados nos argumentos
matriz1 e matriz2. Esses argumentos podem ser intervalos de uma planilha, como mostrado anteriormente,
tomando o cuidado de verificar que as duas variveis tenham a mesma quantidade de dados. Tambm se
podem registrar os argumentos como matriz na prpria frmula da funo, evitando registrar os valores da
amostra em um intervalo de clulas da planilha, como feito na clula G14, registrando a frmula
=CORREL({0,09;0,1;0,12;0,105;0,095;0,11};
{0,12;0,105;0,09;0,11;0,125;0,1})

O coeficiente de correlao pode tambm ser obtido com a funo PEARSON do Excel como foi obtido com
a frmula = PEARSON(C4:C9;D4:D9) registrada na clula G16. A sintaxe da funo PEARSON a seguinte:

PEARSON(matriz1; matriz2)
A funo estatstica PEARSON10 retorna o coeficiente de correlao dos valores registrados nos argumentos
matriz1 e matriz2. Esses argumentos podem ser intervalos de uma planilha, como mostrado anteriormente,
tomando o cuidado de verificar que as duas variveis tenham a mesma quantidade de dados. Tambm se
podem registrar os argumentos como matriz na prpria frmula da funo, evitando registrar os valores da
amostra em um intervalo de clulas da planilha, como feito na clula G18 registrando a frmula
=CORREL({0,09;0,1;0,12;0,105;0,095;0,11};
{0,12;0,105;0,09;0,11;0,125;0,1})

O resultado da funo PEARSON o mesmo que o da funo CORREL, porm utilizando os valores das va-
riveis como mostra a frmula seguinte.
n n n
n Xi Yi Xi Yi
r = i =1 i =1 i =1
2 2
n n n n
n Xi2 Xi n Yi 2 Yi
i =1 i =1 i =1 i =1

9 Em ingls, CORREL CORREL.


10 Em ingls, PEARSON PEARSON.
C A P T U L O 6 / CORRELAO 177

Caractersticas do coeficiente de correlao


Vejamos algumas caractersticas importantes do coeficiente de correlao:
l A frmula do coeficiente de correlao pode ser apresentada sem incluir a covarincia, como mos-
tram as frmulas a seguir, que do o mesmo resultado do coeficiente de correlao, embora utilizem
medidas estatsticas diferentes:
1 n
X i X Yi Y
l Populao: rXY =
N

X Y

i =1

1 n X i X Yi Y
l Amostra: rXY =
n 1 i =1 S X S Y

Essas duas frmulas se assemelham frmula de Pearson.


l Se a varivel Y a mesma varivel X, ento o coeficiente de correlao igual a um, como mostramos
a seguir.

XX 2
rXX = = 2X = 1
X X X

l A permutao das variveis no altera o resultado do coeficiente de correlao, se os mesmos pares


de valores forem mantidos rXY = rYX .
l Da mesma forma que a covarincia, o coeficiente de correlao afetado pelos valores extremos da
varivel, ele no uma medida resistente.
l Se as variveis X e Y forem estatisticamente independentes, ento o coeficiente de correlao dessas
variveis ser igual a zero. Entretanto, se o resultado do coeficiente de correlao das variveis X e Y
for igual a zero, no se poder afirmar que as duas variveis sejam estatisticamente independentes.
Para confirmar essa independncia, deve-se verificar se todos os pares de valores das variveis X e Y
cumprem a condio: P( XeY ) = P( X ) P(Y ).

Anlise dos valores do coeficiente de correlao


Na planilha Anlise, includa na pasta Captulo 6, analisada a tendncia e a fora da relao linear en-
tre duas variveis ou amostras X e Y medida pelo coeficiente de correlao.

Variveis perfeitamente correlacionadas de forma positiva


A Figura 6.3 mostra o comportamento de duas amostras X e Y perfeitamente correlacionadas em senti-
do positivo. O coeficiente de correlao dessas amostras calculado na clula F3 igual a r=+1.

FIGURA 6.3 Amostras


perfeitamente
correlacionadas
em sentido positivo,
r=+1.
178 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

A tabela dos dados das variveis X e Y mostra que qualquer par de valores dessas variveis obtido do
par anterior adicionando ou subtraindo o mesmo valor. Por exemplo, o segundo par de valores
(10,-15) o resultado de subtrair 15 de cada valor do primeiro par (25,0). O terceiro par de valores o
resultado de adicionar 20 ao segundo par, e assim sucessivamente, at completar todos os pares de va-
lores. Da anlise dos dois grficos da Figura 6.3:

l O grfico sequencial dos pares de valores, lado esquerdo da Figura 6.3, mostra que os valores das va-
riveis X e Y formam duas linhas paralelas, com acrscimos e decrscimos iguais e na mesma dire-
o. As duas sries esto perfeitamente correlacionadas de forma positiva.
l O grfico de disperso, lado direito da Figura 6.3, mostra que os incrementos dos valores das duas
variveis X e Y so iguais e na mesma direo, sejam acrscimos ou decrscimos. Todos os pares de
valores so pontos de uma reta com declividade 45 e, portanto, r=+1.

Se os incrementos entre pares so proporcionais e na mesma direo, sejam acrscimos ou decrsci-


mos, os pontos formados pelos pares de valores fazem parte de uma reta com declividade positiva e,
portanto, r=+1.

Variveis perfeitamente correlacionadas de forma negativa


A Figura 6.4 mostra o comportamento de duas amostras X e Y perfeitamente correlacionadas em senti-
do negativo. O coeficiente de correlao dessas amostras calculado na clula F14 igual a r=1.

FIGURA 6.4 Amostras


perfeitamente
correlacionadas
em sentido negativo,
r=1.

Neste caso, tambm, a tabela dos dados das variveis X e Y mostra que qualquer par de valores das
variveis X e Y obtido do par anterior. Por exemplo, o segundo par de valores (10,15) o resultado de
subtrair 15 do valor de X do primeiro par (25,0) e adicionar o valor 15 no primeiro valor de Y. Da mes-
ma maneira, o terceiro par de valores (30,5) o resultado de adicionar 20 ao valor de X do segundo par
e subtrair 20 do segundo valor de Y, e assim sucessivamente, at completar todos os pares de valores.
Da anlise dos dois grficos da Figura 6.4:

l O grfico sequencial dos pares, lado esquerdo da Figura 6.4, mostra que os valores das variveis X e Y
formam duas linhas opostas, os acrscimos e decrscimos so iguais, porm em direes opostas. As
duas sries esto perfeitamente correlacionadas de forma negativa.
l O grfico de disperso, lado direito da Figura 6.4, mostra que os incrementos dos valores das duas
variveis X e Y so iguais e em direes opostas. Todos os pares de valores so pontos de uma reta
com declividade 135 e, portanto, r=1.

Se os incrementos so proporcionais e em direes opostas, os pontos formados pelos pares de valo-


res fazem parte de uma reta com declividade negativa e, portanto, r=1.
C A P T U L O 6 / CORRELAO 179

Variveis no correlacionadas
A Figura 6.5 mostra o comportamento de duas amostras X e Y no correlacionadas. O coeficiente de
correlao dessas amostras calculado na clula F25 igual a r=0. Os pares de valores do grfico de dis-
perso no apresentam nenhuma tendncia.

FIGURA 6.5
Amostras no
correlacionadas,
r=0.

Simulador coeficiente de correlao


As trs anlises apresentadas mostram que o coeficiente de correlao de duas variveis X e Y com n pa-
res de valores ser um valor dentro do intervalo 1 rXY +1. Dentro desse intervalo (1, +1), h um
nmero muito grande de valores do coeficiente de correlao possveis, que so consequncia do afas-
tamento simultneo dos pares de valores de suas respectivas mdias.
A planilha Simulador de Correlao, includa na pasta Captulo 6, ajudar a compreender a forma-
o do coeficiente de correlao, como mostra a Figura 6.6 com o grfico de disperso de duas amostras
aleatrias X e Y com 100 pares de dados. As caractersticas do simulador so:

l A anlise pode ser realizada com amostras aleatrias contendo 50, 100 ou 150 pares de dados, ou
pontos do grfico de disperso, opes que ajudam a compreender a formao do coeficiente de cor-
relao. Cada vez que for escolhida uma Quantidade de pares de valores, selecionando o boto de op-
o correspondente, ser ativada a macro que gera as sries aleatrias bivariadas normais.11
l O acionamento da Barra de rolagem, localizada na parte inferior do grfico, gera sries com novos
coeficientes de correlao cujo valor registrado na parte superior do grfico. Por exemplo, o coefi-
ciente de correlao das sries de dados da Figura 6.6 r=0,85.
l O grfico inclui a reta Mdia X e a reta Mdia Y que facilitam a visualizao da formao do sinal do
coeficiente de correlao, como apresentado anteriormente.
l O modelo pode gerar sries de valores para o valor de coeficiente de correlao informado na clula
I5. Para isso, informe o valor do coeficiente em I5 e depois pressione o boto r. Verifique que a barra
de rolagem se posicionou no valor registrado em I5.

A Figura 6.7 mostra seis grficos com coeficientes de correlao diferentes e dentro do intervalo
(1,1).

l No grfico esquerdo da primeira linha, as amostras tm uma correlao positiva perfeita, r=1. Os
pontos esto em uma mesma reta com declividade positiva. No grfico da Figura 6.6, os pontos mos-
tram uma correlao positiva, e as amostras tm correlao positiva, r=0,85. A maioria dos pontos
est prxima de uma reta com declividade positiva.
l No grfico direito da primeira linha, as amostras tm uma fraca correlao positiva, r=0,32. Os pares
de valores formam uma nuvem com ligeira tendncia de declividade positiva.

11 Discrete-Event System Simulation, Banks J. et al Prentice Hall, 2a ed., 1996.


180 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l No grfico esquerdo da segunda linha, no h relao entre as variveis, r=0,01. Os pontos formam
uma nuvem sem nenhuma tendncia.
l No grfico direito da segunda linha, as amostras tm uma fraca correlao negativa, r=0,32, apre-
sentando uma nuvem de pontos com ligeira tendncia de declividade negativa.
l Na terceira e ltima linha, o grfico da esquerda mostra que as amostras tm uma boa correlao
negativa, r=0,85. Coeficientes de correlao inferiores a esse valor e se aproximando de 1 mos-
trariam uma forte correlao negativa. A maioria dos pontos est prxima de uma reta com declivi-
dade negativa.
l No grfico direito da terceira linha, as amostras tm uma correlao negativa perfeita, r=1. Os pon-
tos esto em uma mesma reta com declividade negativa.

FIGURA 6.6
Simulador de
Correlao.

Alguns cuidados com os resultados


importante ter em mente duas caractersticas do coeficiente de correlao:

l Mantendo os mesmos pares de valores, a permutao das variveis no altera o resultado do coefi-
ciente de correlao rXY = rYX .
l O valor rXY uma medida da tendncia e da fora da relao linear entre as variveis X e Y.

Quando uma cozinheira varia a dosagem de fermento na produo de po e consegue um melhor sa-
bor, pode-se concluir que a melhoria do sabor foi causado pela nova dosagem de fermento. Nesse caso,
h uma relao causa-efeito. Contudo, em geral, uma forte correlao no sinnimo de uma relao
causa-efeito entre as amostras ou variveis. H situaes em que um coeficiente de correlao prximo
de um ou de menos um no significa que a maioria dos pares de valores esteja contida em uma reta.
Como ser mostrado, o simples conhecimento do coeficiente de correlao no suficiente devido a
anomalias na disperso dos dados, sendo recomendado construir o grfico de disperso das amostras
para melhor compreender o resultado.
C A P T U L O 6 / CORRELAO 181

FIGURA 6.7 Simulao de valores do Coeficiente de Correlao de duas amostras.

Correlao e causalidade
As caractersticas descritas anteriormente mostram que o coeficiente de correlao no mede a relao
causa-efeito entre as variveis, apesar de essa relao poder estar presente. Por exemplo, uma correla-
o fortemente positiva entre as variveis X e Y no autoriza afirmar que variaes da varivel X provo-
cam variaes na varivel Y, ou vice-versa. O coeficiente de correlao sozinho no identifica a relao
causa-efeito entre as duas variveis; entretanto, na regresso linear, a relao causa efeito definida no
incio da anlise. Em alguns casos, a relao causa-efeito pode ser provocada por um ou mais fatores
ocultos, uma varivel no considerada na anlise. Por exemplo, suponha que o nmero de vendas di-
182 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

rias de um jornal e a produo diria de ovos tenham uma forte correlao positiva. No se pode afir-
mar que o aumento da produo de ovos seja a causa do aumento do nmero de jornais vendidos, nem
que o aumento do nmero de jornais vendidos resulte no aumento da produo de ovos! Para compre-
ender a forte e positiva correlao, devem-se procurar fatores ocultos, por exemplo, o aumento de ri-
queza da populao, que resulta em aumento de demanda dos dois produtos ao mesmo tempo, jornais
e ovos.

Anomalias do coeficiente de correlao


Se o coeficiente de correlao for igual a mais um, os pares de valores das variveis fazem parte de uma
reta com declividade positiva. medida que os pares de valores se afastam dessa reta, o coeficiente de
correlao diminuir de mais um em direo a menos um, passando pelo valor zero, simulao que
pode ser facilmente realizada com o modelo Simulador de Correlao apresentado na seo anterior.
Quanto a essa imagem de linearidade, voc deve tomar alguns cuidados, pois h casos em que um coefi-
ciente de correlao prximo de um ou de menos um no significa que a maioria dos pares de valores
esteja contida em uma reta. A seguir, comentamos alguns casos registrados com mais detalhes na plani-
lha Anomalias, includa na pasta Captulo 6.

A Figura 6.8 mostra alguns casos comentados a seguir.

l Os pares de valores esto contidos numa curva crescente, por exemplo, como a funo matemtica
Y = 0,10 X 2 mostrada no grfico esquerdo da primeira linha da Figura 6.8. Nesse caso, o coeficien-
te de correlao das variveis X e Y no intervalo 1X10 igual a 0,97.

12 100
10 80
8 60
6
40
4
2 20
0 0
0 5 10 0 10 20 30 40 50 60 70 80 90

120
80
100
60 80
40 60
40
20
20
0 0
0 20 40 60 80 0 10 20 30

FIGURA 6.8 Anomalias no resultado do coeficiente de correlao.

l O coeficiente de correlao dos pontos do grfico da direita da primeira linha da Figura 6.8 0,92. Um dos
pares de valores um dado suspeito, (90, 90), pois ele est bastante afastado dos demais pares que esto
distribudos, formando uma nuvem de pontos com coeficiente de correlao pequeno, prximo de zero.
Essa forte correlao positiva provocada pelo dado suspeito que gera uma forte tendncia positiva.
l Se o primeiro par de valores (90, 90) registrado no intervalo B18:C18 da planilha Anomalias for
substitudo pelo novo par (9, 32) mais prximo da nuvem de pontos, o coeficiente de correlao
diminuir para prximo de zero.
C A P T U L O 6 / CORRELAO 183

l No grfico esquerdo da segunda linha da Figura 6.8, os dados esto distribudos em dois grupos com
r=0,98. Em geral, amostras de populaes diferentes podem provocar essa situao, os dois grupos
geram uma tendncia de declividade positiva nesse caso.

Coeficiente de correlao prximo de zero


O coeficiente de correlao das variveis do grfico direito da segunda linha igual a zero com um dado
suspeito, pois apenas um par est completamente afastado dos demais pares que esto contidos numa
reta com declividade positiva. Removendo o dado suspeito, o coeficiente de correlao ser igual a +1.
Analisemos as consequncias dessas anomalias:12
l Embora seja recomendado excluir os dados suspeitos, esses dados no devem ser simplesmente des-
prezados. Deve-se dar a devida ateno causa de tais anomalias, pois esses dados suspeitos podem
ser teis para descobrir a causa dessa ocorrncia.
l A escala dos eixos dos grficos deve ser escolhida adequadamente. Se a escala for mal escolhida, isso
poder prejudicar a interpretao dos resultados. Para evitar que a disperso apresente tendncia di-
ferente, levando a concluses incorretas, sugere-se que o limite inferior e superior da escala do eixo
sejam prximos dos correspondentes valores mnimo e mximo dos dados.
Como concluso, o simples conhecimento do coeficiente de correlao no suficiente se no for
construdo o grfico de disperso e, em alguns casos, obtidas outras medidas estatsticas.

Tabelas de covarincias e de coeficientes de correlao


A covarincia e o coeficiente de correlao sempre se referem a duas variveis ou amostras. Quando h
mais de duas variveis13, possvel aplicar os conceitos estatsticos considerando as variveis duas a
duas. Nesse caso, as covarincias e os coeficientes de correlao so registrados em uma tabela ou ma-
triz de tamanho definido pelo nmero de variveis.14 Para trs variveis A, B e C, as possveis covarin-
cias das trs variveis tomadas duas a duas esto registradas na tabela da Figura 6.9.

A,A A,B A,C

B,A B,B B,C

C,A C,B C,C

FIGURA 6.9 Tabela de covarincias de trs variveis.

A tabela da Figura 6.9 pode ser simplificada, considerando que:


l A covarincia A,A a prpria varincia de A. Portanto, as covarincias da diagonal principal da tabe-
la so as varincias das variveis.
l A permutao das variveis no altera o resultado da covarincia, pois A,B=B,A. Como as covarin-
cias da tabela so simtricas com relao diagonal principal, a tabela de covarincias pode ser re-
presentada com a diagonal principal e apenas uma das duas metades, por exemplo, a parte inferior
como mostra a Figura 6.10.

12 Mtodos Estatsticos para Melhora da Qualidade de Kume H. Editora Gente, 1993.


13 Como o caso da combinao linear de variveis aleatrias, tema do Captulo 9.
n!
14 Para n variveis, o nmero de covarincias ou coeficientes de correlao diferentes igual a C( n,2 ) =
2 !( n 2 )!
184 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

B,A B

C,A C,B C

FIGURA 6.10 Tabela de covarincias, simplificada.

A tabela dos coeficientes de correlao da Figura 6.11 obtida da tabela de covarincias da Figura
6.10, substituindo B,A pelo seu equivalente rB,A e, da mesma forma, as outras duas covarincias. As va-
rincias registradas na diagonal da tabela devem ser substitudas pelo valor um, pois para a varivel A,
A ,A 2A
por exemplo, verifica-se que rA , A = = = 1.
A A 2A

rB,A 1

rC,A rC,B 1

FIGURA 6.11 Tabela dos coeficientes de correlao.

Ferramenta de anlise Covarincia


O Excel dispe da ferramenta de anlise Covarincia para construir tabelas de covarincias, como mos-
trada na planilha Ferramenta Covarincia, includa na pasta Captulo 6, com os dados do Exemplo 6.1
registrados no intervalo B3:C13 incluindo os nomes das variveis. O procedimento da ferramenta de
anlise Covarincia :

l No menu Ferramentas, escolha Anlise de Dados e na caixa de dilogo Anlise de dados escolha
Covarincia na lista de Ferramentas de anlise. Depois pressione o boto OK.
l Para calcular a covarincia das duas amostras, preencha a caixa de dilogo Covarincia como mos-
tra a Figura 6.12.
l Pressionando o boto Ajuda dessa caixa de dilogo, o Excel apresentar a pgina Sobre a caixa de
dilogo Covarincia pertencente Ajuda do Excel.

As informaes que devem ser registradas no quadro Entrada da caixa de dilogo da ferramenta Co-
varincia so:

l Intervalo de entrada. Informe o intervalo de clulas da planilha onde os dados esto registrados,
nesse caso o intervalo B3:C13, que inclui as clulas nas quais foram registrados os ttulos Propagan-
da e Vendas.
l Agrupado por. Selecione Colunas, pois as amostras foram registradas em coluna. Em geral, o Excel
selecionar automaticamente depois de ter informado o intervalo da amostra.
l Rtulos na primeira linha. Tendo escolhido Colunas no item anterior, necessariamente seleciona-
remos Rtulos na primeira linha, pois nas primeiras clulas das sries foram registrados os ttulos
Propaganda e Vendas.
C A P T U L O 6 / CORRELAO 185

FIGURA 6.12 Caixa de


dilogo da ferramenta
Covarincia.

No quadro Opes de sada, deve ser obrigatoriamente informado um endereo a partir do qual a
ferramenta Covarincia registrar os resultados. H trs alternativas excludentes de informar esse en-
dereo, identificadas por trs botes de opo que aceitam a escolha de uma nica alternativa:
l Intervalo de sada. Os resultados sero apresentados na mesma planilha a partir da clula informa-
da, nesse caso E3. Depois de clicar com o boto esquerdo do mouse dentro da caixa correspondente,
o endereo pode ser registrado digitando E3, ou clicando com o boto esquerdo do mouse na clula
E3. Nesse caso, ser registrado o endereo com os dois cifres, $E$3. Esse endereo o da clula su-
perior esquerda da tabela de respostas que a ferramenta construir. Tambm, o Excel automatica-
mente definir o tamanho da rea dos resultados e exibir uma mensagem se a tabela de sada estiver
prestes a substituir dados existentes.
l Nova planilha. Os resultados sero apresentados a partir da clula A1 de uma nova planilha da mes-
ma pasta.
l Se no for informado nenhum endereo, a ferramenta inserir uma nova planilha com o nome
Plan seguido de um nmero sequencial; por exemplo, escolhendo essa alternativa na pasta Cap-
tulo 6, a ferramenta inserir a planilha Plan1.
l H a alternativa de informar o nome da planilha na caixa desta alternativa; por exemplo, regis-
trando o nome Teste, a ferramenta inserir na mesma pasta uma nova planilha com o nome Teste.
l Nova pasta de trabalho. Os resultados sero apresentados numa nova pasta e a partir da clula A1 da
planilha Plan1.

FIGURA 6.13 Resoluo


do Exemplo 6.1
com a ferramenta
Covarincia.

Depois de realizar as escolhas e pressionar o boto OK, a ferramenta registra a tabela de covarincias
a partir da clula E3, Figura 6.13. Verifique que a covarincia como as varincias obtidas com a ferra-
menta de anlise Covarincia referem-se populao.
186 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Ferramenta de anlise Correlao


A ferramenta de anlise Correlao tem o mesmo formato e procedimento operacional da ferramenta
Covarincia. Dessa maneira, sero apresentadas apenas as diferenas importantes. Para utilizar a fer-
ramenta de anlise Correlao, foi preparada a planilha Ferramenta Correlao, includa na pasta
Captulo 6, com os dados do Exemplo 6.1 registrados no intervalo B3:C13, incluindo os nomes das
variveis. O procedimento da ferramenta de anlise Correlao :
l No menu Ferramentas, escolha Anlise de Dados e, na caixa de dilogo Anlise de dados, escolha
Correlao na lista de Ferramentas de anlise. Depois pressione o boto OK.
l Para calcular a correlao das duas amostras, preencha a caixa de dilogo Correlao, como mostra
a Figura 6.14.
l Pressionando o boto Ajuda dessa caixa de dilogo, o Excel apresentar a pgina Sobre a caixa de
dilogo Correlao pertencente Ajuda do Excel.
Depois de realizar as escolhas e pressionar o boto OK, a ferramenta registra a tabela de correlaes a
partir da clula E3, Figura 6.15.

FIGURA 6.14 Caixa de


dilogo da ferramenta
Correlao.

FIGURA 6.15 Resoluo


do Exemplo 6.1 com a
ferramenta Correlao.

EXEMPLO 6.5
A venda dos produtos tem forte relao com as visitas realizadas pelos vendedores aos seus clientes, o que
afirma o gerente de vendas. A empresa tem onze vendedores e, como regra, eles visitam seus clientes uma vez
por ms. Para tentar confirmar sua afirmativa, o gerente preparou a tabela com as visitas realizadas e as vendas
de cada vendedor durante o ms passado. O objetivo verificar se os dados confirmam a crena do gerente.

Soluo. Na planilha Exemplo 6.5, includa na pasta Captulo 6, foram registradas as sries de dados, construdo
o grfico de disperso e calculado o coeficiente de correlao das duas amostras, como mostra a figura seguinte.
O grfico de disperso mostra que a maioria dos pares de valores das amostras Visitas e Vendas se aproxima
de uma reta com declividade positiva, confirmando a existncia de uma relao forte entre as visitas dos
C A P T U L O 6 / CORRELAO 187

vendedores e as vendas dos produtos oferecidos. Podemos aceitar que mais visitas geram mais vendas, mas
sem poder definir o nmero de visitas.
O coeficiente de correlao 0,92 mostra uma forte correlao positiva entre as duas variveis e parece que
confirma a crena do gerente de vendas.

EXEMPLO 6.6
Construa a tabela dos coeficientes de correlao da Tabela de ndices de Preos15 registrada na planilha ndi-
ces de preo, includa na pasta Captulo 6. Embora esses ndices tenham metodologias e perodos de cole-
tas de preos diferentes e as sries sejam pequenas, apenas dez dados cada uma, uma oportunidade interes-
sante para aplicar a ferramenta de anlise Correlao e analisar as relaes entre as sries de ndices.

Soluo. Com a ferramenta de anlise Correlao, foi construda a tabela dos coeficientes de correlao a par-
tir da clula B16 da planilha. Analisemos os resultados de maior destaque:
A menor correlao r=0,26 ocorre entre os ndices IPCA-E e ICV, que mostra uma fraca correlao entre es-
ses dois ndices de preo.
O ndice IPCA-E mantm uma baixa correlao com os outros ndices.
As duas maiores correlaes ocorrem com os ndices IGPM e IGP-DI e IPA-M e IGP-DI.

15 Tabela publicada no jornal O Estado de So Paulo, 02 de junho de 2004.


188 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problemas
Problema 1
O dono da oficina mecnica regulou seu carro e, em um dia sem muito movimento na estrada, realizou
as medies de consumo de combustvel registradas na tabela seguinte para seis velocidades diferentes.
Construa o grfico de disperso e analise o comportamento das duas variveis, Velocidade e Consumo.

Velocidade Consumo Km/l

70 10,2

80 9,7

90 9,1

100 8,3

110 7,8

120 7

Problema 2
Calcule a covarincia da populao e da amostra da relao Velocidade e Consumo do Problema 1.
R: Cov(Vel, Con)=18,75 e Cov(Vel, Con)= 22,5

Problema 3
Calcule o coeficiente de correlao da relao Velocidade e Consumo do Problema 1 utilizando a frmu-
la para os dois casos, populao e amostra.
R: r=0,9975

Problema 4
O seguinte trecho foi extrado do jornal:16 Para cada 1% de aumento no PIB o impacto no nvel de emprego de
0,4%. ... Entretanto, a criao de vagas formais ainda no suficiente para reduzir significativamente o desem-
prego no Pas ... Para isso o PIB precisaria crescer em mdia 5% ao ano. Responda s seguintes perguntas:
a. Qual o tipo de relao entre PIB e Emprego?
b. Qual deve ser o impacto no emprego de um crescimento de PIB de 5% ao ano?
R: a) Correlao positiva. b) 2%

Problema 5
Supondo que durante cinco anos se mantenha a relao do Problema 4, para cada 1% de aumento no
PIB, o impacto no nvel de emprego de 0,4%.
a. Construa a tabela com o crescimento do PIB, comeando por 100, e o crescimento do Emprego, co-
meando por 60, mantendo ambas as variveis com crescimento anual constante.
b. Construa o grfico de disperso correspondente.
c. Calcule o valor do coeficiente de correlao.
R: c) r=0,999991 arredondando r=1

Problema 6
Analisando o resultado do Problema 5, voc concorda com as seguintes afirmaes?
a. As variveis PIB e Emprego tm uma perfeita correlao positiva.
b. Os pares de dados so pontos de uma linha reta com declividade positiva.

16 Criao de emprego acompanha alta do PIB, artigo de Cleide Silva publicado no jornal O Estado de So Paulo de 2 de junho de 2004.
C A P T U L O 6 / CORRELAO 189

Problema 7
A tabela seguinte registra os retornos das aes tipo ON e PN de um grupo de empresa. Com esses dados:
a. Construa o grfico de disperso correspondente.
b. Calcule a covarincia da populao e o coeficiente de correlao.
c. Analise os resultados e verifique se h algum dado suspeito.

ON% PN% ON% PN%

37,5 20,9 212,5 367,1

45,0 5,4 46,3 6,9

0,0 49,4 11,1 45,4

31,5 31,1 43,0 27,8

1,0 30,0 67,0 43,1

20,1 28,0 9,4 13,4

R: Cov(ON, PN) =5.083,84 e r=0,8942

Problema 8
Repita o Problema 7, porm sem considerar os retornos da empresa com ON% de 212,5 e PN% de 367,1.

Problema 9
O professor passou para os alunos uma folha com duas sries de dados para calcular o coeficiente de cor-
relao e explicar o tipo de relao entre as duas sries. Seu colega rapidamente calculou o valor do coefi-
ciente de correlao igual a zero e afirmou que as duas sries no apresentam nenhuma relao. Concor-
da com a afirmao de seu colega de que as duas sries no apresentam nenhuma relao? Por qu?

Problema 10
Na tabela seguinte, foram registrados sete pares de valores correspondentes aos resultados de um teste de
aptido. Com esses dados e sem construir o grfico de disperso nem calcular o coeficiente de correlao:
a. Voc conseguiria definir a relao e a tendncia dessas duas sries?
b. Voc conseguiria determinar o valor desse coeficiente?
c. Se for possvel, qual o valor do coeficiente de correlao?

A 0 6 4 12 8 2 10
B 35 26 29 17 23 32 20

Problema 11
Continuando com o Problema 10.
a. Construa o grfico de disperso correspondente.
b. Calcule o coeficiente de correlao.

Problema 12
A diferena de idades dos irmos Ana e Joo de 5 anos. Considerando a srie de dados dos anos de
Ana, comeando por 10 e terminando com 15, e a srie de dados de Joo, comeando com 6 e terminan-
do com 11. Sem construir o grfico de disperso nem calcular o coeficiente de correlao:
a. Voc conseguiria definir a relao e a tendncia dessas duas sries?
b. Voc conseguiria determinar o valor desse coeficiente?
c. Se for possvel, qual o valor do coeficiente de correlao?
190 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problema 13
Analise a relao entre as amostras X e Y registradas na tabela seguinte, sugerindo comear pela cons-
truo do grfico de disperso.

X 10 15 18 12 9

Y 21 15 12 18 20

Problema 14
Os prmios e preos de exerccios de cinco sries de opes de compra com mesmo vencimento esto re-
gistrados na tabela seguinte. Construa o grfico de disperso, calcule o coeficiente de correlao e ana-
lise os resultados.

Prmios Preos de exerccio

$257,52 $2.100

$99,25 $2.200

$38,17 $2.300

$14,65 $2.400

$5,61 $2.500

R: r=0,8933

Problema 15
Na planilha Problemas, includa na pasta Captulo 6, est registrada a tabela com a relao dos dez
maiores e melhores grupos de supermercados no ano 1991, porm sem indicar os nomes das empresas.
Construa e analise a tabela dos coeficientes de correlao.

Problema 16
Na planilha Problemas, includa na pasta Captulo 6, est registrada a tabela com a relao dos dez
maiores e melhores grupos de supermercados no ano 1998, porm sem indicar os nomes das empresas.
Construa e analise a tabela dos coeficientes de correlao.

Problema 17
Tomando como base os resultados e as anlises das empresas do Problema 15, analise a evoluo dessas
empresas entre os anos 1991 e 1998, comparando os resultados de 1998 com os de 1991.
C A P T U L O 6 / CORRELAO 191

Apndice 1
Outra forma de calcular a covarincia

Partindo da frmula da covarincia que repetimos em seguida:

N
1
XY =
N
(X i X ) (Yi Y )
i =1

Desenvolvendo o produto indicado temos:

N N
1 1
N
(X i X ) (Yi Y ) = N (X i Yi X i Y X Yi + X Y )
i =1 i =1

1 N
1N N N N

N
(X i X ) (Yi Y ) = i i i
N i =1
X Y X y Y
X i + X Y

i =1 i =1 i =1 i =1

Simplificando as parcelas do segundo membro temos:

1 N
1N N N

N
(X i X ) (Yi Y ) = X i Y i y X i X Y + N X y
N i =1
i =1 i =1 i =1

N N
1 1
N
(X i X ) (Yi Y ) = N X i Yi y X X y + X Y )
i =1 i =1

Depois de simplificar as trs ltimas parcelas do segundo membro temos:

N N
1 1
XY =
N
(X i X ) (Yi Y ) = N
X i Yi y X
i =1 i =1

Essa ltima expresso ser utilizada no Apndice 1 do Captulo 9.


Captulo 7
VARIVEIS ALEATRIAS E
DISTRIBUIES DISCRETAS

O resultado do lanamento de uma moeda pode ser utilizado para tomar decises; por exemplo, o
rbitro de uma partida de futebol sorteia quem inicia o primeiro tempo do jogo e ainda o ganha-
dor do sorteio escolhe a metade do campo onde sua equipe iniciar o jogo. Outras vezes, o resultado da
moeda para realizar uma tarefa, agradvel ou no etc. Embora o resultado do sorteio possa ser utiliza-
do com diferentes finalidades, o experimento lanamento aleatrio de uma moeda permanece o mes-
mo, mantendo os mesmos resultados.
Lembremos que um experimento aleatrio se no for possvel antecipar seu resultado, apesar de
conhecer todos os resultados possveis que define o espao amostral do experimento. Portanto, cada
vez que o experimento for repetido, seu resultado pertencer a esse espao amostral sendo cada resul-
tado denominando ponto amostral, que no pode ser particionado nem dividido. Ainda no Captulo 5,
foi visto que evento elementar aquele que contm um nico ponto amostral com uma determinada
probabilidade de ocorrer. Em vez de operar com o espao amostral, agora utilizaremos um conceito
mais amplo denominado varivel aleatria, que adota valores de acordo com os resultados de um expe-
rimento aleatrio.

Varivel aleatria VA uma varivel cujo valor o resultado numrico de um


experimento aleatrio.

Uma VA uma funo formada por valores numricos definidos sobre o espao amostral de um ex-
perimento, tendo presente que:

l Para cada resultado do experimento aleatrio corresponder apenas um nico valor numrico da
VA. Todavia, um valor numrico da VA poder corresponder a um ou mais resultados de um experi-
mento.
l Dependendo dos valores numricos, a varivel aleatria poder ser discreta ou contnua.1

1 Por exemplo, o nmero de peas rejeitadas por lote em uma linha de produo uma VA discreta, e o lucro lquido mensal de uma
empresa uma VA contnua. Entretanto, nem sempre a separao entre varivel discreta e varivel contnua fica clara.
194 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l Se os valores numricos da VA se referem a contagens, ento a VA ser uma varivel aleatria


discreta.
l Se os valores numricos da VA pertencem ao conjunto dos nmeros reais, ento a VA ser uma va-
rivel aleatria contnua.

Variveis aleatrias discretas


Para definir uma VA de forma completa, ser necessrio especificar as probabilidades e os valores dos
eventos elementares do espao amostral do experimento aleatrio. Iniciamos apresentando as funes
de probabilidade com uma varivel aleatria discreta.

EXEMPLO 7.1
Defina a varivel aleatria X que representa o nmero de caras do experimento aleatrio: lanamento de uma
moeda trs vezes seguidas.

Soluo. O nmero de caras possveis do experimento lanamento de uma moeda trs vezes seguidas so 0,
1, 2 e 3 caras que fazem parte dos oito eventos elementares do espao amostral.
Determinao dos valores x da varivel aleatria X.
O conjunto formado por esses quatro nmeros {0, 1, 2, 3} o conjunto dos valores numricos x da varivel alea-
tria X. Relacionando os oito eventos elementares do espao amostral com os valores x da VA do experimento:

Se x=0, nenhuma cara, o nico resultado possvel : CoCoCo.


Se x=1, uma cara, os resultados possveis so: CaCoCo, CoCaCo e CoCoCa.
Se x=2, duas caras, os resultados so: CaCaCo, CaCoCa e CoCaCa.
Se x=3, todas caras, o nico resultado possvel : CaCaCa.

Determinao da probabilidade dos valores x da varivel aleatria X.


Para determinar as probabilidades dos valores x de X, deve-se considerar que:

Os oito resultados ou eventos elementares do experimento aleatrio so igualmente provveis com proba-
bilidade 1/8 ou 12,50%.
Como os eventos elementares so mutuamente excludentes, pela regra da soma, a probabilidade de ocor-
rer uma cara ser 3/8 ou 37,50%, obtido como soma das probabilidades dos trs eventos elementares com
uma cara:

P ( x = 1) = P (CaCoCo) + P (CoCaCo) + P (CoCoCa )

1 1 1 3
P ( x = 1) = + + =
8 8 8 8
Da mesma maneira, a probabilidade de ocorrerem duas caras ser 3/8 ou 37,50%, e a probabilidade de
ocorrerem trs caras ser 1/8 ou 12,50%.

Definio da varivel aleatria X.


A varivel aleatria X est definida pelos seus valores numricos xi e suas probabilidades associadas p(xi), como
apresentado na tabela seguinte.

x p(x)
0 12,5%
1 37,5%
2 37,5%
3 12,5%
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 195

A tabela do Exemplo 7.1 mostra que uma VA representada pela sua distribuio de probabilidades.
Observe que:

l Essa VA foi obtida a partir de uma populao conhecida.


l Uma VA representa uma distribuio de frequncias relativas, como mostra o histograma da Figu-
ra 7.1.

40%
30%
FIGURA 7.1
20%
10%
Histograma
0% do Exemplo 7.1.
0 1 2 3

VA de cenrios
Em alguns casos, a varivel aleatria pode ser gerada a partir de cenrios definidos pela opinio de um
grupo de pessoas acerca de um determinado assunto, por exemplo, os resultados da empresa nos pr-
ximos dois anos, o retorno do mercado de aes nos prximos doze meses etc.

EXEMPLO 7.2
Na reunio anual, antes de terminar o ano, o consenso do grupo de analistas definiu os retornos possveis do
mercado de aes nos prximos doze meses e suas probabilidades associadas de acordo com quatro possveis
cenrios e os resultados registrados na tabela seguinte.

Cenrio Retorno Probabilidade


Ruim 10% 10%
Regular 0% 20%
Bom +12% 40%
Excelente +25% 30%

Com a distribuio de frequncias relativas apresentada nessa tabela, os analistas definiram a varivel alea-
tria X cujo histograma mostrado a seguir.

50%
40%
30%
20%
10%
0%
10% 0% 12% 25%

Definio da VA discreta
Os resultados dos Exemplos 7.1 e 7.2 ajudam a estabelecer a definio de varivel aleatria discreta:

l A VA discreta X tem o conjunto de valores X={x1, x2, ..., xi, ..., xn}.
196 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l Cada valor xi de X tem associada a probabilidade p(xi), formando a distribuio de frequncias regis-
trada na tabela seguinte:

x1 x2 ... xi ... xn

p(x) p(x1) p(x2) ... p(xi) ... p(xn)

As probabilidades p(xi) de cada xi atendem s seguintes premissas:

l Todos os valores x de X tm um valor de probabilidade no intervalo (0, 1) ou de outra maneira


0 p( x i ) 1.
l A soma das probabilidades de todos os x de X sempre igual a um; de outra maneira:

n
p( x 1 ) + p( x 2 ) +  + p( x n ) = p( x i ) = 1
i =1

Valor esperado da VA
Observe que na distribuio de frequncias da varivel aleatria no conhecido o nmero de dados
utilizados. Ao mesmo tempo, as frequncias relativas da VA do Exemplo 7.2 podem pertencer a vari-
veis com tamanhos diferentes. Por exemplo, em uma varivel com cem dados e as frequncias relativas
do Exemplo 7.2:

l O valor 0,10 teria frequncia 10.


l O valor 0,00 teria frequncia 20.
l O valor +0,12 teria frequncia 40.
l O valor +0,25 teria frequncia 30.

Como possvel repetir esse exemplo para outra varivel com qualquer tamanho de dados, pode-se
entender que uma VA um resumo de uma das muitas sries de dados equivalentes cuja distribuio da
populao idntica distribuio da amostra. Portanto, todas as variveis que tiverem a mesma distri-
buio de frequncias2 tero as mesmas medidas descritivas, por exemplo, a mesma mdia. O conceito
valor esperado aplicado em uma VA a medida descritiva equivalente mdia de uma amostra, ou m-
dia ponderada. O valor esperado, 11,30%, do Exemplo 7.3, a prpria mdia da varivel.

Seja a varivel aleatria X com valores numricos x 1 , x 2 , , x n e probabilidades


associadas p( x 1 ), p( x 2 ), , p( x n ). O valor esperado E[X] da varivel X definido por:

E [X] = x 1p( x 1 ) + x 2 p( x 2 ) +  + x i p( x i ) +  + x n p( x n )
n
E [X] = x i p( x i )
i =1

EXEMPLO 7.3
Calcule o valor esperado E[X] da varivel aleatria X do Exemplo 7.2.

Soluo. O valor esperado de X E[X]=11,30%, obtido com a frmula:

2 Distribuio de frequncias pode ser utilizada como sinnimo de distribuio de probabilidades.


C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 197
4
E [ X ] = xi p( xi ) = x1p( x1) + x2 p( x2 ) + x3 p( x3 ) + x 4 p( x 4 )
i =1
E [ X ] = ( 0,10) 0,10 + 0 0,20 + 0,12 0,40 + 0,25 0,30

E [ X ] = 0,1130

Observe que, no procedimento manual de clculo, os valores da VA e suas probabilidades associadas so


utilizados de forma unitria em vez de percentagens. Uma forma prtica de calcular E[X] registrada na plani-
lha Exemplo 7.3, includa na pasta Captulo 7.

Nas colunas C e D da planilha, foram repetidos os dados registrados na planilha Exemplo 7.2 da mesma
pasta, mantendo a formatao de porcentagem nas clulas.

Na clula E4, foi registrada a frmula =C4*D4, que depois foi copiada at a clula E7. Essas frmulas calcu-
lam e registram o resultado do produto de cada valor da varivel X pela sua probabilidade associada.
Na clula C10, foi registrada a frmula =SOMA(E4:E7), que calcula a soma dos produtos e igual a
E[X]=0,1130. Nesse caso, mantivemos a formatao unitria do resultado, entretanto, o leitor poderia for-
matar a clula em %.

Como alternativa de clculo, que evita o registro dos resultados parciais das parcelas da frmula do valor
esperado no intervalo E4:E7:

Na clula C11, foi registrada a frmula =C4*D4+C5*D5+C6*D6+C7*D7, que calcula a soma dos produtos
diretamente em uma nica clula da planilha.
O resultado do valor esperado pode ser obtido utilizando a funo SOMARPRODUTO do Excel. Na clula
C12, foi registrada a frmula =SOMARPRODUTO(C4:C7;D4:D7).

Simulador mdia de longo prazo


Qual o significado do valor esperado 11,30% do Exemplo 7.3? Esse valor deve ser percebido da se-
guinte maneira: se o experimento aleatrio for repetido um nmero muito grande de vezes, ento a m-
dia de todos os resultados ser igual a 11,30%. Por isso, o valor esperado tambm denominado mdia
de longo prazo. Para compreender esse conceito, foi construda a planilha Simulao, includa na pasta
Captulo 7, e baseada na retirada de Notas($) de uma urna.
Em uma urna foram depositadas dez bolas iguais representando Notas($) de dinheiro:3 trs bolas de
valor $50, quatro bolas de valor $10 e trs bolas de valor $5. Sendo as probabilidades de retirar uma
bola de valor $50, $10 ou $5, respectivamente, 3/10, 4/10 e 3/10, o valor esperado da populao
3 4 3
$20,50, obtido com a frmula: E[X] = $50 + $10 + $5 = $20,50.
10 10 10

3 Usamos bolas no lugar das notas para facilitar a retirada de amostras aleatrias probabilsticas com reposio de uma urna.
198 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

O experimento consiste em retirar da urna uma amostra aleatria probabilstica de trs bolas com
reposio e depois calcular e registrar a mdia dessa amostra. Por exemplo, se na primeira rodada fo-
ram retiradas as bolas $50, $5 e $10, a mdia dessa amostra ser $21,67. Se o experimento for repeti-
do um nmero muito grande de vezes, pela lei dos grandes nmeros, a mdia das mdias das amos-
tras retiradas tender ao valor $20,50, que corresponde ao valor esperado da populao formada pe-
las trs bolas.

FIGURA 7.2 Simulao


da retirada de trs
notas de uma urna.

l As dez Notas($) formadas por trs notas de $50, quatro notas de $10 e trs notas de $5 foram identi-
ficadas na planilha com os nmeros um a dez, como mostra o intervalo B4:C13 da Figura 7.2.
l As amostragens aleatrias so realizadas utilizando os nmeros aleatrios gerados pela funo
=ALEATRIOENTRE(1;10), como se pode ver a partir da linha cinco das frmulas das colunas F, G
e H.
l Depois de selecionar um dgito aleatrio entre um e dez, com a funo PROCV selecionado o valor
$ correspondente na tabela do intervalo B4:C13.
l A partir da clula I5 calculada e registrada a mdia de cada amostra.

A planilha est preparada para gerar 100, 250, 500, 1.000 ou 5.000 amostras, conforme seja selecio-
nado o boto de opo correspondente dentro da caixa de grupo Nmero de amostras. Cada vez que for
selecionado um nmero de amostras, ativada uma macro que prepara a planilha para essa nova quan-
tidade e apresenta:

l O resultado dessa simulao na clula K5.


l Em sequncia, so realizadas dez simulaes completas cujos resultados so apresentados no grfi-
co, onde aparecem as mdias dessas dez simulaes seguidas e a linha reta com a mdia da popula-
o $20,50.

O boto Recalcular utilizado para realizar apenas uma simulao, e o boto Simulao realiza dez
simulaes seguidas e atualiza o grfico. O grfico mostra que medida que o tamanho da amostra au-
menta, de 100 para 250, 500, 1.000 e 5.000, a mdia das mdias das amostras diminui sua variabilidade
e cada vez mais se aproxima do valor esperado da populao. Realizando amostragens extremas, esse
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 199

fato fica bem acentuado, o que mostra que o valor esperado uma mdia de longo prazo, ressaltando
que, embora 5.000 seja um nmero grande de amostras, no suficiente para aceit-lo como longo pra-
zo. No Captulo 5, vimos que, na realidade, no se est em busca da mdia real de $20,50, mas da pro-
babilidade de que o erro entre a mdia observada e a mdia da populao seja inferior a um certo erro
tolerado. Tudo que a lei nos informa que a mdia de um grande nmero de simulaes diferir por
menos que certa quantidade especificada da mdia real e mais provavelmente do que a mdia de um pe-
queno nmero de simulaes. Isso no significa que no haver erro de um nmero muito grande de
simulaes.

EXEMPLO 7.4
O seguro de vida da seguradora LIFE para pessoas com menos de 40 anos $200.000, devendo-se pagar $600
por ano. Se a probabilidade de uma pessoa com menos de 40 anos morrer no prximo ano for 0,1%, qual a
expectativa do lucro anual da seguradora?

Soluo. Os dados mostram que a varivel aleatria X deste seguro tem dois eventos elementares:
A probabilidade de a pessoa no morrer durante o ano p(x1)=99,9%. Nesse caso, a seguradora ganha
x1=$600.
A probabilidade de a pessoa morrer durante o ano p(x2)=0,1%. Nesse caso, a seguradora perde
x2=$199.400=$600$200.000

O valor esperado do lucro anual da seguradora E[X]=$400 obtido de:


2
E [ X ] = xi p( xi ) = x1p( x1) + x2 p( x2 )
i =1
E [ X ] = $199.400 0,001+ $600 0,999 = $400

Qual o significado desse resultado? Se a quantidade de seguros desse tipo vendidos anualmente pela segu-
radora for um nmero muito grande, ento o lucro mdio anual da seguradora ser igual a $400 por seguro
vendido.

Varincia e desvio padro da varivel aleatria discreta


O conceito valor esperado aplicado em uma VA a medida descritiva equivalente mdia de uma
amostra, ou mdia ponderada. Considerando que a varincia a mdia dos desvios ao quadrado, o con-
ceito de valor esperado pode ser utilizado para calcular a varincia e depois o desvio padro de uma va-
rivel aleatria.

Seja a varivel aleatria X com valores numricos x 1 , x 2 , , x n e probabilidades


associadas p( x 1 ), p( x 2 ), , p( x n ). Definimos como:

Varincia da varivel X:
2X = ( x 1 E [X])2 p( x 1 ) +  + ( x n E [X])2 p( x n )
n
2X = (xi E [X])2 p( x i )
i =1

Desvio padro de X: X = + 2X
200 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Deve-se destacar que:

l A varincia pode ser apresentada como 2X = E[( X E[X]) 2 ]. Essa forma de varincia de X como va-
lor esperado obtida da prpria definio de valor esperado de X, substituindo a varivel X pela va-
rivel ( X E[X]) 2 , onde E[X] passa a ser E[( X E[X]) 2 ].
l A varincia da varivel aleatria X pode ser obtida, tambm, com a frmula 2X = E[X 2 ] E[X]2 ,
como mostrado no Apndice 1.

EXEMPLO 7.5
Continuando o Exemplo 7.3, calcule a varincia e o desvio padro dessa VA aplicando o conceito de valor es-
perado.

Soluo. A varincia de X 2X = 0,01274, obtida com a frmula, depois de conhecido o valor esperado E[X]:

2X = ( x1 E [ X ])2 p( x1) +  + ( x n E [ X ])2 p( x n )

2X = ( 0,10 0,1130)2 0,10 +  + (0,25 0,1130)2 0,30

2X = 0,01274

Observe que, no procedimento manual de clculo, os valores da VA e suas probabilidades associadas so


utilizados de forma unitria em vez de percentagens. Uma forma prtica de calcular a varincia de X registra-
da na planilha Exemplo 7.5, includa na pasta Captulo 7.

Nas colunas C e D da planilha, foram repetidos os dados registrados na planilha Exemplo 7.2 da mesma
pasta, mantendo a formatao porcentagem nas clulas.

Na clula C10, foi calculado o valor esperado, como j foi mostrado.


Na clula E4, foi registrada a frmula =C4-$C$10 que depois foi copiada at a clula E7. Essas frmulas cal-
culam e registram os desvios da VA.
Na clula F4, foi registrada a frmula =E4^2*D4 que depois foi copiada at a clula F7. Essas frmulas calcu-
lam e registram os quadrados dos desvios multiplicados pela probabilidade de cada valor da VA.
Na clula C10, foi registrada a frmula =SOMA(F4:F7) que retorna o valor da varincia igual a 0,0127, valor
arredondado na clula, mas no na sua memria
O desvio padro igual a 0,1129 foi calculado a partir da varincia registrando a frmula =RAIZ(C11) na clu-
la C12. Nesse caso, mantivemos a formatao unitria do resultado; entretanto, voc poderia formatar a c-
lula em %, pois a unidade de medida do desvio padro a dos valores da VA.
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 201

Como alternativa de clculo que evita o registro dos resultados parciais das parcelas da frmula da varin-
cia no intervalo E4:F7:

A frmula {=SOMA(((C4:C7-SOMA(C4:C7*D4:D7))^2*D4:D7))} foi registrada na clula C15. Para inserir


essa funo como matriz, pressione simultaneamente as trs teclas Ctrl + Shift + Enter; mantendo pres-
sionada a tecla Ctrl, pressione e mantenha pressionada a tecla Shift e, por ltimo, pressione a tecla Enter.
Depois de pressionar as trs teclas simultaneamente, temos os resultados apresentados na figura seguinte
onde as frmulas receberam as chaves { }.
O desvio padro pode ser obtido da varincia aplicando a raiz quadrada. Tambm pode ser obtido regis-
trando a seguinte frmula como matriz {=RAIZ(SOMA(((C4:C7-SOMA(C4:C7*D4:D7))^2*D4:D7)))}, sem
necessidade de registrar a varincia em outra clula.

Distribuio binomial
Muitas variveis aleatrias tm apenas dois possveis resultados ou eventos elementares:

l O tcnico do controle de qualidade sempre retira uma amostra de dez peas de cada lote recebido do
fornecedor. O nmero de peas que no atendem especificao uma varivel aleatria X.
l O nmero de respostas sim a uma pergunta da pesquisa aplicada em 1.800 pessoas uma varivel
aleatria X.
l O nmero de aes que ontem subiram comparadas com as 50 aes mais negociadas uma varivel
aleatria X.

Nos trs exemplos, o nmero de vezes em que um resultado ocorre durante um determinado nme-
ro de repeties do experimento a varivel aleatria X.

Premissas de um experimento binomial

O experimento repetido n vezes, e os n resultados do experimento so indepen-


dentes.
O experimento tem apenas dois possveis resultados ou eventos mutuamente exclu-
dentes: sucesso ou falha.
A probabilidade de sucesso do experimento e se mantm constante durante as n
repeties do experimento. A probabilidade de falha do experimento (1-).

EXEMPLO 7.6
O gerente da loja estima que de dez vendas realizadas, trs so microcomputadores e sete equipamentos ele-
trnicos. Qual a probabilidade de que uma das quatro prximas vendas seja um microcomputador?
Soluo. Comeamos por determinar as quatro prximas vendas e depois suas probabilidades de ocorrncia.
Sendo E a venda de um equipamento eletrnico e M a de um microcomputador, os quatro possveis resulta-
dos (eventos elementares) so: EEEM, EEME, EMEE e MEEE.
Dos dados do gerente, deduzimos que 70% das vendas realizadas so de equipamentos eletrnicos E e 30%
de microcomputadores M. Se a sequncia de venda de um M for EEEM, sua probabilidade ser igual a:

P (EEEM ) = 0,70 0,70 0,70 0,30

P (EEEM ) = 0,703 0,30 = 0,1029


202 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

O resultado P(EEEM)=10,29% foi obtido aplicando a regra do produto, pois os eventos so independentes.
Repetindo o mesmo procedimento para a sequncia de venda EEME, sua probabilidade ser igual a:

P (EEME ) = 0,70 0,70 0,30 0,70

P (EEME ) = 0,702 0,30 0,70 = 0,1029

As probabilidades das duas sequncias restantes tm o mesmo valor obtido das seguintes frmulas:

P (EMEE ) = 0,70 0,30 0,70 0,70 = 0,70 0,30 0,702 = 0,1029

P (MEEE ) = 0,30 0,70 0,70 0,70 = 0,30 0,703 = 0,1029

Considerando que os quatro eventos so mutuamente excludentes, a probabilidade de que uma das qua-
tro prximas vendas seja um microcomputador igual a 41,16%, resultado obtido da regra da soma com a se-
guinte frmula, onde x=1 identifica a venda de um microcomputador:

P ( x = 1) = P (EEEM ) + P (EEME ) + P (EMEE ) + P (MEEE )

P ( x = 1) = 0,1029 + 0,1029 + 0,1029 + 0,1029

P ( x = 1) = 0,4116

Frmula da distribuio binomial


O Exemplo 7.6 mostra que a probabilidade P(x=1) pode ser obtida contando os possveis resultados,
agrupando-os na seguinte frmula.

P( x = 1) = 4 0,301 0,703

Utilizando o conceito de combinaes:

4!
P( x = 1) = 0,301 0,70 4 1 = 0,4116
1!(4 1)!

De forma geral, a probabilidade P(x) de conseguir em n experincias x sucessos com probabilidade


medida pela frmula:

n!
P( x ) = x (1 ) n x
x !(n x)!

Em cada experincia binomial, ser possvel obter a probabilidade associada aplicando essa frmu-
la, sempre que o tamanho da amostra for pequeno comparado com o tamanho da populao, em geral
menor do que 5%.
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 203

Probabilidade da distribuio binomial


Se em n experincias ocorrem x=1, 2, ..., n sucessos com probabilidade , a
varivel X ter distribuio binomial4 de probabilidades.
n!
P( x ) = x (1 ) n x
x !(n x )!

Nessa expresso x ! = x( x 1)( x 2) (2)(1) e 0!=1

FIGURA 7.3
Distribuio binomial.

A Figura 7.3 mostra a planilha Modelo Distribuio Binomial, includa na pasta Captulo 7. Infor-
mando os valores da probabilidade de sucesso na clula C4 e o nmero de experimentos ou tentativas
na clula C5, limitadas a 50, a planilha calcula a mdia e a varincia nas clulas F4 e F5, respectivamen-
te, e a probabilidade escolhida na caixa de grupo a partir da clula C8 da tabela:

l Probabilidade P(x). Fornecer a probabilidade de ocorrerem x sucessos, de 0 at n, em n tentativas


com a probabilidade de sucesso registrada em C4.
l Probabilidade Acumulada at x. Fornecer a probabilidade acumulada de ocorrerem at x sucessos
em n tentativas com a probabilidade de sucesso registrada em C4, como mostra a Figura 7.3.

EXEMPLO 7.7
Uma moeda lanada dez vezes seguidas. Calcule a probabilidade de conseguir trs caras.

Soluo. A probabilidade de conseguir trs caras 0,3125 ou 31,25%, resultado obtido com a frmula:
5!
P ( x = 3) = 0,503 (1 0,50) 53
3 ! (5 3) !

P ( x = 3) = 10 0,55 = 0,3125

4 A distribuio binomial costuma ser representada com o smbolo B(n, ).


204 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Esse resultado pode ser obtido com a funo estatstica DISTRBINOM do Excel registrando a frmula
=DISTRBINOM(3;5;0,5;FALSO) em uma clula vazia de qualquer planilha.

DISTRBINOM(nm_s; tentativas; probabilidade_s; cumulativo)


A funo estatstica DISTRBINOM retorna a probabilidade ou a probabilidade acumulada do nmero de
tentativas bem-sucedidas nm_s, conforme o valor do argumento cumulativo.
Se o argumento cumulativo for FALSO, a funo retornar a probabilidade do nmero de sucessos nm_s
com probabilidade_s de sucesso para um nmero de tentativas independentes. Neste exemplo, a funo
retorna a probabilidade 0,3125 de conseguir trs sucessos com probabilidade 0,5 em um experimento
com cinco tentativas.
Se o argumento cumulativo for VERDADEIRO, a funo retornar a probabilidade acumulada do nmero
mximo de sucessos nm_s com probabilidade_s de sucesso para um nmero de tentativas independentes.

EXEMPLO 7.8
Uma experincia com distribuio binomial foi repetida quatro vezes seguidas. Considerando a probabilidade
de sucesso =0,50:

Calcule as probabilidades de todos os possveis sucessos x.


Construa o grfico da distribuio de probabilidades.
Soluo. Na planilha Exemplo 7.8, includa na pasta Captulo 7, foi construda a tabela de probabilidades
4!
com a frmula P ( x ) = 0,50x (1 0,50) 4 x , e ao lado foi construdo o histograma.
x !( 4 x ) !

O primeiro resultado da tabela, probabilidade de x=0, pode ser obtido com a funo estatstica DISTRBINOM
do Excel, registrando em uma clula vazia de qualquer planilha a frmula =DISTRBINOM(0;4;0,5;FALSO), resul-
tando no valor 0,0625. O segundo resultado, probabilidade de x=0, pode ser obtido com a frmula
=DISTRBINOM(1;4;0,5;FALSO), resultando no valor 0,25. Da mesma forma, os demais resultados da tabela. A
partir da linha 12 da planilha Exemplo 7.8, foram registradas as frmulas com a funo DISTRBINOM utilizan-
do os dados da tabela construda.

EXEMPLO 7.9
Continuando com o Exemplo 7.8, calcule:

A probabilidade que x seja menor do que 2.


A probabilidade que x seja menor ou igual a 2.

Soluo. Na planilha Exemplo 7.9, includa na pasta Captulo 7, foi construda a tabela utilizando a funo
DISTRBINOM. Na clula C6, foi registrada a frmula =DISTRBINOM(B6;$C$4;$C$3;VERDADEIRO) com o ar-
gumento cumulativo igual a VERDADEIRO. Depois essa frmula foi copiada at a clula C10. A figura seguinte
mostra tambm o grfico de probabilidades acumuladas. Vejamos as respostas.
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 205

A probabilidade que x seja menor do que 2 a probabilidade acumulada at x=1, pois no deve ser includa
a probabilidade quando x=2. Esse resultado P(x<2)=0,3125 pode ser obtido registrando em qualquer clula
vazia a frmula =DISTRBINOM(1;4;0,5;VERDADEIRO).
A probabilidade que x seja menor ou igual a 2 a probabilidade acumulada at x=2. A tabela mostra que
P(x2)=0,6875. Tambm esse resultado pode ser obtido registrando a frmula =DISTRBINOM(2;4;0,5;VER-
DADEIRO).

Modelo probabilidade de sucesso


Os exemplos anteriores mostram tabelas de probabilidades e histogramas da distribuio binomial para a
ocorrncia de x sucessos com probabilidade durante n experincias. Vejamos algumas concluses:
l Em um experimento com distribuio binomial, o nmero de resultados igual a n+1, pois 0xn.
l A probabilidade de sucesso varia entre 0+ e prximo de 1, pois nos casos extremos o experimento
no seria aleatrio.
Para cada valor de probabilidade de sucesso , h uma distribuio binomial de probabilidades dife-
rente, mantendo os outros parmetros inalterados. A planilha Modelo probabilidade da Figura 7.4 mos-
tra essa caracterstica. Com a barra de rolagem dessa planilha, pode-se acompanhar a variao da proba-
bilidade de que ocorra um determinado sucesso e a probabilidade acumulada at esse definido sucesso
em funo da probabilidade de sucesso varivel no intervalo (0, 1) de um experimento com dez tentati-
vas. Quanto forma da distribuio de probabilidade, voc verificar que, para =0,5, a distribuio
sempre simtrica, independente do valor do nmero n de tentativas. Ao mesmo tempo, para valores de
<0,5, a distribuio de probabilidade apresentar inclinao positiva, para a direita, acentuando-se
medida que se aproxima de zero. Inversamente, para valores de >0,5, a distribuio de probabilidade
apresentar inclinao negativa, para a esquerda, acentuando-se medida que se aproxima de um.

Mdia e varincia da distribuio binomial


Como j foi visto, as distribuies de probabilidades tm associadas duas medidas estatsticas, a mdia
e a varincia, sem considerar o desvio padro que obtido da varincia. Aplicando os conceitos de valor
esperado nas distribuies discretas, substituindo a expresso P(x) da distribuio binomial naquelas
expresses, obteremos o valor esperado, a varincia e o desvio padro da distribuio binomial. Obser-
ve que esses resultados no dependem do nmero de sucessos x.
206 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Parmetros da distribuio binomial


A mdia, a varincia e o desvio padro so obtidos com:

=n 2 = n (1 ) e = n (1 )

FIGURA 7.4 Modelo


probabilidade
de sucesso.

EXEMPLO 7.10
So realizadas dez experincias com probabilidade de sucesso =0,10. Considerando que o experimento tem
distribuio binomial, calcule a mdia e o desvio padro.

Soluo. Aplicando as frmulas temos:

= n = 10 0,1 = 1

= n (1 ) = 10 0,10 (1 0,10) = 0,9487

EXEMPLO 7.11
Voc tem uma carteira com quinze aes. No prego de ontem, 75% das aes na Bolsa de Valores caram de
preo. Supondo que as aes que perderam valor tm distribuio binomial:

Quantas aes da sua carteira voc espera que tenham cado de preo?
Qual o desvio padro das aes da carteira?

Soluo. Como 75% das aes caram de preo, o nmero de aes da carteira que devem ter sofrido
queda de preo ser 11,25=0,7515. O desvio padro 1,67, obtido com a frmula:
= n (1 ) = 15 0,75 (1 0,75) = 167.
,

EXEMPLO 7.12
Continuando com o Exemplo 7.11.

Qual a probabilidade de que as quinze aes da carteira aes tenham cado?


Qual a probabilidade que tenham sofrido reduo de preo exatamente dez aes?
Qual a probabilidade que treze ou mais aes tenham sofrido reduo de preo?
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 207

Soluo. Para calcular a probabilidade de que as quinze aes da carteira tenham sofrido reduo de preo,
aplicamos a expresso geral:

n 15
P ( x = 15) = x (1 ) n x = 0,7515(1 0,75)1515
x 15
15 !
P ( x = 15) = 0,7515 0,250 = 0,0134
15 !(15 15) !

De forma equivalente, a probabilidade que tenham sofrido reduo de preo exatamente dez aes
P(x=10)=0,1651, e a probabilidade que treze ou mais aes tenham sofrido queda de preo obtida com
P(x13)=P(x=13)+P(x=14)+P(x=15)=0,2361.

EXEMPLO 7.13
A quantidade de vezes em que o nmero seis foi obtido no lanamento de um dado vinte vezes seguidas tem
distribuio binomial. Calcule:

A probabilidade de conseguir trs seis.


A probabilidade de conseguir mais de trs seis.

Soluo. Utilizando a funo DISTRBINOM:


Registrando a frmula =DISTRBINOM(3;20;1/6;FALSO), temos a probabilidade P(x=3)=0,2379 de conse-
guir trs seis em um experimento de 20 lanamentos de um dado.
Registrando a frmula =DISTRBINOM(3;20;1/6;VERDADEIRO), temos a probabilidade P(x3)=0,5665 de
conseguir at trs seis em um experimento de 20 lanamentos de um dado. Para obter P(x>3), aplicamos a
regra do complemento P(x>3)=1-P(x3)=0,4335.

EXEMPLO 7.14
Uma urna contm 10 bolas, sendo 2 verdes e 8 brancas. Realizando 15 retiradas com reposio, calcule:

A probabilidade de retirar cinco bolas verdes.


A probabilidade de conseguir at cinco bolas verdes.
A mdia e a varincia desse experimento.

Soluo. A probabilidade de sucesso de retirar uma bola branca 0,20. Utilizando a funo DISTRBINOM:
Registrando a frmula =DISTRBINOM(5;15;0,2;FALSO), temos a probabilidade P(x=5)=0,1032 de conse-
guir cinco bolas verdes em um experimento de 15 retiradas com reposio.
Registrando a frmula =DISTRBINOM(5;15;0,2;VERDADEIRO), temos a probabilidade P(x5)=0,9389 de
conseguir at cinco bolas verdes em um experimento de 15 retiradas com reposio.
A mdia igual a 3, e a varincia, igual a 2,4.

Os resultados anteriores, bem como a maioria dos resultados com a distribuio binomial, podem ser obti-
dos com a planilha Clculo Prob. Binomial, includa na pasta Captulo 7, como mostra a figura seguinte.
208 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Antecipando alguns conceitos, deve-se registrar que se n for adequadamente grande e, para valores
de probabilidade de sucesso que no sejam prximos de 0 nem de 1, o teorema central do limite5 per-
mitir aproximar a distribuio binomial utilizando a distribuio normal. A mdia e o desvio padro
sero obtidos com as frmulas da distribuio binomial.

Tabela da distribuio binomial


Na planilha Distribuio Binomial da pasta Tabelas disponvel na pgina do livro no site da Editora,
voc encontrar a Tabela da Distribuio Binomial. Escolhendo na caixa de grupo:
l Probabilidade P(x). A tabela fornecer a probabilidade de ocorrerem x sucessos em n tentativas com
probabilidades de sucesso definidas no intervalo C6:M6.
l Probabilidade Acumulada at x. A tabela fornecer a probabilidade acumulada de ocorrerem at x su-
cessos em n tentativas, com as probabilidades de sucesso definidas no intervalo C6:M6, conforme
apresentado na Figura 7.5.
A tabela foi limitada at 50 experincias, comeando por 1, e, na Figura 7.5, pode-se verificar o re-
sultado da primeira questo do Exemplo 7.14. As colunas do intervalo C:M fornecem as probabilida-
des desejadas para probabilidades determinadas no intervalo C6:M6. Na coluna O, denominada Teste,
possvel calcular qualquer probabilidade para uma determinada probabilidade de sucesso, informada
na clula O6 e o nmero de tentativas registradas na clula C4.

FIGURA 7.5 Amostra


parcial da Tabela da
Distribuio Binomial.

Outras funes do Excel


Com a funo DISTRBINOM, pode ser calculada a probabilidade de um determinado nmero de suces-
sos x de um experimento binomial, ou a probabilidade acumulada at esse nmero de sucessos x. O Excel
tambm dispe de outras funes estatsticas, como mostrado a seguir utilizando o Exemplo 7.15.

EXEMPLO 7.15
Seja uma experincia com distribuio binomial com n=4 e probabilidade de sucesso =0,60. Calcule a proba-
bilidade de ter trs sucessos e a probabilidade de ter de um at trs sucessos, ambos os limites includos.
Soluo. A probabilidade de ter trs sucessos P(x=3)=0,3456, valor obtido com a frmula
=DISTRBINOM(3;4;0,60;FALSO). Da mesma maneira, a probabilidade de ter de um at trs sucessos, am-
bos os limites includos, e o resultado da soma P(x=1)+P(x=2)+P(x=3). Dessa maneira, a probabilidade pro-
curada P(1x3)=0,8448. Esse valor pode ser obtido, tambm, com a funo DISTRBINOM com a frmula
=DISTRBINOM(3;4;0,60;VERDADEIRO)-
DISTRBINOM(0;4;0,60;FALSO)

5 Esse tema ser apresentado no Captulo 10.


C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 209

PROB(intervalo_x; intervalo_prob; limite_inferior; limite_superior)


A funo estatstica PROB6 retorna a probabilidade acumulada entre os argumentos limite inferior e o
limite superior, ambos includos. O argumento intervalo_x de valores e o argumento intervalo_prob se
referem tabela de probabilidades P(x) construda para esse experimento. Na planilha Outras fun-
es, includa na pasta Captulo 7, mostrado como utilizar a funo PROB, como mostra a Figura 7.6
com os dados do Exemplo 7.15.

l No intervalo B3:C10 foram registrados os valores de e n e calculadas as probabilidades para os cin-


co valores de x, de 0 a 4.
l No intervalo F4:F5, foram registrados os valores do limite inferior e o limite superior de x.
l Na clula F8, foi registrada =PROB(B6:B10;C6:C10;F4;F5), frmula utilizada para calcular a proba-
bilidade acumulada P(1x3)=0,8448. Observe que a probabilidade acumulada P(1x3) obtida
com a frmula: P(1X3)=P(X3)P(X=0)=0,87040,0256=0,8448.
l O mesmo resultado obtido informando os dados em forma de matriz, registrando na clula F9 a
frmula:
PROB({0;1;2;3;4};{0,0256;0,1536;0,3456;0,3456;0,1296};E38;E39).
l Com a funo DISTRBINOM, registrando na clula F10 a frmula:
=DISTRBINOM(F5;C4;C3;VERDADEIRO)-
SE(F4=0;0;DISTRBINOM(F4-1;C4;C3;VERDADEIRO))

Observe que foi subtrado um do valor do argumento nm_s da segunda parcela da frmula da fun-
o DISTRBINOM. No entanto, quando o limite inferior de x for zero, esse argumento ser zero, pela
funo condicional SE.

FIGURA 7.6 Utilizando


a funo estatstica
PROB.

CRIT.BINOM(tentativas; probabilidade_s; alfa)


A funo estatstica CRIT.BINOM7 retorna o menor nmero de sucessos para o qual a distribuio bi-
nomial acumulada maior ou igual ao argumento alfa. Para valores exatos de probabilidade acumula-
da, a funo estatstica CRIT.BINOM inversa da funo estatstica DISTRBINOM com o argumento
cumulativo VERDADEIRO.
Aplicando a funo CRIT.BINOM no Exemplo 7.15, se alfa=0,50, o nmero de sucessos menor ou
igual a 0,50 dois. A partir da coluna J da planilha Outras funes, foi construdo o modelo para calcu-
lar esse resultado. Para verificar o resultado dessa funo, ao lado, no intervalo N4:M9, foi construda a
tabela de probabilidades acumuladas desse experimento.

6 Em ingls, a funo PROB PROB.


7 Em ingls, a funo CRIT.BINOM CRITBINOM.
210 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

FIGURA 7.7 Utilizando


a funo CRIT.BINOM.

Em outra aplicao, a funo CRIT.BINOM determina o nmero mximo de peas defeituosas de


um lote de produo sem rejeitar o lote inteiro.

Distribuio de Poisson
Depois da distribuio binomial, a distribuio de Poisson a distribuio de probabilidade discreta
mais utilizada, pois pode ser aplicada a muitos casos prticos nos quais interessa o nmero de vezes em
que um determinado evento pode ocorrer durante um intervalo de tempo ou em um determinado am-
biente fsico, denominados sobre o nome de rea de oportunidade.8 Por exemplo, o nmero de aciden-
tes de carros por dia em uma grande cidade como So Paulo, o nmero de chamadas telefnicas por
hora recebida na central telefnica durante o perodo normal de operao de uma empresa, o nmero
de defeitos de soldagem em seis metros de tubo, o nmero de garrafas mal fechadas por trinta minutos
na mquina de enchimento de cerveja, o nmero de comprimidos rejeitados por hora pela mquina de
compresso devido ao peso fora de especificao etc.
Em um processo de Poisson podem ser observados eventos discretos em uma rea de oportunidade de
tal forma que, reduzindo suficientemente essa rea de oportunidade:

l A probabilidade de observar apenas um sucesso no intervalo estvel.


l A probabilidade de observar mais de um sucesso no intervalo zero.
l A ocorrncia de um sucesso em qualquer intervalo estatisticamente independente da ocorrncia
em qualquer outro intervalo.

A distribuio de Poisson caracterizada apenas pelo parmetro . Enquanto a varivel aleatria do


processo de Poisson X se refere ao nmero de sucessos por rea de oportunidade, o parmetro se refe-
re ao valor esperado, ou mdia, do nmero de sucessos por rea de oportunidade.

Probabilidade da Distribuio de Poisson


e x
A probabilidade P(x)de ocorrncia de x conhecido P ( x ) = .
x!
o nmero esperado de sucessos.
x=0, 1, 2, ... o nmero de sucessos.
e constante aproximadamente igual a 2,7182....
A mdia e a varincia so iguais a = e 2=.

8 Uma rea de oportunidade pode ser um intervalo de tempo, espao ou rea na qual mais de uma ocorrncia de um evento pode
ocorrer.
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 211

EXEMPLO 7.16
As lmpadas de iluminao da rea de manufatura da montadora so substitudas em uma mdia de oito lm-
padas por dia. Se a distribuio de frequncias das lmpadas substitudas for do tipo Poisson:

Qual a probabilidade de amanh cinco lmpadas precisarem ser substitudas?


Qual a probabilidade de amanh nenhuma lmpada precisar ser substituda?
Qual a probabilidade de amanh no mximo cinco lmpadas precisarem ser substitudas?

Soluo. Dos dados, deduzimos que o nmero esperado de trocas dirias de lmpadas =8. A probabilida-
de de amanh cinco lmpadas precisarem ser substitudas P(x=5)=9,16%, resultado obtido com a frmula:

e 8 85
P ( x = 5) = 0,091604
5!
A probabilidade de amanh nenhuma lmpada precisar ser substituda P(x=0)=0,033%, resultado obtido
com a frmula:

e 8 80
P ( x = 0) = = 0,000335
0!
A probabilidade de amanh no mximo (ou at) cinco lmpadas precisarem ser substitudas
P(x5)=P(x=0)+P(x=1)+P(x=2)+P(x=3)+P(x=4)+P(x=5)=19,12%, resultado obtido com a frmula:
5
e 8 8i
P ( x 5) = i!
= 0,1912
i =0

Vimos que, para probabilidades de sucesso menores do que 0,50, a distribuio binomial tem incli-
nao para a direita, quanto mais inclinada, maior a chance de a probabilidade se aproximar de zero. Se
a probabilidade de sucesso for muito pequena e o nmero de experincias grande, no limite, ser obti-
da a distribuio de Poisson.
A Figura 7.8 mostra a planilha Modelo Distribuio de Poisson includa na pasta Captulo 7. Infor-
mando o nmero esperado de sucessos na clula C4, a planilha calcula a mdia, a varincia e as pro-
babilidades escolhidas na caixa de grupo a partir da clula C8:
l Probabilidade P(x). Fornecer a probabilidade de ocorrerem x sucessos, com o nmero esperado de
sucessos registrado em C4.
l Probabilidade Acumulada at x. Fornecer a probabilidade acumulada de ocorrerem at x sucessos
com o nmero esperado de sucessos registrado em C4, como mostra a Figura 7.8.

FIGURA 7.8
Distribuio
de Poisson.
212 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Tabela da distribuio de Poisson


A planilha Distribuio de Poisson da pasta Tabelas disponvel na pgina do livro, no site da editora,
contm a Tabela da Distribuio de Poisson. Escolhendo na caixa de grupo:
l Probabilidade P(x). A tabela fornecer a probabilidade de ocorrerem x sucessos, com o nmero espe-
rado de sucessos registrado no intervalo C6:L6.
l Probabilidade Acumulada at x. A tabela fornecer a probabilidade acumulada de ocorrerem at x
sucessos com o nmero esperado de sucessos , registrado no intervalo C6:M6, como mostra a Fi-
gura 7.9.
Como pode assumir qualquer valor positivo e a tabela registra somente 10 valores diferentes de ,
voc ter de registrar a unidade do valor esperado na clula C4, informao limitada ao intervalo
(0, 25). As colunas do intervalo C:L fornecem as probabilidades desejadas para o nmero esperado de
sucessos do intervalo C6:M6. Na coluna N, denominada Teste, voc poder calcular qualquer probabi-
lidade para o nmero esperado de sucessos informado na clula N6.

FIGURA 7.9 Tabela


da Distribuio
de Poisson.

EXEMPLO 7.17
O nmero de reclamaes de malas no recebidas no terminal nacional da maior companhia area de cinco
por dia. Se a distribuio de frequncias das malas extraviadas do tipo Poisson:

Qual a probabilidade de que em qualquer dia sejam extraviadas exatamente duas malas?
Qual a probabilidade de que em qualquer dia sejam extraviadas trs ou menos malas?
Qual a probabilidade de que em qualquer dia sejam extraviadas trs ou mais malas?

Soluo. Dos dados, deduzimos o nmero esperado de malas extraviadas por dia, =5. A probabilidade de
que em qualquer dia sejam extraviadas exatamente duas malas P(x=2)=8,42%, resultado obtido com a fr-
mula:

e 5 52
P ( x = 2) = = 0,0842
2!

Esse resultado pode ser obtido na Tabela da Distribuio de Poisson, procedendo como foi explicado. Tam-
bm pode ser obtido com a funo estatstica POISSON do Excel.

POISSON(x; mdia; cumulativo)


A funo estatstica POISSON retorna dois tipos de probabilidades, conforme o valor do argumento cumula-
tivo. Se o argumento cumulativo for FALSO, a funo retornar a probabilidade do nmero de sucessos x,
considerando o argumento mdia esperada de sucessos. O resultado dessa questo P(x=2)=8,42% obtido
registrando a frmula =POISSON(2;5;FALSO). Se o argumento cumulativo for VERDADEIRO, a funo retor-
nar a probabilidade acumulada at x, considerando o argumento mdia.

A probabilidade de que em qualquer dia sejam extraviadas trs ou menos malas


P(x3)=P(x=0)+P(x=1)+P(x=2)+P(x=3)=26,50%. Esse resultado pode ser obtido calculando as parcelas
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 213

dessa soma ou utilizando a funo POISSON, registrando a frmula =POISSON(3;5;VERDADEIRO). Esse


resultado tambm pode ser obtido com a planilha Clculo Prob. Poisson, como mostrado a seguir.

A probabilidade de que em qualquer dia sejam extraviadas trs ou mais malas P(x3) =
P(x=3)+P(x=4)+P(x=5)=87,53%. Esse resultado pode ser obtido calculando as parcelas dessa soma ou utilizan-
do a funo POISSON, tendo presente que essa funo retorna a probabilidade acumulada desde x=0. Para re-
solver este exemplo, teremos de utilizar o complemento, que algebricamente dado pela frmula P(x3)=1
(P(x=0)+P(x=1)+P(x=2)). A probabilidade procurada ser obtida com a =1-POISSON(2;5;VERDADEIRO).

Outras distribuies discretas


O Excel tambm dispe das funes da distribuio binomial negativa e a distribuio hipergeomtrica.
Para apresentar a distribuio binomial negativa, faremos uma anlise do que foi apresentado na distri-
buio binomial. O ponto de partida o processo de Bernoulli, definido como o experimento aleatrio
cujo espao amostral tem apenas dois possveis resultados mutuamente excludentes denominados su-
cesso e falha, sendo a probabilidade de sucesso. Se o processo Bernoulli for repetido n vezes, conside-
rando que as experincias so independentes, ento a varivel aleatria X que define o nmero de su-
cessos do experimento ter distribuio binomial. Observe que, na distribuio binomial, o nmero de
experimentos n definido antecipadamente.
Em vez de repetir o experimento um nmero determinado de vezes, pode-se estabelecer que o expe-
rimento seja repetido at conseguir o primeiro resultado sucesso. Nesse caso, a varivel aleatria X que
define o nmero de experimentos necessrios at conseguir o primeiro resultado sucesso tem uma dis-
tribuio geomtrica. Ampliando as premissas da distribuio geomtrica, em vez de repetir o experi-
mento at conseguir o primeiro resultado sucesso, a distribuio binomial negativa9 permite determi-
nar a probabilidade de que ser necessrio realizar exatamente n experimentos para obter x resultados
de sucesso com probabilidade .

n 1 x n x
P( x ) = (1 )
x 1

Com essa expresso, pode-se calcular a probabilidade de que o x-ssimo resultado de sucesso com
probabilidade ser obtido at n experimentos, tendo presente que, no conjunto de n experimentos in-
dependentes, h somente dois resultados possveis e a amostragem realizada sem reposio.10 A m-
dia e a varincia de uma distribuio binomial negativa so obtidas com as seguintes expresses:

x (1 )
= 2 = r
2

9 Tambm conhecida como Distribuio de Pascal.


10 Sheskin D.J. Handbook of Parametric and Nonparametric Statistical Procedures Editora Chapman & Hall/CRC 2a edio, 2000.
214 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

EXEMPLO 7.18
A probabilidade de que uma copiadora consiga reproduzir uma copia aceitvel 25%. Qual a probabilidade
de que a quinta cpia aceitvel seja reproduzida depois de doze reprodues?

Soluo. A probabilidade de que exatamente doze reprodues sero necessrias antes que sejam consegui-
das cinco cpias aceitveis 4,30%, resultado obtido com a frmula anterior.

12 1 5 12 5
P ( x = 5) = 0,25 (1 0,25) = 0,0430
5 1

Esse resultado tambm pode ser obtido registrando numa planilha a frmula:
=FATORIAL(11)/(FATORIAL(4)*FATORIAL(11-4))*0,25^5*0,75^7

A partir da linha 12 da planilha Outras funes, includa na pasta Captulo 7, foram realizados os mes-
mos clculos. Na clula O15, com a frmula anterior, porm utilizando os dados do intervalo L15:L17 e, na c-
lula O16, utilizando a funo COMBIN j apresentada. Na clula O17, com a funo estatstica DIST.BIN.NEG
do Excel.

DIST.BIN.NEG(nm_f; nm_s; probabilidade_s)


A funo estatstica DIST.BIN.NEG11 retorna a probabilidade de que o num_s resultado de sucesso com pro-
babilidade probabilidade_s ser obtido depois de ocorrer o nmero de falhas nm_f. Observe que se o nme-
ro de falhas for igual a zero, a funo DIST.BIN.NEG d o mesmo resultado da funo BINOMDIST, conside-
rando que o nmero de experimentos igual ao nmero de sucessos e o argumento cumulativo FALSO, por
exemplo, DIST.BIN.NEG(0;5;0,25)=DISTRBINOM(5;5;0,60;FALSO).

A distribuio hipergeomtrica no uma distribuio derivada da distribuio binomial, pois os


experimentos so dependentes. Em uma populao composta de N objetos que podem ser classifica-
dos em duas categorias, C1 e C2, de forma que na populao h N1 em C1 e N2 em C2. Desejamos retirar
uma amostra sem reposio de n objetos dessa populao, selecionando x objetos de C1 e (n-x) obje-
tos de C2. A probabilidade de selecionar exatamente x objetos requeridos de C1 e (n-x) de C2 dada
pela frmula:

N1 N 2

x n x
p( x ) =
N

n

A mdia e a varincia de uma distribuio hipergeomtrica so obtidas com as seguintes expresses:

N1 N1 N N n
=n 2 = n 1 1
N N N N 1

11 Em ingls, a funo DIST.BIN.NEG NEGBINOMDIST.


C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 215

EXEMPLO 7.19
Qual a probabilidade de selecionar dois meninos e uma menina de uma turma de nove estudantes compostos
de cinco meninos e quatro meninas?

Soluo. A probabilidade de selecionar dois meninos e uma menina de uma turma de nove estudantes com-
postos de cinco meninos e quatro meninas 47,62%, resultado obtido com a frmula anterior.

5 4

2 3 2
P ( x = 2) = = 0,4762
9

3
A partir da linha 20 da planilha Outras funes, includa na pasta Captulo 7, foram realizados os mes-
mos clculos. Na clula O23, utilizando a funo COMBIN, j apresentada. Na clula O24, a funo estatstica
DIST.HIPERGEOM do Excel.

DIST.HIPERGEOM(exemplo_s; exemplo_nm; populao_s; nm_populao)


A funo DIST.HIPERGEOM12 retorna a probabilidade de acontecer o nmero de sucessos do argumento
exemplo_s, conhecido o tamanho da amostra do argumento exemplo_nm, o nmero de sucessos do argu-
mento populao populao_s e o tamanho da populao nm_populao.

Problemas
Problema 1
A tabela a seguir registra a varivel aleatria discreta Y. Calcule a mdia, a varincia e o desvio padro
dessa varivel.

Y 45 56 82 122

p(y) 15% 23% 48% 14%

R: E[Y] = =76,07 Y=23,44

Problema 2
O retorno monetrio para os prximos doze meses de uma ao foi estimado pela varivel aleatria X
registrada na seguinte tabela. Qual o valor esperado e o desvio padro?

X 100 125 145 170 200

p(x) 10% 20% 40% 15% 15%

R: E[X]=148,50 X=28,60

12 Em ingls, a funo DIST.HIPERGEOM HYPGEOMDIST.


216 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problema 3
A estimativa dos preos de uma ao para os prximos doze meses a varivel aleatria Preo, registra-
da na tabela. Calcule o valor esperado e o desvio padro.

Preo 10 14 19 24 30

p(Preo) 10% 25% 35% 20% 10%

R: E[Preo]=$18,95; Preo=$5,61

Problema 4
O lucro lquido estimado (em milhes) da empresa para o prximo ano e suas respectivas probabilida-
des considerando quatro cenrios esto registrados na tabela seguinte. Calcule o valor esperado e o
desvio padro.

Cenrios Lucro lquido Probabilidade

Excelente 10 20%

Bom 5 40%

Sofrvel 1 25%

Ruim -4 15%

R: E[Lucro]=$3,65; Lucro=$4,40

Problema 5
O seguro de vida para pessoas com menos de 65 anos $100.000, devendo-se pagar $1.850 por ano. Se
a probabilidade de uma pessoa com menos de 65 anos morrer no prximo ano for 1,55%, qual a expec-
tativa do lucro anual da seguradora?
R: E[Lucro]=$300,00

Problema 6
Os dados histricos das vendas de um televisor importado mostram que, durante o perodo de garantia de
um ano, 80% dos televisores no apresentaram nenhum problema, 15% requereram algum conserto e re-
gulagem, e os demais 5% deveram ser substitudos. O lucro nos trs casos foi, respectivamente, $85, $20 e
$35 (considerando o valor da venda como sucata). Calcule o lucro esperado na venda de 100 unidades.
R: Lucro esperado=100$69,25=$6.925,00

Problema 7
No lanamento de uma moeda trs vezes seguidas, estamos interessados em conhecer a probabilidade
de obter:
a. Trs caras.
b. Menos do que duas caras.
R: a) P(x=3)=12,50% b) P(x<2)=50%

Problema 8
A companhia de aviao afirma que 95% dos seus voos chegam no horrio. Se for extrada uma amostra
de dez voos dos registros dos ltimos trs meses, calcule a probabilidade de:
a. Pelo menos oito voos chegarem no horrio.
b. Entre sete e nove voos chegarem no horrio.
R: a) 98,85% b) 40,02%
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 217

Problema 9
No transporte de carros novos entre o ptio da montadora e a concessionria, 3% dos carros transpor-
tados sofrem alguma avaria na sua pintura. Se uma concessionria recebe 50 carros, calcule a probabili-
dade de:
a. Nenhum dos carros transportados sofer avaria na pintura.
b. Dois ou mais carros sofrerem avaria na pintura.
R: a) 21,81% b) 44,47%

Problema 10
Em um experimento com distribuio binomial em que so realizadas 120 experincias com proba-
bilidade de sucesso 0,45, qual a mdia e o desvio padro?
R: =54 e =5,45

Problema 11
Suponha que os registros histricos mostram que 30% de uma populao imune a uma determinada
doena de inverno. Se uma amostra probabilstica de dez pessoas retirada dessa populao, qual a
probabilidade de ter exatamente quatro pessoas imunes?
R: P(x=4)=20,01%

Problema 12
Continuando com o problema 11.
a. Qual a probabilidade de ter menos de trs pessoas imunes a essa doena?
b. Qual a probabilidade de ter cinco ou mais pessoas imunes a essa doena?
R: a) P(x<3)=38,28% b) P(x5)=4,73%

Problema 13
A mdia diria de ajustes dos instrumentos de controle de processo da planta qumica de seis instru-
mentos por dia. Considerando que a distribuio de frequncias dos ajustes dos instrumentos do
tipo Poisson, qual a probabilidade de amanh ter de ajustar:
l Exatamente quatro instrumentos?
l Menos de cinco instrumentos?
l Cinco ou mais instrumentos?
l Nenhum instrumento?
R: P(x=4)=13,4%; P(x<5)= P(x4)=28,5%; P(x5)=71,5%; P(x=0)=0,25

Problema 14
O gerente do banco afirma que, em mdia, sua agncia tem de administrar a devoluo de oito cheques
por dia por falta de fundos. Considerando que a distribuio do nmero de cheques devolvidos do
tipo Poisson, qual a probabilidade de amanh ter de devolver:
l Menos de oito cheques?
l Exatamente oito cheques?
l Oito ou mais cheques?
R: P(x<8)=45,30%; P(x=8)=13,96%; P(x8)=54,70%;

Problema 15
O erro de digitao cometido pelos caixas 0,35 por hora. Qual a probabilidade que um caixa cometa
dois erros numa hora?
R: P(x=2)=4,32%
218 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Apndice 1
Outra frmula da varincia

Para mostrar como utilizar outra frmula de clculo da varincia com o conceito de valor esperado
2X = E[X 2 ] E[X]2 , novamente foi resolvido o Exemplo 7.5, utilizando essa frmula na planilha
Apndice 1 do Captulo 7, Figura 7.10.

l Na segunda e terceira colunas da tabela foram registrados os dados da varivel aleatria X.


l Na quarta coluna, foram calculadas e registradas as quatro parcelas do valor esperado da varivel
aleatria e, na quinta e ltima coluna, as parcelas do valor esperado do quadrado da varivel alea-
tria X.
l No intervalo C10:C11 foram calculadas as parcelas da frmula da varincia.

FIGURA 7.10
Resoluo do Exemplo
7.5 com outra frmula
da varincia.

Na clula C12 foi calculada a varincia de X com a frmula:

2X = E[X 2 ] E[X]2

2X = 0,0255 (0,0128) 2 0,0127

O desvio padro de X foi calculado na clula C13, como resultado da raiz quadrada positiva da va-
rincia. No intervalo C16:C19, foram obtidos os mesmos resultados do intervalo C10:C13, porm uti-
lizando frmulas matriciais, que tm a vantagem de retornar o resultado utilizando apenas os dados da
varivel aleatria registrados no intervalo C3:D7, sem necessidade de construir as ltimas duas colu-
nas da tabela.
Ainda possvel obter o resultado da varincia, ou do desvio padro, com uma nica frmula regis-
trada em uma clula vazia da planilha Excel e sem necessidade de construir a tabela com os dados e os
C A P T U L O 7 / VARIVEIS ALEATRIAS E DISTRIBUIES DISCRETAS 219

resultados intermedirios. Por exemplo, a frmula seguinte registrada na clula C22 da planilha Apn-
dice 1 retorna o resultado da varincia sem utilizar nenhum dado nem resultado intermedirio regis-
trado nessa planilha.
=SOMA({-0,1;0;0,12;0,25}^2*{0,1;0,2;0,4;0,3})-
SOMA({-0,1;0;0,12;0,25}*{0,1;0,2;0,4;0,3})^2

Apndice 2
Covarincia como valor esperado

Na tabela da Figura 7.11, esto registradas as sries de valores da varivel X e da varivel Y cujas mdias
so Y=3 e X=10,8.

Y 2 4 3 4 2

X 10 12 10 10 12

FIGURA 7.11 Amostras X e Y.

Para calcular a varincia, utilizamos a seguinte frmula conhecida:

N
1
XY =
N
(X i X ) (Yi Y )
i =1

Substituindo os dados das sries X e Y, temos:

1 (10 10,8)(2 3) + (12 10,8)(4 3) + (10 10,8)(3 3) +


XY =
5 (10 10,8)(2 3) + (12 10,8)(4 3)

Realizando as operaes indicadas, temos o resultado da covarincia:

XY = (10 10,8)(2 3) 0,2 + (12 10,8)(4 3) 0,2 +


+(10 10,8)(3 3) 0,2 + (10 10,8)(2 3) 0,2 + (12 10,8)(4 3) 0,2
XY = 0

Embora a covarincia seja igual a zero, no podemos afirmar que as variveis X e Y sejam indepen-
dentes, como foi apresentado no Captulo 6. Entretanto, esse no o objetivo deste tema. As variveis
X e Y tm valores repetidos, e elas podem se apresentar como uma tabela de probabilidades conjuntas,
tambm conhecida como tabela de contingncias, como mostra a tabela da esquerda da Figura 7.12,
com os valores das variveis aleatrias X e Y classificados. A tabela da direita da Figura 7.12 mostra os
mesmos resultados da tabela da esquerda, porm com referncia ao nmero total de pares de valores,
nesse caso, cinco. Ou, de outra maneira, os valores do miolo da tabela da direita so as probabilidades
conjuntas.
220 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

X X

Y 10 12 Y 10 12

2 1 1 2 0,20 0,20

3 1 0 3 0,20 0

4 1 1 4 0,20 0,20

FIGURA 7.12 Tabela de contingncias das variveis X e Y.

Observe que as probabilidades conjuntas registradas na tabela da direita so os coeficientes dos pro-
dutos dos desvios do clculo da covarincia. Isso mostra que, na frmula da covarincia, est includa a
probabilidade conjunta de cada par de valores, caracterstica representada pela seguinte frmula:

r s
XY = (x i E[X]) ( y j E[Y]) p( x i , y j )
i =1 j =1

Nessa expresso, os limites superiores r e s dos somatrios definem a quantidade de valores das va-
riveis aleatrias X e Y, respectivamente.
l Se a covarincia for calculada diretamente com os pares de valores, teremos n pares e, consequente-
mente, n parcelas a serem somadas.
l Se a covarincia for calculada com a tabela de contingncias, a quantidade de valores de cada uma
das variveis poder ter, no mximo, n valores, que corresponde ao caso em que todos os valores de
cada varivel so diferentes. Nesse caso, o tamanho da tabela ser nn com n clulas iguais a um e
(n2-n) clulas vazias ou iguais a zero.
l Se as variveis tiverem valores repetidos, o nmero de colunas (e linhas) da tabela ser menor do
que n, da que, na frmula da covarincia, utilizamos os valores r e s como limites das somas das
parcelas.
Resumindo, sejam as variveis aleatrias X = x 1 , x 2 , x r e Y = y 1 , y 2 , y s com valores esperados
E[X] e E[Y] e probabilidades conjuntas p( x 1 , y 1 ), p( x r , y s ). A covarincia das variveis X e Y defi-
nida como:
n
XY = (x i E[X]) ( y i E[Y]) p( x i , y i )
i =1

Outra forma da frmula da covarincia


Uma representao mais formal da covarincia expressada como valor esperado a da expresso:

XY = E[( X E[X]) (Y E[Y])]


Desta ltima expresso, demonstra-se que:

XY = E[X Y] E[X] E[Y]


Como verificao, quando as duas variveis so iguais, por exemplo X, obtm-se a expresso da varincia.

XY = Var ( X ) = E[X X] E[X] E[X]

XY = Var ( X ) = E[X 2 ] E[X]2


Captulo 8
DISTRIBUIES
CONTNUAS

N o Captulo 7, foi mostrado que, para definir uma VA de forma completa, necessrio especificar
os valores dos eventos elementares do espao amostral do experimento aleatrio e suas probabili-
dades associadas. Se os valores da varivel aleatria podem assumir qualquer valor do conjunto dos n-
meros reais, a varivel aleatria denominada VA contnua. Por exemplo, os preos dos carros usados,
os salrios dos empregados de uma determinada categoria, as rentabilidades mensais das aes etc.
Lembre que no possvel registrar todos os valores de uma VA contnua em uma lista, tabela ou histo-
grama, pois o nmero de valores possveis muito grande. Dessa maneira, a distribuio de probabili-
dades de uma varivel aleatria contnua definida por uma curva contnua e no por pontos discretos
de uma tabela.
Seja a varivel aleatria contnua X, onde definimos a funo f(x) denominada funo densidade de
probabilidade, com as seguintes propriedades:
l A probabilidade da varivel aleatria X sempre definida em um intervalo de valores dessa varivel
X, por exemplo, (x1, x2).
l A probabilidade da varivel aleatria X medida pela rea sob a curva da funo densidade f(x) em
um determinado intervalo.
l A rea total sob a curva f(x) igual a um ou 100%. Dessa maneira, o valor f(x) da funo densidade
no mede a probabilidade do valor x da varivel aleatria X.

Varivel aleatria contnua


Para a varivel aleatria contnua X que assume valores do conjunto dos nmeros reais, h uma funo
matemtica f(x) com as seguintes premissas:
l A funo densidade de probabilidade f(x) sempre positiva, f ( x) 0 para todo x pertencente a X.
l A rea sob a funo f(x) entre os limites menos infinito e mais infinito da varivel aleatria contnua
+
X igual a um ou 100%, f ( x) dx = 1.

l A probabilidade da VA contnua X dentro do intervalo (a, b) com ambos os limites includos medi-
b
da pela rea definida pela funo f(x) entre os limites a e b, P(a x b) = f ( x) dx. Portanto:
a
222 E S T A T S T I C A US A N D O E X C E L / LAPPONI

l A probabilidade de uma VA contnua sempre calculada dentro de um intervalo de valores, por


exemplo, a e b.
l Um ponto f(x) da funo densidade no a probabilidade do valor x da varivel aleatria X, pois,
por exemplo, o ponto f(x=a) da funo densidade zero.1

Como devem ser representados os limites do clculo da probabilidade de uma varivel aleatria con-
tnua dentro do intervalo (a, b), P(aXb) ou P(a<X<b)? As duas representaes podem ser utilizadas,
incluindo a representao com limites mistos, por exemplo: P(aX<b) ou P(a<Xb)! Neste livro, utili-
zaremos a representao P(aXb).

Valor esperado e varincia da varivel aleatria contnua


Para variveis discretas, no Captulo 7 foi definido o valor esperado da varivel aleatria X com a fr-
n
mula E[X] = x i p( x i ). Essa frmula mostra que o valor esperado de X a soma dos produtos dos valo-
i =1
res da VA pelas respectivas probabilidades associadas. Como num intervalo da VA contnua X h uma
infinidade de valores, no lugar de somar, deve-se integrar o produto x.f(x) entre os limites do intervalo
definido.
Neste captulo, sero apresentadas distribuies de variveis contnuas, comeando pela distribui-
o uniforme.

Seja a VA contnua X com funo densidade de probabilidade f(x):


+
Valor esperado de X : X = x f ( x ) dx
+
Varincia de X: 2X = ( x X )
2
f ( x ) dx e

Desvio padro de X: X = + 2X

Distribuio uniforme
Uma distribuio de varivel aleatria contnua a distribuio uniforme cuja funo densidade de pro-
babilidade constante dentro de um intervalo de valores da varivel aleatria X. Dessa maneira, cada
um dos possveis valores que X com distribuio uniforme pode assumir tem a mesma probabilidade
de ocorrer.

A varivel aleatria X tem distribuio uniforme de probabilidades no intervalo (a,b)


1
se a funo densidade f(x) for f ( x ) = , com as seguintes condies b a e a x
b a
b.

A representao grfica da distribuio uniforme um retngulo com base definida pelos valores a e
b, que estabelecem os limites de valores possveis da varivel aleatria X, Figura 8.1.

a
1 Pela terceira propriedade: P( a X a ) = a f ( x ) dx = 0.
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 223
f(x)

1/(ba) FIGURA 8.1


Distribuio uniforme
X de probabilidades.
a b

Da definio da distribuio uniforme, podemos deduzir:


l A rea do retngulo igual a um, pois a base (ba) e a altura 1/(ba).
l A probabilidade da varivel aleatria X dentro do intervalo (a,b) igual a 1 ou 100%.
l A probabilidade de P(x) dentro do intervalo (c,d), ambos os valores dentro do intervalo (a,b),

f(x)

1/(ba) FIGURA 8.2 Relao


de reas da distribuio
X uniforme.
a c d b

d c
P(c X d) = , como mostra a Figura 8.2.
b a
A mdia e a varincia da VA com distribuio uniforme contnua dentro do intervalo (a,b) so obti-
das utilizando as definies e realizando as integraes necessrias para o intervalo (a X b).

A mdia X e a varincia 2X da varivel aleatria X com distribuio uniforme de


probabilidades no intervalo (a,b) so:
a+b
Mdia: X =
2
(b a )2
Varincia: 2X =
12

A Figura 8.3 mostra a planilha Modelo Distribuio Uniforme includa na pasta Captulo 8. Infor-
mando no intervalo da planilha C4:C5, respectivamente, o valor mnimo e o valor mximo da distribui-
o, o grfico da planilha mostra o contorno da distribuio, linha azul clara, e, no intervalo F4:F6, so
registrados os valores da mdia, da varincia e do desvio padro dessa distribuio.
Depois, informando o intervalo (c,d) no intervalo da planilha C8:C9, o grfico da planilha mostrar
o contorno da rea de probabilidade calculada e a clula F9 retornar a probabilidade desejada, como
mostra a Figura 8.3.

E X E M P L O 8. 1
Calcule a mdia e o desvio padro da varivel aleatria X com distribuio uniforme no intervalo (100, 200).

Soluo. A mdia da varivel aleatria contnua X 150, obtida com a frmula:


a + b 100 + 200
X = = = 150. Da mesma maneira, a varincia 833,33 foi obtida com a frmula:
2 2
(b a )2 (200 100)2
2X = = = 833,33. O desvio padro igual a: X = 833,33 = 28,87. Todos esses resulta-
12 12
dos podem ser visualizados na planilha mostrada na Figura 8.3.
224 E S T A T S T I C A US A N D O E X C E L / LAPPONI

FIGURA 8.3
Distribuio uniforme
contnua.

E X E M P L O 8. 2
Qual a probabilidade de um valor de X pertencer ao intervalo (120, 170)?

Soluo. A probabilidade de um valor da varivel X se encontrar entre 120 e 170 P (120 X 170) = 0,50,
resultado obtido com:
170 120
P (120 X 170) = = 0,50
200 100

Distribuio normal
A distribuio normal uma das distribuies fundamentais da moderna teoria estatstica. A vantagem
da distribuio normal reside na facilidade de defini-la com apenas dois parmetros, a mdia e o des-
vio padro da distribuio, por exemplo, a curva da distribuio normal f(x) para =40, =10 e valo-
res da varivel aleatria no intervalo (10, 70) mostrada na Figura 8.4. Uma das caractersticas impor-
tantes que a partir desses dois parmetros ser possvel calcular, por exemplo, a percentagem de valo-
res que devero estar acima ou abaixo de um determinado valor da varivel aleatria, ou entre esses
dois valores definidos etc.

A varivel aleatria X tem distribuio normal de probabilidades com parmetros


mdia <<+ e varincia 0<2<+, se a funo densidade f(x) for: 2
(x)2
1
f (x ) = e 2 2
2

Analisando a frmula da funo densidade f(x), observe que, para cada par de parmetros e , h
uma curva diferente de f(x) ou que, para qualquer outro par de parmetros e , a curva f(x) ser dife-
rente. Portanto, no h apenas uma nica distribuio normal e sim uma famlia de distribuies nor-
mais representadas como N(,).

2 Os valores das constantes matemticas da frmula so e=2,71828... e =3,1416...


C A P T U L O 8 / DISTRIBUIES C ONTNUAS 225
0,5 f(x)
0,4
FIGURA 8.4
0,3
0,2 Distribuio normal,
0,1 parmetros =40
X
0
e =10.
10 20 30 40 50 60 70

Propriedades da Distribuio Normal


A distribuio normal da varivel aleatria X com mdia X e varincia 2X tem as
seguintes propriedades:

f(x) tende a zero quando x tende a mais ou a menos infinito, ou f(x) 0 quando
x
A rea total sob a curva 100%, e cada metade da curva tem 50% da rea total, pois
a curva simtrica ao redor da mdia X .
A probabilidade P(aXb) a rea sob a curva no intervalo (a,b).

Influncia dos parmetros na forma da distribuio normal


O que ocorreria com a forma da distribuio normal N(40, 10) da Figura 8.4, se o valor da mdia for
mudado de 40 para 50? A forma da distribuio permaneceria a mesma, porm com a mdia deslocada
de 40 para 50 e definindo a nova distribuio normal N(50, 10).

FIGURA 8.5
Distribuies normais
para =10 e dois
valores de mdia.

Na planilha Famlia DN, includa na pasta Captulo 8, possvel visualizar o comportamento da


forma da distribuio normal quando muda o parmetro mdia e o parmetro desvio padro. A tabela
de cada grfico da distribuio normal foi construda utilizando a frmula da funo f(x) dessa distri-
buio. As duas curvas de distribuio normal da Figura 8.5 aceitam mudanas dos valores de mdia e
desvio padro, porm de forma diferente. No intervalo C3:C4, possvel mudar os parmetros da cur-
va de cor azul registrando novos valores; no entanto, os parmetros da curva vermelha so mudados
226 E S T A T S T I C A US A N D O E X C E L / LAPPONI

acionando um dos dois controles giratrios por vez, clula E3 e E4. Observe que, ao variar o valor da
mdia de 40 para 50, mantendo constante o desvio padro =10, a distribuio normal mantm sua
forma e se desloca para a direita. Da mesma maneira, para valores de mdia menores a 40, por exemplo
=30, a distribuio manter sua forma e se deslocar para a esquerda de =40.
Para analisar o comportamento da forma da distribuio normal variando o desvio padro, lembre-
mos primeiro o significado do desvio padro apresentado no Captulo 4. A terceira regra prtica estabe-
lece que, em todas as distribuies, a porcentagem de valores contidos dentro de trs desvios padro ao
redor da mdia ser prxima de 100%. Como a distribuio normal simtrica ao redor da mdia, qual-
quer que for o valor do desvio padro, praticamente 100% dos valores da varivel aleatria estaro con-
tidos dentro de trs desvios padro ao redor da mdia. Se na distribuio normal N(40, 10), o desvio pa-
dro for mudado para 15, a forma da curva da N(40, 15) ser mais aberta do que a anterior N(40, 10). A
Figura 8.6 mostra que a distribuio aumentou sua base e, consequentemente, diminui sua altura para
manter a rea de 100%. Da mesma maneira, pode-se verificar que, para desvios padro menores do que
10, a distribuio diminui sua base e aumenta sua altura.

FIGURA 8.6
Distribuies normais
para =40 e desvios
padro diferentes.

Clculo de probabilidade
A probabilidade P(aXb) da varivel aleatria contnua X ser igual ou maior do que a e, ao mesmo
tempo, menor ou igual a b obtida da rea definida pela funo f(x) entre os limites a e b, sendo b>a. O
procedimento de clculo passa pela integrao da funo f(x) no intervalo (a,b), procedimento bastan-
te trabalhoso. Todavia, utilizando a funo estatstica DIST.NORM do Excel, esse clculo se tornar
mais simples e, neste momento, nos permitir compreender o processo de clculo da probabilidade
P(X) da varivel aleatria contnua X com distribuio normal. Os exemplos a seguir mostram os pro-
cedimentos bsicos de clculo com a distribuio normal.

E X E M P L O 8. 3
Os resultados do experimento formam uma varivel aleatria X com distribuio normal N(40, 10). Qual a
probabilidade de um resultado do experimento ser menor ou igual a 50?

Soluo. Os resultados do experimento tm distribuio normal com mdia =40 e desvio padro =10.
Estamos procurando o valor da probabilidade P(X50), a rea sob a curva da distribuio normal no intervalo
(, 50), como mostra a figura seguinte.
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 227

P(X50) X
10 15 20 25 30 35 40 45 50 55 60 65 70

O valor dessa rea o resultado da integrao da funo f(x) entre menos infinito e 50. Uma forma prtica
de calcular a probabilidade P(X50) utilizando a funo estatstica DIST.NORM do Excel.

DIST.NORM(x; mdia; desv_padro; cumulativo)


A funo DIST.NORM3 retorna a funo densidade da distribuio normal ou a probabilidade acumulada
de menos infinito at o valor do argumento x, conforme o valor registrado no argumento cumulativo.
Se no argumento cumulativo for registrado o valor FALSO, a funo estatstica DIST.NORM retornar a valor
f(x) para o valor x informado no primeiro argumento da funo, considerando os parmetros mdia e desvio
padro da distribuio, registrados no argumento mdia e no argumento desv_padro.
Se no argumento cumulativo for registrado o valor VERDADEIRO, a funo DIST.NORM retornar a probabi-
lidade acumulada de menos infinito at x, considerando os parmetros mdia e desvio padro da distribui-
o, registrados no argumento mdia e no argumento desv_padro. Nesse caso, a funo DIST.NORM cal-
cula a integral da funo f(x) no intervalo (, x).

Neste exemplo, a probabilidade P(X50) igual a 84,13%, resultado obtido com a frmula
=DIST.NORM(50;40;10;VERDADEIRO), registrada em uma clula vazia de qualquer planilha Excel. Esse resul-
tado tem o seguinte significado:

A probabilidade de um resultado do experimento (ou valor da varivel aleatria X) com distribuio normal
N(40, 10) ser menor ou igual a 50 84,13%.
Ou podemos dizer que 84,13% dos resultados do experimento (ou valores da varivel aleatria X) com dis-
tribuio normal N(40, 10) esto dentro do intervalo (, 50).

E X E M P L O 8. 4
Continuando com a distribuio normal do Exemplo 8.3, qual a probabilidade de um resultado do experi-
mento ser igual ou menor do que 35?

Soluo. Este problema parecido com o anterior, pois devemos calcular a probabilidade P(X35) obtida da
rea sob a curva no intervalo (, 35), como mostra a figura a seguir.

P(X35) X
10 15 20 25 30 35 40 45 50 55 60 65 70

A probabilidade P(X35) igual a 30,85%, resultado obtido com a frmula =DIST.NORM(35;40;10;VER-


DADEIRO), registrada em uma clula vazia de qualquer planilha Excel. Ou seja, a probabilidade de um resulta-
do do experimento (ou valor da varivel aleatria X) com distribuio normal N(40, 10) ser menor ou igual a
35 30,85%, ou 30,85% dos resultados do experimento (ou valores da varivel aleatria X) com distribuio
normal N(40, 10) esto dentro do intervalo (, 35).

E X E M P L O 8. 5
Continuando com a distribuio normal do Exemplo 8.3, qual a probabilidade de um resultado do experi-
mento estar dentro do intervalo (25, 60)?

3 Em ingls, o nome da funo DIST.NORM NORMDIST.


228 E S T A T S T I C A US A N D O E X C E L / LAPPONI

Soluo. A probabilidade de um resultado de o experimento pertencer ao intervalo (25, 60) definida pela
rea sob a curva da distribuio normal definida entre os limites 25 e 60, como mostra a figura seguinte.

P(X50)

10 15 20 25 30 35 40 45 50 55 60 65 70

Como a funo a funo DIST.NORM retorna a probabilidade acumulada de menos infinito at x, o clculo
da probabilidade procurada P(25X60) dever ser realizado em duas partes P(25X60)= P(X60)P(X25).
Primeiro deve ser calculada a probabilidade P(X60)=0,977250, que corresponde rea da figura esquerda.
Depois deve ser calculada a probabilidade P(X25)=0,066807. que corresponde rea da figura direita.
Subtraindo a rea da figura da direita da rea da figura da esquerda ser obtida a primeira figura que represen-
ta a probabilidade procurada P(25X60).

P(X60) P(X25)

10 15 20 25 30 35 40 45 50 55 60 65 70 10 15 20 25 30 35 40 45 50 55 60 65 70

A probabilidade P(25X60) 91,04%, obtida como resultado da diferena das duas probabilidades ante-
riores 0,9772500,066807=0,910443 ou 91,04%. Esse resultado pode ser obtido com a funo DIST.NORM,
registrando a frmula seguinte =DIST.NORM(60;40;10;VERDADEIRO)DIST.NORM(25;40;10;VERDADEIRO)

O resultado tem o seguinte significado:

A probabilidade de um resultado do experimento (ou valor da varivel aleatria X) com distribuio normal
N(40, 10) pertencer ao intervalo (25, 60) 91,04%.
Ou podemos dizer que 91,04% dos resultados do experimento (ou valores da varivel aleatria X) com dis-
tribuio normal N(40, 10) esto dentro do intervalo (25, 60).

E X E M P L O 8. 6
A Gerncia de Desenvolvimento da empresa aplicou um teste de conhecimentos gerais. O resultado mostrou
que as respostas podem ser representadas com uma distribuio normal N(450, 100). Se Joo Pedro obteve
525 pontos, que percentagem de funcionrios tiraram mais pontos do que ele?

Soluo. Agora voc deve calcular a probabilidade P(X525), como mostra a prxima figura. Como a funo
DIST.NORM retorna a probabilidade acumulada de menos infinito at x, este problema dever ser resolvido
pelo complemento P(X525)=1P(X525).

P(X 525) X
150 213 275 338 400 463 525 588 650 713

Registrando a frmula =1DIST.NORM(525;450;100;VERDADEIRO), obtm-se P(X525)=22,66%. Ou


seja, 22,67% dos funcionrios que participaram do teste de conhecimentos gerais tiraram mais pontos do que
Joo Pedro.
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 229

Resultados importantes da distribuio normal


A frmula da funo densidade f(x) mostra que, para cada par de parmetros e , h uma curva dife-
rente de f(x), ou para qualquer outro par de parmetros e , a curva f(x) ser diferente. Embora no
haja apenas uma nica distribuio normal e sim uma famlia de distribuies normais representadas
com N(,), elas mantm algumas propriedades em comum, por exemplo, a porcentagem de resulta-
dos ao redor da mdia.

.
Qual a percentagem de valores localizados dentro de um desvio padro ao redor da mdia 200 da
varivel aleatria X com distribuio normal N(200, 10)? De outra maneira, um valor de X inclu-
do no intervalo de um desvio padro ao redor da mdia deve estar no intervalo (190, 210). A proba-
bilidade de um valor da varivel aleatria X estar dentro de um desvio padro ao redor da mdia
P(190X210)=0,6827 ou 68,27%, resultado obtido com a frmula
=DIST.NORM(210;200;10;VERDADEIRO) DIST.NORM(190;200;10;VERDADEIRO)
Esse resultado mostra que 68,27% dos valores da varivel X com distribuio normal se distribuem
no intervalo de um desvio padro ao redor da mdia. Ou que a probabilidade de um resultado do expe-
rimento com distribuio N(200, 10) pertencer ao intervalo (190, 210) 68,27%.

.
Qual a percentagem de valores da varivel X com distribuio normal N(200, 10) localizados dentro de
dois desvios padro ao redor da mdia? Um valor de X includo no intervalo de dois desvios padro ao
redor da mdia deve estar no intervalo (180, 220). A probabilidade de um valor da varivel aleatria X
estar dentro de dois desvios padro ao redor da mdia P(180X220)=0,9545 ou 95,45%, resultado
obtido com a frmula:
=DIST.NORM(220;200;10;VERDADEIRO) DIST.NORM(180;200;10;VERDADEIRO)
Esse resultado mostra que 95,45% dos valores da varivel X com distribuio normal se distribuem
no intervalo de dois desvios padro ao redor da mdia. Ou que a probabilidade de um resultado do ex-
perimento com distribuio N(200, 10) pertencer ao intervalo (180, 220) 95,45%.

.
Qual a percentagem de valores da varivel X com distribuio normal N(200, 10) localizados dentro de
trs desvios padro ao redor da mdia? Um valor de X includo no intervalo de trs desvios padro ao
redor da mdia deve estar no intervalo (170, 230). A probabilidade de um valor da varivel aleatria X
estar dentro de trs desvios padro ao redor da mdia P(170X230)=0,9973 ou 99,73%, resultado
obtido com a frmula: =DIST.NORM(230;200;10;VERDADEIRO) DIST.NORM(170;200;10;VER-
DADEIRO)
Esse resultado mostra que 99,73% dos valores da varivel X com distribuio normal se distribuem
no intervalo de trs desvios padro ao redor da mdia. Ou que a probabilidade de um resultado do ex-
perimento com distribuio N(200, 10) pertencer ao intervalo (170, 230) 99,73%.
A Figura 8.7 mostra o grfico da distribuio normal f(x) construdo na planilha Modelo Distribui-
o Normal includo na pasta Captulo 8 e incluindo a representao dos intervalos dos trs tipos de
desvios padro utilizando os dados da apresentao dos resultados importantes da distribuio nor-
mal. Com os controles giratrios, so informados os valores da mdia na clula C3 e o desvio padro na
clula C4 e, ao mesmo tempo, a planilha recalcula a tabela do intervalo B6:C31, de acordo com o tipo
de probabilidade escolhida na caixa de grupo:
230 E S T A T S T I C A US A N D O E X C E L / LAPPONI

FIGURA 8.7 Grfico


f(x) da DN, incluindo os
intervalos dos desvios
padro.

FIGURA 8.8
Probabilidade
acumulada da DN, com
os intervalos dos desvios
padro.

l f(x). Fornecer o valor da funo f(x) para o valor x.


l Probabilidade acumulada at x. Fornecer a probabilidade acumulada de menos infinito at x.

A Figura 8.8 mostra o grfico da probabilidade acumulada de menos infinito at x da DN, incluindo
a representao dos intervalos dos trs desvios padro.

Modelo DN
O modelo estatstico Modelo DN, includo na pasta Captulo 8, facilita os clculos de probabilidade
com a distribuio normal N(, ), como mostra a Figura 8.9, calculando a probabilidade de um valor
da varivel aleatria com distribuio N(200, 10) pertencer ao intervalo (180, 220). No modelo:
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 231

l As clulas do intervalo C3:C6, pintadas de cor azul, aceitam somente dados, e as clulas do intervalo
C7:D7, pintadas de cor verde, so clulas de resultados.
l Nas clulas D5 e D6 so selecionados os tipos de limite do intervalo para clculo da probabilidade
desejada. Assim, no exemplo da Figura 8.9, o limite inferior 180 e o limite superior 220. Os
dados registrados no intervalo C5:C6 so utilizados para definir os limites nas duas caixas de com-
binaes.
l Na caixa de combinao da clula D5, possvel escolher os limites e . Na caixa de combinao

da clula D6, possvel escolher os limites , e No.


l Na clula D7, registrado o resultado numrico e, no intervalo B7:C7, informado o texto da proba-
bilidade calculada.

FIGURA 8.9
Modelo DN
calculando um
resultado importante.

Distribuio normal padronizada


Na primeira parte da apresentao da distribuio normal foi mostrado que:

l A probabilidade P(Xa) o resultado de integrar a funo f(x) da distribuio normal N(,) entre
os limites (, a).
l O clculo de probabilidades bastante trabalhoso, pois no h apenas uma nica distribuio nor-
mal e sim uma famlia de distribuies normais N(,).

A funo estatstica DIST.NORM do Excel e o Modelo DN reduzem sensivelmente o procedimento


de clculo; entretanto, o procedimento clssico de clculo de probabilidades utiliza a distribuio nor-
mal padronizada obtida da distribuio normal N(, ), realizando a mudana da varivel X.

A varivel aleatria desvio padro normalizado Z de uma distribuio normal


X
padronizada definida pela expresso Z =

A nova varivel Z realiza clculos de probabilidades com uma nica curva de distribuio denomi-
nada distribuio normal padronizada N(0, 1). Depois da transformao da varivel, a funo densida-
z 2

1
de f(x) passa a ser f ( Z) = e 2 .
2
232 E S T A T S T I C A US A N D O E X C E L / LAPPONI

Propriedades da Distribuio Normal Padronizada


A distribuio normal da varivel aleatria Z com mdia Z e varincia 2Z tem as
seguintes propriedades:
Z = 0 e 2Z = 1
f(Z) 0 quando Z
A curva simtrica ao redor da mdia Z = 0. A rea total sob a curva 100%, e cada
metade da curva tem 50% da rea total.
A probabilidade P(Z 1Z Z 2) a rea sob a curva no intervalo (Z 1,Z 2).

A planilha Modelo DN Padronizada, includa na pasta Captulo 8 mostra a curva nica da varivel Z
com distribuio normal N(0, 1). A tabela e o grfico foram construdos com os limites de quatro des-
vios padro ao redor da mdia, Figura 8.10. Uma das vantagens da distribuio normal padronizada a
facilidade de visualizar resultados como, por exemplo, a percentagem de valores da varivel Z com um,
dois e trs desvios padro ao redor da mdia. Outra vantagem que, com a passagem para o desvio pa-
dro normalizado Z, a distribuio Z agrupa a famlia da distribuio normal em uma nica distribuio,
o desvio padro normalizado.

FIGURA 8.10
Distribuio normal
padronizada.

Depois de realizar a transformao, a curva da distribuio normal padronizada Z tem a mesma for-
ma que a da distribuio normal, porm com mdia e desvio padro, respectivamente, zero e um, re-
presentada como N(0, 1). A seguir, ser mostrado o procedimento de clculo de probabilidade utili-
zando a distribuio Z.

E X E M P L O 8. 7
Qual a probabilidade de um valor de X ser menor ou igual a 52,4, sabendo que a varivel tem distribuio nor-
mal (40, 10)?

Soluo. O objetivo determinar a probabilidade P(X52,4). Para utilizar a distribuio normal padronizada,
o primeiro passo determinar Z=1,24, resultado obtido com a frmula:

X 52,4 40
Z = = = +124
,
10
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 233

Esse resultado pode ser obtido com a funo PADRONIZAR do Excel.

PADRONIZAR(x; mdia; desv_padro)


A funo estatstica PADRONIZAR4 retorna o desvio padro normalizado Z considerando os argumentos x,
x
mdia e desv_padro e utilizando a frmula conhecida Z = . Digitando a frmula =PADRONI-

ZAR(52,4;40;10) numa clula vazia da planilha Excel, obtm-se o resultado procurado Z=1,24.

Neste momento, temos a equivalncia P(X52,4)=P(Z1,24). A probabilidade que estamos procurando se

P(Z+1,24) Z
3 2,5 2 1,5 1 0,5 0 0,5 1 1,5 2 2,5 3

encontra na rea sombreada da figura a seguir.


O valor da probabilidade P(Z1,24) pode ser obtido com a funo DIST.NORM, registrando a frmula
=DIST.NORM(1,24;0;1;VERDADEIRO) numa clula da planilha Excel para obter o resultado procurado
P(Z1,24)=0,8925. Esse resultado tambm pode ser obtido com a funo DIST.NORMP do Excel para a distri-
buio normal padronizada.

DIST.NORMP(z)
A funo estatstica DIST.NORMP5 retorna a probabilidade acumulada da distribuio normal padronizada
Z, de menos infinito at o valor registrado no argumento z.

Registrando a frmula =DIST.NORMP(1,24) numa clula da planilha Excel, obtm-se a probabilidade


P(Z1,24)=0,8925. Para obter esse resultado, primeiro foi obtido o valor de z; contudo, poderamos evitar
esse clculo registrando a frmula =DIST.NORMP(PADRONIZAR(52,4;40;10)), sendo que, no lugar do argu-
mento z, foi includa a funo PADRONIZAR que calcula o valor z.

Tabela Z
Para mostrar a utilizao da Tabela Z, sero utilizados os dados do Exemplo 8.7. A tabela Z_DISTR foi
construda na pasta Tabelas disponvel na pgina do livro, no site da Editora, e reproduzida parcial-
mente na Figura 8.11. Essa tabela comea no valor z=0, com o valor 0,5000 correspondente probabi-
lidade acumulada da metade negativa da curva, regio de valores de z negativos. Tanto a primeira colu-
na quanto os ttulos dos cabealhos das demais colunas registram valores de z. Na primeira coluna, so
registrados os valores de z, variando com intervalo de um dcimo, por exemplo, 0; 0,10; 0,20, e assim
por diante, at o valor z=4. Nos cabealhos das colunas, so registrados os valores de z variando com
intervalo de um centsimo, por exemplo, 0,00; 0,01; 0,02, e assim por diante, at o valor z=0,09.
Vejamos como se procura o valor da probabilidade P(Z1,24) na tabela Z. A localizao do valor
z na tabela comea pela seleo da linha 1,20 e depois da coluna 0,04. Na interseo dessa linha e
dessa coluna, tem-se z=1,24 e, nessa clula, o valor procurado P(Z1,24)=0,8925, como mostra a
Figura 8.11. Qual o significado do resultado P(Z1,24)? O resultado 0,8925 a probabilidade
P(Z1,24), correspondente rea da curva de Z no intervalo (-, +1,24). Quando o valor de z
no estiver explicitamente registrado na planilha, dever ser realizada uma interpolao linear en-
tre os dois valores mais prximos, um deles o maior seguinte, e o outro, o menor anterior ao valor
de z procurado.

4 Em ingls, o nome da funo STANDARDIZE.


5 Em ingls, o nome da funo NORMSDIST.
234 E S T A T S T I C A US A N D O E X C E L / LAPPONI

0,5000 0,5040 0,5080 0,5120 0,5160 0,5199

0,5398 0,5438 0,5478 0,5517 0,5557 0,5596

0,5793 0,5832 0,5871 0,5910 0,5948 0,5987

0,6179 0,6217 0,6255 0,6293 0,6331 0,6368

0,6554 0,6591 0,6628 0,6664 0,6700 0,6736

0,6915 0,6950 0,6985 0,7019 0,7054 0,7088

0,7257 0,7291 0,7324 0,7357 0,7389 0,7422

0,7580 0,7611 0,7642 0,7673 0,7704 0,7734

0,7881 0,7910 0,7939 0,7967 0,7995 0,8023

0,8159 0,8186 0,8212 0,8238 0,8264 0,8289

0,8413 0,8438 0,8461 0,8485 0,8508 0,8531

0,8643 0,8665 0,8686 0,8708 0,8729 0,8749

0,8849 0,8869 0,8888 0,8907 0,8925 0,8944

0,9032 0,9049 0,9066 0,9082 0,9099 0,9115

FIGURA 8.11 Tabela da distribuio Z, listagem parcial.

A curva da distribuio Z tem a mesma forma que a curva da distribuio X, com a mudana dos va-
lores do eixo X para o eixo Z. Sugerimos que voc tente visualizar a mesma curva de distribuio nor-
mal com os dois eixos X e Z. Como h diversos clculos de probabilidade, a tabela da Figura 8.12 apre-
senta o resumo dos procedimentos de clculo de probabilidade utilizando a tabela da distribuio nor-
mal padronizada Z.

P(Z a); a > 0 Direto da tabela

P(Z a); a > 0 1P(Z a)

P(Z a); a < 0 1P(Z |a|)

P(Z a); a < 0 P(Z |a|)

FIGURA 8.12 Procedimentos de clculo com a Tabela Z.

A tabela da Figura 8.12 mostra como operar com a tabela quando se procura o valor de probabili-
dade diferente do registrado na tabela. Essas regras registradas na tabela utilizam a propriedade de
simetria da distribuio normal. Por exemplo, a probabilidade P(Z a), sendo a positivo, corres-
ponde cauda superior da curva a partir do valor a. A rea que procuramos a rea complementar
de P(Z a), que pode ser obtida da tabela. Portanto, o valor de P(Z a) procurado o resultado de
(1P(Z a)).
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 235

E X E M P L O 8. 8
Se a varivel X tem distribuio normal com parmetros N(40, 10), qual a probabilidade P(X50)?

Soluo. O valor equivalente de X=50 na distribuio normal padronizada Z=+1, resultado obtido com a
X 50 40
frmula Z = = = +1. Da tabela Z, para Z=+1, obtm-se P(X50)=P(Z1)=0,8413 ou 84,13%.
10
O mesmo resultado obtido com:

A frmula =PADRONIZAR(50,4;40;10) registrada em uma clula de uma planilha Excel.


Lembrando da propriedade da distribuio normal, possvel realizar um clculo mental. Por exemplo, o
valor X=50 se situa a um desvio padro positivo da mdia. Sabemos que 68,26% dos valores de X se distri-
buem no intervalo de um desvio padro ao redor da mdia; portanto, a metade dessa percentagem,
34,13%, somada metade com desvio negativo de 50% resulta no valor de distribuio procurado,
84,13%.

E X E M P L O 8. 9
Continuando com a varivel X do Exemplo 8.8, qual a probabilidade P(X35)?

Soluo. Para X=35, obtm-se Z=-0,50, porm na tabela no podemos procurar P(Z0,50). Contudo, a ter-
ceira linha da tabela da Figura 8.12 registra que a probabilidade P(Za), sendo a negativo, deve ser calculada
como complemento utilizando a frmula 1P(Z|a|), onde |a| significa que deve ser utilizado o valor a como
positivo. Nesse caso, 1P(Z|a|)=1P(Z+0,50)=10,6915=0,3085.

E X E M P L O 8. 1 0
Continuando com a varivel X do Exemplo 8.8, qual a probabilidade P(25X60)?

Soluo. Os valores de Z para X=25 e X=60 so Z1=1,50 e Z2=+2,0. Como a probabilidade P(1,5Z+2,0)
no obtida diretamente da tabela Z, ela ser o resultado da diferena P(Z+2)P(Z1,5), procedimento que
deve ser realizado por partes:
A probabilidade P(Z+2,0) igual a 0,9772, obtida diretamente da tabela.
A segunda parte P(Z1,5)=1P(Z+1,5)=1-0,9332=0,0668.
Finalmente, P(1,5Z+2,0)=0,97720,0668=0,9104 ou 91,04%.

Modelo clculos com DN


O modelo estatstico Clculos DN, includo na pasta Captulo 8, equivalente ao Modelo DN, porm
incluindo os valores de Z e o grfico da distribuio que mostra as reas sob a curva que esto sendo uti-
lizadas no clculo requerido. A Figura 8.13 mostra o modelo calculando a probabilidade de um valor da
varivel aleatria com distribuio N(200, 10) pertencer ao intervalo (190, 210). No modelo:

l As clulas do intervalo C3:C6 aceitam somente dados.


l Nas clulas D4 e D5, so selecionados os tipos de limite do intervalo para clculo da probabilidade de-
sejada. Assim, no exemplo da Figura 8.13, o limite inferior 190 e o limite superior 210. Os dados
registrados no intervalo C5:C6 so utilizados para definir os limites nas duas caixas de combinaes.
l Na caixa de combinao da clula D5, possvel escolher os limites e . Na caixa de combinao

da clula D6, possvel escolher os limites , e No.


l Nas clulas do intervalo F5:F6, so registrados os valores de Z correspondentes aos limites registra-
dos em C5:C6.
l No intervalo B7:E7, registrado o resultado informando o texto da probabilidade calculada.
236 E S T A T S T I C A US A N D O E X C E L / LAPPONI

l O grfico da distribuio normal mostra a(s) rea(s) sob a curva que est(o) sendo utilizada(s) no
clculo requerido.

FIGURA 8.13 Modelo


Clculos DN.

Outros clculos com a distribuio normal


O objetivo dos exemplos de distribuio normal apresentados at este momento foi o clculo da proba-
bilidade de que ocorra um determinado evento, sendo conhecidos os parmetros da distribuio nor-
mal, a mdia e o desvio padro. H outros problemas com a distribuio normal, por exemplo, o clcu-
lo inverso e a determinao dos parmetros da distribuio normal a partir de constataes prticas.

Clculo inverso
O clculo inverso calcula o valor x da varivel aleatria X correspondente a uma determinada probabi-
lidade de ocorrncia.

E X E M P L O 8. 1 1
Jota afirma que est entre os 5% maiores vendedores da empresa, pois seu total de vendas no ano passado foi
de $1.350.000. Considerando que as vendas de todos os vendedores tm a distribuio normal
N($1.250000, $100.000), verifique se a afirmao do vendedor Jota correta.

5% maiores vendedores

3 2,5 2 1,5 1 0,5 0 0,5 1 1,5 2 2,5 3

Z1=+1,645

Soluo. Os 5% maiores vendedores da empresa esto localizados no final da cauda superior da distribuio
normalizada da figura acima. Qual o valor Z1 que verifica a relao P(ZZ1)=5%? Como a tabela no tem regis-
trada essa parte da rea da curva, deveremos procurar a probabilidade complementar 0,95 obtida como resul-
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 237

tado da diferena (1-0,05). Procurando no miolo da tabela Z, verificamos que o valor 0,95 no coincide com
nenhum dos valores registrados na tabela Z, pelo que ser necessrio realizar uma interpolao. Como o valor
0,95 situa-se entre 0,9495 (Z=1,64) e 0,9505 (Z=1,65), interpolando entre esses valores obtm-se Z=1,645,
que corresponde probabilidade P(Z1,645)=0,05. Com os dados disponveis, a N($1.250000, $100.000) e
o valor Z=1,645, calculamos o valor de venda mnimo x correspondente a 5% dos maiores vendedores, utili-
zando a frmula do desvio padro normalizado Z:

x x $1250000
. .
Z = = = 1645
,
$100000
.
Dessa expresso, temos que o valor de venda mnimo x correspondente a 5% dos maiores vendedores
x=$1.414.500, como mostra a frmula:

x = 1645
, $100000
. + $1250000
. . = $1414500
. . .

Concluindo, para pertencer ao grupo dos 5% maiores vendedores da empresa, seria necessrio vender
pelo menos $1.414.500. Como o vendedor Jota vendeu $1.350.000, ele no pertence ao grupo dos 5%
maiores vendedores.

Verifique que o salrio de Jota est no grupo dos 15,87% maiores vendedores da empresa, resultado obtido
pelo clculo direto da probabilidade a partir do valor de vendas anuais, P(X1.350.000)=0,1587. Como aju-
da, verifique que o valor de vendas de Jota est a um desvio padro da mdia da distribuio.

Outra forma de calcular o valor de venda mnimo X correspondente a 5% dos maiores vendedores utili-
zando a funo estatstica INV.NORM.

INV.NORM(probabilidade; mdia; desv_padro)


A funo INV.NORM6 retorna o valor de x correspondente aos argumentos probabilidade, mdia e desv_pa-
dro. A funo INV.NORM a inversa da funo DIST.NORM, com argumento cumulativo VERDADEIRO.
Para calcular o valor de venda mnimo x correspondente a 5% dos maiores vendedores, registramos a fr-
mula =INV.NORM(0,95;1250000;100000) em uma clula vazia da planilha Excel. Essa frmula retorna o
resultado $1.414.485, resultado um pouco diferente do obtido da tabela Z com valores arredondados.
No clculo de x, o Excel utiliza um procedimento iterativo at alcanar um erro de 3107. Entretanto,
se at 100 iteraes no for possvel encontrar o resultado, a funo INV.NORM retornar o resultado
#N/A.

O Excel tambm dispe da funo INV.NORMP que pode ser utilizada.

INV.NORMP(probabilidade)
A funo INV.NORMP7 retorna o valor Z da probabilidade informada, valor entre zero e um. A funo
DIST.NORMP considera que a probabilidade informada se refere probabilidade acumulada de menos infi-
nito at Z, pois esta funo a inversa da funo DIST.NORMP. Para calcular o valor de venda mnimo x cor-
respondente a 5% dos maiores vendedores, registramos a frmula =INV.NORMP(0,95)*100000+1250000,
retornando $1.414.485, o mesmo resultado obtido com a funo INV.NORM.
Neste caso, tambm, no clculo de Z, o Excel utiliza um procedimento iterativo at alcanar um erro de
310-7. Entretanto, se at 100 iteraes no for possvel encontrar o resultado, a funo DIST.NORMP
retornar o resultado #N/A.

Outra forma de resolver o Exemplo 8.11 utilizando a planilha Clculo Inverso, includa na pasta
Captulo 8, como mostra a Figura 8.14. Este modelo parecido com os anteriores, porm adaptado
para retornar o valor de x nas duas possveis respostas selecionadas na caixa de combinao da clula
D6.

6 Em ingls, o nome da funo INV.NORM NORMINV.


7 Em ingls, o nome da funo INV.NORMP NORMSINV.
238 E S T A T S T I C A US A N D O E X C E L / LAPPONI

FIGURA 8.14 Planilha


Clculo Inverso,
resolvendo
o Exemplo 8.11.

E X E M P L O 8. 1 2
Os registros histricos da loja mostram que a demanda mensal do sabonete especial Alfa tem distribuio nor-
mal com mdia 2.400 e desvio padro 230. Como o valor mdio do ticket de compra desses compradores o
mais alto da loja, o gerente quer garantir que 99% dessas vendas sejam atendidas. Calcule o estoque que a loja
deve ter no incio de cada ms.

Soluo. Para que 99% das vendas do sabonete especial Alfa sejam atendidas, a loja dever ter no incio de
cada um estoque de 2.935 unidades, resultado obtido com a frmula =INV.NORM(0,99;2400;230). Esse re-
sultado pode ser obtido com a planilha Clculo Inverso, como mostra a figura seguinte.

Clculo dos parmetros da distribuio normal


O Exemplo 8.13 mostra outro tipo de problema com a distribuio normal, no qual a varivel aleatria
tem distribuio normal, porm seus parmetros no so conhecidos.

E X E M P L O 8. 1 3
Como costuma ocorrer, o diretor de novos projetos necessita, para ontem, da estimativa preliminar do valor
do investimento do lanamento do novo produto. Quando pergunta ao gerente de novos projetos da empre-
sa, que tem muita experincia na avaliao desse tipo de projeto, bastante frequente na empresa, ele respon-
de que a estimativa do investimento se situa entre $1.500.000 e $2.000.000, com 50% de probabilidade de
acerto. Qual o valor dos parmetros dessa distribuio, considerando que a varivel investimento tem distri-
buio normal?
Soluo.
Determinao da mdia. A estimativa mnima $1.500.000 e a estimativa mxima $2.000.000 do inves-
timento definem a mdia $1.250.000 do investimento, pois a varivel aleatria investimento tem distribui-
o normal.
Determinao do desvio padro. Como a estimativa do investimento se situa entre $1.500.000 e
$2.000.000, com 50% de probabilidade de acerto, devemos entender que elas se distribuem ao redor da
mdia em duas metades iguais de 25% de cada lado da mdia. Dessa maneira:
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 239

O desvio padro normalizado Z do investimento mximo $2.000.000 Z=0,675, valor obtido da tabela
Z, procurando a probabilidade 0,75 (0,50+0,25), ou da frmula =INV.NORMP(0,75) que retorna o valor
0,6745. Ademais, pela simetria da distribuio normal, o desvio padro normalizado Z do limite inferior
$1.500.000 ser Z=0,6745.

Se na frmula do desvio padro normalizado Z, substituirmos os dados:

$2000000
. . $1750000
. .
0,6745 =

Obteremos o desvio padro da estimativa do investimento, que $370.645:

$250000
.
= = $370645
.
0,675
Os resultados mostram que a distribuio normal da estimativa do investimento N(1.750.000, 370.645).

Os parmetros da distribuio normal do Exemplo 8.13 podem ser obtidos com a planilha Clculo Pa-
rmetros DN, includa na pasta Captulo 8, como mostra a Figura 8.15. Esse modelo tambm parecido
com os anteriores, porm adaptado para retornar os valores dos parmetros da distribuio normal, utili-
zando um dos dois valores, Mnimo e Mximo, selecionado na caixa de combinao da clula D6.

FIGURA 8.15 Planilha


Clculo Parmetros
DN, resolvendo o
Exemplo 8.13.

E X E M P L O 8. 1 4
Para definir o preo unitrio de um novo produto, o gerente do produto costuma analisar dois cenrios, um
otimista e o outro pessimista. No caso do novo detergente em cubos para mquina de lavar louas, ele definiu:

O preo do cenrio otimista de $25 por pacote, considerando que a probabilidade de exceder esse valor
seja de 5%.
O preo do cenrio pessimista de $18 por pacote, considerando que a probabilidade de reduzir esse valor
seja de 5%.

Considerando que o preo unitrio tenha distribuio normal, qual o valor dos parmetros dessa distribuio?

Soluo. Os dados do exemplo mostram que o preo mdio unitrio do novo detergente $21,50, re-
sultado obtido como mdia dos preos dos dois cenrios. As probabilidades de 5%, em ambos os extre-
mos da distribuio, de exceder o valor otimista e de reduzir o valor pessimista, definem a probabilidade
de 90% entre os preos dos cenrios pessimista e otimista. A probabilidade 90% se distribui ao redor da
mdia em duas metades iguais, 45% de cada lado. Dessa maneira, o desvio padro Z do preo do cenrio
otimista $25 Z=1,645, resultado obtido com a frmula =INV.NORMP(0,95). Continuando com o proce-
dimento de clculo, obtm-se o desvio padro da estimativa do investimento igual a $2,13. Esse resultado
tambm pode ser obtido com a planilha Clculo Parmetros DN, como mostra a figura a seguir, utili-
zando o limite inferior.
240 E S T A T S T I C A US A N D O E X C E L / LAPPONI

O prximo Exemplo 8.15 mostra como calcular a mdia da distribuio normal conhecendo o des-
vio padro da distribuio e atendendo a certas especificaes de valor da varivel aleatria e sua pro-
babilidade de ocorrncia.

E X E M P L O 8. 1 5
O produto farmacutico colocado enchido em frascos por uma mquina automtica que pode ser ajustada em qual-
quer volume entre dez e vinte centmetros cbicos. O volume do produto uma varivel aleatria com distribuio nor-
mal com desvio padro de 0,4 centmetro cbico. A especificao do controle de qualidade exige que pelo menos 98%
dos frascos contenham 16 centmetros cbicos ou mais. Para qual o volume que a mquina deve ser ajustada?

Soluo. A incgnita do problema a mdia da distribuio normal, pois a mquina automtica pode ser
ajustada em qualquer volume entre dez e vinte centmetros cbicos. Especificar que 98% dos frascos enchidos
contenham pelo menos 16 centmetros cbicos equivalente a afirmar que 2% das ampolas enchidas tero
volume inferior a 16 centmetros cbicos. Portanto:
O desvio padro Z da probabilidade acumulada 2% de menos infinito at 16 Z=2,054, resultado obtido
com a frmula =INV.NORMP(0,02).
16
Substituindo os dados disponveis na frmula do desvio padro normalizado teremos 2,054 = .
0,40
A mquina de enchimento dever ser regulada no valor 16,82 centmetros cbicos, resultado obtido com a
frmula = 16 + 2,054 0,40 = 16,82.

A mdia da distribuio normal do Exemplo 8.15 pode ser obtida com o modelo construdo a partir
da linha 11 da planilha Clculo Parmetros DN, includa na pasta Captulo 8, como mostra a Figura
8.16. Este modelo tambm parecido com os anteriores, porm adaptado para retornar o valor da m-
dia da distribuio normal, utilizando um dos dois lados da distribuio normal. Selecionando a rela-
o adequada na caixa de combinao da clula D16, de acordo com a rea da probabilidade utilizada, o
modelo calcula os valores de Z e da mdia.

FIGURA 8.16 Planilha


Clculo Parmetros
DN, resolvendo o
Exemplo 8.15.
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 241

Distribuio exponencial
A distribuio exponencial uma distribuio contnua aplicada em muitos problemas de empresas nas
reas de servios e manufaturas, em geral denominados problemas de fila de espera. Quando os servi-
os prestados por uma empresa para clientes externos ou internos so de durao varivel, a distribui-
o exponencial indicada para analisar esses experimentos, por exemplo, a durao do atendimento
do caixa de um banco ou de postos de sade, o tempo de operao sem interrupo de um equipamento
etc. A distribuio exponencial definida pelo nico parmetro , denominado mdia, que mede a m-
dia de chegadas por hora, por exemplo, ou de servios por minuto ou alguma outra unidade de tempo.

Probabilidade da Distribuio Exponencial


A funo densidade de probabilidade da distribuio exponencial f ( x ) = e x com
>0, x0 e o nmero e=2,71828...
A mdia igual a =1/ e o desvio padro igual a =1/.
A probabilidade acumulada de zero at a P ( X a ) = 1 e a .
A probabilidade acumulada complementar P ( X a ) = e a , ou como complemento
da anterior P ( X a ) = 1 P ( X a ).

FIGURA 8.17 Funo


densidade da
Distribuio
Exponencial.

A distribuio exponencial definida pela funo densidade de probabilidade f ( x) = e x . As ca-


ractersticas mais importantes so:
l A distribuio no simtrica, como mostra a Figura 8.17, para dois valores do parmetro . Essas
distribuies foram construdas na planilha Funo Densidade DE, includa na pasta Captulo 8,
utilizando a frmula da funo densidade.
l A varivel aleatria X assume somente valores positivos, ou x0.
l Comparando com a distribuio normal, enquanto esta completamente definida por dois parme-
tros, mdia e desvio padro, a distribuio exponencial definida por apenas um nico parmetro .
Acionando o controle giratrio, voc pode analisar o comportamento da curva da distribuio expo-
nencial em funo do parmetro .
242 E S T A T S T I C A US A N D O E X C E L / LAPPONI

E X E M P L O 8. 1 6
O prazo de operao de uma mquina de embalagem de frascos, sem interrupes para manuteno, tem
distribuio exponencial com mdia de duas horas. Qual a probabilidade de essa mquina conseguir operar
mais de uma hora sem interrupo?

Soluo. A probabilidade da mquina de embalagem de frascos conseguir operar uma hora ou mais sem in-
terrupo P(x1). Da distribuio exponencial acumulada complementar com mdia de duas horas e
=0,50 com a frmula P ( x 1) = e 0 ,50 1 = 0,6065 ou 60,65%.
Esse resultado tambm pode ser obtido com a funo estatstica DISTEXPON do Excel.

DISTEXPON(x; lambda; cumulativo)


A funo estatstica DISTEXPON8 retorna a funo densidade de x ou a probabilidade acumulada de zero
at x, conforme o argumento cumulativo. Se cumulativo for FALSO, a funo estatstica DISTEXPON retorna-
r a funo densidade f ( x ) = e x . Se cumulativo for VERDADEIRO, a funo DISTEXPON retornar a pro-
babilidade acumulada de zero at x, ou P(Xx) valor obtido com a frmula P ( X x ) = 1 e x .

Registrando a frmula =1DISTEXPON(1;0,5;VERDADEIRO) em uma clula vazia de uma planilha Excel, te-
mos o resultado P(X1)=0,6065.

Essa frmula calcula o complemento, pois a funo DISTEXPON no d a probabilidade requerida.

O primeiro grfico da Figura 8.18 mostra o grfico da distribuio exponencial f(x). Esse grfico foi
construdo na planilha Modelo Distribuio Exponencial, includo na pasta Captulo 8. Informando
o valor de na clula C3, a planilha recalcula a tabela do intervalo B6:C16, de acordo o tipo de probabi-
lidade escolhida na caixa de grupo:

l f(x). Fornecer o valor da funo f(x) para o valor x.


l Probabilidade acumulada at x. Fornecer a probabilidade acumulada de zero at x.

Selecionando o boto de opo Probabilidade acumulada at x, a planilha recalcula a tabela do inter-


valo B6:C16. O segundo grfico da Figura 8.17 mostra o grfico da probabilidade acumulada de zero
at x.

E X E M P L O 8. 1 7
O atendente de servios em garantia da distribuidora de carros atende a uma mdia de quatro clientes por
hora. Qual a probabilidade de que um cliente requeira menos de 15 minutos?

Soluo. Para iniciar os clculos, necessrio ter uma nica medida de tempo. Como unidade de tempo, po-
de-se escolher uma hora ou quinze minutos, com os mesmos resultados. Por exemplo:
Escolhendo como unidade de tempo o intervalo de 15 minutos, a mdia de atendimentos ser =1 cliente
cada 15 minutos. A probabilidade P(X1) de que um cliente requeira menos de 10 minutos 0,6321, resul-
tado obtido com a frmula =DISTEXPON(1;1;VERDADEIRO) registrada em uma clula da planilha Excel.
Escolhendo a unidade de tempo uma hora, a mdia de atendimentos ser =4 clientes por hora, e o interva-
lo de 15 minutos ser equivalente ao intervalo de x=15/60 por hora. A probabilidade P(X15/60) de que um
cliente requeira menos de 15/60 hora 0,6321, resultado obtido registrada numa clula da planilha Excel a
frmula =DISTEXPON(10/60;3;VERDADEIRO).

A probabilidade de que um cliente requeira menos de 15 minutos 63,21%.

8 Em ingls, a funo DISTEXPON EXPONDIST.


C A P T U L O 8 / DISTRIBUIES C ONTNUAS 243

FIGURA 8.18 Grficos da Distribuio Exponencial.

Distribuio lognormal
A distribuio normal est presente em muitas situaes. Uma das aplicaes que interessa neste mo-
mento utilizada agora, porm ser apresentado com mais detalhe no Captulo 10. Por exemplo, um
cabo de ao tranado utilizado num elevador, ou alguma outra aplicao de trao, formado por mui-
tos fios de ao que, adequadamente entrelaados, conferem uma forte resistncia ao cabo. A fora ou a
capacidade do cabo Y a soma das capacidades individuais dos fios de ao yi:

Y = y1 + y 2 + y3 +  + y i +  + y n

n
Y = yi
i =1

Se o nmero de fios n que formam o cabo for adequadamente grande, apesar de a distribuio da ca-
pacidade dos fios de ao no ser normal, a distribuio da capacidade do cabo ser normal, pelo Teo-
rema Central do Limite, que ser apresentado no Captulo 10. Esse exemplo mostra que uma varivel alea-
tria Y, definida como a soma de n variveis aleatrias yi pode ser descrita com uma distribuio nor-
mal, atendendo a alguns requisitos. Outra situao frequente aparece no caso de uma varivel aleatria
X definida pelo produto de n variveis aleatrias xi, como mostra a frmula:
244 E S T A T S T I C A US A N D O E X C E L / LAPPONI

X = x1 x 2 x3  x i  x n

n
X = xi
i =1

Um exemplo prtico da multiplicao de variveis aleatrias a determinao da taxa de retorno de


um ativo durante um ms, obtido como resultado da multiplicao da variao de preos dirios desse
ativo. Aplicando o logaritmo natural aos dois membros dessa frmula:

ln X = ln x 1 + ln x 2 + ln x 3 +  + ln x i +  + ln x n

n
ln X = ln x i
i =1

Se os termos do segundo membro cumprem com os requisitos necessrios, a analogia com a soma
anterior clara, podendo-se afirmar que a varivel aleatria lnX tem distribuio normal. Se Y=lnX, po-
de-se dizer que a varivel aleatria Y tem distribuio normal, e a varivel aleatria X tem distribuio
lognormal.

A varivel aleatria X com valores positivos tem distribuio lognormal com funo
densidade de probabilidade f(x) se a varivel aleatria Y definida como Y=ln(X) tem
distribuio normal com mdia Y e desvio padro Y.

1
1 (ln x
Y )2
f ( x ) =
2

e 2 Y
para x > 0
x Y 2
f ( x ) = 0 para x 0

A mdia e a varincia de X com distribuio lognormal so:


Y2
Y +
X = e 2

2Y = e 2 + Y2
(e 1)
2
Y Y

Na planilha Distribuio Lognormal, includa na pasta Captulo 8, foram construdas duas funes
densidade de probabilidade f(x) da distribuio lognormal. Registrando outros valores de mdia e des-
vio padro da distribuio normal Y=lnX no intervalo de clulas C4:D5, ser possvel analisar o com-
portamento dessas funes, ajustando o intervalo do eixo x das curvas com valores diferentes registra-
dos na clula D7. No intervalo de clulas G4:H5, a planilha fornece a mdia e o desvio padro de cada
distribuio lognormal, como mostra a Figura 8.19.
A distribuio lognormal muito utilizada em engenharia de confiabilidade9 para descrever falhas
causadas por fadiga de material, incertezas e taxas de falhas e uma variedade de outros fenmenos. Ain-
da tem a propriedade de que se duas variveis aleatrias tm distribuio lognormal, a funo gerada
pelo produto dessas duas variveis tambm ter distribuio lognormal.10 Tambm bastante utilizada

9 Do Houaiss, 3. capacidade de uma unidade funcional desempenhar, sem falhas ou avarias, dada tarefa sob certas condies e den-
tro de um perodo determinado.
10 Lewis E. E. Introduction to Reliability Engineering John Wiley, Second Edition,1996.
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 245

FIGURA 8.19 Funo


densidade da
distribuio lognormal.

em opes de ativos da teoria moderna de finanas. Por exemplo, analisando a varivel aleatria retor-
no de um investimento em aes:

l A relao entre o resgate e a aplicao pode ser maior do que um, sem nenhuma limitao at onde o
prprio mercado permitir.
l Entretanto, a relao entre o resgate e a aplicao pode ser menor do que um at o limite de no res-
gatar nada e perder a aplicao realizada, provocando uma distribuio de retornos assimtrica.

O Excel dispe das funes estatsticas DIST.LOGNORMAL e INVLOG para clculos com a distri-
buio lognormal. Exemplos com funes esto registrados a partir da linha um da coluna J da planilha
Distribuio Log-normal includa, na pasta Captulo 8.

DIST.LOGNORMAL(x; mdia; desv_padro)


A funo estatstica DIST.LOGNORMAL11 retorna a probabilidade acumulada de zero at x, conheci-
dos os argumentos mdia e desv_padro.

INVLOG(probabilidade; mdia; desv_padro)


A funo estatstica INVLOG12 retorna o valor de x para do argumento probabilidade, conhecidos os ar-
gumentos mdia e desv_padro. A funo INVLOG a funo inversa da funo DIST.LOGNORMAL.
Como a distribuio lognormal relacionada com a distribuio normal, a probabilidade acumula-
da de zero at x na distribuio lognormal, com parmetros e , igual probabilidade acumulada de
menos infinito at lnx da distribuio normal, com mdia e desvio padro :

ln( x)
P( X x) = DIST. LOGNORMAL ( x, , ) = DIST. NORM

11 Em ingls, a funo DIST.LOGNORMAL LOGNORMDIST.


12 Em ingls, a funo INVLOG LOGINV.
246 E S T A T S T I C A US A N D O E X C E L / LAPPONI

Essa igualdade pode ser verificada nas clulas L6 e L7 da planilha Distribuio Lognormal, como
mostra a Figura 8.20.
Da mesma maneira, o clculo de x para uma determinada probabilidade acumulada, considerando
os parmetros da distribuio lognormal, tem a seguinte equivalncia com a distribuio normal:

x = INVLOG ( p, , ) = e [ + INV. NORM( p )]

Essa igualdade pode ser verificada nas clulas L14 e L15 da planilha Distribuio Lognormal, como
mostra a Figura 8.20.

FIGURA 8.20 Funes


DIST.LOGNORMAL e
INVLOG.

Problemas
Problema 1
A amostra X foi retirada de uma populao com distribuio uniforme com valores mximo e mnimo
iguais a 35 e 125, respectivamente. Calcule a probabilidade de um dado de uma amostra ser maior do
que 50.
R: P(X50)=P(50X125)=0,83

Problema 2
Continuando com o Problema 1. Calcule as probabilidades P(X65); P(55X105) e P(X35).
R: P(X65)=P(35X65)=0,33 ; P(55X105)=0,56 e P(X35)=0

Problema 3
Continuando com o Problema 1. Calcule a mdia e o desvio padro dessa distribuio uniforme.
R: =80 e =25,98

Problema 4
Repita os Problemas 1, 2 e 3 utilizando a planilha Distribuio Uniforme.

Problema 5
Devido elevada volatilidade do mercado, a estimativa do preo da Ao X para os prximos 12 meses
mostra que dever ser um valor dentro do intervalo $10 e $50, com igual probabilidade para todos os
valores de preo dentro desse intervalo. Calcule:
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 247

a. A mdia e o desvio padro do preo da ao.


b. A probabilidade de que o valor da ao seja maior do que $40.
R: a) =$30 e =$11,55 b) P(X40)=25%

Problema 6
A populao tem distribuio normal com mdia igual a 20 e desvio padro 5. Qual a probabilidade de
um valor de uma amostra retirada dessa populao:
a. Ser menor ou igual a 22?
b. Pertencer ao intervalo (19, 22)?
R: a) P(X22)=65,54% b) P(19X22)=23,47%

Problema 7
Seja a varivel aleatria X com distribuio normal (100; 25). Qual a probabilidade de que x>125, x<50
e 75x150?
R: P(X125)=15,87% P(X50)=2,28% P(75x150)=81,86%

Problema 8
Os resultados da pesquisa de custo de vida de famlias de baixa renda mostram que a despesa mensal
com alimentao tem distribuio normal com mdia $500 e desvio padro $90. Sem utilizar nenhum
recurso de clculo, apenas desenhando a curva da distribuio normal, que porcentagem dessas fa-
mlias tem despesas mensais com alimentao:
a. At $500?
b. At $410?
c. Maiores do que $590?
d. Maiores do que $680?
e. Menores do que $680?
R: a) 50,00% b) 15,87% c) 15,87% d) 2,28% e) 97,72%

Problema 9
Continuando com o Problema 8, que porcentagem dessas famlias tem despesas mensais com alimen-
tao:
a. Entre $400 e $500?
b. Entre $200 e $300?
c. Entre $490 e $580?
R: a) 36,67% b) 1,27% c) 35,72%

Problema 10
Continuando com o Problema 8, que porcentagem dessas famlias em despesas mensais com alimen-
tao:
a. Superiores a $400?
b. Inferiores a $400?
c. Inferiores a $585?
d. Maiores a $585?
R: a) 86,67% b) 13,33% c) 82,75% d) 17,25%

Problema 11
Se os salrios anuais dos auxiliares de escritrio de uma grande empresa tm distribuio normal com
mdia $12.500 e desvio padro $2.800, qual a proporo dos auxiliares de escritrio que ganham:
248 E S T A T S T I C A US A N D O E X C E L / LAPPONI

a. Mais que $14.500?


b. Menos que $11.000?
c. Entre $10.000 e $14.000?
R: a) P(X14.500)=23,75% b) P(X11.000)=29,61% c) P(10.000X14.000)=51,80%

Problema 12
O peso das latas de pssego em calda tem distribuio normal com mdia 1.000 gramas e desvio padro
40 gramas. Se for retirada uma lata de um lote grande de latas, calcule a probabilidade de conter:
a. Menos que 990 gramas.
b. Mais que 1.060 gramas.
c. No intervalo (950, 1.050).
R: a) P(X990)=40,13% b) P(X1.060)=6,68% c) P(950X1.050)=78,87%

Problema 13
Os depsitos mensais na caderneta de poupana do banco tm distribuio normal com mdia $500 e des-
vio padro $150. Se um depositante realizar um depsito, qual a probabilidade de que esse depsito seja:
a. Menor ou igual a $650?
b. Maior ou igual a $650?
c. Entre $250 e $650?
R: a) 84,13% b) 15,87% c) 79,36%

Problema 14
A comisso anual das vendedoras domiciliares de uma importante empresa de cosmticos tem distri-
buio normal com mdia $30.000 e desvio padro de $7.500. Se aleatoriamente for escolhida uma
vendedora domiciliar, calcule a probabilidade de que essa vendedora domiciliar ganhe:
a. Mais do que $35.000 por ano.
b. Menos do que $12.000 por ano.
c. Entre $20.000 e $30.000 por ano.
R: a) P(X35.000)=25,25% b) P(X12.000)=0,82% c) P(20.000X30.000)=40,88%

Problema 15
O fabricante da mquina de enchimento de refrigerantes afirma que o volume das garrafas tem mdia
de 610 ml com desvio padro de 8 ml. Qual a probabilidade de uma garrafa de refrigerante conter:
a. Menos de 600 ml?
b. Mais de 600 ml?
c. Entre 600 e 620 ml?
R: a) 10,56% b) 89,44% c) 78,87%

Problema 16
A anlise estatstica de um investimento mostrou que seu resultado lquido mensal uma varivel alea-
tria X com mdia $10.000 e desvio padro $4.000. Sabendo que a varivel X tem distribuio normal,
qual a probabilidade de o resultado lquido X ser:
a. Menor do que $5.000?
b. Maior do que $15.000?
c. Entre $5.000 e $15.000?
R: a) P(X 5.000)=10,56% b) P(X 15.000)=10,56% c) P(5.000X15.000)=78,88%
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 249

Problema 17
As vendas dirias da empresa tm distribuio normal com mdia $100.000 e desvio padro $28.000.
Calcule a probabilidade que num dia qualquer as vendas sejam:
a. Menores do que $72.000
b. Maiores do que $115.000
c. Entre $90.000 e 110.000
R: a) 15,87% b) 29,61% c) 27,90%

Problema 18
A pesquisa de salrios mensais dos trainees de empresas do mesmo ramo mostrou que os salrios tm
distribuio normal com mdia $950 e desvio padro $185. Calcule a probabilidade de um trainee
ganhar:
a. Menos de $800 por ms.
b. Mais de $1.200 por ms.
c. Entre $850 e $1.150 por ms.
R: a) 20,87% b) 8,83% c) 56,58%

Problema 19
Continuando com o Problema 18. Pedro, um dos trainees, afirma que seu salrio est exatamente no
limite superior do terceiro quartil de todos salrios. Qual o valor desse salrio?
R: $1.074,78

Problema 20
Continuando com o Problema 18. Aproveitando a onda, Raul, outro dos trainees, afirma que seu sal-
rio se situa exatamente em 2 desvios padro positivos. Qual o valor desse salrio?
R: $1.320,00

Problema 21
As vendas mensais durante os ltimos 50 meses tm distribuio normal, com mdia igual a $500 mil e
desvio padro $80 mil. Se para o prximo ms a empresa estabeleceu uma meta de vendas de $550 mil,
considerando que os dados histricos se repetem no futuro prximo, calcule:
a. A probabilidade de ficar abaixo da meta.
b. A probabilidade de superar a meta.
c. A probabilidade de as vendas se situarem entre 80% e 110% da mdia.
R: a) P(X 550)=73,40% b) P(X 550)= 26,60% c) P(400 X 550)= 62,84%

Problema 22
O saldo dirio de caixa da empresa durante os ltimos 400 dias tem distribuio normal, com mdia
$110.000 e desvio padro $40.000. Calcule:
a. A probabilidade do saldo dirio de caixa ser menor do que $100.000.
b. A probabilidade do saldo dirio de caixa ser negativo.
R: a) P(X$100.000)=40,13% b) P(X$0)=0,30%

Problema 23
Continuando com o Problema 22. Analise o resultado da probabilidade do saldo dirio de caixa ser ne-
gativo.
R: O valor P(X$0)=0,30% indica que entre um e dois dias dos 400 dias o saldo dirio de caixa foi me-
nor do que zero.
250 E S T A T S T I C A US A N D O E X C E L / LAPPONI

Problema 24
Continuando com o Problema 22. Aceitando a probabilidade de 10% de ter saldo dirio de caixa nega-
tivo, calcule a nova mdia do saldo dirio de caixa.
R: =$51.200 (Valor obtido com Z=1,28)

Problema 25
Querendo aplicar os conhecimentos de Estatstica, o Engenheiro de Obra manteve o seguinte dilogo
com o Mestre de Obra:
Eng Quantos azulejos, em mdia, um azulejista consegue assentar por dia?
Mestre Um oficial azulejista experiente consegue assentar, em mdia, 8 metros quadrados de azulejos
por dia de 8 horas.
Eng Como todos os dias so diferentes, quais seriam os valores mximo e mnimo?
Mestre Em geral, esse azulejista assenta entre 6 e 10 metros quadrados de azulejos por dia, devido aos
recortes etc.
Eng Considerando que o nmero de dias do ms seja 100%, que porcentagem dos dias do ms o azule-
jista consegue assentar entre 6 e 10 metros quadrados de azulejos por dia?
Mestre Em geral, esse azulejista assenta entre 6 e 10 metros quadrados de azulejos por dia em 85% dos
dias do ms.
Considerando que os metros quadrados de azulejos assentados por dia tenham uma distribuio
normal, calcule a mdia e o desvio padro dessa distribuio.
R: Mdia=8 e Desvio Padro=1,39

Problema 26
O Controle de Qualidade assegura que a durao do tipo de pneu mais vendido tem distribuio nor-
mal com mdia 60.000 km e desvio padro 1.300 km. Embora no haja reclamaes ligadas com a du-
rao desse tipo de pneu, para aumentar as vendas, o gerente de marketing est propondo garantir aos
compradores um valor mnimo de quilometragem. Se essa campanha publicitria estima um aumento
do lucro da empresa em 5%, considerando a substituio de 3% dos pneus vendidos, qual a quilometra-
gem mnima que deve ser assegurada ao comprador?
R: Quilometragem mnima de 57.554 km

Problema 27
O gerente do controle de qualidade da empresa de refrigerantes afirma que as garrafas tm mdia 610 ml e
desvio padro 8 ml com distribuio normal. Qual a probabilidade:
a. De uma garrafa conter menos de 600 ml de refrigerante?
b. Mais de 600 ml de refrigerante?
c. Entre 600 e 620 ml de refrigerante?
R: a) 10,56% b) 89,44% c) 78,87%

Problema 28
O gerente do posto bancrio dentro de uma empresa verificou que o saldo mdio das contas correntes
aumentou depois do contato pessoal realizado com grupos de clientes. Se o saldo mdio tem a distribui-
o normal N($650, $228), qual a probabilidade de o saldo mdio de uma conta ser:
a. Menor ou igual a $330?
b. Maior ou igual a $350?
R: a) P(X330 )=66,95% b) P(X350 )=1,42%
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 251

Problema 29
Depois de realizar mais de mil simulaes, a distribuio do valor presente lquido do projeto de inves-
timento, simplesmente VPL, aproxima-se de uma normal com mdia $245.000 e desvio padro
$83.500. Qual a probabilidade de que o VPL seja:
a. Negativo?
b. Menor do que $25.000?
R: a) P(VPL0 )=0,17% b) P(VPL$25.000 )=0,42%

Problema 30
Suponha que a estatura de uma certa populao de pessoas seja aproximadamente normal, com mdia
de 177 centmetros e desvio padro de 7,8 centmetros. Qual a probabilidade de que a estatura de uma
pessoa seja:
a. Maior do que 175 centmetros?
b. Maior do que 180 e menor do que 190 centmetros?
c. Menor do que 170 centmetros?
R: a) 60,12% b) 30,25% c) 18,47%

Problema 31
O QI (quociente de inteligncia) dos estudantes de uma escola tem uma distribuio aproximadamen-
te normal, com mdia 106 e varincia de 260. Qual a probabilidade de que o QI de um estudante seja:
a. Menor que 99?
b. Maior que 128?
c. Entre 95 e 117?
R: a) 33,21% b) 66,79% c) 50,49%

Problema 32
Para ser membro da Mensa International (mesa, em latim), por exemplo, o candidato precisa obter
uma pontuao que o encaixe entre os 2% mais inteligentes do mundo cerca de 132 pontos no teste
de QI. A mdia da populao, em geral, varia em torno de 100.13 Considerando que o QI seja uma vari-
vel aleatria com distribuio normal, qual o desvio padro?
R: QI=15,58

Problema 33
Continuando com o Problema 32. Qual o QI de um participante que pertence ao seleto grupo dos 0,1%
mais inteligentes do mundo?
R: QI=148,15

Problema 34
Continuando com o Problema 32. Qual o QI de um participante que pertence ao grupo dos:
a. Um em trinta mil mais inteligentes do mundo?
b. Um em um milho mais inteligentes do mundo?
R: a) QI=162,13 b) QI=174,06

Problema 35
Quando uma empresa afirma que seu processo atende especificao Seis Sigma ela quer informar que
a variabilidade de seu processo, produto ou servio menor do que 3,4 falhas por milho de oportuni-

13 Do artigo de Bel Moherdaui Gnios de carteirinha publicado na Revista da Folha em 16/01/2000.


252 E S T A T S T I C A US A N D O E X C E L / LAPPONI

dades. Verifique que esse limite de falhas por milho equivale a 99,99666% de perfeio. Pista: tenha
em mente que as falhas ocorrem em ambas as caudas da distribuio normal e a percentagem de perfei-
o se distribui por igual ao redor da mdia da distribuio normal.

Problema
Seja a distribuio exponencial com mdia =12, qual a probabilidade de que a prxima chegada ocor-
ra em:
a. Menos do que X=0,2?
b. Mais do que X=0,2?
c. Entre 0,1 e 0,2?
R: a) 90,93% b) 9,07% c) 21,05%

Problema 37
Em dias normais e durante o expediente normal, o caixa automtico do banco recebe 18 clientes por
hora. A partir do momento da chegada de um cliente, qual a probabilidade de que o prximo cliente
chegue dentro dos prximos quatro minutos?
R: =18, x=4/60 e P(x)=69,88%

Problema 38
Nos domingos tarde, os carros chegam ao pedgio da estrada com uma mdia de 120 carros por hora.
A partir do momento da chegada de um carro, qual a probabilidade de que o prximo carro chegue:
a. Dentro de um minuto?
b. Dentro de dois minutos?
c. Dentro de meio minuto?
R: =120, x=1/60 a) P(x)=86,47% b) P(x)=98,17% c) P(x)=63,21%
C A P T U L O 8 / DISTRIBUIES C ONTNUAS 253

Apndice 1
Gerao de nmeros aleatrios

Desde o incio do livro, tivemos oportunidade de gerar e utilizar nmeros aleatrios em vrias aplicaes.
No Captulo 1, foram definidos e gerados dgitos e nmeros aleatrios utilizando a funo ALEATRIO
e a funo ALEATRIOENTRE do Excel. Ainda nesse captulo, foi realizada a simulao da retirada de
uma bola com reposio de uma urna com dez bolas que apresentam uma distribuio uniforme discreta,
utilizando a ferramenta Amostragem, e o modelo para amostragem sem reposio. Na simulao do lan-
amento da moeda do Captulo 5, foi utilizada a ferramenta de anlise Gerao de nmero aleatrio, com o
tipo de distribuio discreta para gerar os nmeros aleatrios 0 e 1 com probabilidade de 50% para cada
um. Na simulao realizada para extrair Notas$ de uma urna no Captulo 7, foi utilizado o procedimento
de gerao de nmeros aleatrios de uma distribuio de frequncias uniforme.
A gerao de nmeros aleatrios utilizada nos processos de simulao com diversas distribuies
tericas disponveis e algumas definidas para determinada situao. Os nmeros aleatrios gerados
so utilizados para selecionar valores de uma varivel aleatria a partir de sua distribuio de frequn-
cias acumuladas, como mostrado a seguir com duas distribuies conhecidas.

Distribuio Normal. A Figura 8.21 mostra a curva da distribuio de frequncias acumuladas da dis-
tribuio normal N(40, 15) construda na planilha Gerao Dgitos Aleatrios, includa na pasta Ca-
ptulo 8.

Distribuio Normal
1,00
FIGURA 8.21
0,50
Distribuio normal
0,00 acumulada.
10 0 10 20 30 40 50 60 70 80 90

Um nmero aleatrio gerado no intervalo (0, 1) define uma reta horizontal que na interseco com a
curva determina o valor da varivel correspondente no eixo de abscissas; por exemplo, o nmero alea-
trio 0,25 define o valor da varivel 29 (valor aproximado pela baixa resoluo do grfico).

Distribuio Uniforme. A Figura 8.22 mostra a curva da distribuio de frequncias acumuladas da


distribuio uniforme no intervalo (-10, 90) construda na planilha Gerao Dgitos Aleatrios, inclu-
da na pasta Captulo 8.

Distribuio Normal
1,00
FIGURA 8.22
0,50
Distribuio uniforme

0,00 acumulada.
10 0 10 20 30 40 50 60 70 80 90
254 E S T A T S T I C A US A N D O E X C E L / LAPPONI

Um nmero aleatrio gerado no intervalo (0, 1) da distribuio uniforme define uma reta horizontal
que, na interseco com a curva, determina o valor da varivel correspondente no eixo de abscissas;
por exemplo, o nmero aleatrio 0,25 define o valor da varivel 15 (valor aproximado pela baixa reso-
luo do grfico). Como se pode ver nas figuras 8.21 e 8.22, o eixo de ordenadas que representa o valor
da probabilidade acumulada o mesmo para as duas distribuies, pois os valores da distribuio de
frequncias acumuladas relativas estaro sempre no intervalo (0, 1); entretanto, os correspondentes
valores das variveis so diferentes.
A Figura 8.23 mostra as duas amostragens no mesmo grfico depois de gerar o nmero aleatrio
0,75 com a funo ALEATRIO, por exemplo. Das distribuies de frequncias acumuladas, obtm-se
o valor 51 na distribuio normal e o valor 66 na distribuio uniforme, ambos valores aproximados
pela baixa resoluo do grfico, situao que no ocorre na prtica, pois utilizado o valor gerado sem
passar pelo grfico.

FIGURA 8.23
Distribuies normal e P(X50)
uniforme acumuladas.
10 15 20 25 30 35 40 45 50 55 60 65 70

Ferramenta de anlise Gerao de Nmero Aleatrio


A ferramenta de anlise Gerao de nmero aleatrio14 gera dgitos aleatrios extrados de distribuies
de frequncias tericas, por exemplo, a distribuio normal, a distribuio uniforme, a distribuio bi-
nomial etc., ou de distribuies de frequncias definidas pelo usurio. Essa ferramenta retorna nme-
ros aleatrios gerados da forma como foi apresentado anteriormente. Para compreender a utilizao
dessa ferramenta de anlise, sero gerados nmeros aleatrios das distribuies normal e uniforme.

Distribuio normal
A gerao de nmeros aleatrios com a distribuio normal, utilizando a ferramenta Gerao de nme-
ro aleatrio, foi realizada na planilha Gerao Nmeros Aleatrios, includa na pasta Captulo 8:

l Depois de selecionar Anlise de dados dentro do menu Ferramentas, o Excel exibir a caixa de di-
logo Anlise de dados com todas as ferramentas de anlise disponveis.
l Escolhendo a ferramenta Gerao de nmero aleatrio e depois pressionando o boto OK, ser exi-
bida a caixa de dilogo correspondente, mostrada na Figura 8.24, depois de selecionadas algumas
opes.
l Pressionando o boto Ajuda dessa caixa de dilogo, o Excel apresentar a pgina Sobre a caixa de
dilogo Gerao de nmero aleatrio pertencente Ajuda do Excel.

As informaes que devem ser registradas na caixa de dilogo da ferramenta Gerao de nmero aleat-
rio so:

l Nmero de variveis. Informar o nmero de colunas de valores que se deseja na tabela de sada.
Neste exemplo informamos 2, pois queremos gerar duas sries de dgitos aleatrios com a distribui-
o normal.

14 Em ingls, a ferramenta Gerao de Nmero Aleatrio Random Number Generation.

ED. CAMPUS ESTATSTICA USANDO EXCEL 0949 CAPTULO 2 1 PROVA


C A P T U L O 8 / DISTRIBUIES C ONTNUAS 255

FIGURA 8.24 Gerao


de nmero aleatrio,
distribuio normal.

l Nmero de nmeros aleatrios. Informar o nmero de valores desejados em cada coluna defi-
nida. Neste exemplo informamos 10, pois queremos gerar duas sries com 10 dgitos aleatrios
cada uma.
l Distribuio. Selecionamos Normal. Neste caso, o Excel apresenta o quadro Parmetros no qual foi
informado o valor da Mdia = 40 e o valor do Desvio padro = 10.
l Semente aleatria. Pode-se informar um valor a partir do qual os dgitos aleatrios sero gerados. A
vantagem deste procedimento que, em uma nova gerao de dgitos aleatrios, utilizando o mes-
mo valor de Semente, o Excel gerar os mesmos nmeros aleatrio anteriores. Neste exemplo, dei-
xamos em branco.

Na primeira parte do quadro Opes de sada, deve ser obrigatoriamente informado um endereo a
partir do qual a ferramenta Gerao de nmero aleatrio registrar os resultados. H trs alternativas
para o caso de no informar esse endereo, identificadas por trs botes de opo que aceitam a escolha
de uma nica alternativa:

l Intervalo de sada. Os resultados sero apresentados na mesma planilha a partir da clula informa-
da, neste caso K5. O Excel automaticamente definir o tamanho da rea dos resultados e exibir uma
mensagem se a tabela de sada estiver prestes a substituir dados existentes.
l Nova planilha. Os resultados sero apresentados a partir da clula A1 de uma nova planilha da mes-
ma pasta.
l Se no for informado nenhum endereo, a ferramenta inserir uma nova planilha com o nome
Plan, seguido de um nmero sequencial, por exemplo, escolhendo essa alternativa na pasta Cap-
tulo 2, a ferramenta inserir a planilha Plan1.
l H a alternativa de informar o nome da planilha na caixa desta alternativa; por exemplo, re-
gistrando o nome Teste, a ferramenta inserir na mesma pasta uma nova planilha com o nome
Teste.
l Nova pasta de trabalho. Os resultados sero apresentados numa nova pasta e a partir da clula A1 da
planilha Plan1.

Completadas as informaes, depois de pressionar o boto OK, o Excel registra os valores solici-
tados a partir da clula K5, uma tabela com duas sries com dez nmeros aleatrios cada uma, Fi-
gura 8.26.
256 E S T A T S T I C A US A N D O E X C E L / LAPPONI

Distribuio uniforme
A partir da clula N5 da planilha Gerao Nmeros Aleatrios, foram registradas duas amostras geradas
com a distribuio uniforme utilizando a ferramenta de anlise Gerao de nmero aleatrio, Figura 8.25.
Completadas as informaes, depois de pressionar o boto OK, o Excel registra os valores solicitados a
partir da clula N5, uma tabela com duas sries com dez nmeros aleatrios cada uma, Figura 8.26.

FIGURA 8.25 Gerao


de nmero aleatrio,
distribuio uniforme.

FIGURA 8.26 Nmeros


aleatrios gerados
com a ferramenta
de anlise.

ED. CAMPUS ESTATSTICA USANDO EXCEL 0949 CAPTULO 2 1 PROVA


Captulo 9
COMBINAO LINEAR
DE VARIVEIS ALEATRIAS

A t este momento, analisamos variveis isoladas ou a relao entre duas delas. H uma aplicao
importante quando uma ou mais variveis aleatrias so combinadas para formar outra varivel
aleatria. Essa combinao pode ser realizada com as operaes de soma, diferena, produtos e divi-
ses. Neste captulo, apresentaremos a transformao linear de uma varivel em outra, e a combinao
de duas ou mais variveis utilizando as operaes de soma e diferena.

Transformao linear
Uma varivel aleatria pode ser registrada em diferentes unidades de medida, por exemplo, a varivel
lucro mensal de uma empresa pode ser registrada em real, em dlar americano, em marco alemo etc.
Da mesma maneira, as distncias podem ser medidas em quilmetros ou em milhas, a temperatura em
graus Celsius ou em graus Fahrenheit etc. A converso dos valores de uma varivel em uma unidade
em outra unidade de medida denominada transformao linear de uma varivel.

Transformao Linear de uma Varivel


A transformao linear modifica a varivel X = ( X1 , X2 , , Xi , , X n ) na varivel
Y = (Y1 ,Y2 , ,Yi , ,Y n ), de forma que cada valor de X tenha seu valor
correspondente de Y por meio da funo Yi = a + bXi , sendo a e b nmeros reais.

Analisando a frmula da transformao linear podemos observar que:

l A adio do coeficiente a desloca todos os valores de X na mesma quantidade a, seja aumentando-os


ou diminuindo-os.
l A multiplicao pelo coeficiente b muda o tamanho de todos os valores de X, amplificando-os ou di-
minuindo-os.
258 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

EXEMPLO 9.1
A coluna B da planilha a seguir registra o lucro mensal em USD$ de uma empresa americana durante o ano
2004. Para comparar o resultado com uma empresa brasileira equivalente, o lucro mensal daquela empresa
foi transformado R$ utilizando a taxa de converso 2,96 R$/USD$, como mostra a coluna C da tabela constru-
da na planilha Exemplo 9.1, includa na pasta Captulo 9. Nessa tabela, foram adicionados os resultados das
mdias e dos desvios padro das duas sries de valores monetrios.

Analisando os resultados das mdias das duas sries de valores monetrios, verifica-se que a relao
entre essas medidas a prpria taxa de converso $2,96 R$/USD$. O mesmo ocorre com os resultados
dos desvios padro. No clculo do Lucro em R$ a partir do Lucro em USD$ do Exemplo 9.1, foi aplicada
a transformao linear Lucro (R$) = 2,69 Lucro (USD $). Nesse caso, os coeficientes da frmula
Y i = a + bX i so a=0 e b=2,96.

EXEMPLO 9.2
Na coluna B da tabela a seguir, foram registradas as temperaturas medidas em graus Celsius C na cidade de
So Paulo durante um dia de vero.

Para incluir esses registros em um relatrio em ingls, necessrio transform-los em graus Fahrenheit F,
utilizando a transformao linear Fi = 32 + 180
, Ci , como mostra a coluna C da tabela anterior, construda na
planilha Exemplo 9.2, includa na pasta Captulo 9.
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 259

Analisando a relao entre as duas mdias, verificamos que esse resultado no nenhum dos coe-
ficientes utilizados na transformao. Entretanto, a relao entre os dois desvios padro o coefi-
ciente 1,80, utilizado na transformao. No Exemplo 9.2, foi aplicada a transformao linear:
Fi = 32 + 1,80 C i com a=32 e b=1,80.

Consequncias da transformao linear


De forma geral, os valores da mdia Y e do desvio padro Y da varivel Y da transformao linear
Y i = a + X i so obtidos da mdia X e do desvio padro X da varivel X com as seguintes expresses
Y = a + b + X
.
Y = | b| X

l No Exemplo 9.1, foi aplicada a transformao linear Y i = bX i , com a=0. Nesse caso, a mdia Y e o
desvio padro Y da varivel Y so obtidos da mdia X e do desvio padro X da varivel X com as se-
Y = b + X
guintes relaes .
Y = | b| X
l No Exemplo 9.2, foi aplicada a transformao linear Y i = a + bX i , com a=32 e b=1,8. Nesse caso, os
valores da mdia Y e do desvio padro Y da varivel Y so obtidos da mdia X e do desvio padro X
Y = a + b X
da varivel X com as seguintes relaes
Y = | b| X
Resumindo:
l O coeficiente a muda a mdia, porm no muda o desvio padro.
l O coeficiente b muda a mdia e o desvio padro, sendo que no desvio padro deve ser utilizado o va-
lor absoluto de b, pois o efeito no depende do sinal desse coeficiente.
l A transformao linear no muda a forma da distribuio da varivel. Se a distribuio de X for sim-
trica, a distribuio continuar simtrica e, da mesma maneira, a inclinao positiva da distribuio
continuar positiva depois da transformao linear.

Combinao linear
Uma aplicao importante a combinao de uma ou mais variveis aleatrias cujo resultado gera ou-
tra varivel aleatria. Nesta parte, analisaremos a combinao de variveis aleatrias com as operaes
de soma e diferena. A combinao linear de variveis aleatrias gera a funo de variveis aleatrias
H = f ( X 1 , X 2 ,  , X n ), que uma nova varivel aleatria.1

A funo H = a1X1 + a2 X2 +  + a n X n uma varivel aleatria formada pela


combinao linear das variveis aleatrias X1 , X2 ,  , X n e as constantes a1 , a2 ,  , a n .

O objetivo obter a mdia, a varincia e o desvio padro de H, funo de n amostras ou variveis


aleatrias, aplicando um dos dois seguintes procedimentos:2
l Utilizando os prprios valores das variveis aleatrias.
l Utilizando as medidas estatsticas mdia e desvio padro, ou varincia, das prprias variveis ou
amostras e as covarincias, ou coeficientes de correlao, das combinaes de variveis aleatrias ou
amostras tomadas duas a duas.

1 Este assunto pode ser deixado para uma leitura posterior.


2 As variveis aleatrias tm a mesma unidade, por exemplo, cm, % etc.
260 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Utilizando os valores das amostras ou variveis aleatrias


Os valores da mdia, da varincia e do desvio padro da varivel H podem ser obtidos combinando os
valores das variveis aleatrias como mostram estes exemplos.

EXEMPLO 9.3
Sejam as variveis X1 e X2 cujos valores esto registrados na planilha Exemplo 9.3, includa na pasta Captu-
lo 9. Combine as variveis X1 e X2 para obter a funoH = f ( X1, X2 ) = 5X1 + 2X2 e analise os resultados obtidos.

Soluo. Analisando os resultados da tabela, pode-se concluir que:


O desvio padro da varivel X1 menor do que o da varivel X2.
O coeficiente de correlao r=0,06 mostra que no h correlao entre as variveis X1 e X2.
A mdia da combinao linear ou varivel H a mdia ponderada das mdias das duas variveis
H = 5 6 + 2 14,5 = 59.
O desvio padro de H no mantm nenhuma relao linear com os desvios padro das variveis X1 e X2.

EXEMPLO 9.4
Os retornos anuais durante os ltimos seis anos da Ao A e da Ao B negociadas na Bolsa de Valores esto re-
gistrados na tabela seguinte. Realize a anlise estatstica dos retornos das duas aes.
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 261

Soluo. As medidas estatsticas calculadas na planilha Exemplo 9.4, includa na pasta Captulo 9, mos-
tram que:
O desvio padro da Ao A menor do que o da Ao B, e o risco da Ao A menor do que o da Ao B, pois
seu coeficiente de variao menor.
Os retornos das duas aes mantm uma correlao fortemente negativa. Os retornos das aes variam em
direes opostas, se o retorno da Ao A aumenta, o da Ao B diminui, e vice-versa.

EXEMPLO 9.5
Continuando com o Exemplo 9.4. Suponha que no incio de 1999 tenha sido formada uma carteira de investi-
mento dividindo o capital entre as duas aes, investindo 50% na Ao A e os outros 50% na Ao B. Analise o
retorno da carteira e compare com os resultados das duas aes.

Soluo. O intervalo E5:E10 da planilha Exemplo 9.5, includa na pasta Captulo 9, registra os retornos da
carteira formada com 50% do capital investido na Ao A e os outros 50% na Ao B, e o intervalo E11:E13 cal-
cula as medidas estatsticas da carteira.

Os retornos anuais da carteira de investimento so a mdia ponderada dos retornos das aes; por exem-
plo,R1999 = 0,50 9% + 0,50 12% = 10,5% o retorno do ano de 1999. Dos resultados registrados na tabela,
pode-se concluir que a mdia dos retornos da carteira durante os seis anos igual mdia ponderada das m-
dias dos retornos das duas aes, como mostra a frmula:

R = 0,50 10,333% + 0,50 10,833% = 10,6%

O desvio padro da carteira no mantm nenhuma relao linear com os desvios padro dos retornos das
aes. Ademais, o desvio padro e o coeficiente de variao dos retornos da carteira so significativamente me-
nores do que os das aes, mostrando que a variabilidade dos retornos da carteira bem menor do que a das
duas aes. De outra maneira, o risco de investir na carteira 50% na Ao A e 50% na Ao B, teria sido bem me-
nor do que o de investir 100% em uma das duas aes; a diversificao diminui o risco do investimento.

Utilizando as medidas estatsticas das amostras


ou variveis aleatrias
Na seo anterior, o valor da mdia e o valor do desvio padro da funo H foram obtidos combinando
os pares de valores das duas variveis aleatrias, procedimento que pode ser estendido para n variveis.
Nesta parte, o valor da mdia e o valor do desvio padro da funo H sero obtidos utilizando somente a
mdia, o desvio padro, ou varincia, e a covarincia, ou o coeficiente de correlao, de cada uma das
variveis aleatrias que participam da combinao linear, procedimento que poder ser estendido para
262 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

n variveis aplicando as propriedades da combinao linear.3 O primeiro passo definir a funo H em


funo das variveis aleatrias do problema, por exemplo:

l Para medir o erro cometido na medio do permetro de um componente em uma montagem de dis-
positivos de preciso, ser necessrio definir a funo H do permetro.
l Para um projeto de investimento, ser necessrio definir a funo H do valor presente lquido do flu-
xo de caixa do investimento.
l Para avaliar uma carteira de investimento, ser necessrio estabelecer a funo H do retorno da car-
teira.

Procedimento para Determinar a Varivel Aleatria H


Definir a funo H do problema.
Definir a expresso da mdia ou valor esperado de H.
Definir a expresso da varincia de H e, depois, do desvio padro.

Por que mencionada a varincia se o desvio padro mais adequado para medir disperso? Lem-
bre-se de que:

l O desvio padro a raiz quadrada positiva da varincia.


l Operando com o desvio padro, ser necessrio carregar sua expresso com a raiz quadrada proveni-
ente de sua definio, complicando sem necessidade os desenvolvimentos e os clculos matemticos.

Combinao linear de duas variveis aleatrias


A combinao linear das variveis aleatrias X1 e X2 gera a funo H, identificada pela sua mdia ou valor
esperado e pela sua varincia, valores que devero ser obtidos das propriedades das variveis aleatrias.

Combinao Linear de Duas Variveis Aleatrias

A funo H a combinao linear H = a1X1 + a2 X2 .


As constantes a1 e a2 podem assumir qualquer valor do conjunto dos nmeros reais.
As variveis aleatrias X 1 e X 2 tm mdias 1 e 2 e desvios padro 1 e 2.
A mdia ou valor esperado de H obtida com a expresso: 4

H = a X +a 1 1 2 X2 = a1 1 + a2 2

A varincia da varivel H : 5

2H = 2a X + a
1 1 2 X2

2H = a12 21 + a22 22 + 2 a1 a2 12

3 So apresentadas e demonstradas no Apndice 1 deste captulo.


4 As demonstraes da frmula da mdia e da varincia de H foram realizadas no Apndice 1 deste captulo.
5 O smbolo 12 a covarincia das variveis X1 e X2.
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 263

Sendo 12 a covarincia das variveis X 1 e X 2. A varincia de H tambm pode ser


calculada com o coeficiente de correlao r12:

2H = a12 21 + a22 22 + 2 a1 a2 r12 1 2

O desvio padro de H obtido com: H = + 2H .

EXEMPLO 9.6
As mdias e as varincias das variveis X1 e X2 esto registradas na tabela seguinte. Calcule a mdia, a varincia
e o desvio padro da varivel aleatria H=0,5.X1+0,5.X2, sabendo que o coeficiente de correlao das variveis
X1 e X2 r12=0,20.

X1 X2
Mdia 0,10 0,20
Varincia 0,065 0,088
Desvio padro 0,2550 0,2966

Soluo. As medidas estatsticas de H so:


A mdia de H igual a 0,15, resultado obtido com a frmula:

H = 0,5 0,10 + 0,5 0,20 = 0,15

A varincia de H igual a 0,03075, resultado obtido com a frmula que utiliza o coeficiente de correlao:

2H = 0,52 0,065 + 0,52 0,088 + 2 0,5 0,5 0,255 0,2966 (0,20) = 0,03069

O desvio padro de H igual a 0,1752, resultado obtido com:

H = + 0,03069 = 0,1752

A planilha Combinao duas VA, includa na pasta Captulo 9, ajuda no clculo dos parmetros da
funo H com duas variveis aleatrias, como mostra a Figura 9.1, resolvendo o Exemplo 9.6.

FIGURA 9.1 Modelo


para combinao de
duas VA.

Anlise de resultados importantes


Pela simples inspeo das frmulas da combinao linear de duas variveis aleatrias, pode-se verificar
que o coeficiente de correlao, ou a covarincia, somente impacta a varincia e, consequentemente, o
264 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

desvio padro de H. H importantes valores extremos do coeficiente de correlao que interessam ana-
lisar, pois tm aplicaes muito teis. A seguir, mostramos alguns resultados importante do Exemplo
9.6, utilizando o modelo da planilha Combinao duas VA.

l Coeficiente de correlao r=0. Neste caso, a varincia da funo H passa a ser 2H = a 12 12 + a 22 22 .


Se X1 e X2 forem variveis aleatrias independentes, a covarincia dessas variveis ser igual a zero e,
consequentemente, o coeficiente de correlao tambm ser zero. Pode-se ver que as varincias se so-
mam, com um fator em cada uma delas.
l No caso do Exemplo 9.6, a varincia de H 0,0385, resultado obtido com a frmula

2H = 0,5 2 0,065 + 0,5 2 0,088 = 0,03825. Neste caso, a varincia de H aumentou, pois no cl-
culo anterior, o coeficiente de correlao fracamente negativo diminuiu a varincia de H. O mes-
mo raciocnio pode ser repetido com o desvio padro de H.
l Coeficiente de correlao r=1. As duas variveis esto perfeitamente correlacionadas em sentido
positivo, e a varincia da funo H passa a ser 2H = a 12 12 + a 22 22 + 2 a 1 a 2 1 2 . Essa fr-
mula pode ser transformada em 2H = (a 1 1 + a 2 2 ) 2 , mostrando que a varincia de H , salvo
um fator, o quadrado da soma dos desvios padro das variveis combinadas.
l No caso do Exemplo 9.6, a varincia igual a 0,0761, resultado maior do que o anterior, pois ago-
ra foi adicionado um fator positivo.
l Coeficiente de correlao r=1. As duas variveis esto perfeitamente correlacionadas em sentido
negativo, e a varincia da funo H passa a ser 2H = a 12 12 + a 22 22 2 a 1 a 2 1 2 . Essa fr-
mula pode ser transformada em 2H = (a 1 1 a 2 2 ) 2 , mostrando que a varincia de H , salvo
um fator, o quadrado da diferena dos desvios padro das variveis combinadas.
l No caso do Exemplo 9.6, a varincia igual a 0,00043, resultado bem menor do que os anteriores,
pois foi somado um forte fator negativo.
l Ativos financeiros com coeficiente de correlao fortemente negativo diminuem o risco de uma
carteira de investimento, pois reduzem a variabilidade dos retornos.
l Montagem de duas peas que exijam, por exemplo, uma espessura to uniforme quanto possvel
poderia ser produzida realizando uma combinao seletiva das peas com r=1, que compensem
a soma de espessuras e reduzam a variao dos lotes produzidos.6

Combinao linear de uma varivel aleatria


A transformao linear apresentada no incio do captulo uma combinao linear com uma nica va-
rivel aleatria X cujos resultados podem ser obtidos da combinao linear com duas variveis.

Combinao Linear de Uma Varivel Aleatria


A funo H a combinao linear H = a1 + a2 X.
As constantes a1 e a2 podem assumir qualquer valor do conjunto dos nmeros reais.
A varivel aleatria X tem mdia X e desvio padro X .
A mdia da varivel H H = a 1 + a2 X = a1 + a2 X
A varincia da varivel H 2H = 2a 1 + a 2 X = a22 2X
O desvio padro de H H = + 2H = |a2 | X

6 Kume H. Mtodos Estatsticos para Melhoria da Qualidade Editora Gente, 1993.


C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 265

EXEMPLO 9.7
Calcule a mdia e o desvio padro da varivel aleatria H=10+5.X, sabendo que a mdia e a varincia de X so,
respectivamente, 0,124 e 0,0454.

Soluo. Os resultados solicitados so:

H = 10 + 5 0,124 = 10,62

2H = Var (10 + 5X) = 52 0,0454 = 1135


,

H = 1135
, = 1065
,

EXEMPLO 9.8
A quantidade de estaes grficas vendidas mensalmente por Jos normalmente distribuda com mdia
0,80 estao por ms e varincia 0,25. Mensalmente, Jos recebe $5.000 mais $10.000 por estao grfica
vendida. Calcule a remunerao mdia por ms e o desvio padro correspondente.

Soluo. A expresso da remunerao mensal do vendedor de estaes grficas : H = $5000 . + $10000


. n,
sendo n a varivel aleatria quantidade de estaes grficas vendidas. Jos recebe $13.000 por ms com des-
vio padro de $5.000, resultados obtidos das seguintes frmulas:

H = $5000
. + $10000
. 0,8 = $13000
.

2H = $10000
. 2
0,25 = 25000000
. .

H = 25000000
. . = $5000
.

Como a venda de estaes grficas normalmente distribuda, observe que, em 68% dos meses, o vende-
dor receber entre $8.000 e $18.000.

Combinao linear de n variveis aleatrias


Da mesma forma como foi feito nas combinaes com uma e duas variveis aleatrias, o procedimento
pode ser estendido para a combinao linear com n variveis aleatrias.

EXEMPLO 9.9
Seja a funoH = f ( X1, X2 , X3 ) = a1X1 + a2 X2 + a3 X3 . Calcule a mdia e o desvio padro da varivel H conhecendo
as medidas estatsticas e os coeficientes de correlao das variveis X1, X2 e X3 registradas nas tabelas seguintes.

a Mdia D. padro
X1 1 1.000 50
X2 2 500 100
X3 3 800 200

X1 X2 X3
X1 1
X2 0,8 1
X3 0,9 0,85 1
266 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Soluo.
A funo H H = a1X1 + a2 X2 + a3 X3 = 1 X1 2 X2 + 3 X3
A mdia H=2.400 foi obtida com a frmula:

H = a11 + a22 + a33

H = 1 1000
. 2 500 + 3 800 = 2.400

A varincia de H deve ser calculada com a frmula:

2H = a12 21 + a22 22 + a32 23 +

+2a1a2 12r12 + 2a1a3 13r13 +

+2a2a3 2 3r23

Substituindo os dados nessa frmula:

2H = 1 502 + ( 2)2 1002 + 32 2002 +


+2 1 ( 2) 50 100 0,80 + 2 1 3 50 200 ( 0,90) +
+2 ( 2) 3 100 200 ( 0,85)
2H = 402500
. + 134000
. = 536500
.

A varincia H=536.500 o resultado da soma de duas parcelas. A primeira parcela (402.500) a contribui-
o das varincias das trs variveis aleatrias, ou varincia pura, e a segunda parcela (134.000) a contribui-
o das correlaes.

O desvio padro de H H = 2H = 536500


. = 732,46

A planilha Combinao trs VA, inclua na pasta Captulo 9, ajuda no clculo dos parmetros da
funo H com trs variveis aleatrias, como mostra a Figura 9.2, resolvendo o Exemplo 9.9.

FIGURA 9.2 Modelo


para combinao
de trs VA.
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 267

Combinao Linear de n Variveis Aleatrias


A funo H a combinao linear H = a1X1 + a2 X2 +  + a n X n .
As constantes a 1, ..., a n podem assumir qualquer valor do conjunto dos nmeros
reais.
As variveis aleatrias X 1, ..., X n tm mdias 1, ..., n e desvios padro 1, ..., n .
A mdia da varivel H obtida de:
H = a X +a 1 1 2 X2 +  + a n Xn

n
H = a1 1 + a2 2 +  + a n n = ai i
i =1

A varincia da varivel H obtida de:


2H = 2a X + a
1 1 2 X2 +  + a n Xn

2H = a12 21 + a22 22 +  + a 2n 2n +

+2 a1 a2 12 +  + 2 a1 a n 1n +

+2 a2 a3 23 +  + 2 a2 a n 2 n +

++

+2 a n 1 a n ( n 1) n

Com os coeficientes de correlao a expresso anterior ser:

2H = a12 21 + a22 22 +  + a 2n 2n +

+2a1a2 1 2 r12 +  + 2a1a n 1 n r1n +

+2a2 a3 2 3 r23 +  + 2a2 a n 2 n r2 n +

++

+2a n 1a n n 1 n r ( n 1) n

O desvio padro de H: H = a X + a 1 1 2 X2 +  + a n Xn = + 2H
Se as n variveis aleatrias forem independentes, ento todas as covarincias so
iguais a zero e, consequentemente, os coeficientes de correlao tambm sero
iguais a zero. Dessa maneira, a nica medida estatstica de H que muda a da varin-
cia que passa a ser 2H = a12 . 21 + a22 . 22 +  + a 2n . 2n .

Distribuio de H
A distribuio normal pode ocorrer em diversos contextos, por exemplo, nos dados extrados de um
experimento, na explicao de um experimento etc. Ao mesmo tempo, a soma de um nmero de efei-
tos aleatrios, sem dominncia de nenhum deles sobre o resultado total, produz uma varivel aleatria
com distribuio normal. Dessa maneira, deve-se esperar que a funo H definida como soma de vari-
veis aleatrias tenha distribuio normal, considerando que nenhuma das variveis domina as restan-
268 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

tes. Pelo teorema central do limite, se as n variveis aleatrias Xi que participam da combinao linear
tiverem distribuio normal, ento a nova varivel H tambm ter distribuio normal, para qualquer
valor de n. Entretanto, se as n variveis aleatrias Xi que participam da combinao linear no tiverem
distribuio normal, ento a nova varivel H ter distribuio normal se o nmero n de variveis aleat-
rias for adequadamente grande. Nos outros casos, a distribuio normal poder ser adotada como uma
aproximao conveniente, pois a grande vantagem a possibilidade de realizar inferncias com a fun-
o H. Portanto, conhecendo os parmetros da funo H obtida como combinao linear de variveis
aleatrias ser possvel realizar clculos de probabilidade.

EXEMPLO 9.10
Continuando com o Exemplo 9.9. Considerando que a distribuio de H seja normal, qual a probabilidade de
que H seja igual ou maior do que 1.800?

Soluo. A probabilidade de H ser igual ou maior do que 1.800 79,37%, ou P(H1.800)=79,37%, resultado
obtido registrando em uma clula da planilha Excel a frmula =1-DIST.NORM(1800;2400;732,46;VERDADEI-
RO). Registrando a frmula =1DIST.NORMP(PADRONIZAR(1800;2400;732,46)), tambm se obtm o mes-
mo resultado.

EXEMPLO 9.11
Continuando com o Exemplo 9.9. Considerando que as trs variveis so independentes:

Calcule a varincia e o desvio padro da funo H.


Qual a probabilidade de que H seja igual ou maior do que 1.800?
Soluo.
Na resoluo do exemplo 9.9, destacamos que a varincia de H o resultado da soma de duas parcelas. A prime-
ira parcela igual a 402.500 se refere contribuio das varincias das trs variveis aleatrias e o nico resultado
que interessa para calcular o desvio padro de H igual a 634,43, com a frmula H = 402500 . = 634,43.
A probabilidade de P(H1.800) igual a 82,79%, resultado obtido com a frmula =1-DIST.NORM
(1800;2400;634,43;VERDADEIRO). Registrando a frmula =1DIST.NORMP(PADRONIZAR(1800;2400;634,43))
tambm se obtm o mesmo resultado.

Modelo combinao linear de VAs


A Figura 9.3 mostra o modelo para combinao linear de at seis variveis aleatrias, construdo na plani-
lha Modelo Combinao de VAs includo na pasta Captulo 9, resolvendo o Exemplo 9.9 com trs VAs.

l Os dados so registrados nas clulas pintadas de cor azul. As clulas pintadas de cor verde retornam
resultados e as demais clulas pintadas de cor amarela registram ttulos.
l No intervalo de clulas C5:E10, so informados os parmetros das variveis aleatrias que partici-
pam da combinao linear: constante a, mdia e desvio padro de cada uma das seis VSs.
l Se a combinao linear for realizada com menos de seis variveis aleatrias, deve-se verificar que
as clulas dos dados das demais variveis estejam vazias ou com valores zero.
l Na tabela dos coeficientes de correlao, so informados os valores de r da combinao de variveis
tomadas duas a duas, sendo que a diagonal principal j est preenchida com valores iguais a um,
como foi mostrado no Captulo 6.

No quadro Funo H, o modelo fornece os resultados da nova varivel aleatria H. No quadro Proba-
bilidade de H, na clula G14 o modelo retorna a probabilidade selecionada na caixa de combinao,
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 269

considerando o valor registrado na clula G13. Os clculos de probabilidade so realizados, conside-


rando que a distribuio da varivel H normal.
Aplicaes tradicionais de combinao linear de variveis em finanas so apresentadas nos Apndi-
ces 2 e 3 deste captulo.

FIGURA 9.3 Modelo


para combinao linear
at seis variveis
aleatrias.

Problemas
Problema 1
As vendas mensais da empresa dos ltimos 24 meses tm mdia R$320.000 por ms e desvio padro
R$65.000 por ms. Calcule os novos valores de mdia e desvio padro, considerando como moeda de
referncia a libra inglesa, utilizando a taxa de converso 5,55 R$/$ ou 0,1802 $/R$.
R: Corrigir resultados =$ 57.664 =$ 11.713

Problema 2
A taxa de juro mensal i tem mdia 0,80% por ms e desvio padro 0,1% por ms. Se a relao entre o va-
lor aplicado P e o resgatado F numa operao com prazo de um ms estabelecida com a frmula
F = P (1 + i), qual a mdia e o desvio padro do fator (1+i) da frmula?
R: (1+i)=1,008 (1+i)=0,001

Problema 3
Continuando com o Problema 2. Se forem aplicados $10.000 por um ms, qual a mdia e o desvio pa-
dro do resgate F calculado com esta frmula: F = $10.000 (1 + i)?
R: F=$100.800 F=$10
270 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problema 4
Com as variveis aleatrias X1 e X2 cujas medidas estatsticas esto registradas na tabela seguinte foi
formada a varivel aleatria H=2.X1+3.X2. Calcule a mdia e o desvio padro de H.

X1 X2
Mdia 10 8
Varincia 64 16
r 0,60

R: H=44,00 H=25,11

Problema 5
Repita o Problema 4, considerando que as variveis so independentes.
R: H=44,00 H=20,00

Problema 6
Repita o Problema 4, considerando o coeficiente de correlao 0,60.
R: H=44,00 H=13,02

Problema 7
Com as variveis aleatrias X1 e X2 cujas medidas estatsticas esto registradas na tabela seguinte, foi
formada a varivel aleatria H=X1+2.X2. Calcule a mdia e o desvio padro de H.

X1 X2
Mdia 1,2 3,5
Varincia 9 16
r 0,85

R: H=5,56 H=11,22

Problema 8
Repita o Problema 7, considerando que as variveis so independentes.
R: H=5,56% H=8,773%

Problema 9
Repita o Problema 7, considerando o coeficiente de correlao 0,85.
R: H=5,56% H=5,29%

Problema 10
Sabendo que a varivel aleatria X tem mdia 2 e varincia 1, calcule a mdia e o desvio padro da nova
varivel aleatria H=3,6+8.X.
R: H=12,40 H=8,00

Problema 11
O preo de venda unitrio do produto P=$1.250, o custo unitrio C=$500 e o custo fixo mensal
CF=$120.000. Se o nmero de produtos vendidos n por ms tem distribuio normal com mdia 200
unidades e desvio padro de 35 unidades, qual a mdia e o desvio padro do lucro L medido com fr-
mula: L = CF + ( P C ) n?
R: L=$30.000 L=$26.250
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 271

Problema 12
Continuando com o Problema 11. Qual a probabilidade de o lucro da empresa ser positivo, maior ou
igual a zero?
R: P(L 0)=87,35%

Problema 13
Jean aplicou $10.000 durante 180 dias com taxa de juro ps-fixada i. A estimativa da taxa de juro i para
180 dias tem distribuio normal, com mdia igual a 10% aos 180 dias e desvio padro de 0,3%. Qual a
mdia e o desvio padro do resgate R calculado com R = $10.000 (1 + i)?
R: R=$11.000 R=$30

Problema 14
Continuando com o Problema 13. Qual a probabilidade de o resgate R da aplicao ser maior do que
$11.030?
R: P(R11.030)=15,87%

Problema 15
Continuando com o Problema 13. Qual a probabilidade de R$10.990?
R: P(R10.990)=36,94%

Problema 16
Calcule a mdia e o desvio padro da varivel aleatria H, formada pela combinao linear de trs vari-
veis aleatrias, cujos dados esto registrados nas tabelas seguintes.

a Mdia D.Padro X1 X2 X3

X1 1 100 30 X1 1

X2 1 150 50 X2 0,65 1

X3 1 130 45 X3 0,70 0,90 1

R: H=380 H=115,39

Problema 17
Continuando com o Problema 16. Calcule a probabilidade de H ser maior do que 300, considerando
que a distribuio da varivel H seja normal.
R: P(H300)=75,59%

Problema 18
Os dados das quatro variveis aleatrias que participam da combinao linear esto registrados nas ta-
belas seguintes. Calcule a mdia e o desvio padro da funo H.

a Mdia D.padro X1 X2 X3 X4

X1 1,00 15.000 200 X1 1

X2 0,89 4.500 400 X2 0,50 1

X3 0,80 8.500 800 X3 0,80 0,90 1

X4 0,71 10.000 1.000 X4 1,00 0,50 0,40 1

R: H=2.905 H=1.243,72
272 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problema 19
Continuando com o Problema 18. Considerando que a varivel H tem distribuio normal, qual o valor
da probabilidade P(H3.500)?
R: P(H3.500)=31,62%

Problema 20
Os dados da combinao linear de trs variveis aleatrias esto registrados nas tabelas seguintes. Cal-
cule a mdia e o desvio padro da funo H.

a Mdia D.padro X1 X2 X3

X1 0,9091 1.400 219,09 X1 1

X2 0,8264 1.800 273,86 X2 0,80 1

X3 0,7513 2.500 438,18 X3 0,50 0,65 1

R: H=4.638,51 H=658,65

Problema 21
Continuando com o Problema 20, calcule a probabilidade de H ser menor do que 4.000, considerando
que a distribuio de H seja normal.
R: P(H4.000)=16,62%

Problema 22
Repita o Problema 20, considerando as variveis aleatrias independentes.
R: H=4.638,51 H=446,39

Problema 23
Continuando com o Problema 22. Considerando que a distribuio de H seja normal, qual a probabili-
dade de H ser maior do que 4.000.
R: P(H4.000)=7,63%

Problema 24
Para comparar os salrios dos gerentes da filial, a matriz americana informou que os salrios anuais dos
gerentes americanos tm mdia US$36.000 e desvio padro US$5.800. O gerente de RH da filial conver-
teu os salrios em R$, aplicando a taxa de cmbio 1 USD$=3,00 R$, obtendo mdia R$108.000 e desvio
padro igual a R$17.400. Do ponto de vista da transformao, os resultados em reais devem ser aceitos?
R: Resultados corretos.

Problema 25
Analisando os resultados estatsticos do processo produtivo com mdia de 12,5 e desvio padro 0,26, o
supervisor do controle de qualidade verificou que, no resultado da mdia, foi esquecido de adicionar o
valor de referncia 100. Calcule os novos valores de mdia e de desvio padro.
R: Mdia=112,5 e Desvio Padro=0,26
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 273

Apndice 1
Propriedades para duas variveis
aleatrias

A seguir, so apresentadas algumas propriedades importantes da combinao linear de variveis alea-


trias.

l A mdia do produto da constante a pela varivel aleatria X igual ao produto da constante pela m-
dia da varivel aleatria. Pela definio do valor esperado, pode-se escrever que:

N N
ax i xi
i =1 i =1
aX = =a
N N

aX = a X

l A mdia da soma de duas variveis aleatrias igual soma das mdias das duas variveis aleatrias.

N N N
(x 1 i
+ x2 ) i
x1 i
x2 i
i =1 i =1 i =1
X 1 +X2
= = +
N N N

X 1 +X2 = X + X1 2

l A varincia do produto da constante a pela varivel aleatria X igual ao produto do quadrado da


constante a pela varincia da varivel X. Partindo da expresso da varincia de X:

N N
(x i + X ) 2 (x i2 2x i X + X2 )
i =1 i =1
2X = =
N N

Desenvolvendo a soma indicada no somatrio temos:

N N N
x i2 2 X x i 2X
i =1 i =1 i =1
2X = +
N N N

Analisando cada parcela dessa expresso obtemos:

2X = X 2 2X + X2
2

2X = X X2 2
274 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Multiplicando a varivel X pela constante a obtemos:

2aX = ( aX ) aX
2
= a 2 2
X2
aX aX

2aX = a 2 X a 2 X2 = a 2 ( X 2X )
2 2

2aX = a 2 X2

l Expresso da varincia da combinao linear de duas variveis aleatrias X1 e X2. Da definio de va-
rincia podemos escrever:

2a 1 X 1 + a 2X 2 = ( a 1 X 1 + a 2X 2 ) 2
2a 1 X 1 + a 2X 2

2a 1 X 1 + a 2X 2 = ( a 2
1 X 21 + a 22X 22 + 2 a 1 a 2X 1 X 2 ) 2
a2 1 X 1 + a 2X 2

2a 1 X 1 + a 2X 2 = a 12 X + a 22 X + 2a 1a 2 X
2
1
2
2 1 X2

(a 12 2X + a 22 2X + 2a 1a 2 X X )
1 2 1 2

Aplicando as propriedades anteriores, temos:

2a 1 X 1 + a 2X 2 = a 12 X + a 22 X + 2a 1a 2 X
2
1
2
2 1 X2

(a 12 2X + a 22 2X + 2a 1a 2 X X )
1 2 1 2

Finalmente, temos a expresso da varincia procurada:

a2 1 X 1 + a 2X 2 = a 12 ( X 2X ) + a 22 ( X 2X ) + 2a 1a 2 ( X
2
1 1
2
2 2 1 X2 X X )
1 2

2a 1 X 1 + a 2X 2 = a 12 X2 + a 22 X2 + 2a 1a 2 X
1 2 1 X2

Diminuindo os ndices das variveis temos a expresso:

2a 1 X 1 + a 2X 2 = a 12 12 + a 22 12 + 2a 1a 2 12
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 275

Apndice 2
Anlise do valor presente lquido
de um projeto de investimento

Na avaliao de um projeto de investimento com o mtodo do valor presente lquido, ou simplesmente


VPL, utilizada a frmula:

n
FC 1 FC 2 FC n FC t
VPL = I + + + + = I +
(1 + k) 1
(1 + k) 2
(1 + k) n
t1 (1 + k) t

Na expresso do fluxo de caixa do projeto, participam o desembolso inicial I (investimento) realiza-


do em t=0 e com sinal negativo, os n retornos anuais FC identificados pelo ndice t=1, 2, ...n, e a taxa re-
querida de juro k. Os dados utilizados na frmula do VPL so estimativas definidas antes de realizar o
investimento e esto sujeitas variao durante a execuo se o projeto for realizado. Dessa maneira,
pode-se considerar que essas estimativas so variveis aleatrias com suas respectivas medidas estats-
ticas (mdia e varincia ou desvio padro) e que se relacionam entre si de alguma maneira (coeficiente
de correlao). Para simplificar essa apresentao, consideraremos como varivel aleatria somente os
n capitais FC e o investimento I. Pode-se ver que a frmula do VPL uma combinao linear de n vari-
veis aleatrias, como fica destacado reescrevendo a frmula da seguinte forma:

1 1 1
VPL = I + FC 1 + FC 2 +  + FC n
(1 + k) 1
(1 + k) 2
(1 + k) n

Como as variveis aleatrias I, FC1, FC2, ..., FCn so definidas pelas suas respectivas medidas estats-
ticas e os coeficientes de correlao que estabelecem a relao entre elas, a funo VPL uma varivel
aleatria H. O Exemplo 9.12 mostra como calcular os parmetros de VPL

EXEMPLO 9.12
O fluxo de caixa do projeto de investimento est registrado na primeira parte da tabela seguinte, onde anual-
mente cada capital uma varivel aleatria com valores de mdia e desvio padro definido. Os capitais do fluxo
de caixa comeam na data inicial t=0, quando realizado o desembolso do investimento, e seguem com os re-
tornos anuais de t=1 at t=4. Na tabela ao lado, esto registrados os coeficientes de correlao entre as variveis.

t Capitais Mdia D. padro I CF1 CF2 CF3 CF4


0 I $12.500 $1.300 I 1
1 CF1 $3.000 $330 CF1 0 1
2 CF2 $3.800 $450 CF2 0 0,90 1
3 CF3 $4.500 $630 CF3 0 0,82 0,85 1
4 CF4 $5.600 $750 CF4 0 0,70 0,78 0,80 1

Determine os parmetros da varivel aleatria VPL e a probabilidade de que VPL seja maior do que zero,
considerando a taxa requerida de juro de 8% ao ano.
276 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Soluo. A funo VPL do projeto de investimento est registrada a seguir.


1 1 1 1
VPL = I + 1
FC1 + 2
FC2 + 3
FC3 + FC 4
(1+ k ) (1+ k ) (1+ k ) (1+ k ) 4
Clculo da mdia do VPL.
A mdia do VPL obtida com a seguinte frmula:

1 1 1 1
VPL = 1. I + CF 1 + CF2 + CF3 + CF 4
1+ i (1+ i)2
(1+ i)3
(1+ i) 4
Substituindo os dados, obtm-se a mdia de VPL igual a $3.524,08.

1 1
VPL = 10200
. + 3000
. + 3800
. +
(1+ 0,08)1 (1+ 0,08)2
1 1
+ 4500
. + 5600
.
(1+ 0,08)3 (1+ 0,08) 4
VPL = 3524
. ,08

Clculo da varincia do VPL.


A varincia do VPL deste projeto de investimento obtida com a frmula:

1 1 1 1
2VPL = ( 1)2 2I + 2
2FC 1 + 4
2FC 2 + 6
2FC 3 + 2FC 4 +
(1+ i) (1+ i) (1+ i) (1+ i) 8
1 1
+2( 1) r1,CF1 1 CF 1 + 2.( 1) r1,CF2 1 CF2 +
1+ i (1+ i)2
1 1
+2( 1) r1,CF3 1 CF3 + 2( 1) r1,CF 4 1 CF 4 +
(1+ i)3 (1+ i)2
1 1 1 1
+2 rCF1 ,CF2 CF1 CF2 + 2 rCF ,CF CF1 CF3 +
1+ i (1+ i)2 1+ i (1+ i)3 1 2
1 1 1 1
+2 rCF ,CF CF1 CF 4 + 2 rCF ,CF CF2 CF3 +
1+ i (1+ i) 4 1 4 (1+ i) (1+ i)3 2 3
2

1 1 1 1
+2 rCF ,CF CF2 CF 4 + 2 rCF ,CF CF 4 CF 4
(1+ i)2 (1+ i) 4 2 4 (1+ i)3 (1+ i) 4 3 4

Substituindo os dados, obtm-se a varincia de VPL igual a 4.285.760.

1 1 1 1
2VPL = 1300
. 2
+ 3302 + 4502 + 6302 + 7502 +
, 2
108 , 4
108 , 6
108 , 88
10
1 1
2 0 1300
. 330 2 0 1300
. 450 +
,
108 , 2
108
1 1
2 3
0 1300
. 630 2 0 1300
. 750 +
108
, , 2
108
1 1 1 1
+2 0,90 330 450 + 2 0,82 330 630 +
, 108
108 , 2 108
, 108 , 3
1 1 1 1
+2 0,82 330 750 + 2 0,70 450 630 +
, 108
108 , 3 , 2 108
108 , 3
1 1 1 1
+2 2 4
0,70 450 750 + 2 3
0,80 630 750
108
, 108
, 108
, , 4
108

2VPL = 4285760
. .

O desvio padro de VPL igual a $2.070,21, resultado obtido como a raiz quadrada positiva da varincia de
VPL.

VPL = 2VPL = 4285760


. . = 2070
. ,21
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 277

Com o modelo da planilha Modelo Combinao de VAs, includo na pasta Captulo 9, tambm poss-
vel resolver este exemplo, como mostra a figura seguinte. Para calcular a probabilidade de que o valor do VPL
seja maior do que zero, na clula G3 do modelo foi registrado valor zero retornando na clula G14 o resultado
P (VPL 0) = 95,56%, mostrando uma probabilidade bastante alta. Apenas para voc conferir esse resultado, se
numa clula do Excel for registrada a frmula =1-DIST.NORM(0;3524,08;2070,21;VERDADEIRO), ser obtido
o mesmo resultado.

Apndice 3
Formao de uma carteira
de investimento

Os exemplos anteriores mostraram que ao investir o capital disponvel em dois ou mais ativos ou proje-
tos, o indivduo ou empresa diversifica seu capital com o objetivo de diminuir o risco e manter o mesmo
retorno esperado. A teoria que ser utilizada para formar carteiras foi iniciada por Harry Markowitz,
com a publicao Portfolio Selection, no Journal of Finance, em 1952 e, posteriormente, Merton Miller e
William Sharpe realizaram contribuies importantes. Aos trs professores, foi outorgado o Prmio
Nobel de Economia de 1990. Iniciamos o tema com a resoluo de um exemplo e seguimos com a utili-
zao do comando Solver do Excel. Assim, sero introduzidas novas respostas na formao de uma car-
teira de investimento.
278 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

EXEMPLO 9.13
A tabela seguinte registra as medidas estatsticas de trs ativos e seus pesos na formao de uma carteira de in-
vestimento.

Ativo 1 Ativo 2 Ativo 3


Peso 50,00% 15,00% 35,00%
Mdia 22,00% 10,00% 17,00%
D.padro 60,00% 26,46% 35,00%

As covarincias dos trs ativos esto registradas na tabela seguinte. Calcule o retorno, a varincia e o desvio
padro dessa carteira de investimento.

Ativo 1 Ativo 2 Ativo 3


Ativo 1 0,36
Ativo 2 0,02 0,07
Ativo 3 0 0,04 0,1225

Soluo. O valor esperado da carteira igual a 18,45%, valor obtido depois de substituir os dados do exem-
plo na frmula conhecida.

E [Rp ] = 0,50 22% + 0,15 10% + 35% 17% = 18,45%

A varincia da carteira 0,11378, resultado obtido depois de substituir os dados do exemplo na frmula
conhecida, lembrando que so utilizadas as covarincias, valores obtidos com a frmula xy = rxy x y .

2p = 0,502 0,36 + 0,152 0,07 + 0,352 0,1225 + 2 0,50 0,15 0,02 + 2 0,50 0,35 0 +
+2 0,15 0,35 0,04

2p = 0,11378

O desvio padro da carteira igual a 0,3373 ou 33,73%.

A planilha Formao de Carteira, includa na pasta Captulo 9, utilizada para resolver o Exemplo
9.13 e apresentar os outros tpicos do tema carteiras. A Figura 9.4 mostra esse modelo copiado da pla-
nilha Modelo Combinao de VAs com novos ttulos, novos clculos e resultados.

Formao de uma carteira utilizando o solver


Com trs ativos possvel formar muitas carteiras mudando a proporo dos ativos selecionados. Des-
sas carteiras, sem dvida, o investidor escolher a carteira com menor risco ou varincia mnima. De
outra maneira, a carteira de varincia mnima a carteira com a menor varincia de todas as carteiras
possveis, que podem ser formadas com os ativos sem especificar antecipadamente o retorno da cartei-
ra. Para formar uma carteira com trs ativos, o objetivo do investidor definido de forma matemtica,
como segue:

2p = w 12 12 + w 22 22 + w 32 32 +
Minimizar
+2 w 1 w 2 1, 2 + 2 w 1 w 3 1,3 + 2 w 2 w 3 2 ,3

Sujeita restrio w 1 + w 2 + w 3 = 1, sendo wi a proporo do investimento no ativo i.


C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 279

FIGURA 9.4
Modelo para
Formao de
Carteira de
investimento.

Carteira de varincia mnima


O comando Solver do Excel uma ferramenta de otimizao muito prtica na anlise e na formao de
carteiras, como ser mostrado com o Exemplo 9.13. O ponto de partida o registro das medidas estats-
ticas dos ativos, como foi feito na planilha Formao de Carteira mostrada na Figura 9.4. Na clula
K16 dessa planilha foi registrada a frmula =SOMA(C5:C10), correspondente restrio da minimiza-
o, que sempre dever retornar o valor 1, pois a soma das porcentagens do investimento em cada ativo
tem de ser igual a 100%. Para obter a proporo do investimento nos trs ativos que formam a carteira
de varincia mnima, procede-se como segue:
l Posicione o cursor da planilha na clula E17 e depois no menu Ferramentas escolha Solver.7
l Na caixa de dilogo Parmetros do Solver da Figura 9.5.
l Ao ter selecionado a clula E17, esse endereo aparecer na caixa Definir clula de destino.
l Selecione o boto de opo Mn.
l No quadro Clulas variveis: registre o intervalo das clulas dos pesos dos ativos C5:C7. Para in-
serir esse intervalo, selecione a clula C5 e, mantendo pressionado o boto esquerdo, arraste o
mouse at a clula C7, quando soltar o boto.

Figura 9.5 Caixa de


dilogo dos Parmetros
do Solver.

7 O Solver um Suplemento que nem sempre incorporado ao iniciar o Excel. Para obter mais informaes, veja o Apndice 1 do Ca-
ptulo 1, ou a Ajuda do Excel.
280 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l No quadro Submeter s restries, pressione o boto Adicionar. Na caixa de dilogo Adicionar


restrio, registre a restrio mostrada na Figura 9.6. Repare que a restrio j aparece na caixa de
dilogo da Figura 9.5.

FIGURA 9.6 Caixa de


dilogo das restries
do Solver.

Depois de pressionar o boto Resolver, o comando Solver registra os resultados no intervalo C5:C6
e apresenta a caixa de dilogo da Figura 9.7, onde est registrado que O Solver encontrou uma soluo.
Todas as restries e condies otimizadas foram atendidas.

FIGURA 9.7 Caixa de


dilogo Resultados do
Solver.

Pressionando o boto OK, os resultados so registrados no intervalo C5:C7, como mostra a Fi-
gura 9.8.

FIGURA 9.8 Carteira de


investimento com
varincia mnima.
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 281

Portanto, para formar uma carteira de investimento com varincia mnima sem especificar o retorno
da carteira, o investidor dever comprar 12,17% do capital disponvel do Ativo 1, comprar 62,24% do
Ativo 2 e comprar 25,59% do Ativo 3, sendo a soma dessas propores igual a 100%, com o mnimo
desvio padro da carteira de 23,72%. Verifique que qualquer outra combinao de proporo de ativos
formar uma carteira com desvio padro maior do que 23,72%.8

Carteira de mnima varincia para um definido retorno da carteira


O retorno esperado da carteira da Figura 9.8 13,25% com o menor risco possvel com esses ativos,
desvio padro 23,72%. Alm de ter uma carteira com mnimo risco, o investidor gostaria que essa car-
teira tivesse um retorno predefinido. Em outros termos, para um determinado retorno da carteira defi-
nida pelo investidor *P , o objetivo escolher a carteira com mnimo risco, ou mnimo desvio padro.
Nessas condies, para formar uma carteira com trs ativos, o objetivo do investidor definido de for-
ma matemtica como segue:

2p = w 12 12 + w 22 22 + w 32 32 +
Minimizar
+2 w 1 w 2 1, 2 + 2 w 1 w 3 1,3 + 2 w 2 w 3 2 ,3

w + w 2 2 + w 3 3 = P
Sujeita s restries 1 1 .
w1 + w 2 + w3 = 1

Continuando com o procedimento anterior, na clula K17 da planilha Formao de Carteira foi re-
gistrado o retorno esperado da carteira igual a 16%. A seguir, no menu Ferramentas escolha Solver e,
na caixa de dilogo Parmetros do Solver, adicione a nova restrio que mostra a Figura 9.9.

FIGURA 9.9 Caixa de


dilogo do Solver com a
nova restrio.

Depois, pressione o boto Resolver e aceite registrar os novos resultados no intervalo C5:C7, como
mostra a Figura 9.10. Verifique que, para esse retorno de 16%, qualquer outra combinao de propor-
o de ativos formar uma carteira com desvio padro maior do que 25,71%.

Carteira de mnima varincia e sem venda a descoberto


Vejamos outro exemplo. Se o retorno esperado da carteira for 20%, voc verificar que as propores
dos ativos da carteira indicaro que se deve comprar 37,85% do capital disponvel do Ativo 1, vender

8 O comando Solver apresenta outras respostas que no so apresentadas neste livro.


282 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

15,82% do Ativo 2 e comprar 77,97% do Ativo 3, sendo a soma dessas propores igual a 100%, com o
mnimo desvio padro da carteira de 33,99%. A operao de venda denominada descoberta e inclui
um risco maior para o investidor. O prximo passo construir uma carteira sem venda de ativos cujo
objetivo do investidor, para uma carteira com trs ativos, definido matematicamente como segue:

2p = w 12 12 + w 22 22 + w 32 32 +
Minimizar
+2 w 1 w 2 1, 2 + 2 w 1 w 3 1,3 + 2 w 2 w 3 2 ,3

w 1 1 + w 2 2 + w 3 3 = P

Sujeita s restries w 1 + w 2 + w 3 = 1 .
w 0, w 0, w 0
1 2 3

FIGURA 9.10 Carteira


com retorno definido e
mnima varincia.

Continuando com o procedimento anterior, na clula K17 da planilha Formao de Carteira foi re-
gistrado o retorno esperado da carteira igual a 20%. A seguir, no menu Ferramentas, escolha Solver e,
na caixa de dilogo Parmetros do Solver, adicione a nova restrio que mostra a Figura 9.11.

FIGURA 9.11 Caixa de


dilogo do Solver com
restrio de venda de
ativos.
C A P T U L O 9 / COMBINAO LINEAR DE VARIVEIS ALEATRIAS 283

Depois, pressione o boto Resolver e aceite registrar os novos resultados no intervalo C5:C7, como
mostra a Figura 9.12. Para um retorno esperado de 20% sem venda de ativos, as propores dos ativos
da carteira indicaro que o investidor dever comprar 60% do capital disponvel do Ativo 1, no com-
prar nada do Ativo 2 e comprar 40% do Ativo 3. Neste caso, tambm, observe que qualquer outra
combinao de proporo de ativos formar uma carteira com desvio padro maior do que 38,63%

FIGURA 9.12 Carteira


com retorno definido,
restrio de venda e
mnima varincia.
Captulo 10
DISTRIBUIO AMOSTRAL

C om a mdia X de uma amostra extrada de uma populao ser estimada a mdia dessa popula-
o. No entanto, como voc pode imaginar, de uma mesma populao pode-se tomar muitas
amostras diferentes do mesmo tamanho. A principal preocupao em uma inferncia estatstica obter
concluses sobre a populao e no sobre a amostra, como possvel observar nos seguintes exemplos:

l Determinao da vida mdia de uma lmpada fluorescente especificada pelo fabricante. Essa deter-
minao pode fazer parte:
l Do procedimento de controle de qualidade da empresa. Se a vida mdia das lmpadas fluorescen-
tes de uma amostra retirada de um lote de produo no atender especificao estabelecida, en-
to o lote dever ser rejeitado.
l Do procedimento de um rgo de defesa do consumidor. Se a vida mdia das lmpadas fluores-
centes da amostra retirada de diversos pontos de venda atender especificao do fabricante, en-
to a reclamao dos consumidores no dever ser aceita.
l Avaliao de um novo produto. Antes de seu lanamento, em muitos casos, o novo produto distri-
budo a um grupo de consumidores potenciais que respondem a um questionrio. Se os resultados
dos questionrios mostrarem que o novo produto foi bem aceito, ento o grupo de marketing ter
suporte para defender o lanamento desse novo produto.
l Previso do tempo mdio de espera dos clientes no caixa de um banco. Se o tempo mdio de espera
de uma amostra de clientes for maior do que o tempo mdio afirmado pelo gerente da agncia, ento
ser bastante provvel que as reclamaes dos clientes tenham fundamento.

Um denominador comum nos trs casos apresentados que as decises que devero ser tomadas se-
ro apoiadas em informaes incompletas. No dia a dia, estamos acostumados a tomar decises com
informaes incompletas suportadas pela prpria experincia ou a partir de amostras. Por exemplo, o
procedimento de degustar uma poro de fruta ou queijo antes de comprar. Ao aprovar a amostra de-
gustada e comprar uma quantidade da fruta ou do queijo, estamos aceitando que o resto do lote de fruta
ou pea de queijo tem a mesma caracterstica que apreciamos na amostra; entretanto, a experincia
mostra que mais fcil acertar no caso do queijo do que no da fruta, salvo que o pedao de queijo com-
prado seja de outra pea no amostrada. Qualquer que for a deciso tomada, estar sendo aplicada a
distribuio das mdias das amostras.
286 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Formao da distribuio
A coordenadora do ensino de primeiro grau tem interesse em conhecer a estatura mdia dos alunos da
primeira srie da rede escolar. Se a varivel estatura estivesse registrada no cadastro dos alunos, seria fcil
calcular a mdia das estaturas dos alunos da primeira srie. Contudo, essa informao no est dispon-
vel. Uma tentativa de alcanar o objetivo estimar a mdia de todos os alunos utilizando a mdia de uma
amostra dos alunos da primeira srie, tendo presente que essa amostra ser representativa da populao;
isto , a amostra possuir caractersticas similares s que seriam observadas na populao se estivesse dis-
ponvel. Para testar a ideia, a coordenadora preparou dez funcionrios com a tarefa individual de selecio-
nar aleatoriamente trinta alunos da primeira srie da escola designada, medir a estatura dos trinta alunos
e finalmente calcular e registrar a mdia dessa amostra. Terminada a tarefa, a coordenadora receber as
dez mdias amostrais X 1 , X 2 , , X 10 que, em geral, sero diferentes entre si devido variabilidade amos-
tral e, tambm, essas dez mdias devero ser diferentes da mdia da populao.

Parmetro uma medida numrica que descreve uma populao.


Estatstica uma medida numrica que descreve uma amostra.

Analisando o resultado da tarefa dos dez funcionrios, pode-se observar:

l O parmetro mdia da populao um valor nico e desconhecido.


l A estatstica mdia da amostra um valor conhecido, porm pode variar de amostra para amostra. Se
os dez funcionrios realizarem novas amostragens aleatrias do mesmo tamanho, as mdias das no-
vas amostras no devero ser iguais s dez primeiras. Apesar da mdia da populao no ter mudado,
a mdia da amostra depender de cada amostra.

Com as mdias das amostras, possvel construir a distribuio de frequncias das mdias das amos-
tras denominada distribuio amostral, cuja mdia se denomina mdia amostral e seu desvio padro,
erro padro. Embora os parmetros mdia e desvio padro da populao no sejam conhecidos, para
ajudar na compreenso da distribuio amostral, inicialmente, esses parmetros sero considerados co-
nhecidos.

EXEMPLO 10.1
Suponha que uma urna contm cinco bolas numeradas com os nmeros 2, 4, 6, 8 e 10. Considerando que da
urna sero retiradas amostras com reposio de tamanho n=2, o objetivo determinar o valor esperado da
mdia de todas as combinaes possveis de serem formadas.

Soluo. Analisemos a populao formada pelas cinco bolas {2, 4, 6, 8, 10} dentro da urna.
Cada uma das cinco bolas tem a mesma probabilidade de ser escolhida, sendo 20% a probabilidade de uma
bola ser escolhida.
A distribuio de frequncias relativas da populao {2, 4, 6, 8, 10} uma distribuio discreta e uniforme
com mdia igual a seis, =6, como mostra o histograma da figura seguinte.

20%

X
2 4 6 8 10
C A P T U L O 10 / D ISTRIBUIO AMOSTRAL 287

Analisemos o experimento de retirar amostras de tamanho n=2 com reposio. O nmero total de amos-
tras diferentes dez, resultado obtido da contagem das combinaes de cinco bolas tomadas duas a duas. A
primeira linha da tabela seguinte registra todas as combinaes possveis, ou amostras de tamanho dois, que
podem ser extradas da populao.

Amostras 2, 4 2, 6 2, 8 2, 10 4, 6 4, 8 4, 10 6, 8 6, 10 8, 10
MdiaX 3 4 5 6 5 6 7 7 8 9

A segunda linha da tabela registra as mdias X das amostras correspondentes mesma coluna da primeira
linha da tabela. A tabela seguinte registra a distribuio de frequncias das mdias das amostras X, tendo pre-
sente que todas as amostras so igualmente provveis.

Mdia X 3 4 5 6 7 8 9
P (X ) 0,1 0,1 0,2 0,2 0,2 0,1 0,1

20%

10%
`X
3 4 5 6 7 8 9

Os resultados da tabela anterior formam o histograma da distribuio amostral, registrado na figura seguinte.
Essa tabela define a varivel aleatria X cujo valor esperado E[X]=6 obtido da expresso j conhecida:

E [ X ] = 3 0,1+ 4 0,1+ 5 0,2 + 6 0,2 + 7 0,2 + 8 0,1+ 9 0,1

E[ X ] = 6

Os resultados do Exemplo 10.1 permitem obter as seguintes concluses:


l A mdia da populao seis, =6. A mdia da populao um valor nico e constante.
l Cada amostra de tamanho n=2 tem sua prpria mdia X. A mdia da amostra depende de cada amos-
tra extrada. Qualquer inferncia realizada sobre a mdia da populao utilizando uma nica amos-
tra estar sujeita a alguma incerteza, pois a mdia de cada amostra pode ser diferente.
l A mdia das dez mdias amostras igual a seis, X = 6. A mdia amostral uma mdia de longo
prazo.
l A mdia amostral X coincide com a mdia da populao e, neste exemplo, X = = 6. Temos a
primeira concluso importante: a mdia das mdias das amostras a prpria mdia da populao.1

Definio da distribuio amostral


Dos histogramas do Exemplo 10.1, pode-se ver que a distribuio de frequncias das mdias das amos-
tras, denominada distribuio amostral, diferente da distribuio de frequncias da populao. En-
quanto a distribuio da populao uniforme, a distribuio amostral no uniforme, apresentando
forma simtrica com tendncia para a distribuio normal. Quanto variabilidade, a mdia amostral
varia no intervalo (3, 9), enquanto a populao varia no intervalo (2, 10). A disperso da distribuio
amostral menor do que a disperso da populao.

1 Esta afirmao, baseada nos resultados de apenas um exemplo, formalmente demonstrada, assunto que no abordado neste livro.
288 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Mdia e desvio padro da distribuio amostral


A distribuio da populao X normal, com mdia e varincia 2 . Dessa populao, retirada a
amostra probabilstica {X 1 , X 2 , , X i , , X n } de tamanho n. A mdia X dessa amostra a combinao
1
linear de n variveis aleatrias independentes com a funo X = ( X 1 + X 2 +  + X i +  + X n ). No
n
Captulo 9, vimos que a mdia de uma combinao linear a soma das mdias das variveis.

1 1 1
X = 1
= X + X + + X
( X 1 + X 2 ++ X n )
n
n n 1
n
2 n

Como as variveis aleatrias X i tm distribuio normal com mdia e desvio padro :

 n 


1 1 1 1
X = + + + = n
n n n n

X =

Da mesma maneira, a varincia da combinao linear de n variveis aleatrias independentes 2X


obtida da expresso:

1 2 1 1
2X = 1
= 2
X + 2 X2 +  + 2 X2
1
( X 1 + X 2 ++ X n )
n n n 2
n n

1 1
2X = 2
( 2 + 2 +  + 2 ) = 2 n 2
n n

2
2X =
n

O desvio padro ou erro padro obtido da varincia descrita anteriormente:


X =
n

Mdia e Desvio Padro da Distribuio Amostral


As mdias X das amostras de tamanho n retiradas de uma populao, com mdia
e desvio padro , formam a distribuio amostral com os seguintes parmetros:

O valor esperado X igual mdia da populao: X = .



O desvio padro das mdias amostrais X igual a: X = .
n
C A P T U L O 10 / D ISTRIBUIO AMOSTRAL 289

EXEMPLO 10.2
A estatura dos alunos da primeira srie do primeiro grau tem distribuio normal, com mdia de 105 centme-
tros e desvio padro de 26 centmetros. Qual a mdia e o erro padro de uma amostra aleatria de 26 retirada
dessa populao de alunos?
Soluo. Como a mdia amostral igual mdia da populao, deduzimos que X = 105. Da mesma manei-
ra, o desvio padro ou erro padro igual a 5,81 centmetros, resultado obtido com a frmula:


X =
n
26
X = = 5,81
20


A expresso do X = mostra que o erro padro da distribuio de X diminui quando aumenta o
n
tamanho da amostra n. Isso significa que medida que n aumenta e mais informaes so utilizadas, a
mdia da amostra X se aproxima da mdia da populao .

Forma da distribuio de X
Ao estudar as medidas estatsticas descritivas, foi observado que a forma da distribuio da varivel
importante. Observe que a distribuio amostral do Exemplo 10.1 simtrica, embora a distribuio
da populao seja uniforme. De forma geral, a forma da distribuio amostral depende da forma da dis-
tribuio da populao.

l Se a distribuio da populao for normal N(, ), a distribuio amostral X tambm ser normal
N (, n ) qualquer que seja o tamanho n da amostra.
l Se a distribuio da populao no for normal, medida que o tamanho da amostra aumentar, a dis-
tribuio da mdia amostral se aproximar da distribuio normal. Pelo teorema central do limite, a
distribuio das mdias X de amostras de tamanho suficientemente grande2 poder ser considerada
normal N (, n ), qualquer que seja a forma da distribuio da populao.

Teorema Central do Limite


Se de uma populao com parmetros ( , ) for retirada uma amostra de tamanho
n suficientemente grande, a distribuio de X ser aproximadamente normal
N( , n ), qualquer que seja a forma da distribuio da populao.

O teorema central do limite muito importante, pois permite utilizar a distribuio normal para rea-
lizar inferncias da mdia amostral X, qualquer que seja a forma da distribuio da populao. Como
aplicao prtica, podemos dizer que a soma de um nmero de efeitos aleatrios, sem dominncia de
nenhum deles sobre o resultado total, produz uma varivel aleatria com distribuio normal. Por
exemplo:
l No Captulo 8, vimos que um cabo de ao tranado utilizado em um elevador formado por muitos
fios de ao que, adequadamente entrelaados, conferem uma forte resistncia ao cabo, cuja capaci-

2 Para amostras com n>30. Se a distribuio da populao for aproximadamente simtrica, a amostra poder ter menos de 30 valores,
por exemplo, 15 a 25.
290 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

dade igual soma das capacidades individuais dos fios de ao. Se o nmero de fios que formam o
cabo for adequadamente grande, apesar de a distribuio da capacidade dos fios de ao no ser nor-
mal, a distribuio da capacidade do cabo ser normal.
l No Captulo 9, destacamos que voc deve esperar que a funo H definida como soma de variveis
aleatrias tenha distribuio normal, considerando que nenhuma das variveis domina as restantes.
Pelo teorema central do limite, se as n variveis aleatrias que participam da combinao linear tive-
rem distribuio normal, ento a nova varivel H tambm ter distribuio normal, para qualquer
valor de n. Todavia, se as n variveis aleatrias no tiverem distribuio normal, ento a nova vari-
vel H ter distribuio normal se o nmero de variveis aleatrias for adequadamente grande.

Simulador teorema central do limite


O teorema central do limite pode ser verificado na prtica, realizando simulaes repetidas de um ex-
perimento, como o lanamento de um dado que tem seis resultados possveis {1, 2, 3, 4, 5, 6}, com a
mesma probabilidade 1/6 de ocorrer. O histograma desse experimento mostra que sua distribuio de
frequncias discreta e uniforme, com mdia = 3,50 e varincia 2 = 2,917 e desvio padro = 1,71,
resultados obtidos no intervalo de clulas B2:G6 da planilha Teorema Central do Limite, includa na
pasta Captulo 10, como mostra a Figura 10.1.

FIGURA 10.1
Simulao Teorema
Central do Limite
para n=10.

O modelo permite realizar simulaes para trs tamanhos de amostra, n=15, 30 e 50 resultados alea-
trios de um dado, obtidos com a frmula =ARRED(ALEATRIO( )*(6-1)+1;0), registrada em cada
C A P T U L O 10 / D ISTRIBUIO AMOSTRAL 291

clula da tabela de trinta lanamentos de um dado repetido cinco mil vezes. A ltima coluna da tabela
registra a mdia X de cada lanamento de n=15, 30 e 50 dados. Cada vez que o boto Simulao for
pressionado, o modelo atualiza os seguintes resultados para o tamanho n previamente definido:

l Calcula a mdia e o desvio padro das mdias amostrais, intervalo de clulas C10:F11.
l Calcula a tabela de frequncias absolutas e apresenta o histograma de 200, 500, 1.000 e 5.000 lana-
mentos, como mostra a Figura 10.1 no caso de n=30.

Os quatro histogramas mostram que, ao aumentar o nmero de simulaes, acentua-se a concentra-


o das mdias amostrais ao redor da mdia da populao. Tambm, se for aumentado o tamanho da
amostra para n=50, essa concentrao ao redor da mdia comea a apresentar menos simulaes, con-
firmando que medida que n aumenta, tm-se mais informaes, como mostra a Figura 10.2.

FIGURA 10.2
Simulao Teorema
Central do Limite
para n=30.

Repetindo o que j foi apresentado, a soma de um nmero de efeitos aleatrios, sem dominncia de
nenhum deles sobre o resultado total, produz uma varivel aleatria com distribuio normal.

Correo pela populao ser finita


As premissas includas nas expresses apresentadas estabelecem que a populao suficientemente
grande, os valores da amostra so independentes e a amostragem realizada com reposio. Se numa
populao pequena for realizada uma amostragem sem reposio de tamanho maior do que 5% do ta-
N n
manho da populao, no clculo do erro padro dever ser includo o fator de correo finita .
N 1

Se a relao entre o tamanho da populao N e o tamanho da amostra n for menor


N n
do que 20, o erro padro X dever ser calculado com a frmula X = X ,
n N 1
N n
sendo denominado fator de correo finita.
N 1
292 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

A tabela seguinte mostra valores do coeficiente de correo finita em funo do tamanho n da amos-
tra numa populao de tamanho N=1.000.

N=1.000

n Fator

5 0,9980

10 0,9955

30 0,9854

50 0,9752

100 0,9492

250 0,8665

500 0,7075

Anlise da mdia de uma amostra


Quanto maior for o tamanho n da amostra, mais a mdia amostral ser prxima da mdia da populao,
pois medida que n aumenta, o erro padro diminui e, no limite, quando n tender prpria populao,
o erro padro tender a zero. As propriedades da distribuio amostral X asseguram que a mdia de
uma amostra uma boa estatstica para ser utilizada na inferncia da mdia da populao da qual foi
extrada. Ao mesmo tempo, o teorema central do limite estabelece que se o tamanho da amostra n for
suficientemente grande, a distribuio da mdia amostral ser normal, qualquer que seja a forma da
distribuio da populao. Portanto, o teorema central do limite permite aplicar a distribuio normal
para obter respostas da mdia de uma amostra de tamanho suficientemente grande retirada de uma po-
pulao qualquer.

Se {X1 , X2 , , Xi , , X n } uma amostra aleatria extrada de uma populao infinita


com mdia e varincia 2 , ento, para n suficientemente grande, a distribuio
X
de Z = normal padronizada. 3
n

EXEMPLO 10.3
Os registros histricos de produo de frascos com detergente mostram que o volume de enchimento realiza-
do pela mquina automtica normalmente distribudo com mdia igual a 150 e desvio padro de 0,50 cent-
metro cbico. Se for retirada uma amostra de tamanho n=9, qual a probabilidade da mdia dessa amostra ser
menor ou igual a 149,75 centmetros cbicos?

Soluo. Deve-se encontrar a probabilidade P ( X 149,75). Sabemos que a distribuio amostral X normal,
com mdia igual mdia da populao e desvio padro n . O resultado P ( X 149,75)=0,0668 foi obtido
registrando a frmula =DIST.NORM(149,75;150;0,5/RAIZ(9);VERDADEIRO) numa clula vazia da planilha
Excel. Portanto, a probabilidade da mdia da amostra de tamanho n=9 ser menor ou igual a 149,75 centme-
tros cbicos 6,68%. Esse resultado tambm pode ser obtido com a distribuio normal padronizada, calcu-
lando primeiro o desvio padro normalizado Z=1,50, resultado obtido com a frmula:

3 Freund J. E. Mathematical Statistics Prentice Hall, 5a edio, 1992.


C A P T U L O 10 / D ISTRIBUIO AMOSTRAL 293
X 149,75 150
Z = = = 150
,
0,5
n 9

O resultadoP ( X 149,75) = P (Z 15
, ) = 0,0668 pode ser obtido com a tabela Z, procedimento que deixa-
mos por conta do leitor, ou com a funo estatstica do Excel =DIST.NORMP(-1,5).

Pode ser utilizada a frmula =DIST.NORMP((149,75-150)/(0,5/RAIZ(9))) ou a frmula =DIST.NORMP


(PADRONIZAR(149,75;150;0,5/RAIZ(9))), que equivalente anterior. Essas duas frmulas evitam o clcu-
lo intermedirio do desvio normal padronizado Z.

O Exemplo 10.3 mostra o procedimento de clculo com a mdia da amostra, sendo conhecidos a
mdia e o desvio padro da populao.

l Da populao retirada uma amostra aleatria com mdia X e tamanho n suficiente para atender s
premissas do teorema do limite central e para a distribuio amostral seja normal.
l A mdia da distribuio amostral igual a mdia da populao X = e o erro padro igual a

X = .
n
l Com a distribuio amostral N (, n ) so calculadas probabilidades do tipo P( X ) ou
P( X ).

Quanto ao resultado do Exemplo 10.3, qual o significado da probabilidade P( X 149,75) = 0,0668?


Tendo presente que a distribuio amostral fornece a distribuio terica de todas as possveis amostras
de tamanho nove, a probabilidade 6,68% a proporo de amostras de tamanho nove que tm mdia me-
nor ou igual a 149,75 centmetros cbicos.

EXEMPLO 10.4
Repita o Exemplo 10.3, considerando que a mdia X=149,75 foi obtida de uma amostra com tamanho n=25.

Soluo. Para n=25, obtm-se P ( X 149,75) = 0,0062, resultado obtido com a frmula =DIST.NORM
(149,75;150;0,5/RAIZ(25);VERDADEIRO). Portanto, a probabilidade da mdia da amostra de tamanho n=25
ser menor ou igual a 149,75 centmetros cbicos 0,62%. Esse resultado tambm pode ser obtido com a dis-
tribuio normal padronizada, calculando primeiro o desvio padro normalizado Z=2,50, resultado obtido
com a frmula:

149,75 150
Z = = 2,5
0,5
25
O resultado P ( X 149,75) = P (Z 2,5) = 0,0062 pode ser obtido com a tabela Z, procedimento que tam-
bm deixamos por sua conta, ou com a funo estatstica do Excel =DIST.NORMP(-2,5). O Exemplo 10.3
mostra outras formas de utilizar essa ltima funo estatstica.

Qual o significado do valor de probabilidade 0,62% do Exemplo 10.4? Tendo presente que a distri-
buio amostral fornece a distribuio terica de todas as possveis amostras de tamanho 25, a probabi-
lidade 0,62% a proporo de amostras de tamanho 25, que tm media menor ou igual a 149,75 cent-
metros cbicos.
Vale perguntar: a probabilidade 0,62% confirma que o volume de enchimento realizado pela mqui-
na automtica seja 150 centmetros cbicos?
294 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

l Se for retirado apenas um nico frasco de detergente como amostra, a probabilidade de o volume desse
frasco ser menor ou igual a 149,75 centmetros cbicos P( X 149,75) = 0,3085, resultado obtido
com a frmula =DIST.NORM(149,75;150;0,5;VERDADEIRO). A probabilidade 30,85% muito alta,
comparada com as probabilidades com a mdia de uma amostra dos exemplos anteriores.
l A probabilidade P( X 149,75) = 6,68% da amostra do Exemplo 10.3 no suficiente para afirmar
que a mquina esteja enchendo realmente com mdia igual a 150, pois a proporo de amostras de
tamanho nove com mdia menor ou igual a 149,75 centmetros cbicos no pequena.
l A probabilidade P( X 149,75) = 0,62% da amostra do Exemplo 10.4 pequena, o que nos leva a
aceitar que o volume mdio de enchimento da mquina seja 150.
l A aceitao do volume de enchimento da mquina automtica depende do tamanho da amostra n,
pois quanto maior for n, maior ser a chance de aceitao.

O erro padro uma medida da distncia entre a mdia da amostra X e a mdia da populao . A
aceitao do lote de produo depender do tamanho da amostra n, pois quanto maior for n, maior ser
a chance de aceitar o lote. Como o tamanho da amostra influencia diretamente o erro padro da distri-
buio amostral, quanto maior for o tamanho da amostra n, menor ser o erro padro e, no limite, o
erro padro tender a zero, pois n tender a ser a prpria populao.

EXEMPLO 10.5
O peso das latas de pssego em calda tem distribuio normal com mdia 1.000 gramas e desvio padro 40
gramas. Se for retirada uma amostra de 12 latas de um lote grande de latas, qual a probabilidade de haver uma
mdia amostral menor do que 975 gramas?

Soluo. Deve-se calcular a probabilidade P ( X 975). Procedendo como nos exemplos anteriores, a proba-
bilidade de ter uma mdia amostral menor do que 975 gramas 1,52% ou P ( X 975) = 0,0152. Esse resulta-
do pode ser obtido com a frmula =DIST.NORM(975;1000;40/RAIZ(12);VERDADEIRO), registrada numa c-
lula vazia da planilha Excel. Esse resultado tambm pode ser obtido com a distribuio normal padronizada e a
tabela Z e com a funo DIST.NORMP. Outra forma de obter esse resultado utilizando o modelo Distribui-
o Amostral.

Modelo distribuio amostral


Com o modelo construdo na planilha Distribuio Amostral, includo na pasta Captulo 10, poss-
vel resolver o Exemplo 10.5 e os dois anteriores, como mostra a Figura 10.3. Os dados devem ser infor-
mados nas clulas pintadas de cor azul, pois as clulas de cor verde somente retornam resultados e as
clulas de cor amarela apresentam ttulos. No modelo:

l Nas clulas do intervalo C3:C7, so registrados os dados numricos requeridos para os clculos.
l A Mdia da Amostra registrada na clula C7 utilizada para definir os limites na caixa de combinao
da clula B7. Nessa caixa de combinao, possvel escolher os limites e , utilizados para o clcu-
lo da probabilidade requerida.
l Nas clulas do intervalo C9:C11, so apresentados resultados intermedirios e o resultado final da
probabilidade requerida.

O grfico do modelo apresenta duas distribuies normais, automaticamente identificadas pelos


seus respectivos parmetros. A distribuio com maior disperso a distribuio da populao, dese-
nhada em cor azul, e a outra a distribuio das mdias amostrais. Conforme os dados do problema
que est sendo resolvido, voc dever ajustar a escala do eixo de abscissas pressionando o boto Ajuste
C A P T U L O 10 / D ISTRIBUIO AMOSTRAL 295

escala para um ajuste inicial. O ajuste fino da escala dever ser feito no prprio eixo, clicando duas ve-
zes em cima do eixo ou nos valores do eixo, depois de desproteger a planilha. As curvas das duas distri-
buies no mesmo grfico ajudam a compreender a diferena entre a probabilidade do evento com
amostra e a probabilidade do evento com apenas uma unidade, bem como o comportamento das duas
curvas para outros valores de desvios padro. Analisar o comportamento das curvas para diferentes ta-
manhos de amostra auxiliar a compreender o procedimento de amostragem. Para terminar, infor-
mando o tamanho de amostra igual ao valor um o modelo se comporta, parcialmente, como o
MODELO DN do Captulo 8.

FIGURA 10.3 Modelo


Distribuio Normal
resolvendo
o Exemplo 10.5.

A linha vertical vermelha do grfico representa a mdia da amostra. Essa reta permite comparar as
reas das duas distribuies referentes s probabilidades de exceder o valor dessa mdia da amostra.

EXEMPLO 10.6
A comisso anual das vendedoras domiciliares de uma importante empresa de cosmticos tem distribuio
normal com mdia $35.000 e desvio padro de $7.500. Se aleatoriamente for escolhida uma amostra de dez
vendedoras domiciliares, calcule a probabilidade que a mdia dessa amostra seja:
a. Mais do que $35.000 por ano.
b. Menos do que $29.000 por ano.
296 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Soluo. Os resultados P ( X 35000


. ) = 175
, % e P ( X 29000
. ) = 33,66% foram obtidos com o modelo Dis-
tribuio Amostral, como mostra a figura referente primeira questo.

EXEMPLO 10.7
Continuando com o Exemplo 10.5. Determine o intervalo ao redor da mdia da populao que inclua 90%
das mdias das amostras de tamanho n=16.
Soluo. O peso das latas de pssego em calda tem distribuio normal, com mdia 1.000 gramas e desvio pa-
dro 40 gramas. Os 90% das mdias das amostras de tamanho n=16 distribudas ao redor da mdia da popula-
o definem as duas caudas da distribuio, com 5% cada uma, considerando o erro padro igual a 10 gr. O li-
mite inferior que define a cauda inferior 983,55 gramas, resultado obtido com a frmula =INV.NORM(0,05;
1000;40/RAIZ(16)). Para a cauda superior, registramos a frmula =INV.NORM(0,95;1000;40/RAIZ(16)), que
retorna o limite superior igual a 1.016,45 gramas. Com esses resultados, podemos dizer que 90% das mdias
dos pesos das amostras de tamanho 16 se encontram entre os valores 983,55 gramas e 1.016,45 gramas.
Esses resultados tambm podem ser obtidos, com o modelo Distribuio Amostral, com ajuda do co-
mando Atingir Meta do Excel. Comeamos por registrar os dados da populao e o tamanho da amostra, re-
gistrando tambm um valor qualquer na clula C7, que a incgnita de nosso exemplo, como mostra a figura
a seguir. Posicione o cursor do Excel na clula C11 do modelo.

No menu Ferramentas do Excel, escolher Atingir meta.


Na caixa de dilogo Atingir meta, informar os dados solicitados.

Clique em OK e o comando Atingir meta encontrar a soluo. O Excel apresentar a caixa de dilogo
Status do comando atingir meta com o resultado da clula C7 igual a 983,55 e, ao mesmo tempo, ob-
serve que na clula C11 est registrado o valor 5%.
C A P T U L O 10 / D ISTRIBUIO AMOSTRAL 297

Para terminar, clique em OK. O valor encontrado, 983,55, ser registrado na clula C7. Se voc clicar em
Cancelar, o valor original 1.000 permanecer na clula C7. Na obteno do resultado desejado, o comando
Atingir Meta utiliza um processo iterativo conhecido como mtodo de tentativa e erro, apoiado por algorit-
mos de convergncia. Lembre-se de que o resultado ser obtido com o grau de exatido definido no menu do
Excel Ferramentas Opes Clculo na caixa No mx. de alteraes. Ainda, embora no se aplique
neste exemplo, alguns problemas podem ter mais de uma soluo, e o comando Atingir meta apresenta
apenas uma delas. Para terminar, repita o procedimento para o limite superior procurando a probabilidade de
95%.

Problemas
Problema 1
Na populao formada pelos nmeros {1, 2, 3, 4}.
a. Determine a quantidade de amostras com reposio de tamanho n=2 que podem ser formadas com
essa populao.
b. Identifique todas as amostras de tamanho n=2 e calcule suas mdias.
c. Compare a mdia da populao com a mdia das mdias das amostras.
R: a) A quantidade de amostras de tamanho n=2 igual a 6. b) Por sua conta. c) A mdia da populao e
a mdia amostral so iguais a 2,50.

Problema 2
Na populao formada pelos nmeros {20, 22, 24, 26, 28}.
a. Construa o histograma da populao.
b. Determine a quantidade de amostras com reposio de tamanho n=2 que podem ser formadas com a
populao.
c. Identifique todas as amostras de tamanho n=2 e calcule suas mdias.
d. Construa e analise o histograma da distribuio amostral.
e. Compare a mdia e o desvio padro da populao com os das amostras.
R: a) Por conta do leitor. b) A quantidade de amostras de tamanho n=2 igual a 10. c) Por sua conta. d)
Por conta do leitor. e) A mdia da populao e a mdia amostral so iguais a 24. A disperso da popula-
o maior do que a da distribuio amostral.

Problema 3
A tabela a seguir registra a mdia e o desvio padro de quatro populaes. Calcule a mdia amostral e o
erro padro de uma amostra de tamanho n=100.

Populao Distribuio amostral


Mdia Desvio padro Mdia Erro padro
10 20 10 2
20 10 20 1
50 300 50 30
100 200 100 20

Problema 4
A mdia e o desvio padro da populao so, respectivamente, 60 e 10. Calcule a mdia amostral e o
erro padro de amostras aleatrias de tamanho n=10, 25, 50, 75, 100, 500, 1.000.
R: A mdia para todos os tamanhos a mesma e igual a 60. Os desvios padro so (na mesma ordem):
3,16; 2; 1,41; 1,15; 1; 0,45; 0,32.
298 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

Problema 5
O gerente da agncia bancria verificou que o saldo mdio das contas correntes aumentou. Conside-
rando todos os clientes da agncia, a mdia e o desvio padro do saldo mdio das contas correntes so,
respectivamente, $325 e $114. Se for retirada uma amostra aleatria de 100 contas correntes, qual a
probabilidade de a mdia dos saldos mdios ser menor ou igual a $330?
R: 66,95%

Problema 6
Continuando com o Problema 5, qual a probabilidade de a mdia dos saldos mdios ser maior ou igual
a $350?
R: 1,42%

Problema 7
A garrafa de vinho branco importado vendida na maior parte dos supermercados do pas. Levanta-
mentos realizados pelo distribuidor em todos os pontos de vendas mostraram que o preo mdio de
venda USD $15, com desvio padro de USD $2,50. Se for retirada uma amostra aleatria em 45 pontos
de venda, qual a probabilidade de a mdia do preo de venda da garrafa de vinho ser menor ou igual a
USD $14?
R: 0,36%

Problema 8
Continuando com o Problema 7, qual a probabilidade de a mdia do preo de venda da garrafa de vinho
ser maior ou igual a USD $15,5.
R: 8,99%

Problema 9
O fabricante de pneus assegura que a durao do pneu mais vendido tem mdia de 60.000 km, com
desvio padro 5.000 km. Como os distribuidores no esto convencidos, o fabricante ofereceu aos re-
vendedores a oportunidade de separar, aleatoriamente, 40 pneus para verificar os resultados afirmados
pelo fabricante. Supondo que a afirmao do fabricante seja confirmada, descreva a distribuio da m-
dia amostral da durao do pneu.
R: A distribuio amostral a normal N(60.000, 790,57)

Problema 10
Continuando com o Problema 9. Se a afirmao do fabricante for verdadeira, qual a probabilidade de os
40 pneus da amostra terem mdia de durao menor igual a 57.500 km? Analise o resultado.
R: 0,08%

Problema 11
Uma mquina de enchimento de latas de refrigerantes consegue produzir 12.000 latas por hora, com
mdia de 330 ml e desvio padro de 3 ml. Responda s seguintes questes, considerando a distribuio
normal:
a. Qual a probabilidade de uma lata conter menos de 328 ml?
b. Qual a probabilidade de uma amostra aleatria de 30 latas conter menos de 328 ml?
R: a) 25,25% b) 0,01%
C A P T U L O 10 / D ISTRIBUIO AMOSTRAL 299

Problema 12
O retorno anual de todas as aes negociadas na Bolsa de Valores durante o ano passado apresentou
mdia de 5,45% ao ano e desvio padro 32,3% ao ano. Supondo que a distribuio dos retornos seja
bem prxima da normal:
a. Que percentagem de aes teve retorno nulo ou negativo?
b. Se forem escolhidas cinco aes de forma aleatria do conjunto das aes negociadas na Bolsa de Va-
lores, qual o retorno e o desvio padro dessa carteira durante o ano passado?
c. Qual a probabilidade do retorno dessa carteira ser menor ou igual a zero durante o ano passado?
R: a) 56,70% b) X = 5,45% e X = 14% c) 64,70%

Problema 13
A montadora de carros afirma que a mdia de consumo do seu novo modelo tem distribuio normal
com mdia de 15,9 km por litro e desvio padro de 0,8 km por litro.
a. Calcular a probabilidade da mdia de uma amostra de tamanho n=25 ser menor ou igual a 15,5
km/litro.
b. Suponha que uma amostra aleatria de 25 carros fabricados na mesma poca apresentou mdia
amostral de 15 km/litro. Voc acredita que a declarao da montadora deve ser aceita?
R: a) 0,62% b) As possveis respostas so: 1) A mdia da amostra possvel, porm pouco provvel; 2)
Os parmetros da populao mudaram; 3) H algum erro na afirmao ou nos resultados divulgados.

Problema 14
O fabricante da mquina de enchimento de refrigerantes afirma que o volume das garrafas tem mdia
de 750 ml com desvio padro de 16 ml. Numa amostra de 16 garrafas, qual a probabilidade de a mdia
da amostra ser:
a. Menos de 740 ml?
b. Mais de 740 ml?
c. Entre 742 e 758 ml?
R: a) 0,62% b) 99,38% c) 95,46%
Captulo 11
ESTIMAO

O teorema central do limite apresentado no Captulo 10 muito importante, pois mostra como utilizar
a distribuio normal para realizar inferncias da mdia amostral X, qualquer que seja a forma da dis-
tribuio da populao. Como aplicao prtica, dissemos que a soma de um nmero de efeitos aleatrios,
sem dominncia de nenhum deles sobre o resultado total, produz uma varivel aleatria com distribuio
normal. O teorema central do limite mostra que a mdia X de uma amostra de tamanho n suficientemente
grande, retirada de uma populao com mdia e desvio padro , tem distribuio normal com mdia
igual mdia da populao X = e desvio padro X = n . Neste captulo, mostraremos como estimar
a mdia de uma populao a partir de uma nica amostra1 aleatria retirada da populao. Contudo, se as
mdias de amostras do mesmo tamanho extradas de uma populao, em geral, no coincidiro entre si
nem com a mdia da populao, que preciso devemos esperar de uma nica amostra? Deveremos definir o
erro mximo da estimativa e sua probabilidade de ocorrncia. H dois tipos de estimativas:
l Estimativa pontual. Estimativa pontual de um parmetro da populao o valor obtido por clculo
de uma amostra retirada da populao. Por exemplo, a mdia X de uma amostra aleatria retirada de
uma populao uma estimativa pontual da mdia da populao .
l Estimativa intervalar. A estimativa est includa num intervalo considerando um grau de acerto de-
nominado intervalo de confiana que contm a estimativa pontual. Portanto, a mdia de uma amos-
tra aleatria retirada de uma populao o valor inicial da mdia dessa populao.

Confiana da estimativa
Para facilitar a compreenso do procedimento de estimativa da mdia, nesta anlise inicial, a mdia e
o desvio padro da populao sero considerados conhecidos. Se da populao for retirada a amostra
aleatria X 1 com mdia X 1 , em geral, a mdia dessa amostra no coincidir com a mdia da populao
, como mostra a distribuio normal das mdias amostrais da Figura 11.1. A diferena entre a mdia
e a mdia amostral X 1 denominada erro de estimativa ou margem de erro que pode ser medida a partir
de qualquer um dos dois valores.

1 As estimativas devem ser no viesadas (o valor esperado do estimador deve ser igual ao parmetro da populao) e devem ter va-
rincia mnima (menor valor de varincia de todas as possveis estimativas no viesadas).
302 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

FIGURA 11.1 Erro de


Erro de estimativa
estimativa. `X

m `X1

A mdia X 1 da amostra X 1 uma boa estimativa da mdia da populao , pois uma amostra alea-
tria de tamanho n suficientemente grande e, como foi mostrado no Captulo 10, a mdia da amostra
X 1 tem distribuio normal com parmetros N (, n ).

Intervalo de confiana
Devido variabilidade amostral, as possveis amostras aleatrias de mesmo tamanho retiradas da mes-
ma populao tero mdias diferentes. Como estimar a mdia de uma populao com apenas uma
amostra? Qual a confiabilidade de uma estimativa pontual? O intervalo de confiana definir de forma
objetiva a credibilidade da estimativa.

Intervalo de confiana o intervalo de valores que contm a mdia 2 da populao


com uma determinada probabilidade de acerto. O intervalo de valores
construdo de uma amostra aleatria retirada da populao. 3

Se o tamanho da amostra n for suficientemente grande, a mdia X 1 da amostra X 1 ter distribuio


normal com mdia igual da populao e, como j foi apresentado no Captulo 10:
l Da distribuio das mdias amostrais, tem-se que X = e X = n.
l A probabilidade da media X 1 estar includa, por exemplo, no intervalo de dois desvios padro ao re-
dor da mdia 95,44%, representado como P( X 1 2 X ) 0,9544.
l De outra maneira, 95,44% das mdias amostrais se situam ao redor de mais ou menos dois desvios
padro.
l Portanto, a mdia da populao estar includa no intervalo de mais ou menos dois desvios padro
em 95,44% das vezes, considerando que o experimento ser repetido um nmero grande de vezes.
Desse modo, o intervalo de confiana define o percentual de todas as amostras possveis que satisfaz
margem de erro. Continuando com o exemplo anterior, retirando um nmero muito grande de amos-
tras do mesmo tamanho, poderemos dizer que em 95,44% das vezes a mdia da populao estar in-
cluda no intervalo X 2 X ou:

X 2 X X + 2 X

Definindo o intervalo de confiana de 95,44%, teremos:

P( X 2 X X + 2 X ) = 0,9544

2 Esta definio se aplica a qualquer parmetro da populao.


3 A probabilidade de a mdia da populao estar contida no intervalo de confiana denominada, tambm, nvel de confiana que
medido de forma unitria.
C A P T U L O 11 / ESTIMAO 303

Como consequncia direta desse resultado, devemos entender tambm que, em 4,56% das vezes, a
mdia da populao no estar includa no intervalo definido por dois desvios padro.

EXEMPLO 11.1
De uma populao com mdia desconhecida e desvio padro 16, foi retirada uma amostra aleatria de tama-
nho n=64 cuja mdia 50. Qual a mdia da populao, considerando o intervalo de confiana 95%?

Soluo. O tamanho da amostra n=64 suficiente para aceitar que a mdia da amostra X tenha distribuio
normal. Numa distribuio normal, a probabilidade 95% ao redor da mdia permite estabelecer o desvio pa-
dro normalizado4 Z=1,96, resultado obtido com a frmula =INV.NORMP(0,025) e Z=+1,96, resultado obti-
do com a frmula =INV.NORMP(0,975), e ambos os resultados expressos de forma geral Z=1,96. Da expres-
so de Z:

X
Z=

n

A mdia da populao obtida com:


=XZ
n

O smbolo significa que a expresso inclui os dois limites de Z do intervalo. Substituindo os dados do
exemplo, teremos:

16
= 50 1, 96 = 50 1, 96 2
64

= 50 3, 92

Analisemos o resultado:

A mdia da populao = 50 3,92, com intervalo de confiana de 95%.


O erro de estimativa ou margem de erro da estimativa 3,92.
A mdia da populao um valor do intervalo de 46,08 at 53,92.
A probabilidade de a mdia da populao estar contida no intervalo 1,96 desvios padro normalizados ao
redor da mdia amostral 95%. Esse resultado permite afirmar que em 95% das vezes a mdia da popula-
o se situar entre 46,08 e 53,92

O erro de estimativa (ou margem de erro) e o intervalo de confiana so funes do tamanho da


amostra. No Exemplo 11.1, foi definido o intervalo de confiana e o tamanho da amostra, ficando de-
terminado o erro de estimativa. O Exemplo 11.2 mostrar o erro de estimativa, registrando o limite in-
ferior e o limite superior correspondente, para cinco diferentes valores de intervalos de confiana do
Exemplo 11.1.

EXEMPLO 11.2
Continuando com o Exemplo 11.1. Determinar os limites do erro de estimativa da mdia da populao, consi-
derando os intervalos de confiana 80%, 85%, 90%, 95% e 99%.

Soluo. Os resultados de Z registrados na segunda coluna da tabela seguinte foram obtidos com a funo esta-

4 Denominados, tambm, como valores crticos.


304 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

tstica INV.NORMP. Por exemplo, para o intervalo de confiana 80%, o limite inferior Z 1,2816, resultado obti-
do com a frmula =INV.NORMP(0,1), e o limite superior Z +1,2816, resultado obtido com a frmula
=INV.NORMP(0,9). Podemos simplificar o procedimento de clculo tendo presente que, pela simetria da distribui-
o normal, poderamos calcular apenas um dos dois limites e repetir o valor com sinal oposto para o outro limite.
Os limites do erro de estimativa da mdia da populao foram obtidos da mesma forma que os do Exemplo 11.1.

IC Z Limite Limite
inferior superior
80% 1,2816 47,44 52,56
85% 1,4395 47,12 52,88
90% 1,6449 46,71 53,29
95% 1,9600 46,08 53,92
99% 2,5758 44,85 55,15

Analisando os resultados dos Exemplos 11.1 e 11.2, surge uma concluso importante, afirmar com
90% de probabilidade que a mdia da populao est includa no intervalo de 46,71 at 53,29 pode ser
verdadeiro ou falso, como mostra o Exemplo 11.3.

EXEMPLO 11.3
Para estimar a mdia da populao, foram retiradas trs amostras de tamanho n=64 e mdias 50, 49 e 53. Ana-
lisar as trs estimativas da mdia da populao, considerando o intervalo de confiana 90% e sabendo que a
mdia e o desvio padro so conhecidos e iguais a, respectivamente, 50 e 10.

Soluo. Como o intervalo de confiana 90% define os desvios padro normalizados Z=1,645, a mdia da
populao :
10
= X 1645
, = X 1645
, 125
,
64
= X 2,056

Para qualquer valor de mdia da amostra, o erro de estimativa o mesmo e igual a 2,056. Analisemos os in-
tervalos das trs mdias.

Se a mdia da amostra for igual a 50, ento a mdia da populao estar no intervalo = 50 2,056, ou en-
tre os limites 47,944 e 52,056. Neste exemplo, afirmar que a mdia da populao est contida no intervalo
47,944 e 52,056 verdadeiro, pois a mdia da populao 50.
Se a mdia da amostra for igual a 49, a mdia da populao estar no intervalo = 49 2,056, ou entre os li-
mites 46,944 e 51,056. Afirmar que a mdia da populao est contida no intervalo 46,944 e 51,056 tam-
bm verdadeiro.
Se a mdia da amostra for igual a 53, a mdia da populao estar no intervalo = 53 2,056, ou entre os li-
mites 50,944 e 55,056. Neste exemplo, afirmar que a mdia da populao est contida no intervalo 50,944
e 55,056 falso.

Simulador intervalo de estimao


A estimativa da mdia da populao um processo aleatrio, com os valores verdadeiro e falso associa-
dos a uma distribuio de frequncias do verdadeiro valor, includo o conceito de longo prazo. A plani-
lha Intervalo de Confiana, includa na pasta Captulo 11, ajudar a compreender o que foi exposto. O
modelo est preparado para extrair da distribuio uniforme, ou da distribuio normal, 200 amostras
aleatrias de trs tamanhos diferentes n=10, 20 e 30, que podem ser selecionadas na caixa de opes.
C A P T U L O 11 / ESTIMAO 305

l A Figura 11.3 mostra o modelo com os registros parciais e o grfico dos intervalos das estimativas de
200 amostras aleatrias de tamanho dez, extradas de uma populao com distribuio contnua e
uniforme entre os limites 10 e 30, considerando o intervalo de confiana de 95%, valor registrado na
clula F6. A clula F7 registra a probabilidade de acerto dos 200 intervalos, nesse caso, 94,5%, resul-
tado obtido da contagem dos intervalos que contm o valor da mdia da populao conhecida e re-
gistrada na clula C6.
l A Figura 11.4 mostra o modelo com os registros parciais e o grfico dos intervalos das estimativas de
200 amostras aleatrias de tamanho 30, extradas de uma populao com distribuio normal
N(50, 3), considerando o intervalo de confiana de 90%, valor registrado na clula F6. A clula F7
registra a probabilidade de acerto dos 200 intervalos, nesse caso 90,5%.

FIGURA 11.3
Simulao de 200
amostras com a
distribuio uniforme.

Toda vez que for selecionado um outro tamanho de amostra, o modelo ser recalculado. Clicando
no boto Simulao, o modelo gerar um novo grupo de 200 amostras de tamanho e da distribuio se-
lecionada. Observe que:

l Todos os intervalos de variao da mdia so iguais, duas vezes o erro de estimativa, ou margem de
erro. No entanto, os limites da estimativa da mdia da populao so aleatrios.
l O aumento do tamanho da amostra diminui a diferena entre o IC estabelecido na clula F6 e a pro-
babilidade de intervalos que contm a mdia da populao registrada na clula F7.
l Ao mesmo tempo, a simulao de 200 amostragens uma quantidade pequena para imaginar que,
pela lei dos grandes nmeros, ao aumentar o nmero de experimentos, essa diferena ser prxima
do seu valor terico.
l Analisando o grfico, possvel contar os intervalos que no contm a mdia da amostra que, nesse
caso, conhecida. Uma melhor visualizao pode ser obtida aumentando o comprimento do grfi-
co. Para isso, primeiro a planilha dever ser desprotegida, desta forma: no menu Ferramentas, sele-
cione Proteger e depois Desproteger planilha.
306 E S T A T S T I C A U S A N D O E X C E L / LAPPONI

FIGURA 11.4 Simulao


de 200 amostras com a
distribuio normal.

Incluindo o erro tolerado


O intervalo de confiana determina a probabilidade de acerto da estimativa, por exemplo, se IC=90%, a
probabilidade de acerto ser 90% e, consequentemente, a probabilidade de erro ser 10%. Dessa ma-
neira, o erro no processo de estimativa define o intervalo de confiana IC=(1), medindo ambos
com valores unitrios.
Distribuindo o erro nas duas caudas da distribuio normal, o erro em cada cauda ser /2. O erro
denominado, tambm, erro tolerado ou nvel de confiana, mudando a forma de construir o intervalo
de confiana da mdia. A Figura 11.5 mostra o erro tolerado nas duas caudas e o desvio padro nor-
malizado identificado como Z/2.

(1a )
FIGURA 11.5 Erro
Za /2 Za /2
tolerado .

Za /2 +Za /2

A estimativa da mdia com intervalo de confiana (1)100, sendo conhecido o desvio padro da
populao, registrada na frmula seguinte:


= X Z 2
n
C A P T U L O 11 / ESTIMAO 307

A relao entre o erro tolerado , o intervalo de confiana (1) e o desvio padro normalizado Z/2
apresentada na tabela da Figura 11.6, cujos resultados mostram que, quanto maior for o erro tolerado
, menor ser o desvio padro normalizado Z/2 e, consequentemente, menor ser o erro de estimativa.

0,20 0,100 80% 1,282

0,15 0,075 85% 1,444

0,10 0,050 90% 1,645

0,05 0,025 95% 1,960

0,01 0,005 99% 2,576

FIGURA 11.6 Tabela de comparao.

EXEMPLO 11.4
De uma populao com desvio padro de 2,50, foi retirada uma amostra aleatria de tamanho n=36, cuja m-
dia 10,60. Estime a mdia da populao com intervalo de confiana de 95%.

Soluo. Como o intervalo de confiana 95%, o desvio padro normalizado dos dois limites Z=1,96. A
estimativa da mdia da populao 10,6 0,8167, resultado obtido de:

2,5
= 10,6 196
, = 10,6 196
, 0,4167
36

= 10,6 0,8167

A margem de erro, ou erro de estimativa, tambm pode ser obtida registrando a frmula
=INT.CONFIANA(0,05;2,5;36) em