Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatstica Aplicada
Administrao
Professor
2009
Copyright 2008. Todos os direitos desta edio reservados ao DEPTO. DE CINCIAS DA ADMINISTRAO (CAD/CSE/UFSC).
Inclui bibliografia
Curso de Graduao em Administrao, Modalidade a Distncia
ISBN: 978-85-61608-47-7
CENTRO SCIO-ECONMICO
PARANAGUA PR CHAPEC SC
PREFEITO Jos Baka Filho PREFEITO Joo Rodrigues
COORDENADORA DE PLO Meire Ap. Xavier Nascimento COORDENADORA DE PLO Maria de Lurdes Lamaison
JACUIZINHO RS JOINVILLE SC
PREFEITO Diniz Jos Fernandes PREFEITO Carlito Merss
COORDENADORA DE PLO Jaqueline Konzen de Oliveira COORDENADORA DE PLO a definir
SEBERI RS PALHOA SC
PREFEITO Marcelino Galvo Bueno Sobrinho PREFEITO Ronrio Heiderscheidt
COORDENADORA DE PLO Ana Lcia Rodrigues Guterra COORDENADORA DE PLO Luzinete Barbosa
TAPEJARA RS LAGUNA SC
PREFEITO Seger Menegaz PREFEITO Celio Antnio
COORDENADORA DE PLO Loreci Maria Biasi COORDENADORA DE PLO Maria de Lourdes Corra
BONFIM RR LAGES SC
PREFEITO Rhomer de Sousa Lima PREFEITO Renato Nunes de Oliveira
COORDENADORA DE PLO Tarcila Vieira Souza COORDENADORA DE PLO Marilene Alves Silva
MUCAJA RR
PREFEITO Elton Vieira Lopes
COORDENADORA DE PLO Ronilda Rodrigues Silva Torres
Apresentao
Caro estudante!
Toda vez que algum ouve a palavra Estatstica as reaes
costumam combinar averso, medo, negao da importncia, restri-
es ideolgicas at, e sempre a noo que se trata de algo muito
complicado... matemtica braba, so muitas frmulas difceis,
pode-se obter qualquer resultado com Estatstica, mtodos quanti-
tativos so dispensveis, no se aplica minha realidade, so al-
gumas das expresses que ouvi nesses anos em que leciono a discipli-
na. Talvez voc tenha ouvido tais expresses tambm, mas eu lhe as-
seguro que elas so exageradas ou mesmo falsas. preciso acabar
com alguns mitos e mostrar a importncia que a Estatstica tem na
formao do administrador.
Voc est iniciando a disciplina de Estatstica Aplicada Ad-
ministrao. Os mtodos estatsticos so ferramentas primordiais para
o administrador de qualquer organizao, pois possibilitam obter in-
formaes confiveis, sem as quais a tomada de decises seria mais
difcil ou mesmo impossvel. E, no se esquea, a essncia de admi-
nistrar tomar decises. Por este motivo, esta disciplina faz parte do
currculo do curso de Administrao.
Nesta disciplina voc aprender como obter dados confiveis
(conceitos de planejamento de pesquisa estatstica e amostragem),
como resumi-los e organiz-los (anlise exploratria de dados), e apli-
cando tcnicas apropriadas (probabilidade aplicada e inferncia es-
tatstica), generalizar os resultados encontrados para tomar decises.
Procurei apresentar exemplos concretos de aplicao, usando ferra-
mentas computacionais simples (como as planilhas eletrnicas, com
as quais voc teve um primeiro contato na disciplina de Informtica
Bsica). O domnio dos mtodos estatsticos dar a voc um grande
diferencial, pois permitir tomar melhores decises, o que, em essn-
cia, o objetivo primordial de qualquer organizao.
Sucesso em sua caminhada.
Conceito de Eseatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Variabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
O que amostragem? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Plano de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Atividades de aprendizagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Unidade 4 Anlise Exploratria de Dados II
Quartis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Clculo de medidas de sntese de uma varivel em funo dos valores de outra. . 115
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
Resumindo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
Referncias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
Minicurrculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
Introduo Estatstica
1
UNIDADE
e ao Planejamento
Estatstico
D
Objetivo
Nesta Unidade voc compreender o conceito de
Estatstica, sua importncia para o administrador e os
principais aspectos do planejamento estatstico para
garantir a obteno de dados confiveis.
1
UNIDADE
UNIDADE
Caro estudante seja bem-vindo!
Convidamos voc a entrar conosco nesse universo
B
amplo, porm, desafiador e instigante que a dis-
cusso e a reflexo sobre a Estatstica. A partir da
leitura do material podemos juntos construir e so-
cializar olhares articulando teoria e prtica. Que
rico esse movimento!!!!
Bem, como voc percebeu, o campo de debate
frtil e ter muito a discutir. Este ser um espao
de socializao e construo do conhecimento. No
esquea que dvidas e indagaes so sempre
pertinentes, pois so delineadoras para o processo
que estamos nos dispondo, coletivamente, nesta
disciplina.
N
o possvel tomar decises corretas sem dados confiveis. Os
governantes do Egito antigo e da Sumria (seus administrado-
res) j sabiam disso, portanto, mandavam seus escribas regis-
trar e compilar os dados da produo agrcola e dos homens aptos
para o servio militar. Em outras palavras, eles j usavam mtodos
estatsticos: a raiz da palavra Estatstica vem de Estado. Com o passar
do tempo, e a expanso do conhecimento, os mtodos estatsticos tor-
naram-se mais sofisticados, com a adoo de modelos probabilsticos,
inferncia estatstica e nos ltimos 30 anos a aplicao de computa-
dores, no apenas pelos governos, mas tambm por empresas, univer-
sidades e pessoas comuns.
A intensiva aplicao da informtica possibilitou a
automatizao de muitos clculos e a busca por informaes em gi-
gantescas bases de dados, o que vem constituindo o campo de conhe-
cimento de minerao de dados e inteligncia empresarial.
Hoje em dia todo administrador precisa usar mtodos estatsti-
cos. Para tanto, ele precisa conhec-los, a comear por suas defini-
es e subdivises. Veremos isso nesta Unidade, alm de apresentar-
Perodo 3 13
1 mos os conceitos de planejamento estatstico: como obter dados
confiveis.
UNIDADE
Conceito de Estatstica
UNIDADE
se forem submetidos experincias de vida diferentes tero um desen-
volvimento distinto. Sendo assim, variabilidade inevitvel e ine-
rente vida.
Antes de prosseguir, faa uma reflexo sobre as seguintes ques-
tes:
Subdivises da Estatstica
v
do real. Para respond-la preciso estudar uma ou mais caractersti-
cas de uma Populao de interesse. Populao o conjunto de medi- Maiores detalhes, voc
das da(s) caracterstica(s) de interesse em todos os elementos que a(s) vai estudar, ainda nesta
apresenta(m). Se, por exemplo, estamos avaliando as opinies de elei- Unidade
tores sobre os candidatos a presidente, a populao da pesquisa seria
constituda pelas opinies declaradas pelos eleitores em questo.
v
Como o interesse maior est na populao, o ideal seria
pesquisar toda a populao, em suma realizar um censo (como o IBGE Para Saber sobre o cen-
faz periodicamente no Brasil). Contudo, por razes econmicas ou so no Brasil, acesse o
prticas (para obter rapidamente a informao ou evitar a extino site do IBGE: <http://
ou exausto da populao) nem sempre possvel realizar um censo, w w w. i b g e . g o v. b r /
home>.
Perodo 3 15
v
1 Mais deta-
lhes ainda
torna-se ento necessrio pesquisar apenas uma amostra da popula-
o, um subconjunto finito e representativo da populao.
s etapas dos pargrafos anteriores somam-se outros tpicos
UNIDADE
nesta Uni- que estudaremos mais adiante, para constituir o planejamento es-
!
dade. tatstico da pesquisa.
Lembre-se
Lembre-se: a qualidade de uma pesquisa nunca ser
melhor do que a qualidade dos seus dados.
Amostra um
subconjunto finito e repre-
sentativo da populao. Uma das principais subdivises da Estatstica justamente a
Fonte: Barbetta (2007).
Amostragem, que rene os mtodos necessrios para coletar ade-
quadamente amostras representativas e suficientes para que os resulta-
dos obtidos possam ser generalizados para a populao de interesse.
v
Aps a coleta dos dados, por censo ou amostragem, a Anlise
Tema das Unidades 3 Exploratria de Dados permite apresent-los e resumi-los de maneira
e4 que seja possvel identificar padres e elaborar as primeiras conclu-
ses a respeito da populao. Em suma, descrever a variabilidade
encontrada. Se a pesquisa foi feita por censo, basta realizar a anlise
exploratria de dados para obter as concluses.
Posteriormente, atravs da Inferncia Estatstica possvel ge-
v
neralizar as concluses dos dados para a populao quando os dados
forem provenientes de uma amostra, utilizando a probabilidade para
calcular a confiabilidade das concluses obtidas.
A Figura 1 ilustra a subdiviso da estatstica. Veja:
Tema das Unidades 5,
6e7
Probabilidade medi-
da da possibilidade relati-
va de ocorrncia de um
evento qualquer relaciona-
do a certo fenmeno, pode
ser calculada atravs da
definio de um modelo
probabilstico para o fen-
meno. Fonte: Lopes
(1999).
UNIDADE
O administrador precisa tomar decises. Para tanto, precisa de
informaes confiveis, mas j sabemos que para obt-las preciso
coletar dados e resumi-los. Posteriormente necessrio interpret-los,
levando em conta a variabilidade inerente e inevitvel em todos os
fenmenos. Como a Estatstica fornece os meios para todas essas eta-
pas trata-se de um conhecimento indispensvel para o administrador.
v
Fonte: Dirio Catarinense de 17/10/2007, adaptada pelo autor de Microsoft.
Atravs de um simples grfico de linhas podemos observar uma Na Unidade 3, voc vai
queda no ndice da Bolsa de Valores de So Paulo, entre 15 e 16 de estud-lo com mais de-
talhes
outubro de 2007, motivada pelo temor de queda nas bolsas internaci-
onais, por sua vez causada pelo possvel agravamento da crise imobi-
liria nos EUA: constatao da situao atual, relacionada ao con-
texto internacional. Ao mesmo tempo em que se verifica queda, sabe-
Perodo 3 17
1 se que o IBOVESPA nunca antes havia ultrapassado 60 mil pontos
at recentemente: relacionamento com dados do passado. Os investi-
dores em aes negociadas na BOVESPA provavelmente tomaro suas
UNIDADE
Planejamento estatsti-
co da pesquisa con-
junto de mtodos cuja
implementao visa garan- Planejamento Estatstico de Pesquisa
tir a confiabilidade dos da-
dos coletados. Fonte:
Barbetta, Reis e Bornia
(2008). O planejamento estatstico da pesquisa parte do planejamen-
to geral da pesquisa.
Antes de se pensar em qualquer abordagem estatstica preci-
so definir o que se quer pesquisar, em qualquer campo do conheci-
mento. Como poderemos escolher o melhor caminho se no sabemos
para onde ir? Em outras palavras preciso definir corretamente a
pergunta do mundo real que queremos responder: isso nada
tem a ver com Estatstica, mas afetar profundamente as etapas do
planejamento estatstico.
Para facilitar a compreenso vamos fazer o planejamento de
v
uma pesquisa fictcia, mas que muito auxiliar na compreenso do
Essas e outras infor- contedo. O Conselho Regional de Administrao (CRA) um rgo
maes voc encontra consultivo, orientador, disciplinador e fiscalizador do exerccio da pro-
em: <http:// fisso de Administrador. Somente bacharis em Administrao (gra-
www.crasc.org.br/ duados em cursos de Administrao) podem registrar-se no CRA. O
index.php?pg=inicial/ CRA preocupa-se muito com a qualidade dos cursos de Administra-
oque.htm>. o e, freqentemente, apresenta sugestes para aperfeioar currcu-
los e disciplinas, visando melhoria da formao dos profissionais.
Com isso em mente, imagine que o CRA de Santa Catarina
est interessado em conhecer a opinio dos seus registrados sobre o
curso em que se graduaram, desde que tal curso esteja situado em
Santa Catarina. Esta a pergunta do mundo real: qual a opinio
dos profissionais registrados no CRA de Santa Catarina, e graduados
UNIDADE
Para realizar o planejamento estatstico precisamos
definir o objetivo geral, os objetivos especficos, a
populao, as variveis, o delineamento, a forma de
coleta de dados e o instrumento de pesquisa. Todos
esses itens sero temas das prximas sees.
Objetivos da pesquisa
Perodo 3 19
1 z Objetivos especficos:
z Avaliar a opinio dos registrados sobre o corpo do-
cente dos seus cursos.
UNIDADE
Populao
v
Uma parte importante do delineamento de qualquer pesquisa
A definio de popula- a definio da populao. Tal definio depender obviamente dos
o foi vista no incio objetivos da pesquisa, das caractersticas a mensurar, dos recursos
desta Unidade, voc se disponveis.
lembra? Populao o conjunto de medidas da(s) caracterstica(s) de
interesse em todos os elementos que a(s) apresenta(m). Se, por exem-
plo, estamos avaliando as opinies de eleitores sobre os candidatos a
presidente, a populao da pesquisa seria constituda pelas opinies
declaradas pelos eleitores em questo. A populao pode se referir a
seres humanos, animais e mesmo a objetos. O conjunto de medidas
pode se tratar de: altura de pessoas adultas do sexo masculino, peso
de bois adultos e dimetro dos parafusos produzidos em uma fbrica.
UNIDADE
srios para fazer a tabulao e a anlise dos resultados.
!
secuo dos objetivos especficos da pesquisa.
Perodo 3 21
1
B Tenha em mente que as variveis precisam ser re-
lacionadas aos objetivos especficos. Faa uma ex-
perincia com o seguinte questionamento: Qual era
UNIDADE
UNIDADE
veis nominais: sexo, naturalidade, entre outros.
z As qualitativas ordinais permitem ordenar os itens medi-
dos em termos de qual tem menos ou tem mais da qualida-
de representada pela varivel, mas ainda no permitem que
se diga o quanto mais. Um exemplo tpico de uma varivel
ordinal o status socioeconmico das famlias residentes
em uma localidade, sabemos que mdia-alta mais alta
do que mdia, mas no podemos dizer, por exemplo, que
18% mais alta.
v
3, 4, 8, 9 e 10, quais
forma de medio da varivel vai influenciar a qua-
sero as tcnicas esta-
lidade dos resultados da pesquisa, os custos.
tsticas mais apropriadas
para analisar os dados.
Perodo 3 23
1 Vejamos na Figura 4 a classificao das variveis por nvel de
manipulao.
UNIDADE
v
Os termos varivel dependente e independente aplicam-se prin-
Veremos mais deta- cipalmente pesquisa experimental, em que algumas variveis so
lhes nas prximas Uni- manipuladas, e, nesse sentido, so independentes dos padres de
dades reao inicial, intenes e caractersticas das unidades experimen-
tais. Espera-se que outras variveis sejam dependentes da manipu-
lao ou das condies experimentais. Ou seja, elas dependem do
que as unidades experimentais faro em resposta.
Contrariando um pouco a natureza da distino, esses termos
tambm so usados em estudos em que no se manipulam variveis
independentes, literalmente falando, mas apenas se designam sujeitos
a grupos experimentais (blocos) baseados em propriedades pr-exis-
tentes dos prprios sujeitos.
Muitas vezes fazemos a pesquisa para tentar identificar o rela-
cionamento existente entre variveis. Em uma pesquisa eleitoral para
presidente do Brasil, por exemplo, uma varivel independente poderia
ser a regio do pas, e a dependente o candidato escolhido pelo eleitor
pesquisado.
Vejamos um exemplo para entender esse processo de anlise e
observar se h relao entre as variveis. Nesse caso, para o nosso
exemplo da pesquisa com os registrados no CRA de Santa Catarina,
as variveis a serem medidas devem definir pelo menos uma varivel
para cada objetivo especfico, conforme a seguir:
UNIDADE
z Conhecimento sobre o contedo da disciplina;
z Habilidade didtica;
z Forma de avaliao; e
z Relacionamento com os estudantes.
( ) timo
( ) bom
( ) satisfatrio
( ) insuficiente
( ) horrvel.
Perodo 3 25
1 Delineamento da pesquisa
UNIDADE
tipos de delineamento:
Perodo 3 27
1 duo que quer testar todos os palitos de uma caixa de fsforos para ver
se funcionam.
A partir de uma amostra de 3.000 eleitores podemos obter um
v
UNIDADE
UNIDADE
das variveis, os dados da pesquisa. importante ressaltar que ele
est intrinsecamente relacionado s variveis da pesquisa. Portanto,
no seu projeto precisamos deixar claro qual o relacionamento exis-
tente com as variveis, da mesma forma que as variveis devem ser
relacionadas aos objetivos especficos.
O senso comum confunde instrumento de pesquisa com ques-
tionrio, o que no verdade. O questionrio apenas um tipo de
instrumento de pesquisa, e em muitas situaes ele no o mais apro-
Instrumento de pesqui-
priado. sa dispositivo usado para
Imagine a situao: queremos registrar o movimento em lojas coletar os valores das vari-
veis nos elementos da po-
de um Shopping Center com a finalidade de saber quais apresentam
pulao. Fonte: Barbetta,
clientela suficiente para continuarem a merecer a permanncia. No Reis e Bornia (2008).
precisamos aplicar um questionrio aos clientes, que podem recusar-
se a responder, ou aos lojistas, que podem ser criativos demais nas
respostas. Basta registrar em uma planilha quantas pessoas entra-
ram na loja, o horrio, se fizeram compras ou no, entre outros aspec-
tos. Uma outra situao seria uma pesquisa climtica, em que so
registradas medidas de temperatura, umidade relativa do ar, velocidade
do vento: obviamente no precisamos de um questionrio para isso.
O questionrio torna-se quase que indispensvel quando pre-
cisamos mensurar ou avaliar atitudes, preferncias, crenas e com-
portamentos que exigem a manifestao dos pesquisados. Pesquisas
de mercado, acerca da aceitao de um produto ou propaganda, pes-
quisas de comportamento, pesquisas de opinio eleitoral, todas elas
envolvem algum tipo de questionrio.
O questionrio pode ser enviado pelo correio, feito por telefo-
ne, feito com a presena fsica do entrevistador, ou mesmo via Internet.
Todos eles tm suas vantagens e desvantagens.
O aspecto mais importante do questionrio procurar obter as
informaes sem induzir ou confundir o respondente. As perguntas
precisam ser claras, afirmativas ou interrogativas, evitando negaes,
e coerentes com o nvel intelectual dos elementos da populao.
Perodo 3 29
!
1 Em uma cidade de Santa Catarina foi implementado
um sistema integrado de transporte coletivo; foi feita
uma pesquisa de opinio com os usurios, atravs de
UNIDADE
Saiba mais...
Para saber mais sobre experimentos, consulte: MOORE, David S.; McCABE,
George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A prtica da
estatstica empresarial: como usar dados para tomar decises. Rio de Janeiro:
LTC, 2006.
UNIDADE
O resumo desta Unidade est esquematizado na Figura
6. Observe:
Perodo 3 31
1 Atividades de aprendizagem
aprendizagem
UNIDADE
UNIDADE
Caro estudante,
Fazer com que voc entenda o conceito de Estats-
tica, as suas variabilidades e as subdivises na
aplicao de estudos e experimentos foi a propos-
ta desta Unidade. Com esse conhecimento voc
ser capaz de obter, organizar e analisar dados,
determinando as correlaes que se apresentem e
tirando delas suas consequncias para descrio e
explicao do que passou, alm de aprender a pre-
ver e organizar o futuro.
Leia as indicaes de textos complementares, res-
ponda s atividades de aprendizagem e interaja
com a equipe de tutoria. No fique com dvidas,
questione!
Saiba que voc no est sozinho neste processo e
que existe uma equipe que lhe dar base e supor-
te para a construo do seu conhecimento.
Perodo 3 33
2
UNIDADE
Tcnicas de
Amostragem
D
Objetivo
Nesta Unidade voc compreender em detalhes o
que amostragem, quando deve us-la, as suas
principais tcnicas, a definio do plano de
amostragem; e aprender a utilizar uma frmula
simplificada para clculo do tamanho mnimo de
amostra.
2
UNIDADE
UNIDADE
Caro estudante,
Conforme vimos na Unidade 1, a amostragem
uma das formas de coleta de dados e observamos
tambm que se trata de uma das subdivises da
B
Estatstica, cujo conhecimento indispensvel para
o administrador. Tenha em mente que estamos in-
teressados em obter dados confiveis para a toma-
da de decises e, muitas vezes, precisaremos rea-
lizar pesquisas para coletar tais dados. Convida-
mos voc para conhecer um pouco mais sobre essa
tcnica de pesquisa e seus diferentes mtodos de
aplicao.
H
vrios argumentos para justificar a utilizao da amostragem,
mas h casos em que seu uso pode no ser a melhor opo.
O administrador precisa conhecer tais argumentos, para que,
confrontando com os recursos disponveis e os objetivos da pesquisa,
possa tomar a melhor deciso sobre a forma de coleta dos dados.
Se o administrador decidir por amostragem, preciso delinear
o plano de amostragem, indicando como ela ser implementada, e
qual ser o seu tamanho, item crucial e que ir influenciar muito nos
custos da pesquisa. Vamos ver isso em detalhes, nesta Unidade.
O que amostragem?
Perodo 3 37
2 de 1) j foram cumpridas, e que o administrador agora precisa decidir
se coletar os dados por censo ou por amostragem.
O censo consiste simplesmente em estudar todos os elementos
UNIDADE
Amostragem forma de
coleta de dados em que
apenas uma pequena par-
te, considerada representa- Figura 7: Processo de Amostragem e Generalizao.
tiva, da populao Fonte: elaborada pelo autor.
pesquisada. Os resultados
podem ser ento generali-
B
zados, usualmente atravs
de mtodos estatsticos
apropriados, para toda a
importante saber avaliar os argumentos a favor
populao. Fonte: Barbetta de cada forma de coleta.
(2007).
UNIDADE
processamento mais rpido. Os resultados ficam dispo-
nveis em pouco tempo, permitindo tomar decises em se-
guida. Tal caracterstica especialmente importante em
pesquisas de opinio eleitoral, cujo resultado precisa ser
conhecido rapidamente, para que candidatos e partidos
possam reavaliar suas estratgias.
z Testes destrutivos: se para realizar a pesquisa precisa-
mos realizar testes destrutivos (de resistncia, tempo de vida
til, entre outros), o censo torna-se impraticvel, exigindo
a utilizao de amostragem. Em muitos casos, como no
caso de produtos alimentcios e farmacuticos, h normas
legais que precisam ser cumpridas rigorosamente quando
da realizao dos ensaios.
Perodo 3 39
2 motivos: populao pequena, caracterstica de fcil mensurao, ne-
cessidades polticas e necessidade de alta preciso.
UNIDADE
v
tra para obter bons resultados ser quase igual ao prprio
tamanho da populao. Vale a pena ento realizar um censo.
UNIDADE
de 1: "o CRA de Santa Catarina est interessado
em conhecer a opinio dos seus registrados sobre
o curso em que se graduaram, desde que tal curso
esteja situado em Santa Catarina". Alm disso, vi-
mos que o nmero de registrados no CRA, com
graduao em Santa Catarina foi suposto igual a
9.000 e h uma listagem com os registrados para
fins de cobrana de anuidade que contm infor-
maes sobre endereo, curso em que se graduou,
entre outras. Para conhecer a opinio das pessoas
precisamos entrevist-las (via correio, Internet, te-
lefone ou pessoalmente). Com base no que foi dito
at agora, voc sabe responder se a pesquisa deve
ser conduzida por censo ou por amostragem? Va-
mos ver juntos ento!
Perodo 3 41
2 uma delas, e ela for base poltica de um candidato, o resultado ser
distorcido.
v
A suficincia tambm um aspecto relativamente bvio.
UNIDADE
v
algoritmo matemtico, que tem uma lgica e uma lei de formao
Neste caso h sempre dos resultados. No obstante, tal problema, caso o algoritmo seja bom,
o risco dos nmeros se somente ocorre aps milhes ou bilhes de sorteios, quantidade mui-
repetirem se a srie for tssimo superior quela usada nas nossas pesquisas. Alguns estatsti-
muito longa, cos construram tabelas de nmeros pseudo-aleatrios e as deixaram
descaracterizando a disponveis para o pblico em geral.
aleatoriedade.
UNIDADE
at grandes bancos de dados.
v
exemplo de nmeros aleatrios de quatro dgitos (de 0001 a 9000)
gerados pelo Br.Office Calc: Na seo Para saber
mais vamos
3439 907 5369 8092 7962 8626 131 3667 7769 1248 disponibilizar um link
2206 410 292 1478 1977 155 2566 3088 4983 3217 que explica como gerar
3347 3201 8193 4195 3836 2736 8781 7260 8921 2307 nmeros pseudo-aleat-
rios com este aplicativo.
v
Toda a teoria de inferncia estatstica pressupe que a amos- Veremos sobre a teoria
tra, a partir da qual ser feita a generalizao (veja a Figura 10), foi da inferncia estatstica
retirada de forma aleatria. nas Unidades 8, 9 e
10.
Perodo 3 43
2 B Agora que j conhecemos os aspectos principais
para o sucesso da amostragem podemos detalhar
UNIDADE
o plano de amostragem.
Plano de Amostragem
UNIDADE
Figura 10: Tipos de Amostragem.
Fonte: elaborada pelo autor.
Perodo 3 45
2 A condio primordial para o uso da amostragem probabilstica
a de que todos os elementos da populao tenham uma probabilida-
de maior do que zero de pertencerem amostra. Tal condio mate-
UNIDADE
rializada se:
Amostragem aleatria
simples o processo de
amostragem em que todos
os elementos da populao
tm a mesma probabilida-
B Agora vamos lhe apresentar os tipos de amostragem
probabilstica.
de de pertencer amostra,
e cada elemento sorteado.
Fonte: Barbetta, Reis e
Bornia (2008).
Amostragem aleatria (casual) simples
Ta b e l a s d e n m e r o s A amostragem aleatria simples o tipo de amostragem
a l e a t r i o s so instru-
probabilstica recomendvel, somente, se a populao for homognea
mentos usados para auxili-
ar na seleo de amostras em relao aos objetivos da pesquisa, por exemplo, quando admiti-
aleatrias, formadas por su- mos que todos os elementos da populao tm caractersticas seme-
cessivos sorteios de algaris-
lhantes em relao aos objetivos da pesquisa. H uma listagem dos
mos do conjunto {0, 1, 2,
3, 4, 5, 6, 7, 8, 9}, fazen- elementos da populao, atribuem-se nmeros a eles, e atravs de al-
do com que todo nmero guma espcie de sorteio no viciado, por meio de tabelas de nmeros
com a mesma quantidade de
aleatrios ou nmeros pseudo-aleatrios gerados por computador, os
algarismos tenha a mesma
probabilidade de ocorrncia. integrantes da amostra so selecionados. Nesse tipo de amostragem
Fonte: Barbetta (2007). probabilstica todos os elementos da populao tm a mesma proba-
bilidade de pertencer amostra. Foi exatamente o que fizemos no fi-
nal do tema Aspectos necessrios para o sucesso da amostragem
para a nossa pesquisa do CRA.
UNIDADE
de amostragem aleatria simples pode ser um processo moroso, ou se
o tamanho de amostra for substancial, teremos que realizar um gran-
de nmero de sorteios: caso estejamos utilizando nmeros pseudo-
aleatrios aumenta o risco de repetio dos nmeros. Utiliza-se ento
uma variao, a amostragem sistemtica, que tambm supe que a
populao homognea em relao varivel de interesse, mas que
consiste em retirar elementos da populao a intervalos regulares, at
compor o total da amostra. A amostragem sistemtica somente pode
ser retirada se a ordenao da lista no tiver relao com a varivel
Amostragem sistemti-
de interesse. Imagine que queremos obter uma amostra de idades de ca a variao da
uma listagem justamente ordenada desta forma, neste caso a amostragem aleatria sim-
amostragem sistemtica no seria apropriada, a no ser que ples em que os elementos
da populao so retirados
reordenssemos a lista. a intervalos regulares, at
Veja a seguir o procedimento para a amostragem sistemtica: compor o total da amostra,
sendo o sorteio realizado
apenas no ponto de partida.
z obtm-se o tamanho da populao (N); Fonte: Barbetta (2007).
Perodo 3 47
2
UNIDADE
UNIDADE
terognea em relao aos objetivos da pesquisa. No caso de uma pes-
quisa eleitoral para governador, por exemplo, podemos esperar que a
opinio deva ser diferente dependendo da regio onde o eleitor mora,
classe social e mesmo profisso dos entrevistados. Contudo, podemos
supor que haja certa homogeneidade de opinio dentro de cada gru-
po. Ento, supe-se que haja heterogeneidade entre os estratos, mas
homogeneidade dentro dos estratos, e que eles sejam mutuamente
exclusivos (cada elemento da populao pode pertencer a apenas um
estrato). Para garantir que a amostra seja representativa da popula-
o precisamos garantir que os diferentes estratos sejam nela repre- Amostra representativa
aquela que representa na
sentados: deve usar a amostragem estratificada, como representa a
sua composio todas as
Figura 12: subdivises da populao,
procurando retratar da me-
lhor maneira possvel a sua
variabilidade. Fonte: elabo-
rado pelo autor.
A m o s t r a g e m
estratificada a
amostragem probabilstica
usada quando a populao
for heterognea em relao
aos objetivos da pesquisa
(as opinies tendem a vari-
ar muito de subgrupo para
subgrupo), e amostra pre-
cisa conter elementos de
Figura 12: Amostragem estratificada. cada subgrupo da popula-
Fonte: elaborada pelo autor. o para represent-la ade-
quadamente. Fonte:
B
Barbetta (2007).
Perodo 3 49
2 z uniforme, quando os mesmos nmeros de elementos so
selecionados de cada estrato.
UNIDADE
UNIDADE
nica alternativa possvel. Veja a Figura 13 e entenda como ocorre
essa amostragem:
v
A Pesquisa Nacional por Amostra de Domiclios (PNAD) do
IBGE, coleta informaes demogrficas e socioeconmicas sobre a Mais informaes em
populao brasileira. Utiliza amostragem por conglomerados em trs < h t t p : / /
estgios: www.ibge.gov.br/home/
estatistica/populacao/
z Primeiro estgio: amostras de municpios (conglomera- trabalhoerendimento/
dos) para cada uma das regies geogrficas do Brasil; pnad98/saude/
metodologia.shtm>.
z Segundo estgio: setores censitrios sorteados em cada
municpio (conglomerado sorteado); e
z Terceiro estgio: domiclios sorteados em cada setor
censitrio.
B
Voc deve estar se perguntando, e quando no for
possvel garantir a probabilidade de todo elemento
da populao pertencer amostra? Ento esse o
momento de partirmos para a amostragem no
probabilstica.
Perodo 3 51
2 Amostragem no-probabilstica
A obteno de uma amostra probabilstica exige uma listagem
UNIDADE
B
mximo que o pesquisador
admite errar na estimativa Veja que existem ainda vrios tipos de amostragem no-
de uma caracterstica da
populao a partir de uma
probabilstica e que sero descritos na sequncia.
amostra aleatria desta
mesma populao. Fonte:
Barbetta (2007).
Amostragem a esmo
Na Amostragem a esmo, o pesquisador procura ser o mais ale-
atrio possvel, mas sem fazer um sorteio formal. Imagine um lote de
10.000 parafusos, do qual queremos tirar uma amostra de 100, se
fssemos realizar uma amostragem aleatria simples o processo tal-
vez fosse trabalhoso demais. Ento simplesmente retiramos os elemen-
tos a esmo. Esse tipo de amostragem tambm pode ser utilizado quan-
do a populao for formada por material contnuo (gases, lquidos,
minrios), bastando homogeneizar o material e retirar a amostra.
UNIDADE
escolhe alguns elementos para fazer parte da amostra, com base no
julgamento de que aqueles seriam representativos da populao. Esse
tipo de amostragem bastante usado em estudos qualitativos. Obvia-
mente o risco de obter uma amostra viciada grande, pois se baseia
totalmente nas preferncias do pesquisador, que pode se enganar
(involuntria ou voluntariamente).
v
Na prtica, muitas pesquisas so realizadas utilizando
amostragem por cotas, incluindo as polmicas pesquisas eleitorais. Leia um texto muito in-
No exemplo apresentado no Quadro 1, imagine que queremos teressante sobre o tema
saber a opinio dos eleitores do bairro Goiaba sobre o governo muni- que est disponvel em:
cipal. Supe-se que as principais variveis que condicionariam as < h t t p : / /
respostas seriam sexo, idade e classe social. O bairro apresenta a se- www.ime.unicamp.br/
~ d i a s /
guinte composio demogrfica para as variveis:
falaciaPesquisaEleitoral.pdf>.
Perodo 3 53
2 SEXO
Masculino
IDADE (FAIXA ETRIA)
18| -- 35
CLASSE SOCIAL
A
% POPULACIONAL
1%
UNIDADE
Masculino 18| -- 35 B 4%
Masculino 18| -- 35 C 10%
Feminino 18| -- 35 A 1%
Feminino 18| -- 35 B 2%
Feminino 18| -- 35 C 9%
Masculino 35| -- 60 A 5%
Masculino 35| -- 60 B 8%
Masculino 35| -- 60 C 12%
Feminino 35| -- 60 A 4%
Feminino 35| -- 60 B 8%
Feminino 35| -- 60 C 10%
Masculino Mais de 60 A 1%
Masculino Mais de 60 B 9%
Masculino Mais de 60 C 3%
Feminino Mais de 60 A 3%
Feminino Mais de 60 B 7%
Feminino Mais de 60 C 3%
UNIDADE
quando difcil identificar respondentes em potencial. A cada novo
respondente que identificado e entrevistado, pede-se que identifique
outros que possam ser qualificados como respondentes. Pode levar a
amostras compostas apenas por amigos dos primeiros entrevista-
dos, o que pode causar viesamentos nos resultados finais.
Viesamentos distores
A determinao do tamanho de amostra um dos aspectos na obteno da amostra que
mais controversos da tcnica de amostragem, e envolve uma srie de podem comprometer a
conceitos (probabilidade, inferncia estatstica e a prpria teoria da confiabilidade dos dados.
Fonte: elaborado pelo autor.
amostragem). Nesta seo apresentaremos uma viso simplificada
para obter o tamanho mnimo de uma amostra aleatria simples que
atenda aos seguintes requisitos:
Perodo 3 55
2 z no vamos nos preocupar com aspectos financeiros relaci-
onados ao tamanho da amostra (embora, obviamente, seja
uma considerao importante).
UNIDADE
a) 200 elementos.
b) 200.000 elementos.
UNIDADE
2% para ambas podemos calcul-lo apenas uma vez. Devemos dividir
Perodo 3 57
2
UNIDADE
UNIDADE
Cincias Sociais. 7. ed. Florianpolis: Ed. da UFSC, 2008, Captulo 3.
r
Sobre Amostragem a esmo, leia: COSTA NETO, Pedro L. da O. Estatstica.
2. ed, So Paulo: Edgard Blcher, 2002.
Resumindo
O resumo desta Unidade est esquematizado na Figura
15. Observe:
Perodo 3 59
2
UNIDADE
UNIDADE
mos sobre amostragem e censo e suas formas de
utilizao, habilidades necessrias para um bom
administrador. Essa Unidade foi repleta de Figu-
ras, Quadros, representaes e exemplos de utili-
zao das tcnicas e das diferentes formas de uti-
lizao na ntegra de suas especificidades, e deu
sustentao para as discusses das prximas Uni-
dades. Releia, caso necessrio, todos os exemplos,
leia as indicaes do Saiba mais e discuta com seus
colegas. Na realizao da atividade de aprendiza-
gem voc colocar em prtica os ensinamentos re-
passados. Conte sempre com o acompanhamento
da tutoria e das explicaes do professor. Lembre-
se que voc no est sozinho. Conte com a gente!
Atividades de aprendizagem
aprendizagem
Perodo 3 61
2 40 estudantes da ltima fase do curso de Jornalismo da-
quela instituio.
UNIDADE
UNIDADE
i) Para avaliar a qualidade dos itens que saem de uma linha
de produo, observou-se um item a cada meia hora, du-
rante todo o dia.
j) Para estimar a porcentagem de empresas que investiram
em novas tecnologias no ltimo ano, enviou-se um questi-
onrio a todas as empresas de um estado. A amostra foi
formada pelas empresas que responderam o questionrio.
2) Uma determinada faculdade do interior de Santa Catarina possui seis
cursos, estando os alunos matriculados de acordo com a tabela abaixo:
Perodo 3 63
2 b) Supondo a populao dividida em dois estratos iguais, qual
o tamanho mnimo de amostra para se ter um erro amostral
mximo de 5% em cada estrato?
UNIDADE
UNIDADE
UNIDADE
Anlise Exploratria
de Dados I
D
Objetivo
Nesta Unidade voc compreender a definio de
Anlise Exploratria de Dados e aprender como
realizar a descrio tabular e grfica de conjuntos
de dados referentes a variveis qualitativas e
quantitativas.
Perodo 3 65
3
UNIDADE
UNIDADE
Caro estudante,
Perodo 3 67
v A
3 No passa-
do a An-
Anlise Exploratria de Dados, antigamente chamada ape-
nas de Estatstica Descritiva, constitui o que a maioria das pes-
soas entende como Estatstica, e inconscientemente usa no dia
UNIDADE
UNIDADE
do DAE, Joo Ningum, nasceu em 20 de fevereiro de 1985, matrcu-
la 02xxxxxxx-01, IAA = 3,5, IAP = 6,0. Para a operadora de carto
de crdito, carto nmero xxxxxxxxx-84, Jos Nenhum, R$200,
v
14h28min 11 de dezembro de 2003, supermercado.
Exemplo 1 A Megamontadora TOYORD regularmente con-
duz pesquisas de mercado com os clientes que compraram carros zero Trata-se de uma empre-
km diretamente de suas concessionrias. O objetivo avaliar a satis- sa e de uma pesquisa
fao dos clientes em relao aos diferentes modelos, seu design e fictcias.
adequao ao perfil do cliente. A ltima pesquisa foi terminada em
julho de 2007: 250 clientes foram entrevistados entre o total de 30.000
que compraram veculos novos entre maio de 2006 e maio de 2007. A
pesquisa foi restringida aos modelos mais vendidos, e aos que j es-
to no mercado h dez anos. As seguintes variveis foram obtidas:
Perodo 3 69
3 z Quilometragem mensal mdia percorrida com o veculo.
z Percepo do cliente de h quantos anos o veculo com-
prado teve a sua ltima remodelao de design: em anos
UNIDADE
UNIDADE
ria onde comprou o veculo no causou impresso, est muito insatis-
feito com seu veculo, tem renda mensal de 24,98 salrios mnimos
(R$ 9.492,00), costuma levar cinco pessoas no veculo, trafega em
mdia 415 km por ms com esse veculo, cr que a ltima remodela-
o foi feita h dois anos e tem 35 anos de idade. Esse raciocnio
pode ser estendido para os outros 249 respondentes. Analisando as
variveis isoladamente ou em conjunto podemos atingir os objetivos
da pesquisa.
O arquivo de dados mostrado na Figura 16 est disponvel no
v
Ambiente Virtual de Ensino-Aprendizagem no formato do Excel e do
Calc. Juntamente com ele est disponibilizado o texto Como realizar Veja a seo Saiba
anlise exploratria de dados no Br.Office Calc, e como realizar an- mais desta Unidade. O
lise exploratria de dados no Microsoft Excel. arquivo de dados e o tex-
A maioria dos programas estatsticos, gerenciadores de bases to serviro para as Uni-
de dados e planilhas eletrnicas com capacidade estatstica exige que dades 3 e 4.
os dados sejam estruturados de acordo com o formato da Figura 16.
Podemos ter tantas colunas e linhas quisermos, respeitando, porm,
as capacidades dos programas, o Microsoft Excel, por exemplo, ad-
mite 65.000 linhas, o que suficiente para muitas aplicaes.
Uma vez os dados no formato apropriado, especialmente se em
meio digital, podemos passar para a etapa de anlise. Uma das ferra-
mentas mais teis para isso a distribuio de frequncias, como
veremos a seguir.
Perodo 3 71
3 Uma distribuio de frequncias pode ser expressa atravs de
tabelas ou de grficos, que tero algumas particularidades dependen-
do do nvel de mensurao da varivel e de quantas variveis sero
UNIDADE
v
trs mulheres (dados
brutos) deste curso uma des de dados); j a frequncia relativa possibilita comparar os resulta-
delas casou-se com um dos da distribuio de frequncias com outros conjuntos de tamanhos
professor o efeito j no diferentes. A distribuio de frequncias pode ser apresentada em for-
ser to grande. Fonte: ma de tabela ou grfico.
B
Huff (1992).
UNIDADE
Insatisfatria 58 23,20%
No causou impresso 75 30,00%
Satisfatria 50 20,00%
Bastante satisfatria 38 15,20%
Total 250 100%
Perodo 3 73
3
UNIDADE
UNIDADE
Figura 18: Grfico em barras para Opinio sobre as concessionrias.
Fonte: adaptada pelo autor de Microsoft.
Perodo 3 75
3 VALORES
Muito insatisfatria
FREQNCIA
29
PERCENTUAIS
11,60%
GRAUS
41,76
UNIDADE
UNIDADE
Quando as duas variveis so qualitativas (originalmente ou
quantitativas categorizadas) usualmente construda uma distribui-
o conjunta de frequncias, tambm chamada de tabela de con-
tingncias, ou dupla classificao.
Nela so contadas as frequncias de cada cruzamento possvel
entre os valores das variveis. A expresso pode incluir o clculo de
percentuais em relao ao total das linhas, colunas ou total geral da ta-
bela. A representao grfica tambm possvel. Vamos ver um exemplo.
Para a mesma situao do Exemplo 1. Agora voc est interes-
Ta b e l a d e c o n t i n g n c i -
sado em observar relacionamento entre a varivel modelo adquirido e as tabela que permite
a opinio geral do cliente sobre o veculo, e expressa-lo de forma tabu- analisar o relacionamento
entre duas variveis, nas li-
lar e grfica.
nhas so postos os valores
A varivel modelo apresenta cinco resultados possveis (cinco de uma delas, e nas colu-
modelos foram considerados nesta pesquisa), e a varivel opinio geral nas os da outra, e nas clu-
las contam-se as freqn-
pode assumir quatro resultados (Bastante satisfeito, satisfeito, insatis- cias de todos os cruzamen-
feito e muito insatisfeito). Isso significa que podemos ter at 20 cruza- tos possveis. Fonte:
mentos possveis para os quais precisamos contar as frequncias. Para Barbetta (2007).
1 1
Chiconaultla 69 11 1 0 81
DeltaForce3 29 22 5 0 56
Valentiniana 11 18 9 3 41
SpaceShuttle 1 14 17 10 42
LuxuriousCar 0 1 9 19 29
Total 110 67 41 32 250
Perodo 3 77
3 Observe a ltima coluna e a ltima linha do quadro acima: so
os chamados totais marginais, isto , as frequncias dos valores
das variveis Modelo e Opinio geral sobre o veculo, respectivamen-
UNIDADE
v
h motivo para preocupao, pois ou houve muitos erros de digitao
Conforme vimos na na tabulao dos dados, ou o instrumento de pesquisa foi mal proje-
Unidade 1 tado, pois muitos elementos da populao no forneceram as infor-
maes desejadas.
O Quadro 4 pode ser apresentado de forma grfica, atravs de
um grfico de barras mltiplas (Figura 20).
UNIDADE
podemos calcular percentuais, em relao aos totais de cada coluna,
ou aos totais de cada linha ou ao total geral da tabela. Vamos apre-
sentar apenas um dos percentuais possveis, em relao aos totais das
linhas (maiores detalhes nos textos Como realizar anlise exploratria
de dados no Microsoft Excel e Como realizar anlise exploratria
de dados com o Br.Office Calc):
Chiconaultla 69 11 1 0 81
85,19% 13,58% 1,23% 0,00% 100%
DeltaForce3 29 22 5 0 56
51,79% 39,29% 8,93% 0,00% 100%
Valentiniana 11 18 9 3 41
26,83% 43,90% 21,95% 7,32% 100%
SpaceShuttle 1 14 17 10 42
2,38% 33,33% 40,48% 23,81% 100%
LuxuriousCar 0 1 9 19 29
0,00% 3,45% 31,03% 65,52% 100%
Total 110 66 41 32 249
44,18% 26,51% 16,47% 12,85% 100%
Perodo 3 79
3 Caso de uma varivel quantitativa
A construo das distribuies de frequncias para variveis
UNIDADE
B
para variveis quantitativas discretas graficamente?
3
v
O Quadro 6 poderia ser representado atravs de um
UNIDADE
Histograma, um grfico de barras justapostas, em
que as reas das barras so proporcionais s A maioria
frequncias de cada valor. Vamos ver (Figura 21): dos progra-
mas (estats-
ticos ou no)
que constro-
em histogramas para
variveis quantitativas
discretas costuma igno-
rar isso.
v
Mais informaes veja a
Se o conjunto de dados for pequeno, at 100 observaes,
seo T a fim de sa-
possvel usar ferramentas grficas como o diagrama de pontos e o ber.
ramo em folhas.
Perodo 3 81
3 Se o conjunto for grande, preciso representar os dados atra-
vs de um conjunto de faixas de valores mutuamente exclusivas (para
que cada valor pertena apenas a uma faixa), que contenha do menor
UNIDADE
UNIDADE
ficariam os resultados nos seguintes casos:
v
cem classe mdia, e acima disso pertencem classe alta?
b) Se optssemos por uma distribuio de frequncias para A resoluo passo a pas-
dados agrupados? so deste problema est
na seo Saiba mais
No caso do item a, a categorizao levar criao de uma desta Unidade, que ex-
nova varivel, agora qualitativa, permitindo uma abordagem seme- plica como realizar an-
lhante a que vimos anteriormente. No Quadro 7 e na Figura 22 esto lise exploratria de da-
os resultados: tabela de frequncias e grfico em setores. dos no Excel. Aqui apre-
sentaremos apenas os
resultados finais.
VALORES FREQUNCIA PERCENTUAL
Classe baixa (at 2 s.m.) 2 0,8%
Classe mdia (entre 2,01 e 20 s.m.) 104 41,6%
Classe alta (acima de 20 s.m.) 144 57,6%
Total 250 100%
Perodo 3 83
3 Observe que perdemos informao sobre os dados originais de
renda ao fazer a categorizao. A interpretao relativamente sim-
ples: a maioria absoluta (mais de 50%) dos clientes da montadora
UNIDADE
v
Esses valores foram
z Intervalo = Maior Menor = 86,015 1,795 = 84,22 (a
obtidos no arquivo de maior renda de 86,015 salrios mnimos e a menor de
dados citado no incio 1,795, as classes devem englobar do menor ao maior valor).
desta Unidade
z . Por esse ex-
pediente deveramos usar 16 classes. Porm, conforme foi
dito anteriormente, o nmero de classes pode ser definido
de forma arbitrria: para simplificar nosso problema va-
mos usar cinco classes.
Amplitude das classes = 86,015/5 = 16,844 (valor exato)
A amplitude das classes pode ser ligeiramente maior do que
a obtida acima, poderamos, novamente procurando a sim-
plificao do problema, usar amplitude igual a 16,85. Se a
amplitude no for um valor exato, deve sempre ser arre-
dondado para cima, garantindo que as classes contero
do menor ao maior valor. As classes podem ento ser defi-
nidas
z Classes:
1,795|-18,645 18,645|- 35,495 35,495|- 52,345
52,345|- 69,195 69,195|- 86,045
(neste caso o ponto inicial foi o prprio menor valor do
conjunto, poderia ser outro valor conveniente abaixo do
menor valor).
z Pontos mdios de cada classe: (limite inferior + limite su-
perior)/2
(os pontos mdios calculados esto no quadro abaixo)
z Frequncias de cada classe (Quadro 8):
UNIDADE
18,645|- 35,495 102 40,8% 27,07
35,495|- 52,345 38 15,2% 43,92
52,345|- 69,195 9 3,6% 60,77
69,195|- 86,045 3 1,2% 77,62
Total 250 100%
Perodo 3 85
3 Note que a interpretao mais direta quando observamos o
grfico apresentado na Figura 23.
Mas aqui surge um fato interessante. Parece haver contradio
UNIDADE
vB
probabilidade de que estas estimativas correspondam exatamente aos
verdadeiros valores. Outro problema so as medidas estatsticas cal-
A tendncia atual culadas com base na distribuio de frequncias para dados agrupa-
NO CALCULAR me- dos: sero apenas estimativas dos valores reais devido perda de
didas estatsticas com informao referida acima.
base em tabelas de
dados grupados.
Agora vamos ver como analisar o relacionamento
entre duas variveis quantitativas.
v
H uma outra varivel, chamada de dependente, seus valores
Reveja as definies de so resultado da variao dos valores das variveis independentes.
variveis na Unidade
1.
UNIDADE
res variam em uma mesma direo, ou em direes
opostas, com uma certa fora, ou seja, correlao
no significa causalidade.
v
Diagrama de Disperso. Atualmente isso pode ser feito com
aplicativos computacionais, at mesmo uma planilha eletrnica como Saiba mais nos textos
o Br.Office Calc ou Microsoft Excel. Como realizar anlise
Atravs do diagrama de disperso podemos ter uma ideia ini- exploratria de dados no
cial de como as variveis esto relacionadas: a direo da correlao Br.Office Calc e Como
(isto , quando os valores de X aumentam, os valores de Y aumentam realizar anlise
exploratria de dados no
tambm ou diminuem), a fora da correlao (em que taxa os valo-
Microsoft Excel.
res de Y aumentam ou diminuem em funo de X) e a natureza da
correlao (se possvel ajustar uma reta, parbola, exponencial aos
pontos).
v
sunto, que sero extre- de voto dos candidatos a presidente a cada pesquisa eleitoral. O obje-
mamente teis, caso
tivo da anlise de uma srie temporal identificar a existncia de
voc tenha que lidar
padres que nos auxiliem a tomar decises.
com sries temporais.
UNIDADE
comum ele ter que estudar o relacionamento entre
uma varivel qualitativa e outra quantitativa.
Perodo 3 89
3 Neste caso, podemos obter distribuies de frequncias da va-
rivel Renda para cada valor da varivel Modelo. Seria uma situao
semelhante a do item b do Exemplo 4, mas agora com cinco tabelas,
UNIDADE
MODELO
1,795|- 73 20 4 0 0 97
18,645
18,645|- 7 35 32 24 4 102
35,495
35,495|- 1 1 4 18 14 38
52,345
52,345|- 0 0 1 0 8 9
69,195
69,195|- 0 0 0 0 3 3
86,045
Total 81 56 41 42 29 249
v
Observe a semelhana da tabela mostrada no Quadro 9 com
aquela do Quadro 8. Da mesma forma que l fizemos, possvel cal-
H 249 dados na ta- cular percentuais em relao aos totais das linhas, colunas ou total
bela porque o dado
geral.
perdido (descoberto no
Podemos perceber que o relacionamento esperado entre as va-
Quadro 5) foi removi-
riveis foi confirmado: para os modelos mais baratos a renda mais
do do conjunto.
alta est na classe de 35,495 a 52,345 salrios mnimos; j os clientes
do modelo mais caro (LuxuriousCar) esto nas classes mais altas.
UNIDADE
considerveis manipulaes. Mas, atravs de um software estatstico,
no nosso caso o Statsoft Statistica 6.0, isso possvel (Figura 25):
Saiba mais...
Sobre correlao entre variveis (quantitativas): BARBETTA, Pedro A.
Estatstica Aplicada s Cincias Sociais. 7. ed. Florianpolis: Ed. da UFSC,
2007. Captulo 13.
Perodo 3 91
3 Sobre correlao entre variveis (quantitativas): MOORE, David S.;
McCABE, George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A
prtica da estatstica empresarial: como usar dados para tomar decises. Rio
UNIDADE
r
dados com o Br.Office Calc disponvel no ambiente virtual assim como o
arquivo de dados usado nos exemplos apresentados.
Resumindo
O resumo desta Unidade est mostrado na Figura 26:
UNIDADE
Figura 26: Resumo da Unidade 3.
Fonte: elaborado pelo autor.
Perodo 3 93
3 B Caro estudante,
Essa Unidade foi importantssima para voc enten-
UNIDADE
Atividades de aprendizagem
aprendizagem
UNIDADE
culos da TOYORD? JUSTIFIQUE.
2) A varivel anos de remodelao dos veculos (na percepo do clien-
te) est representada no histograma a seguir:
Perodo 3 95
3 verificar se isso verdade construram a tabela a seguir. Com base
nela, a crena dos executivos verificada (calcule os percentuais
que achar necessrios)? JUSTIFIQUE!
UNIDADE
1,795|- 0 16 78 4 98
18,645
18,645|- 7 47 26 22 102
35,495
35,495|- 15 4 5 14 38
52,345
52,345|- 7 0 1 1 9
69,195
69,195|- 3 0 0 0 3
86,045
Total geral 32 67 110 41 250
UNIDADE
Anlise Exploratria
UNIDADE
de Dados II
D
Objetivo
Nesta Unidade voc aprender mais uma maneira
de descrever e analisar um conjunto de dados
referente a uma varivel quantitativa (discreta ou
contnua): atravs das medidas de sntese. Sero
apresentadas as medidas de posio e de disperso
que permitem sintetizar o comportamento da varivel
individualmente ou em funo dos valores de outra
varivel.
Perodo 3 97
4
UNIDADE
UNIDADE
Caro estudante!
Na Unidade 3 estudamos como fazer a descrio
B
tabular e grfica das variveis, seja isoladamente
ou relacionadas a outras, e interpretar os resulta-
dos obtidos. Alm daquelas tcnicas, nos casos
em que a varivel sob anlise for quantitativa dis-
creta ou quantitativa contnua, h uma terceira
forma de descrio: as medidas de sntese, ou es-
tatsticas. A sua utilizao pode ser feita de forma
a complementar as tcnicas vistas na Unidade 3,
ou como alternativa a elas.
As medidas de sntese subdividem-se em medidas
de posio (ou de tendncia central) e medidas
de disperso. Vamos estudar as medidas de posi-
o: mdia, mediana, moda e quartis; e as medi-
das de disperso: intervalo, varincia, desvio padro
e coeficiente de variao percentual. Cada uma de-
las pode ser muito til para caracterizar um conjunto
de dados referente a uma varivel quantitativa.
Tenha sempre em mente que indispensvel que
o administrador conhea as medidas de sntese
para que possa realizar Anlise Exploratria de
Dados atravs delas. Vamos ver que so ferramen-
tas que geram resultados objetivos, o que torna
mais racional o processo de tomada de deciso.
A
s Medidas de Posio procuram caracterizar a tendncia cen-
tral do conjunto, um valor numrico que represente o con-
junto. Esse valor pode ser calculado levando em conta todos
os valores do conjunto ou apenas alguns valores ordenados. As medi-
das mais importantes so mdia, mediana, moda e quartis.
Perodo 3 99
4 Mdia ( )
UNIDADE
v
Onde xi um valor qualquer do conjunto, a soma dos
B
dados. Fonte: Barbetta
(2007).
No exemplo que acabamos de ver as trs turmas
tm a mesma mdia (6), ento se apenas essa
medida fosse utilizada para caracteriz-las poder-
amos ter a impresso de que as trs turmas tm
desempenhos idnticos. Ser? Observe atentamente
o Quadro 10.
UNIDADE
nota baixa, mas seu valor tal que realmente consegue diminuir a
mdia do conjunto.
Um dos problemas da utilizao da mdia que, por levar em
conta todos os valores do conjunto, ela pode ser distorcida por valo-
res discrepantes (outliers) que nele existam. importante ento
interpretar corretamente o valor da mdia.
O valor da mdia pode ser visto como o centro de massa de
Valores discrepantes
cada conjunto de dados, ou seja, o ponto de equilbrio do conjunto: ( outliers) valores de
se os valores do conjunto fossem pesos sobre uma tbua, a mdia a uma varivel quantitativa
que se distanciam muito
posio em que um suporte equilibra essa tbua.
(para cima ou para baixo)
Vamos ver como os valores do exemplo distribuem-se em um da maioria das observa-
diagrama apropriado (Figura 27): es. Por exemplo, a renda
de Bill Gates um valor
discrepante da varivel
renda de pessoas morando
nos EUA. Fonte: adaptado
pelo autor de Bussab e
Morettin (2003).
v
capita (PIB/nmero de
parte de baixo, e o terceiro grupo claramente assimtrica em relao
habitantes), uma m-
mdia (que foi distorcida pelo valor discrepante 0). Portanto muito
dia, que no revelava,
cuidado ao caracterizar um conjunto apenas por sua mdia. porm, a concentrao
de renda do pas, levan-
Perodo 3
do a concluses errne-
101
as sobre a qualidade de
vida em muitos pases.
4 Outro aspecto importante a ressaltar que a mdia pode ser
um valor que a varivel no pode assumir. Isso especialmente verda-
de para variveis quantitativas discretas, resultantes de contagem,
UNIDADE
!
brado, 4,3 filhos, por exemplo.
UNIDADE
2 29 11,60%
3 43 17,20%
4 42 16,80%
5 57 22,80%
6 60 24,00%
Total 250 100%
VALORES Xi FREQUNCIA fi f i H fi
1 19 19
2 29 58
3 43 129
4 42 168
5 57 285
6 60 360
Total 250 1019
no veculo.
Perodo 3 103
4 No Exemplo 2 o resultado da mdia um valor (4,076) que a
v
varivel nmero de pessoas usualmente transportadas no pode assu-
Veja nova- mir. Mas, se trata do centro de massa do conjunto
UNIDADE
Mediana (Md)
UNIDADE
tas das trs turmas do Exemplo 1.
TURMA VALORES
A 4 5 5 6 6 7 7 8
B 1 2 4 6 6 9 10 10
C 0 6 6 7 7 7 7,5 7,5
v
o valor da mediana ser calculado atravs da mdia entre os valores
que estiverem na 4 e na 5 posio do conjunto. Por esse motivo os da-
dos precisam estar orde-
Turma A: Md = (6 + 6)/ 2 = 6. nados crescentemente.
Turma B: Md = (6 + 6)/ 2 = 6.
Turma C: Md = (7 + 7)/ 2 = 7.
10 11 12 13 15 16 16 35 60.
v
o MED( ), tal como
sentaria o conjunto seria a mediana. Se a mdia diferente da medi- explicado no texto
ana a distribuio da varivel quantitativa no conjunto de dados Como realizar anlise
dita assimtrica. exploratria de dados no
Microsoft Excel.
Perodo 3 105
4 Tal como a mdia, a mediana pode ser calculada a partir de
uma tabela de frequncias, com as mesmas ressalvas feitas para aquela
medida. Os programas estatsticos, e muitas planilhas eletrnicas dis-
UNIDADE
Moda (Mo)
TURMA VALORES
A 4 5 5 6 6 7 7 8
B 1 2 4 6 6 9 10 10
C 0 6 6 7 7 7 7,5 7,5
UNIDADE
Para alguns autores os quartis no so medidas de posio,
so separatrizes. Porm, como sua forma de clculo semelhante a da
mediana, resolvemos inclu-los no tpico de Medidas de Posio. Os
quartis so medidas que dividem o conjunto em quatro partes iguais.
O primeiro quartil ou quartil inferior (Qi) o valor do con-
junto que delimita os 25% menores valores: 25% dos valores so me-
nores do que Qi e 75% so maiores do que Qi.
O segundo quartil ou quartil do meio a prpria mediana
(Md), que separa os 50% menores dos 50% maiores valores.
O terceiro quartil ou quartil superior (Qs) o valor que de-
limita os 25% maiores valores: 75% dos valores so menores do que
Qs e 25% so maiores do que Qs.
Como so medidas baseadas na ordenao dos dados neces-
srio, primeiramente, calcular as posies dos quartis.
v
Onde n o nmero total de elementos do conjunto.
Aps calcular a posio, encontrar o elemento do conjunto que No Microsoft Excel e
nela est localizado. O conjunto de dados precisa estar ordenado! Se no Br.Office Calc os
o valor da posio for fracionrio deve-se fazer a mdia entre os dois quartis so imple-
valores que esto nas posies imediatamente anterior, e imediata- mentados atravs da
mente posterior posio calculada. Se os dados estiverem dispostos funo QUARTIL( ;1)
em uma distribuio de frequncias, utilizar o mesmo procedimento para quartil inferior, e
observando as frequncias associadas a cada valor (varivel discreta) QUARTIL( ;3) para
ou ponto mdio de classe. quartil superior.
Perodo 3 107
4 V ALORES
4,695 5,750 7,575 12,960 13,805 14,000 15,820 18,275 18,985 18,985
UNIDADE
19,595 19,720 20,600 22,855 22,990 23,685 24,400 24,400 24,685 24,980
24,980 26,775 27,085 27,240 28,340 31,480 40,050 43,150 47,075
UNIDADE
O objetivo das medidas de disperso medir quo prximos
uns dos outros esto os valores de um grupo (e algumas mensuram a
disperso dos dados em torno de uma medida de posio). Com isso
obtido um valor numrico que sintetiza a variabilidade.
TURMA VALORES
A 4 5 5 6 6 7 7 8
B 4 4 4,2 4,3 4,5 5 5 8
Perodo 3 109
4 O intervalo ser o mesmo para ambas as turmas: [4,8] ou 4.
Observe que no Exemplo 7 as duas turmas apresentam o mes-
mo intervalo (4). Mas observando os dados percebemos facilmente
UNIDADE
v
Observamos claramente que os dados da turma A apresentam
No Microsoft Excel e uma disperso bem mais uniforme do que os da turma B, embora am-
no Br.Office Calc po- bos os conjuntos tenham o mesmo intervalo. O intervalo no permite ter
demos obter o Interva- ideia de como os dados esto distribudos entre os extremos (no per-
lo atravs das funes mite identificar que o valor 8 na turma B um valor discrepante).
MXIMO ( ) e MNI- Torna-se necessrio obter outras medidas de disperso, capa-
MO ( ) . zes de levar em conta a variabilidade entre os extremos do conjunto, o
que nos leva a estudar varincia e desvio padro.
Varincia (s2)
UNIDADE
B
sa distino
ser expli-
cada mais
Voc sabe por que preciso elevar os desvios ao
adiante na
quadrado para avaliar a disperso? No podemos
Unidade 7.
apenas somar os desvios dos valores em relao
Po d e m o s
mdia do conjunto? Deixamos como exerccio para
adiantar que
voc os clculos dos desvios (diferena entre cada a utilizao de n 1
valor e a mdia) para as notas das trs turmas des- no denominador indis-
critas no quadro 10, do Exemplo 1. Aps calcular pensvel para que a
os desvios, some-os e veja os resultados. Lembre-se varincia da varivel na
de que a mdia o centro de massa do conjunto. amostra possa ser um
bom estimador da
varincia da varivel na
A unidade da varincia o quadrado da unidade dos dados e, populao.
portanto, o quadrado da unidade da mdia, causando dificuldades
para avaliar a disperso: se por exemplo temos a varivel peso com
mdia de 75 kg em um conjunto e ao calcular a varincia obtemos 12
kg a avaliao da disperso torna-se difcil. No obstante, a varincia
e a mdia so as medidas geralmente usadas para caracterizar as dis-
v
tribuies probabilsticas (que sero vistas adiante, na Unidade 6).
O que podemos afirmar, porm, que quanto maior a varincia, No Microsoft Excel e
mais dispersos os dados esto em torno da mdia (maior a disperso no Br.Office Calc a
do conjunto). varincia populacional
B
obtida atravs da funo
VARP( ), e a varincia
Para fins de Anlise Exploratria de Dados, carac- amostral atravs da fun-
terizar a disperso atravs da varincia no mui- o VAR( ).
to adequado. Costumamos usar a raiz quadrada
positiva da varincia, o desvio padro. Vamos ver
mais sobre isso? Continuemos, ento, a estudar!
Perodo 3 111
4 .
UNIDADE
UNIDADE
elementos no conjunto) so substitudos na frmula para obter os re- ma que os
sultados. programas
Tal como no caso da mdia pode haver interesse em calcular o computa-
desvio padro de variveis quantitativas a partir de distribuies de cionais cal-
frequncias representadas em tabelas. Tal como no caso da mdia os culam o des-
valores da varivel (ou os pontos mdios das classes), e os quadrados vio padro.
desses valores, sero multiplicados por suas respectivas frequncias:
v
Onde xi o valor da varivel ou ponto mdio da classe, fi a
frequncia associada, k o nmero de valores da varivel discreta No Microsoft Excel e
(ou o nmero de classes da varivel agrupada), e n o nmero de no Br.Office Calc po-
elementos do conjunto. demos obter o desvio
Veremos neste oitavo exemplo como calcular o desvio padro padro populacional
da renda para os dados do Exemplo 6. atravs da funo
DESVPADP( ) e amostral
atravs da funo
V ALORES DESVPAD( ).
4,695 5,750 7,575 12,960 13,805 14,000 15,820 18,275 18,985 18,985
19,595 19,720 20,600 22,855 22,990 23,685 24,400 24,400 24,685 24,980
24,980 26,775 27,085 27,240 28,340 31,480 40,050 43,150 47,075
Perodo 3 113
4
UNIDADE
C
Coefi
oefi cien
c ien te de va ria o
Coeficiente de Variao Percentual (c.v.%)
percentual resultado da
diviso do desvio padro O coeficiente de variao percentual uma medida de disper-
pela mdia do conjunto,
so relativa, pois permite comparar a disperso de diferentes distri-
multiplicado por 100, per-
mite avaliar o quanto o des- buies (com diferentes mdias e desvios padres).
vio padro representa da
mdia. Fonte: Barbetta,
Reis e Bornia (2008);
Anderson, Sweeney e Onde s o desvio padro da varivel no conjunto de dados, e
Williams (2007).
a mdia da varivel no mesmo conjunto.
Quanto menor o coeficiente de variao percentual, mais os
dados esto concentrados em torno da mdia, pois o desvio padro
pequeno em relao mdia.
Neste exemplo, vamos calcular o coeficiente de variao
percentual para as notas das turmas do Exemplo 1, e indicar qual das
trs apresenta as notas mais homogneas.
TURMA VALORES
A 4 5 5 6 6 7 7 8
B 1 2 4 6 6 9 10 10
C 0 6 6 7 7 7 7,5 7,5
UNIDADE
Para a turma C: = 6 s = 2,49 c.v.% = (2,49/6) x 100 = 41,55%.
B
tante calcular a mdia e o desvio padro dos valo-
res de uma varivel registrados em um conjunto de
dados? Argumentam que talvez a mediana seja uma
melhor medida de posio, e que os quartis permi-
tem ter uma boa ideia da disperso. Contudo h
um teorema que permite, a partir da mdia e do
desvio padro, obter estimativas dos extremos do
conjunto, especialmente quando se trata de uma
v
amostra: o teorema de Chebyshev, tambm cha-
mado de Desigualdade de Chebyshev. h um pequeno texto
sobre o Teorema de
Chebyshev no ambien-
te virtual.
Perodo 3 115
4
B Recomendamos que voc olhe novamente o oitavo
exemplo da Unidade 3 ver que construmos dis-
tribuies de frequncias agrupadas em classes,
UNIDADE
UNIDADE
Mnimo 29,800
Mximo 86,015
Mdia 50,932
Desvio padro (amostral) 14,922
SpaceShuttle Frequncia 42
Mnimo 18,865
Mximo 47,300
Mdia 33,050
Desvio padro (amostral) 7,620
Valentiniana Frequncia 41
Mnimo 13,055
Mximo 65,390
Mdia 27,353
Desvio padro (amostral) 8,383
Frequncia Total 249
Mnimo Total 1,795
Mximo Total 86,015
Mdia Total 25,105
Desvio padro (amostral) Total 14,505
Perodo 3 117
4 Portanto, o relacionamento entre renda e modelo parece real-
mente existir.
Agora devemos avaliar a disperso da renda em funo dos
UNIDADE
UNIDADE
Deltaforce3 22,064 56 6,956 10,82 48,22 16,575 21,378 26,392
SpaceShuttle 33,05 42 7,62 18,865 47,3 26,62 33,85 39,65
Valentiniana 27,353 41 8,383 13,055 65,39 23,685 25,715 30,13
Chiconaultla 12,705 81 6,038 1,795 40,16 8,88 12,245 15,4
LuxuriousCar 50,932 29 14,922 29,800 86,015 41,89 47,525 58,92
Total 25,105 249 14,505 1,795 86,015 14,095 23,545 32,17
Saiba mais...
Sobre medidas de sntese, assimetria, diagramas em caixa e outros aspectos,
procure em: BARBETTA, Pedro A. Estatstica Aplicada s Cincias Sociais.
7. ed. Florianpolis: Ed. da UFSC, 2007, Captulo 7.
Perodo 3 119
4 Resumindo
r
UNIDADE
UNIDADE
tutoria para tirar dvidas, pois no h outra forma
de aprender a no ser praticando. Na Unidade 5,
veremos os conceitos de Probabilidade, que so
indispensveis para compreender o processo de
inferncia (generalizao) estatstica. Vamos em
frente e timos estudos!!!
Atividades de aprendizagem
aprendizagem
As atividades devem ser feitas usando o Microsoft Excel ou o
Br.Office Calc, atravs do arquivo AmostraToyord.xls que est no
Ambiente Virtual de Ensino-Aprendizagem.
Perodo 3 121
4 design e o marketing dos veculos esto coerentes. Com
base nos resultados da letra a, os dados mostram isso? Jus-
tifique.
UNIDADE
UNIDADE
Conceitos bsicos
UNIDADE
da Probabilidade
D
Objetivo
Nesta Unidade voc compreender os conceitos de
Probabilidade e a importncia do uso do raciocnio
probabilstico para auxiliar o administrador na tomada
de decises em ambiente de incerteza.
Perodo 3 123
5
UNIDADE
UNIDADE
Caro estudante,
B
Nesta Unidade vamos estudar os conceitos bsi-
cos de Probabilidade, tais como Experimento Alea-
trio, Espao Amostral e Eventos, Axiomas e Pro-
priedades, Probabilidade Condicional e Indepen-
dncia Estatstica. Nos EUA h uma anedota que
diz: as nicas coisas que so certas so a morte e
os impostos. Em outras palavras, estamos imersos
na incerteza, e os administradores diariamente pre-
cisam tomar decises, muitas delas, extremamen-
te srias, em um cenrio de grande incerteza:
z lanamos ou no um novo modelo de autom-
vel?
z convertemos nossos fornos de leo combustvel
para gs natural?
z qual ser a reao do nosso pblico s mudan-
as na grade de programao?
Por que h incerteza? Porque a variabilidade ine-
rente natureza impede a compreenso completa
dos fenmenos naturais e humanos. Mas, os seres
humanos precisam tomar decises, assim neces-
srio levar a incerteza em conta no processo: al-
guns apelam para a sabedoria popular, outros para
o mstico. Os administradores precisam tomar de-
cises de forma objetiva, e surge ento a Probabili-
dade como uma das abordagens de tratamento da
incerteza.
A utilizao de mtodos probabilsticos proporcio-
na um grande auxlio na tomada de decises, pois
permite avaliar riscos, e otimizar recursos (sempre
escassos) para as situaes mais provveis. Voc
est convidado a conhecer mais sobre esse tema
nesta Unidade.
Perodo 3 125
5 N
as Unidades 3 e 4 foi utilizado um raciocnio predominante-
mente indutivo. Os dados foram coletados, e atravs da sua
organizao em distribuies de frequncias e medidas de sn-
UNIDADE
UNIDADE
es de ocorrncias das faces de um dado, e se este dado no viciado
espera-se que cada face ocorra em 1/6 do total de lanamentos: se o
v
dado for lanado um grande nmero de vezes isso provavelmente ocor-
rer, mas um resultado diferente poderia ser obtido sem significar que o Para cons-
dado est viciado, principalmente se forem feitos poucos lanamentos. truir ou utili-
Neste ponto, impor tante ressaltar que os modelos zar modelos
probabilsticos no tm razo de ser para fenmenos (experimentos) probabilsticos neces-
no aleatrios (determinsticos): aqueles em que usando teorias e srio que haja um gran-
de nmero de realiza-
frmulas apropriadas pode-se prever exatamente qual ser o seu re-
es do fenmeno (ex-
sultado antes do fenmeno ocorrer, por exemplo, o lanamento de uma
perimento) para que
pedra de 5 kg de uma altura de 10 metros, havendo interesse em
uma regularidade possa
cronometrar o tempo para que ela atinja o cho. Conhecendo o peso
ser verificada: a Lei
da pedra, a altura do lanamento, a acelerao da gravidade e as leis dos Grandes Nmeros.
da fsica, perfeitamente possvel calcular o tempo de queda, no h No incio do Sculo XX o
necessidade sequer de realizar o experimento. estatstico ingls Karl
B
Pearson lanou uma
moeda no viciada
Para prosseguirmos precisamos de algumas defini- 24.000 vezes (!) para
es importantes para estudar os modelos verificar a validade des-
probabilsticos. Precisamos definir exatamente as sa lei: obteve 12.012
condies em que devemos usar modelos caras, praticamente o
probabilsticos, e isso exige saber o que experi- valor esperado (12.000,
mento aleatrio, espao amostral e eventos. Va- 50%).
mos ver?
Definies Prvias
Experimento Aleatrio
Perodo 3 127
5 z quando realizado um grande nmero de vezes (replicado)
apresentar uma regularidade que permitir construir um
modelo probabilstico para analisar o experimento.
UNIDADE
So experimentos aleatrios:
Espao Amostral (S ou )
v
limite superior conhe-
c) O nmero de mensagens que so transmitidas corretamente
cido, mas somente
por dia em uma rede de computadores: = {0, 1, 2, 3, ...}.
possvel a ocorrncia de
valores inteiros.
UNIDADE
No h um
de veculo: = {0, 1, ...} limite supe-
rior e, teori-
O espao amostral pode ser: camente,
pode haver
z finito, formado por um nmero limitado de resultados pos- uma infinida-
sveis, como nos casos a e b; de de valores.
Eventos
v
cular a probabilidade de que um determinado evento venha a ocorrer,
e esse evento pode ser definido de forma verbal, precisando ser tradu- Embora nem todos os
zido para as definies da Teoria de Conjuntos, que veremos a seguir. autores concordem com
Seja o Experimento Aleatrio lanamento de um dado no vi- essa abordagem, ela au-
ciado e observao da face voltada para cima: o seu espao amostral xilia bastante na com-
ser = {1, 2, 3, 4, 5, 6}. preenso dos conceitos.
E1 = {2, 4, 6};
E2 = {3, 4, 5, 6}; e
E3 = {1, 3}.
Perodo 3 129
5 sero apresentadas as definies de Evento Unio, Evento
Interseco, Eventos Mutuamente Exclusivos e Evento Com-
plementar.
UNIDADE
E1 E2 = {2, 3, 4, 5, 6}.
UNIDADE
podem ocorrer simultaneamente, no apresentando elementos em co-
mum (sua interseco o conjunto vazio).
Dentre os trs eventos definidos acima, observamos que os even-
tos E1 e E3 no tm elementos em comum:
E3 = {1, 3} E1 = {2, 4, 6} E1 E3 = E1 e E 3 so
mutuamente exclusivos.
Evento Complementar de um evento qualquer formado por
todos os resultados do espao amostral que no pertencem ao evento.
A unio de um evento e seu complementar formar o prprio Espao
Amostral, e a interseco de um evento e seu complementar o con-
junto vazio.
Ei Ei = Ei E i =
E1 = {2, 4, 6} E1 = {1, 3, 5}
E2 = {3, 4, 5, 6} E2 = {1, 2}
Perodo 3 131
5 Definies de Probabilidade
UNIDADE
v
amigo. O vencedor ser aquele que acertar a face que ficar para cima
Usaremos o termo aps o lanamento de uma moeda honesta. Qual a chance de
moeda honesta para voc ganhar?
referenciar uma moeda Intuitivamente voc responderia que h 50% (1/2) de chances
perfeitamente equili- de ganhar, uma vez que h apenas duas faces (resultados) possveis.
brada e lanamentos Mesmo sem saber o que probabilidade voc pode calcular a chance
imparciais. De forma de ocorrncia de um evento de interesse, a face na qual voc apostou.
anloga, usaremos o
Voc continua apostando com o mesmo amigo. O vencedor
adjetivo honesto para
agora ser aquele que acertar o naipe de uma carta que ser retirada
dado, baralho, entre
ao acaso de um baralho comum de 52 cartas. Veremos neste segundo
outros.
exemplo qual a chance de voc ganhar?
Novamente, de forma intuitiva voc responderia que h 25%
(1/4) de chance, uma vez que h apenas quatro naipes (resultados)
possveis.
O que h em comum entre as situaes dos exemplos 1 e 2?
Refletindo um pouco voc observar que em ambos temos experimen-
tos aleatrios. A cada realizao do experimento apenas um dos re-
sultados possveis pode ocorrer. Alm disso, como se supe que a
moeda e o baralho so honestos, cada um dos resultados possveis
tem a mesma probabilidade de ocorrer: tanto cara quanto coroa pos-
suem 50% de chance de ocorrer, todos os quatro naipes (copas, espa-
UNIDADE
Se um experimento aleatrio puder resultar em n diferentes e
igualmente provveis resultados, e nEi destes resultados referem-se ao
evento E i, ento a probabilidade do evento Ei ocorrer ser:
a) Face 1.
b) Face par.
c) Face menor ou igual a 2.
Perodo 3 133
5 dados e roletas, marcavam baralhos, de maneira a fazer com que os
clientes perdessem sistematicamente, ou seja, o lanamento dos da-
dos ou a retirada da carta do baralho no eram mais experimentos
UNIDADE
aleatrios.
O segundo problema decorre da pergunta: ser que em todos
os experimentos aleatrios todos os eventos tero a mesma probabili-
dade de ocorrer? Ser que a probabilidade de chover no ms de no-
vembro na cidade de Brest (na Frana, que tem, em mdia, 225 dias
nublados por ano), a mesma na cidade de Sevilha (na Espanha, que
tem, em mdia, 240 dias de sol por ano)? Precisamos partir para a
definio experimental de probabilidade.
UNIDADE
nio axiomtica da Probabilidade.
Seja um experimento aleatrio e um espao amostral associa-
do a ele. A cada evento Ei associaremos um nmero real denominado
P(Ei) que deve satisfazer os seguintes axiomas:
a) 0 P(Ei) 1,0:
A probabilidade de ocorrncia de um evento sempre um
nmero real entre 0 e 1 (0% e 100%);
b) P () = 1,0:
A probabilidade de ocorrncia do Espao Amostral igual
a 1 (100%) pois pelo menos um dos resultados do Espao
Amostral ocorrer. Por isso o Espao Amostral chamado
de Evento Certo; e
c) Se E1, E2, ..., E n so eventos mutuamente exclusivos, ento
P(E1 E2 ... En) = P(E1) + P(E2) + ... + P(En):
Esse axioma afirma que ao unir resultados diferentes, de-
vemos somar as probabilidades.
Perodo 3 135
5 das probabilidades de todos os outros eventos do Espao
Amostral); e
d) Sejam Ei e Ej dois eventos quaisquer: P (Ei E j ) = P(Ei)
UNIDADE
a) Complementar de E1;
b) Complementar de E2;
c) Unio de E2 e E3; e
d) Unio de E1 e E2.
B
trabalha em uma corretora de aes e precisa acon-
selhar um cliente sobre investir ou no em aes
5
UNIDADE
da PETROBRS. Supe-se que o preo do barril
do petrleo subir cerca de 10% nos prximos dias,
h uma probabilidade estimada de acontecer. E,
sabendo disso, voc gostaria de saber qual a
probabilidade de que as aes da empresa subam
tambm 10% na BOVESPA. Este caso, em que
queremos calcular a probabilidade de ocorrncia
de um evento condicionada ocorrncia de outro,
somente poder ser resolvido por Probabilidade
Condicional, que veremos a seguir.
Probabilidade Condicional
v
cia de B ser igual probabilidade da interseco entre A e B, dividi-
da pela probabilidade de ocorrncia de B (o evento que j ocorreu). No denominador da ex-
Se houvesse interesse no oposto, probabilidade de ocorrncia presso colocada
de B condicionada ocorrncia prvia de A: sempre a probabilida-
de do evento que j
ocorreu.
.
Perodo 3 137
5 Neste caso o valor no denominador seria a probabilidade de A
uma vez que esse evento ocorreu previamente, tal como B na outra
expresso. importante ressaltar que a operao de interseco
UNIDADE
UNIDADE
Primeiramente definir o nmero de resultados do Espao
Amostral que pertencem aos eventos de interesse, para que seja pos-
svel calcular a sua probabilidade usando a definio clssica de pro-
babilidade:
E1 = {(1,1) (2,2) (3,3) (4,4) (5,5) (6,6)} faces iguais, 6 resultados, nE1 = 6.
E2 = {(1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (3,1) (3,2) (4,1)} soma
das faces 5, 10 resultados, nE2 = 10.
Os elementos em comum formaro o evento interseco:
E1 E 2 = {(1,1) (2,2)} faces iguais e soma das faces 5, 2 resulta-
dos, nE1 E2 = 2.
P(E2) = nE2 / n = 10/36 P(E1 E2) = nE1 E2/ n = 2/36
Tendo as probabilidades acima possvel calcular a probabili-
dade condicional:
novo = {(1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (3,1) (3,2) (4,1)}
Perodo 3 139
v
5 Houve
uma mu-
soma menor ou igual a 5, supondo que j ocorreram faces que so
iguais; chamando o evento faces iguais de E1 e o evento soma das
faces menor ou igual a 5 de E2 estamos procurando P(E2|E1), proba-
UNIDADE
!
anteriormente.
UNIDADE
Uma das consequncias da expresso da probabilidade condi-
cional a regra do produto, isolando a probabilidade da interseco:
v
.
Perodo 3 141
5 z a 1 bola vermelha e a 2 bola vermelha (duas bolas da
mesma cor) evento E4 = V1 V2.
UNIDADE
v
z a probabilidade de retirar uma bola branca na 2 retirada
Repare que o nmero se na 1 foi extrada uma branca de 1/4 (1 bola branca
de bolas, nmero de em 4), P(B 2| B1) = 1/4.
resultados, diminuiu
z a probabilidade de retirar uma bola vermelha na 2 retira-
de 5 para 4 porque as
da se na 1 foi extrada uma branca de 3/4 (3 bolas ver-
retiradas so feitas sem
melhas em 4), P(V 2| B 1) = 3/4.
reposio.
UNIDADE
(V1 V2)].
Usando as propriedades de probabilidade:
P(F) = P [(B1 B2) (V1 V2)]= P(B1 B2) + P(V1 V2) P (B1 B2)
(V 1 V2).
Os eventos (B1 B2) e (V1 V2) so mutuamente exclusivos, se
as bolas so da mesma cor ou so brancas ou so vermelhas, ento a
interseco entre eles o conjunto vazio, e a probabilidade do conjun-
to vazio ocorrer igual a zero, ento simplesmente: P(F) = P [(B1 B2)
(V 1 V2)]= P(B1 B2) + P(V 1 V2).
Usando a regra do produto:
Substituindo na expresso:
P(F) = P [(B1 B2) (V1 V2)]= P(B1 B2) + P(V1 V2) = 1/10 +
3/10 = 4/10 = 0,4 (40%).
Perodo 3 143
5 (V 1 V2) [(B1 B2) (V1 V2)] = (V1 V2);
P{(V1 V2) [(B1 B2) (V1 V2)]} = P (V1 V2) = 3/10.
UNIDADE
UNIDADE
probabilidades condicionais para cada caso, e depois substitu-las nas
frmulas adequadas. Contudo, a rvore ser intil se o evento para o
qual se deseja calcular a probabilidade no for definido adequadamen-
te: neste caso, no item a, bolas da mesma cor [(B1 B2) (V1 V2)], e
no item b, bolas vermelhas sabendo que so da mesma cor {(V1 V2)
| [(B1 B2) (V1 V2)]}.
A rvore ser igualmente intil se no forem usadas as defini-
es de eventos dependentes (porque no h reposio) e de eventos
mutuamente exclusivos (porque os eventos no podem ocorrer simul-
taneamente), e as expresses de probabilidade condicional e os axio-
mas de probabilidade.
O grande inconveniente da rvore de Probabilidades surge
quando o nmero de retiradas aumenta e/ou o nmero de resulta-
dos possveis para cada retirada considervel: torna-se impraticvel
desenhar a rvore, enumerando todos os resultados. Nesses casos
usamos Anlise Combinatria, que veremos adiante.
Perodo 3 145
5 Se A e B so independentes ento:
!
P (A B) = P(B) H P(A|B) = P(B) H P(A)
Saiba mais...
Sobre conceitos bsicos de Probabilidade, BARBETTA, Pedro A. Estatstica
Aplicada s Cincias Sociais. 7. ed. Florianpolis: Editora da UFSC, 2007,
Captulo 7.
UNIDADE
O resumo desta Unidade est mostrado na Figuras 35:
Perodo 3 147
5
B Chegamos ao final de Unidade 5. Esperamos que
voc tenha aprendido todos os conceitos trabalha-
dos e com os exemplo propostos, tenha colocado
UNIDADE
Atividades de aprendizagem
aprendizagem
1) Numa eleio para a prefeitura de uma cidade, 30% dos eleitores
pretendem votar no candidato A, 50% no candidato B e 20% em
branco ou nulo. Sorteia-se um eleitor na cidade e verifica-se o can-
didato de sua preferncia.
a) Construa um modelo probabilstico para o problema.
b) Qual a probabilidade de o eleitor sorteado votar em um
dos dois candidatos? (R.: 0,8)
Adaptado de BARBETTA, Pedro A. Estatstica Aplicada s Cincias
Sociais. 7. ed. Florianpolis: Ed. da UFSC, 2007.
UNIDADE
b) Ambas as cartas so de paus. (R.: 0,058)
c) Ambas as cartas so de Figuras (s, rei, dama ou valete).
(R.: 0,0905)
d) Uma carta de paus e outra de copas. (R.: 0,1274)
Adaptado de STEVENSON, W.J. Estatstica Aplicada Administra-
o, So Paulo: Harper do Brasil, 1981, pgina 76.
3) Repita o exerccio 2 supondo que as retiradas fossem feitas COM
reposio.
Adaptado de STEVENSON, W.J. Estatstica Aplicada Administra-
o, So Paulo: Harper do Brasil, 1981, pgina 75.
a) R.: 0,25 b) R.: 0,0625
c) R.: 0,0947 d) 0,125
4) Para um determinado telefone a probabilidade de se conseguir linha
de 0,75 em dias normais e 0,25 em dias de chuva. A probabilida-
de de chover em um dia 0,1. Alm disso tendo-se conseguido li-
nha, a probabilidade de que um nmero esteja ocupado 11/21.
a) Qual a probabilidade de que um telefone tenha sua liga-
o completada? (R.: 0,333)
b) Dado que um telefonema foi completado, qual a probabi-
lidade de estar chovendo? (R.: 0,0357)
Perodo 3 149
Variveis aleatrias
6
UNIDADE
D
Objetivo
Nesta Unidade voc compreender o conceito de
varivel aleatria e seu relacionamento com os
modelos probabilsticos. Aprender tambm que os
modelos probabilsticos podem ser construdos para
as variveis aleatrias.
6
UNIDADE
UNIDADE
Caro estudante!
Uma pergunta que normalmente feita a todos
que trabalham com cincias exatas: por que a
obsesso em reduzir tudo a nmeros? Vimos em
Anlise Exploratria de Dados que uma varivel
B
quantitativa, geralmente, porque nem tudo pode
ser reduzido a nmeros, como a inteligncia e a
criatividade, apresenta mais informao que uma
varivel qualitativa, pode ser resumida no somen-
te atravs de tabelas e grficos, mas tambm atra-
vs de medidas de sntese.
Nos exemplos sobre probabilidade apresentados na
Unidade 5 os eventos foram geralmente definidos
de forma verbal: bolas da mesma cor, 2 bolas ver-
melhas, soma das faces menor ou igual a 5, etc.
No haveria problema em definir os eventos atravs
de nmeros. Bastaria associar aos resultados do Es-
pao Amostral nmeros, atravs de uma funo.
Essa funo chamada de Varivel Aleatria. Os
modelos probabilsticos podem ento ser
construdos para as variveis aleatrias. O admi-
nistrador precisa conhecer esses conceitos porque
eles proporcionam maior objetividade na obteno
das probabilidades, o que torna o processo de to-
mada de decises mais seguro. Vamos conhecer
esses conceitos nesta Unidade?
Espao Amostral o
U
ma definio inicial de Varivel Aleatria poderia ser: trata-se conjunto de todos os re-
sultados possveis de um
de uma varivel quantitativa, cujo resultado (valor) depende experimento aleatrio.
de fatores aleatrios. Fonte: Barbetta, Reis e
Bornia (2008).
Formalmente, Varivel Aleatria uma funo matemtica
que associa nmeros reais (contradomnio da funo) aos resultados
de um Espao Amostral (domnio da funo), por sua vez vinculado a
um Experimento Aleatrio. Se o Espao Amostral for finito ou infinito
Perodo 3 153
6 numervel a varivel aleatria dita discreta. Se o Espao Amostral
for infinito a varivel aleatria dita contnua.
UNIDADE
UNIDADE
Podemos ver alguns exemplos de variveis aleatrias discretas:
X= XI P (X = X I)
x1 p(x1)
x2 p(x2)
... ...
xn p(xn )
Perodo 3 155
6 se ele tiver errado a anterior a probabilidade de ele acertar uma co-
brana cai para 30%. Construa a distribuio de probabilidades do
nmero de acertos em 3 tentativas de cobrana.
UNIDADE
X = 0 [E1 E2 E3]
X = 1 [(A1 E2 E3) (E1 A2 E3) (E1 E2 A3)]
X = 2 [(A1 A2 E3) (E1 A2 A3) (A 1 E2 A3)]
X = 3 [A 1 A2 A3]
Ento:
UNIDADE
P(X=3) = P[A 1 A2 A3]
v
Assume-se que na primeira tentativa o jogador tem 50% de E 1 , errar a
chance de acertar, ento: P(A1) = 0,5 e P(E1) = 0,5. primeira co-
Alm disso, estabeleceu-se que quando o jogador acertou a brana, o
cobrana na tentativa anterior a probabilidade de acertar a prxima evento com-
de 0,6, e caso tenha errado na anterior a probabilidade de acertar na plementar de
A 1, acertar a primeira
prxima de apenas 0,3. Tratam-se de duas probabilidades condicio-
cobrana.
nais, estabelecidas em funo de eventos j ocorridos.
Se o jogador acertou na tentativa i (qualquer uma), as probabi-
lidades de acertar e errar na prxima tentativa sero: P(Ai+1|Ai) = 0,6.
Pelo complementar obtm-se P(Ei+1|Ai) = 0,4.
Se o jogador errou na tentativa i, as probabilidades de acertar
e errar na prxima tentativa sero: P(Ai+1|Ei) = 0,3
Pelo complementar obtm-se P(Ei+1|Ei) = 0,7.
Com essas probabilidades estabelecidas, lembrando da regra
do produto, e considerando o fato de que os eventos so mutuamente
exclusivos possvel calcular as probabilidades de ocorrncia de cada
valor da varivel aleatria X.
Perodo 3 157
6 P(X=1) = 0,50,4 0,7 + 0,5 0,3 0,4+ 0,5 0,7 0,3 = 0,305
P(X=2) = P(A1 A2 E3)+ P(E1 A2 A3) + P(A1 E2 A3)
P(X=2)
UNIDADE
=P(A1)P(A2|A1)P(E3|A2)+P(E1)P(A2|E1)P(A3|A2)+P(A1)P(E2|A1)P(A3|E2)
P(X = 2) = 0,5 0,6 0,4 +0,5 0,3 0,6 + 0,5 0,4 0,3 = 0,27
(27%)
P(X=3) = P[A1 A2 A3] = P(A1) P(A2|A1) P(A 3|A 2) = 0,5
0,6 0,6 = 0,18 (18%)
X P (X = X I)
0 0,245
1 0,305
2 0,270
3 0,180
Total 1,0
UNIDADE
Podemos ver alguns exemplos de variveis aleatrias contnu-
as:
Perodo 3 159
6 de interesse. Em muitas situaes de nosso interesse tais probabilida-
des podem ser calculadas atravs de frmulas matemticas relativa-
mente simples, ou foram dispostas em tabelas, que so encontradas
UNIDADE
UNIDADE
rao de propostas. Suponha que os valores de uma varivel aleat-
ria sejam lucros, ou prejuzos, advindos de decises tomadas, por exem-
plo, decidir por uma proposta de compra do cliente A, ou do cliente B.
Associados aos valores h probabilidades, como decidir qual a mais
vantajosa? O clculo do valor esperado possibilita uma comparao
objetiva: decidiramos pela que apresentasse o lucro esperado mais
elevado. H um campo de conhecimento que se ocupa especificamente
de fornecer as ferramentas necessrias para tais tomadas de deciso: a
teoria estatstica da deciso ou anlise estatstica da deciso.
O valor esperado (mdia) e a varincia apresentam algumas
propriedades, tanto para variveis aleatrias discretas quanto cont-
nuas. O seu conhecimento facilitar muito a obteno das medidas
em problemas mais sofisticados.
Para o valor esperado E(X), sendo k uma constante:
Perodo 3 161
6 b) V(k X) = V(X) A varincia de uma constante somada a
uma varivel aleatria igual apenas varincia da vari-
vel aleatria.
UNIDADE
X P (X = X I) XI H P (X = XI) XI2 P (X = X I)
0 0,245 0 0
1 0,305 0,305 0,305
2 0,270 0,540 1,08
3 0,180 0,540 1,62
Total 1,0 1,385 3,005
UNIDADE
quase do valor da mdia (valor esperado).
Saiba mais...
Sobre Variveis Aleatrias, BARBETTA, Pedro A.; REIS, Marcelo M.;
BORNIA, Antonio C. Estatstica para Cursos de Engenharia e Informtica.
2. ed. So Paulo: Atlas, 2008, Captulos 5 e 6.
Sobre teoria estatstica da deciso: BEKMAN, Oto R.; COSTA NETO, Pedro
O. Anlise Estatstica da Deciso. So Paulo: Edgard Blcher, 1980, 4.
r
reimpresso, 2006.
Resumindo
O resumo desta Unidade est demonstrado na Figura 39:
Perodo 3 163
6
UNIDADE
UNIDADE
do estudarmos vrias distribuies de probabilida-
de (modelos probabilsticos) que so extremamente
teis para modelar muitas situaes prticas, auxi-
liando na tomada de decises. Esses conhecimen-
tos sero depois aplicados nas Unidades 8 e 9.
Atividades de aprendizagem
aprendizagem
1) Trs alunos esto tentando independentemente resolver um proble-
ma. A probabilidade de que o aluno A resolva o problema de 4/5,
de B resolver de 2/3 e de C resolver de 3/7. Seja X o nmero de
solues corretas apresentadas para este problema.
a) Construa a distribuio de probabilidades de X. (R.: 0,038;
0,257; 0,476; 0,228); e
b) Calcule E(X) e V(X). (R.: 1,893; 0,630).
2) Um prdio possui 3 vigias dispostos em vrios pontos de onde tm
viso do porto de entrada. Se algum no autorizado entrar, o vigia
que o v faz soar um alarme. Suponha que os vigias trabalham inde-
pendentemente entre si, e que a probabilidade de que cada um de-
les veja uma pessoa entrar 0,8. Seja X o nmero de alarmes que
soam ao entrar uma pessoa no autorizada. Encontre a distribuio
de probabilidades de X. (R.: 0,008; 0,096; 0,384; 0,512)
Perodo 3 165
6
UNIDADE
UNIDADE
Modelos probabilsticos
UNIDADE
mais comuns
D
Objetivo
Nesta Unidade voc conhecer os modelos
probabilsticos mais importantes para variveis
aleatrias discretas e contnuas e aprender a
identificar as situaes reais em que eles podem ser
usados para o clculo de probabilidades e a
importncia disso para o administrador.
Perodo 3 167
7
UNIDADE
UNIDADE
Nas Unidades 5 e 6 vimos os conceitos gerais de
B
Probabilidade e Variveis Aleatrias: podemos cons-
truir um modelo probabilstico do zero para um pro-
blema de administrao, a partir de dados histri-
cos ou experimentais.
Embora plenamente possvel, o processo de cons-
truo de um modelo probabilstico do zero pode
ser bastante longo: preciso coletar os dados (ver
Unidades 1 e 2), fazer a anlise exploratria deles
(ver Unidades 3 e 4), obter as probabilidades e
validar o modelo. Mesmo tomando todos os cuida-
dos, muitas vezes iremos reinventar a roda, e cor-
rendo o risco de ela sair quadrada...
Por que no usar os conhecimentos prvios desen-
volvidos ao longo de centenas de anos de pesqui-
sa e experimentao? Vamos procurar, dentre os
vrios modelos probabilsticos existentes aquele
mais apropriado para o fenmeno que estamos es-
tudando, que materializado atravs de variveis
aleatrias.
Atravs da anlise exploratria de dados podemos
avaliar qual modelo mais apropriado para os nos-
sos dados. Contudo, para fazer isso precisamos
conhecer tais modelos.
Nesta Unidade vamos estudar os modelos mais
usados para variveis aleatrias discretas (binomial Varivel aleatria
e Poisson), e para variveis aleatrias contnuas uma funo matemtica que
associa nmeros reais aos
(uniforme, normal, t e quiquadrado). resultados de um Espao
Amostral, por sua vez vin-
culado a um Experimento
Aqui importante avaliar com cuidado a varivel aleatria dis- Aleatrio. Fonte: Barbetta,
Reis e Bornia (2008).
creta.
Perodo 3 169
7 preciso identificar se o Espao Amostral finito ou
infinito numervel alguns modelos so apropriados para um caso
e no para o outro.
UNIDADE
UNIDADE
a) Observar o nmero de caras em 3 lanamentos imparciais
de uma moeda honesta: n=3; p=0,5.
b) Observar o nmero de meninos nascidos em 3 partos de
uma famlia: n=3; p = x.
c) Observar o nmero de componentes defeituosos em uma
amostra de 10 componentes de um grande nmero de pe-
as que apresentaram anteriormente 10% de defeituosos:
n = 10; p= 0,1.
= {H
H
H, H
H
M, H
M
H, M
H
H, H
M
M,
M H
M, M
M
H, M
M
M}.
Perodo 3 171
7 Observe que:
lidade de 2 sucessos.
P{HMM} = P{MHM} = P{MMH} = p H(1 p)2 = Proba-
bilidade de 1 sucesso.
v
Importa apenas a natureza dos sucessos, no a ordem em
que ocorrem: com a utilizao de combinaes. possvel obter o
Em qualquer livro de nmero de resultados iguais para cada nmero de sucessos. Supondo
matemtica do ensino que o nmero de ensaios n o nmero de objetos disponveis, e que
mdio possvel en- o nmero de sucessos em que estamos interessados (doravante cha-
contrar a definio e os mado k) o nmero de espaos onde colocar os objetos (um objeto
exemplos de combina- por espao), o nmero de resultados iguais ser:
es.
.
UNIDADE
Para cada entrega (ensaio) h apenas dois resultados: no prazo
ou no. H um nmero limitado de realizaes, n = 3. Definindo su-
cesso como no prazo, e supondo as operaes independentes, a vari-
vel aleatria X, nmero de entregas no prazo em 3 ter distribuio
binomial com parmetros
n = 3 e p = 0,82 (e 1p = 0,18).
Ento:
v
Somando todas as probabilidades o resultado igual a 1, Lembre-se que a soma
como teria que ser. O Valor Esperado, Varincia e o Desvio Padro das probabilidades de
sero: todos os eventos que
compem o Espao
E(X) = n H p = 3 H 0,82 = 2,46 entregas. Amostral igual a 1. E
V(X) n H p H (1p) = 3 H 0,82 H 0,18 = 0,4428 entregas. que 0! = 1, e que um
nmero diferente de 0
(X) = V(X) = 0,4428 = 0,665 entregas.
elevado a zero igual a
A mdia quase igual ao nmero de operaes devido alta 1.
probabilidade de sucesso.
m = H t,
v
onde uma taxa de ocorrncia do evento em um perodo contnuo
Apesar do smbolo t, o (igual ou diferente do perodo sob anlise), e t justamente o perodo
perodo contnuo no contnuo sob anlise.
necessariamente um Como obter a taxa ? H duas opes: realizar um nmero
intervalo de tempo. suficiente de testes de laboratrio para obter a taxa de ocorrncia do
evento a partir dos resultados, ou observar dados histricos e calcular
a taxa.
Se uma varivel aleatria discreta X, nmero de ocorrncias
de um evento, segue a distribuio de Poisson, a probabilidade de X
assumir um valor k ser:
E(X) = m = H t
V(X) = m = H t
UNIDADE
Vejamos neste exemplo os experimentos e fenmenos que se-
guem a distribuio de Poisson:
Perodo 3 175
7 Neste exemplo uma telefonista recebe cerca de 0,20 chamadas
por minuto (valor obtido de medies anteriores).
UNIDADE
UNIDADE
minutos). Primeiro calcula-se a varincia:
V(X) = m = H t = 0,2 H 30 = 6 chamadas
O Desvio Padro a raiz quadrada positiva da varincia:
(X) = V(X) = 6 2,45 entregas.
B
relembrar a definio clssica de probabilidade: a
probabilidade de ocorrncia de um evento ser
igual ao quociente entre o nmero de resultados
Perodo 3 177
7
B associados ao evento pelo nmero total de resulta-
dos possveis. Ora, se o nmero total de resultados
UNIDADE
UNIDADE
lidades for tal como a da Figuras 49.
A probabilidade de que a varivel assuma valores entre c e d
(sendo a < c < d < b), a rea compreendida entre c e d:
v
do um modelo probabilstico contnuo adequado.
O modelo uniforme bastante usado para gerar nmeros No ambiente virtual te-
pseudo-aleatrios em processos de amostragem probabilstica. mos um exemplo resol-
vido de modelo unifor-
B
me, adaptado de
Agora vamos passar ao modelo mais importante BUSSAB, Wilton O.;
para variveis aleatrias contnuas. MORETTIN, Pedro A.
Estatstica Bsica.
5. ed. So Paulo: Sarai-
va, 2003.
Modelo normal
v
menores ou maiores) o modelo probabilstico contnuo mais adequa-
do seja o modelo Normal ou gaussiano. O matemtico alemo
Isso especialmente encontrado em variveis biomtricas, re- Gauss utilizou ampla-
sultantes de medidas corpreas em seres vivos. mente este modelo no
tratamento de erros ex-
O Modelo Normal extremamente adequado para medidas
perimentais, embora
numricas em geral, descrevendo vrios fenmenos, e permitindo fa-
no tenha sido o seu
zer aproximaes de modelos discretos. extremamente importante
descobridor.
Perodo 3 179
7 tambm para a Estatstica Indutiva (mais detalhes na prxima Unida-
de). O grfico da distribuio de probabilidades de uma varivel ale-
atria contnua que siga o modelo Normal (distribuio Normal) ser
UNIDADE
Caractersticas:
A curva apresenta forma de sino, h maior probabilidade da
varivel assumir valores prximos do centro.
Os valores de mdia () e de mediana (Md) so iguais, signifi-
cando que a curva simtrica em relao mdia.
Teoricamente a curva prolonga-se de 4 a +4 (menos infinito
a mais infinito), ento a rea total sob a curva igual a 1 (100%).
v
Qualquer distribuio normal perfeitamente especificada por
comum a utilizao seus parmetros mdia ( ) e varincia (
) X: N (
, ) significa
de letras do alfabeto que a varivel X tem distribuio normal com mdia e varincia .
grego para representar A rea escura na Figura 41 a probabilidade de uma varivel
algumas medidas. No que siga a distribuio normal assumir valores entre a e b: esta rea
se esquea que o des- calculada atravs da integral da funo normal de a a b.
vio padro () a raiz Cada combinao ( , ) resulta em uma distribuio Normal
quadrada positiva da diferente, portanto h uma famlia infinita de distribuies.
varincia.
A funo normal citada acima tem a seguinte (e aterradora...)
frmula para sua funo densidade de probabilidade:
UNIDADE
quando implementados manualmente (somente viveis se usarem
meios computacionais). De Moivre, Laplace e Gauss desenvolveram Gauss, e to-
seus trabalhos entre a metade do Sculo XVIII e incio do Sculo XIX, das as outras
e os computadores comearam a se popularizar a partir da dcada de pessoas que
60, do Sculo XX. usavam a dis-
Porm todas as distribuies normais apresentam algumas ca- tribuio Nor-
mal para calcular proba-
ractersticas em comum, independentemente de seus valores de mdia
bilidades at recente-
e de varincia:
mente, resolviam as in-
z 68% dos dados esto situados entre a mdia menos um tegrais usando mtodos
) e a mdia mais um desvio padro
desvio padro ( numricos manualmente.
+ );
(
z 95,5% dos dados esto situados entre a mdia menos dois
2
desvios padres ( ) e a mdia mais dois desvios pa-
+ 2
dres ( );
z 99,7% dos dados esto situados entre a mdia menos trs
3
desvios padres ( ) e a mdia mais trs desvios pa-
+ 3
dres ( ).
Perodo 3 181
7 em uma tabela. Atravs de uma transformao de variveis chamada
padronizao possvel converter os valores de qualquer distribuio
Normal em valores da distribuio Normal padro e assim obter suas
UNIDADE
UNIDADE
Primeiro, calculamos o valor de Z correspondente a 55. Z = (55
50)/ 10 = + 0,5.
Pelas Figuras 44 e 45 podemos ver a correspondncia entre as
duas distribuies:
Perodo 3 183
7 0,00 (na linha do topo) encontramos o valor 0,3085 (30,85%). Por-
tanto, P(X>55) igual a 0,3085. Observe a coerncia entre o valor
encontrado e as reas na Figuras: a rea menor do que a metade da
UNIDADE
UNIDADE
Figura 48: Distribuio normal padro.
Fonte: elaborada pelo autor.
Perodo 3 185
7
UNIDADE
UNIDADE
Z1 = (48 50)/ 10 = 0,20 Z2 = (56 50)/ 10 = 0,60
P(48 < X < 56) = P(X > 48) P(X > 56)= P(-0,20< Z <0,60) =
P(Z > 0,20) P(Z > 0,60)
Perodo 3 187
7 preciso encontrar os valores de Z (na tabela da distribuio
Normal padro) correspondentes s probabilidades da Figuras aci-
ma, e a partir da obter os valores de x1 e x2. Passando para a distri-
UNIDADE
v
.
UNIDADE
abaixo da mdia (1,96 desvios padres) e 69,6 acima (tambm 1,96
desvios padres). O intervalo definido por esses dois valores compre-
ende 95% dos resultados da varivel X.
Todo esse trabalho poderia ter sido poupado se houvesse um
programa computacional que fizesse esses clculos. H vrios softwares
disponveis no mercado, alguns deles de domnio pblico, que calcu-
lam as probabilidades associadas a determinados eventos, como tam-
bm os valores associados a determinadas probabilidades. Modelo binomial mo-
Uma das caractersticas mais importantes do modelo normal delo probabilstico para va-
riveis aleatrias discretas
a sua capacidade de aproximar outros modelos, permitindo muitas
que descreve o nmero de
vezes simplificar os clculos de probabilidade. Na prxima seo va- sucessos em n experimen-
mos ver como o modelo normal pode ser usado para aproximar o tos independentes (sendo n
finito e conhecido), sendo
binomial.
que os experimentos podem
ter apenas dois resultados
possveis, e a probabilida-
Modelo normal como aproximao do de de sucesso permanece
v
z quando o valor de n (nmero de ensaios) for tal que os
clculos binomiais trabalhosos demais.
Para os que pensam que
z quando o produto n p (o valor esperado do modelo o advento dos computa-
Binomial) e o produto n (1 p) forem ambos maiores dores eliminou este pro-
ou iguais a 5. blema um alerta: em al-
guns casos os nmeros
Se isso ocorrer, uma binomial, de parmetros n e p, pode ser envolvidos so to gran-
aproximada por uma normal com: des que sobrepujam
suas capacidades.
z mdia = = n p (valor esperado do modelo
Binomial); e
z varincia = 2 = n p (1 p) (varincia do mo-
delo Binomial).
Perodo 3 189
7 centrado no valor discreto, e deve ter uma amplitude igual diferena
entre dois valores consecutivos da varivel discreta: se por exemplo a
diferena for igual a 1 (a varivel somente pode assumir valores intei-
UNIDADE
ros) o intervalo deve ter amplitude igual a 1, 0,5 abaixo do valor e 0,5
acima. Esta correo de continuidade precisa ser feita para
garantir a coerncia da aproximao.
Seja uma varivel aleatria X com distribuio Binomial.
UNIDADE
Figura 56: Correo de continuidade da aproximao do modelo Binomial
pelo Normal 3 caso.
Fonte: elaborada pelo autor.
Perodo 3 191
7 Esse problema poderia ser resolvido usando o modelo Binomial.
H apenas dois resultados possveis para cada eleitor: menor de 25
anos (sucesso) e maior ou igual a 25 anos (fracasso). Existe um
UNIDADE
B
probabilsticos derivados do modelo normal, usados
predominantemente em processos de inferncia es-
7
UNIDADE
tatstica. Vamos introduzi-los agora para facilitar nos-
so trabalho quando chegarmos s Unidades 9 e 10.
v
maior, podendo levar a
Assim, a estatstica ter n 1 graus de liberdade.
intervalos de confiana
Trata-se de uma distribuio de probabilidades que apresenta que no correspondem
mdia igual a zero (como a normal padro), simtrica em relao realidade. A no utiliza-
mdia, mas apresenta uma varincia igual a n/(n 2), ou seja, seus o desta correo foi a
valores dependem do tamanho da amostra, apresentando maior fonte de muitos erros no
varincia para menores valores de amostra. Quanto maior o tamanho passado, e, infelizmen-
te, de ainda alguns er-
ros no presente.
Perodo 3 193
v
7 Para tama-
nhos de
da amostra mais a varincia de t aproxima-se de 1,00 (varincia da
normal padro). A distribuio t de Student est na Figura 59 para
vrios graus de liberdade:
UNIDADE
amostra
maiores do
que 30,
supe-se
que a
varincia
de t igual a 1: por
isso a aproximao do
item b.1.
UNIDADE
Modelo quiquadrado
Perodo 3 195
7
UNIDADE
UNIDADE
Figura 62: Uso da tabela da distribuio quiquadrado. Ilustrao com gl = 3
e rea na cauda superior de 5%.
Fonte: adaptado pelo autor de Barbeta, Reis, Bornia (2008).
Perodo 3 197
7 Resumindo
r
UNIDADE
UNIDADE
Nela estudamos os modelos probabilsticos mais
comuns. Essa Unidade foi repleta de Figuras, Qua-
dros, representaes e exemplos de utilizao das
tcnicas e das diferentes formas de utilizao des-
tes modelos. Releia, caso necessrio, todos os
exemplos, leia as indicaes do Saiba mais e dis-
cuta com seus colegas. Responda atividade de
aprendizagem e visite o Ambiente Virtual de Ensi-
no-Aprendizagem. Conte sempre com o acompa-
nhamento da tutoria e das explicaes do profes-
sor. timos estudos!
Atividades de aprendizagem
aprendizagem
1) Em um determinado processo de fabricao 10% das peas so de-
feituosas. As peas so acondicionadas em caixas com 5 unidades
cada uma. As caixas s sero aceitas se apresentarem no mximo
uma pea defeituosa. Pergunta-se:
a) Qual o modelo terico mais adequado para este caso? Por qu?
b) Qual a probabilidade de haver exatamente 3 peas defei-
tuosas em uma caixa?
c) Qual a probabilidade de uma caixa ser aceita?
d) Qual a probabilidade de que em um lote de 10 caixas
pelo menos 8 sejam aceitas?
2) Uma comisso responsvel pelo recebimento de equipamentos em
uma empresa faz testes em equipamentos selecionados aleatoriamente
dentre os que chegam. Para avaliar uma determinada marca de trans-
formadores de pequeno porte, a comisso selecionou aleatoriamente
18 dentre os que chegaram e classificar a marca como satisfatria
se no existir nenhum defeituoso nesta amostra. Sabe-se que a pro-
Perodo 3 199
7 duo destes equipamentos apresenta um percentual de 6% de de-
feituosos.
UNIDADE
UNIDADE
a) Qual a probabilidade de que seu tempo de vida ultrapas-
se as 260 horas?
b) Qual deveria ser o prazo de garantia para estes componen-
tes para que o servio de reposio atendesse a somente
5% dos componentes adquiridos?
6) Imagine que a UFSC tivesse antecipado os resultados abaixo, refe-
rentes aos candidatos no eliminados, antes de divulgar a relao
com as notas de todos os candidatos.
Perodo 3 201
7
UNIDADE
UNIDADE
Inferncia estatstica e
UNIDADE
distribuio amostral
D
Objetivo
Nesta Unidade voc conhecer os conceitos de
inferncia estatstica e de distribuio amostral, que
so a base para o processo de generalizao usado
pelos administradores em vrias tomadas de deciso.
Perodo 3 203
8
UNIDADE
UNIDADE
B
Caro estudante, vamos relembrar um pouco nossa
trajetria ao longo da disciplina de estatstica:
Na Unidade 1 vimos que atravs da Inferncia Es-
tatstica, usando os conceitos de Probabilidade (e
variveis aleatrias, Unidades 5, 6 e 7) podemos
generalizar os resultados de uma pesquisa por
amostragem (Unidade 2) para a populao da qual
a amostra foi retirada.
Lembre-se, estamos supondo que a amostra foi re-
tirada por meio de amostragem probabilstica ou
aleatria, temos ento um experimento aleatrio:
no sabemos quem far parte da amostra antes do
sorteio (Unidade 5).
Uma vez retirada a amostra, fazemos anlise
exploratria dos dados (Unidades 3 e 4): por exem-
plo, calculamos mdia de uma varivel quantitati-
va. Essa mdia e todas as demais estatsticas se-
ro variveis aleatrias (pois esto associadas ao
Espao Amostral de um experimento aleatrio), e
poderemos tentar identificar o modelo probabilstico
mais apropriado para elas (Unidades 6 e 7). Mas,
neste caso o modelo probabilstico de uma estats-
tica da amostra chamado de Distribuio
Amostral.
Conhecer a Distribuio Amostral das principais
estatsticas vai nos ser muito til quando estudar-
mos os tipos particulares de Inferncia Estatstica:
Estimao de Parmetros (Unidade 9) e Testes de
Hipteses (Unidade 10).
Vamos continuar aprendendo? muito bom ter voc
conosco!
Perodo 3 205
8 E
statstica a cincia que se ocupa de organizar, descrever, ana-
lisar e interpretar dados para que seja possvel a tomada de de-
cises e/ou a validao cientfica de uma concluso. Os dados
UNIDADE
v
obtidos atravs de um censo (pesquisa de toda a populao), ou atra-
Na Unidade 2 enume- vs de uma amostra (subconjunto finito) da populao.
ramos as principais ra- A amostra deve ser: representativa da populao, suficiente
zes para usar (para que o resultado tenha confiabilidade), e aleatria (retirada por
amostragem. sorteio no viciado).
!
A Inferncia Estatstica consiste em fazer afirma-
Amostra aleatria, ca- es probabilsticas sobre as caractersticas do mode-
sual ou probabilstica
amostra retirada por meio
lo probabilstico, que se supe representar uma popu-
de um sorteio no viciado, lao, a partir dos dados de uma amostra aleatria
que garante que cada ele- (probabilstica) desta mesma populao.
mento da populao ter
uma probabilidade maior do
que zero de pertencer
amostra. Fonte: elaborado Fazer uma afirmao probabilstica sobre uma caracterstica
pelo autor. qualquer associar declarao feita uma probabilidade de que tal
Parmetros alguma me- declarao esteja correta (e, portanto, a probabilidade complementar
dida descritiva (mdia,
de que esteja errada). Quando se usa uma amostra da populao sem-
varincia, proporo) dos
valores x1, x2, x3, ..., as- pre haver uma probabilidade de estar cometendo um erro (justamen-
sociados populao. Fon- te por ser usada uma amostra): a diferena entre os mtodos estatsti-
te: Barbetta, Reis e Bornia
cos e os outros reside no fato de que os mtodos estatsticos permitem
(2008).
calcular essa probabilidade de erro. E para que isso seja possvel a
Estimao de
P a r m e t r o s forma de
amostra da populao precisa ser aleatria.
inferncia estatstica que As afirmaes probabilsticas sobre o modelo da populao
busca estimar os parmetros
podem ser basicamente:
do modelo probabilstico da
varivel de interesse na po-
pulao, a partir de dados z estimar quais so os possveis valores dos parmetros
de uma amostra
Estimao de Parmetros:
probabilstica desta mesma
populao. Fonte: Barbetta, z qual o valor da mdia de uma varivel que segue
Reis e Bornia (2008).
uma distribuio normal?
UNIDADE
z testar hipteses sobre as caractersticas do modelo:
parmetros, forma da distribuio de probabilidades, en-
tre outros Testes de Hipteses.
z o valor da mdia de uma varivel que segue uma
distribuio maior do que um determinado valor?
z o modelo probabilstico da populao uma distri-
buio normal?
z o valor da mdia de uma varivel que segue uma
distribuio normal em uma populao diferente
da mesma mdia em outra populao?
Perodo 3 207
8 varivel pode assumir com a frequncia (contagem) com que foram
encontrados naquele conjunto. Essa distribuio pode ser apresenta-
da na forma de uma tabela, ou atravs de um grfico (esses dois m-
UNIDADE
todos podem ser usados tanto para variveis qualitativas quanto para
variveis qualitativas).
H uma terceira forma de resumir o conjunto de dados, quan-
do a varivel sob anlise quantitativa: as medidas de sntese ou
v
estatsticas. As principais estatsticas so a mdia, o desvio padro, a
A proporo est rela- varincia e a proporo.
cionada aos
percentuais de ocor-
rncia dos valores em Ateno! Vamos relembrar o que cada uma significa:
uma distribuio de Mdia
Mdia: mdia aritmtica simples (ver Unidade 4) tra-
frequncias de uma va- ta-se de uma estatstica que caracteriza o centro de
rivel qualitativa. massa do conjunto de dados (Valor Esperado ver
Unidade 6). Quando a mdia populacional recebe o
smbolo , quando a mdia amostral recebe o sm-
bolo 0 ;
Estatsticas medidas de
Varincia
arincia: trata-se de uma estatstica (ver Unidade 4)
sntese da varivel calcula-
das com base nos resulta- que mede a disperso em torno da mdia do conjunto,
dos de uma amostra da po- (em torno do valor esperado possuindo uma unida-
pulao. Se a amostra for
de que o quadrado da unidade da mdia (e dos valo-
probabilstica (aleatria) as
estatsticas podem ser con- res do conjunto). Quando a varincia populacional
sideradas variveis aleat- recebe o smbolo , quando a varincia amostral
rias. Fonte: Barbetta, Reis e
recebe o smbolo ss;
Bornia (2008).
Desvio padro a raiz quadrada positiva da varincia,
tendo, portanto, uma unidade que igual unidade
da mdia, sendo muitas vezes preferida para efeito de
!
mensurao da disperso. Quando o valor
populacional recebe o smbolo , e quando o amostral
recebe o smbolo s .
Proporo
roporo: consiste em calcular a razo entre o n-
mero de ocorrncias do valor de interesse de uma va-
rivel qualitativa e o nmero total de ocorrncias
registradas no conjunto (de todos os valores que a
varivel pode assumir); quando uma proporo
populacional recebe o smbolo ; quando uma pro-
poro amostral recebe o smbolo p .
UNIDADE
lizar tais medidas de sntese como estatsticas que sero utilizadas
para estimar os parmetros do modelo probabilstico que descreve a
populao.
A Tabela 4 resume os parmetros e as estatsticas:
Mdia
Varincia
Proporo
Distribuio Amostral
Perodo 3 209
v
8 NO con-
fundir com
Os valores de t formam uma nova populao que segue uma
distribuio de probabilidades que chamada de distribuio
amostral de T.
UNIDADE
UNIDADE
Se retirarmos todas as amostras aleatrias de dois elementos
(com reposio) possveis desta populao (n = 2), teremos os se- H 16 amos-
guintes resultados: tras poss-
veis.
(2, 2) (2, 3) (2, 4) (2, 5)
(3, 2) (3, 3) (3, 4) (3, 5)
(4, 2) (4, 3) (4, 4) (4, 5)
(5, 2) (5, 3) (5, 4) (5, 5)
Perodo 3 211
8 Se forem calculados mdia e varincia das mdias de todas as
amostras o resultado ser:
UNIDADE
v
precisam de amostras
lao ser normal se o tamanho destas amostras for suficientemente
maiores. Alguns auto-
grande, com uma mdia igual mdia populacional e uma varincia
res costumam chamar
igual varincia populacional dividida pelo tamanho da amostra.
de grandes amostras
aquelas que possuem Para o caso da Proporo podemos chegar a uma concluso
mais de 30 elemen- semelhante.
tos, a partir deste ta-
manho a aproximao
poderia ser feita sem
maiores preocupaes.
UNIDADE
proporo atravs de um exemplo.
Neste exemplo 4, pense agora em uma varivel qualitativa que
pode assumir apenas dois valores, e que constitui a seguinte popula-
o: (, , , , )
Vamos supor que h interesse no valor (este valor seria o
nosso sucesso). A proporo deste valor na populao (o valor do
parmetro) ser = 1/5.
v
Se retirarmos todas as amostras aleatrias de dois elementos
(com reposio) possveis desta populao (n = 2) teremos os se- H 25 amostras poss-
guintes resultados: veis.
Perodo 3 213
8
UNIDADE
v
das propores amostrais igual ao produto da proporo populacional
Voltaremos a analisar o de por seu complementar, dividido pelo tamanho da amostra.
significado deste resul- Lembre-se de que um modelo binomial pode ser aproximado
tado quando estudar- por um modelo normal se algumas condies forem satisfeitas: se o
mos Estimao por produto do nmero de realizaes pela probabilidade de sucesso
v
Ponto. (n p) E o produto do nmero de realizaes pela probabilidade de
Isto tambm decor-
fracasso (n [1 p]) forem ambos maiores ou iguais a 5. E essa
rncia do Teorema Cen- distribuio normal teria mdia igual a n p e varincia igual a
tral do Limite. n p (1 p). Se estivermos interessados apenas na proporo
(probabilidade de sucesso) e no no nmero de sucessos as ex-
presses anteriores podem ser divididas por n (o tamanho da amos-
tra): mdia = p e varincia = [p (1 p) / n].
Por causa do Teorema Central do Limite que o modelo nor-
mal to importante. claro que ele representa muito bem uma gran-
de variedade de fenmenos, mas devido sua utilizao em
Inferncia Estatstica que o seu estudo imprescindvel. Ressalte-se,
porm, que a sua aplicao costuma resumir-se ao que se chama de
Inferncia Paramtrica, inferncias sobre os parmetros dos modelos
probabilsticos que descrevem as variveis na populao. Para fazer
inferncias sobre outros aspectos que no os parmetros, ou quando
as amostras utilizadas no forem suficientemente grandes para se assu-
mir a validade do Teorema Central do Limite, preciso usar tcnicas de
Inferncia No Paramtrica (que ns no veremos nesta disciplina).
UNIDADE
BORNIA, Antonio C. Estatstica para Cursos de Engenharia e Informtica. 2.
ed. So Paulo: Atlas, 2008, Captulo 7.
r
BERENSON, Mark L. Estatstica: Teoria e Aplicaes Usando Microsoft
Excel em Portugus. 5. ed. Rio de Janeiro: LTC, 200, Captulo 5.
Resumindo
O resumo desta Unidade est mostrado na Figura 67:
Perodo 3 215
8
UNIDADE
B
Esta Unidade foi muito importante para o seu apren-
8
UNIDADE
dizado, pois lhe dar base para chegar Inferncia
Estatstica propriamente dita, assunto que ser tema
de discusso nas Unidades 9 e 10. Vimos at ago-
ra sobre a inferncia estatstica e distribuio
amostral, seu modelo probabilstico e testes de hi-
pteses. Chegamos ao final desta Unidade e a con-
tinuidade da aprendizagem proposta desde o in-
cio deste material. Interaja com seus colegas, res-
ponda atividade de aprendizagem e visite o Am-
biente Virtual de Ensino-Aprendizagem, espao este
que contemplar suas possveis dvidas. Procure
seu tutor e solicite todas as informaes necessri-
as para o seu aprendizado. Bons estudos!!!
Atividades de aprendizagem
aprendizagem
1) Uma fundio produz blocos para motor de caminhes. Os furos para
as camisas devem ter dimetro de 100 mm, com tolerncia de 5
mm. Para verificar qual o dimetro mdio no processo, a empresa
vai retirar uma amostra com 36 blocos e medir os dimetros de 36
furos (1 a cada bloco). Suponha que o desvio padro (populacional)
dos dimetros seja conhecido e igual a 3 mm.
a) Qual o desvio padro da distribuio da mdia amostral?
b) Qual a probabilidade da mdia amostral diferir da mdia
populacional (desconhecida) em mais do que 0,5 mm
(para mais ou para menos)?
c) Qual a probabilidade da mdia amostral diferir da mdia
populacional (desconhecida) em mais do que 1 mm (para
mais ou para menos)?
Perodo 3 217
8 d) Se algum afirmar que a mdia amostral no se distanciar
da mdia populacional em mais do que 0,98 mm, qual a
probabilidade dessa pessoa acertar?
UNIDADE
UNIDADE
Estimao de
UNIDADE
parmetros
D
Objetivo
Nesta Unidade voc conhecer e aplicar os
conceitos de Estimao de Parmetros por Ponto e
por Intervalo de Mdia e Proporo, e aprender
como calcular o tamanho mnimo de amostra
necessrio para a Estimao por Intervalo.
Perodo 3 219
9
UNIDADE
UNIDADE
Prezado estudante!
B
Na Unidade 8 voc viu o conceito de Distribuio
Amostral e observou a importncia do modelo nor-
mal. Nesta Unidade voc vai aprender como apli-
car esses conceitos no primeiro tipo particular de
Inferncia Estatstica, a Estimao de Parmetros:
por ponto e por intervalo.
Parmetros so medidas de sntese de variveis
quantitativas na Populao que estamos
pesquisando. Por ser invivel ou inconveniente
pesquisar toda a Populao coletamos uma amos-
tra para estud-la. Os resultados da amostra po-
dem ser ento usados para fazer afirmaes
probabilsticas sobre o parmetro de interesse: de-
finir um intervalo possvel para os valores do
parmetro e calcular a probabilidade de que o va-
lor real do parmetro esteja dentro dele (esta a
Estimao por Intervalo).
Vamos aprender como estimar os parmetros m-
dia de uma varivel quantitativa e proporo de
um dos valores de uma varivel qualitativa. Alm
disso, voc vai ver como possvel definir de forma
mais acurada o tamanho mnimo de uma amostra
aleatria para estimar mdia e proporo (para esta
ltima apresentamos uma primeira expresso de
clculo Unidade 2).
U
ma vez tendo decidido que modelo probabilstico mais ade-
quado para representar a varivel de interesse na Populao
resta obter os seus parmetros. Nos estudos feitos com base em
amostras preciso escolher qual das estatsticas da amostra ser o
melhor estimador para cada parmetro do modelo.
Perodo 3 221
9 A Estimao por Ponto consiste em determinar qual ser o
melhor estimador para o parmetro de interesse.
Como os parmetros sero estimados atravs das estatsticas,
UNIDADE
UNIDADE
do os critrios definidos acima.
Lembrando dos Exemplos 2, e 3 da Unidade 8, algumas
constataes que l foram feitas passaro a fazer sentido agora.
Vamos supor que houvesse a inteno de estimar a mdia
populacional da varivel do Exemplo 2. Qual das estatsticas dispon-
veis seria o melhor estimador?
Lembrem-se de que aps retirar todas as amostras aleatrias
possveis daquela populao, calculamos a mdia de cada amostra, e
posteriormente a mdia dessas mdias. Constatou-se que o valor es-
perado das mdias amostrais (mdia das mdias) igual ao valor da
mdia populacional da varivel e a varincia das mdias amostrais
igual ao valor da varincia populacional da varivel dividida pelo ta-
manho da amostra:
Perodo 3 223
9 O melhor estimador da proporo populacional a propor-
UNIDADE
UNIDADE
dir exatamente com os valores reais dos parmetros. Ento a Estimao
por Ponto dos parmetros insuficiente, e as estimativas assim obtidas
serviro apenas como referncia para a Estimao por Intervalo.
A Estimao por Intervalo consiste em colocar um Intervalo de
Confiana (I.C.) em torno da estimativa obtida atravs da Estimao
por Ponto.
fazer uma Estimao por
O Intervalo de Confiana ter uma certa probabilidade chama-
v
Intervalo de um
da de Nvel de confiana (que costuma ser simbolizado como 1 ) parmetro efetuar uma
de conter o valor real do parmetro e a probabilidade de que esta afirmao probabilstica
faixa realmente contenha o valor real do parmetro. A probabilidade sobre este parmetro,
de que o Intervalo de Confiana no contenha o valor real do parmetro indicando uma faixa de
chamada de Nvel de Significncia ( ), e o valor desta probabilida- possveis valores.
de ser o complementar do Nvel de Confiana. comum definir o
Nvel de Significncia como uma probabilidade mxima de erro, um
Intervalo de confiana
risco mximo admissvel. faixa de valores da esta-
A determinao do Intervalo de Confiana para um determina- tstica usada como
estimador, dentro da qual h
do parmetro resume-se basicamente a definir o Limite Inferior e o
uma probabilidade conhe-
Limite Superior do intervalo, supondo um determinado Nvel de Con- cida de que o verdadeiro
fiana ou Significncia. valor do parmetro esteja.
Sinnimo de estimao por
A definio dos limites depender tambm da distribuio
intervalo. Fonte: Barbetta,
amostral da estatstica usada como referncia para o intervalo e do Reis e Bornia (2008).
tamanho da amostra utilizada. Nvel de Significncia
Para os dois parmetros em que temos maior interesse (mdia complementar do nvel de
confiana, a probabilidade
populacional e proporo populacional ) a distribuio amostral
de que o intervalo de confi-
dos estimadores (mdia amostral 0 e proporo amostral p, respecti- ana no contenha o valor
vamente) pode ser aproximada por uma distribuio normal: o Inter- real do parmetro. Probabi-
lidade de erro espera-se que
valo de Confiana ser ento simtrico em relao ao valor calculado
seja um valor baixo, de no
da estimativa (mdia ou proporo amostral), com base na amostra mximo 10%. Fonte:
aleatria coletada (Figura 68): Barbetta, Reis e Bornia
(2008).
Nvel de confiana
probabilidade de que o in-
tervalo de confiana conte-
nha o valor real do
parmetro a estimar, espe-
ra-se que seja um valor alto,
de no mnimo 90%. Fonte:
Moore, McCabe, Duckworth
e Sclove (2006).
Perodo 3 225
9
UNIDADE
v
de Z correspondente, e substituir o valor em Z = (x mdia) des-
Foram colocados entre vio padro, para obter o valor x (valor correspondente ao valor de Z
aspas porque os valo- para a probabilidade fixada). Observe a Figura 69:
res dependero dos
parmetros sob anli-
se e de outros fatores.
UNIDADE
Z2 Hdesvio padro.
0 e0 0 + e 0 ) = 1
P(0
Perodo 3 227
9 a) Se a varincia populacional da varivel (cuja mdia
populacional queremos estimar) for conhecida.
Neste caso a varincia amostral da mdia poder ser calcula-
UNIDADE
da atravs da expresso:
E e0 ser:
E e0 ser:
UNIDADE
da na equao a seguir:
v
corte.
Adotou-se um nvel de significncia de 1%, ento = 0,01 e Este valor pode ser ar-
1 = 0,99. bitrado pelo usurio ou
As estatsticas disponveis so: mdia amostral = 8,2 kg pode ser uma exigncia
s = 0,4 kg n = 4 elementos. do problema sob anli-
se, ou at mesmo uma
Definio da varivel de teste: como a varincia populacional
exigncia legal. Os n-
DESCONHECIDA, e o tamanho da amostra menor do que 30 ele-
veis de significncia
mentos, no obstante a populao ter distribuio normal, a distribui-
mais comuns so de
o amostral da mdia ser t de Student, e a varivel de teste ser tn-1. 1%, 5% ou mesmo
Encontrar o valor de tn-1,crtico: como o Intervalo de Confiana para 10%.
a mdia bilateral, teremos uma situao semelhante da Figura 70:
Perodo 3 229
9 Para encontrar o valor crtico devemos procurar na tabela da
distribuio de Student, na linha correspondente a n1 graus de liber-
dade, ou seja, em 4 1 = 3 graus de liberdade. O valor da probabili-
UNIDADE
dade pode ser visto na Figura acima: os valores crticos sero t3;0,005
e t3;0,995 os quais sero iguais em mdulo. E o valor de tn1,crtico ser
igual a 5,84 (em mdulo).
Determinam-se os limites do intervalo, atravs da expresso
abaixo (cujo resultado ser somado e subtrado da mdia amostral)
para determinar os limites do intervalo:
Se n H 5 E n H (1 ) 5.
UNIDADE
Neste caso a mdia ser a proporo amostral (ou mais pre-
cisamente o seu valor):
P(p e0 p + e0) = 1
Ento e0 ser: .
Perodo 3 231
9 z Para a proporo, observar se possvel fazer a aproxima-
o pela distribuio normal.
UNIDADE
UNIDADE
do intervalo:
Perodo 3 233
9 A soluo para o dilema acima obter um tamanho mnimo
de amostra capaz de atender simultaneamente ao Nvel de Confian-
a (ou de Significncia) e preciso (e0) especificados. Como as ex-
UNIDADE
isolando n: .
UNIDADE
onde N o tamanho da populao
isolando n:
Perodo 3 235
9 necessrio especificar o Nvel de Confiana (ou de
Significncia) que ser usado para encontrar o Zcrtico, e o valor de e 0
(tomando o cuidado de que tanto e0 quanto p e 1 p estejam todos
UNIDADE
v
Estimao por Intervalo da proporo populacional h, porm, uma
Esta soluo somente soluo alternativa: utiliza-se uma estimativa exagerada da amostra,
usada quando a na- supondo o mximo valor possvel para o produto p H (1 p), que
tureza da pesquisa tal ocorrer quando ambas as propores forem iguais a 0,5 (50%).
que no possvel re- Conforme visto na Unidade 2, se o tamanho da populao for
tirar uma amostra pi- conhecido recomendvel corrigir o tamanho da amostra obtida, seja
loto: a retirada de uma para o intervalo de confiana de mdia ou proporo, atravs da se-
amostra piloto e a guinte frmula:
eventual retirada de
novos elementos da , onde N o tamanho da populao.
populao poderiam
prejudicar muito o re- Assim procedendo, evitamos o inconveniente de obter um ta-
sultado da pesquisa. manho de amostra superior ao tamanho da populao, o que pode
Paga-se, ento, o pre-
ocorrer se N no for muito grande.
o de ter uma amostra
Neste quarto exemplo considere o caso do Exemplo 2. Supon-
substancialmente mai-
do 99% de confiana e preciso de 1%, esta amostra suficiente para
or do que talvez fosse
necessrio. estimar a proporo populacional
De acordo com o Exemplo 2 possvel utilizar a aproximao
pela distribuio normal. A expresso para o clculo do tamanho m-
nimo de amostra para a proporo populacional ser:
Os valores de p e 1 p j so conhecidos:
p = 0,035 1 p = 0,965
O nvel de confiana exigido de 99%: para encontrar o valor
crtico devemos procurar na tabela da distribuio normal padro pela
probabilidade 0,995 (0,99+0,005); os valores crticos sero Z0,005 e
Z0,995 os quais sero iguais em mdulo. E o valor de Zcrtico ser igual a
2,58 (em mdulo).
A preciso foi fixada em 1% (0,01). Substituindo os valores na
expresso acima:
UNIDADE
Observe que o tamanho mnimo de amostra necessrio para
atender a 99% de confiana e preciso de 1% deveria ser de 2.249
elementos. Como a amostra coletada possui apenas 1.000 elementos
ela insuficiente para a confiana e preciso exigidas. Recomenda-se
o retorno populao para a retirada aleatria de mais 1.249 peas.
Perodo 3 237
9 OPINIO
Godofredo Astrogildo
LIMITE INFERIOR %
31%
LIMITE SUPERIOR %
37%
UNIDADE
Saiba mais
Sobre propriedades e caractersticas desejveis de um estimador,
BARBETTA, Pedro A.; REIS, Marcelo M.; BORNIA, Antonio C. Estatstica
para Cursos de Engenharia e Informtica. 2. ed. So Paulo: Atlas, 2008,
Captulo 7.
UNIDADE
O resumo desta Unidade est mostrado na Figura 72:
Perodo 3 239
9 B Vimos nesta Unidade sobre os conceitos de Esti-
mao de Parmetros. Aprendemos a estimar os
parmetros mdia de uma varivel quantitativa e
UNIDADE
Atividades de aprendizagem
aprendizagem
1) Buscando melhorar a qualidade do servio, uma empresa estuda o
tempo de atraso na entrega dos pedidos recebidos. Supondo que o
tempo de atraso se encontra normalmente distribudo, e conhecendo
o tempo de atraso dos ltimos 20 pedidos, descritos abaixo (em dias),
determine:
5 1 0 3 6 10 2 3 4 1 5 3 1 6 6 9 0 0 1 0
UNIDADE
ministrao estadual. Admitindo-se um nvel de significncia de 5%,
solucione os itens abaixo.
a) Estime o percentual da populao que est insatisfeita com
a administrao estadual.
b) Qual o tamanho da amostra necessria para a estimao se
a empresa responsvel pela pesquisa estipulou uma folga
mxima de 2,5%?
3) Os ndices apresentados pelos alunos do curso de Economia e de
Administrao esto sendo questionados pelos alunos, no sentido de
definirem se h diferena entre os cursos. Para tanto foram analisa-
dos os ndices de 10 alunos de cada curso, escolhidos aleatoriamen-
te dentre os regularmente matriculados e anotados seus valores, onde
se obteve:
Economia mdia 7,3 desvio padro 2,6
Administrao mdia 7,1 desvio padro 3,1
a) Estime os valores mdios dos ndices de cada curso com
95% de confiana.
b) Para o mesmo nvel de confiana de a. Ser que 10 alunos
uma amostra suficiente, em ambos os cursos, para esti-
mar seus ndices mdios, com uma preciso igual a 1?
4) O CRA de SC est conduzindo uma pesquisa sobre a opinio dos
acadmicos de administrao sobre seus respectivos cursos. Suspei-
ta-se que haja diferena entre as propores de satisfeitos de insti-
tuies pblicas e privadas: os acadmicos das pblicas seriam mais
satisfeitos. Para avaliar esta suposio foi conduzida uma pesquisa
por amostragem, entrevistando alunos de duas instituies pblicas,
SHUFSC e GASE, e de trs privadas, PATPIO de S, UNIMALI e
UNILUS. Os resultados esto na tabela a seguir:
Perodo 3 241
9 MEDIDAS SHUFSC GASE
UNIVERSIDADES
PATPIO UNIMALI UNILUS
UNIDADE
UNIDADE
Testes de Hipteses
UNIDADE
D
Objetivo
Nesta Unidade voc conhecer e aplicar os
conceitos de Testes de Hipteses, especialmente para
mdia de uma varivel quantitativa, proporo de
um dos valores de uma varivel quantitativa, e
associao entre duas variveis qualitativas. Voc
aprender tambm qual a importncia de tais
conceitos para o dia-a-dia do administrador.
Perodo 3 243
10
UNIDADE
UNIDADE
Caro estudante, voc viu anteriormente que uma
determinada populao pode ser descrita atravs
de um modelo, que apresenta caractersticas e
parmetros. Muitas vezes esses parmetros so
desconhecidos e h interesse em estim-los para
obter um melhor conhecimento sobre a popula-
B
o: retira-se ento uma amostra aleatria da po- Te s t e s p a r a m t r i c o s
pulao e atravs das tcnicas de Estimao de testes de hipteses sobre
parmetros do modelo da
Parmetros (Unidade 9) procura-se obter uma esti- varivel sob anlise Fonte:
mativa de algum parmetro de interesse, e associ- elaborado pelo autor.
amos uma probabilidade de que a estimativa este- Te s t e s n o p a r a m t r i -
ja correta. Nesta ltima e importantssima Unida- cos testes de hipteses
sobre outros aspectos do
de veremos que a Estimao de Parmetros uma
modelo da varivel sob an-
subdiviso da Inferncia Estatstica (que consiste lise ou alternativas aos tes-
em fazer afirmaes probabilsticas sobre o mode- tes paramtricos quando as
condies para uso destes
lo da populao a partir de uma amostra aleatria
no forem satisfeitas. Fon-
desta populao), a outra grande subdiviso cons- te: elaborado pelo autor.
titui os Testes de Hipteses. Vamos saber mais!
C
ontrariamente Estimao de Parmetros os Testes de Hipte-
ses permitem fazer inferncias sobre outras caractersticas do
modelo da populao alm dos
parmetros, como, por exemplo, a forma do mo- T a fim de saber
delo da populao. Quando os Testes so feitos
Na realidade a denominao correta deveria ser
sobre os parmetros da populao so chama-
Testes dependentes de distribuio de refern-
dos de Testes Paramtricos, e quando so feitos
cia (porque para fazer inferncias sobre os
sobre outras caractersticas so chamados de
parmetros devemos supor que o modelo
Testes No Paramtricos. No obstante vamos
probabilstico populacional normal, por exem-
nos restringir aos Testes Paramtricos: de uma
plo, ou que a distribuio amostral do parmetro
mdia de uma varivel quantitativa e de uma
pode ser aproximada por uma normal). J os no
proporo de um dos valores de uma varivel
paramtricos deveriam ser Testes livres de distri-
qualitativa.
buio (porque os Testes No Paramtricos no
Vimos que uma determinada populao exigem que os dados tenham uma aderncia a
pode ser descrita atravs de um modelo certo modelo).
Perodo 3 245
10 probabilstico, que apresenta caractersticas e parmetros. Muitas ve-
zes estes parmetros so desconhecidos e h interesse em estim-los
para obter um melhor conhecimento sobre a populao: retira-se en-
UNIDADE
v
Testes Paramtricos, e quando so feitos sobre outras caractersticas
A voc estudante inte- so chamados de Testes No Paramtricos No obstante vamos nos
ressado em Testes No restringir aos Testes Paramtricos.
Paramtricos recomen- Imagine-se que um determinado pesquisador est interessado
do a seguinte refern- em alguma caracterstica de uma populao. Devido a estudos prvi-
cia: SIEGEL, Sidney. os, ou simplesmente por bom senso (melhor ponto de partida para o
Estatstica No estudo) ele estabelece que a caracterstica ter um determinado com-
Paramtrica (para portamento. Formula ento uma hiptese estatstica sobre a caracte-
as Cincias do rstica da populao, e essa hiptese aceita como vlida at prova
Comportamento).
estatstica em contrrio.
McGraw-Hill: So Pau-
Para testar a hiptese coletada uma amostra aleatria repre-
lo, 1975. uma boa
sentativa da populao, sendo calculadas as estatsticas necessrias
referncia no assunto,
em portugus. para o teste. Naturalmente, devido ao fato de ser utilizada uma amos-
tra aleatria, haver diferenas entre o que se esperava, sob a condi-
o da hiptese verdadeira, e o que realmente foi obtido na amostra.
A questo a ser respondida : as diferenas so significativas o bas-
tante para que a hiptese estatstica estabelecida seja rejeitada? Esta
no uma pergunta simples de responder: depender do que est sob
teste (que parmetro, por exemplo), da confiabilidade desejada para
o resultado, entre outros. Basicamente, porm, ser necessrio com-
parar as diferenas com uma referncia, a distribuio amostral de
um parmetro, por exemplo, que supe que a hiptese sob teste ver-
dadeira: a comparao costuma ser feita atravs de uma estatstica
de teste que envolve os valores da amostra e os valores sob teste.
UNIDADE
era esperado (sob a condio da hiptese verdadeira) no
for significativa a hiptese ser aceita; e
z se a diferena entre o que foi observado na amostra e o que
era esperado (sob a condio da hiptese verdadeira) for
significativa a hiptese ser rejeitada.
v
Usando outros mtodos
dados de uma amostra aleatria da populao h sempre a probabili- (empricos) no h como
dade de estar cometendo um erro, mas com a utilizao de mtodos ter ideia da chance de
estatsticos possvel calcular o valor desta probabilidade. erro (pode ser um erro
O Nvel de Significncia uma probabilidade, portanto , um de 0% ou de
5.000%...).
nmero real que varia de 0 a 1 (0 a 100%), e como a probabilidade
de se cometer um erro no teste interessante que seja o mais prximo
possvel de zero: valores tpicos so 5%, 10%, 1% e at menores de-
pendendo do problema sob anlise. Contudo, no possvel usar um
Nvel de Significncia igual a zero porque devido ao uso de uma amos- Nvel de Significncia
tra aleatria sempre haver chance de erro, a no ser que a amostra probabilidade arbitrada
pelo pesquisador, valor m-
fosse do tamanho da populao. O complementar do Nvel de
ximo de erro admissvel
Significncia chamado de Nvel de Confiana, pois ele indica a para rejeitar a hiptese nula
confiabilidade do resultado obtido, a probabilidade de que a deciso sendo ela verdadeira, espe-
ra-se que seja um valor bai-
tomada esteja correta
B
xo, de no mximo 10%.
Fonte: Barbetta, Reis e
Bornia (2008); Moore,
Voc deve estar lembrado desses dois conceitos McCabe, Duckworth e
Sclove (2006).
de Estimao de Parmetros: Nvel de Confiana
era a probabilidade de que o Intervalo de Confian-
a contivesse o valor real do parmetro, e Nvel de
Significncia, complementar daquele, era a proba-
bilidade de que o Inter valo no contivesse o
parmetro, em suma a probabilidade da Estima-
o estar correta ou no, respectivamente.
Perodo 3 247
10 Tipos de Hipteses
UNIDADE
UNIDADE
A formulao das hipteses o ponto inicial do problema, e
deve depender nica e exclusivamente das concluses que se preten-
de obter com o teste. A formulao da hiptese alternativa determina-
r o tipo de teste: se Unilateral ou Bilateral.
Se a formulao da hiptese alternativa indicar que o parmetro
maior ou menor do que o valor de teste (valor considerado verdadei-
ro at prova em contrrio) o teste ser Unilateral: somente h inte-
resse se as diferenas entre os dados da amostra e o valor de teste
forem em uma determinada direo. Se a formulao da hiptese al-
ternativa indicar que o parmetro diferente do valor de teste o teste
ser Bilateral: h interesse nas diferenas em qualquer direo. As
hipteses ento seriam:
Testes Unilaterais
H0: parmetro = valor de teste.
Te s t e u n i l a t e r a l teste
H1: parmetro < valor de teste. no qual a regio de rejeio
da hiptese nula est con-
H0: parmetro = valor de teste. centrada em apenas um dos
lados da distribuio
H1: parmetro > valor de teste. amostral da varivel de tes-
te. Fonte: Barbetta, Reis e
Testes Bilaterais
Bornia (2008).
H0: parmetro = valor de teste. Teste bilateral teste no
qual a regio de rejeio da
H1: parmetro valor de teste.
hiptese nula est dividida
em duas partes, em cada
A escolha do tipo de teste depender das condies do proble- um dos lados da distribui-
o amostral da varivel de
ma sob estudo, sejam as trs situaes abaixo:
teste. Fonte: Barbetta, Reis
e Bornia (2008).
a) Um novo protocolo de atendimento foi implementado no
Banco RMG, visando reduzir o tempo que as pessoas pas-
sam na fila do caixa. O protocolo ser considerado
satisfatrio se a mdia do tempo de fila for menor do que
30 minutos. Um teste Unilateral seria o adequado.
b) Cerca de 2.000 formulrios de pedidos de compra esto
sendo analisados. Os clientes podem ficar insatisfeitos se
houver erros nos formulrios. Neste caso, admite-se que a
proporo mxima de formulrios com erros seja de 5%.
Perodo 3 249
10 Ou seja, um valor maior do que 5% causaria problemas.
Um teste Unilateral seria o adequado.
c) Uma pea automotiva precisa ter 100 mm de dimetro,
UNIDADE
!
importante ressaltar que a montagem das hipteses
deve depender apenas das concluses que se preten-
de obter e jamais de uma eventual evidncia amostral
disponvel.
UNIDADE
so significativas.
Essa abordagem chamada de abordagem clssica dos testes
de hipteses. H tambm a do valor-p, muito usada por programas
computacionais. Mas, neste texto, vamos usar apenas a clssica por
consider-la mais clara.
Para entender melhor os conceitos acima, observe a situao a
seguir:
H interesse em realizar um teste de hipteses sobre o compri-
mento mdio de uma das dimenses de uma pea mecnica. O valor
nominal da mdia (aceito como verdadeiro at prova em contrrio)
igual a b (valor genrico), H0: = b. Supondo que a distribuio
amostral do parmetro (distribuio de 0 ) seja normal, e ser centrada
em b: possvel fazer a converso para a distribuio normal padro
(mdia zero e desvio padro 1, varivel Z) (Figuras 73 e 74).
H0: = b
Figura 73: Hiptese nula: mdia populacional = b.
Fonte: elaborada pelo autor.
H0: = 0
Figura 74: Hiptese nula normal padro.
Fonte: elaborada pelo autor.
Perodo 3 251
10 O valor de b (mdia da dimenso e mdia de 0 ) corresponde a
zero, mdia da varivel Z. Dependendo da formulao da Hiptese
Alternativa haveria diferentes Regies de Rejeio de H0.
UNIDADE
UNIDADE
com o valor crtico desta mesma mdia: se for menor do que o valor
crtico 0crtivo, ou seja, est na regio de Rejeio de H0) ento rejei-
ta-se a Hiptese Nula. muito comum tambm tomar a deciso com-
parando o valor da varivel de teste (Z neste caso), obtido com base
nos dados da amostra, com o valor crtico Zcrtico desta mesma varivel
(obtido de uma tabela ou programa computacional): se for menor do
que o valor crtico rejeita-se a Hiptese Nula. Observe que o valor do
Nvel de Significncia colocado na curva referente Hiptese
Nula, porque esta que aceita como vlida at prova em contrrio.
v
Observe tambm que a faixa de valores da regio de Rejeio perten-
ce curva da Hiptese Nula, assim o valor a probabilidade de
Rejeitar H0 sendo H0 verdadeira. Probabilidade de tomar
uma deciso errada fixa-
Neste ponto importante ressaltar um ponto que costuma pas-
da pelo pesquisador.
sar despercebido. Se a deciso for tomada com base na varivel de
teste (Z, por exemplo) interessante notar que, como o teste Unilate-
ral esquerda o valor Zcrtico ser NEGATIVO, uma vez que a regio de
Rejeio de H0 est ESQUERDA de 0 (menor do que zero). No teste
Unilateral direita, que veremos a seguir, o valor de Z crtico ser positi-
vo, pois a regio de Rejeio de H0 estar DIREITA de 0 (maior do
que zero). Se por exemplo o Nvel de Significncia fosse de 5% (0,05)
v
o valor de Zcrtico para o teste Unilateral esquerda seria 1,645. Se
houvesse interesse em obter o valor de 0 crtivo correspondente bastaria
usar a expresso Z = (0 0)/ substituindo Z por 1,645. O sinal correto impor-
tante para que o valor de
Se a Hiptese Alternativa fosse H1: > b (H1: > 0), ou seja,
coerente com a posio
se o teste fosse Unilateral direita a Regio de Rejeio de H0 seria
da regio de Rejeio de
(Figuras 77 e 78):
H 0.
Perodo 3 253
10
UNIDADE
Figura 79 H1: b.
Fonte: elaborada pelo autor.
UNIDADE
Figura 80 H1: 0.
Fonte: elaborada pelo autor.
Perodo 3 255
10 b) Cerca de 2.000 formulrios de pedidos de compra esto
sendo analisados. Os clientes podem ficar insatisfeitos se
houver erros nos formulrios. Nesse caso, admite-se que a
UNIDADE
UNIDADE
Nesse caso, h interesse em testar a hiptese de que o parmetro
mdia populacional () de uma certa varivel quantitativa seja maior,
menor ou diferente de um certo valor. Para a realizao desse teste
necessrio que uma das duas condies seja satisfeita:
v
mas a amostra retirada desta populao considerada su- uma amostra suficien-
temente grande, mas
ficientemente grande o que, de acordo com o Teorema
geralmente uma amos-
Central do Limite, permite concluir que a distribuio
tra com pelo menos 30
amostral da mdia normal; e
elementos costuma ser
z supe-se tambm que a amostra representativa da popu- considerada grande o
lao e foi retirada de forma aleatria. bastante para que a dis-
tribuio amostral da
Tal como na Estimao de Parmetros por Intervalo existiro mdia possa ser aproxi-
diferenas nos testes, dependendo do conhecimento ou no da mada por uma normal.
varincia populacional da varivel.
a) Se a varincia populacional ( ) da varivel (cuja mdia
populacional se quer testar) for conhecida.
Nesse caso, a varincia amostral da mdia poder ser calcula-
v
da atravs da expresso:
Perodo 3 257
10 denotada por 0, e o desvio padro ser o valor obtido anteriormen-
te. Sendo assim, a expresso da varivel de teste Z:
UNIDADE
v
Se H1 : > 0 Rejeitar H0 se Z > Z crtico (0 > 0crtico);
Neste caso Zcrtico Se H1 : < 0 Rejeitar H0 se Z < Z crtico (0 < 0crtico); e
ser negativo, j que a
Se H1 : 0 Rejeitar H0 se |Z||Zcrtico|.
regio de Rejeio de
H0 est esquerda de b) Se a varincia populacional da varivel for desconhecida.
zero. Naturalmente esse o caso mais encontrado na prtica. Como
se deve proceder? Depender do tamanho da amostra.
v
rar mais de 30 elemen- varincia da distribuio t de Student aproximadamente
tos como sendo uma igual a 1.
amostra suficiente-
mente grande.
UNIDADE
onde s o desvio padro amostral e os outros valores tm o mesmo
significado da expresso anterior.
Compara-se o valor da varivel de teste com o valor crtico
(tn-1,crtico que depende do Nvel de Significncia adotado) de acordo
com o tipo de teste (as expresses abaixo tambm esto no Apndice):
v
Se H1: < 0 Rejeitar H0 se tn-1 > tn-1,crtico (0 < 0crtico); e
Se H1: : 0 Rejeitar H0 se |tn-1| |tn-1,crtico|. neste caso tn-1,crtico ser
negativo, j que a regio
A correta identificao dos valores crticos, decorrente da cor-
de Rejeio de H 0 est
reta identificao da regio de rejeio de H0, por sua vez decorrente
esquerda de zero.
da adequada formulao das hipteses estatsticas, indispensvel
para que o resultado obtido seja coerente.
Uma pea automotiva precisa ter 100 mm de dimetro, exata-
mente. Foram medidas 15 peas, aleatoriamente escolhidas. Obteve-
se mdia de 100,7 mm e varincia de 0,01 mm. Supe-se que a di-
menso segue distribuio normal na populao. A pea est dentro
das especificaes? Usar 1% de significncia? Vejamos neste primei-
ro exemplo:
Enunciar as hipteses.
Conforme visto anteriormente o teste mais adequado para este
caso um Teste Bilateral:
Nvel de significncia.
O problema declara que necessrio usar 1% de significncia
(se no fosse especificado, outro valor poderia ser usado).
Varivel de teste.
Uma vez que a varincia populacional da varivel DESCO-
NHECIDA (o valor fornecido a varincia amostral), e a amostra
retirada apresenta apenas 15 elementos (portanto menos de 30) a va-
rivel de teste ser tn-1 da distribuio t de Student.
Perodo 3 259
10 Definir a regio de aceitao de H0 (Figura 81).
UNIDADE
UNIDADE
tatsticas suficientes de que a dimenso da pea no est dentro das Cuidado
especificaes. com os ca-
Um novo protocolo de atendimento foi implementado no Ban- sos de
co RMG, visando reduzir o tempo que as pessoas passam na fila do FRONTEI-
caixa. O protocolo ser considerado satisfatrio se a mdia do tempo RA, em que
de fila for menor do que 30 minutos. Suponha que o tempo que 35 o valor da
clientes (selecionados aleatoriamente) passaram na fila foi monitorado, varivel de
resultando em uma mdia de 29 minutos e desvio padro de 5 minu- teste muito prximo do
valor crtico. Nesses ca-
tos. O protocolo pode ser considerado satisfatrio a 5% de
sos a rejeio ou aceita-
significncia? Vejamos neste segundo exemplo:
o de H 0 pode ocorrer
Esse problema j foi estudado anteriormente.
por acaso. Sempre que
Enunciar as hipteses. Conforme visto anteriormente o teste apresentar o resultado
mais adequado para este caso um Teste Unilateral Esquerda: recomende que uma
nova amostra seja reti-
H0: = 30, onde 0 = 30 (valor de teste); e
rada para avaliar nova-
H1: < 30. mente o problema. Mas
neste caso rejeita-se H0
Nvel de significncia. O problema declara que necessrio com folga.
usar 5%.
Varivel de teste. Uma vez que a varincia populacional da
varivel DESCONHECIDA (o valor fornecido o desvio padro
AMOSTRAL), mas a amostra retirada apresenta 35 elementos (por-
tanto mais de 30) a varivel de teste ser Z da distribuio normal.
Definir a regio de aceitao de H0 (Figura 82).
Perodo 3 261
10 Observe que por ser um teste Unilateral Esquerda o Nvel de
Significncia est todo concentrado em um dos lados da distribui-
o, definindo a regio de rejeio de H0. Para encontrar o valor cr-
UNIDADE
UNIDADE
(de um dos valores da varivel). Se ambas as condies forem satis-
feitas, a distribuio amostral da proporo que binomial (uma
Bernoulli repetida n vezes) pode ser aproximada por uma normal.
Obviamente supe-se que a amostra representativa da populao e
foi retirada de forma aleatria, e que a varivel pode assumir apenas
dois valores, aquele no qual h interesse e o seu complementar.
Se as condies acima forem satisfeitas, a distribuio amostral
da proporo poder ser aproximada por uma normal com:
v
Se H1 : > 0 Rejeitar H0 se Z > Zcrtico (p > pcrtico);
Se H1 : : < 0 Rejeitar H0 se Z < Zcrtico (p < pcrtico); e Neste caso Z crtico ser
Se H1: : 0 Rejeitar H0 se |Z| |Zcrtico|. negativo, j que a regio
de Rejeio de H 0 est
Cerca de 2.000 formulrios de pedidos de compra esto sendo esquerda de zero.
analisados. Os clientes podem ficar insatisfeitos se houver erros nos
formulrios. Neste caso admite-se que a proporo mxima de formu-
lrios com erros seja de 5%. Suponha que dentre os 2.000 formulrios
7% apresentavam erros. A proporo mxima foi ultrapassada a 1%
de significncia? Vejamos neste terceiro exemplo:
Perodo 3 263
10 Enunciar as hipteses. Conforme visto anteriormente, o teste
mais adequado para esse caso um Teste Unilateral Direita:
UNIDADE
UNIDADE
O valor de teste 0 igual a 0,05 (5%), a proporo amostral p
vale 0,07 (7%), e o tamanho de amostra n igual a 2.000. Substituin-
do na equao acima:
v
Interpretar a deciso no contexto do problema. H provas es-
tatsticas suficientes de que a proporo est acima do mximo admi- Este no um caso de
tido. Provavelmente os vendedores/compradores precisaro passar por fronteira
novo treinamento.
B
Agora vamos ver um tipo de teste estatstico muito
utilizado pelos administradores, para avaliar o re-
lacionamento entre duas variveis qualitativas: o
teste de associao (independncia de
quiquadrado).
Te s t e d e a s s o c i a o
(independncia) de
quiquadrado teste que
permite avaliar se duas va-
Teste de associao de quiquadrado riveis qualitativas, cujas
frequncias esto dispostas
em uma tabela de contin-
gncias, apresentam asso-
O teste do quiquadrado, tambm chamado de teste de inde- ciao significativa ou no.
Fonte: Barbetta, Reis e
pendncia de quiquadrado, est vinculado anlise de duas variveis
Bornia (2008).
qualitativas. Vamos ver alguns conceitos antes de apresentar o teste
de associao de quiquadrado.
Perodo 3 265
10 Variveis qualitativas e tabelas de contingncia
UNIDADE
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474
FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA TOTAL
Masculino 43,25% 100% 88,10% 54%
Feminino 56,75% 0% 11,90% 46%
Total 100% 100% 100% 100%
Perodo 3 267
10 de que as duas variveis no se diferem em relao s frequncias
com que ocorre uma caracterstica particular, ou seja, as variveis
so independentes, que ser testada contra a Hiptese Alternativa (H1)
UNIDADE
Sendo .
Onde:
v
z Eij a frequncia esperada, sob a condio de independn-
Se isso no ocorrer re-
cia entre as variveis, em uma clula qualquer da tabela de
comenda-se agrupar as
contingncias. Todas as freqncias esperadas precisam ser
categorias (de uma ou
maiores ou iguais a 5 para que o resultado do teste seja
outra varivel, ou de
vlido.
ambas) at obter todas
as frequncias pelo z Oij a frequncia observada em uma clula qualquer da
menos iguais a 5. tabela de contingncias.
z L o nmero total de linhas da tabela de contingncias
(nmero de valores que uma das variveis pode assumir).
z C o nmero total de colunas da tabela (nmero de valores
que a outra varivel pode assumir).
UNIDADE
O Teste do quiquadrado para avaliar se duas variveis so in-
dependentes ser unilateral: ou seja a Hiptese Nula ser rejeitada se
q > qcrtico, para um certo nmero de graus de liberdade. Por exemplo,
para o caso em que h trs graus de liberdade, e o Nvel de Significncia
fosse de 5% (a regio de Rejeio de H0 ficar DIREITA), o valor
crtico seria (lembre-se da Unidade 7) (Figura 84):
Perodo 3 269
10 Enunciar as Hipteses:
FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA TOTAL
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474
UNIDADE
demais operaes, que sero mostradas nos Quadros 26 , 27 e 28).
OE FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA
Masculino 157 197,58 27 14,70 74 45,72
Feminino 206 165,42 0 12,30 10 38,28
(O E) FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA
Masculino 1646,921 151,383 799,672
Feminino 1646,921 151,383 799,672
Finalmente:
(O E)/E FUNO
SEXO ESCRITRIO SERVIOS GERAIS GERNCIA
Masculino 8,336 10,301 17,490
Feminino 9,956 12,304 20,891
Perodo 3 271
10 O q crtico ser: procurando na Tabela 3 do ambiente, ou em
um programa, para 2 graus de liberdade e 99% de confiana (1% de
significncia): q 2,crtico = 6,63.
UNIDADE
UNIDADE
REIS, Marcelo M.; BORNIA, Antonio C. Estatstica para Cursos de Engenha-
ria e Informtica. 2. ed. So Paulo: Atlas, 2008, Captulo 8; STEVENSON,
Willian J. Estatstica Aplicada Administrao. So Paulo: Harbra, 2001,
Captulo 10.
Sobre testes de uma varincia: BARBETTA, Pedro A.; REIS, Marcelo M.;
BORNIA, Antonio C. Estatstica para Cursos de Engenharia e Informtica.
2. ed. So Paulo: Atlas, 2008, Captulo 8; TRIOLA, Mrio. Introduo
Estatstica. Rio de Janeiro: LTC, 1999, Captulo 7.
Perodo 3 273
10 Resumindo
r
UNIDADE
UNIDADE
Unidade os testes de hipteses, tipos de hipteses
e suas variveis. A Unidade foi explorada com Fi-
guras, exemplos e Quadros para melhor represen-
tar o contedo oferecido. Alm do material produ-
zido pelo professor, voc tem em mos uma
riqussima fonte de referncias para saber mais
sobre o assunto. Explore os conhecimentos pro-
postos. No tenha esta Unidade como fim, mas
sim como o comeo de uma nova trajetria em sua
vida acadmica. Bons estudos e boa sorte!
Atividades de aprendizagem
aprendizagem
1) O tempo mdio de atendimento em uma agncia lotrica est sendo
analisado por tcnicos. Uma amostra de 40 clientes foi sistematica-
mente monitorada em relao ao tempo que levavam para serem aten-
didos, obtendo-se as seguintes estatsticas: tempo mdio de atendi-
mento de 195 segundos e desvio padro de 15 segundos.
Considerando que o tempo de utilizao segue uma distribuio normal:
O dono da agncia garante que o tempo mdio de atendimento de
3 minutos (se for maior ele se compromete a contratar mais um
atendente). Com base nos dados da amostra a afirmao do dono
verdadeira, ou ele deve contratar um novo atendente? Use um nvel
de significncia de 1%?
2) Buscando melhorar a qualidade do servio, uma empresa estuda o
tempo de atraso na entrega dos pedidos recebidos. Supondo que o
tempo de atraso se encontra normalmente distribudo, e conhecendo
o tempo de atraso dos ltimos 20 pedidos, descritos abaixo (em dias),
determine:
5 1 0 3 6 10 2 3 4 1 5 3 1 6 6 9 0 0 1 0
Perodo 3 275
10 Um cliente enfurecido quer testar estatisticamente a hiptese (de-
clarada pela empresa) de que o atraso mdio ser de no mximo 1
dia. Ele argumenta que deve ser maior, e quer uma confiana de
UNIDADE
MEIO DE COMUNICAO
CAPACIDADE DE LEMBRANA REVISTA TV RDIO TOTAL
Lembram da propaganda 25 93 7 125
No lembram da propaganda 73 10 108 191
Total 98 103 115 316
REFERNCIAS
ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas
A. Estatstica Aplicada Administrao e Economia. 2. ed. So
Paulo: Thomson Learning, 2007.
Perodo 3 277
REFERNCIAS
STEVENSON, Willian J. Estatstica Aplicada Administrao.
So Paulo: Harbra, 2001.
Perodo 3 279
MINICURRCULO
Marcelo Menez
Marcelo es R
Menezes eis
Reis
Formado em Engenharia Eltrica pela Uni-
versidade Federal de Santa Catarina UFSC,
Bacharel em Administrao de Empresas pela
Universidade para o Desenvolvimento de Santa
Catarina UDESC, registro no CRA-SC 4049,
Especializao em Seis Sigma (Beyond Six Sigma
Certification Program) na University of South Florida USF
(EUA), Mestre em Engenharia Eltrica pela Universidade Fede-
ral de Santa Catarina, e Doutor em Engenharia de Produo pela
Universidade Federal de Santa Catarina. Professor Adjunto, lotado
no Departamento de Informtica e Estatstica da Universidade
Federal de Santa Catarina, desde 1995. Ministra disciplinas de
estatstica em vrios cursos de graduao e ps-graduao da
Universidade, incluindo os de Administrao.