Você está na página 1de 182

ESTATSTICA

Professora Me. Ivnna Gurniski de Oliveira


Professora Me. Renata Cristina de Souza Chatalov

GRADUAO

Unicesumar
Reitor
Wilson de Matos Silva
Vice-Reitor
Wilson de Matos Silva Filho
Pr-Reitor de Administrao
Wilson de Matos Silva Filho
Pr-Reitor de EAD
Willian Victor Kendrick de Matos Silva
Presidente da Mantenedora
Cludio Ferdinandi

NEAD - Ncleo de Educao a Distncia


Direo Operacional de Ensino
Ktia Coelho
Direo de Planejamento de Ensino
Fabrcio Lazilha
Direo de Operaes
Chrystiano Mincoff
Direo de Mercado
Hilton Pereira
Direo de Polos Prprios
James Prestes
Direo de Desenvolvimento
Dayane Almeida
Direo de Relacionamento
Alessandra Baron
Head de Produo de Contedos
Rodolfo Encinas de Encarnao Pinelli
Gerncia de Produo de Contedos
Gabriel Arajo
Superviso do Ncleo de Produo de
Materiais
Ndila de Almeida Toledo
Superviso de Projetos Especiais
Daniel F. Hey
Coordenador de Contedo
Silvio Silvestre Barczsz
Designer Educacional
C397 CENTRO UNIVERSITRIO DE MARING. Ncleo de Educao Giovana Vieira Cardoso
a Distncia; OLIVEIRA, Ivnna Gurniski de; CHATALOV, Renata
Cristina de Souza. Iconografia
Isabela Soares Silva
Estatstica. Ivnna Gurniski de Oliveira; Renata Cristina de Souza
Chatalov.
Projeto Grfico
Maring-Pr.: UniCesumar, 2017. Jaime de Marchi Junior
182 p. Jos Jhonny Coelho
Graduao - EaD.
Arte Capa

1. Estatstica. 2. Probabilidade. 3. EaD. I. Ttulo. Andr Morais de Freitas
Editorao
CDD - 22 ed. 515.5 Victor Augusto Thomazini
CIP - NBR 12899 - AACR/2
Qualidade Textual
Hellyery Agda
Erica Fernanda Ortega
Ficha catalogrfica elaborada pelo bibliotecrio Ilustrao
Joo Vivaldo de Souza - CRB-8 - 6828
Bruno Cesar Pardinho
Daphine Ramella Marcon
Viver e trabalhar em uma sociedade global um
grande desafio para todos os cidados. A busca
por tecnologia, informao, conhecimento de
qualidade, novas habilidades para liderana e so-
luo de problemas com eficincia tornou-se uma
questo de sobrevivncia no mundo do trabalho.
Cada um de ns tem uma grande responsabilida-
de: as escolhas que fizermos por ns e pelos nos-
sos faro grande diferena no futuro.
Com essa viso, o Centro Universitrio Cesumar
assume o compromisso de democratizar o conhe-
cimento por meio de alta tecnologia e contribuir
para o futuro dos brasileiros.
No cumprimento de sua misso promover a
educao de qualidade nas diferentes reas do
conhecimento, formando profissionais cidados
que contribuam para o desenvolvimento de uma
sociedade justa e solidria , o Centro Universi-
trio Cesumar busca a integrao do ensino-pes-
quisa-extenso com as demandas institucionais
e sociais; a realizao de uma prtica acadmica
que contribua para o desenvolvimento da consci-
ncia social e poltica e, por fim, a democratizao
do conhecimento acadmico com a articulao e
a integrao com a sociedade.
Diante disso, o Centro Universitrio Cesumar al-
meja ser reconhecido como uma instituio uni-
versitria de referncia regional e nacional pela
qualidade e compromisso do corpo docente;
aquisio de competncias institucionais para
o desenvolvimento de linhas de pesquisa; con-
solidao da extenso universitria; qualidade
da oferta dos ensinos presencial e a distncia;
bem-estar e satisfao da comunidade interna;
qualidade da gesto acadmica e administrati-
va; compromisso social de incluso; processos de
cooperao e parceria com o mundo do trabalho,
como tambm pelo compromisso e relaciona-
mento permanente com os egressos, incentivan-
do a educao continuada.
Seja bem-vindo(a), caro(a) acadmico(a)! Voc est
iniciando um processo de transformao, pois quando
investimos em nossa formao, seja ela pessoal ou
profissional, nos transformamos e, consequentemente,
Diretoria de
transformamos tambm a sociedade na qual estamos
Planejamento de Ensino
inseridos. De que forma o fazemos? Criando oportu-
nidades e/ou estabelecendo mudanas capazes de
alcanar um nvel de desenvolvimento compatvel com
os desafios que surgem no mundo contemporneo.
O Centro Universitrio Cesumar mediante o Ncleo de
Educao a Distncia, o(a) acompanhar durante todo
Diretoria Operacional
este processo, pois conforme Freire (1996): Os homens
de Ensino
se educam juntos, na transformao do mundo.
Os materiais produzidos oferecem linguagem dialgica
e encontram-se integrados proposta pedaggica, con-
tribuindo no processo educacional, complementando
sua formao profissional, desenvolvendo competn-
cias e habilidades, e aplicando conceitos tericos em
situao de realidade, de maneira a inseri-lo no mercado
de trabalho. Ou seja, estes materiais tm como principal
objetivo provocar uma aproximao entre voc e o
contedo, desta forma possibilita o desenvolvimento
da autonomia em busca dos conhecimentos necess-
rios para a sua formao pessoal e profissional.
Portanto, nossa distncia nesse processo de cresci-
mento e construo do conhecimento deve ser apenas
geogrfica. Utilize os diversos recursos pedaggicos
que o Centro Universitrio Cesumar lhe possibilita. Ou
seja, acesse regularmente o AVA Ambiente Virtual de
Aprendizagem, interaja nos fruns e enquetes, assista
s aulas ao vivo e participe das discusses. Alm dis-
so, lembre-se que existe uma equipe de professores
e tutores que se encontra disponvel para sanar suas
dvidas e auxili-lo(a) em seu processo de aprendiza-
gem, possibilitando-lhe trilhar com tranquilidade e
segurana sua trajetria acadmica.
AUTORES

Professora Me. Ivnna Gurniski de Oliveira


Mestre em Ensino de Cincias e Educao Matemtica da Universidade
Estadual de Londrina, especialista em Docncia no Ensino Superior pela
Unicesumar - Centro Universitrio Cesumar, graduada em Licenciatura em
Matemtica pela Universidade Estadual de Maring.

Professora Me. Renata Cristina de Souza Chatalov


Possui graduao em Tecnologia Ambiental pelo Centro Federal de Educao
Tecnolgica do Paran. Especialista em Gesto Ambiental pela Faculdade
Estadual de Cincias e Letras de Campo Mouro - FECILCAM. Mestre em
Engenharia Urbana pela Universidade Estadual de Maring - UEM. Tem
experincia em pesquisa na rea de Sistema de Gesto de Qualidade, na
rea Ambiental, com nfase em Tecnologias Avanadas de Tratamento de
Efluentes, Gesto e Tratamento de Resduos Slidos. Trabalha como Professora
Formadora no curso de Gesto Ambiental, Gesto de Recursos Humanos,
Gesto de Negcios Imobilirios, Segurana do Trabalho no EAD no Centro
Universitrio Cesumar - UniCesumar. Professora no curso de graduao em
Administrao na Faculdade Metropolitana de Maring. Coordenadora do
Curso de Tecnologia em Gesto Ambiental na Faculdade Metropolitana
de Maring. Professora da disciplina de Indstria e Meio Ambiente na Ps-
graduao em Gesto Ambiental na Faculdade Metropolitana de Maring.
Professora da ps-graduao EAD UniCesumar.
APRESENTAO

ESTATSTICA

SEJA BEM-VINDO(A)!
Caro(a) estudante, com muito prazer que apresentamos a voc o livro que far parte
da disciplina de Estatstica. A Estatstica uma cincia que se dedica ao desenvolvimen-
to e ao uso de mtodos para a coleta, resumo, organizao, apresentao e anlise de
dados. Um exemplo do uso da estatstica est na previso do tempo em uma regio, em
tendncias numa eleio, a posio dos bancos dos trens em certa linha e, at, o hbito
de lavar as mos aps usar o banheiro.
Fazendo uma pequena viagem pelo tempo, em 3000 a.C., registrava-se os primeiros in-
dcios de censos na Babilnia, na China e no Egito. No Velho Testamento, Livro 4 (N-
meros), registra-se uma instruo de Moiss: Fazer levantamento dos homens de Israel
aptos a guerrear (TOREZANI, 2004, p. 2).
A palavra Censo deriva do verbo latino censere, que significa taxar. O objetivo inicial
da realizao dos censos era buscar informaes sobre as populaes para orientar a
taxao de impostos. Era, portanto, uma atividade que interessava, particularmente, aos
governos, ao Estado. Da deriva a palavra ESTATSTICA (de STATUS). Trata-se da ferramen-
ta de trabalho dos estadistas.
Em 1805, Guilherme, o Conquistador, determinou que se fizesse, na Inglaterra, um le-
vantamento, visando obter informaes sobre posse de terras, sua utilizao, seus pro-
prietrios, nmero de empregados, posse de animais etc., para taxao de impostos.
No sculo XVII, John Graint publica Aritmtica Poltica, uma anlise sobre nascimentos
e bitos, a partir das chamadas Tbuas de Mortalidade.
J, no sculo XVIII (1797), surge, na Enciclopdia Britnica, o verbete STATISTICS pela
primeira vez.
O termo Estatstica usado, hoje, com alguns significados diferentes. Ele pode se referir a:
meros registros de eventos que interessem ao administrador em geral;
uma simples medida estatstica que seja obtida de uma amostra;
mtodos estatsticos padronizados utilizados em pesquisa por amostragem;
cincia estatstica em geral, hoje, grandemente desenvolvida e com aplicao disse-
minada como auxiliar as mais diferentes reas de conhecimento.
De forma simplificada, podemos admitir que a Cincia Estatstica tem como objetivo
obter informaes confiveis sobre determinado fenmeno de interesse.
A Estatstica est de forma muito presente na mdia, seja em jornais, revistas ou meios
de comunicao. Alm disso, uma vez que est diretamente envolvida com pesquisa,
a partir dela que as decises so tomadas. Podemos dizer que a Estatstica uma
ferramenta para qualquer pesquisador na busca pelas respostas aos vrios problemas
relacionados ao meio em que trabalha. Entretanto, para que ela seja bem utilizada,
necessrio conhecer os seus fundamentos, seus princpios e suas ferramentas para que
possamos utiliz-la de forma adequada.
APRESENTAO

Este material foi separado em cinco unidades, sendo iniciado com a importncia da
Estatstica bsica, passando por probabilidades e finalizando com medidas de asso-
ciao.
A unidade I vai do incio de sua utilizao at a importncia dos grficos e das tabelas
na apresentao dos dados. Essa unidade trata, basicamente, dos conceitos que voc
precisar saber para entender a Estatstica nas unidades posteriores.
Na unidade II, nos aprofundaremos no estudo de tabelas e de grficos, mais especi-
ficamente, leitura e construo de tabelas, aplicao e utilizao de alguns tipos de
grficos.
A unidade III mostra as medidas de posio e de disperso. Essas medidas so, ampla-
mente, empregadas dentro de pesquisas em nvel cientfico e, tambm, nos proble-
mas mais simples do cotidiano.
A unidade IV trata sobre probabilidades. As probabilidades podem tratar de eventos
simples a extremamente complexos. De forma abrangente, elas tratam das chances
de determinados fenmenos ocorrerem. A importncia de se estudar probabilidades
est na verificao de que alguns eventos ocorrem com uma facilidade maior que
outros e, assim, podemos prever situaes futuras sobre esses eventos.
A unidade aborda as probabilidades de forma geral, mostrando desde os clculos mais
simples, passando por suas propriedades, e indo at as probabilidades condicionais
e distribuies de probabilidades. As principais distribuies so aquelas que utiliza-
mos com maior frequncia, uma vez que existem inmeros tipos. Essas distribuies
do comportamento da varivel com a qual estamos trabalhando importante, pois,
por meio delas que determinamos como calcular probabilidades de forma correta.
Finalizando o material, a unidade V trata das medidas de associao, mais especifica-
mente a correlao e a anlise de regresso. Essas medidas nos mostram o grau de re-
lao entre duas variveis. A correlao informa a intensidade da relao e a anlise de
regresso mostra a quantidade de variao em uma por meio da variao em outra.
Este material est bastante sintetizado, focando os pontos principais da Estatstica de
modo a proporcionar encaminhamentos que possibilitem a compreenso dos con-
ceitos, ao contrrio do que muitas vezes posto em se tratando de estudar Matem-
tica e, especificamente, Estatstica.
A resoluo de tarefas importante desde que o(a) estudante procure faz-la luz da
teoria que ela contempla. Com isso, afirmo: ser necessrio, tambm, muito empenho
de sua parte para a realizao desse intenso trabalho. No decorrer de suas leituras,
procure interagir com os textos, fazer anotaes, responder as atividades de estudo,
anotar suas dvidas, ver as indicaes de leitura e realizar novas pesquisas sobre os
assuntos tratados, pois com certeza no ser possvel esgot-los em apenas um livro.
Prof. Ivnna Gurniski De Oliveira
Prof. Renata C. de Souza Chatalov
09
SUMRIO

UNIDADE I

CONCEITOS E IMPORTNCIA DA ESTATSTICA

15 Introduo

16 A Importncia da Disciplina de Estatstica

18 Populao e Amostra

20 Amostragem

30 Tipos de Variveis

32 Fases do Mtodo Estatstico

36 Consideraes Finais

40 Referncias

41 Gabarito

UNIDADE II

TABELAS E GRFICOS

45 Introduo

46 Tabelas

60 Grficos 

68 Consideraes Finais

73 Referncias

74 Gabarito
10
SUMRIO

UNIDADE III

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS

79 Introduo

80 Medidas de Posio

91 Medidas Separatrizes

96 Medidas de Disperso

105 Consideraes Finais

110 Referncias

111 Gabarito

UNIDADE IV

PROBABILIDADES

115 Introduo

116 Probabilidade

135 Distribuio de Probabilidades Discreta

141 Distribuio de Probabilidades Contnua

150 Consideraes Finais

155 Referncias

156 Gabarito
11
SUMRIO

UNIDADE V

CORRELAO LINEAR E REGRESSO

159 Introduo

160 Correlao Linear

165 Regresso Linear

173 Consideraes Finais

179 Referncias

180 Gabarito

182 CONCLUSO
Professora Me. Ivnna Gurniski De Oliveira
Professora Me. Renata Cristina de Souza Chatalov

CONCEITOS E IMPORTNCIA

I
UNIDADE
DA ESTATSTICA

Objetivos de Aprendizagem
Entender o que significa Estatstica.
Compreender a importncia da Estatstica.
Assimilar os principais conceitos dentro da Estatstica.
Compreender as principais formas de apresentao de dados
estatsticos.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
A Importncia da Disciplina de Estatstica
Populao e Amostra
Amostragem
Tipos de Variveis
Fases do Mtodo Estatstico
15

INTRODUO

Normalmente, as pessoas imaginam que a Estatstica simplesmente uma coleo


de nmeros, ou que tem a ver apenas com censo demogrfico, com a constru-
o de tabelas ou de grficos. Podemos afirmar que a Estatstica vai muito alm
de disso e que, na verdade, ela muito frequente na nossa vida.
Como exemplos de aplicaes de tcnicas estatsticas, temos: a pesquisa elei-
toral, a pesquisa de mercado, o controle de qualidade, os ndices econmicos,
o desenvolvimento de novos medicamentos, as novas tcnicas cirrgicas e de
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

tratamento mdico, as sementes mais eficientes, as previses meteorolgicas, as


previses de comportamento do mercado de aes, dentre outros, isto , tudo
que se diz cientificamente comprovado, por algum momento, passa por proce-
dimentos estatsticos.
Portanto, podemos definir Estatstica como um conjunto de tcnicas de an-
lise de dados, que so aplicveis a quase todas as reas do conhecimento, e que
nos auxiliam no processo de tomada de deciso. Estatstica a cincia que estuda
os processos de coleta, de organizao, de anlise e de interpretao de dados
relevantes e referentes a uma rea particular de investigao.
Voc ver que a Estatstica uma cincia multidisciplinar que permite a
anlise de dados em todas as reas e que fornece ferramentas para que sejamos
capazes de transformar dados brutos em informaes acessveis e de fcil com-
preenso, de modo que possamos compar-los com outros resultados ou, ainda,
verificar sua adequao com alguma teoria pronta.
Abordaremos que a Estatstica tem uma base na formao do acadmico,
pois de extrema importncia para o desenvolvimento dos alunos saber obser-
var as tabelas e os grficos e usar essa ferramenta para a tomada de decises.
Nesta unidade, sero apresentados conceitos bsicos em Estatstica, que
so subsdios para o desenvolvimento de todo o estudo proposto neste livro.
Ento, aproveite bem essa unidade, e lembre-se que ela ser um subsdio para
toda nossa disciplina.

Introduo
16 UNIDADE I

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
A IMPORTNCIA DA DISCIPLINA DE ESTATSTICA

A palavra Estatstica deriva do latim status, que significa ESTADO. Os primei-


ros usos da Estatstica se deram com base no conhecimento da populao em
relao s suas riquezas e na coleta de impostos. Posteriormente, foi empregada
no manuseio de dados que descreviam aspectos de um Estado ou pas, da a ori-
gem da palavra estar relacionada a Estado.
A Estatstica est presente no dia a dia de qualquer indivduo, seja na abor-
dagem governamental em que somos questionados, como o censo demogrfico,
ou ento quando somos abordados sobre qual candidato que iremos votar na
prxima eleio, quando nasce um indivduo, ou quando estamos consumindo
algum tipo de produto; em todas essas situaes, dentre tantas outras, estamos
fazendo parte da Estatstica.
A anlise estatstica tem, assim, por objetivo, a resoluo de problemas, bem
como a produo de conhecimentos que geram novos problemas e, portanto,
podemos dizer que est envolvida diretamente em um processo iterativo, sendo
seu principal objetivo auxiliar na tomada de deciso.
Segundo Rao (1999), a Estatstica uma cincia que estuda e pesquisa tanto
o levantamento de dados, quanto o processamento destes para a quantificao
da incerteza existente na resposta para um determinado problema; a tomada
de decises sob condies de incerteza, sob o menor risco possvel.

CONCEITOS E IMPORTNCIA DA ESTATSTICA


17

A importncia da Estatstica est presente em todos os segmentos ligados


pesquisa, de forma geral e abrangente. A maioria desses rgos possui depar-
tamentos oficiais destinados realizao de estudos estatsticos. A Estatstica
tornou-se responsvel, nos ltimos tempos, pelo desenvolvimento cientfico e tec-
nolgico, sendo que a partir dela que analisamos dados e tomamos as decises.
Ainda, podemos dizer que ela fornece meios precisos e rigorosos na veri-
ficao e na anlise dos dados, transformando-os em informaes claras e a
partir das quais tomamos nossas decises baseados em comprovaes cientfi-
cas, e no em achismos.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Dentre outros atributos, podemos dizer ainda que o estudo da Estatstica


justifica-se pela necessidade de desenvolver pesquisas e pela utilizao dos resul-
tados visando comprovao de alguma hiptese e soluo de algum problema.
Ademais, atualmente as empresas tm procurado admitir profissionais que
tenham certo nvel de conhecimento em Estatstica, pois este tem resultado em
diferena significativa nos processos decisrios. Torna-se fundamental para qual-
quer indivduo ter conhecimentos bsicos e saber aplic-los de maneira coerente,
utilizando tcnicas estatsticas nos diferentes casos que podem surgir.

CONCEITOS BSICOS EM ESTATSTICA

A Estatstica tem por objetivo fornecer mtodos e tcnicas para que se possa
lidar com situaes de incerteza, e pode ser subdividida em trs reas: descri-
tiva, probabilstica e inferencial.
A estatstica descritiva, tambm chamada de estatstica dedutiva, tem como obje-
tivo organizar, resumir e simplificar as informaes, a fim de torn-las mais fceis
de serem entendidas, transmitidas e discutidas. Como o nome indica, ela descreve
os fenmenos de forma prtica e acessvel, ou seja, por meio de tabelas, grficos e
medidas resumo, que veremos nas prximas unidades. Assim, podemos captar rapi-
damente, por exemplo, o significado de uma taxa de desemprego, de um consumo
mdio de combustvel por quilmetro, ou de uma nota mdia de estudantes.
A Estatstica Inferencial objetiva inferir concluses sobre a populao,
interpretando os dados colhidos de uma amostra. Para isso, utiliza amplamente a

A Importncia da Disciplina de Estatstica


18 UNIDADE I

Teoria das Probabilidades, que fundamental para avaliar situaes que envol-
vam o acaso. A aplicao de mtodos probabilsticos nos permite quantificar
a importncia do acaso.
Assim, resultados obtidos por amostragem so testados, utilizando-se
conhecimentos probabilsticos, a fim de se determinar at que ponto eles so
significativos, isto , no so obra do acaso.
Quando tratamos de dados estatsticos, podemos optar por dois processos:
o Censo e as Estatsticas, que podem ser assim definidos:
Censo: processo que consiste no exame de todos os elementos da popu-

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
lao. Exemplo: censo demogrfico, censo industrial, etc.
Estatsticas: utilizadas para avaliar os elementos de uma amostra.

A partir do censo, so encontradas medidas que descrevem toda a populao,


os chamados Parmetros e, ao se trabalhar com amostras, so obtidas as estima-
es e, a partir delas, os Estimadores, como definidos a seguir:
Parmetros: medidas descritivas de uma populao. Exemplo: a conta-
gem do nmero total de habitantes de uma regio.
Estimadores: medidas descritivas de uma amostra e que indiretamente
estimam um parmetro pelo clculo de probabilidades. Exemplo: propor-
o de votantes em certo candidato obtido por amostragem.

POPULAO E AMOSTRA

A Estatstica fornece vrios mtodos para organizar e para resumir um conjunto


de dados e, com base nestas informaes, tirar concluses. Quando se fala em
conjunto de dados ou fatos coletados, este se refere ao material tomado a partir
de um conjunto de elementos. Deve-se, ento, definir de onde esses dados sero
tomados, e assim surge o conceito de Populao (BARBETTA, 2014).

CONCEITOS E IMPORTNCIA DA ESTATSTICA


19

Populao pode ser definida como sendo uma coleo de elementos que
possuem alguma caracterstica em comum, podendo estes ser animados ou
inanimados.
Quando as informaes desejadas estiverem disponveis para todos os objetos
da populao, temos o chamado censo. Normalmente, impraticvel ou invi-
vel trabalhar com a populao quando se faz Estatstica (CRESPO, 2009). Isto
devido a alguns fatores:
Restrio de tempo ou de recursos.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Populao infinita, entre outros.

Assim, o procedimento comum coletar desta populao um subconjunto de


elementos, as chamadas Amostras.
Amostra pode ser definida como uma parte da populao. Entretanto, este
conceito deve ir um pouco mais alm. Uma amostra deve ser representativa da
populao, ou seja, deve ter todas as caractersticas da populao de onde foi
extrada.
A partir do estudo do conjunto de dados obtido na amostra, faz-se uma
extrapolao dos seus resultados para a populao toda. Essa extrapolao
chamada Inferncia.
Um exemplo pode ser dado em estudos de opinio pblica sobre a aceitao
de um candidato s eleies, ou ento sobre a durabilidade de aparelhos, resis-
tncia de materiais, etc.
A escolha das unidades
que comporo a amostra
feita por um processo cha-
mado Amostragem, e este
pode ser feito de vrias
maneiras, dependendo do
que se tem em mos, por
exemplo, do tamanho da
populao e do conheci-
mento que se tem dela.

Populao e Amostra
20 UNIDADE I

AMOSTRAGEM

A amostragem utilizada no nosso cotidiano. Por exemplo, para verificar o tem-


pero de um alimento em preparao, provamos uma pequena poro (amostra),
dessa maneira estamos fazendo uma amostragem, isto , extraindo do todo (popu-
lao) uma parte (amostra) com o objetivo de se ter uma ideia (inferncia) sobre
a qualidade do tempero em todo o alimento preparado (BARBETTA, 2014).
Em pesquisas cientficas, na qual desejamos, muitas vezes, conhecer algumas
caractersticas (parmetros) de uma populao, podemos utilizar as tcnicas de

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
amostragens, a fim de obtermos os valores aproximados (estimativas) para os
parmetros em que estamos interessados.
Esse tipo de pesquisa chamado de levantamento por amostragem
(BARBETTA, 2014). No entanto, a seleo dos elementos que sero utilizados
para fazerem parte da amostra, deve ser feita sob uma metodologia adequada,
de tal forma que os resultados da amostra sejam suficientemente informativos
para se inferir sobre os parmetros populacionais.

Figura 1 - Exemplo de amostra

CONCEITOS E IMPORTNCIA DA ESTATSTICA


21

E por que utilizamos as tcnicas de amostragem?


01. Economia: normalmente mais econmico fazermos o levantamento
somente em uma parcela da populao, no em um todo.
02. Tempo: Muitas vezes no temos tempo suficiente para analisar toda popu-
lao, por exemplo: queremos fazer uma pesquisa eleitoral, a cinco dias
antes das eleies. Imaginem o tempo para isso.
03. Confiabilidade e operacionalidade: quando pesquisamos em um nmero
reduzido de elementos, podemos dar mais ateno aos casos individuais.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

E quando a amostragem no se torna interessante?


01. Populao pequena: quando temos uma populao pequena invivel
utilizarmos uma tcnica de amostragem, imaginem a situao: vamos
fazer uma entrevista com alunos de uma turma com dez alunos; nesse
caso, mais interessante entrevistamos os dez alunos do que aplicarmos
uma tcnica de amostragem a fim de obtermos a amostra.
02. Caracterstica de fcil mensurao: a populao pode no ser to
pequena, mas a varivel que se quer observar de to fcil mensura-
o que no compensa investir em um plano de amostragem. Como
por exemplo, queremos fazer uma pesquisa sobre o local de uma festa
de confraternizao em uma empresa, assim podemos entrevistar todos
os colaboradores no prprio local de trabalho.

Amostragem
22 UNIDADE I

03. Necessidade de alta preciso: a cada dez anos o Instituto Brasileiro


de Geografia e Estatstica (IBGE) realiza um censo demogrfico a fim
de estudar vrias caractersticas da populao brasileira. Para Barbetta
(2014), dentre essas caractersticas, tem-se o parmetro nmero de habi-
tantes residentes no pas. um parmetro que precisa ser avaliado com
grande preciso; por isso, pesquisada toda populao.

Para que se obtenha uma amostra representativa da populao, o processo de


coleta deve ser feito de forma adequada, no qual cada situao exige uma maneira
apropriada.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Existem dois grandes grupos de tcnicas amostrais:
Probabilsticas: quando todos os elementos da populao tm probabili-
dade conhecida e diferente de zero de pertencer amostra.
No probabilsticas: quando nem todos os elementos da populao tm
probabilidade conhecida de pertencer amostra.

A amostragem probabilstica a mais recomendada para garantir a representa-


tividade da amostra, pois implica em um sorteio dos elementos com regras bem
determinadas, sendo possvel, apenas, quando a populao finita.
As principais tcnicas de amostragem probabilsticas so:

AMOSTRAGEM CASUAL SIMPLES

Para se ter uma amostra casual simples, precisa-se de uma listagem com todos
os elementos da populao de origem. Os elementos que faro parte da amos-
tra devem ser obtidos de forma totalmente aleatria, ou seja, por sorteio e sem
restrio. escrito cada elemento em um carto e assim sorteado os participan-
tes da amostra. Todos os elementos da populao tm igual probabilidade n
N
de pertencer amostra.
Essa tcnica de sorteio se torna invivel quando a populao significativa-
mente grande. Neste caso, necessrio o uso de tabelas de nmeros aleatrios
ou algoritmos que geram nmeros aleatoriamente.

CONCEITOS E IMPORTNCIA DA ESTATSTICA


23

Tendo em vista que a amostragem aleatria vital para a inferncia esta-


tstica, existem tabelas que so elaboradas e so denominadas Tabelas de
Nmeros Aleatrios, construdas de modo que os dez algarismos (0 a 9), so
distribudos ao acaso nas linhas e nas colunas.
Nesta tabela de nmeros aleatrios, os dez algarismos (0, 1, 2, 3, 4, 5, 6, 7, 8,
9) podem ser lidos: isoladamente ou em grupos; em qualquer ordem, como
por colunas, em um sentido ou outro, por linhas, diagonalmente, dentre ou-
tras formas e podem ser considerados aleatrios. A opo de leitura, porm,
deve ser feita antes de iniciado o processo.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Fonte: Bussab e Morettin (2003).

De forma geral, na amostragem casual simples, sorteia-se um elemento da popu-


lao, sendo que todos os elementos tm a mesma probabilidade de serem
selecionados. Repete-se o procedimento at que sejam sorteadas todas as uni-
dades da amostra.
Exemplo:
Para obter uma amostra representativa de 10% de uma populao de 100
elementos:
Numerar os apartamentos de 1 a 100.
Escrever os nmeros de 1 a 100 em pedaos de papel e coloc-los em
uma urna.
Retirar 10 pedaos de papel um a um da urna, formando a amostra.
1
Observe que cada elemento tem a mesma probabilidade de ser selecionado.
100

AMOSTRAGEM SISTEMTICA

A amostragem sistemtica utilizada quando os elementos da populao se apre-


sentam ordenados, sendo a retirada dos elementos feita, periodicamente, para
compor a amostra. O sorteio feito de forma sistematizada.
De posse de uma listagem de todos os elementos da populao, estabelece-
-se o intervalo de seleo: I = N / n.

Amostragem
24 UNIDADE I

Em seguida, sorteia-se um nmero dentro desse intervalo. Esse ser o nmero


de ordem do primeiro sorteado da lista. Os demais sujeitos da amostra sero
selecionados utilizando o intervalo I, a partir do primeiro nmero sorteado.
Exemplo:
Em uma turma de 32 alunos, desejamos obter uma amostra de 5 alunos.
Utilizando a tcnica de amostragem sistemtica, temos que N = 32, n = 5 e o
32
intervalo de seleo I = 5 = 6,4. Para o valor do intervalo, deve ser conside-

rado apenas o valor inteiro, logo, I = 6.
O primeiro elemento da amostra deve ser retirado entre os seis primeiros

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
da lista. Para obter os demais elementos da amostra, somamos o intervalo I ao
elemento anterior. Se o sorteado for, por exemplo, o nmero 4, a amostra ser
formada pelos sujeitos de nmeros 4, 10, 16, 22 e 28.

AMOSTRAGEM ESTRATIFICADA

Neste tipo de amostragem, a populao deve ser dividida em subgrupos (estra-


tos). Dentro de cada subgrupo, os indivduos devem ser semelhantes entre si.
Assim, pode-se obter uma amostra aleatria de pessoas em cada grupo. Esse pro-
cesso pode gerar amostras bastante precisas, mas s vivel quando a populao
pode ser dividida em grupos homogneos, devendo, na composio da amos-
tra, serem sorteados elementos de todos os estratos.
Quando os estratos possuem, aproximadamente, o mesmo tamanho, sor-
teia-se igual nmero de elementos em cada estrato e a amostragem chamada
estratificada uniforme. Caso contrrio, sorteia-se, em cada estrato, um nmero
de elementos proporcional ao nmero de elementos do estrato, chamada amos-
tragem estratificada proporcional.
Exemplo:
Um corretor possui 200 imveis disposio, h 120 venda e 80 para loca-
o. Para extrair uma amostra representativa de 10% dessa populao, devem-se
identificar seus subconjuntos, sendo neste caso os tipos de investimentos (
venda ou locao).

CONCEITOS E IMPORTNCIA DA ESTATSTICA


25

Tabela 1 - Imveis de uma imobiliria

INVESTIMENTO POPULAO AMOSTRA (10%)


venda 120 12
Locao 80 8
Total 200 20
Fonte: elaborada pelas autoras.

Portanto, a amostra com 20 elementos deve conter 12 imveis venda e 8 para


locao.
Deve-se sortear 12 elementos entre os 120 imveis venda e 8 entre os
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

80 imveis para locao, formando a amostra da populao.

AMOSTRAGEM POR CONGLOMERADO

Nesta amostragem, a populao dividida em diferentes grupos (conglomera-


dos), extraindo-se uma amostra apenas dos conglomerados selecionados e no
de toda a populao. O ideal seria que cada conglomerado representasse tanto
quanto possvel o total da populao.
Exemplo:
Para estudar a populao de uma cidade, dispondo apenas do mapa dos
bairros, deve-se:
Numerar os bairros e colocar os pedaos de papis numa urna.
Retirar um pedao de papel da urna e realizar o estudo sobre o bairro
(conglomerado) selecionado.

importante saber que a amostra no pode conter vcios, ou seja, no ser ten-
denciosa. Deve ser selecionada com cuidado, aplicando a tcnica de amostragem
adequada com tamanho amostral (n) que seja informativo ao que consta na
populao. O tamanho da populao pode ser obtido por frmulas encontra-
das facilmente na literatura ou pode ser dado pelo bom senso do pesquisador.
O importante que ele seja representativo da populao.

Amostragem
26 UNIDADE I

No caso da amostra no ser representativa da populao, devemos ter cui-


dado com o conjunto de dados para que no haja grandes erros de inferncia ou
ento no devemos fazer a inferncia.

um erro bsico teorizar antes de ter os dados.


(Sir Arthur Conan Doyle 1859-1930).

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
AMOSTRAGEM NO ALEATRIA

As amostragens no aleatrias procuram gerar amostras que, de alguma forma,


representem razoavelmente bem a populao de onde foram extradas. As prin-
cipais podem ser a amostragem por cotas e por julgamento.

Amostragem por cotas

A amostragem por cotas semelhante amostragem estratificada proporcional. A


populao separada, dividida em diversos subgrupos. selecionada uma cota de
cada subgrupo proporcional ao seu tamanho. Para compensar a falta de aleatorie-
dade da seleo, para Barbetta (2014), costuma-se dividir a populao em um grande
nmero de subgrupos, como em uma pesquisa socioeconmica na qual a popula-
o pode ser dividida por localidade, por nvel de instruo, por faixas de renda.

Amostragem por julgamento

Os elementos escolhidos so aqueles julgados como tpicos da populao que


se deseja estudar. Por exemplo em um estudo sobre a produo cientfica de um
departamento de uma instituio de ensino superior, um pesquisador sobre esse
assunto pode escolher os departamentos que ele considera serem aqueles que
melhor representam a instituio como um todo.

CONCEITOS E IMPORTNCIA DA ESTATSTICA


27

DIMENSIONAMENTO DA AMOSTRA

Para Barbetta (2014), o tamanho de uma amostra um problema complexo, pois


a heterogeneidade e os tipos de parmetros que queremos estimar so pontos
muito importante para determinarmos esse tamanho.
O tamanho da amostra ir depender do nvel de confiana estabelecido para
pesquisa em funo direta do erro amostral, previamente fixado pelo pesquisa-
dor. O erro amostral mais utilizado de 5%. No mximo, recomendado que esse
erro seja de 10%, para que se possa manter uma preciso razovel nos parme-
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

tros estimados pela pesquisa. Quanto menor o erro amostral, maior o tamanho
da amostra, implicando em maior preciso nas estimativas populacionais e con-
sequentemente maior custo para execuo da pesquisa (FONSECA, 2008).
O erro amostral a diferena entre uma estatstica e o parmetro que se quer
estimar (BARBETTA, 2014).
Para que possamos determinar o tamanho de uma amostra, o pesquisador
precisa especificar o erro amostral tolervel, isto , o quanto ele admite errar na
avaliao dos parmetros de interesse; por exemplo, em uma pesquisa eleitoral,
comum encontrarmos algo que diz que a pesquisa tem um erro de 2%. Isso
significa que, quando a pesquisa aponta que determinado candidato tem 45% de
intenes de votos, o pesquisador afirma na verdade que a preferncia por este
candidato, em toda a populao de eleitores, um valor no intervalo de 43% a
47%, isto , 45% mais ou menos 2%.
Para dimensionamento da amostra, utilizaremos a equao a seguir:

Z 2 . p^ . q^ . N
d2 . (N - 1) + Z 2 . p^ . q^

Em que:
N = Tamanho da populao.
p^ = estimativa da verdadeira proporo de um dos nveis da varivel
escolhida.
q^ = 1 p
Z /2 = abcissa da curva norma padro, fixado em um nvel de confiana
d = erro amostral.

Amostragem
28 UNIDADE I

Quando no sabemos o valor de p^ e q^ podemos adotar 0,5 para cada. O


valor de z /2, observamos no Quadro 01.
Quadro 01 Intervalo de confiana e valores de Z

INTERVALO DE CONFIANA VALOR DE Z


90% 1,645
95% 1,96
98% 2,33
99% 2,575

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Fonte: elaborado pelas autoras adaptado de Crespo (2009); Barbetta (2014).

Os valores que devem ser utilizados na equao so os valores de z, por exemplo


se tivermos o intervalo de confiana de 90%, utilizaremos 1,645 e assim por diante.
Exemplo: Temos uma populao com 43.373 pessoas e desejamos fazer uma
pesquisa utilizando os nveis de confiana e os erros amostrais a seguir:

a. Determine o tamanho da amostra com o nvel de confiana de 90% e


erro amostral de 10%
Temos:
Z 2 . p^ . q^ . N
d 2 . (N - 1) + Z2 . p^ . q^

N (nmero total) = 43.373


p = 0,5
q = 0,5
Z /2 (para 90% de grau de confiana, encontrado na tabela Z de distri-
buio normal) = 1,645
d = 0,10
1,6452 . 0,5 . 0,5 . 43.373
0,102 . (43.373 - 1) + 1,6452 . 0,5 . 0,5
29.342,10558
= 67,54 arredondando = 68 entrevistados
434,40

CONCEITOS E IMPORTNCIA DA ESTATSTICA


29

b. Determine o tamanho da amostra com o nvel de confiana de 95% e erro


amostral de 0,05%
Temos:
Z 2 . p^ . q^ . N
d 2 . (N - 1) + Z2 . p^ . q^

N (nmero total) = 43.373


p = 0,5
q = 0,5
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Z /2 (para 95% de grau de confiana, encontrado na tabela Z de distri-


buio normal) = 1,96
d = 0,05
1,962 . 0,5 . 0,5 . 43.373
0,052 . (43.373 - 1) + 1,962 . 0,5 . 0,5
41.655,43
= 380,79 arredondando = 381 entrevistados
109,39

c. Determine o tamanho da amostra com o nvel de confiana de 95,5% e


erro amostral de 0,045%
N (nmero total) = 43.373
p = 0,5
q = 0,5
Z /2 (para 95,5% de grau de confiana, encontrado na tabela Z de dis-
tribuio normal) = 2
d = 0,045
22 . 0,5 . 0,5 . 43.373
0,0452 . (43.373 - 1) + 22 . 0,5 . 0,5
43.373
= 488,26 arredondando = 489 entrevistados
88,83

Amostragem
30 UNIDADE I

d. Determine o tamanho da amostra com o nvel de confiana de 98% e erro


amostral de 0,02%
N (nmero total) = 43.373
p = 0,5
q = 0,5
Z /2 (para 98% de grau de confiana, encontrado na tabela Z de distri-
buio normal) = 2,33
d = 0,02

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
2,332 . 0,5 . 0,5 . 43.373
0,022 . (43.373 - 1) + 2,332 . 0,5 . 0,5
58.869,63
= 3.146,43 arredondando = 3147 entrevistados
18,71

TIPOS DE VARIVEIS

VARIVEL uma caracterstica que possa ser avaliada (ou medida) em cada
elemento da populao, sob as mesmas condies. Uma varivel observada (ou
medida) em um elemento da populao deve gerar um e apenas um resultado.
Exemplo:
Seja uma populao formada pelos funcionrios de determinada empresa.
Podemos considerar variveis como: tempo de servio, salrio, estado civil,
idade, sexo, escolaridade, inteligncia, peso, estatura, autoestima, grau de satis-
fao com o emprego, autoritarismo, religiosidade, etc.
Como medir essas caractersticas? Devemos fixar uma unidade de medida
(kg, cm, anos completos,...) ou definir atributos (casado, solteiro, masculino,
feminino, forte, fraco...).

CONCEITOS E IMPORTNCIA DA ESTATSTICA


31

Para descrever o grupo ou a amostra, h a necessidade de identificar o tipo


dessa varivel para definir a melhor metodologia de trabalho. As variveis podem
ser: Quantitativas ou Qualitativas.
Variveis Qualitativas ou Categricas - so variveis que assumem como
possveis valores atributos ou qualidades. Se tais variveis assumem uma orde-
nao natural, so chamadas de qualitativas ordinais (ex.: grau de escolaridade,
classe social); caso contrrio, so chamadas qualitativas nominais (ex.: cor dos
olhos, campo de estudo).
Variveis Quantitativas - so variveis que assumem como possveis valores
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

os nmeros. Quando estas variveis so resultantes de contagens, so chamadas


de quantitativas discretas (ex.: quantidade de irmos, de defeitos num carro
novo); caso assumam qualquer valor em intervalos dos nmeros reais, so cha-
madas quantitativas contnuas (ex.: altura, peso, velocidade).

Exerccio:

Classificar as seguintes variveis:


a. tempo de vida de uma placa-me.
b. tipo sanguneo.
c. raa.
d. produo de amortecedores de uma indstria em um perodo de dois
minutos.
e. produo de mel das caixas de um apirio.
f. religio.
g. estado civil.
h. nmero de pessoas na fila de um banco.
i. nmero de produtores associados a uma cooperativa.

Tipos de Variveis
32 UNIDADE I

Respostas:
a. Quantitativa Contnua.
b. Qualitativa Nominal.
c. Qualitativa Nominal.
d. Quantitativa Discreta.
e. Quantitativa Contnua.
f. Qualitativa Nominal.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
g. Qualitativa Nominal.
h. Quantitativa Discreta.
i. Quantitativa Discreta.

FASES DO MTODO ESTATSTICO

Aps a definio do problema a ser estudado, a marcha natural do processo de


pesquisa a seguinte:
Planejamento.
Coleta de dados.
Crtica, organizao e sumarizao dos dados.
Apresentao dos dados.
Anlise e interpretao.

PLANEJAMENTO devem-se estabelecer com clareza os objetivos e os proce-


dimentos a serem adotados. Nesta fase, define-se a maneira de coletar os dados
(entrevista, questionrio ou simples medio), determinando, tambm, o tama-
nho necessrio para a amostra e a maneira mais indicada para selecion-la.

CONCEITOS E IMPORTNCIA DA ESTATSTICA


33

COLETA DE DADOS de acordo com a finalidade da pesquisa, a coleta


pode ser:
contnua - obtendo-se registros de fenmenos de interesse do administrador.
peridica - quando se necessita de avaliaes sistemticas. Um exem-
plo bem caracterstico o censo realizado pelos governos em perodos
pr-estabelecidos.
ocasional - quando existe um interesse momentneo em determinado
fenmeno.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

O conjunto de dados coletados d origem s SRIES ESTATSTICAS.


Didaticamente, podemos caracteriz-las como:
HISTRICAS ou CRONOLGICAS: quando o fenmeno estudado ao
longo do tempo, em determinado local.
GEOGRFICAS ou TERRITORIAIS: quando se observam valores da
varivel em determinado momento, segundo sua localizao.
ESPECIFICATIVAS ou CATEGRICAS: quando a varivel observada em
determinado tempo e local, discriminada por especificaes ou categorias.

CRTICA, ORGANIZAO E SUMARIZAO - tm a finalidade de eliminar


erros. Neste processo, procede-se a uma reviso crtica dos dados, retirando os
valores estranhos que podem ocorrer tanto por erro de quem coletou os dados
ou de quem foi abordado na pesquisa. Para um melhor entendimento, diante
de grande quantidade de dados,
adequado que se faa uma compi-
lao deles para sua apresentao.
APRESENTAO DOS
DADOS ser feita por meio
de TABELAS e GRFICOS. As
tabelas so mais ricas em deta-
lhes e em preciso. Os grficos
proporcionam maior rapidez de
interpretao, embora percam
exatido em detalhes.

Fases do Mtodo Estatstico


34 UNIDADE I

ANLISE E INTERPRETAO - tm como objetivo a determinao de


medidas estatsticas que, como j vimos, tm a finalidade de descrever de forma
prtica e objetiva as caractersticas gerais de uma populao. Determinadas as
medidas estatsticas bsicas, a anlise desejada poder ter sequncia j no campo
da Estatstica Inferencial, baseada sempre em raciocnios probabilsticos.

TABELAS E GRFICOS

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
O objetivo da utilizao de tabelas e grficos transformar dados em informaes
que permitam a fcil visualizao e interpretao da nossa pesquisa. Tambm
servem para verificar a existncia de algum padro para comparar esse padro
com outros resultados ou, ainda, para julgar sua adequao a alguma teoria.
As tabelas so quadros em que sero dispostas as informaes por alguma
categoria pelo clculo de alguma frequncia. Devem ter as laterais abertas, ou
seja, sem bordas, e devem ainda ter um ttulo explicativo e localizado acima delas,
precedido da palavra Tabela e seguido de sua numerao. Veja o exemplo abaixo:
Tabela 2 - Nmero de computadores pessoais instalados no Brasil e percentual sobre total de habitantes de
2000 a 2004

NMERO DE COMPUTADORES PERCENTUAL DE COMPUTADORES


ANO
(MILHES) POR TOTAL DE HABITANTES
2000 5,0 3,0
2001 8,5 4,0
2002 13,0 7,3
2003 24,0 13,1
2004 30,0 16,1
Fonte: elaborada pelas autoras.

Um grfico uma figura utilizada na Estatstica para representar um fenmeno.


Ele deve refletir padres gerais e especficos do conjunto de dados. Apesar de
comum, a utilizao dos grficos fornece menos detalhes do conjunto de dados
em relao s tabelas, entretanto, um meio rpido e prtico para visualizao
dos dados.

CONCEITOS E IMPORTNCIA DA ESTATSTICA


35

Um grfico dispe tendncias, os valores mnimos e mximos, as variaes


dos dados e, tambm, as ordens de grandezas dos fenmenos que esto sendo
observados. Todo grfico deve visar clareza e objetividade, alm de ser fiel s
informaes pertinentes ao conjunto original de dados.
Existem diversos tipos de grficos e de tabelas disponveis e que podemos uti-
lizar na apresentao dos dados de nossas pesquisas. Na prxima unidade, voc
ver esses exemplos associados a vrios tipos e formatos. Veja o exemplo a seguir:

%
100,0
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

90,0
80,0
70,0
60,0
50,0
40,0
30,0
20,0
10,0
0,0
Brasil Norte Nordeste Sudeste Sul Centro-
oeste
2005 2006 2007
Grfico 1 - Percentual de domiclios atendidos por rede geral de abastecimento de gua no total de domiclios
particulares permanentes (%)
Fonte: IBGE - Pesquisa Nacional por Amostra de Domiclios (2006-2007, online).

Algumas perguntas podem ser feitas ao se optar pela utilizao de um grfico,


como:
O grfico uma opo que realmente demonstra o que quero mostrar
na pesquisa?
Qual o tipo de grfico adequado para os dados da pesquisa?
Como este grfico deve ser mostrado ao pblico?
Devo usar somente um grfico para visualizao dos dados da pesquisa?

Fases do Mtodo Estatstico


36 UNIDADE I

CONSIDERAES FINAIS

A Estatstica utilizada para coleta, organizao, descrio e anlise de informaes


obtidas em uma pesquisa, sendo que a estatstica descritiva utilizada para a descri-
o dos dados. O objetivo principal transformar os dados brutos em informaes.
Nesta unidade, voc viu os principais conceitos utilizados dentro da esta-
tstica descritiva, tipos de amostras e a importncia da utilizao de grficos e
de tabelas como forma de apresentao dos dados. Dos conceitos abordados,
podemos destacar o censo, que o processo que consiste no exame de todos os

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
elementos da populao e cujas medidas so chamadas de parmetros. Entretanto,
se utilizamos uma parte dessa populao, no temos um parmetro, e sim uma
estatstica ou um estimador; portanto, um estimador uma medida tomada em
uma parte dessa populao, mas no nela toda, embora este estimador repre-
sente o parmetro.
Tambm vimos os conceitos de Populao e Amostra. Populao, no sen-
tido estatstico, pode ser definida como um conjunto de elementos que possuem
alguma caracterstica em comum. Como na maioria das vezes difcil ou custoso
trabalharmos com populao, utilizamos uma parte dela. A esta parte chama-
mos de amostra. Essa amostra deve, porm, representar a populao, ou seja,
deve ter as mesmas caractersticas da populao que se ir amostrar.
Para que isso seja conseguido, o processo de coleta de uma amostra, tambm
conhecido como amostragem, deve ser feito de forma casual ou aleatria. Existem
algumas maneiras de se fazer uma amostragem e, para cada situao, existe uma
maneira ideal. Nesta unidade, foram discutidos os principais tipos de amostras
utilizadas nas pesquisas, sendo que a escolha deve ser feita de modo que as amos-
tras representem de fato a populao e de forma que sejam no tendenciosas.
Aps a coleta da amostra, necessrio descrever os dados. Para isso, primei-
ramente, devemos saber com quais tipos de variveis estamos trabalhando, para,
assim, escolhermos qual a melhor maneira de apresentar a pesquisa.
Finalizando, importante que a apresentao dos dados seja feita de forma
precisa. As duas formas vistas nesta unidade foram as tabelas e os grficos, e o
uso correto das formas de apresentao dos dados fundamental para o sucesso
da pesquisa.

CONCEITOS E IMPORTNCIA DA ESTATSTICA


37

1. Defina Estatstica, Estatstica Descritiva e Estatstica Inferencial.

2. Apresente os conceitos para os termos abaixo relacionados e d um exem-


plo para cada um deles:
Populao.
Amostra.
Censo.
Estimao.
Variveis.

3. Explique os principais tipos de amostras.

4. Comente as vantagens de apresentar resultados de pesquisa por meio de


tabelas grficos.

5. Identifique a populao em estudo e o tipo de amostragem a ser utilizado


em cada alternativa:
a. Uma empresa tem 3.414 empregados repartidos nos seguintes departamen-
tos: Administrao (914), Transporte (348), Produo (1401) e Outros (751).
Deseja-se extrair uma amostra entre os empregados para verificar o grau de
satisfao em relao qualidade da refeio servida no refeitrio.
b. Um cabo eleitoral escreve o nome de cada senador do Brasil em cartes sepa-
rados, mistura e extrai 10 nomes.
c. Um administrador hospitalar faz uma pesquisa com as pessoas que esto na
fila de espera para serem atendidas pelo sistema SUS, entrevistando uma a
cada 10 pessoas da fila.
d. Para dar a porcentagem de defeitos das 3000 peas fabricadas por dia, a cada
6 peas, uma retirada para teste.
38

SOBRE O IBGE - Censo


Para entender como funciona o IBGE, que tal conhecer um pouco sobre sua organiza-
o? Voc vai ver que o IBGE est presente no Brasil inteiro!
O IBGE composto por quatro diretorias (Executiva, de Pesquisas, de Geocincias e de
Informtica), um Centro de Documentao e Disseminao de Informaes e pela Esco-
la Nacional de Cincias Estatsticas (ENCE). Essas diretorias possuem funes especficas
e esto localizadas no municpio do Rio de Janeiro.
Para que nossas atividades possam cobrir todo o territrio nacional, possumos uma
rede nacional de pesquisa e disseminao, composta por:
27 Unidades Estaduais (26 nas capitais dos estados e 1 no Distrito Federal)
27 Supervises de Documentao e Disseminao de Informaes (26 nas capitais e
1 no Distrito Federal)
584 Agncias de Coleta de dados nos principais municpios brasileiros.
O IBGE mantm, ainda, a Reserva Ecolgica do Roncador, situada a 35 quilmetros ao sul
de Braslia. O Censo Demogrfico uma pesquisa realizada pelo IBGE a cada dez anos.
Atravs dele, reunimos informaes sobre toda a populao brasileira.
Nosso primeiro Censo aconteceu em 1872 e recebeu o nome de Recenseamento da
Populao do Imprio do Brasil. O mais recente foi o Censo 2010, cujos resultados voc
pode buscar no site do IBGE. Antes dele, o IBGE realizou o Censo 2000.
No Censo, os pesquisadores do IBGE visitam todos os domiclios do pas para aplicar um
questionrio. Depois de percorrer todos os cantos do Brasil, indo de casa em casa, os
pesquisadores organizam e analisam as informaes coletadas nos questionrios. Em se-
guida, divulgam os resultados em uma srie de publicaes sobre os temas estudados.
Os resultados do Censo Demogrfico so importantes para a sociedade ter informaes
atualizadas sobre a populao e para o governo planejar suas aes de forma mais ade-
quada.
No IBGE, muitas pessoas trabalham coletando, analisando e armazenando informaes
sobre a populao e as atividades econmicas de nosso pas. Em nosso instituto existem
duas grandes reas de pesquisa: a de informaes sociais, demogrficas e econmicas:
para produzir estas informaes, so realizadas pesquisas como o Censo Demogrfico,
o Censo Agropecurio e os ndices de Preos; a de informaes geogrficas: onde so
feitos os mapas, os estudos de recursos naturais e de meio ambiente.
Com estas informaes, o governo pode saber quem est estudando, onde so necess-
rias mais escolas, onde o nmero de lojas e fbricas maior, onde h mais empregos, o
que produzido em uma determinada regio e uma srie de outras coisas.
Fonte: adaptado de IBGE (2017, on-line).
MATERIAL COMPLEMENTAR

A Estatstica Fcil
Antnio Arnot Crespo
Editora: Saraiva
Sinopse: Este livro apresenta todos os tpicos exigidos pelo programa estabelecido
para os cursos profissionalizantes da rede de ensino particular e oficial, de forma
acessvel ao aluno, dentro de um esquema de ensino objetivo e prtico. O estudo
complementado por exerccios em abundncia com situaes prticas.
Trabalha com estatstica descritiva, probabilidades, distribuies de probabilidades,
correlao e regresso linear, de forma prtica e fcil linguagem.

Material Complementar
REFERNCIAS

BARBETTA, P. A. Estatstica aplicada s Cincias Sociais. 9. ed. Florianpolis SC:


UFSC, 2014.
BUSSAB, W. O.; MORETTIN, P. A. Estatstica Bsica. So Paulo: Saraiva, 2003.
CRESPO, A. A. Estatstica Fcil. 19. ed. So Paulo: Saraiva, 2009.
FONSECA, J. S. da; MARTINS, G. de A. Curso de Estatstica. 6. ed. 11. Reimp. So
Paulo: Atlas, 2008.
IBGE Instituto Brasileiro de Geografia e Estatstica. Pesquisa Nacional por Amos-
tra de Domiclios. 2006-2007. Disponvel em: <http://www.ibge.gov.br/home/es-
tatistica/pesquisas/pesquisa_resultados.php?id_pesquisa=40>. Acesso em: 18 abr.
2017.
IBGE Instituto Brasileiro de Geografia e Estatstica. Pesquisa Nacional por Amos-
tra de Domiclios. 2007-2009. Disponvel em: <http://www.ibge.gov.br/home/es-
tatistica/pesquisas/pesquisa_resultados.php?id_pesquisa=40>. Acesso em: 18 abr.
2017.
IBGE - Instituto Brasileiro de Geografia e Estatstica. Sobre o IBGE - Censo. Dispon-
vel em: <http://7a12.ibge.gov.br/sobre-o-ibge/nossas-pesquisas.html> Acesso em:
18 abr. 2017.
RAO, C. R. Statistics: a technology for the millennium Internal. J. Math. & Statist. Sci,
v. 8, n. 1, p. 5-25, jun. 1999.
TOREZANI, W. Apostila de Estatstica I. Vila Velha: Faculdade Univila, 2004.
41
GABARITO

1. A Estatstica pode ser definida como uma parte da matemtica que se preocupa
em coletar, organizar, descrever, analisar e interpretar um conjunto de dados.
A estatstica descritiva se preocupa em descrever os dados.
A estatstica inferencial se preocupa com a anlise dos dados e sua interpreta-
o. Ela analisa os dados com base na amostra e, ento, estende as concluses
desta amostra populao.

2. Populao conjunto de elementos que possuem alguma caracterstica em co-


mum.
Amostra parte da populao, devendo ser representativa dela.
Censo levantamento de dados de toda uma populao.
Estimao obteno de valores de uma amostra.
Variveis caractersticas tomadas em uma populao ou amostra, por exemplo:
sexo, idade, regio de procedncia, peso, etc.

3. Amostra Casual Simples - aquela em que todos os elementos da populao


tm igual probabilidade de pertencer amostra. Pode ser obtida sorteando os
elementos a partir da populao de estudo.
Amostra Sistemtica - uma forma simplificada da amostragem casual simples,
podendo ser utilizada quando os elementos da populao se apresentam orde-
nados, sendo a retirada dos elementos para compor a amostra feita com certa
periodicidade.
Amostra Estratificada uma amostra em que a populao separada em gru-
pos ou estratos e, dentro de cada estrato, os indivduos so sorteados, devendo
ser semelhantes entre si dentro de cada estrato.
Amostra por Conglomerado uma amostra em que a populao dividida em
diferentes conglomerados, extraindo-se uma amostra apenas dos conglomera-
dos selecionados, e no de toda a populao.

4. Representar os dados por meio de grficos e tabelas: os dados so apresentados


de forma resumida, em que h uma visualizao rpida e fcil deles para o p-
blico. H um entendimento melhor dos dados, ficando fcil sabermos o que est
ocorrendo com os dados coletados.

5.
a) Funcionrio da empresa, amostragem estratificada.
b) Senadores do Brasil, amostragem aleatria simples.
c) Pessoas na fila de atendimento, amostragem sistemtica.
d) Peas fabricadas, amostragem sistemtica.
Professora Me. Ivnna Gurniski De Oliveira
Professora Me. Renata Cristina de Souza Chatalov

II
UNIDADE
TABELAS E GRFICOS

Objetivos de Aprendizagem
Entender a importncia dos grficos e das tabelas.
Aprender a construir grficos e tabelas para variveis qualitativas.
Aprender a construir grficos e tabelas para variveis quantitativas.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Tabelas
Grficos
45

INTRODUO

Em uma pesquisa, geralmente, os dados so descritos e analisados com auxlio


de tcnicas estatsticas. As pesquisas precisam da Estatstica para alcanar seus
objetivos, principalmente, quando envolvem grande quantidade de informaes
que precisam ser resumidas.
A organizao dos dados em tabelas de frequncias nos proporciona um
meio eficaz de estudo do comportamento de caractersticas de interesse. Muitas
vezes, a informao contida nas tabelas pode ser mais facilmente visualizada
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

por meio de grficos. Como exemplo, podemos citar os meios de comunicao


que nos apresentam, diariamente, grficos das mais variadas formas para auxi-
liar na apresentao das informaes. Tambm os rgos pblicos e empresas
se municiam de grficos e de tabelas em seus documentos internos e relatrios
de atividades e de desempenho. Graas ao aumento dos recursos grficos, sua
construo tem sido cada vez mais simplificada por meio do uso de programas
computacionais, existindo hoje uma infinidade de tipos de grficos que podem
ser utilizados. importante salientar que existem diversas formas de grficos e
de tabelas e a escolha de uma ou outra forma depende da caracterstica com a
qual estamos trabalhando.
Diante disso, nesta unidade, temos o objetivo de ensin-lo(a) a construir as
tabelas e os principais tipos de grficos. Para essa construo, h necessidade
de separao das variveis. As variveis em estudos estatsticos so valores que
assumem determinadas caractersticas dentro de uma pesquisa e podem ser clas-
sificadas em: qualitativas ou quantitativas.
Para alguns tipos de grficos, podem ser utilizados tanto para uma, quanto
para outra varivel, entretanto, existem alguns tipos que so especficos para
variveis qualitativas ou quantitativas, portanto, interessante conhecer o tipo
adequado para cada caso.
importante desenvolver tanto a habilidade de construir tabelas e grficos,
quanto a de fazer uma leitura adequada deles.

Introduo
46 UNIDADE II

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
TABELAS

Quando retiramos as informaes da pesquisa, temos em mos os dados brutos.


A ideia transformar os dados brutos em informaes para que seu entendi-
mento e visualizao se tornem mais simples e rpidos.
Existem normas nacionais para a organizao de tabelas, ditadas pela
Associao Brasileira de Normas e Tcnicas (ABNT), que no sero aborda-
das aqui, mas convm saber que as tabelas so formadas por ttulo, cabealho,
corpo e fonte:
Ttulo: precede a tabela e resume o dado em estudo (O qu? Onde?
Quando?). Deve vir precedido da palavra tabela e de sua numerao. As
tabelas devem ser numeradas em ordem crescente maneira que apare-
cem no texto, ex.: Tabela 1; Tabela 2 e assim por diante.
Cabealho: especifica o contedo de cada coluna.
Corpo: formado por linhas e colunas contendo os dados.
Fonte: na parte inferior, informa-se a fonte da coleta de dados ou o autor.
A fonte cita o informante, caracterizando a confiabilidade dos dados.
As tabelas devero ser fechadas com traos horizontais nas bordas superior e
inferior, enquanto que nas bordas esquerda e direita no. Dentro das tabelas pode
haver traos verticais na separao das colunas no corpo da tabela ou entre as
linhas. conveniente, tambm, que o nmero de casas decimais seja padroni-
zado. Vejamos um exemplo a seguir:

TABELAS E GRFICOS
47
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Fonte: elaborada pelas autoras.

Uma tabela contm as categorias da varivel estudada e suas respectivas frequ-


ncias. Essas frequncias podem ser:
Absoluta (Fi), dada pela contagem do nmero de ocorrncias de
cada categoria.

Relativa (Fr), dada pela frequncia absoluta em relao ao total de


Fi
elementos (n) a serem estudados, ou seja, Fr = .
n
Percentual (Fr%), dada pela frequncia relativa multiplicada por
cem, ou seja, Fr% = Fi X 100.
n
Acumulada (Fac), dada pela soma das frequncias de todas as
linhas anteriores at a classe atual. Pode ser: frequncia acumulada
absoluta, frequncia acumulada relativa ou frequncia acumu-
lada percentual.

TABELAS PARA VARIVEIS QUALITATIVAS

Variveis qualitativas apresentam-se em categorias e, portanto, a representa-


o tabular deve ser feita por meio das frequncias referentes a cada uma das
categorias. Podem se apresentar de forma simples (com apenas uma varivel)
ou conjunta (com duas ou mais variveis).

Tabelas
48 UNIDADE II

Exemplo:
Tabela 02 - Distribuio de frequncias de indivduos que acessam o site quanto ao sexo

SEXO NMERO DE CLIENTES ( Fi ) Fr Fr% Fac


Masculino 7 7/11 = 0,636 63,6 7
Feminino 4 4/11 = 0,364 36,4 11
Total 11 1,0 100 -
Fonte: dados fictcios elaborados pelas autoras.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Outro exemplo:
Tabela 03 - Grupo de atributos que mais valorizam os imveis

GRUPO DE ATRIBUTOS PORCENTAGEM (%)


Localizao 27,47
Conforto 22,71
Segurana 20,51
Incorporao 17,58
Lazer 11,73
Fonte: dados fictcios elaborados pelas autoras.

Existem diversos tipos de variveis demonstradas em tabelas. O formato


das tabelas sempre o mesmo, podendo apresentar uma nica frequncia
como a frequncia absoluta ou a porcentagem ou, ainda, vrias frequncias
combinadas.

TABELAS E GRFICOS
49

As tabelas tambm podem se apresentar mostrando a combinao de algumas


variveis conjuntas. Observe que, na tabela a seguir, foram tomadas 2 variveis:
Regio e Ano.
Tabela 4 - Custo mdio (R$/m) das reas geogrficas de um dado pas

REGIO 2005 2006 2007 2008 2009


Norte 870,2 893,4 921,0 923,1 925,7
Nordeste 574,4 573,6 573,8 571,1 582,0
Sudeste 659,2 670,4 671,5 680,9 681,4
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Sul 1094,3 1112,0 114,6 1240,3 1500,4


Centro-Oeste 897,5 902,4 909,5 1002,1 1004,9
Fonte: dados fictcios elaborados pelas autoras.

TABELAS PARA VARIVEIS QUANTITATIVAS

Para variveis quantitativas contnuas ou discretas, com elevado nmero de valo-


res diferentes, a distribuio de frequncias apropriada apresentar os dados
em classes de valores.
Para esse procedimento, primeiramente, precisamos determinar o nmero
de classes. Uma classe uma linha da distribuio de frequncias.
Quando temos um conjunto de dados com muitos valores, recomendado
que seja colocado em uma tabela de frequncias. A seguir, aprenderemos como
fazer uma distribuio de frequncias de forma adequada.

Tabela Primitiva

Vamos considerar a forma pela qual podemos descrever os dados estatsticos


resultantes de variveis quantitativas, como por exemplo, o peso dos colaborado-
res de um setor, a estatura de um grupo de pessoas, as notas obtidas por alunos
de uma turma, dentre outros.

Tabelas
50 UNIDADE II

Supondo que resolvemos fazer uma coleta de dados referentes s estaturas


de 40 colaboradores de uma empresa, que resultou nos dados a seguir:
ESTATURAS DE 40 COLABORADORES DE UMA EMPRESA
166 160 161 150 162 160 165 167 164 160
162 168 161 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
Fonte: dados fictcios elaborados pelas autoras.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
A esse tipo de tabela, na qual os valores e/ou elementos no foram trabalhados,
nem numericamente organizados, denominamos de tabela primitiva.

Rol

A partir dos resultados anteriores, composta pelos 40 colaboradores de uma


empresa (tabela primitiva), difcil ns averiguarmos em torno de que valor tende
a se concentrar as estaturas, qual a menor ou qual a maior estatura ou, ainda,
quantos alunos se acham abaixo ou acima de uma dada estatura (CRESPO, 2009).
Depois que ns conhecemos os valores de certa varivel, fica difcil termos
uma ideia exata do comportamento do grupo como um todo, por meio dos dados
no ordenados. A maneira mais simples de organizar os dados por meio de
certa ordenao (crescente ou decrescente). A tabela obtida mediante a ordena-
o dos dados recebe o nome de rol.
O Rol definido como uma organizao dos dados, que pode ser em ordem
crescente ou decrescente. Para construirmos as tabelas de distribuio de fre-
quncias, fica mais fcil organizarmos os dados de forma crescente. Vamos ver
como ficou os dados organizados em Rol a seguir.
ESTATURAS DE 40 COLABORADORES DE UMA ORGANIZAO
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Fonte: dados fictcios elaborados pelas autoras.

TABELAS E GRFICOS
51

Observem que bem melhor para trabalharmos com os dados organizados, no


acham? A partir disso, j conseguimos visualizar algumas coisas quanto esta-
tura dos colaboradores, por exemplo, que o colaborador com a menor estatura
tem 150 cm e a maior estatura 173 cm.

Construindo uma Distribuio de Frequncia

a) Distribuio de Frequncia sem intervalo de classes


Uma distribuio de frequncias sem intervalo de classes consiste na simples
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

condensao dos dados de acordo as repeties de seus valores. Vejamos um


exemplo a seguir, referente s idades de 20 colaboradores de uma organizao:
20 18 18 19 21 25 28 28 28 28
28 21 25 29 29 29 18 18 25 21

Para agrup-los em uma tabela de frequncias sem intervalo de classes, vamos


organizar os dados em Rol (crescente).
18 18 18 18 19 20 21 21 21 25
25 25 28 28 28 28 28 29 29 29

Agora vamos construir a tabela de frequncias; basta colocarmos na coluna


Idades as referncias s idades, e nas colunas Frequncias quantas vezes as ida-
des se repetiram, vejam a seguir:
Tabela 5 - Idades de colaboradores de uma empresa

IDADES FREQUNCIA (Fi)


18 4
19 1
20 1
21 3
25 3
28 5
29 3
Total 20
Fonte: dados fictcios elaborados pelas autoras.

Tabelas
52 UNIDADE II

Vejam como simples, construmos a tabela e distribumos suas frequncias, ou


seja, quantas vezes a idade se repetiu.

b) Distribuio de Frequncia com intervalo de classes


Vamos construir uma tabela de frequncias com intervalo de classes com os
dados referentes Estatura de 40 alunos colaboradores; a varivel em questo,
estatura, para Crespo (2009), ser analisada e estudada mais facilmente quando
colocarmos valores ordenados em uma coluna e colocarmos, ao lado de cada
valor, o nmero de vezes que aparece repetido. Para isso, vamos construir uma

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
distribuio de frequncias.
Segue os dados em rol seguir:

ESTATURAS DE 40 COLABORADORES DE UMA ORGANIZAO


150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Fonte: dados fictcios elaborados pelas autoras.

Podemos chamar de frequncia o nmero de colaboradores que fica relacionado


a um determinado valor da varivel, isto , quantas vezes determinado valor se
repetiu (CRESPO, 2009). Podemos obter, ento, uma tabela que receber o nome
de distribuio de frequncia. Primeiro apresentamos a vocs esses dados em
uma distribuio de frequncias sem intervalos de classes, analisem:
Tabela 06 - Estaturas de 40 colaboradores de uma organizao

ESTATURAS (CM) FREQUNCIA


150 1
151 1
152 1
153 1
154 1
155 4
156 3

TABELAS E GRFICOS
53

ESTATURAS (CM) FREQUNCIA


157 1
158 2
160 5
161 4
162 2
163 2
164 3
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

165 1
166 1
167 1
168 2
169 1
170 1
172 1
173 1
Total 40
Fonte: dados fictcios elaborados pelas autoras.

O que podemos concluir por meio dessa tabela?


Vejam que nesse caso, quando temos muitos valores e resolvemos distri-
buir em uma tabela de frequncias sem intervalo de classes, a tabela fica
muito grande.
As frequncias (Fi) so as repeties dos valores no rol, por exemplo, a
altura 150 cm se repetiu uma vez, portanto sua frequncia 1; enquanto
a altura 151, tambm se repetiu uma vez, e tem sua frequncia igual a 1;
e assim sucessivamente, at completarmos a tabela.

Entretanto, essa tabela, feita essa distribuio de frequncias (sem o intervalo de


classes), est de fcil leitura? Poderia ser melhorada?
Essa tabela tem 22 classes, ou seja, 22 linhas (fora o cabealho e o total);
poderamos condensar esses valores, construindo uma tabela de distri-
buio de frequncias com intervalo de classes.

Tabelas
54 UNIDADE II

Vamos aprender a construir essa tabela? Vejamos os passos para sua elaborao.

1 Passo: Amplitude Total (AT): consiste na diferena entre o maior valor


do conjunto de dados e o menor valor do conjunto de dados, portanto:
AT = Xmax Xmn
No nosso exemplo:
AT = 173 150 = 23
(Vamos guardar esse valor, que tambm ser usado no 3 passo).

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
2 passo: determinar o nmero de classes (k): no h regras absolutas para
a escolha do nmero de classes (k), geralmente entre 5 e 20 classes sero satisfa-
trias para a maior parte dos conjuntos de dados. Uma regra prtica razovel :

K nmero de observaes
K= n
Usar um nmero pequeno de classes poderia concentrar a maioria das
observaes em uma ou duas classes. Se for usado um nmero grande de clas-
ses, muitas delas tero frequncias iguais zero.
No nosso exemplo, K = 40 = 6,32... = arredondando = 6.
Portanto, nossa tabela ter 6 classes.

3 passo: determinar a amplitude total: consiste na diferena entre o limite


inferior e o limite superior, sendo dado pela equao:
AC (h) =
Em que:
AT = Amplitude Total
K = nmero de classes
Portanto, AC ou h a diviso entre a amplitude total (AT) pelo nmero das
classes (K).
No nosso exemplo:
h= = 3,83 = arredondando 4.
Portanto, a diferena entre o limite inferior (li) e o limite superior (ls) da
classe ser igual a 4.

TABELAS E GRFICOS
55

4 passo: construir a Tabela de frequncias


O menor valor da classe denominado limite inferior (Li) e o maior valor
da classe, limite superior (Ls).
a. Para obteno da primeira classe, tomar como Li o menor valor. Ao Li,
somar o valor da AC (ou h) e assim se obtm o Ls.
b. Para construo da segunda classe, repetir o Ls da primeira classe, sendo
que este na segunda classe passa a ser o Li. A este valor adicionar o valor
de AC (ou h) e se obtm o Ls.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

c. Para a terceira classe, repetir o procedimento. O Ls da segunda classe


repetido na terceira classe e se torna o Li. A esse Li, adicionar o valor de
AC e assim se obtm o Ls. Esse definido procedimento deve ser repetido
at que se obtenha o nmero de classes. O Ls da ltima classe deve, obri-
gatoriamente, ser igual ou ultrapassar o maior valor do conjunto de dados.

Obs.: No se esquea de obedecer simbologia do limite entre as classes.


So os valores extremos de cada intervalo de classe representado por:
Li = limite inferior e Ls = limite superior, em que o limite inferior o menor
nmero da classe e o limite superior o maior nmero da classe. No nosso exem-
plo, o Li =150 e o Ls = 173.
Notaes entre os limites de classes:
Li |--- Ls : o limite inferior est includo na contagem da frequncia
absoluta da classe e o limite superior no.
Li ---| Ls : o limite superior est includo na contagem da frequncia
absoluta da classe e o limite inferior no.
Li |---| Ls : os limites inferiores e superiores esto includos na con-
tagem da frequncia absoluta da classe.
Li --- Ls : os limites inferiores e superiores no esto includos na
contagem da frequncia absoluta da classe.
Agora que j sabemos todas as regras, vamos construir a tabela de frequncias
seguindo os passos anteriores.
Com os dados organizados em rol (apresentados novamente para facilitar
na elaborao da tabela).

Tabelas
56 UNIDADE II

ESTATURAS DE 40 COLABORADORES DE UMA ORGANIZAO


150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Fonte: dados fictcios elaborados pelas autoras.

Tabela 07 - Estaturas de 40 colaboradores de uma organizao

IDADES FREQUNCIA (Fi)

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
150 |----- 154 4
154 |----- 158 9
158 |----- 162 11
162 |----- 166 8
166 |----- 170 5
170 |----- 174 3
Total 40
Fonte: dados fictcios elaborados pelas autoras.

Aps, contamos as frequncias (fi), quantos valores foram determinados para


cada classe da tabela.
Alm disso, temos as colunas complementares da tabela de frequncia, que
so:
a. Ponto mdio das Classes
O ponto mdio de uma classe dado por:
Li + Ls
xi =
2
Em que:
xi = Ponto mdio
Li = limite inferior
Ls = limite superior

TABELAS E GRFICOS
57

Veremos, na prxima unidade, que o ponto mdio de uma classe uti-


lizado para calcular a mdia aritmtica ponderada para um conjunto de
dados agrupados.
Obs.: S existe limite de classes em tabelas de frequncias com intervalo
de classes.

b. Frequncia relativa (fr ou fr %): a proporo dos dados que aparece


em cada classe, dada pela equao a seguir:
fi
fr(%) = . 100
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

n
Em que:
fr(%) = Frequncia relativa em percentual
fi = Frequncia da classe
n = nmero total de elementos (ou somatria da frequncia)

c. Frequncia acumulada (Fac): a representao da frequncia absoluta


(fi) de forma acumulada.

d. Frequncia Relativa Acumulada (FRac ): dada pela diviso da frequncia


acumulada pelo nmero total de elementos da srie em porcentagem (%).

Fac
FRac(%) = . 100
n
Em que:
FRac(%) = Frequncia relativa acumulada em percentual
Fac = Frequncia acumulada
n = nmero total de elementos (ou somatria da frequncia)

Tabelas
58 UNIDADE II

Vamos resolver as colunas complementares na tabela a seguir:


Tabela 08 - Estaturas de 40 colaboradores de uma organizao

IDADES (Fi) FR (%) Fac FRac(%) Xi


(150+154)/2=
150 |----- 154 4 (4/40)*100 = 10 4 (4/40)*100 = 10
152
(154+158)/2=
154 |----- 158 9 (9/40)*100 = 22,5 13 (13/40)*100 = 32,5
156
(158+162)/2=
158 |----- 162 11 (11/40)*100 = 27,5 24 (24/40)*100 = 60
160

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
(162+166)/2=
162 |----- 166 8 (8/40)*100 = 20 32 (32/40)*100 = 80
164
(166+170)/2=
166 |----- 170 5 (5/40)*100 = 12,5 37 (37/40)*100 = 92,5
168
(170+174)/2=
170 |----- 174 3 (3/40)*100 = 7,5 40 (40/40)*100 = 100
172
Total 40 100 972
Fonte: dados fictcios elaborados pelas autoras.

Para melhor apresentar nossa tabela, vamos apresent-la somente com os resul-
tados, sem os clculos dentro dela, observem:
Tabela 09 - Estaturas de 40 colaboradores de uma organizao

IDADES (Fi) FR (%) Fac FRac(%) Xi


150 |----- 154 4 10 4 10 152
154 |----- 158 9 22,5 13 32,5 156
158 |----- 162 11 27,5 24 60 160
162 |----- 166 8 20 32 80 164
166 |----- 170 5 12,5 37 92,5 168
170 |----- 174 3 7,5 40 100 172
Total 40 100 972
Fonte: dados fictcios elaborados pelas autoras.

TABELAS E GRFICOS
59

Observe que conseguimos ir tirando provas do nosso clculo em uma tabela


de frequncias, a saber:
a. Na coluna Fac (frequncia acumulada), o ltimo valor igual ao total da
somatria das frequncias, que tambm igual ao total de nmero de ele-
mentos do conjunto de dados (no nosso exemplo igual a 40).
b. Na coluna FR(%), a somatria de todos os nmeros igual a 100.
c. Na coluna FRac(%), o ltimo elemento igual a 100.
Analise que, para conseguirmos fazer uma tabela de frequncias, temos
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

que fazer um bom ROL, pois, se voc errar na distribuio da coluna fre-
quncias (fi), voc poder errar os dados de toda tabela.
Exemplo 02: Suponhamos que perguntamos a idade a um grupo de 100 pessoas
e, ainda, que desejamos representar os resultados obtidos distribudos em inter-
valos. As idades desse grupo esto apresentadas a seguir (em rol):
17 17 18 18 18 18 19 19 19 20
20 21 21 21 22 23 24 24 25 25
25 26 26 26 27 27 27 28 28 28
29 29 29 30 30 30 30 31 32 32
33 34 34 35 35 36 36 36 36 37
38 39 39 40 40 40 40 40 41 42
43 43 43 43 43 44 44 44 44 44
44 44 45 45 45 46 46 46 46 46
47 47 47 47 47 48 48 48 48 48
48 48 48 49 50 52 52 53 55 55
Fonte: elaborados pelas autoras.

1 passo: AT = X mx. X mn.: 55 17 = 38

2 passo: n = 100 = 10

AT 38
3 passo: h = = =3,8 = arredondando 4.
K 10

Tabelas
60 UNIDADE II

Tabela 10 - Idades de 100 colaboradores de uma organizao

IDADES Fi FR (%) Fac FRac (%) Xi


17 |----- 21 11 11 11 11 19
21 |----- 25 7 7 18 18 23
25 |----- 29 12 12 30 30 27
29 |----- 33 10 10 40 40 31
33 |----- 37 9 9 49 49 35
37 |----- 41 9 9 58 58 39
41 |----- 45 14 14 72 72 43

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
45 |----- 49 21 21 93 93 47
49 |----- 53 4 4 97 97 51
53 |----- 57 3 3 100 100 55
Total 100 100 370
Fonte: elaborada pelas autoras.

GRFICOS

Grficos so ferramentas de representao dos dados que servem para facilitar a


visualizao deles. Devem ter simplicidade e clareza para permitir se chegar a con-
cluses sobre a evoluo do fenmeno ou como se relacionam os valores da srie.
Cotidianamente, observa-se que meios de comunicao utilizam essa ferra-
menta para mostrar as pesquisas. Isso se deve ao fato da facilidade de interpretao
demonstrada nos grficos e da eficincia com
que resume informaes, embora apresente
menor grau de detalhes em relao s tabelas,
dando uma ideia mais global dos dados.
Ao optar pela utilizao de um grfico em uma
pesquisa, devemos levar em conta que sua cons-
truo exige cuidados, como escolher o tipo que
melhor se encaixa na representao dos dados.

TABELAS E GRFICOS
61

ELEMENTOS FUNDAMENTAIS DOS GRFICOS

Os elementos fundamentais de um grfico para que ele cumpra sua funo de


racionalizao das informaes so:
Ttulo: para indicar o que ele representa.
Legenda: para facilitar a leitura do grfico.
Fonte: para informar a origem dos dados.
A identificao ou o ttulo de um grfico deve aparecer na parte inferior dele,
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

precedido pela palavra Grfico, seguido de seu nmero de ordem de ocorrncia


no texto. Se necessrio, uma legenda explicativa pode ser utilizada. Se os dados
observados no grfico forem extrados de terceiros, como dados obtidos de uma
revista, de uma fundao, prefeitura, etc., ento, obrigatrio o uso de sua fonte.

GRFICOS PARA VARIVEIS QUALITATIVAS

Grficos em colunas

Esse tipo de grfico formado por retngulos verticais, em que cada um dos
retngulos representa a intensidade de um atributo. o grfico mais utilizado
para representar variveis qualitativas. Indicado quando as categorias so breves.
Exemplo:
5.5
5
4.5
4
Preo (R$)

3.5
3
2.5
2
1.5
1
Arroz Feijo Macarro Acar Leite

Produto
Grfico 1 - Valores de Produtos em um Supermercado
Fonte: elaborados pelas autoras.

Grficos
62 UNIDADE II

No caso de estarmos trabalhando com duas variveis, podemos utilizar os gr-


ficos comparativos. Por exemplo, em uma escola temos 120 alunos e o grfico a
seguir nos indica o nmero de alunos inscritos em cada modalidade esportiva
praticada na escola. Cada aluno s pratica um esporte.
30

25
25

20
18

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
N de alunos

15 Meninos
15
13 Meninas
11
10 10
10 9

5
5 4

0
Futebol Vlei Basquete Atletismo Tnis
Modalidade Esportiva
Grfico 2 - Modalidades Esportivas de uma escola
Fonte: elaborados pelas autoras.

Para os grficos comparativos, podemos utilizar as barras empilhadas, uma acima


da outra, como visto abaixo:
40
35
30
N de alunos

25
Meninos
20 Meninas
15
10
5
0
Futebol Vlei Basquete Atletismo Tnis
Grfico 3 - Modalidades Esportivas de uma escola
Fonte: elaborados pelas autoras.

TABELAS E GRFICOS
63

importante observar, neste tipo de grfico, que cada uma das modalidades de
esporte refere-se a uma das barras e dividida por sexo.

Grfico em barras

um grfico formado por retngulos horizontais, em que cada um deles representa


a intensidade de um atributo. O objetivo deste grfico de comparar grandezas,
e recomendvel para variveis cujas categorias tenham designaes extensas.
Exemplo:
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

2006

2004

Ano 2002

2000

1998

0 5 10 15 20
% de computadores por total de habitantes

Grfico 4 Valores de Produtos em um Supermercado


Fonte: elaborado pelas autoras.

Grfico de setores

Tambm conhecido como grfico de pizza. Neste tipo de grfico, a varivel em


estudo projetada num crculo dividido em setores com reas proporcionais s
frequncias das suas categorias. recomendado para o caso em que o nmero
de categorias no grande e no obedece a alguma ordem especfica.

Grficos
64 UNIDADE II

Exemplo:
No
informado
Aterro 5%
Controlado
18%

Aterro Vazadouro a

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Sanitrio cu aberto
14% (lixo)
63%

Grfico 5 - Destinao final de resduos slidos por nmero de municpio (2000)


Fonte: IBGE (2000, on-line).

Grfico de linhas

Este tipo de grfico utilizado para representar dados relacionados ao tempo.


feito colocando-se no eixo vertical (y) a mensurao da varivel em estudo e
no eixo horizontal (x) as unidades da varivel numa ordem crescente. Esse tipo
permite mostrar as flutuaes da varivel ao longo do tempo alm de analisar
as tendncias.
Exemplo:
Suponha uma empresa que esteja analisando o nmero de vendas de note-
books de certa marca nos primeiros 4 meses do ano.
Tabela 11 - Nmero de vendas de notebooks por ms

MS NMERO DE VENDAS
Janeiro 10
Fevereiro 16
Maro 9
Abril 12
Fonte: elaborada pelas autoras.

TABELAS E GRFICOS
65

18
16
Nmero de computadores

14
12
10
8
6
4
2
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

0
Janeiro Fevereiro Maro Abril
Ms

Grfico 6 - Nmero de vendas de notebooks por ms


Fonte: elaborado pelas autoras.

GRFICOS PARA VARIVEIS QUANTITATIVAS

Se o conjunto de dados consiste de muitas observaes, seria trabalhoso cons-


truir grficos como os j mencionados. Assim, para variveis quantitativas, so
usados outros dois grficos importantes: Histograma e Polgono de Frequncia.

Histograma

um grfico de colunas, sendo dispostos, no eixo horizontal, os limites das clas-


ses da varivel em questo, segundo as quais os dados foram agrupados e, no
eixo vertical, as frequncias para cada agrupamento. Um detalhe importante
que, no histograma, as colunas so retngulos justapostos.

Grficos
66 UNIDADE II

12

10

8
Frequncias (Fi)

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
2

0
150 | ----- 154 154 | ----- 158 158 | ----- 162 162 | ----- 166 166 | ----- 170 170 | ---- 174
Estaturas (em cm)
Grfico 7 - Estatura (em cm) de 40 colaboradores de uma organizao
Fonte: dados fictcios elaborados pelas autoras.

Polgono de frequncia

Segundo Crespo (2009), o polgono de frequncia um grfico de linhas, sendo


as frequncias marcadas sobre perpendiculares ao eixo horizontal, levantadas
pelos pontos mdios dos intervalos de classes. Vejamos um exemplo desse gr-
fico a seguir:
5

4
Frequncia (Fi)

0
0 | --- 2 2 | --- 4 4 | ---- 6 6 | ---- 8 8 | ------ 10

Idades

Grfico 8 - Idades de crianas em uma creche


Fonte: dados fictcios elaborados pelas autoras.

TABELAS E GRFICOS
67

Os diversos tipos de grficos sempre tm o mesmo objetivo: mostrar os da-


dos de forma resumida. O tipo de grfico a ser utilizado depende da escolha
e do objetivo do pesquisador.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

A interpretao adequada de um grfico ou tabela fundamental para o entendi-


mento da pesquisa. Ler o ttulo de forma minuciosa e observar valores mximos,
mnimos e suas variaes so pontos fundamentais para uma interpretao
adequada.

O Microsoft Excel no fornece mais o assistente de grfico. Agora, para criar


um grfico bsico, selecione uma parte do contedo que pretende repre-
sentar e clique no tipo de grfico desejado na guia Inserir, no grupo Grficos.
O Microsoft Excel possui um assistente para facilitar a gerao de grficos,
no qual ele divide este processo em quatro etapas subsequentes, apresen-
tando a cada etapa apenas as opes, diretamente, relacionadas e necess-
rias para a concluso do grfico.
Fonte: Support Office (2017)

Grficos
68 UNIDADE II

CONSIDERAES FINAIS

Nesta unidade, tratamos da necessidade de que a apresentao dos dados seja


feita de forma precisa. As duas formas vistas, nesta unidade, foram tabelas e gr-
ficos. Enfatizamos que o uso correto das formas de apresentao dos dados
fundamental para o sucesso da pesquisa.
Os grficos so formas de sintetizar as informaes coletadas. So impor-
tantes para dispormos as informaes de forma clara e para que consigamos
enxergar o que aconteceu na nossa pesquisa. Existem diversos tipos de grficos.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Nesta unidade, vimos os tipos mais comuns como os de barras e colunas, os de
linha, de setores ou pizza, histograma e polgono de frequncia.
De forma geral, os grficos demonstram dados quantitativos associados a
alguma varivel qualitativa. Todos os grficos tm o mesmo objetivo, que o
de demonstrar de forma clara e rpida os dados da pesquisa. A escolha do tipo
adequado fica ou a critrio do pesquisador ou a critrio do objetivo da pesquisa
estudada.
Nessa etapa, o interesse maior consiste em tirar concluses que auxiliem o
pesquisador a resolver seu problema. Portanto, alm da organizao e da tabu-
lao dos dados, as tabelas e os grficos nos apresentam de uma forma clara,
sucinta e objetiva os resultados de uma pesquisa, para tirarmos concluses e nos
ajudarem na tomada de decises.
Tambm observamos que podemos construir grficos e tabelas por meio
de programas computacionais, por exemplo, o Microsoft Excel, que uma pla-
nilha de dados que dispe de ferramentas para construo de grficos, a partir
de tabelas. Esse programa fcil de usar, tem inmeras ferramentas que podem
ser teis ao gestor.
Esperamos que voc tenha compreendido essa unidade, porque ela de
extrema importncia aos futuros profissionais, pois tabelas e grficos esto pre-
sentes no nosso cotidiano, e cabe a ns entender, interpretar e avaliar os dados
apresentados por meio de tabelas e de grficos.

TABELAS E GRFICOS
69

Considere a seguinte planilha de dados quanto s topologias de rede de computa-


dores na resposta do tempo ao usurio:

INFORMAO TOPOLOGIA TEMPO DE RESPOSTA


1 C1 6,0
2 C2 7,0
3 C3 5,0
4 C1 6,3
5 C2 6,8
6 C2 7,2
7 C1 6,0
8 C2 6,7
9 C1 5,7
10 C2 6,5
11 C3 6,4
12 C1 5,7
13 C3 7,2
14 C3 6,8
15 C3 6,5
16 C2 7,5

1. Construa uma tabela de distribuio de frequncias para Topologia.

2. Construa um grfico de setores para Topologia.

3. Construa uma tabela de distribuio de frequncias com intervalo de clas-


ses para a varivel tempo de resposta em quatro classes.

4. Demonstre um histograma para a varivel tempo de resposta.

5. Demonstre um polgono de frequncias para a varivel tempo de resposta.


70

REGRAS DE ARREDONDAMENTO
Arredondamentos so de fundamental importncia para nossos estudos, principalmen-
te ao calcular valores que tm muitas casas decimais. Muitas vezes, conveniente supri-
mir unidades inferiores s de determinada ordem. Esta tcnica denominada arredon-
damento de dados ou valores.

Muitas vezes muito mais fcil e mais compreensvel usarmos valores arredondados
para melhor entendimento do pblico que ter acesso informao.
De acordo com a Resoluo n 886/66 do IBGE:
I) < 5 (menor que 5). Quando o primeiro algarismo a ser abandonado 0,1,2,3 ou 4, ficar
inalterado o ltimo algarismo que permanece.
Exemplo:
43,24 passa para 43,2.
54,13 passa para 54,1.

II) > 5 (maior que 5). Quando o primeiro algarismo a ser abandonado o 6,7,8, ou 9,
aumenta-se em uma unidade o algarismo que permanece.
Exemplos:
23,87 passa para 23,9.
34,08 passa para 34,1.
74,99 passa para 75,0.

III) = 5 (igual a 5). Quando o primeiro algarismo a ser abandonado 5, h duas solues:
A) Se aps o 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se
uma unidade ao algarismo que permanece.
Exemplos:
6,352 passa para 6,4.
55,6501 passa para 55,7.
96,250002 passa para 96,3.
71

B) Se o 5 for o ltimo algarismo ou aps o 5 s se seguirem zeros, o ltimo algarismo a


ser conservado s ser aumentando de uma unidade se for mpar.

Exemplos:
14,75 passa para 14,8
24,65 passa para 24,6
34,75000 passa para 34,8
44,8500 passa para 44,8

Observao: Nunca devemos fazer arredondamentos de sucessivos.


Para melhor entendimento didtico quando o ltimo primeiro algarismo a ser abando-
nado for 5 o ltimo a permanecer aumenta em uma unidade.

Exemplo:
72,5 passa para 73 inteiros.
72,45 passa para 72,5 (setenta e dois inteiros e cinco dcimos) - uma casa aps a vrgula.
72,445 passa para 72,45 (setenta e dois inteiros e quarenta e cinco centsimos) duas
casas aps a vrgula.

Fonte: Portal da Educao (2013, on-line).


MATERIAL COMPLEMENTAR

Estatstica Bsica
Geraldo Luciano Toledo, Ivo Izidoro Ovalle
Editora: Atlas
Sinopse: Este livro contm a matria fundamental para estudos subsequentes no
campo da estatstica inferencial. Alm disso, aborda os tpicos mais importantes da
estatstica bsica.
73
REFERNCIAS

CRESPO, A. A. Estatstica Fcil. So Paulo: Saraiva, 19. ed., 2009.


IBGE - Instituto Brasileiro de Geografia e Estatstica. Comentrios. Disponvel em:
<https://www.ibge.gov.br/home/estatistica/economia/ppm/2006/comentarios.
pdf >. Acesso em: 20 abr. 2017.
IBGE Instituto Brasileiro de Geografia e Estatstica. Pesquisa Nacional por Amos-
tra de Domiclios. 2006-2007. Disponvel em: <http://www.ibge.gov.br/home/es-
tatistica/pesquisas/pesquisa_resultados.php?id_pesquisa=40>. Acesso em: 20 abr.
2017.
IBGE Instituto Brasileiro de Geografia e Estatstica. Pesquisa Nacional por Amos-
tra de Domiclios. 2007-2009. Disponvel em: <http://www.ibge.gov.br/home/es-
tatistica/pesquisas/pesquisa_resultados.php?id_pesquisa=40>. Acesso em: 20 abr.
2017.
PORTAL DA EDUCAO. Regras de Arredondamento. Disponvel em:<https://
www.portaleducacao.com.br/conteudo/artigos/administracao/regras-de-arredon-
damento/30568> Acesso em: 20 abr. 2017.
SUPPORT OFFICE. Criar um grfico do incio ao fim. Disponvel em: <https://su-
pport.office.com/pt-br/article/Criar-um-gr%C3%A1fico-do-in%C3%ADcio-ao-fim-
-0baf399e-dd61-4e18-8a73-b3fd5d5680c2> Acesso em: 20 abr. 2017.
GABARITO

1. Tabela 01 - Distribuio de frequncias para a varivel topologia


TOPOLOGIA Fi Fr% Fac
C1 5 31,25 5
C2 6 37,50 11
C3 5 31,25 16
Total 16 100,00 -

Fonte: as autoras.

2.
C1 C2 C3

31,25% 31,25%

37,50%

Grfico 01 - Porcentagem de clientes para a varivel topologia


Fonte: as autoras.

7,5 - 5,0
3. AC = = 0,625 = arredondando para 0,63
4
Tabela 01 - Distribuio de frequncias para a varivel tempo de resposta
TEMPO Fi Fr% Fac Xi
5,00 |--5,63 1 6,25 1 5,32
5,63 |--6,26 4 25,00 5 5,95
6,26 |--6,89 7 43,75 12 6,58
6,89|--7,52 4 25,00 16 7,21
Total 16 100,00 - -

Fonte: as autoras.
75
GABARITO

4.
8
7
7

5
4 4
4

2
1
1

0
5,00 | -- 5,63 5,63 | -- 6,26 6,26 | -- 6,89 6,89 | -- 7,52
Grfico 02 - Porcentagem de clientes para a varivel tempo de resposta ao usurio
Fonte: as autoras.

5.

Grfico 3 - Porcentagem de clientes para a varivel tempo de resposta


Fonte: as autoras.
Professora Me. Ivnna Gurniski De Oliveira
Professora Me. Renata Cristina de Souza Chatalov

III
MEDIDAS DESCRITIVAS

UNIDADE
ASSOCIADAS A VARIVEIS
QUANTITATIVAS

Objetivos de Aprendizagem
Compreender as principais medidas estatsticas de posio, disperso
e separatrizes.
Entender a aplicao das medidas estatsticas de posio, disperso e
separatrizes.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Medidas de Posio
Medidas Separatrizes
Medidas de Disperso
79

INTRODUO

Quando estamos realizando uma pesquisa, podemos fazer a apresentao dos


dados por meio de grficos, tabelas, ou fazendo o uso de medidas que resumem
as informaes obtidas na coleta dos dados, chamadas medidas descritivas.
Nesta unidade, estudaremos as medidas de posio e de disperso utilizadas
para descrever dados quantitativos. Essas medidas so demasiadas importantes
na representao dos dados.
As medidas de posio ou de tendncia central mostram o centro de uma
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

distribuio de dados, dando-nos uma noo do que est ocorrendo com eles.
Por meio dessas medidas, podemos localizar a maior concentrao de valores
em uma distribuio, ou seja, se ela localiza-se no incio, no meio ou no centro,
ou, ainda, se h uma distribuio por igual. As medidas de tendncia central
mais importantes so a mdia aritmtica, a mediana e a moda. Vale salientar
que temos outras medidas de posio que so as separatrizes, que englobam: a
prpria mediana, os quartis e os percentis.
As medidas de disperso, porm, so utilizadas para avaliar o grau de varia-
bilidade do conjunto de dados, mostrando se ele homogneo ou heterogneo.
Essas medidas servem para analisar o quanto os dados so semelhantes e des-
crevem o quanto os dados distanciam do valor central, portanto as medidas de
disperso servem tambm para avaliar o grau de representao da mdia. As
medidas de disperso mais utilizadas so: a amplitude total, a varincia, o des-
vio padro e o coeficiente de variao.
Assim, para descrevermos um conjunto de dados, de bom grado sempre
termos uma medida de posio e uma de disperso para represent-lo. A de
posio, para dizer o que est ocorrendo com a pesquisa, e a de disperso, para
dizer se h alta ou baixa variabilidade.
Nesta unidade, vamos estudar as principais medidas de posio e medidas
de disperso utilizadas nas pesquisas para descrever e representar o conjunto
de dados.

Introduo
80 UNIDADE III

MEDIDAS DE POSIO

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Para sumarizar as informaes de um conjunto de observaes, muitas vezes
necessrio utilizar medidas que resumem em um s nmero certas caracte-
rsticas. Assim, temos as medidas de posio, de disperso, de assimetria e de
curtose. Se as medidas so calculadas para dados a partir de uma amostra, so
chamadas de estatsticas da amostra; se so calculadas a partir de uma popula-
o, so chamadas de parmetros da populao.
As principais medidas de posio e as principais medidas separatrizes so:

As principais medidas de disperso so:

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


81

As medidas de posio servem para representar o ponto central de equilbrio


de um conjunto de observaes ordenadas segundo suas grandezas. Dentre as
medidas de posio, destacamos: mdia, mediana e moda, sendo que a medida
a ser escolhida para representar coerentemente os dados depende das caracte-
rsticas deles.

MDIA ARITMTICA
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

A mdia de uma varivel a medida mais importante e mais simples de ser cal-
culada. Esta fornece uma medida de posio central. Se os dados so de uma
amostra, a mdia denotada por ; se os dados so de uma populao, a mdia
denotada pela letra grega .
A mdia de um conjunto de dados encontrada somando seus valores e
dividindo pelo nmero de observaes. Seja x1, x2, ..., xn um conjunto de dados,
a mdia ser dada por:

Populao Amostra

Exemplo:
Suponha que estamos estudando a idade de cinco indivduos de uma famlia.
As idades observadas foram: 5, 10, 12, 35, 38. Logo, a idade mdia dessa famlia :
n

i=1
xi x1 + x2 + ... + xn
x= =
n n

x = 5 + 10 + 12 + 35 + 38 = 20 anos
5

Medidas de Posio
82 UNIDADE III

Exerccio
Calcule a mdia para a quantidade de atendimentos realizados em um ms
por um consultor financeiro.

18, 19, 20, 21, 21, 22, 24, 34, 35, 37


R: 25,1

MDIA ARITMTICA PONDERADA

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Existem situaes em que no temos todos os dados disponveis ou ento temos
pesos diferentes para os dados considerados. Nestes casos, utilizamos o que
chamamos de mdia aritmtica ponderada para obtermos a mdia, cujas frmu-
las para Populao e para Amostra so dadas da seguinte maneira:

Populao Amostra

Se a situao for de dados agrupados, a mdia obtida a partir de uma ponde-


rao em que os pesos so as frequncias absolutas (Fi) de cada classe e xi o
ponto mdio da classe i. Observe o exemplo abaixo:
Tabela 1 - Idades de colaboradores de uma empresa

IDADES FREQUNCIA (Fi)


18 4
19 1
20 1
21 3
25 3
28 5
29 3
Total 20
Fonte: dados fictcios elaborados pelas autoras.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


83

A mdia ponderada ser dada por:


476
20
= 23,8

Tabela 2 - Idades de colaboradores de uma empresa

IDADES FREQUNCIA Xi. Fi


18 4 72
19 1 19
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

20 1 20
21 3 63
25 3 75
28 5 140
29 3 87
Total 20 476
Fonte: dados fictcios elaborados pelas autoras.

476 = 23,8.
20

Quando desejamos obter a mdia de dados que esto distribudos em uma tabela com
intervalo de classes, a equao para determinar a mdia continua sendo a mesma,
no entanto, temos que tirar o ponto mdio antes. Observem um exemplo a seguir.
Tabela 03 - Idades de 100 colaboradores de uma organizao

IDADES Fi Xi Xi. Fi
17 |----- 21 11 19 (11*19) = 209
21 |----- 25 7 23 (7*23) = 161
25 |----- 29 12 27 (12*27) = 324
29 |----- 33 10 31 (10*31) = 310
33 |----- 37 9 35 (9*35) = 315
37 |----- 41 9 39 (9*39) = 351
41 |----- 45 14 43 (14*43) = 602
45 |----- 49 21 47 (21*47) = 987

Medidas de Posio
84 UNIDADE III

49 |----- 53 4 51 (4*51) = 204


53 |----- 57 3 55 (3*55) = 165
Total 100 370 3.628
Fonte: dados fictcios elaborados pelas autoras.

3.628 = 36,28 = 36.


100

Exerccio:
Tabela 4 - Distribuio de frequncias para a idade dos clientes de uma imobiliria para efetuar uma compra

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
CLASSES Fi Fr(%) Fac Xi
17 |---- 29 4 36,4 4 23
29 |---- 41 4 36,4 8 35
41 |----| 53 3 27,3 11 47
Total 11 100 - -
Fonte: dados fictcios elaborados pelas autoras.

Resposta: 33,91

Existem situaes em que os dados no esto agrupados, mas existem pesos


diferentes para cada um deles. Vejamos um exemplo:
A mdia da nota bimestral dos alunos da Unicesumar composta pela nota
de uma prova (com peso 8) e pela nota dos trabalhos (com peso 2). Calcule a
mdia bimestral do aluno que tirou as seguintes notas:

Prova: 7 (peso 8) Trabalho: 9 (peso 2)

A mdia ser dada por:

x = (8 x 7) (2 x 9) = 7,4
8+2

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


85

Exerccio: Calcule as mdias ponderadas das notas bimestrais dos alunos abaixo:
Tabela 5 - Mdias bimestrais dos alunos da Escola X

ALUNO PROVA TRABALHO


Joo 5,0 3,0
Antnio 7,0 4,0
*Considere que o peso da prova seja igual a 9,0 e o peso do trabalho seja igual a 1,0.
Fonte: dados fictcios elaborados pelas autoras.

Resposta: 4,8 e 6,7


Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

A mdia a medida mais importante dentro de um conjunto de dados e pos-


sui algumas propriedades importantes. So elas:
1. A mdia nica em um conjunto de dados.
2. A mdia afetada por valores extremamente pequenos ou grandes.
3. A mdia depende de todos os valores observados, assim, qualquer modi-
ficao nos dados far que a mdia fique alterada.
4. A soma das diferenas dos valores observados em relao mdia zero:

(xi - x) = 0

A propriedade 2 importante, pois, em um conjunto de dados muito hetero-


gneo, a mdia torna-se uma medida no apropriada para representar os dados,
devendo o pesquisador optar por uma outra medida.
A propriedade 4 importante na definio de varincia, uma medida de dis-
perso que veremos ainda nesta unidade.

Medidas de Posio
86 UNIDADE III

O conceito e a ideia de mdia esto sempre relacionados com a soma dos


valores de um determinado conjunto de medidas, dividindo-se o resultado
dessa soma pela quantidade dos valores que foram somados.Esse proce-
dimento o que definimos como mdia aritmtica simples, e que estamos
acostumados a aplicar nas estimativas que fazemos diariamente.
No faltam brincadeiras em relao a esse tipo de clculo quando, ironica-
mente, calculamos a mdia salarial de, por exemplo, determinada empre-
sa, somando o maior salrio com o menor e dividindo por dois. A mdia
aritmtica simples produz a mdia ponderada em funo da repetio das
medidas. Geralmente, a mdia ponderada apresentada com regras pr-es-

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
tabelecidas para os seus pesos, dando a aparncia de que se trata de outra
frmula, muito diferente da mdia aritmtica.
Fonte: Neto (2009).

MODA

Chamamos de moda o valor que aparece com maior frequncia em um con-


junto de dados. Para o caso de valores individuais, a moda pode ser determinada
observando-se o rol dos dados.
Exemplos:
Observe as notas da prova de estatstica de uma turma do curso de
administrao:
4; 5; 6; 6; 6; 6; 7; 7; 7; 8.
A moda 6, pois esse o valor que ocorreu com maior frequncia.
Essa sequncia unimodal, pois tem apenas uma moda.
Veja essa outra sequncia:
4; 5; 5; 5; 6; 7; 7; 7; 8; 9.
Nesta, existem duas modas (5 e 7), ela bimodal.
Essa outra:
1; 2; 3; 4; 5; 6; 7; 8; 9; 10.
No existe moda, nenhum valor aparece com maior frequncia, amodal
ou antimodal.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


87

Quando os dados esto agrupados em classes, primeiramente necessrio


identificar a classe modal que apresenta a maior frequncia e calcular ento a
moda da seguinte maneira:

h(Fi - Fi - 1)
Mo = li +
(Fi - Fi - 1) + (Fi - Fi + 1)

Em que:
i a ordem da classe modal.
li o limite inferior da classe modal.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

h a amplitude da classe modal.


Fi a frequncia absoluta da classe modal.
Fi - 1 a frequncia absoluta da classe anterior classe modal.
Fi + 1 a frequncia absoluta da classe posterior classe modal.

Se o conjunto de dados apresentar todos seus elementos com a mesma fre-


quncia absoluta, no existir a moda. Se ocorrer vrias frequncias iguais, ento
teremos uma distribuio com mais de uma moda.
A moda tem o atributo de no ser afetada pelos valores extremos no con-
junto de dados.
Exemplo:
Tabela 06 - Idades de 100 colaboradores de uma organizao

IDADES Fi Xi
17 |----- 21 11 19
21 |----- 25 7 23
25 |----- 29 12 27
29 |----- 33 10 31
33 |----- 37 9 35
37 |----- 41 9 39
41 |----- 45 14 43
45 |----- 49 21 47
49 |----- 53 4 51
53 |----- 57 3 55
Total 100 370
Fonte: dados fictcios elaborados pelas autoras.
Medidas de Posio
88 UNIDADE III

Para isso, devemos determinar a classe modal. A classe modal a classe com
a maior frequncia absoluta e, neste caso, a terceira classe, pois essa possui o
maior valor de Fi . Determinada a classe modal, vamos calcular a moda por meio
da frmula para dados agrupados.
Nesse exemplo, temos que a classe modal a 8 classe, pois nela que temos
a maior frequncia, agora que localizamos a classe modal, vamos aplicar a equa-
o dada:

h(Fi - Fi - 1) 4(21 - 14)


Mo = li = = 45 + = 46,16

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
(Fi - Fi - 1) + (Fi - Fi + 1) (21 - 14) + (21 - 4)

Portanto, a moda para o conjunto de dados da Tabela 46,16 ou arredon-


dando 46.

MEDIANA

Corresponde ao valor central ou mdia aritmtica dos dois valores centrais de


um conjunto de observaes organizadas em ordem crescente. Ou seja, 50% das
observaes so inferiores mediana e 50% superiores.
Exemplo:
Uma pesquisa em uma empresa apresentou os seguintes dados relacionados
ao tempo de trabalho de seus funcionrios:
5, 13, 12, 3, 15, 17, 8, 15, 6, 16, 9.
Para encontrarmos a mediana, primeiramente devemos ordenar os dados
brutos transformando-os em um rol, ou seja, organizando os dados:

3, 5, 6, 8, 9, 12,13, 15, 15, 16, 17

Identificamos a posio da mediana, aps verificar que o conjunto de dados


mpar, pois n = 11 elementos. Utilizamos a frmula:
Se n for mpar: Md = , portanto: = = 6. Nesse caso, a mediana o
6 elemento do conjunto de dados. Depois localizamos o elemento central, no
caso 12, pois esquerda dele temos 5 elementos e direita tambm. Assim temos:

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


89

Md = 12.
3, 5, 6, 8, 9, 12, 13, 15, 15, 16, 17

Quando o rol tiver nmero par de elementos, a mediana ser a mdia aritmtica
entre os dois elementos centrais. Vejamos, por exemplo, um rol com 10 elemen-
tos (nmero par de elementos):
3, 5, 6, 8, 9, 13, 14, 15, 15, 16.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Md = = 11

Assim, considerando n o nmero de elementos da srie, o valor mediano


ser dado pelo termo de ordem dado pelas seguintes frmulas:

Se n for mpar: Md =

Se n for par: Md = (mdia entre dois nmeros)

Exerccio:
Calcule a mediana para as notas dos alunos nas duas situaes seguintes:
6.0, 4.5, 5.0, 7.0, 6.5;
4.8, 6.3, 8.9, 9.5, 6.0, 7,8;

Resposta: 6.0 e 7.05

Para os dados agrupados em distribuio de frequncias em classes, tem-se:

h(p - Fac - 1)
Md = li +
Fi

Em que:
li o limite inferior da classe da mediana.
h a amplitude da classe da mediana.

Medidas de Posio
90 UNIDADE III

p indica a posio da mediana, onde n , sendo o nmero total de elementos.


Fac - 1 a frequncia acumulada da classe anterior da mediana.
Fi a frequncia absoluta da classe da mediana.
Exemplo:
Vamos encontrar a mediana para o seguinte conjunto de dados:
Tabela 08 - Idades de 100 colaboradores de uma organizao

IDADES Fi Fac Xi
17 |----- 21 11 11 19

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
21 |----- 25 7 18 23
25 |----- 29 12 30 27
29 |----- 33 10 40 31
33 |----- 37 9 49 35
37 |----- 41 9 58 39
41 |----- 45 14 72 43
45 |----- 49 21 93 47
49 |----- 53 4 97 51
53 |----- 57 3 100 55
Total 100 370
Fonte: dados fictcios elaborados pelas autoras.

Primeiramente devemos determinar em qual classe a mediana est, para isso


calculamos o valor de p.

p= n p = 100 = 50
2 2

Quando o valor de p for decimal, sempre aproximamos seu valor para cima.
Para saber qual a classe da mediana, devemos olhar na coluna da frequncia
acumulada, de modo que p Fac . Logo, a mediana est na 6 classe. Em seguida,
aplicamos a equao da mediana:

h(p - Fac - 1) 4(50 - 49)


Md = li + = 37 + = 37,44
Fi 9

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


91

Para qualquer assunto que trate de dados numricos, sempre trabalhamos


com uma medida de posio. Normalmente usamos a mdia, que a medi-
da mais conhecida. Observe tambm como essas medidas so importantes
no seu cotidiano.
(As autoras)

MEDIDAS SEPARATRIZES
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

As separatrizes so os valores que dividem as sries em partes iguais. As prin-


cipais medidas separatrizes so: a mediana (j estudada) e os quartis, os decis
e os percentis.

QUARTIS

Chamamos de quartis os valores que dividem a distribuio em 4 partes iguais,


e podem ser obtidos da seguinte maneira:

Temos trs quartis:


Primeiro quartil (Q1) o valor que tem 25% dos dados sua esquerda e
o restante (75%) direita.
Segundo quartil (Q2) tem 50% dos dados de cada lado, coincide com a
mediana.
Terceiro quartil (Q3) tem 75% dos dados sua esquerda e 25% direita.

Frmulas:

1 Quartil (Q1) P=0,25(n +1)


2 Quartil (Q2) P=0,50(n +1)
3 Quartil (Q3) P=0,75(n +1)

Medidas Separatrizes
92 UNIDADE III

DECIS

Chamamos de decis os valores que dividem uma srie em dez partes iguais.
Portanto, temos nove decis, o primeiro tem 10% dos dados sua esquerda e 90%
sua direita, o segundo tem 20% dos dados sua esquerda e 80% sua direita
e assim por diante at o nono decil, que tem 90% dos dados sua esquerda e
10% sua direita.
1 Decil (D1) P=0,10(n +1)
2 Decil (D2) P=0,20(n +1)

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
3 Decil (D3) P=0,30(n +1)
4 Decil (D4) P=0,40(n +1)
5 Decil (D5) P=0,50(n +1)
6 Decil (D6) P=0,60(n +1)
7 Decil (D7) P=0,70(n +1)
8 Decil (D8) P=0,80(n +1)
9 Decil (D9) P=0,90(n +1)

PERCENTIS

Chamamos de percentis os noventa e nove valores que separam uma srie em


100 partes iguais. O clculo dos percentis est relacionado com percentagem.
No quadro seguinte, so mostrados alguns percentis:
5 Percentil (P5) P=0,05(n +1)
25 Percentil (P25) P=0,25(n +1)
50 Percentil (P50) P=0,50(n +1)
75 Percentil (P75) P=0,75(n +1)
90 Percentil (P90) P=0,90(n +1)

Em que a letra n nas frmulas de calcular a posio dos quartis, dos decis e dos
percentis representa o nmero total de elementos da amostra.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


93

Quando o valor de p for inteiro, temos que a medida separatriz est na posi-
o de nmero p, caso contrrio, o clculo das medidas separatrizes, para os
dados em rol, dado por:

Sk = Xi + (p - i) (Xi + 1 - Xi)

Em que:
Sk a medida separatriz a ser utilizada, podendo ser os quartis, os decis ou
os percentis.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Xi e Xi +1 so as posies dos dados no rol.


p a posio da medida separatriz adotada.
i a parte inteira de p.

Calcule o 3 quartil (Q3) e o 90 percentil (P90) para a idade mdia de um


grupo de indivduos que tm as seguintes idades: 18, 19, 20, 21, 21, 22, 24, 24,
25, 27, 30, 33, 38.
Primeiramente, verifique se os dados do rol esto ordenados; caso no este-
jam, coloque-os em ordem crescente. Em seguida, calcule a posio do dado e,
por fim, substitua os valores numricos na frmula: Sk = Xi + (p - i) (Xi + 1 - Xi).
Para o (Q3) tem-se:
p = 0,75(13 +1) = 10,5 k = 10
Assim,
Q3 = X10 + (p - k)(X11 - X10)

Q3 = 27 + (10,5 - 10)(30 - 27)


Q3 = 27 + (0,5 . 3)
Q3 = 28,5 anos.
Portanto, pode-se afirmar que 75% dos indivduos tm idade inferior a
28,5 anos.

Medidas Separatrizes
94 UNIDADE III

Para o (P90) tem-se:


p = 0,90(13 +1) = 12,6 k = 12
Assim,
P90 = X12 + (p - k)(X13 - X12)

P90 = 33 + (12,6 - 12)(38 - 32)


P90 = 33 + (0,6 . 5)
P90 = 33 + (0,6 . 5)

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
P90 = 36 anos.
Portanto, 90% dos indivduos tm idade inferior a 36 anos.

Para os dados agrupados, o clculo das medidas separatrizes dado por

h(p - Fac - 1)
Sk = li +
Fi

Em que:
Sk a medida separatriz a ser utilizada, podendo ser os quartis, os decis ou
os percentis.
li o limite inferior da classe da separatriz.
h a amplitude da classe da separatriz.
p a posio da medida separatriz adotada. Sendo que para os quartis p = nk 4
,
nk nk
k = 1, 2, 3; para os decis p = 10 , k = 1, 2, ..., 9; para os percentis p = 100, k = 1, 2, ...,
99; onde n a quantidade de elementos da amostra.
Fac - 1 a frequncia acumulada da classe anterior a da separatriz.
Fi a frequncia absoluta da classe da separatriz.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


95

Exemplo:
Vamos determinar o Q3 e o D7 para o seguinte conjunto de dados:
Tabela 9 - Teor de oxignio (mg/L) em vrios rios da regio Norte do Brasil

CLASSES Fi Fr Fr% Fac Xi


0,5|---0,8 4 0,2500 25,00 4 0,65
0,8|---1,1 4 0,2500 25,00 8 0,95
1,1|---1,4 7 0,4375 43,75 15 1,25
1,4|---1,7 1 0,0625 6,25 16 1,55
Total 16 1,0000 100,00 - -
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Fonte: dados fictcios elaborados pelas autoras.

Para o Q3 :
Primeiro vamos determinar a posio da medida e, em seguida, deter-
minar qual a sua classe.
nk 16 . 3
p= = = 12
4 4

Para saber qual a classe do Q3 , devemos olhar na coluna da frequncia


acumulada, de modo que p Fac . Logo, o Q3 est na 3 classe, pois 12 15
e corresponde

0,3(12 - 8)
Q3 = 1,1 + = 1,27
7

Portanto, pode-se afirmar que 75% dos rios da regio norte do Brasil tm
teor de oxignio inferior a 1,27 mg/L.

Para o D7 :
Primeiro vamos determinar a posio da medida e, em seguida, deter-
minar qual a sua classe.

nk 16 . 7
p= = = 11,2
10 10

Medidas Separatrizes
96 UNIDADE III

Para saber qual a classe do D7 , devemos olhar na coluna da frequncia acu-


mulada, de modo que p Fac. Logo, o D7 est na 3 classe, pois 11,2 15 e
corresponde
0,3(11,2 - 8)
D7 = 1,1 + = 1,24
7

Portanto, pode-se afirmar que 70% dos rios da regio norte do Brasil tm
teor de oxignio inferior a 1,24 mg/L.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
MEDIDAS DE DISPERSO

As medidas de disperso mostram a variabilidade de um conjunto de obser-


vaes em relao regio central. Essas medidas indicam se um conjunto de
dados homogneo ou heterogneo. Alm disso, mostram se a medida de ten-
dncia central escolhida representa bem o conjunto de dados que est sendo
trabalhado pelo pesquisador. Vejamos um exemplo:
Considere as idades de trs grupos de pessoas A, B e C:
A: 15; 15; 15; 15; 15
B: 13; 14; 15; 16; 17
C: 5; 10; 15; 20; 25
A mdia aritmtica do conjunto A 15, do B 15 e do C tambm 15.
A mdia aritmtica a mesma para os trs conjuntos acima, porm o grau
de homogeneidade entre eles muito diferente, ou seja, a variao dos seus ele-
mentos em relao mdia bem distinta. O conjunto A no tem disperso, o
B tem certo grau de variabilidade e o conjunto C tem grande variabilidade. Por
isso, devemos estudar as medidas de disperso, pois conjuntos de dados dife-
rentes podem ter mdias iguais, porm isso no indica que so iguais, uma vez
que a variabilidade entre eles pode ser diferente.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


97

AMPLITUDE TOTAL

A amplitude total de um conjunto de dados a diferena entre o maior e o menor


valor. Essa medida nos diz pouco, pois embora fcil de ser calculada, baseada em
somente duas observaes, sendo altamente influenciada pelos valores extremos;
quanto maior a amplitude, maior ser a variabilidade. Veja sua frmula abaixo:

AT = xmax xmin
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Em que:
xmax o maior valor no conjunto de dados.
xmin o menor valor no conjunto de dados.

Exemplo:
Suponha que estamos estudando a idade de cinco indivduos de uma fam-
lia. As idades observadas foram: 5, 10, 12, 35, 38. Logo, a amplitude das idades
nessa famlia:

AT = 38 5 = 33 anos

Esta medida de disperso no leva em considerao os valores intermedi-


rios, perdendo a informao de como os dados esto distribudos.

Exerccio
Calcule a Amplitude total dos seguintes conjuntos de dados:
A: 15; 15; 15; 15; 15
B: 13; 14; 15; 16; 17
C: 5; 10; 15; 20; 25

R: 0; 4; 20

Medidas de Disperso
98 UNIDADE III

VARINCIA

A varincia uma medida de variabilidade que utiliza todos os dados. calcu-


lada considerando o quadrado dos desvios em relao mdia aritmtica dos
dados em estudo.
Se os dados so para uma populao, a varincia denotada pelo smbolo
grego 2 e sua definio dada como segue:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
No qual a mdia da populao e N o nmero de observaes.
Se os dados so para uma amostra, a varincia, denotada por s2, definida
como:

No qual x a mdia da amostra e n o nmero de observaes. O uso de (n


1) neste denominador necessrio para que a varincia da amostra resultante
fornea uma estimativa no induzida da varincia da populao.
Na maioria das vezes, trabalhamos nas pesquisas com dados amostrais.
Portanto, iremos nos basear sempre na varincia amostral.

Exemplo:
Vamos calcular a varincia do conjunto de dados do exemplo anterior, ou
seja, vamos calcular a varincia das idades observadas de uma famlia, sendo
elas: 5, 10, 12, 35, 38.
Primeiramente, devemos calcular a mdia x para as idades:

x = 5 + 10 + 12 + 35 + 38 = 20
5

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


99

Agora vamos calcular a varincia das idades:

n 5

i=1
(xi - x)
2
i=1
(xi - 20)2
s =
2
=
n-1 5-1

(5 - 20)2 + (10 - 20)2 + (12- 20)2 + (35 - 20)2 + (38 - 20)2


s2 = =
4
938
= 234,5 anos 2
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

A unidade da varincia a mesma unidade da caracterstica, entretanto, por


simbologia apenas, devemos colocar o smbolo do quadrado junto unidade.
Assim, dizemos que a varincia dada em unidades quadrticas, o que dificulta
a sua interpretao. O problema resolvido extraindo-se a raiz quadrada da vari-
ncia, definindo-se, assim, o desvio padro.

DESVIO PADRO

O desvio padro d a ideia de distribuio dos desvios ao redor do valor da mdia.


Para obtermos o desvio padro, basta que se extraia a raiz quadrada da varin-
cia e, seguindo a notao adotada para as varincias de populao e amostra, s
denotar o desvio padro da amostra, enquanto , o desvio padro da popula-
o. Assim:

Populao Amostra

De forma mais simplificada:

Medidas de Disperso
100 UNIDADE III

Considerando o exemplo, em que a varincia foi s2 = 234,5 anos2, o clculo


do desvio padro (s) fica bastante simples, ou seja:

s = 234,5 = 15,31 anos

Esta medida interpretvel e dizemos que a disperso mdia entre os indi-


vduos desta famlia de 15,31 anos.
Para saber se o desvio padro est alto ou baixo, vamos compar-lo com
o valor da mdia. Quanto maior o valor do desvio padro em relao mdia,

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
maior ento ser a variao dos dados e mais heterogneo o nosso conjunto
de observaes.

COEFICIENTE DE VARIAO

O Coeficiente de Variao (CV) envolve clculos percentuais, por isso uma


medida relativa, e no absoluta. Assim, observe as frmulas a seguir:

Populao Amostra

CV = . 100 CV = . 100

A partir do valor do coeficiente de variao, podemos verificar se o con-


junto de dados homogneo e tambm conseguimos saber se a mdia uma
boa medida para representar o conjunto de dados. Outra utilizao para esta
medida comparar conjuntos com unidades de medidas distintas, uma vez que
o CV dado em porcentagem (%).
O CV tem o problema de deixar de ser explicativo da variao quando a
mdia est perto de zero, pois esta situao pode deix-lo alto demais. Um coefi-
ciente de variao alto sugere alta variabilidade ou heterogeneidade do conjunto
de observaes. Quanto maior for este valor, menos representativa ser a mdia.

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


101

Se isto acontecer, deve-se optar para representar os dados por outra medida,
podendo ser essa a mediana ou moda, no existindo uma regra prtica para a
escolha de uma dessas. Fica, ento, essa escolha a critrio do pesquisador. Ao
mesmo tempo, quanto mais baixo for o valor do CV, mais homogneo o con-
junto de dados e mais representativa ser sua mdia.
Quanto representatividade em relao mdia, podemos dizer que quando
o coeficiente de variao (CV) ou est (CRESPO, 2009):
Menor que 10%: significa que um timo representante da mdia, pois
existe uma pequena disperso (desvio padro) dos dados em torno da
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

mdia.
Entre 10% e 20%: um bom representante da mdia, pois existe uma boa
disperso dos dados em torno da mdia.
Entre 20% e 35%: um razovel representante da mdia, pois existe uma
razovel disperso dos dados em torno da mdia.
Entre 35% e 50%: representa fracamente a mdia, pois existe uma grande
disperso dos dados em torno da mdia.
Acima de 50%: no representa a mdia, pois existe uma grandssima dis-
perso dos dados em torno da mdia.

Exemplo: vamos determinar o coeficiente de variao para o exemplo das ida-


des dos indivduos de uma famlia, sendo elas: 5, 10, 12, 35, 38.
J efetuamos anteriormente os clculos da mdia e da varincia: = 20 e s =
15,31. Logo, o coeficiente de variao para esse conjunto de dados

s 15,31
CV = = x 100 = 76,55%
x 20

Verificamos que h uma grande variao, ou seja, uma alta disperso dos
dados. Portanto, conclumos que a mdia no uma boa representante desse
conjunto de dados.

Medidas de Disperso
102 UNIDADE III

Exerccio:
Calcule as medidas de disperso para um grupo de indivduos que tm as
seguintes idades: 18, 19, 20, 21, 21, 22, 24, 24, 25, 27, 30, 33 e verifique se a mdia
uma medida que representa bem este conjunto de dados.

R: Mdia: 23,67; Varincia: 20,42; desvio padro amostral: 4,51; C.V.(%): 19%.

Observe que, para dados agrupados, h uma pequena diferena nas frmu-
las de varincia da populao e da amostra:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Populao Amostra

Em que cada xi , o ponto mdio de cada classe estudada e Fi a frequncia respec-


tiva a cada classe, sendo e as mdias populacional e amostral, respectivamente.
Observe que a nica diferena que, com dados agrupados, os desvios ao
quadrado devem ser multiplicados por suas respectivas frequncias.
Exemplo: vamos determinar a varincia para o seguinte conjunto de dados
agrupados em tabelas de frequncias.
Tabela 10 - Idades de 100 colaboradores de uma organizao

IDADES Fi Xi (Xi - MDIA)2* Fi


17 |----- 21 11 19 (19 36)2 * 11 = 3.179
21 |----- 25 7 23 (23 36)2 * 7 = 1.183
25 |----- 29 12 27 (27 36)2 * 12 = 972
29 |----- 33 10 31 (31 36)2 * 10 = 250
33 |----- 37 9 35 (35 36)2 * 9 = 9
37 |----- 41 9 39 (39 36)2 * 9 = 81
41 |----- 45 14 43 (43 36)2 * 14 = 686

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


103

45 |----- 49 21 47 (47 36)2 * 21 = 2.541


49 |----- 53 4 51 (51 36)2 * 4 = 900
53 |----- 57 3 55 (55 36)2 * 3 = 1.083
Total 100 370 10.884
Fonte: dados fictcios elaborados pelas autoras.
Obs.: a mdia foi arredondada para 36.

10884
= = 109,93
100 - 1
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

DESVIO PADRO

Para calcular o desvio padro, o procedimento continua sendo o mesmo, ou


seja, basta extrairmos a raiz quadrada da varincia. Assim, observe as frmulas:

Populao Amostra

De forma mais simplificada:

Observe como importante diferenciar populao de amostra.

Medidas de Disperso
104 UNIDADE III

Exemplo
Considerando a situao exposta acima, em que a varincia foi igual a s2 =
109,93, o desvio padro ser:

S = 109,93 = 10,48

E, consequentemente, o Coeficiente de variao ser:

C.V.(%) = = 0,2911 * 100 = 29,11%

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Exerccio:
Calcule as medidas de disperso para dados agrupados considerando a
tabela abaixo:
Tabela 11 - Distribuio de frequncias para a idade dos clientes de uma loja em Maring

CLASSES Fi Fr(%) Fac Xi


17 |---- 29 4 36,4 4 23
29 |---- 41 4 36,4 8 35
41 |----| 53 3 27,3 11 47
Total 11 100 - -
Fonte: as autoras.

R: varincia 99,49; desvio padro 9,97; coeficiente de variao 29,40%

MEDIDAS DESCRITIVAS ASSOCIADAS A VARIVEIS QUANTITATIVAS


105

CONSIDERAES FINAIS

Nas pesquisas, aps a coleta e organizao dos dados, convm verificar o que
ocorre com eles. Nos dados quantitativos, a principal forma de anlise calcu-
lar as medidas de posio e de disperso.
Nesta unidade, voc aprendeu a calcular as principais medidas de Posio e
Disperso, alm das medidas Separatrizes. Vimos que as principais medidas de
posio dentro da estatstica so mdia aritmtica, moda, mediana e separatri-
zes. Pelo menos uma dessas medidas sempre deve estar presente na descrio
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

das informaes coletadas.


As principais medidas de disperso so varincia, desvio padro e coefi-
ciente de variao. Analisamos que as medidas de disperso so utilizadas para
um estudo descritivo de um conjunto de dados numricos qualquer, que tm
por objetivo determinar a variabilidade ou a disperso dos dados em relao
medida de localizao do centro da amostra em anlise.
Aprendemos o passo a passo de como calcular essa disperso, diferenciando
os clculos de populao e amostra. Vimos que, para calcular essa disperso,
precisamos da mdia; aps calcularmos a mdia, calculamos a varincia em
relao mdia, sendo que, para se calcular a varincia, soma-se os quadrados
dos desvios da amostra observada, em relao mdia, e divide-se pelo nmero
de observaes da amostra menos um; o que a diferencia da populao que a
diviso feita somente pelo nmero de observaes. Logo aps, calculamos o
desvio padro, que simplesmente a raiz quadrada da varincia. O desvio padro
uma medida de extrema importncia, porque quanto maior for a variabilidade
dos dados, maior ser o valor do desvio padro.
importante salientar que, de todas essas medidas vistas, as mais utilizadas
nas pesquisas so a mdia e o desvio padro e que essas so representativas da
populao e da amostra tambm. As medidas representaro sempre os dados,
portanto fundamental que saibamos qual ou quais so as medidas mais ade-
quadas para o tipo de informao que temos em mos.

Consideraes Finais
106

1. Das medidas de posio vistas na unidade, explique:


a. Qual a mais utilizada e por qu.
b. Quais so os problemas que a mdia pode ter em sua utilizao como medi-
da representativa de um conjunto de dados.

2. Considere os seguintes dimetros (mm) de eixos produzidos em certa fbrica de


autopeas:
93 94 96 100 96 102 89 87 105
Calcule:
a. A mdia aritmtica, a moda e a mediana.
b. A varincia, o desvio padro.
c. O coeficiente de variao (interprete).
d. O 3 quartil e o 6 decil.

3. Considere a seguinte tabela de distribuio de frequncias com os tempos (em


dias) que um corretor demora a concluir um negcio, observado em 40 opera-
es:

TEMPO (DIAS) Fi Fac Xi


0 | 2,5 2 2 1,25
2,5 | 5,0 3 5 3,75
5,0 | 7,5 25 30 6,25
7,5 | 10,0 10 40 8,75
Total 40 - -

Fonte: as autoras.

Calcule:
a. A mdia aritmtica, a moda e a mediana.
b. A varincia, o desvio padro.
c. O coeficiente de variao (interprete).
d. O 3 quartil e o 4 percentil.
107

Anurio Estatstico de Acidentes do Trabalho AEAT


A partir da experincia com a publicao do Anurio Estatstico de Previdncia Social
AEPS, da crescente necessidade de informaes sobre os acidentes de trabalho no pas
e considerando que a nica fonte de dados disponvel sobre esses acidentes era o do-
cumento Comunicao de Acidente do Trabalho CAT, recebido pelo Instituto Nacional
do Seguro Social INSS a Secretaria de Polticas de Previdncia Social SPS decidiu pro-
duzir uma publicao que sistematizasse as informaes coletadas pela CAT e agregasse
dados oriundos dos sistemas de concesso de benefcios do INSS. Essa publicao, o
Anurio Estatstico de Acidentes do Trabalho AEAT, comeou a ser editada em 2000 e
tambm introduziu indicadores que permitiam a mensurao da evoluo relativa da
incidncia de acidentes do trabalho e de outras caractersticas desses acidentes. Inicial-
mente os nveis de anlise eram Brasil e UF, mas atendendo demandas de pesquisadores
e do Ministrio do Trabalho e Emprego foi introduzido um detalhamento dos acidentes
em nvel municipal.
Objetivo:
Tornar pblicos dados estatsticos consistentes e confiveis sobre os acidentes do traba-
lho ocorridos no Brasil, criando um registro histrico dessas estatsticas e subsidiando a
formulao de polticas pblicas e estudos relativos ao tema.
Populao Alvo: -
Abrangncia Geogrfica:
Nacional.
Metodologia:
O AEAT produzido basicamente a partir de dados armazenados na Empresa de Tecno-
logia e Informaes da Previdncia Social DATAPREV. Os dados so provenientes das
Comunicaes de Acidentes do Trabalho encaminhadas ao INSS e de dados de benef-
cios por acidente do trabalho concedidos pelo INSS. Para o clculo dos indicadores, so
utilizados dados da base de contribuintes do INSS. Uma vez ao ano so ativados proces-
sos automticos que fazem a extrao dos dados das bases transacionais. Esses dados
so avaliados e com eles preparadas as tabelas publicadas no AEAT.
Principais Variveis:
Acidentes do Trabalho:
Registrado: Para Brasil, UF e Regies: Nmero de Acidentes do Trabalho por Motivo, Tipo
de Registro, Ms do Ano, Grupos de Idade, Sexo, Classe de Atividade Econmica, Para
Brasil e UF: 200 cdigos CID mais incidentes.
Para Municpios: Quantidade de Acidentes do Trabalho por Motivo, Tipo de Registro e
Nmero de bitos.
108

Liquidado: Para Brasil, UF e Regies: Nmero de Acidentes do Trabalho Liquidados, Con-


sequncia do Acidente, Classe de Atividade Econmica, Ms do Ano.
Indicadores: Para Brasil e UF: Indicadores de Incidncia, Incidncia de Doenas do Tra-
balho, Incidncia de Acidentes Tpicos, Incidncia de Incapacidade Temporria, Taxa de
Mortalidade, Taxa de Letalidade, Taxa de Acidentalidade Proporcional Especfica para a
Faixa Etria de 16 a 34 anos, Classe de Atividade Econmica.
Observao: Nem todas as variveis esto disponveis em todos os anos de publicao
do AEAT.
Documentao Operacional: -
poca da Coleta:
Meses de Maio a Julho do ano seguinte ao de competncia.
Tempo Previsto entre o Incio da Coleta e a Liberao dos Dados:
Sete meses.
Nvel de Divulgao:
Brasil, Grandes Regies, UF e Municpios.
Formas de Disseminao:
H 4 formas de disseminao: volumes impressos, CD-ROM, tabelas na Internet e tabu-
lador de dados na Internet.
Fonte: adaptado de IBGE (2017, on-line).
MATERIAL COMPLEMENTAR

Estatstica Aplicada
Douglas Downing; Jeffrey Clarck
Editora: Saraiva
Sinopse: este livro aborda assuntos, tcnicas estatsticas e suas aplicaes, estatstica
descritiva, probabilidades, teste de hipteses, pesquisa e amostragem, regresso
linear simples e mltipla, mtodos no-paramtricos, indicadores econmicos e teoria
da deciso. Os captulos comeam com os Termos-chave, trazendo um resumo dos
conceitos fundamentais de cada captulo. A seo Lembre-se retoma, ao longo do
estudo, tpicos essenciais a serem fixados, e no Conhea os conceitos, encontram-se
exerccios para aplicao do aprendizado.

Material Complementar
REFERNCIAS

CRESPO, A. A. Estatstica Fcil. So Paulo: Saraiva, 19. ed., 2009.


IBGE (2017). Anurio Estatstico de Acidentes do Trabalho AEAT. Disponvel em:
<http://ces.ibge.gov.br/base-de-dados/metadados/mps/anuario-estatistico-de-a-
cidentes-do-trabalho-aeat.html>. Acesso em: 24 abr. 2017.
NETO, A. R. Conceito de mdia: A mdia ponderada tambm uma mdia aritm-
tica. 2009. Disponvel em: <https://educacao.uol.com.br/disciplinas/matematica/
conceito-de-media-a-media-ponderada-e-tambem-uma-media-aritmetica.htm>.
Acesso em: 24 abr. 2017.
111
GABARITO

1.
a) A mdia mais utilizada, pois a medida mais precisa, nica em um con-
junto de dados e sempre existe.

b) Os problemas da mdia ocorrem porque ela afetada por medidas extre-


mas, ou seja, valores muito altos ou muito baixos, destoando da maioria dos
outros valores, podem comprometer o valor da mdia. Alm disso, em con-
juntos de dados muito heterogneos, ela no uma medida que representa
bem o conjunto de dados.

2.
a) A mdia aritmtica: x =95,8 mm
A moda: Mo = 96 mm
A mediana: Md = 96 mm

b) Varincia: s2 = 34,5 mm2


Desvio padro: s = 5,9 mm

c) CV = 6,2%. Temos uma baixa disperso dos dados em torno da mdia, logo
esta uma tima representante do conjunto de dados.

d) Q3 = 101 mm, portanto, 75% dos dimetros dos eixos esto abaixo de 101 mm.
D6 = 96 mm, portanto, 60% dos dimetros dos eixos esto abaixo de 96 mm.

3.
a) x = 6,44 dias
Mo = 6,48 dias
Md = 6,5 dias

b) s2 = 33,3 dias2
s = 1,82 dias

c) CV = 28,26%. Temos uma disperso razovel dos dados em torno da mdia,


logo esta uma representante aceitvel do conjunto de dados.

d) Q3 = 7,5 dias, portanto, 75% da demora de concluir um negcio est abaixo


de 7,5 dias.
P4 = 2 dias, portanto, 4% da demora de concluir um negcio est abaixo de
2 dias.
Professora Me. Ivnna Gurniski De Oliveira
Professora Me. Renata Cristina de Souza Chatalov

IV
UNIDADE
PROBABILIDADES

Objetivos de Aprendizagem
Entender os conceitos relacionados a probabilidades.
Saber aplicar as probabilidades nas diversas situaes.
Compreender probabilidade condicional.
Conhecer as principais distribuies de probabilidades.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Probabilidade
Distribuio de Probabilidades Discreta
Distribuio de Probabilidades Contnua
115

INTRODUO

Nesta unidade, vamos tratar das probabilidades. Quando estamos falando de


probabilidade, queremos identificar a chance de ocorrncia de um determinado
resultado de interesse em situaes nas quais no possvel calcular com exa-
tido o valor real do evento. Ento, desta forma, trabalhamos com chances ou
com probabilidades.
A palavra probabilidade deriva do Latim probare (provar ou testar), e designa
eventos incertos, ou mesmo sorte, risco, azar, incerteza ou duvidoso. A
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

probabilidade como ramo da matemtica data de mais de 300 anos e se aplicava


a jogos de azar, em que jogadores que tinham mais conhecimento sobre suas
teorias planejavam estratgias para levar vantagem nos jogos. Hoje, essa prtica
ainda utilizada, porm tambm passou a ser empregada por governos, empre-
sas e organizaes profissionais nas suas tomadas de decises ou ainda na escolha
de produtos, sendo teis tambm para o desenvolvimento de estratgias.
As decises nos negcios so frequentemente baseadas na anlise de incer-
tezas, tais como: chances de um investimento ser lucrativo, chances das vendas
decrescerem se o preo for aumentado, probabilidade de projetos terminarem no
prazo, etc. As probabilidades medem o grau de incerteza, assim, no podemos
antecipar o evento, mas lidar com as chances maiores ou menores dele ocorrer.
Nesta unidade, sero apresentados conceitos bsicos de probabilidade, como
a probabilidade pode ser interpretada e como suas regras podem ser utilizadas
para calcular as possibilidades de ocorrncia de eventos futuros, alm de traba-
lharmos com as principais distribuies de probabilidades discretas e contnuas.
Veremos a importncia de estudarmos as probabilidades, pois necessrio que
os futuros gestores saibam que muitas das decises a serem tomadas so base-
adas na incerteza.

Introduo
116 UNIDADE IV

PROBABILIDADE

As probabilidades so utilizadas para delinear a chance de ocorrncia de deter-


minado evento. Seus valores so sempre atribudos numa escala de 0 a 1. A
probabilidade prxima de 1 indica um evento quase certo, enquanto que a pro-
babilidade prxima de zero indica um evento improvvel de
acontecer.
Ao discutirmos probabilidade, definimos expe-
rimentos como qualquer ao ou processo

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
que gera resultados bem definidos. Os
experimentos aleatrios so aqueles
que, repetidos vrias vezes, apre-
sentam resultados imprevisveis.
Ao descrever um experimento
aleatrio, deve-se sempre espe-
cificar o que dever ser observado.

ANLISE DE RISCO E A PROBABILIDADE

A anlise qualitativa de risco definida como o processo de avaliao do impacto


e probabilidade de riscos identificados. Este processo prioriza riscos de acordo
com os seus efeitos potenciais nos objetivos do projeto. Anlise qualitativa de
risco um modo de determinar a importncia de se enderear riscos especficos
e guiar respostas de risco. A questo crtica do tempo e as aes relaciona-
das ao risco podem ampliar a importncia de um risco (SILVEIRA; ORTH;
PRINKLANDICKI, 2006).
Essa anlise qualitativa de risco requer que a probabilidade e as consequncias
dos riscos sejam avaliadas, usando mtodos e ferramentas de anlise qualitativa
estabelecidos. Tendncias nos resultados, quando a anlise qualitativa repetida,
pode indicar a necessidade de mais ou menos ao da gerncia de risco. O uso
dessas ferramentas ajuda a corrigir influncias que esto frequentemente pre-
sentes em um plano de projeto. (SILVEIRA; ORTH; PRINKLANDICKI, 2006).

PROBABILIDADES
117

EXEMPLOS PRTICOS DE PROBABILIDADES

Queremos estudar a ocorrncia das faces de um dado. Esse seria o experimento


aleatrio. A partir do conhecimento de que o dado tem 6 faces, sendo o dado
equilibrado, de modo a no favorecer nenhuma das faces, podemos construir o
modelo probabilstico da seguinte maneira:
Tabela 1 - Modelo probabilstico do lanamento de um dado

Face 1 2 3 4 5 6
Frequncia 1/6 1/6 1/6 1/6 1/6 1/6
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Fonte: as autoras.

Se o experimento aleatrio for o lanamento de uma moeda. Sabendo que s


podem ocorrer duas situaes ao lanamento dela: cara ou coroa, o modelo pro-
babilstico para esta situao seria:
Tabela 2 - Modelo probabilstico do lanamento de uma moeda

Face Cara Coroa


Frequncia 1/2
Fonte: as autoras.

Se um grupo for composto por 20 homens e 30 mulheres e um deles for sorte-


ado ao acaso para ganhar um determinado prmio, o modelo probabilstico ser:
Tabela 3 - Modelo probabilstico do sorteio de um prmio

Indivduo Homem Mulher


Frequncia 20/50 30/50
Fonte: as autoras.

Verificamos que em todos os exemplos mostrados, precisamos ter um modelo


probabilstico. Um modelo probabilstico envolve os conceitos de espao amos-
tral e eventos. Vejamos a seguir suas caractersticas.

Probabilidade
118 UNIDADE IV

Espao amostral
Chamamos de espao amostral o conjunto de todos os resultados possveis de um
experimento. Os elementos do espao amostral so chamados de pontos amos-
trais. Representamos o espao amostral por .
Exemplo: considere o lanamento de uma moeda. Os possveis resulta-
dos (n) so dois: cara (c) ou coroa (k). Ento, o espao amostral dado por =
{c,k}. Se quisermos lanar a moeda duas vezes, os possveis resultados so qua-
tro: cara e cara; cara e coroa; coroa e cara; coroa e coroa. Logo, o espao amostral
= {cc,ck,kc,kk}.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Eventos
Chamamos de evento um subconjunto do espao amostral de um experimento
aleatrio. O evento dito simples se consistir em um nico resultado, ou com-
posto se consistir em mais de um resultado.

Exemplo
No lanamento de uma moeda = {cara, coroa}. Um evento de interesse A
pode ser obter cara no lanamento de uma moeda e ento A = {cara} e o n para
este evento ser 1, sendo n o nmero de resultados para o evento.
No lanamento de um dado, o evento de interesse A pode ser obter face par
e ento A ser igual a:

A = 2; 4, 6 e n = 3.

Probabilidade de um evento
Podemos fazer clculos de probabilidades utilizando trs formas distintas:
Mtodo clssico quando o espao amostral tem resultados equiprovveis.
Mtodo emprico baseado na frequncia relativa de um grande nmero
de experimentos repetidos.
Mtodo subjetivo baseia-se em estimativas pessoais de probabilidade
com certo grau de crena.

Utilizaremos aqui o mtodo clssico.

PROBABILIDADES
119

Considerando um experimento aleatrio em que se queira um determinado


evento A, a probabilidade deste evento ocorrer dada por P(A).
Assim: a probabilidade de A ocorrer ser dada por:

n(A)
P(A) = , para qualquer evento discreto. Ou seja,

Considere um experimento aleatrio em que se queira determinar um evento


E. A probabilidade de este evento ocorrer, denotada por P(E), dada pela razo
do nmero de resultados do evento E, (n(E)), pelo nmero total de resultados
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

no espao amostral, (). Isto ,

n(E)
P(E) =

Por exemplo, considere o lanamento de um dado. Queremos calcular a pro-


babilidade de obtermos uma face mpar (evento A) e a probabilidade de sair as
faces 2 e 5 (evento B).
Primeiro vamos determinar o espao amostral, que composto por todos
os resultados possveis:

= {1, 2, 3, 4, 5, 6}, n = 6

Em seguida, determinamos os resultados possveis para os eventos A e B:

A = {1, 3, 5}, n = 3
B = {2, 5}, n = 2

Assim,

n(A) 3
P(A) = = = 0, 5 ou, em porcentagem, P(A) = 0,5 x 100 = 50%.
6
n(B) 2
P(B) = = = 0,33 ou, em porcentagem, P(B) = 0,33 x 100 = 33%.
6

Probabilidade
120 UNIDADE IV

REGRAS BSICAS

Tendo um modelo probabilstico e conhecendo suas frequncias relativas, pode-


mos estabelecer no clculo das probabilidades algumas regras:
A probabilidade dever ser um valor que varie entre 0 e 1, sendo repre-
sentado por:
0 < P(A) < 1
Um evento impossvel um conjunto vazio () e atribui-se probabilidade

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
0, enquanto que um evento certo tem probabilidade 1, assim:
P() = 1 P()= 0
A soma das probabilidades para todos os resultados experimentais tem
de ser igual a 1.

OPERAES COM EVENTOS

Nos clculos de probabilidades, algumas vezes, o interesse do pesquisador est


na determinao da probabilidade de combinao dos eventos relacionados
ao experimento aleatrio. Podemos ter dois tipos de combinaes, dados dois
eventos A e B:
O evento interseco de A e B, denotado AB, o evento em que A e B
ocorrem simultaneamente.
O evento reunio de A e B, denotado AB, o evento em que A ocorre
ou B ocorre (ou ambos).
O evento complementar de A, denotado Ac, o evento em que A no
ocorre.

Assim:
A probabilidade de um ou outro evento ocorrer dada por P(AB).
A probabilidade de ambos os eventos ocorrerem simultaneamente dada
por P(AB).

PROBABILIDADES
121

Exemplo: considere um baralho completo de 52 cartas. Desejamos saber qual


a probabilidade de sair um rei de copas. Para este evento, vamos calcular a
probabilidade P(AB), na qual A a probabilidade da carta ser um rei e B a
probabilidade da carta ser de copas. Se desejarmos saber a probabilidade de sair
uma carta de valor 2 ou uma carta de valor 5, vamos calcular a probabilidade
P(CD), na qual C a probabilidade de sair uma carta de valor 2 e D a pro-
babilidade de sair uma carta de valor 5.

Regra da adio
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Essa regra leva em considerao a ocorrncia do evento A ou a ocorrncia do


evento B ou ainda de ambos os eventos. denotada matematicamente por
P(AB) e dizemos unio de A e B que a probabilidade de ocorrncia de pelo
menos um dos dois eventos.
No clculo dessa probabilidade, surgem duas situaes:
A primeira quando os eventos A e B so mutuamente excludentes (no tm
elementos em comum). Nesta situao, a frmula dada por:

P(A B) = P(A) + P(B)

A segunda, quando os eventos A e B no so mutuamente excludentes (tm


elementos em comum). Nesta situao, a frmula dada por:

P(A B) = P(A) + P(B) - P(A B), em que:

P(A B) a probabilidade de A e B ocorrerem simultaneamente; a inter-


seco entre os eventos A e B.

A B

P(A B)

Probabilidade
122 UNIDADE IV

COMPLEMENTO DE UM EVENTO

Dado um evento A, o complemento de A (Ac) um evento que consiste de


todos os pontos amostrais que no esto em A (TOLEDO; OVALLE, 1997). O
diagrama abaixo ilustra o conceito. A rea retangular representa o espao amos-
tral; o crculo representa o evento A e a regio com preenchimento, os pontos
do complemento de A.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
O clculo da probabilidade usando o complemento feito por meio da relao:

P(AC) = 1 - P(A) para todo evento A.

A teoria da probabilidade no fundo nada mais do que o senso comum


reduzido ao clculo.
(Pierre Simon de Laplace)

Exemplo:
Considere o lanamento de um dado e os seguintes eventos: sair faces pares
(A), sair faces mpares (B), sair faces cujo valor maior do que 3 (C). Ou seja,

= {1, 2, 3, 4, 5, 6} n() = 6
A = {2, 4, 6} n(A) = 3
B = {1, 3, 5} n(B) = 3
C = {4, 5, 6} n(C) = 3

PROBABILIDADES
123

Vamos calcular as seguintes probabilidades: P(A B), P(A C), P(A B) e


P(Ac). Temos que:
A B = {} n(A B) = 0
A C = {4, 6} n(A C) = 2
A B = {1, 2, 3, 4, 5, 6} = n(A B) = 6
Ac = {1, 3, 5} n(Ac) = 3

Logo,
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

0
P(A B) = =0
6
2
P(A C) = = 0,33
6
6
P(A B) = =1
6
3
P(Ac) = = 0,5
6

Exerccios

1. Determine o espao amostral no lanamento de um dado.

2. Considere o experimento aleatrio do lanamento de dois dados e:


a. Encontre .
b. Demonstre o n(A) e P(A) nos casos abaixo.
A1: apaream faces iguais.
A2: a segunda face o dobro da primeira.
A3: apaream somente nmeros mpares.

A4: apaream faces iguais ou a segunda face o quadrado da primeira.


A5: a soma das faces igual a 7.

Probabilidade
124 UNIDADE IV

3. Um consultor est estudando dois diferentes tipos de imveis quanto a


quantidades disponveis venda, por regio, em uma determinada cidade.
Os dados so mostrados abaixo:
Tabela 4 - Tipos de imveis e apartamentos por regio

TIPO DE IMVEL
REGIO TOTAL
APARTAMENTO CASA
Norte 30 28 58
Sul 40 56 96
Leste 38 34 72

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Oeste 52 22 74
Total 160 140 300
Fonte: as autoras.

Considere Norte por N; Sul por S; Leste por L; Oeste por O; Apartamento
por A e Casa por C.
Calcule as seguintes probabilidades:
a. P(N) =
b. P(S) =
c. P(L) =
d. P(O) =
e. P(A) =
f. P(C) =
g. P(N A) =
h. P(S C) =
i. P(L A) =
j. P(O C) =
k. P(N A) =
l. P(S C) =
m. P(L A) =
n. P(O C) =

PROBABILIDADES
125

Resposta:

1. = {1, 2, 3, 4, 5, 6}

2.
a. = {(1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1)
(5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)}
b. A1 = {(1,1) (2,2) (3,3) (4,4) (5,5) (6,6)}
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

P(A1) = 6/36 = 0,17


A2 = {(1,2) (2,4) (3,6)}
P(A2) = 3/36 = 0,08
A3 = {(1,1) (1,3) (1,5) (3,1) (3,3) (3,5) (5,1) (5,3) (5,5)}
P(A3) = 9/36 = 0,25
A4 = {(1,1) (2,2) (2,4) (3,3) (4,4) (5,5) (6,6)}
P(A4) = 7/36 = 0,19
A5 = {(1,6) (2,5) (3,4) (4,3) (5,2) (6,1)}
P(A5) = 6/36 = 0,17

3. a) 0,193; b) 0,320; c) 0,240; d) 0,247; e) 0,533; f) 0,467; g) 0,100; h) 0,187;


i) 0,127; j) 0,073; k) 0,627; l) 0,60; m) 0,647; n) 0,64.

PROBABILIDADE CONDICIONAL

Frequentemente, a probabilidade de um evento influenciada pela ocorrncia de


um evento paralelo. Seja A um evento com probabilidade P(A). Se obtivermos a
informao extra que o evento B ocorreu paralelamente, iremos tirar vantagem
dela no clculo de uma nova probabilidade para o evento A. Esta ser escrita
como P(A | B) e lida como probabilidade de A dado B.

Probabilidade
126 UNIDADE IV

Neste caso, podemos utilizar esta informao extra para realocar probabilida-
des aos outros eventos. Vamos utilizar o exemplo da tabela do exerccio anterior.
Tabela 5 - Tipos de imveis e apartamentos por regio

TIPO DE IMVEL
REGIO TOTAL
APARTAMENTO CASA
Norte 30 28 58
Sul 40 56 96
Leste 38 34 72
Oeste 52 22 74

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Total 160 140 300
Fonte: as autoras.

Se soubermos que o imvel um apartamento, qual a chance de ser da regio


norte? Reformulando a pergunta, poderamos ter o interesse de saber: dado que
o imvel um apartamento, qual a probabilidade de pertencer regio norte?
Observe que estamos impondo uma condio ao evento. Sabemos que o imvel
um apartamento, essa a condio imposta. Quando impomos alguma condi-
o em probabilidade, dizemos ento que a probabilidade condicional e, assim,
reduzimos ento o espao amostra condio imposta.
Assim, escrevemos:

P(N A) e l-se probabilidade de N dado A, sendo a condio A, ou seja, ser


apartamento, sendo que:

30
P(N A) =
160

De forma geral, para dois eventos quaisquer A e B, sendo P(B) > 0, definimos
a probabilidade condicional de A B como sendo P(A B) dado pela seguinte
frmula:

P(AB)
P(A B) =
P(B)

PROBABILIDADES
127

Caso a condio seja A:

P(AB)
P(B A) =
P(A)

Para o exemplo acima mencionado, se N e A indicam, respectivamente, norte


para regio e apartamento para tipo, ento:

P(NA) 30/300
P(N A) = = = 30 como mostrado acima.
P(A) 160/300 160
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Observe que, se trocarmos a condio para ser do tipo A, dado que a regio
Norte, a condio agora ser da regio Norte e o problema ficaria da seguinte
maneira:

P(NA) 30/300
P(N A) = = = 30
P(N) 58/300 58

Exerccios
Baseado na tabela acima, calcular as seguintes probabilidades:
a. P(S | C) =
b. P(C | S) =
c. P(L | A) =
d. P(A | L) =
e. P(O | C) =
f. P(C | O) =

Resposta: a) 0,400; b) 0,292; c) 0,238; d) 0,264; e) 0,156; f) 0,149.

EVENTOS INDEPENDENTES

Dois eventos A e B so independentes se P(A | B) = P(A) ou P(A | B) = P(B).


Caso contrrio, os eventos so dependentes.

Probabilidade
128 UNIDADE IV

Regra da multiplicao
A relao geral mostrada acima foi:

P(AB)
P(A B) =
P(B)

Desta relao, obtemos a regra do produto das probabilidades, em que:

P(A B) = P(B) . P(A B).

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Observe que a probabilidade de A e B ocorrerem conjuntamente est sob
uma condio, pois a probabilidade de A est sob a condio de B, mostrando
que h uma dependncia de uma probabilidade em relao ao evento ocorrido
anteriormente.
Em caso de A e B serem eventos independentes, ou seja, a probabilidade
de um evento no depender da ocorrncia do outro evento, nesta condio, a
probabilidade de A e B ocorrer dada pela probabilidade de A vezes a proba-
bilidade de B.

P(A B) = P(A) . P(B)

Exemplo:
Uma urna contm duas bolas brancas e trs bolas pretas. Sorteamos duas
bolas ao acaso sem reposio. Isto quer dizer que sorteamos a primeira bola,
verificamos sua cor e no a devolvemos urna. As bolas so novamente mistu-
radas e sorteamos ento a segunda bola. Para resolver as probabilidades nesta
situao, ilustraremos a situao por um diagrama de rvore em que em cada
galho da rvore esto indicadas as probabilidades.

PROBABILIDADES
129

Diagrama de rvore
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Figura 1 - Diagrama de rvores para o sorteio de duas bolas sem reposio


Fonte: as autoras.

Observe que o clculo das probabilidades, na segunda retirada, fica condicionado


aos resultados da primeira retirada. Na Tabela 24, esto os resultados possveis
do sorteio com suas respectivas probabilidades.
Indicando bola branca por B e bola preta por P, vejamos o clculo das pro-
babilidades para as seguintes situaes:
Tabela 6 - Resultados e probabilidades do diagrama de rvore

RESULTADOS PROBABILIDADES
BB 2/5 x 1/4 = 2/20
BP 2/5 x 3/4 = 6/20
PB 3/5 x 2/4 = 6/20
PP 3/5 x 2/4 = 6/20
Total 1,0
Fonte: as autoras.

Probabilidade
130 UNIDADE IV

Considere agora que vamos fazer o mesmo sorteio, mas repondo a primeira bola
sorteada novamente na urna. Assim, as probabilidades so:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Figura 2 - Diagrama de rvores para o sorteio de duas bolas com reposio
Fonte: as autoras.

a. Qual a probabilidade de sair bola branca na primeira retirada?


P(B) = 2/5
b. Qual a probabilidade de sair bola branca na primeira retirada e bola
preta na segunda retirada?
P(B na 1 P na 2 ) = 6/20
c. Qual a probabilidade de sair bola preta na segunda retirada, dado que
saiu branca na primeira retirada?
P(P na 2 B na 1) = 3/4
d. Qual a probabilidade de sair bola branca na segunda retirada, dado que
saiu preta na primeira retirada?
P(B na 2 P na 1) = 2/4
e. Qual a probabilidade de sair bola preta na segunda retirada?
P(P na 2) = 6/20 + 6/20 = 12/20

Observe que os clculos das probabilidades na segunda retirada no ficam con-


dicionados aos resultados da primeira retirada.

PROBABILIDADES
131

Tabela 7 - Resultados e probabilidades do diagrama de rvore

RESULTADOS PROBABILIDADES
BB 2/5 x 2/5 = 4/25
BP 2/5 x 3/5 = 6/25
PB 3/5 x 2/5 = 6/25
PP 3/5 x 3/5 = 9/25
Total 1,0
Fonte: as autoras.

Observe que os clculos das probabilidades na segunda retirada no ficariam con-


Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

dicionados aos resultados da primeira retirada. Assim, indicando B por branca


e P por preta, vejamos o clculo das probabilidades.

a. Qual a probabilidade de sair bola branca na primeira retirada?


P(B) = 2/5
b. Qual a probabilidade de sair bola branca na primeira retirada e bola
preta na segunda retirada?
P(B na 1 P na 2 ) = 6/25
c. Qual a probabilidade de sair bola preta na segunda retirada, dado que
saiu branca na primeira retirada?
P(P na 2 B na 1 ) = 3/5
d. Qual a probabilidade de sair bola branca na segunda retirada, dado que
saiu preta na primeira retirada?
P(B na 2 P na 1 ) = 2/5
e. Qual a probabilidade de sair bola preta na segunda retirada?
P(P na 2 ) = 6/25 + 9/25= 15/25 = 3/5

Observe que as probabilidades da segunda retirada no so alteradas pela extra-


o da primeira bola.
Assim, P(P na 2 B na 1) = 3/5 = P(P na 2 ).
Nesse caso, dizemos que o evento A independe do evento B e:
P(A B) = P(A) . P(B)

Probabilidade
132 UNIDADE IV

REGRAS BSICAS DA PROBABILIDADE

De acordo com o evento estudado, existem algumas regras para o clculo de

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
probabilidades. So elas:

P(A ou B), para eventos no mutuamente excludentes:


P(A ou B ou ambos) = P(A) + P(B) P(A e B)

Para eventos mutuamente excludentes:


P(A ou B) = P(A) + P(B)

Para eventos independentes:


P(A e B) = P(A) . P(B)

Para eventos dependentes:


P(A e B) = P(B).P(A | B) ou P(A).P(B | A)

Exerccios:

1. Uma urna contm 5 bolas pretas e 4 azuis. Em duas extraes conse-


cutivas, sem reposio, determine os resultados esperados e calcule as
seguintes probabilidades:
a. De retirar a primeira azul e a segunda preta.
b. De retirar a primeira azul e a segunda azul.
c. De retirar a segunda azul, dado que a primeira foi preta.

PROBABILIDADES
133

2. Em um lote de 15 peas, sendo 5 defeituosas, retira-se uma pea e inspe-


ciona-se. Qual a probabilidade:
a. Da pea ser defeituosa?
b. Da pea no ser defeituosa?

3. Uma loja dispe de cartuchos de tintas novas e recondicionadas. Entre


30 cartuchos, sabe-se que 10 so recondicionados.
a. Se um cliente levar um cartucho, qual a probabilidade de que ele seja
recondicionado?
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

b. Se um cliente levar dois cartuchos, qual a probabilidade de que ambos


sejam recondicionados?
c. Se um cliente levar 4 cartuchos, qual a probabilidade de que todos
sejam recondicionados?

Resposta:
1. a. 0,278
b. 0,167
c. 0,5
2. a. 0,333
b. 0,667
3. a. 0,333
b. 0,103
c. 0,008

Distribuies De Probabilidade
Os mtodos de anlise estatstica requerem sempre que sejam enfocados certos
aspectos numricos dos dados (mdia, desvio padro, etc.), independentemente
de o experimento originar resultados qualitativos ou quantitativos.
Um meio para descrever, por valores numricos, os resultados experimen-
tais o conceito de Varivel Aleatria.

Probabilidade
134 UNIDADE IV

Uma varivel aleatria permite passar cada um dos resultados do experi-


mento para uma funo numrica dos resultados. Para ilustrar, em uma amostra
de componentes, ao invs de manter o registro de falhas individuais, o pesquisa-
dor pode registrar apenas quantos apresentaram falhas dentro de mil horas. Em
geral, cada resultado associado por um nmero, especificando-se uma regra
de associao (TRIOLA, 1999).
Uma varivel aleatria pode ser classificada como discreta ou contnua,
dependendo dos valores numricos que ela assume. Uma varivel aleatria :
Discreta: quando pode assumir tanto um nmero finito de valores como

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
uma infinita sequncia de valores, tais como 0, 1, 2, ..., n.
Contnua: quando pode assumir qualquer valor numrico em um inter-
valo ou associao de intervalos.

Observe o exemplo do lanamento de uma moeda duas vezes. A varivel alea-


tria o nmero de caras em duas jogadas. Considerando C como sair cara e
K como sair coroa, os possveis resultados so:
Tabela 8 - Distribuio de probabilidades Cara ou Coroa

VALOR DA VARIVEL ALEATRIA


RESULTADOS PROBABILIDADE DO RESULTADO
(SAIR CARA)
CC 2 x=
CK 1 x=
KC 1 x=
KK 0 x=
Fonte: as autoras.

A distribuio de probabilidades ficar:


Tabela 9 - Distribuio de probabilidades

VALOR DA VARIVEL ALEATRIA


PROBABILIDADE DO RESULTADO
(SAIR CARA)
0
1 + = 2/4
2
Total 1,0
Fonte: as autoras.

PROBABILIDADES
135

Para cada possvel evento, associamos um nmero e em seguida montamos o


modelo probabilstico. Assim, conhecemos a distribuio de probabilidades que
essa varivel aleatria (v.a.) segue.

DISTRIBUIO DE PROBABILIDADES DISCRETA


Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Existem experimentos cujos resultados, refletidos em uma varivel aleatria,


seguem um comportamento previsvel em relao s suas probabilidades de ocor-
rncia e, portanto, podem ser modelados por uma equao especfica.
Dentre as principais distribuies discretas, destacam-se a Distribuio de
Bernoulli, Distribuio Binomial e Distribuio de Poisson.

DISTRIBUIO DE BERNOULLI

A distribuio de Bernoulli consiste em uma distribuio em que a varivel ale-


atria assume apenas dois possveis resultados: sucesso (o evento se realiza) ou
fracasso (o evento no se realiza).
Exemplos:
Lanamento de uma moeda: o resultado cara ou no.
Uma pea escolhida ao acaso: o resultado defeituosa ou no.
Uma cidade tem esgotamento sanitrio: sim ou no.

Deve ficar claro que nem sempre o que bom o sucesso, mas sim o que se
est estudando. Assim, o fato da pea ser defeituosa, por exemplo, seria o sucesso
da pesquisa em si.

Distribuio de Probabilidades Discreta


136 UNIDADE IV

Em todos os casos, definimos uma varivel aleatria X que s assuma dois


valores possveis:

0 fracasso
X=
1 sucesso

onde P (X = 0) = q e P(X = 1) = p.

A funo probabilidade de Bernoulli dada por:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
P(X = k) = pk . q1-k

O clculo da mdia (chamada de Esperana e denotada por E(X)) e da vari-


ncia (Var(X)) e do desvio padro () para a distribuio de Bernoulli so:

E(X) = p
Var(X) = pq
(X) = pq

Exemplo:
Supondo que a probabilidade de venda amanh seja de 0,8.
Seja a varivel aleatria vender, temos que:
A probabilidade de no vender este produto :
P (X = 0) = q
P(X = 0) = 1 - p
P(X = 0) = 1 - 0,8 = 0,2
Ou seja, 20% de chances de no vender.
A probabilidade de vender este produto :
P(X = 1) = p
P(X = 1) = 0,8
Ou seja, 80% de chances de vender.

PROBABILIDADES
137

A mdia, a varincia e o desvio padro da venda so:


E(X) = p = 0,8
Var(X) = pq = 0,8 . 0,2 = 0,16
(X) = pq = 0,16 = 0,4

DISTRIBUIO BINOMIAL
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Um experimento binomial aquele que consiste em uma sequncia de n ensaios


idnticos e independentes. Cada tentativa pode resultar em apenas dois resul-
tados possveis: sucesso e fracasso, e a probabilidade de sucesso constante de
uma tentativa para outra.
Exemplos:
Lanar uma moeda 5 vezes e observar o nmero de caras.
10 peas so escolhidas ao acaso e observamos as falhas.
5 cidades so observadas quanto ao acesso rede de internet.

Designando por X o nmero total de sucessos em n tentativas, com probabili-


dade p de sucesso, sendo 0 < p < 1, os possveis valores de X so 0, 1, 2, ... , n.
Os pares (x, p(x)), em que p(x) = P(X=x), constituem a distribuio binomial,
de modo que:

n k n-k
P(X = k) = p .q
k

n n!
=
k K! (n - k)!

n n!
P(X = k) = = pk . qn - k
k K! (n - k)!

Distribuio de Probabilidades Discreta


138 UNIDADE IV

Em que:
k = nmero de sucessos.
n = nmero de elementos da amostra.
p = probabilidade de sucesso.
q = probabilidade de fracasso.

A mdia, a varincia e o desvio padro de uma distribuio binomial so


dadas por:
E(x)....

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Var(x).....
(X) = npq

Exemplos:
Um processo industrial na fabricao de monitores opera com mdia de 5%
de defeituosos. Baseado em amostras de 10 unidades, calcule as probabilidades
de uma amostra apresentar:

a. Nenhum monitor com defeito:


10!
P(x = 0) = 0,050 . 0,9510 = 0,598 ou 59,8%
0! (10 - 0)!
Observe que:
n = 10
k=0
p = 5% ou 0,05
q = 1 0,05 = 0,95
Aps a retirada dos dados, basta substituir os valores na frmula.
Vejamos outro exemplo:

b. 3 monitores com defeito:


10!
P(x = 3) = 0,053 . 0,957 = 0,010 ou 1%
3! (10 - 3)!

PROBABILIDADES
139

c. Pelo menos 9 monitores com defeito:


P(x 9) = P(x = 9) + P(x =10)
10!
P(x = 9) = 0,059 . 0,951 = 1,85 x 10-11
9! (10 - 9)!
10!
P(x = 10) = 0,0510 . 0,950 = 9,76 x 10-14
10! (10 - 10)!
P(x 9) = 1,85 x 1011 + 9,76 x 10-14 = 1,86 x 10-11 ou 0,0000000000186
ou 0,00000000186%

d. No mximo 2 monitores com defeito:


Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

P(x 2) = P(x = 0) + P(x = 1) + P(x = 2)


10!
P(x = 0) = 0,050 . 0,9510 = 0,598 ou 59,8%
0! (10 - 0)!

P(x = 1) = 10! 0,051 . 0,959 = 0,315 ou 31,5%


1! (10 - 1)!

P(x = 2) = 10! 0,052 . 0,958 = 0,074


2! (10 - 2)!

P(x 2) = 0,598 + 0,315 + 0,074 = 0,987 ou 98,7%


A mdia e a varincia de monitores defeituosos sero:
E(X) = 10 x 0,05 = 0,5
Var (X) = 10 x 0,05 x 0,95 = 0,475
Desvio padro = 0,689

DISTRIBUIO DE POISSON

A distribuio de Poisson frequentemente til para estimar o nmero de ocor-


rncias sobre um intervalo de tempo ou de espaos especficos. A probabilidade
de uma ocorrncia a mesma para qualquer dois intervalos de igual compri-
mento e a ocorrncia ou no em um intervalo independente da ocorrncia ou
no em qualquer outro intervalo.

Distribuio de Probabilidades Discreta


140 UNIDADE IV

Exemplos:
Nmero de chamadas telefnicas durante 10 minutos.
Nmero de falhas de uma mquina durante um dia de operao.
Nmero de acidentes ocorridos numa semana.
Nmero de mensagens que chegam a um servidor por segundo.
Defeitos por m2, etc.

A distribuio de Poisson dada por

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
k . e-
P(X - k) =
k!

Em que:
a taxa de ocorrncia do evento em um intervalo.
k o nmero de ocorrncias do evento.
e uma constante matemtica e 2,71828.

A mdia (E(X)), a varincia (Var(X)) e o desvio padro () para a distribuio


de Poisson so dadas por:
E(X) =
Var(X) =
(X) =

Vale ressaltar que a Distribuio de Poisson no tem um limite superior, ou


seja, o nmero de ocorrncias X pode assumir uma infinita sequncia de valores.
Exemplos:

1. Um departamento de polcia recebe 5 solicitaes por hora, em mdia,


relacionadas a crimes cometidos. Qual a probabilidade de receber:
a. 2 solicitaes numa hora selecionada aleatoriamente?
P (X=2) = 2,71828 . 5 = 0,0842 ou 8,42%
-5 2

2!

PROBABILIDADES
141

b. No mximo 2 solicitaes numa hora selecionada aleatoriamente?


P (X 2) =P(x = 0)+ P(x = 1) + P(x = 2)
P(x = 0) = 2,71828 . 5 = 0,0067 ou 0,67%
-5 0

0!

P(x = 1) = 2,71828 . 5 = 0,0337 ou 3,37%


-5 1

1!

P (X=2) = 2,71828 . 5 =0,0842 ou 8,42%


-5 2

2!
P (X 2) = 0,0067 + 0,0337 + 0,0842 = 0,1246 ou 12,46%
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

2. Em um posto de gasolina, sabe-se que, em mdia, 10 clientes por hora


param para colocar gasolina numa bomba. Pergunta-se:
a. Qual a probabilidade de 3 clientes pararem qualquer hora para
abastecer?
2,71828-10 . 103
P (X) = = 0,0076 ou 0,76%
3!

b. Qual a mdia, a varincia e o desvio padro para essa distribuio?

Valor mdio: E(X) = 10


Varincia: Var(X) = 10
Desvio padro: (X) = 10 = 3,16

DISTRIBUIO DE PROBABILIDADES CONTNUA

As variveis aleatrias contnuas so aquelas que assumem qualquer valor num-


rico em um intervalo de nmeros reais. Como este tipo de varivel pode assumir
infinitos valores dentro de um intervalo e, por consequncia, infinitos valores
de probabilidade, no faz sentido tratar as variveis contnuas da mesma forma
que so tratadas as variveis discretas.

Distribuio de Probabilidades Contnua


142 UNIDADE IV

Por exemplo, suponhamos que quisssemos calcular a probabilidade de, num


grupo, uma pessoa ter 170 cm de altura. Observe que a varivel aleatria agora
a altura e X pode assumir qualquer valor entre 0 e infinito. Assim, se cada ponto
fosse uma probabilidade, iramos obter probabilidades com valores tendendo a
zero. O valor para probabilidade citada no exemplo seria 1/. Assim, para cal-
cular a probabilidade X, usamos o artifcio de que X esteja compreendido entre
dois pontos quaisquer. Exemplo: podemos calcular a probabilidade de um indi-
vduo medir entre 160 cm e 180 cm. Podemos fazer isso por meio da construo
de um histograma, como pode ser visto abaixo:

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Grfico 1 - Alturas de indivduos
Fonte: as autoras.

Com o conhecimento da rea na qual o intervalo 160 180 est compreendido,


sabemos a probabilidade correspondente de um indivduo ter entre 160 cm e
180 cm. Para o clculo da rea, usamos o artifcio matemtico chamado de inte-
gral. Assim, definidos dois pontos [a, b], a probabilidade da varivel estar entre
a e b dado por:
b

P(a X b) = f (x)dx
a

A funo f(x) chamada de densidade de probabilidade (f.d.p) da varivel ale-


atria X. Assim, podemos construir modelos tericos para variveis aleatrias
contnuas, escolhendo adequadamente as funes densidade de probabilidade.
Dentre as principais distribuies contnuas, destacam-se a Distribuio
Uniforme, Distribuio Exponencial e Distribuio Normal.

PROBABILIDADES
143

DISTRIBUIO UNIFORME

A Distribuio Uniforme uma das mais simples de se conceituar. usada em


situaes em que a funo densidade de probabilidade constante dentro de um
intervalo de valores da varivel aleatria X.
Usualmente, associamos uma distribuio uniforme a uma determinada
varivel aleatria, simplesmente por falta de informao mais precisa, alm do
conhecimento do seu intervalo de valores. O grfico, a seguir, representa a fun-
o dada:
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Grfico 2 - Funo
Fonte: as autoras.

Sendo que:

1
f(x) = se axb
b-a

As frmulas para o valor esperado e para a varincia so:

a+b
E(x) =
2
(b - a)2
Var (x) =
12

Distribuio de Probabilidades Contnua


144 UNIDADE IV

DISTRIBUIO NORMAL DE PROBABILIDADE

A distribuio de probabilidade contnua mais importante e mais utilizada na


prtica a Distribuio Normal. A forma desta distribuio ilustrada por uma
curva em forma de sino, cujo ponto mais alto est na mdia, que tambm a
mediana e a moda da distribuio. Seu formato simtrico em relao mdia
e seus extremos se estendem ao infinito em ambas as direes e, teoricamente,
nunca tocam o eixo horizontal.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Fonte: as autoras.

O desvio-padro determina a curva. Curvas mais largas e planas resultam de


valores maiores de desvio-padro, mostrando maior variabilidade dos dados. A
rea total sob a curva para a Distribuio Normal 1. Como ela simtrica, o
valor da rea sob a curva esquerda e direita equivalente a 0,5 de cada lado.
Para simplificar a notao de uma varivel aleatria com distribuio nor-
mal, com mdia e varincia, utiliza-se:

X ~ N(, 2)

Dizemos que a varivel aleatria X tem distribuio normal com parme-


tros e 2 se sua densidade dada por:

1
f(x) = e - (x - )2 / 2 2
2

PROBABILIDADES
145

Em que:
e = constante matemtica (aproximada por 2,71828).
= constante matemtica (aproximada por 3,14159).
= mdia aritmtica da populao.
= desvio padro da populao.
x = qualquer valor da varivel aleatria contnua onde - < X < .

DISTRIBUIO NORMAL PADRO


Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Para calcular P(a X b) quando X uma varivel aleatria normal com par-
metros e , devemos calcular:
b
1
e - (x - )2 / 2 2 dx
a
2

Quando uma varivel aleatria tem uma distribuio normal com mdia
zero e desvio padro 1, tem uma distribuio normal padro de probabilidade.
Nenhuma das tcnicas de integrao padro pode ser usada para calcular a
integral acima. Assim, quando = 0 e = 1, essa expresso foi calculada e tabu-
lada para valores determinados de a e b. Nesta tabela, entra-se com a varivel
reduzida ou a varivel padronizada Z e se encontra f(Z) ou vice-versa.

Grfico 3 - Distribuio Normal Padro


Fonte: as autoras.

Distribuio de Probabilidades Contnua


146 UNIDADE IV

A partir dessas integrais obtidas numericamente e utilizando a curva normal


padronizada, podemos obter as probabilidades por meio de tabelas prontas que
mostram a rea sob a curva normal correspondente. A tabela para utilizao das
probabilidades mostrada a seguir:

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

PROBABILIDADES
147

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
Tabela 10 - Tabela de distribuio normal reduzida
Fonte: EEL-USP ([2017], on-line).

Vale ressaltar que tabelas com diferentes integrais calculadas podem ser encon-
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

tradas. A tabela acima fornece sempre a seguinte rea sob a curva:

Grfico 4 - rea sobre a curva


Fonte: as autoras.

A tabela anterior retorna a probabilidade de ocorrncia de um evento entre 0 e


z. Na margem esquerda, h o valor de z com uma decimal e, se for necessrio
considerar a segunda decimal, deve-se procur-la na margem superior.
Exemplos:
Para calcular a probabilidade de z entre 0 e 1, procuramos na margem
esquerda a linha que tem z = 1,0 e a coluna 0,00, e encontramos o valor
0,3413. Isto significa que a probabilidade de encontrar um valor de x entre
a mdia zero e z = 1,0 0,3413 ou 34,13%.
Por outro lado, para se obter a probabilidade de z maior que 1, calcula-
mos a probabilidade de z entre 0 e 1, que 0,3413, e a seguir fazemos 0,5
- 0,3413 = 0,1587 ou 15,87%.

Distribuio de Probabilidades Contnua


148 UNIDADE IV

Para se obter a probabilidade de z entre 0 e 1,87, procuramos a clula cuja


linha 1,8 e coluna 0,07. O resultado o valor 0,4693 ou 46,93%.
Valores procurados abaixo da mdia, ou seja, abaixo de 0 iro aparecer
como negativos, porm observe que na tabela no h valores negativos.
Como a curva simtrica, valores negativos so equivalentes aos valo-
res positivos, ou seja, a rea procurada a mesma equivalente aos valores
positivos.

Para utilizar a tabela, as variveis aleatrias x precisam ser padronizadas. A fr-


mula usada para esta converso :

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
xi -
z=

Em que:
xi = ponto que se deseja converter em z.
= mdia da normal original.
= desvio padro da normal original.

Vejamos o exemplo:
Suponha que a mdia da taxa de falhas de dados transmitida em lotes.
Sabe-se que essa caracterstica segue uma distribuio normal com mdia de 2,0
e desvio padro igual a 0,5. Calcule, ento, as seguintes probabilidades:
De tomarmos um lote ao acaso e este ter uma taxa de falhas entre 2,0 e
2,5. Traduzindo para linguagem probabilstica, queremos:

P(2,0 < x < 2,5) = ?

Primeiramente, vamos padronizar os dados.


Lembre-se que a frmula da padronizao :

xi -
Z= e que = 2,0 = 0,5

PROBABILIDADES
149

Assim:
2,5 - 2,0
Z= =1
0,5

2,0 - 2,0
Z= =0
0,5

Novamente traduzimos para a linguagem probabilstica, mas agora usando


os dados padronizados:
P(2,0 < x < 2,5) = P(0 < z < 1) = 0,3413 ou 34,13%
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Queremos uma rea que esteja entre 0 e 1 desvios padro.


Essa rea exatamente o que a tabela nos d. Basta olhar, como explicado
acima, o valor da linha 1,0 e na linha 0,0 para obtermos o valor 0,3413.
Assim, dizemos que a chance de tomarmos um lote que tenha uma taxa de
falhas de dados entre 2,0 e 2,5 de 34,13%.
Vamos ver outra probabilidade:
De tomarmos um lote ao acaso e ter menos que uma taxa de falhas de 2,5.
P(x < 2,5) = P(z < 1) = 0,5 0,3413 = 0,1587 ou 15,87%
De tomarmos um lote ao acaso e ter mais que uma taxa de falhas de 2,5.
P(x > 2,5) = P(z > 1) = 0,5 + 0,3413 = 0,8413 ou 84,13%
De tomarmos um lote ao acaso e ter uma taxa de falhas entre 1,25 e 2,0
falhas.
P(1,25 < x < 2,0) = P(-1,5<z<0) = 0,4332 ou 43,32%
Observe que a rea desejada est entre a mdia (0) e 1,5 desvios abaixo
da mdia. Olhamos no 1,5 na linha e no 0 na coluna, que me dar a rea
entre 0 e 1,5 equivalente rea entre 1,5 e 0.
De tomarmos um lote ao acaso e este ter uma taxa de falhas entre 1,25 e 2,5.
P(1,25 < x < 2,5) = P(-1,5 < z < 1) = 0,4332 + 0,3413 = 0,7745
Observe que, quando olhamos no valor 1,5 na tabela, estamos tomando
a rea entre 0 e 1,5; quando olhamos no 1 na tabela, estamos tomando
a rea entre 0 e 1. Se somarmos as duas reas, ento temos a rea com-
preendida entre 1,5 e 1,0, que condizente com os valores de lotes com
falhas entre 1,25 e 2,5.

Distribuio de Probabilidades Contnua


150 UNIDADE IV

CONSIDERAES FINAIS

Vimos nesta unidade a importncia das probabilidades no nosso cotidiano.


A teoria das probabilidades tenta quantificar a noo de provvel, sendo
uma ferramenta estatstica de grande utilidade quando se trabalha com in-
meros eventos relacionados a pesquisas em empresas, rgos governamentais
e instituies de ensino. Essa ferramenta lida com as chances de ocorrncias de
algo que vai acontecer, ento dizemos que ela lida com fenmenos aleatrios.
Portanto, necessrio conhecer o material de estudo para poder calcular essas

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
chances ou probabilidades de maneira correta e ento tomarmos nossas deci-
ses com base em nossas estimativas.
Um efeito importante da teoria da probabilidade no cotidiano est na ava-
liao de riscos. Normalmente, governos, por exemplo, utilizam processos
envolvidos em probabilidades para suas tomadas de decises. Uma aplicao
importante das probabilidades a questo da confiabilidade, por exemplo, no
lanamento de algum produto, nas chances deles falharem.
Para inferir sobre probabilidades, necessrio saber que tipo de varivel
aleatria est sendo trabalhada. Cada varivel aleatria possui um tipo de com-
portamento chamado de distribuio de probabilidades. Isso importante, pois
cada distribuio de probabilidade possui algumas caractersticas e elas devem
ser respeitadas para que se possa chegar a resultados precisos e ento conclu-
ses vlidas possam ser tomadas sobre aquilo que estamos estudando. Vimos,
nesta unidade, os conceitos bsicos de probabilidade, a forma clssica de calcu-
l-la e tambm vimos as principais distribuies de probabilidades utilizadas.
Deve-se entender que razovel pensar ser de extrema importncia com-
preender como estimativas de chance e probabilidades so feitas e como elas
contribuem para reputaes e decises em nossa sociedade.

PROBABILIDADES
151

1. Explique espao amostral e eventos.

2. Uma mquina de fabricao de computadores tem probabilidade de produzir


um item defeituoso de 10%. Em uma amostra de 6 itens, calcule a probabili-
dade de:
a. Haver no mximo um item defeituoso.
b. Haver 3 itens defeituosos.
c. No haver itens defeituosos.
d. Determine a mdia e a varincia do experimento.

3. A qualidade de alguns CDs foi avaliada sobre a resistncia a arranhes e sobre a


adequao de trilhas. Os resultados foram:

RESISTNCIA A ADEQUAO DE TRILHAS


TOTAL
ARRANHES APROVADO REPROVADO
Alta 700 140 840
Baixa 100 60 160
Total 800 200 1000
Fonte: adaptado de Barbetta et al. (2010)

Se um CD for selecionado aleatoriamente deste lote, qual a probabilidade


de:
a. Ter resistncia alta a arranhes.
b. Ter resistncia baixa a arranhes.
c. Ser aprovado na avaliao das trilhas.
d. Ser reprovado na avaliao das trilhas.
e. Ter resistncia alta ou ser aprovado.
f. Ter resistncia baixa ou ser reprovado.
g. Ter resistncia alta dado que seja reprovado.
h. Ter resistncia baixa dado que seja aprovado.
152

4. Um sistema de banco de dados recebe em mdia 80 requisies por minuto, se-


gundo uma distribuio de Poisson. Qual a probabilidade de que no prximo
minuto ocorram 100 requisies? Determine a mdia e a varincia para essa
varivel aleatria.

5. A distribuio da durao de monitores pode ser aproximada por uma distri-


buio normal de mdia = 6 anos e desvio padro = 2 anos. Determine a
probabilidade de um monitor durar:
a. Entre 6 e 9 anos.
b. Acima de 9 anos.
c. Entre 4 e 9 anos.
d. Acima de 4 anos.
153

Qual a probabilidade de ganhar na Mega Sena?


Acho que todos os brasileiros gostariam de ganhar na Mega Sena, no acham? Por isso
as casas lotricas esto sempre lotadas. Muitos pensam em jogar suas datas de nasci-
mento, de casamento, do aniversrio de algum importante, mas nem sempre esses
nmeros so os sorteados. E esse o momento esperado, o sorteio dos nmeros que
iro decidir se existiram ganhadores.
A cartela da Mega Sena composta por 60 nmeros, enumerados de 01 a 60. A aposta
mnima feita por seis nmeros e a mxima de 15, mas os valores das apostas podem
variar de acordo com o aumento dos nmeros apostados. Quanto mais nmeros mar-
cados, maior a chance de ganhar. Os seis nmeros sorteados (dentre os sessenta) e os
prmios em dinheiro so pagos para os ganhadores da quadra (que o acerto de quatro
nmeros), da quina (acerto de cinco nmeros) e a to esperada sena (o acerto dos seis
nmeros). E aqueles sonhados prmios milionrios so pagos somente a quem acertar
os seis nmeros sorteados; caso mais de uma pessoa acerte os seis nmeros, o prmio
dividido em partes iguais dentre os acertadores. E agora, pergunta-se: qual a chance
de uma pessoa ganhar com apenas seis nmeros?
Essas chances de acerto de seis nmeros so por meio de combinao simples de sessenta
elementos tomados seis a seis C60,6, ou seja, existem 50.063.860 (cinquenta milhes, sessen-
ta e trs mil e oitocentos e sessenta) probabilidade de se acertar os seis nmeros de 1 a 60.
Essa probabilidade corresponde a 1/50.063.860 = 0,00000002 que corresponde a
0,000002%.
A pergunta : quantos jogos de 6 nmeros so possveis utilizando os 60 nmeros
disponveis?
Para a escolha do 1 nmero, temos 60 possibilidades.
Para a escolha do 2 nmero, temos 59 possibilidades
Para a escolha do 3 nmero, temos 58 possibilidades.
Para a escolha do 4 nmero, temos 57 possibilidades.
Para a escolha do 5 nmero, temos 56 possibilidades.
Para a escolha do 6 nmero, temos 55 possibilidades.
Pelo princpio multiplicativo, temos ento 60 x 59 x 58 x 57 x 56 x 55 jogos, ou seja, um
nmero bem grande.
Contudo, devemos verificar que, por exemplo, existe o jogo 1,2,3,4,5,6 que a mesma
coisa que 2,3,4,1,6,5, ou seja, existe a permutao dos 6 nmeros que foram sorteados.
Portanto, para sabermos quantos jogos distintos podemos formar, dividiremos pela
permutao dos 6 algarismos da mega sena, que 6!
Fonte: adaptado de ALAMADA (2010, on-line).
MATERIAL COMPLEMENTAR

Estatstica Bsica. Probabilidade e Inferncia


Luis Gonzaga Morettin
Editora: Pearson
Sinopse: O livro Estatstica bsica traz o contedo programtico de um curso de
estatstica. Fornece diversos exemplos para ilustrar a teoria ao longo dos captulos e,
ao final de cada um deles, apresenta exerccios resolvidos e propostos para auxiliar na
aprendizagem dos estudantes.
155
REFERNCIAS

TOLEDO, G. L.; OVALLE, I. I. Estatstica Bsica. So Paulo: Atlas, 1997.


TRIOLA, M. F. Introduo Estatstica. Rio de Janeiro: LTC, 1999.
SILVEIRA, F. K.; ORTH, A. I.; PRINKLADNICKI, R. RiskFree Uma Ferramenta de Geren-
ciamento de Riscos Baseada no PMBOK e Aderente ao CMMI. V Simpsio Brasilei-
ro de Qualidade de Software SBQS2006 Disponvel em: <http://www.lbd.dcc.
ufmg.br/colecoes/sbqs/2006/014.pdf>. Acesso em: 25 abr. 2017.

REFERNCIAS ON-LINE

Em: <http://www.dequi.eel.usp.br/~fabricio/tabela_dist_normal.pdf>. Acesso em:


25 abr. 2017.
Em: <http://cassiusalmadamatematica.blogspot.com.br/2010/08/analise-combina-
toria-chance-de-ganhar.html>. Acesso em: 25 abr. 2017.
GABARITO

1. Espao amostral o conjunto de todos os possveis resultados do experimento


aleatrio.
Eventos: um dos possveis resultados do experimento aleatrio e do qual se
deseja saber a probabilidade de ocorrncia.

2.
a. 0,53 + 0,35 = 0,88 ou 88%
b. 0,0145 ou 1,45%
c. 0,53 ou 53%....
d. Mdia = 0,6. Varincia = 0,54

3.
a. Ter resistncia alta a arranhes 840/1000
b. Ter resistncia baixa a arranhes 160/1000
c. Ser aprovado na avaliao das trilhas 800/1000
d. Ser reprovado na avaliao das trilhas 200/1000
840 + 800 - 700
e. Ter resistncia alta ou ser aprovado p(aap) = = 940/1000
1000
160 + 200 - 60
f. Ter resistncia baixa ou ser reprovado p(br) = = 300/1000
1000
g. Ter resistncia alta dado que seja reprovado p(a/r) = 140/200
h. Ter resistncia baixa dado que seja aprovado 100/800

4.
2,71828-80 . 80100
P (X) = =0,0039 ou 0,39%
100!
E(x) = 80
Var (x) = 80

5.
a. 0,4332 ou 43,32%
b. 0,0668
c. 0,3413 + 0,4332 = 0,77 ou 77%
d. 0,8413 ou 84,13%
Professora Me. Ivnna Gurniski De Oliveira
Professora Me. Renata Cristina de Souza Chatalov

CORRELAO LINEAR E

V
UNIDADE
REGRESSO

Objetivos de Aprendizagem
Conhecer o coeficiente de correlao linear.
Entender associao entre duas variveis.
Saber interpretar correlao positiva e negativa.
Compreender a correlao e aplicao da correlao de Pearson.
Conhecer a utilizao da regresso linear.
Entender a predio de uma varivel por meio de outra.

Plano de Estudo
A seguir, apresentam-se os tpicos que voc estudar nesta unidade:
Correlao Linear
Regresso Linear
159

INTRODUO

A Estatstica apresenta muitas ferramentas para descrever e analisar dados de


pesquisas. A escolha das ferramentas a serem utilizadas na pesquisa depende dos
seus objetivos, bem como do tipo de varivel com a qual se trabalha.
Como visto na unidade I, as variveis podem ser qualitativas e quantitativas.
Esta distino importante, uma vez que as ferramentas utilizadas para um tipo
de varivel nem sempre podem ser utilizadas para o outro tipo. importante tam-
bm saber que, nas pesquisas, se utiliza no s uma, mas um grupo de variveis.
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Em alguns casos, algumas variveis podem estar relacionadas de alguma


forma e a variao de uma vai depender da variao da outra. As decises geren-
ciais, geralmente, so baseadas nas relaes entre duas ou mais variveis. Por
exemplo, aps considerar a relao entre gastos com publicidade e vendas, um
gerente poderia tentar prever as vendas de acordo com o nvel de gastos com a
publicidade.
O fato de duas variveis estarem ligadas permite tomar decises se baseando
em uma varivel, porm esperando resposta em outra que seja de difcil mensu-
rao ou s possa ser medida tardiamente. Existem algumas medidas estatsticas
que permitem medir o grau de associao entre duas variveis.
Nesta unidade, iremos ver duas delas: a correlao linear e a regresso linear.
Entretanto, essas duas ferramentas s podem ser utilizadas quando as variveis
medidas so quantitativas. Assim, nesta unidade, voc ver como podemos veri-
ficar a associao entre variveis ou a dependncia de uma varivel em funo
da outra, e tambm como quantificar esta associao.
A importncia da correlao e da regresso linear est associada em algumas
decises gerenciais, que so baseadas na relao entre duas ou mais variveis,
como a relao entre o consumo e vendas, matria-prima e produto acabado,
sendo uma ferramenta de fundamental conhecimento para os futuros gestores.

Introduo
160 UNIDADE V

CORRELAO LINEAR

Em diversas situaes, o objetivo apenas estudar o comportamento conjunto


de duas variveis e verificar se elas esto relacionadas, ou seja, saber se as altera-
es sofridas por uma das variveis so acompanhadas por alteraes nas outras.
Em Estatstica, o termo correlao usado para indicar a fora que mantm
unidos dois conjuntos de valores. O estudo da correlao tem como objetivo estu-
dar a existncia ou no de uma relao; e seu grau de relao entre as variveis.
Uma medida do grau da correlao e sua direo dada pela covarincia

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
entre duas variveis aleatrias, mas mais conveniente medir o grau da correla-
o por meio do Coeficiente de Correlao Linear de Pearson.

COEFICIENTE DE CORRELAO LINEAR DE PEARSON

O coeficiente de correlao uma medida que dimensiona a correlao. repre-


sentado pela letra r e dado pela seguinte frmula:

r=

O valor de r no depende de qual das duas variveis em estudo chamada de


x e de y e independe das unidades com as quais as variveis so medidas.
A intensidade do coeficiente de correlao pode variar entre -1 e 1, sendo
que quanto mais prximo de -1 ou de 1, mais forte ser a associao entre as duas
variveis, e quanto mais prximo de 0, mais fraca ser a associao. Quando r =
1, todos os pares (x, y) estaro alinhados em linha reta com coeficiente angular
positivo e quando r = -1, todos os pares (x, y) estaro alinhados com o coefi-
ciente angular negativo (BUSSAB e MORETTIN, 2003).
Quanto ao direcionamento entre as duas variveis, o coeficiente de correlao
pode ser positivo ou negativo. Se a correlao entre duas variveis for positiva,
dizemos que as duas variveis variam para o mesmo sentido.

CORRELAO LINEAR E REGRESSO


161

Exemplo: se sabemos que


a correlao entre renda fami-
liar e gastos com alimentao
positiva, podemos dizer, que,
medida que a renda familiar
aumenta, tambm, aumentam
os gastos com alimentao, ou
medida que a renda familiar
diminui, tambm diminuem
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

os gastos com alimentao.


Entretanto, se dizemos que o
conhecimento e tempo gasto para aprender a operar uma mquina tm uma corre-
lao negativa, ento, podemos pensar que medida que o conhecimento aumenta,
o tempo gasto para aprender a operar uma mquina diminui ou vice-versa.
Se o coeficiente de correlao for igual a 0, dizemos que no existe associa-
o linear entre as duas variveis.
Outra forma de representao das correlaes por meio do diagrama de
disperso, mostrando a variao conjunta entre as duas variveis. Observe os
diagramas de disperso abaixo:

Grfico 1 - Correlao positiva Grfico 2 - Correlao negativa


Fonte: as autoras Fonte: as autoras.

Grfico 3 - Correlao Nula


Fonte: as autoras.

Correlao Linear
162 UNIDADE V

Exemplo:
Verifique se existe correlao linear entre o nmero de nascidos vivos e a
taxa de mortalidade infantil na regio de Maring-PR.
Tabela 01 - Taxa de Mortalidade Infantil em municpios da regio de Maring

TOTAL MENOR DE
REGIONAL DE SADE E MUNICPIOS NASCIDOS VIVOS (X) *
01 ANO (Y)

Astorga 289 6
Colorado 246 2

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Floresta 68 1
Itamb 67 1
Mandaguau 251 4
Mandaguari 423 6
Marialva 378 5
Nova Esperana 423 9
Paiandu 443 4
So Jorge do Iva 59 0
Fonte: adaptada de SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade (2002, on-line).

Inicialmente, interessante traar um diagrama de disperso para as duas vari-


veis, para nos dar uma ideia de como ocorre a variao conjunta dos dados.

Grfico 04 - Disperso da taxa de mortalidade at 1 ano e o nmero de nascidos vivos na regio de Maring
Fonte: adaptado de SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade (2002, on-line).

CORRELAO LINEAR E REGRESSO


163

Por meio do diagrama de disperso, podemos notar que h uma variao cres-
cente entre as duas variveis.
As maiores correlaes positivas e negativas so obtidas somente quando
todos os pontos esto bem prximos a uma linha reta.
O prximo passo calcular o coeficiente de correlao entre as duas vari-
veis. Podemos utilizar uma tabela para organizar os dados:
Tabela 02 - Nascidos Vivos das Cidades Metropolitanas de Maring

NASCIDOS TAXA DE
CIDADE X.Y X2 Y2
VIVOS (X) MORTALIDADE (Y)
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Astorga 289 6 1734 83521 36


Colorado 246 2 492 60516 4
Floresta 68 1 68 4624 1
Itamb 67 1 67 4489 1
Mandaguau 251 4 1004 63001 16
Mandaguari 423 6 2538 178929 36
Marialva 378 5 1890 142884 25
Nova Esperana 423 9 3807 178929 81
Paiandu 443 4 1772 196249 16
So Jorge do Iva 59 0 0 3481 0
Soma 2647 38 13372 916623 216
Fonte: adaptada de SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade (2002, on-line).

Agora, vamos calcular o r:

r= = 0,84

Observe que o valor do coeficiente de correlao foi 0,84. Assim, podemos con-
cluir que existe uma forte correlao ou associao entre o nmero de nascidos
vivos e a taxa de mortalidade antes de 1 ano de idade, uma vez que o valor 0,84
um valor prximo de 1. Em seguida, podemos verificar que, como mostrado

Correlao Linear
164 UNIDADE V

no diagrama de disperso, o valor dessa correlao positivo, ento, podemos


pensar que, se aumenta o nmero de nascidos vivos, tambm h um aumento
na taxa de mortalidade at 1 ano de idade.

O coeficiente de correlao de Pearson (r) uma medida de associao line-

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
ar entre variveis.

COEFICIENTE DE DETERMINAO

O coeficiente de determinao expressa a porcentagem de variao dos valo-


res de Y em funo do valor X, ou seja, este coeficiente mostra at que ponto a
variao conjunta dos dados de fato linear.
Esse coeficiente varia de 0 a 1, sendo que, quanto mais perto de 1, maior a
variao conjunta das duas variveis somadas com a varivel x que dar um
resultado na qual a varivel x pode ser explicada pela varivel y. O R varia
entre 0 e 1, e indica, em percentual, o quanto o modelo consegue explicar os
valores observados, e quanto maior o R, mais explicativo o modelo, melhor
ele se ajusta amostra.
O coeficiente de determinao dado por R2, ou seja, o smbolo do coefi-
ciente de determinao dado por R maisculo e dado pelo valor encontrado
para a correlao linear de Pearson ao quadrado.
Utilizando um exemplo em que r = 0,84, o coeficiente de determinao ser
dado por:
R2 = 0,842 = 0,7056
Isso mostra que a variao conjunta dos dados boa, ou seja, a variao da
taxa de mortalidade pode ser explicada pela variao no nmero de nascidos
vivos. Observe que os dados retirados pela estatstica se encaixam.

CORRELAO LINEAR E REGRESSO


165

REGRESSO LINEAR

A anlise de regresso uma tcnica estatstica cujo objetivo investigar e des-


crever a relao entre variveis por meio de um modelo matemtico. Esta relao
explorada de modo que se possa obter informaes sobre uma varivel, por
meio dos valores conhecidos das outras.
Primeiramente, preciso estudar a dependncia de uma varivel em rela-
o outra e, assim, indicar a varivel independente para o eixo x e a varivel
dependente para o eixo y. medida que a varivel independente (ou explica-
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

tiva) varia, provoca uma mudana na varivel dependente (ou resposta).


Aplicaes da regresso:
Estimar valores de uma varivel com base em valores conhecidos de
outra varivel.
Situaes em que as duas variveis medem, aproximadamente, a mesma
situao, mas uma delas relativamente dispendiosa ou difcil de lidar,
enquanto a outra no.
Explicar valores de uma varivel em termos da outra, isto , pode-se sus-
peitar de uma relao de causa e efeito.
Predizer valores de uma varivel para a anlise de regresso: resta saber
como o tipo dessa relao.

REGRESSO LINEAR SIMPLES

A regresso linear simples assim chamada quando duas variveis, X e Y


(numricas e contnuas) esto relacionadas linearmente. Isso quer dizer que
medida que X aumenta, Y tambm aumenta, ou medida que X aumenta, y
diminui. Essa relao dada por uma equao que chamamos de equao de
regresso linear:

Regresso Linear
166 UNIDADE V

= a + bx em que

= valor predito da varivel resposta.


a = constante de regresso que representa o intercepto entre a linha de regres-
so e o eixo y.
b = coeficiente linear de regresso da varivel resposta y em funo da vari-
vel explicativa x; inclinao da reta; taxa de mudana na varivel y por unidade
de mudana na varivel x.
x = valor da varivel explicativa.

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
O coeficiente de regresso b fornece uma estimativa da variao esperada
de y a partir da variao de uma unidade em x (BARBETTA et al., 2010).
A partir dessa equao, possvel encontrar os valores preditos para y e a
reta de regresso. Alm disso, a relao entre x e y pode ser mostrada por um
diagrama de disperso. Vejamos o diagrama de disperso abaixo, mostrando a
relao entre as variveis x e y, bem como o exemplo de uma reta de regresso.

Grfico 05 - Reta de Regresso Linear


Fonte: as autoras.

O diagrama de disperso mostra o tipo de relao que existe entre x e y e tam-


bm verifica se o modelo proposto (y = a + bx) explica bem a variao dos dados.
O modelo explicar melhor quanto mais perto dos dados ou dos pontos (visto
no grfico) a reta estiver.

CORRELAO LINEAR E REGRESSO


167

O mtodo mais usado para ajustar uma linha reta a um conjunto de pontos
conhecido como mtodo dos mnimos quadrados que nos fornece os seguin-
tes resultados para estimarmos a e b:

b= e a = y - bx
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

Em que so as mdias de y e x, respectivamente.


Exemplo:
Tabela 03 - Nascidos Vivos das Cidades Metropolitanas de Maring

TOTAL MENOR
REGIONAL DE SADE E MUNICPIOS NASCIDOS VIVOS *
DE 01 ANO

Astorga 289 6
Colorado 246 2
Floresta 68 1
Itamb 67 1
Mandaguau 251 4
Mandaguari 423 6
Marialva 378 5
Nova Esperana 423 9
Paiandu 443 4
So Jorge do Iva 59 0
Fonte: adaptada de SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade (2002, on-line).

Nesse caso, a varivel x o nmero de nascidos vivos, a varivel y a taxa de mor-


talidade, uma vez que evidente que a taxa de mortalidade depende do nmero
de nascidos vivos. A partir dessa definio, necessria a estimao dos par-
metros da equao a e b.

Regresso Linear
168 UNIDADE V

Tabela 04 - Nascidos Vivos das Cidades Metropolitanas de Maring

TAXA DE
CIDADE NASCIDOS VIVOS (X) X.Y X2
MORTALIDADE (Y)
Astorga 289 6 1734 83521
Colorado 246 2 492 60516
Floresta 68 1 68 4624
Itamb 67 1 67 4489
Mandaguau 251 4 1004 63001
Mandaguari 423 6 2538 178929

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
Marialva 378 5 1890 142884
Nova Esperana 423 9 3807 178929
Paiandu 443 4 1772 196249
So Jorge do Iva 59 0 0 3481
Soma 2647 38 13372 916623
Fonte: adaptada de SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade (2002, on-line).

Assim, o valor de b e de a ser:

(2647 . 38)
13372 -
10
b= = 0,015
2647 2
916623 -
10

2647 38
x= = 264,7 y= = 3,8
10 10

a = 3,8 0,015 x 264,7 = -0,17

De acordo com o valor de b, dizemos que a cada 1 nascido vivo esperamos


um aumento (b positivo) de 0,015% na taxa de mortalidade em crianas de at
1 ano de idade.
Assim, a equao da reta de regresso dada por:

= - 0,17 + 0,015x

CORRELAO LINEAR E REGRESSO


169

As equaes de regresso mostram as taxas de mortalidades preditas em


funo do nmero de nascidos vivos, como segue:
Tabela 05 - Nascidos Vivos das Cidades Metropolitanas de Maring

NMERO DE NASCIDOS VIVOS (X) A + BX


59 - 0,17 + 0,015 . 59 0,715
67 - 0,17 + 0,015 . 67 0,835
68 - 0,17 + 0,015 . 68 0,85
246 - 0,17 + 0,015 . 246 3,52
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

251 - 0,17 + 0,015 . 251 3,595


289 - 0,17 + 0,015 . 289 4,165
378 - 0,17 + 0,015 . 378 5,5
423 - 0,17 + 0,015 . 423 6,175
443 - 0,17 + 0,015 . 443 6,475
Fonte: adaptada de SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade (2002, on-line).

Para cada nmero de nascidos vivos, temos uma taxa de mortalidade prevista.
A representao grfica para esta situao pode ser observada no diagrama de
disperso abaixo.

Grfico 06 - Diagrama de disperso para a taxa de mortalidade prevista em funo do nmero de nascidos vivos
Fonte: as autoras.

Regresso Linear
170 UNIDADE V

Observe que, para cada nmero de nascidos vivos, foi construda uma equao
e obtida uma taxa de mortalidade prevista. No grfico 2, mostrada a reta que
descreve os dados e, a ttulo de exemplificao, foi mostrado um ponto no gr-
fico em que o nmero de nascidos vivos (disposto no eixo x) foi 378 e a taxa de
mortalidade (disposta no eixo y) prevista de 5,41.
Vimos que a correlao linear de Pearson mostrou um valor alto para a rela-
o entre o nmero de nascidos vivos e a taxa de mortalidade (0,84), e que foi
verificada uma correlao populacional acima de 0. Na anlise de regresso,
utilizamos, tambm, o coeficiente de determinao para verificar a preciso da

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
reta de regresso e dizer se ela explica bem ou no a variao dos dados.
Como vimos:

R2 = 0,7056

A explicao para a anlise de regresso ser:


70,56% da variao observada na taxa de mortalidade explicada pela reta
de regresso. Isto mostra que a reta se aproxima bem dos pontos observados. A
reta de regresso mostra as equaes de regresso previstas e os pontos so os
valores observados.

Grfico 07 - Diagrama de disperso para a taxa de mortalidade prevista e taxa de mortalidade observada em
funo do nmero de nascidos vivos
Fonte: as autoras.

CORRELAO LINEAR E REGRESSO


171

Os pontos em vermelho nos mostram as taxas de mortalidade observadas. Observe


que os pontos esto prximos da reta de regresso. Isso, associado ao coeficiente
de determinao, indica boa preciso da variao dos dados.
A partir da equao dada acima e tambm do diagrama de disperso, podemos
fazer predies para a varivel dependente em funo da varivel independente.
Como exemplo, podemos prever a taxa de mortalidade em funo de qualquer
nmero de nascidos vivos dentro do intervalo estudado (59 a 443). Supondo que
quisssemos saber a taxa de mortalidade esperada para um nmero de 300 nasci-
dos vivos, se substituirmos esse valor na equao de regresso estimada, temos que:
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

= - 0,17 + 0,015 x 300 = 4,33% de mortalidade esperada

No entanto, essas predies devem seguir alguns critrios:


S podemos fazer predies em casos de valores dentro do intervalo tra-
balhado para a varivel independente.
S devemos fazer essas predies caso, de fato, a varivel independente
explique a variao da varivel dependente.

Exerccios:
Resultado de um teste (de 0 a 100) sobre conhecimento (X) e tempo gasto
(minutos) para aprender a operar uma mquina (Y) para oito indivduos.
Tabela 06 - Tempo gasto para operao de uma mquina

INDIVDUO TESTE (X) TEMPO (Y)

A 45 343
B 52 368
C 61 355
D 70 334
E 74 337
F 76 381
G 80 345
H 90 375
Fonte: as autoras.

Regresso Linear
172 UNIDADE V

Responda:

1. Construa um diagrama de disperso entre as variveis teste e tempo.

2. Calcule os valores do coeficiente de regresso linear b e do intercepto a.

3. Demonstre os valores das equaes para o tempo esperado ou previsto


para todos os valores do teste.

4. Demonstre o diagrama de disperso para as duas variveis utilizando os

Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.
y preditos.

5. Demonstre o valor do tempo esperado quando o valor do teste for igual


a 69.

R: 2) a = 316,462 e b = 0,548

A anlise de regresso tambm pode ser feita com vrias variveis indepen-
dentes sobre uma nica varivel dependente. A esse tipo de anlise damos o
nome de anlise de regresso mltipla, que muito utilizada em aplicaes
financeiras como renda, poupana e juros. Para ver um exemplo, leia o livro
Estatstica para os cursos de engenharia e informtica de Pedro Barbetta.
Fonte: Barbetta (2010, p. 346).

CORRELAO LINEAR E REGRESSO


173

CONSIDERAES FINAIS

Estudar o grau de relacionamento entre duas variveis de grande importncia


dentro das anlises estatsticas. Para verificar o grau de associao entre duas
variveis, h a necessidade de conhecer os mtodos estatsticos utilizados para
tal procedimento.
Vimos, nesta unidade, duas ferramentas importantes para estudar o grau de
associao entre duas caractersticas numricas: a correlao e a regresso. Na
Estatstica, estuda-se casos com 1 varivel. No estudo de Correlao e Regresso,
Reproduo proibida. Art. 184 do Cdigo Penal e Lei 9.610 de 19 de fevereiro de 1998.

deve-se levar em conta 2 ou mais variveis. Dentre esse estudo, o principal obje-
tivo investigar a existncia ou no de relao entres essas variveis, quantificando
a fora dessa relao por meio da correlao, ou explicitando a forma dessa rela-
o por meio da regresso.
As correlaes podem ser Positivas, quando o aumento de uma varivel cor-
responde ao aumento da outra; Negativas, quando o aumento de uma varivel
corresponde diminuio da outra; Lineares, quando possvel ajustar uma reta,
que podem ser fortes (quanto mais prximas da reta) ou fracas (quanto menos
prximas da reta), e ainda No Lineares, quando no possvel ajustar uma reta.
Aps estabelecida uma relao linear e uma boa correlao entre as vari-
veis, deve-se, agora, determinar uma frmula matemtica para fazer predies
de uma das variveis por meio da outra, e a essa tcnica damos o nome de an-
lise de regresso.
importante entender que nem sempre duas variveis esto de fato asso-
ciadas. Para isso, h necessidade da avaliao do coeficiente de determinao
na anlise de regresso. , tambm, importante termos bom senso na hora de
calcular algumas medidas, uma vez que estamos trabalhando com frmulas
matemticas para explicar fenmenos. Assim, sempre algum valor ser extrado
numericamente, porm, nem sempre esses valores podem ser explicados biologi-
camente ou socialmente. Portanto, cabe ao pesquisador escolher quais variveis
devem participar das anlises.

Consideraes Finais
174

1. Um estudo foi desenvolvido para verificar o quanto o comprimento de um cabo


da porta serial de microcomputadores influencia na qualidade da transmisso
de dados, medida pelo nmero de falhas em 10000 lotes de dados transmitidos
(taxa de falha) (BARBETTA et al., 2010).
Os resultados foram:
COMPRIMENTO DO CABO (M) TAXA DE FALHA
8 2,2
8 2,1
9 3,0
9 2,9
10 44,1
10 4,5
11 6,2
11 5,9
12 9,8
12 8,7
13 12,5
13 13,1
14 19,3
14 17,4
15 28,2

Fonte: as autoras.

Desenvolva os exerccios abaixo:


a. Explique quem a varivel independente (x) e a dependente (y).
b. Demonstre e interprete o valor da correlao entre o comprimento do cabo
e a taxa de falha.
c. Verifique a significncia da correlao populacional em nvel de 1% de erro.
d. Explique a significncia da correlao por meio dos intervalos.
e. Demonstre os valores de b e de a na anlise de regresso linear.
f. Demonstre os valores das equaes de predio (y = a + bx) para todos os
comprimentos de cabo mostrados na tabela.
175

g. Demonstre o diagrama de disperso entre os valores dos comprimentos dos


cabos (x) e das taxas de falhas preditas ().
h. Calcule e interprete o coeficiente de determinao e de alienao.
i. Explique a diferena entre a anlise de correlao linear e de regresso linear.

2. Uma pesquisa foi realizada para verificar o efeito da rea (m2) sobre o preo de
terrenos na cidade de Mogi Mirim-SP. Considere a equao y = 20 + 0,5x para
estimar os preos em funo da rea. Considerando terrenos com 200, 300 e
400 m2, estime o preo de cada terreno.

3. esperado que a massa muscular de uma pessoa diminua com a idade. Para
estudar essa relao, uma nutricionista selecionou 18 mulheres, com idade entre
40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y).
Determine a correlao linear entre a idade a massa muscular.
Relao entre massa muscular e idade
MASSA MUSCULAR (Y) IDADE (X)
82.0 71.0
91.0 64.0
100.0 43.0
68.0 67.0
87.0 56.0
73.0 73.0
78.0 68.0
80.0 56.0
65.0 76.0
84.0 65.0
116.0 45.0
76.0 58.0
97.0 45.0
100.0 53.0
105.0 49.0
77.0 78.0
73.0 73.0
78.0 68.0

Fonte: as autoras.
176

Hipertenso arterial e consumo de sal em populao urbana


A hipertenso arterial considerada um problema de sade pblica por sua magnitude,
risco e dificuldades no seu controle. tambm reconhecida como um dos mais impor-
tantes fatores de risco para o desenvolvimento do acidente vascular cerebral e infarto
do miocrdio.
Vrios estudos populacionais evidenciam a importncia do controle da hipertenso para
a reduo da morbimortalidade cardiovascular. Desta forma, as elevadas taxas de mor-
bimortalidade cardiovascular em pases de industrializao recente parecem depender
de modo importante da elevada prevalncia de hipertenso arterial nesses pases. Ape-
sar de no se dispor de estudos com boa representatividade em nvel nacional sobre
a hipertenso arterial no Brasil, pesquisas localizadas mostram prevalncias elevadas,
situando-se no patamar de 20 a 45% da populao adulta.
Na maioria dos casos, desconhece-se a causa da hipertenso arterial. Porm, vrios so
os fatores que podem estar associados elevao da presso arterial como o sedenta-
rismo, o estresse, o tabagismo, o envelhecimento, a histria familiar, a raa, o gnero, o
peso e os fatores dietticos.
Apesar de consolidada a relao entre hipertenso arterial e os fatores nutricionais, ain-
da no so bem esclarecidos os mecanismos de atuao destes sobre a elevao da
presso arterial. So conhecidos, no entanto, os efeitos de uma dieta saudvel (rica em
frutas e vegetais e pobre em gordura) sobre o comportamento dos nveis pressricos.
Dentre os fatores nutricionais estudados e que se associam alta prevalncia de hiper-
tenso arterial esto o elevado consumo de lcool e sdio e excesso de peso. Recente-
mente vm sendo, tambm, associados o consumo de potssio, clcio e magnsio, os
quais atenuariam o progressivo aumento dos nveis pressricos com a idade.
A avaliao diettica de sdio extremamente complexa, j que sua ingesto diria
varia substancialmente e pode subestimar a quantidade de sdio ingerida, pois no
leva em considerao as diferenas interpessoais na adio de sal. Alm disso, outro
problema encontrado para a realizao da avaliao diettica a tabela de composio
de alimentos utilizada, que pode variar muito de um pas para o outro e no contemplar
preparaes regionais e os produtos industrializados produzidos internamente.
Levando-se em considerao que mais de 95% do sdio ingerido excretado na urina, e
que a avaliao diettica apresenta muitos problemas operacionais, a excreo urinria
de 24h vem sendo utilizada como um marcador do consumo dirio de sdio, apesar da
grande variabilidade intraindividual. Assim sendo, interpretaes clnicas e fisiolgicas
baseadas numa nica avaliao devem ser cautelosas. Este problema, porm, pode ser
superado em estudos de base populacional, visto que a excreo urinria de sdio
considerada um bom ndice de consumo de sal num dado dia.
177

A maior parte dos estudos que visa associar o consumo de sdio hipertenso arterial
utiliza a excreo urinria de sdio de 24h como marcador dirio e em muitos h uma
consistente relao. Evidncias sobre a associao do consumo de sdio e hipertenso
foram relatadas tambm pelo INTERSALT Group, principalmente quando foram avalia-
das as diferenas nas prevalncias de hipertenso arterial associadas ao nvel de indus-
trializao das populaes estudadas. Populaes ocidentais e com alto consumo de
sal apareceram como tendo os maiores percentuais de hipertenso, enquanto as popu-
laes rurais ou primitivas que no faziam uso de sal de adio apresentaram menores
prevalncias ou nenhum caso de hipertenso arterial. Porm, o sobrepeso e o seden-
tarismo, presentes nessas populaes, podem ser importantes variveis de confuso.
Outros estudos foram conduzidos nesta direo em vrias populaes com objetivo de
comprovar a hiptese de que uma grande ingesto de sal na dieta aumenta os nveis
pressricos, independentemente da idade e de outros fatores, hoje j bem estabeleci-
dos.
Fonte: Bisi Molina et al. (2003)
MATERIAL COMPLEMENTAR

Estatstica Bsica
Wilton de O. Bussab, Pedro A. Morettin
Editora: Saraiva
Sinopse: O livro trata da estatstica bsica e dividido em trs partes. A primeira trata
da anlise de dados unidimensionais e bidimensionais, com ateno especial para
mtodos grficos. A segunda parte trata dos conceitos bsicos de probabilidades
e variveis aleatrias. Por fim, a terceira parte estuda os tpicos principais da
interferncia estatstica, alm de alguns temas especiais, como regresso linear
simples.
179
REFERNCIAS

BARBETTA, P. A. et al. Estatstica para os cursos de engenharia e informtica. 3.


ed. So Paulo: Atlas, 2010.
BISI MOLINA, M. D. C.; CUNHA, R. de S.; HERKENHOFF, L. F.; MILL, J. G. Hipertenso ar-
terial e consumo de sal em populao urbana. Rev. Sade Pblica [on-line]. 2003, v.
37, n. 6, p. 743-750. Disponvel em: <http://www.scielo.br/scielo.php?script=sci_art-
text&pid=S0034-89102003000600009&lng=en&nrm=iso&tlng=pt>. Acesso em: 25
abr. 2017.
BUSSAB, W. O.; MORETTIN, P. A. Estatstica Bsica. So Paulo: Saraiva, 2003.
SESA/ISEP/CIDS - Departamento de Sistemas de Informao em Sade. Situao da
Mortalidade Infantil no Paran Trinio 2000-2002. Disponvel em: <http://www.
saude.pr.gov.br/arquivos/File/SPP_Arquivos/comite_mort_mat_infant/infantil/
15SITUA__O_DA_MORTALIDADE_INFANTIL_NO_PARAN__2000_2002.pdf>. Acesso
em: 26 abr. 2017.
GABARITO

1.
a. A varivel independente o comprimento do cabo x e a varivel dependente
a varivel taxa de falhas y, ou seja, a taxa de falhas depende do comprimen-
to do cabo.
b. 0,47 verifica-se uma correlao mediana e positiva entre as duas variveis
a, mostrando que, quanto maior o comprimento do cabo, maior a taxa de
falhas.
c. tc = 2,17 ttabelado = 3,06
tc < ttabelado conclui-se que no existe significncia na correlao entre as duas
variveis em nvel de 1% de erro.
d. Correlao substancial entre as duas variveis.
e. b = 2,4 a = -15,2
f.
COMPRIMENTO DO CABO (M)
8 4,08
9 6,49
10 8,9
11 11,31
12 13,72
13 16,13
14 18,54
15 20,95

g. Diagrama de disperso

Grfico 01 - Diagrama de disperso entre o comprimento do cabo e as taxas de falhas preditas


Fonte: as autoras.
181
GABARITO

h. R2 = 0,472 = 0,22 k = 0,78


22% dos dados so explicados pela equao linear de regresso.
Pelo coeficiente de alienao, observamos que h mais ausncia que relao
entre as duas variveis.
i. Na correlao linear, medimos somente o grau de associao linear entre
duas variveis. Na anlise de regresso, porm, medimos o quanto de varia-
o de uma varivel explicada pela outra; podemos, tambm, fazer predi-
es de uma varivel baseada em outra.

2. 120; 170; 220.

3. -0,837.
CONCLUSO

Caro(a) aluno(a)!
Este material foi feito para contribuir com seu processo de formao. Atualmente,
as informaes chegam a ns de forma rpida e no podemos deixar de pensar o
quanto a Estatstica til para quem precisa tomar decises.
Nesse sentido, a Estatstica aparece como suporte na compreenso dos fatos, dando
base para o seu entendimento e compreenso adequada para eles.
Este material tratou de alguns pontos importantes no ensino da Estatstica. O pri-
meiro ponto tratou da importncia da Estatstica, dos seus conceitos e da aplicao
de algumas de suas ferramentas. Em qualquer pesquisa, seja ela de ordem observa-
cional ou experimental, utilizamos a Estatstica.
Na unidade II, foram discutidas formas de apresentao dos dados estatsticos, mais
especificamente a estruturao e a interpretao de grficos e tabelas.
A unidade III tratou das medidas descritivas, mostrou como devemos calcul-las e
onde devemos aplic-las. Vimos as principais medidas de posio, as separatrizes e
as medidas de disperso.
Na unidade IV, trabalhamos com parte da teoria das probabilidades e algumas de
suas principais distribuies. As distribuies de probabilidades, vistas tambm nes-
sa unidade, lida com probabilidades, porm associadas ao tipo de varivel aleatria
em questo. Para utilizarmos qualquer distribuio, necessrio saber se a varivel
aleatria numrica contnua, discreta.
Finalizando o material, a unidade V tratou das medidas de associao, duas ferra-
mentas importantes dentro da estatstica. Tanto a correlao quanto a regresso
envolvem associao entre variveis, embora a funo de cada uma delas seja dife-
rente. Na correlao, tem-se o grau de associao entre as duas variveis; na regres-
so, o que se obtm estimao de uma varivel por meio da outra. Entender como
duas variveis se relacionam importante dentro da anlise de dados. Alguns cri-
trios devem ser seguidos, entretanto, ao se trabalhar com regresso ou correlao,
essas medidas s podem ser utilizadas em casos de variveis quantitativas.
Professora Me. Ivnna Gurniski De Oliveira
Professora Me. Renata Cristina de Souza Chatalov

Você também pode gostar