Você está na página 1de 166

1

Estatstica
Bsica
Silvio Alves de Souza
NDCE
Conceitos Bsicos de Estatstica..................................................................................4
Populao.................................................................................................................7
Amostra.....................................................................................................................8
Arredondamento de nmeros...................................................................................8
................................................................................................................................13
Proporo................................................................................................................13
Porcentagem...........................................................................................................15
Exerccios...............................................................................................................15
Fases do Mtodo Estatstico.......................................................................................19
Definio do Problema............................................................................................19
Planejamento...........................................................................................................19
Coleta dos Dados....................................................................................................20
Apurao dos Dados...............................................................................................22
Apresentao dos Dados........................................................................................22
Anlise e nterpretao dos Dados.........................................................................23
Questionrios..............................................................................................................24
Ordem das Questes...............................................................................................25
Tipo de Abordagem.................................................................................................25
Clareza nas Perguntas............................................................................................25
No Sugerir Respostas............................................................................................26
A Necessidade do Pr-Teste...................................................................................26
A Prtica de Pesquisas por Amostragem................................................................26
Amostragem................................................................................................................27
Amostragem Aleatria Simples...............................................................................27
Amostragem Estratificada........................................................................................28
Amostragem por Conglomerado..............................................................................31
Amostragem Sistemtica.........................................................................................32
Exerccios................................................................................................................33
Distribuio de Freqncia..........................................................................................39
Dados Brutos...........................................................................................................39
Rol............................................................................................................................39
Tabela de freqncia...............................................................................................39
Distribuio de Freqncias de Dados Tabulados No-Agrupados em Classes
..............................................................................................................................40
Distribuio de Freqncias de Dados Agrupados em Classes.........................41
Manual para Normalizao de Publicaes Tcnico cientificas..........................45
Exerccios................................................................................................................46
Medidas de Tendncia Central. ................................................................................52
Medidas de Variabilidade............................................................................................63
....................................................................................................................................63
Exerccios................................................................................................................67
Representao Grfica................................................................................................74
Exerccios................................................................................................................89
Probabilidade...............................................................................................................91
Exerccio:...................................................................................................................107
Distribuies de probabilidade..................................................................................114
Teste de Hiptese.....................................................................................................140
2
Correlao.................................................................................................................154
Regresso Linear......................................................................................................162
Regresso Mltipla....................................................................................................164
3
Conceitos Bsicos de Estatstica
Definio de Estatstica:
No plural (Estatsticas) indica qualquer coleo consistente de dados numricos,
reunidos com a finalidade de fornecer informaes acerca de uma atividade
qualquer. Assim, por exemplo, as estatsticas demogrficas referem-se aos
dados numricos sobre nascimentos, falecimentos, matrimnios, desquites,
etc. As estatsticas econmicas consistem em dados numricos relacionados
com emprego, produo, preos, vendas e com outras atividades ligadas aos
vrios setores da vida econmica.
No singular, indica uma metodologia desenvolvida para a coleta, a classificao,
a apresentao, a anlise e a interpretao de dados quantitativos e a
utilizao desses dados para a tomada de decises.
A grosso modo podemos dividir a estatstica em trs reas:
Estatstica Descritiva
Probabilidade
nferncia Estatstica
Estatstica Descritiva
Pode ser definida como um conjunto de tcnicas destinadas a descrever,
analisar e interpretar dados, a fim de que possamos tirar concluses a respeito de
caractersticas de interesse.
, em geral, utilizada na etapa inicial da anlise, quando tomados contatos
com os dados pela primeira vez.
Probabilidade
4
Aplicada a no poucos das cincias naturais, do comportamento e sociais, e
constitui, presentemente, um importante instrumento para anlise de qualquer
situao (em cincia, administrao ou na vida diria) que, de alguma forma,
envolva um elemento de incerteza, ou chance.
5
Inferncia Estatstica
o estudo de tcnicas que possibilitam a extrapolao dos resultados,
estimao de quantidades desconhecidas e testar hipteses a partir de um conjunto
de dados denominado amostra. Podemos assim chegar a concluses sobre a
populao.
Natureza dos dados
Dados Nominais: So dados categricos (qualitativos ou descritivos).
Exemplos: solteiro ou casado, sim ou no, gordo ou magro, etc. Podem ser
transformados em dados numricos, como por exemplo: 1 sim e 2 no.
Dados ordinais: So dados numricos os quais podemos estabelecer
desigualdades, como por exemplo 1- madeira e 2 diamante. Temos que
2>1. Em se tratando de dados ordinais , > no significa necessariamente "
maior do que. Pode representar por exemplo " mais feliz do que , " mais
gostoso do que , mais resistente do que, etc.
Dados intervalares: So dados numricos que podemos estabelecer
desigualdades e formar diferenas. Exemplo: Temperaturas.
Dados de razo: So dados numricos que podemos estabelecer
desigualdades, diferenas, formar multiplicao e diviso. Exemplos: peso,
altura, dinheiro, volume, etc.
6
Populao Amostra
Estatstica Descritiva
nferncia
b!etivo do Estudo da Estatstica
A utilizao da Estatstica cada vez mais acentuada em qualquer atividade
profissional da vida moderna. Nos seus mais diversificados ramos de atuao, as
pessoas esto freqentemente expostas Estatstica, utilizando-a com maior ou
menor intensidade. sto se deve s mltiplas aplicaes que o mtodo estatstico
proporciona queles que dele necessitam.

Po"ulao
Conjunto da totalidade dos indivduos sobre o qual de faz uma inferncia.
Em linguagem mais formal, a populao o conjunto constitudo por todos os
indivduos que apresentem pelo menos uma caracterstica comum, cujo
comportamento interessa analisar (inferir).
Essas caractersticas da populao so comumente chamadas de
parmetros, os quais so valores fixos e ordinariamente desconhecidos.
Exemplo:
Se se quiser realizar um estudo censitrio das rendas das famlias, poderia
existir uma observao para cada famlia no Brasil, podemos limitar a populao ao
estado de Minas Gerais.
Observao:
importante ficar bem claro que uma populao estudada em termos de
observaes de caractersticas nos indivduos, e no em termos de pessoas ou
objetos em si. Assim, por exemplo, as alturas dos cidados de MG constituem uma
populao. Poderia haver uma populao correspondente aos pesos desses
mesmos cidados.
7
A#ostra
Um subconjunto, uma parte selecionada da totalidade de observaes
abrangidas pela populao, atravs da qual se faz um juzo ou inferncia sobre as
caractersticas da populao.
Exemplo:
Avaliao de um Programa de Ensino Toma-se certo nmero de pares de
turmas: a um conjunto de turmas ensina-se um assunto por um novo mtodo, e ao
outro conjunto, pelo mtodo clssico. Aplica-se uma prova a ambos os grupos. As
notas observadas nesses conjuntos de turmas consistem a nossa amostra. Se os
resultados do novo mtodo forem melhores, iremos aplica-lo a todas as turmas isto
, populao. A partir da amostra estabelecemos o que conveniente para a
populao, ou seja, fazemos uma inferncia sobre a populao.
Arredonda#ento de n$#eros
Arredondamento por falta
Quando o primeiro dgito, aquele situado mais esquerda entre os que iro
ser eliminados, for igual ou menor que quatro, no dever ser alterado o dgito
remanescente.
Nmero a
arredondar
Arredondamento
para
Nmero arredondado
12,489 nteiros 12
20,733 Dcimos 20,7
35,992 Centsimos 35,99
Arredondamento por excesso
Quando o primeiro dgito, aquele situado mais esquerda entre os que iro
ser eliminados, for maior ou igual a cinco seguido por dgitos maiores que zero, o
dgito remanescente ser acrescido de uma unidade.
8

Nmero a
arredondar
Arredondamento
para
Nmero arredondado
15,504 nteiros 16
16,561 Dcimos 16,6
17,578 Centsimos 17,58
Arredondamento centrais
Quando o dgito situado mais esquerda dos que sero eliminados for um
cinco ou um cinco seguido somente de zeros, o ltimo dgito remanescente, se for
par, no se altera, e se for mpar ser aumentado uma unidade.
Nmero a
arredondar
Arredondamento
para
Nmero arredondado
15,500 nteiros 16
16,500 nteiros 16
17,750 Dcimos 17,8
17,705 Centsimos 17,70
Arredondamento de Soma
Quando se trata de soma, deve-se arredondar primeiro o total, e
posteriormente as parcelas. H aqui dois casos a considerar:
a) Se a soma das parcelas da srie arredondada for superior ao total, deve-se
retornar srie original, arredondando-se, por falta, tantas parcelas quantas
forem as unidades excedentes. Sero escolhidas as parcelas anteriormente
arredondadas por excesso e cujas fraes desprezadas representem o menor
erro relativo.
9
O erro relativo ser definido como: dados dois nmeros diferentes de zero x
e
y
com
y x >
, o erro relativo entre eles ser calculado pela expresso
x
y x
E
R

O arredondamento do erro feito de modo a poder identificar a ordem das


parcelas.

Exemplo: O quadro abaixo apresenta um modelo de arredondamento, para inteiro,
da soma total de uma srie.
Srie
original
Erro
relativo
Srie arredondada Srie corrigida
5,51 0,082 6 6
7,50 0,062 8 8
14,63 0,025 15 15
20,10 20 20
24,73 0,011 25 24 *
27,52 0,017 28 27 *
Total : 99,99 102 100
Observaes: 1. (*) srie corrigida
2. O arredondamento do erro foi milesimal para poder identificar as
duas menores parcelas.
Veja o clculo dos erros relativos
081667 0
6
51 5 6
,
,
E
R

062500 0
8
50 7 8
,
,
E
R

024667 0
15
63 14 15
,
,
E
R

010800 0
25
73 24 25
,
,
E
R

017143 0
28
52 27 28
,
,
E
R

10
b) Se a soma das parcelas da srie arredondada for inferior ao total, deve-se
retornar srie original, arredondando-se, por excesso, tantas parcelas
quantas forem as unidades em falta. Sero escolhidas as parcelas
anteriormente arredondadas por falta e cujas fraes desprezadas
representem o menor erro relativo.
11
Exemplo: O quadro abaixo apresenta um modelo de arredondamento, para
centsimo, da soma total de uma srie.
Srie original Erro
relativo
Srie arredondada Srie corrigida
2,514 0,0016 2,51 2,51
12,502 0,0002 12,50 12,50
4,6355 4,64 4,64
11,1028 0,0002 11,10 11,10
35,733 0,0001 35,73 35,74 *
7,524 0,0005 7,52 7,52
Total : 74,0113 74,00 74,01
Observao: (*) srie corrigida
Exemplo: A tabela a seguir apresenta os resultados de uma pesquisa realizada com
162 alunos de uma escola pblica:
dades
(anos)
Freqnci
a
simples
Porcentagem
(calculadora)
Porcentagem
(dcimos)
Erro
Porcentagem
Corrigida
Menos
17
1 0,61728 0,6 0,0279938 0,6
17 60 37,03704 37,0 0,0010001 37,0
18 72 44,44444 44,4 0,0009999 44,4
19 24 14,81481 14,8 0,0009997 * 14,9
Mais
19
5 3,08642 3,1 3,1
Total 162 99,99999 99,9 100
12
Tabela 1: dade dos alunos do 3 ano
do curso tcnico integrado diurno
do CEFET OP no ano de 2008.
dades
(anos)
Freqnci
a
simples
Porcentagem
Menos
17
1 0,6
17 60 37,0
18 72 44,4
19 24 14,9
Mais
19
5 3,1
Total 162 100
Fonte: Relatrio de pesquisa CEFET - OP

Pro"oro
Um certo nmero de pessoas foi classificado em quatro categorias. Essas
categorias so, naturalmente, mutuamente exclusivas e exaustivas. Em outras
palavras: uma pessoa s poder estar includa em uma nica categoria, e todas elas
devero estar classificadas.
Em termos simblicos, pode-se escrever:
1
N
= nmero de pessoas includas na categoria 1.
2
N
= nmero de pessoas includas na categoria 2.
3
N
= nmero de pessoas includas na categoria 3.
4
N
= nmero de pessoas includas na categoria 4.
4 3 2 1
N N N N N + + +
= nmero total de pessoas consideradas.
Neste caso, a proporo de pessoas pertencentes primeira categoria
determinada mediante o clculo do seguinte quociente
13
N
N
1
A proporo de pessoas pertencentes segunda categoria determinada
mediante o clculo do seguinte quociente
N
N
2
Sucessivamente temos
N
N
3
e
N
N
4
o clculo da proporo das pessoas pertencentes terceira e quarta categoria.
Observe que
1
N
N
N
N
N
N
N
N
N
N
4 3 2 1
+ + + .
Exemplo: A tabela a seguir apresenta o nmero de scios praticantes e no-
praticantes de futebol em um clube hipottico.
Tabela 2: nmero de scios praticantes e no-praticantes
de futebol em um clube hipottico
Scios Praticante (exclusivamente)
de:
Clube 1 Proporo
Futebol de salo 580 0,100
Futebol de campo 430 0,074
No-Praticantes 4810 0,826
Total 5820 1,000
14
Porcenta%e#
As porcentagens so obtidas a partir do clculo das propores, simplesmente
multiplicando-se o quociente obtido por 100. Para represent-las usamos o smbolo
%.
Voltando ao exemplo anterior temos:
Tabela 3: nmero de scios praticantes e no-praticantes
de futebol em um clube hipottico
Scios Praticante (exclusivamente)
de:
Clube 1 Porcentagem (%)
Futebol de salo 580 10
Futebol de campo 430 7,4
No-Praticantes 4810 82,6
Total 5820 100
E&erccios
1) Considere as situaes a seguir e identifique a populao e a amostra em cada
caso.
a. Para a anlise de desempenho dos alunos da 8. srie de uma determinada
escola municipal foram escolhidas as notas de portugus de 35 alunos.
b. Uma amostra de sangue foi retirada de um paciente com suspeita de alto
colesterol.
c. Uma maternidade entrevista 20 mes de recm nascidos dos 218 partos, no
ms de janeiro, para avaliar a satisfao na prestao de servio.
d. A fim de avaliar a inteno de voto dos eleitores para deputado estadual, um
candidato entrevista 2.120 eleitores em Minas Gerais.
2) Use os critrios de arredondamento para arredondar cada valor a seguir para
dcimos.
15
a) 21,24 d) 0,75 g) 3,521
b) 1,088 e) 5,819 h) 9,275
c) 125,5555 f) 0,3333 i) 235,25
3) Aplique os critrios de arredondamento para completar o quadro abaixo:
Nmero a arredondar Arredondamento para Nmero arredondado
25,458 Centsimo
123,99 Dcimo
205,7056 Milsimo
17,561 nteiro
4) Aplique os critrios de arredondamento para completar o quadro abaixo:
Nmero a arredondar Arredondamento para Nmero arredondado
1,23 Dcimo
5,488 Centsimo
0,126 Centsimo
35,4 nteiro
13,99 Dcimo
25,7056 Milsimo
7,561 nteiro
690,1555 Centsimo
0,115588 Milsimo

5) A tabela abaixo representa a produo, em unidades, da fbrica X de
determinada pea no segundo semestre de 2005.
Ms Produo
Julho 35.500
Agosto 34.750
Setembro 36.800
Outubro 35.150
Novembro 32.300
Dezembro 31.250
Calcule: (Use arredondamento para centsimos)
a) a proporo de peas produzidas no ms de outubro.
b) a proporo de peas produzidas at setembro.
16
c) a porcentagem de peas produzidas em dezembro.
6) Uma escola ia contratar um grupo de 8 professores para dar um curso sobre
computadores em 48 horas, pagando um total de R$ 9 216,00. No entanto, como
medida de economia, ela resolveu contratar somente 6 professores e dar o curso em
36 horas. Quanto a escola economizar?
7) Joo comprou uma mercadoria em uma loja de utilidades. Quando foi pagar a
conta, o vendedor informou-lhe que devido a uma promoo relmpago, ele teria 8
% de desconto na compra vista pagando, pelo produto, R$ 276,00. Joo optou por
no pagar vista. Quanto ele pagar pela mercadoria se compra-la a prazo?
8) Para as situaes descritas a seguir, identifique a populao e a amostra
correspondente. Discuta a validade do processo de inferncia estatstica, ou seja, se
as amostras foram coletadas corretamente, para cada um dos casos. No esquea
de apontar o erro de cada caso.
a) Uma amostra de sangue foi retirada de um paciente com suspeita de
anemia.
b) Para verificar a audincia de um programa de TV, 563 indivduos foram
entrevistados por telefone com relao ao canal em que estavam
sintonizados.
c) A fim de avaliar a inteno de voto para presidente dos brasileiros, 122
pessoas foram entrevistadas em Braslia.
9) Para encher um reservatrio em 15 dias, so necessrias 3 torneiras. Em quanto
tempo 5 torneiras, idnticas s anteriores, enchero o mesmo reservatrio?
10) Um navio dispe de reservas suficientes para alimentar 14 homens durante 45
dias, mas recebe 4 sobreviventes de um naufrgio. Durante quantos dias duraro as
reservas de alimento?
17
11) Calcule:
a) 15 % de R$ 2 800,00 ?
b) 42 % de R$ 18 300,00 ?
12) Resolva os problemas abaixo:
a) Numa classe foram reprovados 15 % dos alunos, isto , 9 alunos. Quantos
alunos haviam nesta classe?
b) Em uma cidade haviam 5600 eleitores do candidato A e 7800 eleitores do
candidato B.
1) Qual a proporo dos eleitores do candidato A?
2) Qual a proporo dos eleitores do candidato B?
13) Em um colgio existem 1 200 alunos, dos quais 720 so meninos. Determine:
a) Qual a proporo do nmero de meninos?
b) Qual a proporo do nmero de meninas?
14) Num livro de 200 pginas, h 30 linhas em cada pgina. Se houvesse 25 linhas,
quantas pginas teria o livro?
18
'ases do ()todo Estatstico
Quando se pretende empreender um estudo estatstico completo existem
diversas fases do trabalho que devem ser desenvolvidas para se chegar aos
resultados finais do estudo.
Definio do Proble#a
A primeira fase do trabalho estatstico consiste em uma definio ou
formulao correta do problema a ser estudado.
O problema deve ser preciso, bem determinado e especfico.
Alm de considerar detidamente o problema objeto do estudo, o analista
dever examinar outros levantamentos realizados no mesmo campo e anlogos,
uma vez que parte da informao de que necessita pode, muitas vezes, ser
encontrada nesses ltimos.
Saber exatamente aquilo que se pretende pesquisar o mesmo que definir
corretamente o problema.
Plane!a#ento
Consiste em se determinar o procedimento necessrio para resolver o
problema e, em especial, como levantar informaes sobre o assunto objeto do
estudo.
Mais especialmente, na fase do planejamento a preocupao maior reside na
escolha das perguntas.
nessa fase que ser escolhido o tipo de levantamento a ser utilizado. Sob
esse aspecto, pode haver dois tipos de levantamento:
a) Levantamento censitrio, quando a contagem abranger todo o
universo.
b) Levantamento por amostragem, quando a contagem for parcial.
Nesta fase temos outros elementos importantes que devem ser tratados.
19
a) cronograma das atividades, atravs do qual so fixados os prazos
para as varias fases;
b) Os custos envolvidos;
c) O exame das informaes disponveis;
d) O delineamento da amostra;
e) A forma como sero escolhidos os dados, etc.
Obs: Os livros mais especficos sobre pesquisa de mercado podero ser
consultados.
Coleta dos Dados
O terceiro passo essencialmente operacional.
A coleta de dados se refere obteno, reunio e registro sistemtico de
dados, com um objetivo determinado.
Es")cies de dados*
) Dados Primrios: quando so publicados ou comunicados pela
prpria pessoa ou organizao que os haja recolhido.
) Dados Secundrios: Quando so publicados ou comunicados por
outra organizao.
Um conjunto de dados , pois, primrio ou secundrio em relao a
algum.
mais seguro trabalhar com fontes primrias, pois:
a) Uma fonte primria oferece, em geral, informaes mais detalhadas
do que uma secundria.
b) mais provvel que as definies de termos e de unidades figurem
somente nas fontes primrias.
c) O uso da fonte secundria traz o risco adicional de erros de
transcrio.
20
d) Uma fonte primria poder vir acompanhada de cpias dos
impressos utilizados para coletar as informaes, juntamente com o
procedimento adotado na pesquisa, a metodologia seguida e o tipo
de tamanho da amostra.
Essas informaes proporcionam ao usurio uma idia do grau de garantia
que os dados oferecem.
A coleta de dados pode ser realizada de duas maneiras: direta ou
indiretamente.
Coleta Direta
A coleta direta quando obtida diretamente da fonte.
Ex.: Uma empresa pesquisa seus consumidores.
H trs tipos de coleta direta:
a) Coleta direta contnua: quando estes so obtidos ininterruptamente,
automaticamente e na vigncia de um determinado perodo.
Ex.: Registros de nascimento, de casamento, de bito, etc.
b) Coleta direta peridica: quando realizada em perodos curtos,
determinados, de tempo em tempo.
Ex: Recenseamento demogrfico. O censo industrial.
c) Coleta direta ocasional: Quando os dados forem colhidos
esporadicamente, atendendo a uma conjuntura qualquer ou a uma
emergncia.
Ex.: Casos fatais em surto epidmico.
21
Coleta Indireta
A coleta dos dados indireta quando inferida a partir dos elementos
conseguidos pela coleta direta, ou atravs do conhecimento de outros fenmenos
que, de algum modo, estejam relacionados com o fenmeno em questo.
feita, portando, por dedues e conjunturas, podendo ser realizada:
a) Por analogia: quando o conhecimento de um fenmeno induzido a partir
de outro que com ele guarda relaes de casualidade.
b) Por proporcionalizao: Quando o conhecimento de um fato se induz das
condies quantitativas de uma parte dele.
c) Por indcios: quando so escolhidos fenmenos sintomticos para discutir
um aspecto geral da vida social.
d) Por avaliao: quando atravs de informaes fidedignas ou estimativas
cadastrais, se presume o estado quantitativo de um fenmeno.
A"urao dos Dados
Consiste em resumir os dados, atravs de sua contagem e agrupamento.
Ela pode ser manual, mecnica, eletromecnica ou eletrnica.
Atravs da apurao tem-se a oportunidade de condensar os dados, de modo
a obter um conjunto compacto de nmeros, o qual possibilita distinguir melhor o
comportamento do fenmeno na sua totalidade.
Entretanto, a contrapartida da melhor apreciao dos dados em seu conjunto
a perda correspondentes de detalhes, uma vez que se trata de um processo de
sintetizao.
A"resentao dos Dados
H duas formas de apresentao, que no se excluem mutuamente.
a) Apresentao Tabular: uma apresentao numrica dos dados.
Consiste em dispor os dados em linhas e colunas distribudas de
modo ordenado.
22
b) Apresentao Grfica: Constitui uma Apresentao Geomtrica. Embora a
apresentao tabular seja de extrema importncia, no sentido de
facilitar a anlise numrica dos dados, no permite ao analista obter
uma viso to rpida, fcil e clara do fenmeno e sua variao como
a conseguida atravs de um grfico.
Anlise e Inter"retao dos Dados
a ltima fase e a mais importante e tambm a mais delicada.
O interesse maior, nesta etapa, reside em tirar concluses que auxiliem o
pesquisador a resolver seu problema.
A anlise est ligada essencialmente ao clculo de medidas, cuja finalidade
principal descrever o fenmeno.
23
+uestionrios
Questionrios so o meio mais comum de coleta de informaes.
Dois tipos de questes so usualmente empregados na redao de
questionrios:
Questes de mltipla escolha
Questes de resposta aberta
As alternativas em uma questo de mltipla escolha devem ser claras,
mutuamente excludentes e, quando pedirem opinies, fornecer opes dos dois
lados do assunto. dealmente, as opes devem cobrir todas as respostas provveis.
Se, entretanto, muitas alternativas so apresentadas, elas podem no ser
suficientemente claras e confundir o respondente no momento de sua deciso. A
grande desvantagem de questes de mltipla escolha que tendem a sugerir uma
resposta, j que limita as respostas possveis, impedindo o respondente de dizer
exatamente o que pensa.
Este tipo de limitao no ocorre nas questes de resposta aberta, em que o
entrevistado usa suas prprias palavras para responder pergunta. Uma pergunta
deste tipo produz uma grande gama de respostas que devem ser classificadas em
grupos homogneos antes que se possa fazer uma anlise estatstica. Esta
classificao uma tarefa difcil quando o nmero de respostas a serem analisadas
muito grande. Por isso, questes de respostas abertas so mais freqentemente
empregadas em estudos pilotos ou nos estgios exploratrios, quando se procura
determinar quais tipos de respostas aparecero. Essas informaes so ento
usadas na construo do questionrio a ser utilizado na obteno dos dados de um
grupo maior. s vezes inevitvel misturar os dois tipos de pergunta, quando, por
exemplo, colocamos a opo "outros e pedimos especificao. Se os dados forem
analisados por computador, deve-se pensar na etapa da codificao ao redigir as
perguntas.
24
rde# das +uest,es
Um questionrio consistente em uma bateria de questes arranjadas em certa
ordem. As primeiras questes so para estabelecer contato com o respondente e
devem ser bem simples. Quando vrios tpicos esto envolvidos, deve-se completar
um tpico antes de passar a outro. A ordem das questes freqentemente afeta as
respostas dadas pelo respondente, j que as perguntas chamam a ateno do
entrevistado para um conjunto de pensamentos e sentimentos, em cujo contexto as
outras perguntas sero respondidas. Em pesquisa de mercado, por exemplo,
questes que mencionam um produto especfico tendem a viciar as perguntas que
se seguem; conseqentemente, estas questes identificando produtos ou firmas
devem ser colocadas no final, sempre que possvel.
-i"o de Aborda%e#
Muitas pessoas tendem a racionalizar ou exagerar suas respostas quando
so questionadas diretamente sobre seus motivos, realizaes ou outros assuntos
que envolvam seu prestgio ou auto-estima. Para se evitar a introduo de
tendenciosidade nessas respostas, usa-se freqentemente uma abordagem indireta
na elaborao de questes que envolvem prestgio. Por exemplo, ao invs de
perguntas: "Voc terminou o curso secundrio?, pode-se perguntar: "Em que ano
voc estava quando deixou de estudar?. Na segunda pergunta tenta-se evitar
constrangimento aos respondentes que no terminaram o curso secundrio.
Clareza nas Per%untas
Uma pergunta deve ter aproximadamente o mesmo sentido para todos os
entrevistados; caso contrrio, os dados obtidos no tero grande utilidade. Termos
com sentido dbio devem ser evitados. As perguntas devem ser simples. Nem todos
os entrevistados entendero questes com enunciado complexo, originando, assim,
resultados ruins.
25
No Su%erir .es"ostas
Na formulao das perguntas deve-se evitar um tipo de redao como esta:
"Voc concorda em que esta bebida, sendo a melhor, deva custar mais caro?
Esta pergunta sugere to obviamente uma resposta que praticamente intil.
Algumas vezes, entretanto, difcil perceber que a redao de uma pergunta possa
sugerir determinada resposta.
A Necessidade do Pr)/-este
Assim que um questionrio tenha sido redigido, deve ser testado em um
estudo piloto. Esta fase fundamental para detectar dificuldades no observadas,
como o lay out do questionrio, ordem e redao das perguntas, necessidade de
instrues mais claras para os entrevistadores, etc. Naturalmente, a correo
dessas imprecises melhorar a qualidade do levantamento.
A Prtica de Pes0uisas "or A#ostra%e#
O leitor deve convencer-se de que fundamental conhecer as caractersticas
especficas da rea onde pretende participar de pesquisas por amostragem. O
significado especial de algumas palavras, os melhores locais e horrios para se
fazer coleta de dados, o tipo de entrevistador so, entre outros, fatores importantes
para o bom andamento do levantamento. S lendo literatura na rea especfica
que se pode, entretanto, conhecer estes detalhes.
26
A#ostra%e#
Conceitos 'unda#entais
Assim que decidimos obter informaes atravs de um levantamento
amostral, temos imediatamente dois problemas:
definir cuidadosamente a populao de interesse e
selecionar a caracterstica que iremos pesquisar.
A populao-alvo a populao sobre a qual vamos fazer inferncias
baseadas na amostra.
Caracterizada a populao-alvo, o prximo passo escolher as
caractersticas que iremos medir. Aqui o erro freqente querer incluir muitas
caractersticas. A qualidade da mensurao cai com o aumento do nmero de
perguntas. Devemos, portanto, fixar-nos apenas em perguntas que contribuam para
a quantificao adequada da caracterstica populacional de real interesse para o
estudo.
Para que possamos fazer inferncias vlidas sobre a populao a partir de
uma amostra, preciso que esta seja representativa. Uma das formas de se
conseguir representatividade fazer com que o processo de escolha da amostra
seja, de alguma forma, aleatrio. Alm disso, a aleatoriedade permite o clculo de
estimativas dos erros envolvidos no processo de inferncia.
A#ostra%e# Aleat1ria Si#"les
Neste caso a amostra escolhida elemento a elemento. A populao
numerada de 1 a N. escolhem-se, em seguida, na tbua de nmeros aleatrios, n
nmeros compreendidos entre 1 e N. esse processo equivalente a um sorteio no
qual se colocam todos os nmeros misturados dentro de uma urna. Os elementos
correspondentes aos nmeros escolhidos formaro a amostra.
27
Exemplo: A tabela a seguir refere-se aos dimetros de 30 eixos produzidos por uma
industria automobilstica (dados hipotticos)
26 32 26 19 20 22 30 31 17 20
16 17 28 15 26 19 14 16 16 26
27 31 13 26 18 29 18 16 21 24
Extrair, sem reposio, uma amostra aleatria de tamanho n = 5.
Soluo: Primeiramente deveremos numerar a populao.
Eixo 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17
Dimetro 26 32 26 19 20 22 30 31 17 20 16 17 28 15 26 19 14
Eixo 18 19 20 21 22 23 24 25 26 27 28 29 30
Dimetro 16 16 26 27 31 13 26 18 29 18 16 21 24
Escolhemos uma coluna na TNA.
Procuramos os 5 primeiros nmeros no superiores a 30, lendo os dos
ltimos algarismos ou os dois primeiros.
Obtemos:
2. coluna
Leitura na TNA (2 ltimos) 18 15 22 24 03
Dimetro 16 26 31 26 26
A#ostra%e# Estratificada
Quando os elementos da populao esto divididos em grupos no
superpostos, mais fcil e mais eficiente escolher, independentemente, uma
amostra aleatria simples dentro de cada um destes grupos, os quais so chamados
estratos.
28
Esta forma de amostragem uma das mais utilizadas, j que a maioria das
populaes tem estratos bem definidos: os homens e as mulheres; os alunos das
escolas X, Y, Z; os estados brasileiros; ect.
O mais comum utilizar-se a Amostragem Estratificada Proporcional, que
consiste em selecionar os elementos da amostra entre os vrios estratos, em
nmero proporcional ao tamanho de cada um dos estratos. Em outras palavras,
sejam:
N o nmero de elementos da populao
L o nmero de estratos
i
N
o nmero de elementos do estrato i
n o tamanho da amostra a ser selecionada
i
n
tamanho de amostra no estrato i
Note que
N = N
1
+ N
2
+ ... + N
L
Calcula-se a frao de amostragem dada por:
f =
N
n
Obs: A frao de amostragem calcula o tamanho de amostra por unidade da
populao.
O nmero de elementos a serem sorteados em cada estrato ser:
.f N n
1 1

.f N n
2 2

.f N n
L L

Exemplo: Na execuo de uma rede eltrica, uma firma especializada utiliza


eletrodutos de dois tipos: E e F. em uma anlise do custo do material
foram considerados 30 faturas, representadas abaixo pelo preo de 10m
de eletroduto.
29
Eletroduto (estrato) E
Fatura 01 02 03 04 05 06
Preo (R$) 710 710 715 715 755 760
Eletroduto (estrato) F
Fatura Preo
(R$)
Fatura Preo
(R$)
Fatura Preo
(R$)
Fatura Preo
(R$)
01 750 07 760 13 770 19 790
02 750 08 765 14 770 20 795
03 750 09 765 15 770 21 795
04 750 10 765 16 785 22 800
05 755 11 765 17 785 23 810
06 760 12 765 18 790 24 820
Extrair, sem reposio, uma amostra estratificada proporcional de tamanho
n = 8.
Soluo:
f =
30
8
= 0,27
De cada estrato sero sorteadas respectivamente n
E
e n
F
unidades:
n
E
= (0,27) . 6 = 1,62 2
n
F
= (0,27) . 24 = 6,48 6
Para encontrar a amostra referente ao eletroduto E utilizamos TNA (8. coluna
primeiro algarismo) e para encontrar a amostra referente ao eletroduto F utilizamos
TNA (4. coluna ltimos algarismos). Assim obtemos:
30
Estrato E F
Leitura na
TNA
03 01 20 03 18 17 24 12
Fatura (R$) 715 710 795 750 790 785 820 765
Entre as vantagens da amostragem estratificada destacam-se:
a) os dados so geralmente mais homogneos dentro de cada estrato do que na
populao como um todo;
b) o custo da coleta e anlise dos dados freqentemente menor nesse tipo de
amostragem do que na aleatria simples, devido a convenincias
administrativas;
c) podem-se obter estimativas separadas dos parmetros populacionais para
cada estrato sem selecionar outra amostra e, portanto, sem custo adicional.
A#ostra%e# "or Con%lo#erado
Uma amostra por conglomerado uma amostra aleatria simples na qual
cada unidade de amostragem um grupo, ou conglomerado de elementos.
O primeiro passo para se usar este processo especificar conglomerados
apropriados. Os elementos em um conglomerado devem ter caractersticas
similares. Como regra geral, o nmero de elementos em um conglomerado deve ser
pequeno em relao ao tamanho da populao, e o nmero de conglomerados,
razoavelmente grande.
Tanto no caso da amostragem estratificada, como no da amostragem por
conglomerados, a populao deve estar dividida em grupos. Na amostragem
estratificada, entretanto, seleciona-se uma amostra aleatria simples dentro de cada
grupo (estrato) enquanto que na amostragem por conglomerado selecionam-se
amostras aleatrias simples de grupos, e todos os itens dentro dos grupos
(conglomerados) selecionados faro parte da amostra.
A amostragem por conglomerado recomendada quando:
a) ou no se tem um sistema de referncia listando todos os elementos da
populao, ou a obteno dessa listagem dispendiosa;
b) o custo da obteno de informaes cresce com o aumento da distncia entre
os elementos;
31
Exemplo: Supondo que se deseje estimar o rendimento mdio familiar em um
determinado bairro, como deve ser escolhida a amostra?
Soluo:
A amostragem aleatria simples invivel, pois pressupe uma listagem de
todas as famlias do bairro, o que praticamente impossvel de se obter.
A alternativa da amostragem estratificada tambm invivel, j que aqui
tambm necessria uma listagem dos elementos por estrato.
A melhor escolha a amostragem por conglomerado. O sistema de referncia
pode ser constitudo por todos os quarteires do bairro. Cada quarteiro um
conglomerado. Extrai-se uma amostra aleatria simples de quarteires e neles
pesquisa-se a renda familiar em todas as casas.
A#ostra%e# Siste#tica
Uma amostragem sistemtica de tamanho n constituda dos elementos de
ordem K, K+r, K+2r, ... , onde K um inteiro escolhido aleatoriamente entre 1 e n . E
r o inteiro mais prximo da frao
n
N
r
Por exemplo, se a populao tem 100 elementos e vamos escolher uma
amostra de tamanho 6, K um inteiro escolhido aleatoriamente entre 1 e 6, e r =
100/6 = 16,6 = 17.
Pela TNA (8 coluna primeiro algarsmo) K = 3. Assim a amostra ser
composta pelos elementos de posio:
3, 20, 37, 54, 71, 88
Se o tamanho da populao desconhecido, no podemos determinar
exatamente o valor de r. Escolheremos intuitivamente um valor razovel para r.
32
s vezes a amostragem sistemtica preferida amostragem aleatria
simples, porque mais fcil de executar, estando portando menos sujeita a erros, e
proporciona mais informaes com menor custo.
Exemplo: escolha a tcnica adequada para extrair uma amostra de 50
compradores de uma loja.
Soluo: A amostragem aleatria simples no pode ser empregada neste caso,
pois o entrevistador no pode determinar quais compradores sero includos na
amostra, uma vez que no se conhece o tamanho N da populao, at que todos os
compradores tenham ido loja. Assim, ele pode usar a amostragem sistemtica
(digamos 1 em cada 20 compradores) at obter a amostra do tamanho desejado.
E&erccios
1) Com relao a amostragem aleatria CORRETO afirmar que:
a) ( ) Utilizamos a tabela de nmeros aleatrios para encontrar o valor do k.
b) ( ) utilizada quando conhecemos parte da populao
c) ( ) Pode ser utilizada quando no conhecemos a populao
d) ( ) um mtodo aleatrio em que no h possibilidade do pesquisador
interferir na escolha da amostra;
e) ( ) Nenhuma das alternativas acima.
2) Com relao a amostragem sistemtica CORRETO afirmar que:
a) ( ) Permite encontrar amostras de populao cujo nmero total de
elementos desconhecido;
b) ( ) A amostra encontrada utilizando uma progresso geomtrica cujo
primeiro termo o primeiro elemento da populao ;
c) ( ) A amostra encontrada utilizando uma progresso aritmtica cujo
primeiro termo o primeiro elemento da populao ;
d) ( ) A amostra encontrada utilizando uma progresso aritmtica cuja razo
encontrada na tabela de nmeros aleatrios;
33
e) ( ) Nenhuma das alternativas acima.
3) Com relao a amostragem estratificada CORRETO afirmar que:
a) ( ) Permite encontrar amostras de estratos que no possuem nenhuma
caracterstica em comum;
b) ( ) Os estratos devem ser disjuntos;
c) ( ) A amostra sempre dividida em partes iguais para cada estrato;
d) ( ) Utilizamos uma amostragem aleatria simples considerando todos os
estratos juntos;
e) ( ) Nenhuma das alternativas acima.
4) O gerente de um determinado banco com o intuito de fazer uma pesquisa junto a
seus clientes utiliza o seguinte processo: Pega o primeiro cliente que compareceu
agncia naquele dia e o entrevista. O segundo a ser entrevistado o 6. cliente. O
terceiro a ser entrevistado o 11. cliente e assim sucessivamente at que a
agncia feche. CORRETO afirmar que:
a) ( ) O gerente utilizou uma amostragem estratificada proporcional;
b) ( ) O gerente utilizou uma amostragem aleatria simples;
c) ( ) O gerente utilizou uma amostragem sistemtica;
d) ( ) O gerente no utilizou nenhum mtodo de amostragem;
e) ( ) Nenhuma das alternativas acima.
5) Considere o seguinte problema: Deve-se extrair uma amostra estratificada
proporcional de tamanho 60 de uma populao de tamanho 4.000, que consiste de
trs estratos de tamanhos N
1
=2.000, N
2
=1.200 e N
3
= 800. CORRETO afirmar que:
a) ( ) Do primeiro estrato dever ser extrada 18 amostras;
b) ( ) Do segundo estrato dever ser extrada 30 amostras;
c) ( ) Do terceiro estrato dever ser extrada 12 amostras;
d) ( ) Dever extrair 20 amostras de cada estrato;
e) ( ) Nenhuma das alternativas acima.
34
6) A nica opo que traz dois mtodos de amostragem em que preciso conhecer
todos os elementos da populao :
a) ( ) Aleatria simples e por conglomerado;
b) ( ) Por conglomerado e sistemtica;
c) ( ) Aleatria simples e sistemtica;
d) ( ) Estratificada e por conglomerado;
e) ( ) Nenhuma das alternativas acima.
7) Os dados abaixo se referem a taxa de hemoglobina no sangue (em gramas/cm
3
)
de 12 professores de uma determinada escola.
Professor 1 2 3 4 5 6 7 8 9 10 11 12
Taxa de
hemoglobina
11,1 12,2 15,2 11,3 14,4 12,7 13,5 15,8 11,7 16,3 14,1 12,5
Extrair uma amostra sistemtica de 3 taxas de hemoglobina. (Usar 7. coluna da
TNA, ltimo algarismo).
8) Os dados abaixo referem-se ao salrio (em salrios mnimos) de 20 funcionrios
administrativos em uma indstria.
10.1 7.3 8.5 5 4.2 3.1 2.2 9 9.4 6.1
3.3 10.7 1.5 8.2 10 4.7 3.5 6.5 8.9 6.1
a) Extraia uma amostra de 6 elementos usando a amostra aleatria simples.
(Usar 2. coluna na TNA, dois ltimos algarismos);
b) Extraia uma amostra de 5 elementos usando a amostra sistemtica. (Usar
2. coluna na TNA, ltimo algarismo).

35
9) Uma pesquisa com usurios de transporte coletivo na cidade de So Paulo
indagou sobre os diferentes tipos usados nas suas locomoes dirias. Dentre
nibus, metr e trem, o nmero de diferentes meios de transporte utilizado foi o
seguinte: 2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2 e
3.
a) Extraia uma amostra de 10 elementos usando a amostra aleatria simples.
(Usar 3. coluna na TNA, dois ltimos algarismos);
b) Extraia uma amostra de 10 elementos usando a amostra sistemtica. (Usar
3. coluna na TNA, dois ltimos algarismos);
10) A idade dos 20 ingressantes num certo ano no curso de ps-graduao em
jornalismo de uma universidade foi o seguinte: 22, 22, 22, 22, 23, 23, 24, 24, 24, 24,
25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.
a) Extraia uma amostra de 8 elementos usando a amostra aleatria simples.
(Usar 3. coluna na TNA, dois ltimos algarismos);
b) Extraia uma amostra de 8 elementos usando a amostra sistemtica. (Usar
3. coluna na TNA, ltimo algrarismo);
11) Um novo medicamento para cicatrizao est sendo testado e um experimento
feito para estudar o tempo (em dias) de completo fechamento em cortes
provenientes de cirurgia. As 30 cobaias tiveram os seguintes tempos: 15, 17, 16, 15,
17, 14, 17, 16, 16, 17, 15, 18, 14, 17, 15, 14, 15, 16, 17, 18, 18, 17, 15, 16, 14, 18,
18, 16, 15 e 14.
a) Extraia uma amostra de 10 elementos usando a amostra aleatria simples.
(Usar 3. coluna na TNA, dois ltimos algarismos);
b) Extraia uma amostra de 10 elementos usando a amostra sistemtica. (Usar
3. coluna na TNA, dois ltimos algarismos);
36
12) Um exame vestibular para uma faculdade tem 80 questes, sendo 40 de
portugus e 40 de matemtica. Para os 20 melhores classificados, apresentamos o
nmero de acertos em cada disciplina, em ordem decrescente de pontos:
Aluno 1 2 3 4 5 6 7 8 9 10
Portugus 35 35 34 32 31 30 26 26 24 23
Matemtica 31 29 27 28 28 26 30 28 25 23
Aluno 11 12 13 14 15 16 17 18 19 20
Portugus 23 12 11 20 17 12 14 20 8 10
Matemtica 21 32 31 20 21 25 20 13 23 20
a) Extraia uma amostra de 5 alunos usando a amostra aleatria simples.
(Usar 3. coluna na TNA, dois ltimos algarismos);
b) Extraia uma amostra de 5 alunos usando a amostra sistemtica. (Usar 3.
coluna na TNA, dois ltimos algarismos);
13) Em uma escola da rede municipal, esto matriculados 370 alunos no curso da
manh. Eles esto distribudos na seguinte maneira:
Salas 5. A 5. B 5. C 6. A 6. B 6. C 6. D 7. A 7. B 8. A 8. B 8. C
Aluno
s
30 25 30 30 30 25 25 35 40 35 35 30
a) Extraia uma amostra de 74 alunos usando a amostra estratificada. (Usar 3.
coluna na TNA, dois ltimos algarismos)
14) O Departamento de Ensino de uma Escola Particular, de um bairro de classe
mdia, deseja realizar uma pesquisa para saber se seria conveniente criar o 2. grau
em seu quadro de turmas. sso porque ela ministra apenas da 1. srie 8. srie do
ensino bsico e fundamental.
Para isso ela contrata uma firma de consultoria para realizar esta pesquisa.
37
Suponhamos que voc faa parte dessa firma e seja indicado(a) para formular
um questionrio a fim de coletar dados que iro ajudar na soluo deste problema.
Ento voc dever criar um questionrio com esse objetivo. Bom trabalho.!!!
38
Distribuio de 're02ncia
Dados Brutos
Feita a coleta, os dados originais ainda no se encontram prontos para
anlise, por no estarem numericamente organizados. Por essa razo, costuma-se
cham-los de dados brutos.
Exemplo: Na tabela 1, esto relacionadas as notas em estatstica dos alunos do 7.
perodo de Matemtica.
Tabela 1: Notas em estatstica dos alunos do 7. perodo de Matemtica
16 14 15 14 15
15 12 11 13 16
16 12 15 16 15
18 11 16 15 16
15 13 12 15 15
17 15 12 17
.ol
O Rol uma lista em que os valores esto dispostos em uma determinada
ordem, crescente ou decrescente.
Tabela 2:Notas em estatstica dos alunos do 7. perodo de Matemtica
11 13 15 15 16
11 13 15 15 16
12 14 15 16 17
12 14 15 16 17
12 15 15 16 18
12 15 15 16
-abela de fre02ncia
39
As tabelas de freqncias so representaes nas quais os valores se
apresentam em correspondncia com suas repeties, evitando se assim que eles
apaream mais de uma vez na tabela, como ocorre com o rol.
A tabela de freqncias proporciona uma apresentao esteticamente mais
vantajosa dos dados, facilitando ainda a verificao do comportamento do
fenmeno. possvel, por outro lado, com a utilizao de uma tabela de
freqncias, a obteno de estatsticas (medidas) com menos clculo, e,
conseqentemente, em menos tempo do que se esse trabalho fosse realizado a
partir dos dados brutos.
As tabelas de freqncias podem representar tanto valores individuais como
valores agrupados em classes.
Distribuio de 're02ncias de Dados -abulados No/A%ru"ados e# Classes
uma tabela onde os valores da varivel aparecem individualmente. Esse
tipo de apresentao utilizado para representar uma varivel discreta ou
descontinua.
Exemplo: A tabela abaixo representa as notas em estatstica dos alunos do 7.
perodo de Matemtica da FAFDA.
Tabela 3: Notas obtidas em uma
avaliao de estatstica dos alunos
do 7. perodo de Matemtica da FAFDA
Notas
Freqncia
f
j
11 2
12 4
13 2
14 2
15 10
16 6
17 2
40
18 1
29
Distribuio de 're02ncias de Dados A%ru"ados e# Classes
Muitas vezes, mesmo com o risco de se sacrificar algum detalhe manifestado
na ordenao de valores individuais, h vantagem em resumir os dados originais em
uma distribuio, onde os valores observados no mais aparecero individualmente,
mas agrupados em classes.
Para variveis contnuas sempre usamos agrupar. Para variveis discretas e
nmero de valores representativos dessa varivel muito grande tambm agrupamos.
Elementos de uma Distribuio de Freqncias
1) Freqncia Simples Absoluta: f
j
o nmero de observaes correspondentes a essa classe ou a esse
valor. A freqncia simples absoluta, ou simplesmente freqncia,
simbolizada por f
j
.
2) Amplitude Total: A
t

a diferena entre o maior e o menor valor observado da varivel em
estudo.
3) Nmero de Classes
cada um dos grupos de valores em que se subdivide a amplitude total do
conjunto de valores observados da varivel.
Uma classe pode ser identificada por seus extremos ou pela ordem em que
ela se encontra na tabela (valor do ndice j)
O nmero de classes pode ser calculado usando a frmula de Sturges:
41
k = 1 + 3,3 log
10
N
Onde
k = nmero de classes
N = nmero total de observaes
O arredondamento de k feito para o inteiro imediatamente superior.
4) Limites de classes
Os limites de classe so seus valores extremos.
a) Limite nferior: o valor mnimo de uma classe.
b) Limite Superior: o valor mximo de uma classe. Este pode no
pertencer classe atual.
5) Amplitude do ntervalo de classe
Amplitude do intervalo de classe ou simplesmente intervalo de classe o
comprimento da classe, sendo geralmente definida como a diferena entre seus
limites superior e inferior. Pode-se tambm tomar a diferena entre dois limites
inferiores ou superiores.
6) Ponto mdio de classe
O ponto mdio ou valor mdio o valor que a representa, para efeito de
clculos de certas medidas.Na distribuio de freqncias com valores
agrupados em classes, considera-se que os resultados includos em cada classe
distribuem-se uniformemente por seu intervalo.
Exemplo 1: A tabela abaixo representa as notas obtidas por 29 alunos em uma
avaliao de estatstica
42
Amplitude total = 18 11 = 7
Nmero de classes:
k = 1 + 3,3 x log 29
k = 1 + 3,3 x 1,4624
k = 5,83
k 6
Amplitude do intervalo de classe:
A
t
/ k = 7 / 6 =1,17 1,2
Tabela 4: Notas obtidas em uma avaliao de estatstica dos alunos do 7. perodo
de Matemtica da FAFDA











Exemplo 2:
Notas f
j
11,0 12,2 6
12,2 13,4 2
13,4 14,6 2
14,6 15,8 10
15,8 17,0 6
17,0 18,2 3
Total 29
43
Tabela 5: Notas obtidas em uma avaliao de estatstica dos alunos do 7. perodo
de Matemtica da FAFDA
Notas Simples
f
j
Acumulada
simples
F
j
"abaixo de
Relativa
Simples
fr
j
Relativa
Acumulada
Fr
j
"abaixo de
11,0 12,2 6 6 0,21 0,21
12,2 13,4 2 8 0,07 0,28
13,4 14,6 2 10 0,07 0,35
14,6 15,8 10 20 0,34 0,69
15,8 17,0 6 26 0,21 0,90
17,0 18,2 3 29 0,10 1,00
Total 29
ROTERO PARA A ELABORAO DE UMA TABELA DE FREQNCAS COM
DADOS AGRUPADOS EM CLASSES
Para a construo de uma tabela de freqncias, conveniente adotar-se um
roteiro que, embora baseado em critrios relativamente arbitrrios, facilita e torna
operacional o trabalho de quem ir montar a tabela. O roteiro proposto consta dos
seguintes passos:
a) Lista de dados brutos que pode ou no ser transformada em rol;
b) Encontrar a amplitude total do conjunto de valores observados:



c) Calcular o nmero de classes (k) usando a frmula de Sturges:
d) Determinar a amplitude do intervalo de classe.
44
Menor valor do conjunto
Maior valor do conjunto - A
t
=
Muitas vezes convm arredondar o nmero correspondente amplitude
do intervalo de classe a que se chegou para um nmero mais adequado, que
facilite os clculos.
e) Determinar os limites das classes, escolhendo-se preferencialmente,
nmeros inteiros.
f) Construir a tabela de freqncias.
(anual "ara Nor#alizao de Publica,es -)cnico 3 cientificas
Ed4 5'(6
Tabelas de distribuio de freqncia
1) As tabelas devem ser dotadas de um ttulo claro e conciso localizado acima
delas. So numeradas seqencialmente em todo o trabalho, com algarismos
arbicos (1, 2, 3, ...), segundo normas do BGE.
2) No cabealho de cada coluna indica-se o seu contedo. Os ttulos das
colunas podem ser datilografados verticalmente, se necessrio, para
economizar espao.
3) No se deve deixar nenhuma "casa vazia no corpo da tabela, usando-se os
smbolos, conforme conveno internacional:
- quando, pela natureza do fenmeno, o dado no existir
Z quando o dado for rigorosamente zero
... quando no se dispuser do clculo
2) Na construo de tabelas usam-se os seguintes traos:
a) trao duplo horizontal, limitando o quadro;
b) trao simples vertical, separando a coluna indicadora das demais e
estas entre si; no corpo da tabela pode ser eliminado desde que o nmero de
colunas seja pequeno e no haja prejuzo na leitura dos dados;
45
3) a tabela no deve ser fechada lateralmente, tampouco se colocam traos
horizontais separando os dados numricos.
E&erccios
1) As cifras abaixo representam os ganhos de 15 vendedores:
425 440 610 518 324
482 624 390 468 457
509 561 482 480 520
2) Do-se a seguir os pesos, em libras, de 20 candidatos a empregos no corpo de
bombeiros de uma cidade:
225 182 194 210 205 172 181 198 164 176
180 193 178 193 208 186 183 170 186 188
3) Os seguintes nmeros de unidades de um produto foram completados em
determinados dia por 20 operrios de uma fbrica de artigos de artesanato:
61 58 59 72 47 55 40 73 66 60
71 69 63 58 51 42 67 80 62 53
4) Uma auditoria em 60 faturas de venda revelou os seguintes nmeros de erros na
fixao de preos:
0 0 2 1 4 1 0 1 3 2
2 0 1 1 1 4 0 3 1 5
1 1 0 2 0 0 1 1 4 3
0 1 0 2 1 4 3 1 0 0
5 1 2 0 3 0 2 1 1 3
1 4 3 0 2 0 1 1 0 1
46
5) Do-se, a seguir, os nmeros de alarmes falsos(acionados acidentalmente ou por
mau funcionamento do equipamento) recebidos em 30 dias por um servio de
monitoramento da segurana:
3 6 2 4 5 8 2 5 6 3
4 7 4 6 5 5 5 4 3 7
4 4 6 3 9 5 7 4 4 6
As questes de 6 a 11 so referentes tabela a seguir. Ela se refere a notas de
alunos, em uma prova de 30 pontos, de uma determinada escola.
47
6) O valor do limite superior da 4. classe de:
a) ( ) 17;
b) ( ) 18;
c) ( ) 19;
d) ( ) 20;
e) ( ) Nenhuma das alternativas acima.
7) O valor do limite inferior da 3. classe de:
a) ( ) 13;
b) ( ) 14;
c) ( ) 15;
d) ( ) 16;
e) ( ) Nenhuma das alternativas acima.
8) O valor da freqncia acumulada simples da 5. classe de:
a) ( ) 8;
b) ( ) 10;
c) ( ) 20;
d) ( ) 26;
e) ( ) Nenhuma das alternativas acima.
Notas f
j
11 6
2
2
10
6
21 4
Total 30
48
9) O valor da freqncia relativa acumulada 4. classe de:
a) ( ) 0,2000;
b) ( ) 0,2667;
c) ( ) 0,3333;
d) ( ) 0,6667;
e) ( ) Nenhuma das alternativas acima.
10) Porcentagem dos alunos que tiraram abaixo de 50% da nota da prova de:
a) ( ) 20%;
b) ( ) 27%;
c) ( ) 34%;
d) ( ) 67%;
e) ( ) Nenhuma das alternativas acima.
11) A nota em que 66% dos alunos esto acima dela de:
a) ( ) 15;
b) ( ) 16;
c) ( ) 17;
d) ( ) 18;
e) ( ) Nenhuma das alternativas acima.
As questes de 12 a 15 so referentes tabela a seguir. Ela se refere a pacientes
internados no hospital X, localidade Y, no ano Z.
49
12) O valor do limite superior da 4. classe de:
13) O valor do limite inferior da 3. classe de:
14) O valor da freqncia acumulada simples da 5. classe de:
15) O valor da freqncia relativa simples da 4. classe de:
16) Os dados se referem aos pesos dos alunos de uma determinada escola:
60.5 60 70 47.4 60 57 52 47 55 50
55 58 54 66 58.5 63 73 95 39 54.5
72.8 47 58 85.2 49.2 52 56 84 75 50
80.9 57.8 68.5 54.5 48 49 58 60 55 71
55 58 63.5 52.5 51.6 59 87 73 49 86
Aps construir uma tabela de distribuio de freqncia agrupada em classes, a
freqncia simples da terceira classe de:
17) Os dados abaixo se referem aos pesos dos alunos de uma determinada escola:
Grupo etrios (em
anos)
f
j
20 1
3
5
6
4
70 1
Total 20
50
60.5 60 70 47.4 60 57 52 47 55 50
55 58 54 66 58.5 63 73 95 44 54.5
72.8 47 58 85.2 49.2 52 56 84 75 50
80.9 57.8 68.5 54.5 48 49 58 60 55 71
55 58 63.5 52.5 51.6 59 87 73 49 86
Siga os passos para a construo de uma tabela de distribuio de freqncia com
dados agrupados:
a) Determine a amplitude total
b) Determine a amplitude de classe
c) Construa a tabela usando 7 classes
d) nclua na tabela as freqncias relativas simples
e) nclua na tabela as freqncias acumuladas (abaixo de) simples
f) nclua na tabela as freqncias acumuladas (abaixo de) relativas
18) Com relao tabela de distribuio de freqncia agrupada acima responda:
a) Quantos alunos pesam at 69 kg?
b) Quantos alunos pesam mais de 76 kg?
c) Qual a porcentagem de alunos que pesam menos de 62 kg?
51
(edidas de -endncia Central4
Medidas de Posio
1) Mdia Aritmtica Simples
Dados no agrupados
A mdia aritmtica simples, amostral, de um conjunto de n observaes
n
x x x , , ,
2 1

definida por
n
x
x
n
i
i

1
A mdia aritmtica simples, populacional, de um conjunto de N observaes
N
x , ,
2
x ,
1
x
definida por
N
x
N
i
i

Exemplo: Os dados a seguir representam as alturas de 5 alunos de uma


determinada escola.

1,6
0
1,6
8
1,8
0
1,7
6
1,66
Qual a mdia aritmtica?
Soluo: A mdia ser
52
700 , 1
5
66 , 1 76 , 1 80 , 1 68 , 1 60 , 1
5
5
1
1

+ + + +

x
x
x
x
n
x
x
i
i
n
i
i
53
Clculo da Mdia de dados em tabela de distribuio de freqncia
Considere:
x
i
o ponto mdio da classe i ,
f
i
a freqncia da classe i,
k a quantidade de classe.
A mdia aritmtica definida por:

k
i
i
k
i
i i
f
f x
x
1
1
.
BS4*
Caso ten7a#os u#a tabela de distribuio a%ru"ada e# classes8 o valor de
&
i
ser o "onto #)dio da classe4
arredonda#ento ser se#"re u#a casa deci#al a #ais 0ue os dados4
Exemplo: A tabela abaixo representa as notas em estatstica dos alunos do 7.
perodo de Matemtica da FAFDA. Calcule a nota mdia.
Notas
Freqncia
f
j
i i
f . x
11 2 22
12 4 48
13 2 26
14 2 28
15 10 150
16 6 96
17 2 34
18 1 18
29 422
54
Soluo: A nota mdia ser
6 , 14
29
422
.
1
1

k
i
i
k
i
i i
f
f x
x
Exemplo: A tabela abaixo representa as notas obtidas por 500 alunos em um teste
de geografia. Calcule a nota mdia.










Soluo: A nota mdia ser
95 , 56
500
475 . 28
. .
6
1
6
1
1
1

i
i
i
i i
k
i
i
k
i
i i
f
f x
f
f x
x
2) Mediana: (d
Notas f
j
x
i
x
i
.f
i
10 25 44 17,5 770
25 40 70 32,5 2.275
40 55 92 47,5 4.370
55 70 147 62,5 9.187,5
70 85 115 77,5 8.912,5
85 100 32 92,5 2.960
Total 500 28.475
55
Dados no agrupados
Para evitar a possibilidade de sermos enganados por valores muito pequenos
ou muito grandes, ocasionalmente descrevemos o "meio ou "centrode um
conjunto de dados com outras medidas estatsticas que no a mdia. Uma
dessas medidas, a MEDANA de n valores, exige que os ordenemos, e se define
como:
O valor do elemento do meio se n mpar, ou a mdia aritmtica dos dois
valores do meio se n par.
Assim dizemos que a mediana o valor do
2
1 n +
elemento.
Exemplo: Em um ms recente, o Departamento de Caa e Pesca de um estado
reportou
5
3
3
1
6
7
5
3
36
violaes em atividade de caa e pesca em cinco regies. Qual a mediana?
Soluo: Ordenando os elementos temos: 31, 36, 53, 53, 67. Como temos 5
elementos, a mediana o valor do elemento central, 3
2
1 5

+
. A mediana o valor
do 3. elemento. Logo a mediana (d 9 :;.
Exemplo 2: Em algumas reas, as pessoas autuadas por certas infraes leves de
trfego podem freqentar um curso de direo defensiva em lugar de pagar uma
multa. Se 12 desses cursos foram freqentados por
40 32 37 30 24 40 38 35 40 28 32 37
Cidados. Qual a mediana?
56
Soluo: Ordenando os elementos temos:
24 28 30 32 32 35 37 37 38 40 40 40
Como temos 12 elementos, nmero par, a mediana ser a mdia aritmtica dos
elementos centrais. A mediana ser a mdia aritmtica dos elementos 35 e 37. Logo
a mediana ser 36
2
37 35

+
Md .
Clculo da Mediana de dados em tabela de distribuio de freqncia
Se tivermos uma tabela de distribuio de freqncia simples, ento podemos
proceder como no caso anterior.

Exemplo: A tabela abaixo representa as notas em estatstica dos alunos do 7.
perodo de Matemtica da FAFDA.
Notas
Freqncia
f
j
11 2
12 4
13 2
14 2
15 10
16 6
17 2
18 1
29
Qual a nota mediana?
Soluo: Como temos 29 elementos, o valor mediano dever estar na posio
15
2
1 29

+
. Logo o elemento mediano o
0
15 elemento.
57
Assim somando as freqncias temos 15 5 2 2 4 2 + + + + . A mediana ser 15.
Portanto a nota mediana 15.
Para uma distribuio de freqncia agrupada em classes, a mediana tal
que metade da rea total dos retngulos do histograma da distribuio est sua
esquerda, e a outra metade est sua direita.
De modo geral podemos calcular a mediana por:
c
f
j
L x
~
Md +
onde
L: a fronteira inferior da classe em que a mediana deve estar.
f: a sua freqncia
c: o intervalo de classe
j: o nmero de elementos que ainda faltam quando atingimos L.
Exemplo: A tabela abaixo representa as notas obtidas por 500 alunos em um teste
de geografia. Calcule a nota mediana.







Notas f
j
10 25 44
25 40 70
40 55 92
55 70 147
70 85 115
85 100 32
Total 500
58


Soluo: Como temos 500 elementos, o valor mediano dever estar no
0
250
2
500

elemento.
Assim << = >? = @A 9 A?B e << = >? = @A = C<> 9 ;:; D A:?. A mediana estar na
4. classe. Usando a frmula temos:
L = 55, f = 147, c = 15 e j = 250-206 = 44. Logo
5 , 59
15
147
44
55

+
Md
Md
Portanto a mediana 59,5.
3) Moda: (o
Dados no agrupados
o valor que ocorre com maior freqncia e mais de uma vez.
Exemplo: Vinte reunies de um clube de dana tiveram as seguintes freqncias de
seus membros
26 25 28 23 25 24 24 21 23 26
28 26 24 32 25 27 24 23 24 22
Qual a moda?
Soluo: A moda vale 24, pois ocorre 5 vezes.
bservao: A moda raramente utilizada em inferncia estatstica pelo fato de
nem sempre existir (o que ocorre quando no h dois valores iguais) ou de,
eventualmente, no ser nica.
59
Exemplo: Os dados a seguir referem-se a quantidade de pessoas que assistiram a 6
sesses de um filme no cinema:
121 133 121 133 114 141
Qual o nmero modal de pessoas que assistiram ao filme?
Soluo: Temos que os nmeros 121 e 133 repetem, ambos, duas vezes. Portanto a
moda no nica. Logo as modas so 121 e 133.
Clculo da Moda de dados em tabela de distribuio de freqncia
Se tivermos uma tabela de distribuio de freqncia simples, ento podemos
proceder como no caso anterior.
Exemplo: A tabela abaixo representa as notas em estatstica dos alunos do 7.
perodo de Matemtica da FAFDA.
Notas
Freqncia
f
j
11 2
12 4
13 2
14 2
15 10
16 6
17 2
18 1
29
Qual a nota modal?
Soluo: A nota que ocorre com maior freqncia a nota 15, pois ocorre 10 vezes.
Logo a nota modal (o 9 C:.
60
Quando temos uma tabela de distribuio de freqncia agrupada em classes, o
clculo da moda feito utilizando a frmula de Czuber.
1. passo: dentificamos a classe modal ( aquela que possui maior frequncia)
2. passo: Aplica-se a frmula
h L Mo
+

+
2 1
1
onde
L: o limite inferior da classe modal.
1

: Diferena entre a freqncia da classe modal e a classe imediatamente


anterior.
2

: Diferena entre a freqncia da classe modal e a classe imediatamente


posterior.
h: Amplitude da classe modal
Exemplo: A tabela abaixo representa as notas obtidas por 500 alunos em um teste
de geografia. Calcule a nota modal.







Notas f
j
10 25 44
25 40 70
40 55 92
55 70 147
70 85 115
85 100 32
Total 500
61


Soluo:
1. passo: A classe modal a 4., pois ela possui a maior freqncia.
2. passo: Temos
L = 55,
55 92 147
1

,
32 115 147
2

e h = 15
5 , 64
15
32 55
55
55

+
+
Mo
Mo
Logo a nota modal (o 9 B<8:.
62
(edidas de Eariabilidade
So medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou
disperso, dos valores em torno da mdia.
Considere os dois conjuntos da dados a seguir:
Conjunto 1 20 20 20 20 20 20 20
Conjunto 2 30 15 15 20 20 20 20
Ambos os conjuntos tm mdia 20, no entanto a variabilidade dos elementos
do conjunto 2 maior.

Desvio "adro
Smbolo: S
Dados no agrupados
Amostral Populacional
1
1
1
1
1
1
]
1

,
_

n
x
x
n
S
n
i
i
n
i
i
2
1
1
2
1
1
1
1
1
1
1
1
]
1

,
_

n
x
x
n
n
i
i
n
i
i
2
1
1
2
1

Clculo do desvio padro de dados em tabela de distribuio de freqncia


Sejam :
x
i
o ponto mdio da classe i ,
63
f
i
a freqncia da classe i,
k a quantidade de classe.
64
Amostral Populacional
1
1
1
1
1
1
]
1

,
_

n
f x
f x
n
S
i
k
i
i
k
i
i i
2
1
1
2
.
.
1
1
1
1
1
1
1
1
]
1

,
_

n
f x
f x
n
i
k
i
i
k
i
i i
2
1
1
2
.
.
1

A variFncia de um conjunto de dados denotada por s


2

O desvio padro aumenta quando a disperso dos dados aumenta.
Exemplo: A tabela abaixo representa as notas obtidas por 500 alunos em um teste
de geografia. Calcule o desvio-padro.
Notas f
j
x
i
x
i
.f x
i
2
. f
10 25 44 17,5 770 13.475
25 40 70 32,5 2.275 73.937,5
40 55 92 47,5 4.370 207.575
55 70 147 62,5 9.187,5 574.218,8
70 85 115 77,5 8.912,5 690.718,8
85 100 32 92,5 2.960 273.800
Total 500 28.475 1.833.725
65
Temos que
( )
( )
( )
2 , 19
183868 , 368
75 , 723 . 183
499
1
25 , 651 . 621 . 1 725 . 833 . 1
499
1
500
475 . 28
725 . 833 . 1
1 500
1
2

,
_

s
s
s
s
s
Logo o desvio-padro de 19,2.
66
E&erccios
1) A tabela abaixo se refere ao peso, em kg, de 50 alunos de uma determinada
escola.
Peso = x
i
f
i

45 8
55 22
65 8
75 6
85 5
95 1
Total 50
a) Calcule a mdia dos dados agrupados
b) Calcule a varincia.
2) A mdia aritmtica a razo entre:
a) ( ) O nmero de valores e o somatrio;
b) ( ) O somatrio dos valores e o nmero;
c) ( ) Os valores extremos;
d) ( ) Os dois valores centrais.
3) Numa distribuio de valores todos iguais, o desvio-padro :
a) ( ) negativo;
b) ( ) positivo;
c) ( ) a unidade;
d) ( ) zero.
4) A mdia de um conjunto de valores iguais a uma constante :
a) ( ) zero;
b) ( ) o valor da constante;
c) ( ) a unidade;
67
d) ( ) a quantidade de valores que temos
5) O desvio-padro de um conjunto de dados 4. A varincia ser:
a) ( ) 3;
b) ( ) 4;
c) ( ) 16;
d) ( ) 81.
6) Uma empresa possui dois serventes recebendo salrios de R$ 250,00 cada um,
quatro escriturrios recebendo R$ 600,00 cada um, um chefe de escritrio com
salrio de R$ 1.000,00 e trs tcnicos. A mdia de salrios da empresa de R$
1.050,00. Quanto cada tcnico recebe?
7) A mdia do conjunto de valores
46,1 57,5 21,6 16,8 4,2
igual a?
8) O desvio-padro do conjunto de valores
46 57 21 16 4
igual a?
9) Os 20 dados abaixo se referem aos ndices pluviomtricos em determinado
Estado:
144 152 159 160 160 151 157 146 154 145
141 150 142 146 142 141 141 150 143 158
Determine:
a) O ndice mdio.
b) O ndice mediano.
68
10) Os dados abaixo se referem a pesos (em gramas) de 50 ratos usados em um
estudo de deficincia de vitaminas.
136 125 135 137 126 129 124 118 120 126
119 92 115 115 127 95 100 113 95 113
146 103 101 118 121 129 110 126 106 148
137 87 126 119 125 132 108 118 119 117
120 110 82 105 102 104 133 104 132 146
a) Construa uma tabela de distribuio de freqncia agrupada em classes.
b) Qual o peso modal?
c) Qual o desvio-padro?
d) Um rato considerado magro se seu peso menor que s x 2 e gordo se seu
peso maior que s x 2 + . Quais os pesos mximo e mnimo para que um rato seja
considerado magro ou gordo?
e) Baseado na letra e, um rato cujo peso de 135 gramas considerado magro ou
gordo? Justifique sua resposta.
11) D um exemplo numrico, com no mximo 4 amostras, em que a mdia e a
mediana sejam iguais e o desvio-padro seja nulo.
12) D um exemplo numrico, com no mximo 4 amostras, em que a mdia menor
que a mediana.
13) Um artigo de jornal fez meno a determinada pesquisa citando que o conjunto
amostral acusa x = 5, x
2
= 7 e s = 0,5. Por erro esqueceram de citar o tamanho da
amostra utilizado. Considerando as informaes anteriores o que podemos dizer
sobre os possveis tamanho da amostra?
69
14) Uma lista de nmeros acusa x =202, x
2
= 3.452 e n = 15. Qual o desvio-
padro?
15) Em quatro paradas no box, o mecnico dos pneus dianteiros trocou o pneu
dianteiro direito dos carros de corrida em
10,8 12,0 10,5 10,7
segundos. Calcule:
a) o tempo mdio de troca de pneus
b) o desvio-padro.
16) A tabela a seguir apresenta o tempo que 80 estudantes dedicam a atividade de
lazer durante uma semana escolar tpica
Calcule:
a) o tempo mdio
b) o tempo mediano
c) Qual a porcentagem dos alunos que dedicam mais de 25 horas de lazer ?
Horas f
j
10 15 9
15 20 28
20 25 27
25 30 12
30 35 4
Total 80
70
17) Uma lista de nmeros acusa x =40 e x
2
= 156. Quantos valores figuram na
lista, se seu desvio-padro 2,0?
18) Um inspetor de controle de qualidade examinou 15 engradados de telhas de
cermica, contendo cada um 144 telhas. Os nmeros de telhas trincadas nessas
caixas foram
2 5 3 4 2 0 1 5 7 3 0 2 2 4 3
Calcule:
a) o nmero mdio de telhas trincadas e
b) o desvio-padro.
71
19) A tabela de distribuio a seguir apresenta o nmero de peas defeituosas em
uma produo de determinado produto
N4G de defeitos N4G de "eas
0 5
1 10
2 18
3 12
4 5
Total 40
Calcule:
a) a mdia
b) a mediana
c) a moda
d) Qual das trs medidas melhor representa os dados?
20) A tabela a seguir apresenta os salrios pagos a 100 operrios de uma empresa
Calcule:
a) o salrio mdio
N. de salrios
mnimos
f
j
0 2 40
2 4 30
4 6 10
6 8 15
8 10 5
Total 100
72
b) o salrio mediano
c) Qual a porcentagem dos empregados que ganham acima de 4
salrios?
d) O dono da empresa afirmou, em entrevista, que seus funcionrios
ganham, em mdia, R$ 1440,00. Considerando o salrio mnimo no
valor de R$ 330,00, a afirmao do dono da empresa verdadeira?
73
.e"resentao 6rfica
1) Classificao dos grficos segundo o objetivo
possvel distinguir, de certo modo arbitrariamente, dois objetivos que
justifiquem o emprego de grficos. Os grficos so usados para apresentar
visualmente dados numricos, proporcionando maior facilidade e rapidez de
compreenso dos mesmos, ou, ento, para apresentar concluses ou resultados
de uma anlise. H, portanto, dois tipos de grficos, conforme o objetivo ou uso a
que se destinam: grficos de informao e grficos de anlise.
a) Grficos de nformao
So grficos destinados principalmente ao pblico em geral, objetivando
proporcionar uma visualizao rpida e clara da intensidade das modalidades e
dos valores relativos ao fenmeno observado.
So grficos tipicamente expositivos, devendo, por conseguinte, ser o mais
completo possvel, dispensando comentrios explicativos adicionais.
b) Grficos de Anlise
Os grficos de anlise prestam-se melhor ao trabalho estatstico,
fornecendo elementos teis fase de anlise dos dados, sem deixar de ser
tambm informativos.
Quando se usam grficos para apresentar os resultados de uma anlise,
esses freqentemente vm acompanhados de uma tabela. nclui-se, muitas vezes,
um texto dissertativo, chamando a ateno do leitor para os pontos principais
revelados pelo grfico ou pela tabela.
2) Uso indevido dos grficos
74
Muitas vezes, o uso indevido dos grficos pode trazer uma idia falsa dos
dados que esto sendo analisados, chegando mesmo a confundir o leitor.
3) Grficos em linhas ou grficos lineares
Os grficos em linha so freqentemente usados para a representao de
sries de tempo (quando um dos fatores for o tempo).
Para construir o grfico em linha, basta marcar os pontos
correspondentes aos valores observados em cada perodo e uni-los por meio de
um trao contnuo.
75
Exemplo: O dado apresentado na tabela representa as matriculas em uma
escola municipal.
Tabela: Matrculas em Escola Municipal
Ano 200
3
200
2
200
1
200
0
199
9
199
8
199
7
199
6
1995
Matrcula
s
158
0
165
0
145
0
180
0
165
0
149
0
159
0
163
0
1530
Matriculas na Rede Municipal de BH
1450
1480
1510
1540
1570
1600
160
1660
16!0
1720
1750
1780
1810
2
0
0

2
0
0
2
2
0
0
1
2
0
0
0
1
!
!
!
1
!
!
8
1
!
!
7
1
!
!
6
1
!
!
5
Ano
(
a
t
r
i
c
u
l
a
s
4) Grficos em barras
Exemplo: A tabela a seguir apresenta a pulsao, por minutos, de alunos do
primeiro ano da Faculdade de Cincias Mdicas de MG, 1990.

Tabela: Pulsao, por minutos, de alunos do primeiro ano da Faculdade de Cincias
Mdicas de MG, 1990
76
Pulsao
(p/m)
Freqnci
a
60 3
68 6
82 12
84 4
98 3
100 2
Pulsao8 "or #inuto8 de alunos do
"ri#eiro ano da 'aculdade de
Cincias ()dicas de (68 C@@?
0
2
4
6
8
10
12
14
60 68 82 84 98 100
Pulsao
'
r
e
0
u

n
c
i
a
77
0
2
4
6
8
10
12
're0un
cia
60 68 82 84 98 100
Pulsao
Pulsao8 "or #inuto8 de alunos do
"ri#eiro ano da 'aculdade de
Cincias ()dicas de (68 C@@?
5) Grficos de Pizza ou setores
Exemplo: A tabela a seguir apresenta a pulsao, por minutos, de alunos do
primeiro ano da Faculdade de Cincias Mdicas de MG, 1990.

78
Tabela: Pulsao, por minutos, de alunos do primeiro ano da Faculdade de Cincias
Mdicas de MG, 1990
Pulsao
(p/m)
Freqnci
a
60 3
68 6
82 12
84 4
98 3
100 2
Pulsao8 "or #inuto8 de alunos do
"ri#eiro ano da 'aculdade de Cincias
()dicas de (68 C@@?
60
68
82
84
98
100
6) Histograma
O histograma um grfico formado por um conjunto de retngulos
justapostos, de forma que a rea de cada retngulo seja proporcional
freqncia da classe que ele representa. Assim, a soma dos valores
correspondentes s reas dos retngulos ser sempre igual freqncia total.
O histograma constitudo tomando-se como referncia dois eixos
coordenados. No eixo horizontal so anotados os valores individuais da varivel em
estudo, ou os limites das classes. Por conseguinte, a dimenso horizontal de cada
retngulo representar a classe. No eixo vertical ser construda a escala onde
sero lidos os valores relativos ao nmero de observaes ou freqncias da classe.
A rea de cada retngulo do histograma corresponde freqncia da classe que o
79
retngulo representa. Para determinar a altura do retngulo, basta tomar a frmula
de clculo da rea de um retngulo:
S = b x h
Onde:
= base do retngulo = amplitude do intervalo de classe
! = altura do retngulo
S = rea do retngulo = freqncia da classe.
Para traar o grfico deve-se calcular as alturas dos retngulos. Usando a
frmula acima temos:
b
S
h
Exemplo: A tabela a seguir apresenta a pulsao, por minutos, de alunos do
primeiro ano da Faculdade de Cincias Mdicas de MG, 1990.

Tabela: Casos de Hansenase em Minas Gerais
Anos Nmero
1980 32903
1984 37582
1988 37102
1992 29070
1996 11459
1999 5118
80
Casos de Hansenase e# (6
0
5000
10000
15000
20000
25000
30000
35000
40000
1980 1984 1988 1992 1996 1999
Ano
N
$
#
e
r
o
7) Poligonal Caracterstica
A poligonal caracterstica a representao do contorno do histograma.
8) Polgono de Freqncias
Unindo por linhas retas os pontos mdios das bases superiores dos
retngulos do histograma, obtm-se outra representao dos dados, denominado
Polgono de Freqncias.
81
9) Ogiva ou Polgono de Freqncias Acumuladas
Tem por finalidade a representao grfica das tabelas de freqncias
acumuladas.
Quando o polgono de freqncias acumuladas se refere s freqncias
relativas, usa-se a denominao ogiva percentual ou polgono de freqncias
relativas acumuladas.
10) Box-plot
Box-plot: Grfico em que temos o ponto de mnimo, 1 quartil, mediana, 3
quartil e o ponto de mximo.
Exemplos:
a) Considere o conjunto de dados
0 1 2 2 3 1 2 3 1 2 3 3 2 1 2 3 3
No exemplo acima temos:
Mnimo = 0
1 quartil = 1
2 quartil = Mediana = 2
3 quartil = 3
Mximo = 3.
82
83
b) Considere o conjunto de dados
0 1 2 3 4 1 2 2 2 1 0 3 4 2 1 0 2 0 2 3 1 2 0 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 3 3 3 3 3 3 3 3 3 3 3
Nele temos:
Mnimo = 0
1 quartil = 1
2 quartil = Mediana = 1
3 quartil = 3
Mximo = 4.
11) Ramo-e-folhas
uma forma de visualizao dos dados originais o qual nos permite
ver a distribuio dos dados sem a perda de informaes.
84
Permite visualizar a ordenao dos dados.
Para a construo de um grfico ramo-e-folhas tomamos como ramo
os algarismos mais a esquerda e as folhas os algarismos mais a direita. Por
exemplo, no nmero 352, o ramo 35 e a folha o 2.
85
Exemplo:
a) Considere o conjunto de dados a seguir
0 1 2 3 4 1 2 2 2 1 0 3 4 2 1 0 2 0 2 3 1 2 0 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 3 3 3 3 3 3 3 3 3 3 3
O grfico ramo-e-folhas ser
Ramo Folhas
0 00000
1 00000000000000000000000000
2 0000000000
3 00000000000000
4 00
b) Considere o conjunto de dados a seguir
10 11 12 12 14 13 12 10 14 15 16 12 12 13 12 11 14 15 10 14 12
O grfico ramo-e-folhas ser
Ramo Folhas
10 000
11 00
12 0000000
13 00
14 0000
15 00
16 0
86
c) Considere o conjunto de dados a seguir
100 110 121 124 145 135 122 100 146 151 162 121 123 134 122 118 145 151 100
144 125
O grfico ramo-e-folhas ser
Ramo Folhas
10 000
11 08
12 1122345
13 45
14 4556
15 11
16 2
87
Tabelas - Normalizao de Publicaes Tcnico cientificas - Ed. UFMG
4) As tabelas devem ser dotadas de um ttulo claro e conciso localizado acima
delas. So numeradas seqencialmente em todo o trabalho, com algarismos
arbicos (1, 2, 3, ...), segundo normas do BGE.
5) No cabealho de cada coluna indica-se o seu contedo. Os ttulos das
colunaspodem ser datilografados verticalmente, se necessrio, para
economizar espao.
6) No se deve deixar nenhuma "casa vazia no corpo da tabela, usando-se os
smbolos, conforme conveno internacional:
- quando, pela natureza do fenmeno, o dado no existir
Z quando o dado for rigorosamente zero
... quando no se dispuser do clculo
7) Na construo de tabelas usam-se os seguintes traos:
a) trao duplo horizontal, limitando o quadro;
b) trao simples vertical, separando a coluna indicadora das
demais e estas entre si; no corpo da tabela pode ser eliminado
desde que o nmero de colunas seja pequeno e no haja
prejuzo na leitura dos dados;
8) a tabela no deve ser fechada lateralmente, tampouco se colocam traos
horizontais separando os dados numricos.
88
E&erccios
1) Observe o histograma abaixo.
N$#ero de defeitos e# instru#entos
1ticos
40
120
340
290
160
30
0
50
100
150
200
250
300
350
400
0 1 2 3 4 5
N$#ero de defeitos
'
r
e
0
u

n
c
i
a
Complete a tabela de distribuio abaixo.
Nmero de defeitos f
i

0
1 12
0
2
3
4
5
Total
89
90
Probabilidade
-)cnicas de conta%e#
'atorial
O fatorial de um nmero inteiro positivo
n
representado por
! n
(L-se: n
fatorial).
O fatorial do nmero
n
obtido pela multiplicao de
n
por todos os inteiros
inferiores at o nmero 1.
( ) ( ) 1 2 n 1 n n ! n
Exemplos:
1)
24 1 . 2 . 3 . 4 ! 4
2)
720 1 . 2 . 3 . 4 . 5 . 6 ! 6
Por definio:
1 ! 0
1 ! 1
Observao:
! 5 . 6 ! 4 . 5 . 6 ! 6
Exemplo:
Qual o valor de
! 3 ! 10
! 12

?
Soluo:
22
6
11 . 12
1 . 2 . 3 . ! 10
! 10 . 11 . 12
! 3 ! 10
! 12

Exerccio:
Muitas calculadoras ou computadores no podem calcular diretamente valores de
! 70
ou superiores. Para
n
muito grande,
! n
pode ser aproximado por
k
10 ! n
,
onde o valor de k dado por
( ) n 43429448 , 0 39908993 , 0 n log 5 , 0 n k + +
.
Calcule
! 50
utilizando a tecla fatorial da calculadora e utilizando a aproximao.
91
Princ"io 'unda#ental da Conta%e#
Se um primeiro acontecimento pode ocorrer de
1
m
maneiras distintas, um segundo
pode ocorrer de
2
m
maneira distintas e, sucessivamente, um simo n
acontecimento pode ocorrer de
n
m
maneiras distintas, sendo todos eventos
independentes, ento o nmero de maneiras distintas em que os
n
acontecimentos
ocorrem conjuntamente
n 2 1
m . . m . m
.
Exemplos:
1) Quantas placas para identificao de veculos podem ser confeccionadascom 3
letras e 3 algarismos? ( Considere 26 letras, supondo que no h nenhuma
restrio)
2) Existem 5 ruas ligando os supermercados X e Y e 3 ruas ligando os
supermercados Y e W. Quantos trajetos diferentes podem ser utilizados para irmos
de X a W, passando por Y?
Arran!o Si#"les
Corresponde ao estudo da quantidade de maneiras em que se pode agrupar os
objetos de uma amostra em que a ordem dos objetos seja relevante.
O nmero de arran!os si#"les (sem repetio) de r elementos escolhidos dentre
n
elementos
( )! r n
! n
A
r , n

92
Exemplos*
1) No estoque de uma determinada empresa existem 8 caixas diferentes, das quais
devem ser escolhidas e empilhadas 4. De quantas maneiras podemos empilhar
estas 4 caixas?
Soluo: A ordem com que empilhamos as caixas relevante, logo temos um
problema de arranjo. Assim
( )
680 . 1
! 4 8
! 8
A
4 , 8

2) Um almoxarifado necessita organizar uma estante, destinada a armazenar


suprimentos diversos. Sabendo que existem 3 itens diferentes da rea industrial
(departamento de produo), 6 itens diferentes da rea de transporte e 3 itens
diferentes do departamento de recursos humanos. Calcule:
a) de quantas maneiras os itens poderiam ser organizados?
b) se os itens da produo precisassem necessariamente ficar juntos, quantas
maneiras de organizar todos os itens possveis?
Soluo:
a) Temos 12 itens diferentes. Ao organiz-los a ordem relevante. Assim
( )
600 . 001 . 479
! 12 12
! 12
A
12 , 12

b) Temos 3 itens diferentes da rea industrial. Os outros 9 no precisam ficar juntos.


Podemos ento considerar os 3 itens da produo como um nico bloco. Assim
teremos
( ) ( )
! 3 . ! 10
! 3 3
! 3
! 10 10
! 10
A . A
3 , 3 10 , 10

Co#binao Si#"les
Corresponde ao estudo da quantidade de maneiras em que se pode agrupar os
objetos de uma amostra em que a ordem dos objetos seja irrelevante.
93
O nmero de co#bina,es si#"les (sem repetio) de r elementos escolhidos
dentre
n
elementos
( ) ! r . ! r n
! n

r , n

Exemplos:
1) Uma empresa de pesquisa mercadolgica deseja selecionar uma comisso
formada por 4 consumidores de uma amostra previamente selecionada de 8
pessoas. Calcule:
a) de quantas maneiras possveis as 4 pessoas podero ser selecionadas?
b) se a comisso fosse composta por um presidente, um vice-presidente, um relator
e um secretrio, escolhidos nessa ordem, de quantas maneiras possveis
poderemos formar a comisso?
Soluo:
a)
( )
70
! 4 . ! 4 8
! 8

4 , 8

b)
( )
680 . 1
! 4 8
! 8
A
4 , 8

2) Em um departamento industrial existem 8 engenheiros eletricistas e 7 tcnicos em


eletrnica. Sabendo que uma comisso dever ser formada, calcule de quantas
maneiras a comisso poder ser elaborada, supondo que:
a) 5 pessoas devem ser escolhidas.
b) 3 engenheiros e 2 tcnicos devem ser escolhidos.
Soluo:
a)
( )
003 . 3
! 5 . ! 5 15
! 15

5 , 15

b)
( ) ( )
176 . 1
! 2 . ! 2 7
! 7
! 3 . ! 3 8
! 8

2 , 7 3 , 8


94
Probabilidade
Definies:
E&"eri#ento Aleat1rio: qualquer processo que permite ao pesquisador fazer
observaes cujos resultados no podem ser previstos com certeza.
Exemplos:
1
!
: Retirar uma carta de um baralho com 52 cartas e observar seu naipe.
2
!
:Jogar uma moeda 10 vezes e observar o nmero de caras obtidas.
3
!
: Em uma linha de produo, fabricam-se peas em srie e conta-se o
nmero de peas defeituosas produzidas em um perodo de 24 horas.
4
!
: Uma lmpada fabricada. Em seguida testada e verifica-se o tempo
de vida.
5
!
: Retira-se uma bola de uma urna que contm bolas pretas, vermelhas e
amarelas e observa sua cor.
Es"ao A#ostral: Para cada experimento E, define-se espao amostral S o
conjunto de todos os possveis resultados desse experimento.
Exemplos:
Considerando os experimentos aleatrios anteriores, o espao amostral para cada
um deles pode ser descrito como:
1
S
: {ouro, copa, paus, espada}
2
S
: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
3
S
: {0, 1, 2, 3, ..., N}, onde N o mximo de peas produzidas em 24 horas.
4
S
: {t | t < 0}
5
S
: {preta, vermelha, amarela}
O espao amostral pode ser:
1. Finito: formado por um nmero limitado de resultados possveis.
95
2. nfinito enumervel: formado por um nmero infinito de resultados, os quais
podem ser listados ou enumerados.
Exemplo: nmero de mensagens que so transmitidas corretamente por dia
em uma rede de computadores.
3. nfinito: formado por intervalo de nmeros reais.
Evento: qualquer subconjunto do espao amostral.
A um evento A

S
Em particular S o evento certo e

o evento impossvel.
Exemplo:
Considere o experimento
E = jogar uma moeda trs vezes e observar os resultados.
Ento
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) { } k , k , k , " , k , k , k , " , k , k , k , " , " , k , " , " , " , k , k , " , " , " , " , " S
Seja o evento: A = ocorrer pelo menos duas caras.
Ento
( ) ( ) ( ) ( ) { } " , k , " , " , " , k , k , " , " , " , " , " A
Eventos (utua#ente E&clusivos: Dois eventos A e B so denominados
mutuamente exclusivos, se eles no puderem ocorrer simultaneamente, isto
# A
.
Exemplo:
Considere o experimento
E = jogar um dado e observar o nmero da parte de cima.
Ento
{ } 6 5 4 3 2 1 , , , , , S
Sejam os eventos: A = ocorrer um nmero par, e B = ocorrer um nmero
mpar.
Ento
{ } 6 , 4 , 2 A
,
{ } 5 , 3 , 1 #
e
# A
.
Definio clssica de probabilidade
96
Dado um experimento aleatrio E, S o espao amostral e A um evento. A
probabilidade do evento A,
( ) A $
, uma funo definida em S que associa a cada
evento um nmero real calculada pela relao:
( )
( )
( ) S n
A n
A $
Onde:
( ) A n
: o nmero de vezes em que o evento A pode ocorrer

( ) S n
: o nmero de vezes em que o espao amostral S pode ocorrer
Obs: Ao expressar a probabilidade devemos faz-la utilizando as fraes ordinrias
ou com 4 casas decimais.
Exemplos:
1. Considere um baralho com 52 cartas. Qual a probabilidade de se retirar uma
carta de ouro?
Soluo: Em um baralho temos 13 cartas de ouro. Logo considerando o evento A
= retirar uma carta de ouro temos
( )
4
1
52
13
A $
2. Num lote de 12 peas, 4 so defeituosas; duas peas so retiradas
aleatoriamente. Qual a probabilidade de ambas serem defeituosas?
Soluo: Evento A = ambas peas so defeituosas.
Nmero de maneiras do evento A ocorrer =
( )
6
! 2 . ! 2 4
! 4
2
4

,
_

.
Nmero de maneiras do espao S ocorrer =
( )
66
! 2 . ! 2 12
! 12
2
12

,
_

.
Logo
( )
11
1
66
6
A $
.
3. A MasterCard nternational efetuou um estudo de fraude em cartes de
crdito. Os resultados esto apresentados na tabela a seguir.
Tabela: Tipos de fraude em cartes de crdito
Tipo de fraude Nmero de ocorrncia
97
Carto roubado 243
Carto falsificado 85
Pedido por correio/
telefone
52
Outros 46

Selecionando aleatoriamente um caso de fraude, qual a probabilidade de:
a) a fraude resultar de um carto roubado?
b) A fraude no ser de carto falsificado?
Soluo:
a) Considere o evento A = carto roubado. Logo
( ) 5704 , 0
426
243
A $
.
b) Considere o evento B = carto no falsificado. Ento
( ) 8005 , 0
426
341
# $
Propriedades da probabilidade
Para cada evento A associado um nmero real
( ) A P
com as seguintes
propriedades:
1)
( ) 1 0 A P
2)
( ) 1 S P
3) Se A e B forem eventos mutuamente exclusivos ento
( ) ( ) ( ) B P A P B A P +
Eventos co#"le#entares: Dois eventos A e B so complementares quando A 5 B
9 S. Neste caso vale a propriedade
( ) ( ) 1 # $ A $ +
.
Neste caso simbolizamos
c
A B
Exemplo: O evento A = chuva e o evento B = no chuva so complementares.
Evento Co#"osto: qualquer evento que combina dois ou mais eventos simples.
Exemplo: No lanamento de um dado considere o evento A = {2,5}.
98
.e%ra da Adio: Se A e B so dois eventos quaisquer, ento:
( ) ( ) ( ) ( ) # A $ # $ A $ # A $ +
Observaes:

( ) # A $
denota a probabilidade do evento A, ou do evento B, ou de ambos.

( ) # A $
denota a probabilidade do evento A e do evento B simultaneamente
em um mesmo experimento.
99
Exemplos:
1) As preferncias de homens e mulheres por cada gnero de filme alugado em uma
locadora de vdeos, esto apresentados na tabela a seguir:
Tabela: Preferncia de homens e mulheres por filmes
Sexo / Filme Comdia Romance Policial
Homens 136 92 248
Mulheres 102 195 62
Sorteando-se ao acaso uma dessas locaes de vdeo, pergunta-se a probabilidade
de:
a) Uma mulher ter alugado um filme ou o filme do gnero policial;
b) Um homem ter alugado um filme ou o filme do gnero romance.
Soluo:
a) Considere os eventos
A = mulher aluga o filme e
B = Filme do gnero policial
( ) ( ) ( ) ( ) # A $ # $ A $ # A $ +
( ) 7269 , 0
835
607
835
62
835
310
835
359
# A $ +
b) Considere os eventos
A = homem aluga o filme e
B = Filme do gnero romance
( ) ( ) ( ) ( ) # A $ # $ A $ # A $ +
( ) 8036 , 0
835
671
835
92
835
287
835
476
# A $ +
100
2) Uma loja de material de construo possui 2 caixas de conexes. Na primeira,
das 30 conexes 11 so defeituosas. Na segunda, das 12 conexes 4 so
defeituosas. Uma conexo retirada aleatoriamente. Qual a probabilidade de a
conexo ser defeituosa ou ter sido retirada da segunda caixa?
Soluo:
a) Considere os eventos
A = conexo defeituosa.
B = conexo retirada da segunda caixa.

( ) ( ) ( ) ( ) # A $ # $ A $ # A $ +
( ) 5476 , 0
42
23
42
4
42
12
42
15
# A $ +
Obs: Este exemplo pode ser melhor visualizado utilizando a rvore de probabilidade.
Ou seja:
.e%ra da (ulti"licao: Se A e B so dois eventos quaisquer, ento:

( ) ( ) ( ) # $ . A $ # A $
se A e B so independentes ou

( ) ( ) ( ) A % # $ . A $ # A $
se A e B so dependentes
Notao: ( ) A % # $ representa a probabilidade de ocorrncia do evento B dado que o
evento A ocorreu. chamado de probabilidade condicional.
Dois eventos A e B so inde"endentes se a ocorrncia de um deles no afeta
101
a probabilidade de ocorrncia do outro. Caso contrrio eles so de"endentes.
Exemplos:
1) Uma determinada companhia produz um lote de 50 filtros de combustveis, dos
quais 6 so defeituosos. Escolhem-se aleatoriamente e testam-se dois filtros do lote.
Determine a probabilidade de ambos serem bons, se os filtros so selecionados:
a) com reposio;
b) sem reposio.
Soluo: Considere os eventos
A = filtro bom.
B = filtro bom.
a) Como processo de escolha com reposio, ento a escolha do primeiro filtro
no afeta a escolha do segundo filtro. Logo so independentes. Assim
( ) ( ) ( ) # $ . A $ # A $
( ) 7744 , 0
2500
1936
50
44
50
44
# A $
b) Como processo de escolha sem reposio, ento a escolha do primeiro filtro
afeta a escolha do segundo filtro. Logo so dependentes. Assim
( ) ( ) ( ) A % # $ . A $ # A $
( ) 7722 , 0
2450
1892
49
43
50
44
# A $
102
2) Uma loja de material de construo possui 2 caixas de conexes. Na primeira,
das 30 conexes 11 so defeituosas. Na segunda, das 12 conexes 4 so
defeituosas. Uma conexo retirada aleatoriamente de cada caixa. Calcule a
probabilidade de:
a) Apenas uma ser defeituosa.
b) Ambas serem defeituosas.
c) Ambas no serem defeituosas.
Soluo:
a) Podemos ter os seguintes casos: DB ou BD. Assim
Caso 1:
A = defeituosa na primeira
B = boa na segunda.
( ) ( ) ( ) # $ . A $ # A $
( ) 2444 , 0
360
88
12
8
30
11
# A $
Caso 2:
A = defeituosa na segunda
B = boa na primeira.
( ) ( ) ( ) # $ . A $ # A $
( ) 2111 , 0
360
76
30
19
12
4
# A $
Portanto a probabilidade de apenas uma ser defeituosa de
( ) 4555 , 0 2111 , 0 2444 , 0 &'('i)*os+ *m+ +,'n+s $ +
b) 12,22%.
c) 42,22%.
103
-eore#a da "robabilidade total
Considere o espao amostral particionado em k eventos,
k 2 1
A , , A , A
, satisfazendo s seguintes condies:
a)

- i
A A
para todo
- i
.
b)
S A A A
k 2 1

.
c)
( ) 0 A $
i

para
k , , 2 , 1 i
.
Seja um evento F qualquer, referente ao espao amostral S . Ento:
( ) ( ) ( )

k
1 i
i i
A % . $ A $ . $
Demonstrao: Considere F um evento qualquer em S. Ento
( ) ( ) ( )
k 2 1
A . A . A . .
Usando a regra do produto teremos
( ) ( ) ( ) ( )
k 2 1
A . $ A . $ A . $ . $ + + +
Usando a regra do produto teremos o teorema da probabilidade total
( ) ( ) ( ) ( ) ( ) ( ) ( )
k k 2 2 1 1
A % . $ A $ A % . $ A $ A % . $ A $ . $ + + +
( ) ( ) ( )

k
1 i
i i
A % . $ A $ . $
Cqd.
Exemplo:
Uma determinada pea manufaturada por trs fbricas, denominadas X, Y e Z.
Sabe-se que X produz o dobro de peas que Y, e Y e Z produzem o mesmo
nmero de peas. Sabe-se tambm que 2% das peas produzidas por X e Y so
defeituosas, enquanto que 4% das produzidas por Z so defeituosas. Todas as
peas so colocadas em um depsito, e depois uma pea extrada
aleatoriamente. Qual a probabilidade de que a pea escolhida seja defeituosa?
104
Soluo:Considere os seguintes eventos
F = a pea defeituosa
1
A
= a pea provm da fbrica X.
2
A
= a pea provm da fbrica Y.
3
A
= a pea provm da fbrica Z.
Empregando o teorema da probabilidade total temos
( ) ( ) ( ) ( ) ( ) ( ) ( )
3 3 2 2 1 1
A % . $ A $ A % . $ A $ A % . $ A $ . $ + +
Sabe-se que:
( )
2
1
A $
1

( )
4
1
A $
2

( )
4
1
A $
3

( ) ( ) 02 , 0 A % . $ A % . $
2 1

( ) 04 , 0 A % . $
3

Logo
( ) 0250 , 0 04 , 0
4
1
02 , 0
4
1
02 , 0
2
1
. $ + +
Assim, a probabilidade da pea ser defeituosa de 0,0250 ou 2,50%.
105
-eore#a de BaIes (Thomas Bayes 1702 - 1761)
Considere o espao amostral particionado em k eventos,
k 2 1
A , , A , A
, satisfazendo s seguintes condies:
a)

- i
A A
para todo
- i
.
b)
S A A A
k 2 1

.
c)
( ) 0 A $
i

para
k , , 2 , 1 i
.
Seja um evento F qualquer, referente ao espao amostral S . Ento:
( )
( ) ( )
( ) . $
A % . $ A $
. % A $
i i
i

Exemplo:
1) (voltando ao exemplo anterior) Uma determinada pea manufaturada por trs
fbricas, denominadas X, Y e Z. Sabe-se que X produz o dobro de peas que Y, e Y
e Z produzem o mesmo nmero de peas. Sabe-se tambm que 2% das peas
produzidas por X e Y so defeituosas, enquanto que 4% das produzidas por Z so
defeituosas. Todas as peas so colocadas em um depsito, e depois uma pea
extrada aleatoriamente. Qual a probabilidade de que a pea escolhida seja
produzida pela fbrica Y dado que ela era defeituosa?
Soluo:Considere os seguintes eventos
F = a pea defeituosa
1
A
= a pea provm da fbrica X.
2
A
= a pea provm da fbrica Y.
3
A
= a pea provm da fbrica Z.
Sabe-se que:
( ) 0250 , 0 . $
(pelo exemplo anterior)
( )
4
1
A $
2

( ) ( ) 02 , 0 A % . $ A % . $
2 1

Logo
( )
( ) ( )
( ) . $
A % . $ A $
. % A $
2 2
2

106
( )
0250 , 0
02 , 0
4
1
. % A $
2

( )
0250 , 0
005 , 0
. % A $
2

( ) 2000 , 0 . % A $
2

2) Uma rede local de computadores composta por um servidor e cinco clientes (A,
B, C, D e E). Registros anteriores indicam que dos pedidos de determinado tipo de
processamento, realizados atravs de uma consulta, cerca de 10% vm do cliente A,
15% do B, 15% do C, 40% do D e 20% do E. Se o pedido no for feito de forma
adequada, o processamento apresentar erro. Usualmente, ocorrem os seguintes
percentuais de pedidos inadequados: 1% do cliente A, 2% do cliente B, 0,5% do
cliente C, 2% do cliente D e 8% do cliente E.
a) Qual a probabilidade de o sistema apresentar erro?
b) Qual a probabilidade de que o processo tenha sido pedido pelo cliente E,
sabendo-se que apresentou erro?
E&erccio*
1) As preferncias de homens e mulheres por cada gnero de filme alugado em
uma locadora de vdeos, esto apresentados na tabela a seguir:
Sexo / Filme Comdia Romance Policial
Homens 136 92 248
Mulheres 102 195 62
Sorteando-se ao acaso uma dessas locaes de vdeo, pergunta-se a probabilidade
de:
c) Uma mulher ter alugado um filme e o filme ser de comdia;
d) Um homem ter alugado um filme e o filme ser de romance.
107
2) Uma determinada companhia produz um lote de 50 filtros de combustveis, dos
quais 6 so defeituosos. Escolhem-se aleatoriamente e testam-se dois filtros do lote.
Determine a probabilidade de ambos serem bons, se os filtros so selecionados:
c) com reposio;
d) sem reposio.
3) Joga-se dois dados equilibrados e soma-se os dois resultados. Qual a
probabilidade de se obter o total 5 ?
4) Se 226 dentre 300 assinantes de um jornal, selecionado aleatoriamente,
afirmaram que lem a seo cmica diariamente. Qual a probabilidade de um
assinante escolhido aleatoriamente no ler a seo cmica?
5) Diga se cada afirmao verdadeira ou se ela falsa.
a. Espao amostral o conjunto de todos os resultados possveis de um
experimento.
b. Se dois eventos no podem ocorrer ao mesmo tempo eles so chamados de
mutuamente excludentes.
c. A regra da adio usada para encontrar a probabilidade de dois eventos
ocorrerem simultaneamente.
d. A amostra um subconjunto da populao. Em todo experimento a amostra pode
ser igual populao.
e. Dado x um evento, ento
( ) 1 x P 0 < <
.
6) Dois dados so lanados simultaneamente. Qual a probabilidade de o primeiro
resultado ser maior do que o segundo?
7) Um grupo de 100 alunos de dois cursos de uma faculdade foram escolhidos para
responderem a uma pesquisa. A tabela a seguir apresenta a composio destes
alunos:
Matemtica Pedagogia
Homens 31 10
108
Mulheres 23 36
Selecionando aleatoriamente um aluno:
a) qual a probabilidade dele ser homem ou ser do curso de Pedagogia?
b) qual a probabilidade dela ser mulher dado que do curso de Matemtica?
8) Uma livraria acaba de receber 40 novos livros, entre eles 12 romances histricos.
Se quatro desses livros so escolhidos aleatoriamente, e sem reposio, qual a
probabilidade de nenhum deles ser romance histrico? (Expressar o resultado em
frao)
9) A tabela a seguir apresenta o nmero de pacientes internados no hospital X, por
Alas.
Alas
Sexo e Nmero
Total
Masculino Feminino
A 415 220 635
B 250 375 595
C 105 220 325
Total 740 815 1555
A probabilidade de um paciente selecionado aleatoriamente ser do sexo feminino ou
estar internado na ala A de:
10) Complete com E se a afirmao for verdadeira e com ' se for falsa.
a. ( ) Espao amostral o conjunto de todos os resultados possveis de um
experimento.
b. ( ) Se dois eventos podem ocorrer ao mesmo tempo eles so chamados de
mutuamente excludentes.
c. ( ) A regra da multiplicao usada para encontrar a probabilidade de dois
eventos ocorrerem simultaneamente.
109
d. ( ) A amostra um subconjunto da populao. Em todo experimento a amostra
nunca ser igual populao.
e. ( ) Dado x um evento, ento
( ) 1 0 < x "
.
11) Dois dados so lanados simultaneamente. Qual a probabilidade de o primeiro
resultado ser menor do que o segundo?
12) Um grupo de 100 alunos de dois cursos de uma faculdade foram escolhidos para
responderem a uma pesquisa. A tabela a seguir apresenta a composio destes
alunos:
Matemtica Pedagogia
Homens 31 10
Mulheres 23 36
Selecionando aleatoriamente um aluno(a):
a) qual a probabilidade dele ser homem e ser do curso de Pedagogia?
b) qual a probabilidade dela ser mulher ou ser do curso de Matemtica?
13) Uma livraria acaba de receber 40 novos livros, entre eles 12 romances
histricos. Se um desses livros escolhido aleatoriamente, e sem reposio, qual a
probabilidade dele ser romance histrico? (Expressar o resultado em frao)
14) Quais dos valores abaixo no podem ser probabilidade?
0 ; 0,0001; -0,2 ; 3/2 ; 2/3 ; 2 ;
2 , 0
15) Quanto P(A), se A o evento "Fevereiro tem 30 dias este ano?
16) Quanto P(A), se A o evento "Novembro tem 30 dias este ano?
17) Qual a probabilidade do resultado "cara ao jogar uma moeda?
18) A MasterCard nternational efetuou um estudo de fraude em cartes de crdito.
Os resultados esto na tabela a seguir
110
Tipo de fraude Nmero
Carto roubado 243
Carto falsificado 85
Pedido por correio/ telefone 52
Outros 46
Selecionado aleatoriamente um caso de fraude, qual a probabilidade de a fraude
resultar de um carto falsificado?
19) Um casal planeja ter 2 filhos.
a) Relacione os diferentes resultados, de acordo com o sexo de cada criana.
b) Determine a probabilidade de o casal ter 2 meninas
c) Determine a probabilidade de exatamente uma criana de cada sexo.
20) Em um teste com 3 questes do tipo verdadeiro/falso, um estudante que no
est preparado deve responder cada uma aleatoriamente.
a) Relacione os diferentes resultados possveis.
b) Qual a probabilidade de responder corretamente todas as trs questes?
c) Qual a probabilidade de "palpitar incorretamente todas as trs questes?
d) Qual a probabilidade de acertar duas questes?
21) Diga se os dois eventos so mutuamente excludentes:
a. Escolha de um espectador de televiso do sexo masculino;
b. Escolha de algum que raramente utiliza o controle remoto.
22) Diga se os dois eventos so mutuamente excludentes:
c. Girar uma roleta e obter um nmero 7;
d. Girar uma roleta e obter um nmero par.
23) De um conjunto de cinco empresas, deseja-se selecionar, aleatoriamente, uma
empresa, mas com probabilidade proporcional ao nmero de funcionrios. O nmero
de funcionrios da Empresa A 20; de B 15; de C 7; de D 5 e de E 3.
a) Qual a probabilidade de cada uma das empresas ser selecionada?
b) Qual a probabilidade de a Empresa A no ser
111
Selecionada?
24) Se
4 , 0 " # A $
e
5 , 0 " # # $
, o que se pode dizer quanto a
" # # A $
se A e B
so eventos mutuamente exclusivos?
25) Num lote de 12 peas, 4 so defeituosas; trs peas so retiradas
aleatoriamente. Calcule:
a. A probabilidade de ambas serem defeituosas.
b. A probabilidade de ambas no serem defeituosas.
c. A probabilidade de ao menos uma ser defeituosa.
26) Um lote formado por 10 peas boas, 4 com defeitos leves e 2 com defeitos
graves. Uma pea escolhida aleatoriamente. Calcule a probabilidade de:
a. Ela no tenha defeitos graves.
b. Ela no tenha defeito.
c. Ela ou seja boa ou tenha defeitos graves.
27) Trs mquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total
de peas de uma fbrica. As porcentagens de peas defeituosas nass respectivas
mquinas so 3%, 5% e 2%. Uma pea selecionada aleatoriamente e verifica-se
que defeituosa. Qual a probabilidade de que a pea tenha vindo da mquina B?
28) A probabilidade de o aluno X resolver um problema de 3/5 e a do aluno Y
resolver o mesmo problema de 4/7. Qual a probabilidade de que o problema seja
resolvido?
29) Um grupo de 15 elementos apresenta a seguinte composio:
Homem Mulher
Menores 5 3
Adultos 5 2
Um elemento escolhido ao acaso. Pergunta-se:
a. Qual a probabilidade de ser homem?
b. Qual a probabilidade de ser adulto?
c. Qual a probabilidade de ser mulher e menor?
d. Sabendo-se que o elemento escolhido adulto, qual a probabilidade de ser
homem?
e. Dado que a escolhida mulher, qual a probabilidade de ser menor/
112
30) Suponha que um fabricante de sorvete recebe 20% de todo o leite que utiliza de
uma fazenda
1
.
, 30% de uma outra fazenda
2
.
e 50% de

.
. Um rgo de
fiscalizao inspecionou as fazendas de surpresa, e observou que 20% do leite
produzido por
2
.
estava adulterado por adio de gua, enquanto que para
2
.
e

.
, essa proporo era de 5% e 2%, respectivamente. Na indstria de sorvetes os
gales de leite so armazenados em um refrigerador sem identificao das
fazendas. Para um galo escolhido ao acaso, calcule:
a) a probabilidade de que o leite tenha sido produzida pela fazenda
1
.
b) a probabilidade de que o leite tenha sido produzida pela fazenda
2
.
c) a probabilidade de que o leite tenha sido produzida pela fazenda
.
31) Uma companhia que fura poos artesianos trabalha numa regio escolhendo
aleatoriamente o ponto de furo. No encontrando gua nessa tentativa, sorteia outro
local e, caso tambm no tenha sucesso, faz uma terceira e ltima tentativa. Admita
probabilidade de 0,7 de encontrar gua em qualquer ponto dessa regio. Calcule a
probabilidade de:
a) encontrar gua na segunda tentativa.
b) encontrar gua em at duas tentativas
encontrar gua.
113
Distribui,es de "robabilidade
Earivel Aleat1ria
Definio:
Sejam E um experimento e S o espao amostral associado ao experimento.
Uma funo X, que associe a cada elemento S s um nmero real
( ) s X

denominada varivel aleatria.
Veja a ilustrao
Exemplo:
E: Lanamento de duas moedas;
J: Nmero de caras obtidas nas duas moedas;
( ) ( ) ( ) ( ) { } k , k , c , k , k , c , c , c S
, onde c= cara e k= coroa;
A varivel aleatria J pode assumir os valores 0, 1 e 2.
Outros exemplos de variveis aleatrias:
2. X: nmero de acidentes com avies de uma determinada companhia;
3. X: nmero de mulheres entre 10 empregados recm-admitidos;
4. X: nmero de peas produzidas por uma empresa em determinado dia;
5. X: altura de um adulto do sexo masculino selecionado aleatoriamente.
114
Definies:
Uma varivel aleat1ria discreta admite um nmero finito de valores ou um nmero
infinito enumervel de valores.
Exemplo:
a. O nmero de espectadores que vem um filme.
b. Nmero de peas produzidas em um dia.
Uma varivel aleat1ria contnua admite um nmero infinito de valores, e esses
valores podem ser associados a mensuraes em uma escala contnua.
Exemplo:
a) A voltagem em uma pilha.
b) Quantidade de leite em um copo.
Distribuio de Probabilidade
Dada uma varivel aleatria discreta, podemos identificar:
1) Quais os possveis resultados podem ocorrer;
2) Qual a probabilidade de cada resultado ocorrer.
Por exemplo: No lanamento de duas moedas no viciadas, o nmero de caras
possveis e suas probabilidades dada por:
115
Tabela: Distribuio de probabilidade do n
de caras no lanamento de duas moedas
N de caras
x
Probabilidad
e
0 1/4
1 2/4
2 1/4
Total 1
Assim, defini#os:
A Distribuio de probabilidade de uma varivel aleatria X a descrio do
conjunto de probabilidades associadas aos possveis resultados de X. Podemos
tambm cham-la de funo de probabilidade.
Simbolicamente temos:
... , 2 , 1 " # " # i "om x / $ x ,
i i
No caso do exemplo anterior temos:
4
1
0 2 / 1 $ 0 2 1 ,
4
2
0 1 / 1 $ 0 1 1 ,
4
1
0 0 / 1 $ 0 0 1 ,



O grfico da distribuio de probabilidade dada por:
116
Grfico: Distribuio de probabilidade do nmero
de caras no lanamento de duas moedas
A funo de probabilidade deve satisfazer s seguintes propriedades:
1)
0 " #
i
x ,
;
2)
1 " #

i
i
x ,
.
'uno de distribuio acu#ulada
Podemos tambm representar uma distribuio de probabilidade por sua
funo de distribuio acumulada definida por:
x x / $ x . ", # " #
onde o conjunto dos nmeros naturais.
Obs.: A distribuio acumulada descreve a probabilidade de ocorrer um valor at x.
Exemplo: No lanamento de duas moedas no viciadas, a distribuio acumulada do
nmero de caras possveis dada por:
( )

'

<
<

x 2 s' 1
2 x 1 s'
4
3
1 x 0 s'
4
1
x .
117
Tabela: Distribuio de probabilidade acumulada do n
de caras no lanamento de duas moedas
Valores
possveis
x
Distribuio acumulada
0 1/4
1 3/4
2 4/4
O grfico da distribuio acumulada da varivel X = nmero de caras em dois
lanamentos :
Grfico: Distribuio de probabilidade do nmero
de caras no lanamento de duas moedas
Ealor es"erado
A mdia ou valor esperado de uma varivel aleatria X dado por:


k
1 i
i i
0 x 1 , . x 0 / 1 !
EariFncia
A varincia de uma varivel aleatria X dada por:
2 2
" # " # / ! / 2+r
118
Exemplo: No lanamento de duas moedas no viciadas, a mdia e a varincia so
dadas por:
Valores possveis
x
Probabilidade
p(x)
( )
i i
x , x ( )
i
2
i
x , x
0 1/4 0 0
1 2/4 2/4 2/4
2 1/4 2/4 1
Total 1 1 1,5
Assim


k
1 i
i i
1 0 x 1 , . x
5 , 0 1 5 , 1 0 / 1 ! 0 / 1 2+r
2 2

Exerccios
1) Num lote de 12 peas, 4 so defeituosas. Duas peas so retiradas
aleatoriamente sem reposio. Resolva:
a) Encontre a distribuio de probabilidade associada a varivel aleatria
X = nmero de peas defeituosas.
b) Faa o grfico do resultado obtido na letra a.
c) Encontre a distribuio acumulada de X.
d) Faa o grfico do resultado obtido na letra c
e) Encontre a mdia de peas defeituosas, ou seja, a mdia de X.
f) Encontre a varincia do nmero de peas defeituosas, ou seja, a varincia de X.
2) Considere o lanamento de um dado honesto. Encontre a distribuio de
probabilidade associada ao resultado da face deste dado.
3) Suponha
( )
5
x
x $
(onde x assume valores 0, 1, 2, 3).
( ) x $
Define uma
distribuio de probabilidade?
4) Suponha
( )
3
x
x $
(onde x assume valores 0, 1, 2).
( ) x $
Define uma
distribuio de probabilidade?
5) Suponha
( )
( ) [ ] ! x ! x 3 4
3
x $

(onde x assume valores 0, 1, 2, 3).


( ) x $
Define
uma distribuio de probabilidade?
119
6) O peso de um livro escolhido aleatoriamente uma varivel aleatria discreta ou
contnua?
7) O custo de uma pea escolhida aleatoriamente uma varivel aleatria discreta
ou contnua?
8) Suponha que a varivel aleatria discreta x possa tomar os valores 1, 2, 3, ..., n e
que esses valores sejam igualmente provveis. Mostre que
( )
2
1 n +
e
( )
12
1 n
2
2


Pricipais propriedades:
Considere c constante e X e Y variveis aleatrias.
Mdia Varincia
E(c) = c V(c) = 0
E(X+c) = E(X) + c V(X + c) = V(X)
E(cX) = c E(X) V(cX) = c
2
V(X)
E(X+Y) = E(X) + E(Y) DP(cX) = |c| DP(X)
E(X-Y) = E(X) - E(Y)
120
Princi"ais Distribui,es discretas
) Distribuio Binomial
Premissas assumidas pelo modelo binomial:
a) n provas independentes e do mesmo tipo so realizadas;
b) cada prova admite apenas dois resultados: sucesso e falha;
c) a probabilidade de sucesso em cada prova
, 3 s*"'sso 4 $
constante em todo
o experimento. Neste caso consideramos amostragem aleatria com reposio.
A probabilidade da varivel X assumir certo valor x, pertencente ao conjunto {0, 1,
2, ...} dada por
x n x
0 , 1 .1 , .
x
n
0 x 1 ,

,
_

Onde
, . n 0 / 1 !
e
0 , 1 .1 , . n 0 / 1 2+r
.
Exerccios:
1) Num lote de 12 peas, 4 so defeituosas; duas peas so retiradas
aleatoriamente e com reposio. Calcule:
a) Qual a probabilidade de ambas serem defeituosas?
b) Qual a probabilidade de apenas uma ser defeituosa?
Soluo:
a) Usando probabilidade (regra da multiplicao) temos
( )
9
1
12
4
12
4
A $
.
Resolvendo usando a distribuio binomial temos:
Seja A: uma pea ser defeituosa. Ento
( )
12
4
, A $
. Assim a probabilidade de
retirar duas peas defeituosas :
9
1
144
16
0
12
8
.1
12
4
.
2
4
0
12
4
1 .1
12
4
.
2
2
0 2 1 ,
0
2
2 2
2

,
_

,
_


,
_

,
_


b) Exerccio
2) Dados histricos mostram que 5% dos itens provindos de um fornecedor
apresentam algum tipo de defeito. Considerando um lote de 20 itens, calcule a
probabilidade de (com reposio):
121
a) haver algum item com defeito;
b) haver exatamente dois itens defeituosos;
c) haver mais de dois itens defeituosos;
d) qual o nmero esperado de itens defeituosos?
e) e de itens bons?
3) Se 7% das lmpadas de certa marca so defeituosas, achar a probabilidade de
que, numa amostra de 100 lmpadas, escolhidas ao acaso e com reposio,
tenhamos trs defeituosas.
) Distribuio geomtrica
Se um caso satisfaz todas as condies de um experimento binomial, exceto
pelo fato de o nmero de provas no ser fixo, ento aplicamos a distribuio
geomtrica.
A distribuio geomtrica se aplica quando estamos interessados na probabilidade
de o primeiro sucesso ocorrer em determinada prova.
Para que o sucesso ocorra, por exemplo na sim+ x prova, deve-se ser precedido
por
1 x
fracassos, cuja probabilidade
( )
1 x
, 1

.

122
A distribuio chamada geomtrica porque seus valores sucessivos constituem
uma progresso geomtrica.
Considere um experimento E e uma varivel aleatria X com
probabilidade de sucesso p. Se X tem distribuio geomtrica, ento a
probabilidade de X obter sucesso na x-sima prova dada por
( ) ( ) , 3 , 2 , 1 x , 1 1 , x ,
1 x


Exerccios;
1) Num lote de 12 peas, 4 so defeituosas. Seleciona-se aleatoriamente 5 peas.
Qual a probabilidade de a primeira pea defeituosa ser a 3 pea escolhida?
Soluo: A probabilidade de uma pea ser defeituosa
( ) 3333 , 0
12
4
&'('i)o ,
Escolhida 5 peas, a probabilidade da primeira pea defeitosa ser a 3
( ) ( ) 1481 , 0 3333 , 0 1 3333 , 0 3 ,
2

2) A probabilidade de uma criana contrair uma doena contagiosa, qual est
exposta 0,70. Qual a probabilidade de a stima criana exposta doena ser a
primeira a contra-la?
123
) Distribuio hipergeomtrica
A distribuio hipergeomtrica utilizada quando temos uma amostragem
sem reposio de uma populao finita. Neste caso o experimento tambm admite
apenas dois resultados possveis, sucesso e fracasso.
Considere uma populao com N objetos do tipo A e r objetos do tipo B. Se
extrarmos n objetos sem reposio, ento a probabilidade de obter x objetos do tipo
A e n-x objetos do tipo B dada por
n ..., , 1 , 0 x "om
n
r N
x n
r
x
N
0 x 1 ,

,
_

,
_

,
_

Onde
, n / ! . " #
e
1 r N
n r N
0. , 1 .1 , . n 0 / 1 2+r
+
+

.
Exerccios:
1) Num lote de 12 peas, 4 so defeituosas; duas peas so retiradas
aleatoriamente e sem reposio. Calcule:
a) Qual a probabilidade de ambas serem defeituosas?
b) Qual a probabilidade de apenas uma ser defeituosa?
Soluo:
a) Consideremos peas boas sendo do tipo B e peas defeituosas tipo A. temos: N =
4, n = 2, r = 8 e x = 2. Assim
11
1
2
8 4
2 2
8
2
4
0 2 1 ,

,
_

,
_

,
_

Utilizando probabilidade temos:


( )
11
1
11
3
12
4
A $
.
2) Placas de vdeo so expedidas em lotes de 30 unidades. Antes que a remessa
seja aprovada, um inspetor escolhe aleatoriamente cinco placas do lote e as
inspeciona. Se nenhuma das placas inspecionadas for defeituosa, o lote aprovado.
Se uma ou mais forem defeituosas, todo o lote inspecionado. Supondo que haja
124
trs placas defeituosas no lote, qual a probabilidade de que o controle da
qualidade aponte para a inspeo total?
V) Distribuio de Poisson
Suponha que queremos avaliar o nmero de ocorrncia de um evento por unidade
de tempo, de comprimento, de rea, de volume, etc.
Exemplo:
a) nmero de consultas em uma base de dados por minuto;
b) nmero de erros de tipografia em um formulrio;
Se tivermos:
a) ndependncia entre as ocorrncias do evento e
b) Os eventos ocorrerem de forma aleatria,
Ento a probabilidade da varivel aleatria X assumir um determinado valor dada
por
... , 1 , 0 x "om
! x
. '
0 x 1 ,
x

Onde
0 / 1 2+r 0 / 1 !
.
Exerccios:
1) Suponha que as consultas num banco de dados ocorrem de forma independente
e aleatria, com uma taxa mdia de trs consultas por minuto. Qual a probabilidade
de que no prximo minuto ocorram:
a) nenhuma consulta?
b) uma consulta?
c) duas consultas?
d) menos do que trs consultas?
Soluo:
Seja

= taxa mdia = 3 consultas/min.


a) Queremos a probabilidade de no ter consulta no prximo minuto, ou seja,
x = 0. Assim
125
0498 , 0
1
1 0498 , 0
! 0
3 . '
0 0 1 ,
0 3

Portanto a probabilidade de, no prximo minuto, ter nenhuma consulta 0,0498.


b) Queremos a probabilidade de ter 1 consulta no prximo minuto, ou seja,
x = 1. Assim
1494 , 0
1
3 0498 , 0
! 1
3 . '
0 1 1 ,
1 3

Portanto a probabilidade de, no prximo minuto, ter nenhuma consulta 0,1494.


c) Queremos a probabilidade de ter 2 consulta no prximo minuto, ou seja,
x = 2. Assim
2241 , 0
2
9 0498 , 0
! 2
3 . '
0 1 1 ,
2 3

Portanto a probabilidade de, no prximo minuto, ter nenhuma consulta 0,2241.


d) Queremos
( ) ( ) ( ) 4233 , 0 2241 , 0 1494 , 0 0498 , 0 2 , 1 , 0 , + + + +
2) Suponha que as consultas num banco de dados ocorrem de forma independente
e aleatria, com uma taxa mdia de trs consultas por minuto. Qual a probabilidade
de que nos prximos dois minutos ocorram mais do que 5 consultas?
126
Distribui,es contnuas
Uma varivel aleatria X dita contnua quando ela assume qualquer valor
real dentro de um intervalo.
Exemplos:
1) Altura de uma pessoa;
2) Tempo de viagem;
3) Tempo de uma reao qumica;
4) Volume de leite em um copo; etc
Propriedades
Seja
" #x (
a funo densidade de probabilidade da varivel
contnua X. Ento
" #x (

deve satisfazer s seguintes propriedades:
1)
r'+l x x ( , 0 " #
2)
1 " #

+

&x x (
3) Se
5 b , + 6 A
, ento

b
+
&x 0 x 1 ( 0 A 1 $
.
Seja
" #x (
a funo densidade de probabilidade da varivel contnua X, ento
temos:
a)

+

&x x ( x / ! " # . " #
b)

+

&x x ( x / 2+r " # . " # " #
2 2

.
Uma curva de densidade o grfico de uma distribuio contnua
127
de probabilidade. Deve satisfazer as seguintes propriedades
1. A rea total sob a curva deve ser 1;
2. Todo ponto da curva deve ter uma altura vertical no inferior a 0.

128
) Distribuio Uniforme.
Uma varivel aleatria X tem distribuio uniforme quando todos os seus valores
possveis tem a mesma probabilidade.
A curva de densidade de X uma reta horizontal.
Uma varivel aleatria X tem distribuio uniforme de parmetros

com
>
se

'

$ , % , 0
$ , % ,
1
" #



x ,+r+
x ,+r+
x (
Neste caso
2
" #
+
/ !
e
12
" #
" #
2

/ 2+r .
Exemplos:
1) Suponha por exemplo o lanamento de um dado no viciado. Os valores
possveis so {1, 2, 3, 4, 5, 6}. Como todos os resultados so igualmente
possveis,1/6, ento temos uma distribuio uniforme.
A curva de densidade dada por
Grfico: Curva de densidade da probabilidade
de lanamento de um dado
129
2) Um profissional de computao observou que seu sistema gasta entre 20 e 24
segundos para realizar determinada tarefa, segundo uma distribuio uniforme em
[20, 24]. Sua curva de densidade dada por
Grfico: Curva de densidade da probabilidade
de um sistema
Exerccio:
Um profissional de computao observou que seu sistema gasta entre 20 e 24
segundos para realizar determinada tarefa. Considere a probabilidade uniforme em
[20, 24]. Resolva:
a) Encontre, graficamente, a funo densidade de probabilidade.
b)
" 2 # > / $
.
c)
" # / !
130
d)
" # / 2+r
.
) Distribuio Exponencial
Uma distribuio exponencial utilizada quando queremos modelar a varivel
aleatria contnua que representa:
a) Tempo at a prxima consulta a uma base de dados;
b) Tempo entre pedidos a um servidor;
c) Distncia entre defeitos de uma fita.
131
Sejam as variveis aleatrias:
)
/
= nmero de ocorrncias no intervalo de tempo [0, t]; e
7 = tempo entre as ocorrncias.
Sendo a taxa mdia de ocorrncias por unidade de tempo, ento, considerando
independncia entre as ocorrncias, 7 tem distribuio exponencial dada por:
)
' ) (
.
. " #

Onde

1
" # 7 !
e
2
1
" #

7 2+r
A curva de densidade da varivel T com distribuio exponencial dada por
A probabilidade
( )



b
+
) .
' . b 7 + $

.
Exerccios:
132
1) Seja a varivel aleatria T definida como o tempo de resposta na consulta a um
banco de dados, em minutos. Suponha que essa varivel tenha a seguinte funo
densidade de probabilidade:

'

<

0 , 0
0 , 2
" #
2
) ,+r+
) ,+r+ '
x (
)
Calcule:
a) A probabilidade de a resposta demorar mais do que 3 minutos?
b) Calcule
" 2 # 7 $
.
Soluo:
a)
( ) 0025 , 0 0025 , 0 0 ' ' ' &) ' . 2 3 7 $
3 . 2 . 2
3
) . 2
3
) . 2
+ +

.
b)
( )
0208 , 0
0183 , 0 0025 , 0 ' ' ' &) ' . 2 3 7 2 $
2 . 2 3 . 2 3
2
) . 2
3
2
) . 2

+ +

2) O tempo de vida (em horas) de um transistor uma varivel aleatria T com


distribuio exponencial. O tempo mdio de vida do transistor de 500 horas.
a) Faa a curva de densidade.
b) Calcule a probabilidade de o transistor durar mais do que 500 horas.
c) Calcule a probabilidade de o transistor durar entre 300 e 1000 horas.
133
) Distribuio Normal
Uma varivel aleatria X tem distribuio normal se seu histograma tem a
forma de um sino.
Definio
Dados os parmetros

e 0 > reais, a funo densidade de probabilidade


da normal dada por:
2
" #
2
1
.
2 .
1
" #

x
' x (
Onde " #/ !
e
" # / 2+r
.
Podemos perceber que o clculo de probabilidade usando a distribuio
normal muito difcil devido ao tipo de funo. Uma forma de contornarmos este
problema utilizar a distribuio normal padronizada.
A distribuio normal padronizada tem este nome pois sua mdia 0 e a
varincia um. Com isso os clculos ficam muito mais prticos pois podemos utilizar
as tabelas de probabilidade normal padronizada.
134
Vendas de auto peas
6
0
0
0
,
0
5
5
0
0
,
0
5
0
0
0
,
0
4
5
0
0
,
0
4
0
0
0
,
0
3
5
0
0
,
0
3
0
0
0
,
0
2
5
0
0
,
0
2
0
0
0
,
0
1
5
0
0
,
0
1
0
0
0
,
0
5
0
0
,
0
0
,
0
200
100
0
Std. Dev = 994,59
Mean = 2516,6
N= 1488,00
Uma conseqncia importante do fato de uma distribuio Normal ser
completamente caracterizada por sua mdia e desvio-padro que a rea sob a
curva entre um ponto qualquer e a mdia funo somente do nmero de desvios-
padres que o ponto est distante da mdia.
Como existem uma infinidade de distribuies normais (uma para cada mdia
e desvio-padro), transformamos a unidade estudada seja ela qual for (peso,
espessura, tempo, etc.) na unidade Z, que indica o nmero de desvios-padro a
contar da mdia.
Para padronizar um conjunto de dados que tem distribuio normal s
aplicar a frmula

/
8
Utilizao da tabela da normal padronizada
A tabela nos d a rea sobre o grfico, ou seja, a probabilidade.
Exemplo 1: A resistncia trao do papel usado em sacolas de super-mercado
uma caracterstica de qualidade importante.
Sabe-se que essa resistncia segue um modelo Normal com mdia 40 psi e
desvio padro 2 psi.
Se a especificao estabelece que a resistncia deve ser maior que 35 psi,
qual a probabilidade que uma sacola produzida com este material satisfaa a
especificao?
{ } { } 35 / $ 1 35 / $
{ } { } 5 , 2 9 $
2
40 35
9 $ 35 / $

'


Pela tabela da normal padronizada temos probabilidade de 0,0062.
Logo a resposta 1-0,0062 = 99,38%.
135
Exerccios
1) Utilizando a tabela da distribuio normal padronizada calcule:
a)
( ) 42 , 0 8 $ <
b)
( ) 75 , 0 8 $ <
c)
( ) 30 , 0 8 $ <
d)
( ) 56 , 0 8 $ >
e)
( ) 72 , 0 8 25 , 0 $ < <
f)
( ) 20 , 0 8 25 , 0 $ < <
g) o valor de z tal que
( ) 90 , 0 8 9 8 $ < <
.
Propriedades da distribuio normal
1) a curva simtrica em torno da mdia;
2)
( ) 0 x ( lim
x


3) a rea total sob a curva igual a 1;
r e a = 1
r e a = 0 , 5 r e a = 0 , 5
136
137
Comparao entre mdia e varincia
&
'
B
(
f#("
a) da distribuio A para B muda a tendncia central, mas a variabilidade
constante;
b) da distribuio A para C muda a variabilidade, mas a tendncia central
constante;
c) da distribuio B para C muda a tendncia central e a variabilidade.
138
Exerccios
1) Suponha que a absoro de gua(%) em certo tipo de piso cermico tenha
distribuio normal com mdia 2,5 e desvio-padro 0,6. Selecionando,
aleatoriamente, uma unidade desse piso, qual a probabilidade de ele acusar
absoro de gua entre 2% e 3,5%?
2) Uma fbrica de chocolates comercializa barras que pesam em mdia 200g. Os
pesos so normalmente distribudos. Sabe-se que o desvio padro igual a 40g.
Calcule a probabilidade de uma barra de chocolate, escolhida aleatoriamente, pesar
a) entre 200 e 250g;
b) mais de 230g;
c) menos que 150g.
139
-este de Hi"1tese
-este de Hi"1tese
Em Estatstica, uma hiptese uma afirmao sobre uma propriedade de
uma populao.
Podemos estar interessados em saber informaes sobre a mdia, a
proporo ou a varincia.
Co#"onentes de u# teste de 7i"1tese
1) Hiptese nula -
0
#
: uma afirmao sobre o valor de um parmetro
populacional. Deve conter o sinal de igualdade e deve escrever-se como
, ,
.
2) Hiptese alternativa -
1
#
: a afirmao que deve ser verdadeira se a
hiptese nula for falsa. No deve conter o sinal de igualdade.
Exemplos:
a) Testar a afirmao de que a mdia populacional 75.
Soluo: Neste caso temos
75 )
0
:
e
75 )
1
:
.
b) Testar a afirmao de que a mdia no mximo 2,50.
Soluo: Neste caso temos
50 , 2 )
0
:
e
75 )
1
> :
.
3) Erro tipo : Consiste em rejeitar a hiptese nula quando ela verdadeira.
0
:
verdadeira 0
:
falsa
Rejeita
0
: Erro tipo Acerto
No rejeita
0
: Acerto Erro tipo
4) Nvel de significncia -

: A probabilidade do erro tipo ocorrer.


5) Erro tipo : Consiste em no rejeitar a hiptese nula quando ela falsa.
6) A probabilidade de ocorrer o erro tipo

.
140
7) Estatstica de teste: uma estatstica amostral baseado nos dados amostrais.
8) Regio crtica: o conjunto de todos os valores da estatstica de teste que
levam rejeio da hiptese nula.
9) Valor Crtico: o valor, ou valores, que separa(m) a regio crtica dos valores
da estatstica de teste que no levam rejeio da hiptese nula.
Conclus,es no teste de 7i"1tese
Em um teste de hiptese conclumos por:
rejeitar a hiptese nula ou
no rejeitar a hiptese nula.
-i"os de teste
Bilateral (sinal de
1
#
: ): a regio crtica est situada nas duas regies.
Neste caso
( )
2

; )i,o !rro $
.
141
Unilateral esquerdo (sinal de
1
#
: <): a regio crtica est situada na parte
esquerda. Neste caso
( ) ; )i,o !rro $
.
Unilateral direito (sinal de
1
#
: >): a regio crtica est situada na parte
direita.
( ) ; )i,o !rro $
.
-este de u#a afir#ao sobre u#a #)dia* %randes a#ostras
142
Considere uma amostra razoavelmente grande ( 0 n ) para valer o teorema
central do limite, ou que os dados provenham de uma distribuio aproximadamente
normal. Para testarmos alguma informao com respeito mdia populacional
utilizamos a estatstica de teste dada por:

Estatstica de teste:
n
x
$
x

Caso

seja desconhecido podemos substitu-lo por


s
.
Os valores crticos so encontrados na Tabela A 2.
Exemplo:
O tempo mdio entre falhas de um rdio da Telektronic Companhy para
avies de pequeno porte 420 horas. Aps terem sido modificados 35 aparelhos de
rdio, em uma tentativa de melhorar sua confiabilidade, os testes acusaram um
tempo mdio de 385 horas para esta amostra, com desvio-padro de 24 horas. Ao
nvel de significncia de 0,05, teste a afirmao de que as modificaes melhoraram
a confiabilidade.
Soluo:
a) As hipteses so:

'

420 )
420 )
1
0

:
:
b) O teste bilateral, pois o sinal de
1
#
.
c) O nvel de significncia
05 , 0
;
d) Os valores crticos so
96 , 1 8
2
t

; Logo temos:
143
e) Os dados amostrais so: 85 x e 24 s ;
f) Como n=35 ( 0 n ), a estatstica de teste dada por:
6 , 8
5
24
420 85

n
x
8
x

g) Concluso: Como a estatstica de teste est na dentro da regio crtica, ento


rejeitamos
0
:
.
144
-este de u#a afir#ao sobre u#a #)dia* "e0uenas a#ostras
Considere uma amostra pequena ( 0 < n ) , que os dados provenham de uma
distribuio normal e que o desvio-padro populacional

desconhecido. Para
testarmos alguma informao com respeito mdia populacional utilizamos a
estatstica de teste dada por:

Estatstica de teste:
n
s
x
)
x

Os valores crticos so encontrados na Tabela A 3.


O nmero de Graus de liberdade = n 1.
Exemplo:
Os sete valores relacionados a seguir so cargas axiais (em libras) da
primeira amostra de sete latas de alumnio de 12oz. A carga axial de uma lata o
peso mximo que seus lados podem suportar, e deve ser superior a 165 libras,
porque esta a presso mxima aplicada quando se fixa a tampa no lugar. Ao nvel
de significncia de 0,01, teste a afirmao do engenheiro supervisor de que esta
amostra provm de uma populao com mdia superior a 165 libras.
270 273 258 204 254 228 282
Soluo:
a) As hipteses so:

'

>

165 )
165 )
1
0

:
:
b) O teste unilateral direito, pois o sinal de
1
#
>;
c) O nvel de significncia
01 , 0
;
d) O valor do grau de liberdade de 7-1 = 6. Logo o valor crtico
14 ,

)
;
Logo temos:
145
e) Os dados amostrais so:
7 , 252 x
e
6 , 27 s
;
Como n = 7 ( 0 < n ), a estatstica de teste dada por:
407 , 8
7
6 , 27
165 7 , 252

n
s
x
)
x

f) Concluso: Como a estatstica de teste est na dentro da regio crtica, ento


rejeitamos
0
:
.
-este de u#a afir#ao sobre variFncia ou desvio/"adro
Ao testar uma hiptese sobre o desvio-padro

ou a varincia
2
de uma
populao, admitimos que os valores da populao sejam distribudos normalmente.
Para testar uma informao sobre desvio-padro

ou a varincia
2
a
estatstica de teste dada por:

146
Estatstica de teste:
( )
2
2
2
1

s n
,
onde
n = tamanho da amostra
2
s = varincia amostral
2
= varincia populacional
Os valores crticos so encontrados na Tabela A 4.
O nmero de Graus de liberdade = n 1.
Exemplo:
O tempo para transmitir 10 MB em determinada rede de computadores varia
segundo um modelo normal, com mdia 7,4 segundos e varincia 1,3 segundos.
Depois de algumas mudanas na rede, acredita-se numa reduo no tempo de
transmisso de dados, Alm de uma possvel mudana na variabilidade. Foram
realizados 10 ensaios independentes com um arquivo de 10 MB e foram coletados
os tempos de transmisso, em segundos:
6,8 7,1 5,9 7,5 6,3 6,9 7,2 7,3 6,6 6,3
Resolva:
147
a) Existe evidncia suficiente de que as mudanas na rede de computadores
alteraram a variabilidade no tempo de transmisso de dados? Ao nvel de
0,05.
b) Existe evidncia suficiente de que as mudanas na rede de computadores
alteraram o tempo mdio de transmisso de dados? Ao nvel de 0,05
Soluo da letra a:
a) As hipteses so:

'

, 1 )
, 1 )
2
2
0
1

:
:
b) O teste bilateral direito, pois o sinal de
1
#
;
c) O nvel de significncia
05 , 0
;
d) O valor do grau de liberdade de 10-1 = 9. Logo os valores crticos so
700 , 2
2

e
02 , 1!
2

; Logo temos:
e) Os dados amostrais indicam:
04 , 0 s
;
f) a estatstica de teste dada por:
10 , 2
, 1
04 , 0 " 1 10 #
2



148
g) Concluso: Como a estatstica de teste est na dentro da regio crtica, ento
rejeitamos
0
:
.
-ES-E DE HIPK-ESE PA.A P.P.LM
O teste para proporo aplicado em situaes nas quais queremos verificar
se a proporo de algum atributo na populao pode ser igual a certo valor
0
,
.
S5PSILNES:
1) So verificadas as condies para um experimento binomial. sto , temos um
nmero fixo de provas independentes com probabilidade constante, e cada
prova comporta dois resultados, que designamos "sucesso e "falha.
2) As condies
5 n,
e
5 n<
so ambas verificadas, de modo que a
distribuio binomial das propores amostrais pode ser aproximada por uma
distribuio normal com
n,
e
n,<
.
149
______________________________________________________________
N-ALM:
n
: nmero de provas;
,
: proporo populacional (usada na hiptese nula);
n
x
, * : proporo amostral;
, < 1
______________________________________________________________
ES-A-OS-ICA DE -ES-E*
n
,<
, ,
8

*
Os valores crticos so obtidos na tabela A 2 (distribuio normal
padronizada).
Exemplos:
1) Uma empresa retira periodicamente amostras aleatrias de 500 peas de sua
linha de produo para anlise da qualidade. As peas da amostra so
classificadas como defeituosas ou no, sendo que a poltica da empresa
exige que o processo produtivo seja revisto se houver evidncia de mais de
1,5% de peas defeituosas. Na ltima amostra, foram encontradas nove
peas defeituosas. Usando nvel de significncia de 1%, o processo precisa
ser revisto?
Soluo:
h) As hipteses so:

'

>

015 , 0 )
015 , 0 )
1
0
, :
, :
i) O teste unilateral direito, pois o sinal de
1
#
> .
j) O nvel de significncia
01 , 0
;
150
k) O valor crtico
, 2

8
; Logo temos:
l) Os dados amostrais so:
018 , 0
500
!
* ,
m) Critrios para a aproximao normal:
5 , 7 015 , 0 500 , n
e
5 , 4!2 !85 , 0 500 " 015 , 0 1 # 500 < n
n) Estatstica de teste dada por:
552 , 0
00546 , 0
00 , 0
500
!85 , 0 015 , 0
015 , 0 018 , 0 *

n
,<
, ,
8
o) Concluso: Como a estatstica de teste est fora da regio crtica, ento no
rejeitamos
0
:
.
2) Em um estudo da eficcia do air-bag em automveis, constatou-se que, em
821 colises de carros de tamanho mdio equipados com air-bag, 46 colises
resultaram em hospitalizao do motorista. Ao nvel de significncia de 0,01,
teste a afirmao de que a taxa de hospitalizao nos casos de air-bag
inferior taxa de 7,8% para colises de carros de tamanho mdio equipados
com cintos automticos de segurana.
151
Exerccios
()dia P6randes a#ostrasQ
1) O gerente de uma empresa de transporte suspeita da afirmao de um
vendedor de pneus de que o seu produto tem uma vida mdia de, ao menos,
28 000 milhas. Para verificar a afirmao, a firma instala 40 desses pneus em
seus caminhes, obtendo uma vida mdia de 27 563 milhas, com desvio-
padro de 1 348 milhas. Qual a concluso do gerente, se a probabilidade de
um erro tipo deve ser 0.01?
2) A vida mdia de uma amostra de 100 lmpadas de certa marca 1615 horas.
Por similaridade com outros processos de fabricao, supomos o desvio-
padro igual a 120 horas. Utilizando um nvel de significncia de 2 %, teste a
afirmao de que a durao mdia de todas as lmpadas dessa marca igual
a 1600 horas.
()dia PPe0uenas a#ostrasQ
1) Admitindo que a presso sangunea arterial em homens siga o modelo
Normal, 7 pacientes foram sorteados e tiveram sua presso medida obtendo
os seguintes resultados:
82 - 84 - 78 - 85 - 69 - 80 - 75
Utilizando um nvel de significncia de 0,02 , teste a afirmao de a mdia da
presso sangunea de 82.
2) O inspetor de qualidade da JF Construes mediu 25 barras de ao e obteve
as seguintes medidas em metros:
4,51 5,38 4,84 5,33 4,74 4,99 5,15 5,52 5,82 5,45
4,68 4,74 5,53 5,40 4,72 4,97 5,24 4,94 4,75 5,50
4,81 5,25 4,86 4,93 4,95
152
Pode-se afirmar, com com nvel de significncia de 5%, que tais barras foram
sacadas de um lote cujo comprimento mdio de 5,00 metros?
EariFncia
1) A cofap alega que a varincia da vida mdia de seus amortecedores de
nove meses. A Chevrolet ensaia 18 peas e encontra varincia de um ano
para a vida mdia das referidas peas. A 5% de significncia, isso lhe permite
refutar a alegao da Cofap?
2) Um laboratrio fez oito determinaes da quantidade de impurezas em
pores de certo composto. Os valores eram (em mg):
12,4 12,6 12,0 12,0 12,1 12,3 12,5 12,7
Teste a hiptese de que o desvio-padro 1, ao nvel se significncia de 0,05.
Usurios de uma rede de transmisso de energia eltrica tm reclamado da alta
variao na tenso. A empresa encarregada da transmisso de energia eltrica
instalou novos transformadores. O desvio-padro calculado sobre 30 observaes
independentes foi de 8V e a distribuio de frequncias dos valores da amostra
sugere uma distribuio normal. A um nvel de 5%, h evidncia de reduo na
variao da tenso, que segund
153
Correlao
Correlao
Com muita freqncia, na prtica, verifica-se que existe uma relao entre
duas (ou mais) variveis. Por exemplo: os pesos dos adultos do sexo masculino
dependem, em certo grau, de suas alturas; as circunferncias de crculos dependem
de seus raios; a presso de uma determinada massa de gs depende de sua
temperatura e de seu volume.
Pesquisadores tm estudado os ursos, anestesiando-os a fim de obterem
medidas vitais como idade, sexo, comprimento e peso. Como os ursos, em sua
maioria, so bastante pesados e difceis de serem levantados, os pesquisadores
tm considervel dificuldade em pesar um urso na selva. Baseado nisso
levantamos a seguinte pergunta:
Ser possvel determinarmos o peso de um urso a partir de seu comprimento?
A tabela a seguir apresenta 8 dados (comprimento e peso) de ursos machos.
No decorrer da exposio nosso objetivo utilizar os dados da tabela acima para
responder aa pergunta inicial.
Tabela 1
Comprimento: X (in) Peso: Y (lb)
53,0 80
67,5 344
72,0 416
72,0 348
73,5 262
68,5 360
73,0 332
37,0 34
Dado duas variveis X e Y, ou mais, nosso objetivo verificar se existe
relao entre elas. Por exemplo: Os conjuntos X = {1, 2, 3, 4, 5} e Y = {3, 5, 7, 9, 11}
so tais que Y = 2X+1. Portanto dizemos que as variveis X e Y so
correlacionadas.
Encontrar uma relao entre variveis de fundamental importncia para
podermos predizer valores futuros. Por exemplo: se soubermos que duas variveis
154
se relacionam por Y = 2X 4, ento os valores de Y so encontrado apenas
atribuindo valores a X.
Vamos aqui estudar variveis que se relacionam linearmente. No final deste
estudo daremos um exemplo de variveis que no se relacionam linearmente e sim
de forma quadrtica.
Definio: Existe uma correlao entre duas variveis quando uma delas est, de
alguma forma, relacionada com a outra.
Como estamos interessados em variveis que se relacionam linearmente,
ento estas relaes so descritas por uma equao de uma reta, ou seja, equaes
do tipo Y = a
0
+ a
1
X.
Como no podemos basear nossas concluses apenas em diagramas,
necessitamos de mtodos mais precisos e objetivos para tirarmos concluses.
Vamos utilizar o coeficiente de correlao linear. Ele tambm conhecido como
coeficiente de correlao de Pearson (Karl Pearson).
Definio: O coeficiente de correlao linear r mede o grau de relacionamento
linear entre os valores emparelhados x e y em uma amostra.
Podemos encontrar o valor do coeficiente de correlao linear r atravs da
frmula:


2
) (
2
.
2
) (
2
) )( (
% % n x x n
% x x% n
r
Como r calculado com base em dados amostrais, uma estatstica amostral
usada para medir o grau da correlao linear entre x e y. Se tivssemos todos os
pares de valores (x, y) para a populao, a frmulas acima seria um parmetro
populacional.
Arredonda#ento do coeficiente de correlao linear
155
Arredondamos o coeficiente de correlao linear r para trs casas decimais,
afim de que seu valor possa ser comparado com os valores crticos da tabela A-6.
Os grficos de disperso a seguir descrevem alguns dos tipos de correlao
existentes.
Correlao linear "ositiva
0
5
10
15
20
25
30
0 5 10
X
Y
A correlao ser considerada positiva se valores crescentes de X estiverem
associados a valores crescentes de Y, ou valores decrescentes de X estiverem
associados a valores decrescentes de Y. Neste caso 0 < r < 1.
Correlao linear "erfeita "ositiva
0
10
20
30
0 5 10
J
R
A correlao linear ser considerada perfeita positiva se valores
crescentes de X estiverem perfeitamente alinhados a valores crescentes de Y, ou
valores decrescentes de X estiverem perfeitamente alinhados a valores
decrescentes de Y. Neste caso r = 1.
Correlao Ne%ativa
156
0
5
10
15
20
25
30
0 2 4 6 8 10
X
Y
A correlao considerada negativa quando valores crescentes da varivel X
estiverem associados a valores decrescentes da varivel Y, ou valores decrescentes
de X estiverem associados a valores crescentes da varivel Y. Neste caso 1 < r <
0.
Correlao ne%ativa "erfeita
0
5
10
15
20
25
30
0 2 4 6 8 10
X
Y
A correlao linear ser considerada perfeita negativa se valores crescentes
de X estiverem perfeitamente alinhados a valores decrescentes de Y, ou valores
decrescentes de X estiverem perfeitamente alinhados a valores crescentes de Y.
Neste caso r = -1.
Correlao nula
0
5
10
15
20
25
30
0 5 10
X
Y
Quando no houver relao entre as variveis X e Y, ou seja, quando as
variaes de X e Y ocorrerem independentemente no existe correlao entre elas.
Neste caso r = 0.
157
Correlao no/linear
0
10
20
30
0 5 10
J
R
Quando no houver correlao linear entre as variveis X e Y pode
acontecer que haja outro tipo de correlao. Esta correlao pode ser quadrtica,
exponencial, logartmica, uma curva do 3. grau, etc.
Clculo do coeficiente de correlao "ara os dados da tabela C4
Para o clculo do coeficiente de correlao conveniente a construo de
tabelas ampliadas, onde, a partir dos valores de X e Y, so determinadas todas as
somas necessrias.
Comprimento:
X (in)
Peso:
Y (lb)
X
2
Y
2
XY
53 80 2809 6400 4240
67,5 344 4556,25 118336 23220
72 416 5184 173056 29952
72 348 5184 121104 25056
73,5 262 5402,25 68644 19257
68,5 360 4692,25 129600 24660
73 332 5329 110224 24236
37 34 1369 1156 1258
516,5 2176 34525,75 728520 151879
O valor de r dado por r 9 ?8S@>.
Inter"retao do valor de r
Se o valor de r est prximo de 0 (zero), conclumos que no h correlao
linear significativa entre X e Y, mas se r est prximo de 1 ou +1, conclumos pela
158
existncia de correlao linear significativa entre X e Y. Como o termo "prximo
vaga, temos que adotar um critrio de deciso. Adotaremos o critrio a seguir
Se o mdulo do valor calculado de r excede o valor na tabela de Valores
Crticos do Coeficiente de Correlao de Pearson, conclumos que h
correlao linear significativa. Em caso contrrio, no h evidncia
suficiente para apoiar a existncia de uma correlao linear significativa.
Para encontrar o valor crtico na tabela de Valores Crticos do Coeficiente de
Correlao de Pearson precisamos do nmero de pares (X, Y), representado pela
letra n, e do nvel de significncia , erro tipo 1, (que pode ser 0,05 ou 0,01). Neste
caso temos n = 8. Assim encontramos o valor crtico de 0,707 (para = 0,05) e valor
crtico de 0,834 (para = 0,01).
A interpretao dos valores crticos muito simples: Com oito pares de dados
e sem qualquer correlao linear entre X e Y, h uma chance de 5 % de que o valor
absoluto do coeficiente de correlao linear calculado r exceda 0,707. Com os
mesmos dados h uma chance de 1 % de que o valor absoluto do coeficiente de
correlao linear calculado r exceda 0,834.
Em nosso caso, como o valor calculado de r = 0,897 que maior que 0,707 e
0,834, ento conclumos que h correlao linear significativa entre X (comprimento
dos ursos) e Y (pesos dos ursos).
Pro"riedades do Coeficiente de Correlao Tinear r
1) O valor de r est sempre compreendido entre 1 e +1;
2) O valor de r no varia se todos os valores de qualquer uma das variveis so
convertidos para uma escala diferente;
3) O valor de r no afetado pela escolha de X ou Y;
4) O valor de r mede a intensidade, ou grau, de um relacionamento linear. No
serve para medir a intensidade de um relacionamento no-linear.
-este de 7i"1tese "ara deter#inar se 7 correlao
159
Podemos utilizar dois mtodos para verificar se duas variveis possuem
correlao linear entre elas. Utilizando a teoria do teste de hiptese vamos verificar
se h correlao entre as variveis X e Y de uma populao. Neste caso usaremos
o parmetro para representar a correlao entre duas variveis de uma populao.
Assim temos:
H
0
: = 0 (No h correlao linear entre as variveis X e Y)
H
1
: 0 (H correlao linear significativa entre as variveis X e Y)
Mtodo 1: A estatstica de teste t. Utilizamos a distribuio t de Student.
Estatstica de -este t "ara Correlao Tinear
2
2
1

n
r
r
t
Valores crticos:Utilizar Tabela A-3 com n 2 graus de liberdade.
Mtodo 2: Estatstica de Teste r. Usamos o valor calculado do Coeficiente de
Correlao Linear de Pearson r.
Estatstica de -este r "ara Correlao Tinear
Estatstica de Teste: r
Valores crticos: Tabela do Coeficiente de Correlao r de Peason.
Exemplo: Para os dados da Tabela 1 temos: r = 0,897 (calculado). Utilizando o teste
de hiptese teremos:
Mtodo 1: A estatstica de teste ser t 9 <8@>C. Os valores crticos so t = -2,447 e t
= 2,447 so obtidos na tabela A-3 com nvel de significncia 0,05. e 6 graus de
liberdade. Como o valor da estatstica de teste t = 4,971 est dentro da rea crtica,
ento rejeitamos H
0
. Logo h evidncias para apoiar a existncia de uma correlao
linear.
160
Mtodo 2: A estatstica de teste r = 0,897. Os valores crticos so r = - 0,707 e r =
0,707 com n = 8 e nvel de significncia 0,5. Como r est dentro da rea crtica,
ento rejeitamos H
0
. Logo h evidncias para apoiar a existncia de uma correlao
linear.
Rejeita
r
= 0
No
Rejeitar
= 0
Rejeitar
= 0
-1 r = -0,707 r = 0,707 1
Como sabemos que h correlao entre as variveis X e Y, basta agora
encontrar qual a correlao, ou seja, qual a equao que relaciona as duas
variveis. sto podemos facilmente encontrar usando a .e%resso Tinear.
161
.e%resso Tinear
Definio: Dada uma coleo de dados amostrais emparelhados (X, Y), a equao
de regresso
x b b y
1 0
+
descreve a relao entre as duas variveis. O grfico da equao de regresso
chamado reta de regresso. (ou reta de melhor ajuste, ou reta de mnimos
quadrados)
Esta definio expressa uma relao entre x (chamada varivel independente
ou varivel preditora) e
y
(chamada varivel dependente ou varivel resposta).
Temos que b
0
o intercepto y e b
1
o coeficiente angular.
Suposies:
1) Estamos investigando apenas relaes lineares.
2) Para cada x, y uma varivel aleatria com distribuio normal. Todas essas
distribuies de y tm a mesma varincia e, ainda, para um dado valor de x, a
mdia da distribuio dos valores de y est sobre a reta de regresso.
Frmulas:
Estimamos os valores b
0
e b
1
pelas frmulas a seguir.
2 2
1
2 2
2
0
) x ( ) x ( n
) y )( x ( ) xy ( n
b
) x ( ) x ( n
) xy )( x ( ) x )( y (
b



Arredonda#entos
Clculos intermedirios arredondar para seis casas decimais. Arredondar o
resultado final para uma casa decimal a mais que os dados.
162
Voltando ao problema proposto, Tabela 1, vamos calcular a reta de regresso
entre as variveis X e Y.
Temos que b
0
= - 351,66 e b
1
= 9,66. Assim y = -351,66 + 9,66 x . Esta
relao nos diz que o peso de um urso dado como 9,66 vezes o valor do
comprimento do urso menos 351,66.
As equaes de regresso podem ser teis quando usadas para predizer o
valor de uma varivel, dado um valor determinado da outra varivel. Ao predizer um
valor de y com base em determinado valor de x:
1) Se no h correlao linear significativa, o melhor valor predito de y a mdia
de y;
2) Se h correlao linear significativa, obtm-se o melhor valor predito de y
substituindo-se o valor de x na equao de regresso.
Por exemplo, se queremos saber qual o peso de um urso de 80 in de
comprimento teremos: y = - 351,66 + 9,66. 80 = 421,14 lb.
163
.e%resso ($lti"la
_______________________________________________________________
Definio:
Uma equao de regresso mltipla expressa um relacionamento linear entre
uma varivel dependente
=
e duas ou mais variveis independentes
( )
k
x x x , , ,
2 1

.
_______________________________________________________________
Notao:
+ + + + +
k k
x b x b x b b =
2 2 1 1 0
*
: frmula geral da equao de regresso mltipla
estimada;
n
: tamanho da amostra;
k : nmero de variveis independentes;
=*
: valor predito da varivel dependente;
k
x x x , , ,
2 1

: variveis independentes;
0

: intercepto;
0
b : estimativa de
0

;
k
, , ,
2 1
: coeficientes das variveis independentes
k
x x x , , ,
2 1

;
k
b b b , , ,
2 1
: estimativas de
k
, , ,
2 1

.

: erro
Exemplos:
Os dados seguintes se referem ao mercado brasileiro de tratores e
colheitadeiras. Baseados neles, determine a equao de regresso mltipla da
produo em funo das vendas internas e das exportaes.
164
Ano 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Produo 22,20 22,08 32,18 51,33 28,34 22,19 31,66 33,41 28,22 35,43
Vendas
internas
18,94 16,84 27,41 46,69 22,74 13,97 21,47 24,85 24,70 31,06
Exportaes 4,22 5,82 4,48 5,03 5,26 8,36 10,06 8,86 4,21 5,27
Soluo: Sada do Excel 97. (Ferramentas anlise de dados - regresso)
.ES5( DS .ES5T-ADS
&stat'sti(a de re)resso
R mltiplo 0,998739179
R-Quadrado 0,997479948
R-quadrado
ajustado
0,996759933
Erro padro 0,498084785
Observaes 10
ANOVA
)l S* M* + + de si)nifi(ao
Regresso 2 687,3836208 343,6918104 1385,359963 8,03403E-10
Resduo 7 1,736619173 0,248088453
Total 9 689,12024
,oefi(ientes &rro padro Stat t -alor."
nterseo -0,899860129 0,811205051 -1,109288124 0,303955593
Varivel X 1 1,002741039 0,019093396 52,51768884 2,378E-10
Varivel X 2 1,083108449 0,082237436 13,17050357 3,39691E-06
RESULTADOS DE RESDUOS
/ser-ao 0 pre-isto 1es'duos
1 22,6627728 -0,462772798
2 22,28999013 -0,209990135
3 31,43759759 0,742402407
4 51,36615447 -0,036154466
5 27,59962153 0,740378468
6 22,16321881 0,026781186
7 31,52506097 0,134939033
8 33,61459554 -0,204595539
9 28,4277301 -0,207730097
10 35,95325806 -0,523258059
165
nterpretaes:
Na primeira tabela:
o valor de R-quadrado igual a 0,997 indica que, na amostra observada, cerca
de 99,7% da variao da produo pode ser explicada por uma relao linear
que envolve as vendas internas e as exportaes.
o valor de R-quadrado ajustado igual a 0,997 o coeficiente mltiplo de
determinao, R-quadrado, modificado de modo a levar em conta o nmero
de variveis e o tamanho da amostra..
Na segunda tabela, o valor de F de significao = 8,034E-10, extremamente
pequeno, mostra que no teste de hiptese rejeitamos a hiptese nula,
0 )
1 0 0

k
:
.
Na terceira tabela temos as estimativas dos coeficientes do modelo. Neste caso o
modelo :
s !x,or)+>?' 2'n&+s = + + 08 , 1 00 , 1 !00 , 0 *
166