Você está na página 1de 193

1

Estatstica
Bsica para
Engenharia
Silvio Alves de Souza


2
NDICE

Introduo ...................................................................................................................4
Software R ..................................................................................................................5
Software SPSS............................................................................................................6
Conceitos Bsicos de Estatstica ................................................................................7
Populao................................................................................................................9
Amostra .................................................................................................................10
Arredondamento de nmeros ................................................................................10
Proporo ..............................................................................................................14
Porcentagem.........................................................................................................15
Exerccios ..............................................................................................................16
Fases do Mtodo Estatstico.....................................................................................20
Definio do Problema ..........................................................................................20
Planejamento.........................................................................................................20
Coleta dos Dados ..................................................................................................21
Apurao dos Dados .............................................................................................23
Apresentao dos Dados.......................................................................................23
Anlise e Interpretao dos Dados........................................................................24
Questionrios ............................................................................................................25
Ordem das Questes.............................................................................................26
Tipo de Abordagem...............................................................................................26
Clareza nas Perguntas ..........................................................................................26
No Sugerir Respostas..........................................................................................27
A Necessidade do Pr-Teste.................................................................................27
A Prtica de Pesquisas por Amostragem..............................................................27
Amostragem..............................................................................................................28
Amostragem Aleatria Simples..............................................................................29
Amostragem Estratificada......................................................................................31
Amostragem Sistemtica.......................................................................................34
Exerccios ..............................................................................................................35
Distribuio de Freqncia........................................................................................41
Dados Brutos.........................................................................................................41
Rol .........................................................................................................................41
Tabela de freqncia.............................................................................................42
Distribuio de Freqncias de Dados Tabulados No-Agrupados em Classes42
Distribuio de Freqncias de Dados Agrupados em Classes.........................43
Manual para Normalizao de Publicaes Tcnico cientificas..........................49
Exerccios ..............................................................................................................50
Medidas de Tendncia Central. ................................................................................56
Dados brutos .........................................................................................................56
Dados em tabela de distribuio de freqncia.....................................................60
Exerccios ..............................................................................................................67
Separatrizes ..............................................................................................................69
3
Dados brutos ou em tabela de distribuio simples...............................................69
Dados agrupados em classes................................................................................71
Exerccios: .............................................................................................................73
Medidas de Variabilidade..........................................................................................76
Desvio padro........................................................................................................77
Coeficiente de variao: ........................................................................................79
Exerccios ..............................................................................................................82
Representao Grfica .............................................................................................89
Exerccios ............................................................................................................100
Probabilidade ..........................................................................................................101
Tcnicas de contagem.........................................................................................101
Clculo de Probabilidade.....................................................................................105
Exerccios: ...........................................................................................................118
Distribuies de probabilidade ................................................................................126
Varivel Aleatria.................................................................................................126
Distribuies discretas de probabilidade..............................................................133
Distribuies contnuas de probabilidade ............................................................140
Teste de Hiptese...................................................................................................152
Distribuio Amostral ..............................................................................................166
Correlao...............................................................................................................170
Regresso Linear ....................................................................................................177
Regresso Mltipla..................................................................................................184
Bibliografia ..............................................................................................................188
Anexo 1...................................................................................................................189
Anexo 2...................................................................................................................191
4

Introduo

Esta apostila uma tentativa de compor todo o contedo da disciplina
Estatstica do CEFET MG. Esta disciplina ministrada nos vrios cursos de
Engenharia e Bacharelados.
Seu contedo de acordo com o plano de ensino dos cursos citados acima.
Na verdade um material complementar para os alunos. Ele no os isenta da
necessidade de consultar outras bibliografias.
A disciplina de Estatstica abordada com o auxlio de vrios softwares para
tratamento de dados, entre eles o R e o SPSS.
Em anexo esto todas as tabelas utilizadas no decorrer do curso.
Os exemplos e exerccios foram montados com o objetivo de contextualizar o
contedo dentro dos vrios cursos. No buscamos priorizar nenhum desses cursos
para que o aluno possa perceber a utilizao da Estatstica em cada rea do
conhecimento.
A construo do conhecimento foi elaborada de acordo com os passos de
uma pesquisa, salvo casos em que o contedo requer outros elementos essenciais
para seu entendimento.

5
Software R

O software R um software livre utilizado para anlise de dados, clculo e
construo de grficos.
Sua construo foi feita utilizando vrios colaboradores.
Para sua utilizao necessrio conhecimento de sua linguagem prpria, ou
seja, seus comandos. Algumas tarefas podem facilmente serem realizadas apenas
utilizando seus comandos e outras so necessrias a construo de algoritmos.
O R tem um help que os ajuda na execuo das tarefas.
No decorrer do curso iremos utiliz-lo para anlise de vrios dados e para a
construo de alguns grficos especficos. Os comandos necessrios bem como a
utilizao do software sero apresentados no decorrer das aulas.
A utilizao deste software uma tentativa de demonstrar como utilizar a
tecnologia computacional na anlise de dados.

Comandos bsicos

1) Criar vetor: para construir um vetor basta digitar a letra c e, entre parnteses
separados por vrgula, digitar os valores do vetor. Para visualisar o vetor
basta digitar seu nome na linha de comando.

Exemplo: Criar um vetor de nome x com os valores 2, 3, 6 e 13.
Soluo: x<- c(2,3,6,13)

No anexo 2 encontra-se alguns comandos teis.

6
Software SPSS

O software SPSS um software no-livre utilizado para anlise Estatstica em
geral.
Por no ser um software livre muitas pessoas preferem a utilizao do
software R. No entanto ele muito utilizado no meio empresarial.
Ao contrrio do R o SPSS bem simples de utilizar. Neste caso no
necessrio conhecimento dos comandos.
O SPSS tem um help que os ajuda na execuo das tarefas.
No decorrer do curso iremos utiliz-lo para anlise de vrios dados e para a
construo de alguns grficos especficos.
A utilizao deste software tambm uma tentativa de demonstrar como
utilizar a tecnologia computacional na anlise de dados.




7
Conceitos Bsicos de Estatstica


Estatsticas
Uma coleo de dados numricos ou qualitativos.

Estatstica

Ramo da cincia que se dedica a desenvolver metodologias para a coleta,
classificao, apresentao, anlise e interpretao de dados quantitativos e
qualitativos e a utilizao desses dados para a tomada de decises.

A Estatstica pode ser dividida em trs grandes reas:

Estatstica Descritiva
Probabilidade
Inferncia Estatstica

Estatstica Descritiva

Utiliza tcnicas com o objetivo de descrever, analisar e interpretar o conjunto
de dados.
utilizada na etapa inicial da anlise.

Probabilidade

Trabalha com a idia de incerteza.
Desenvolve e utiliza tcnicas capazes de calcular as chances de que algum
fenmeno acontea.

8
Inferncia Estatstica

Desenvolve e utiliza tcnicas capazes de fazer uma extrapolao dos
resultados, estimao de quantidades desconhecidas e testar hipteses a partir de
uma amostra.
Baseando-se na amostra podemos assim chegar a concluses sobre a
populao.
A figura a seguir nos d uma noo de como podemos trabalhar com os
dados:







Natureza dos dados

Dados Nominais: Trata-se de dados qualitativos ou descritivos, ou seja, que
descrevem uma qualidade ou uma descrio. Exemplos: solteiro ou casado,
certo ou errado, pea boa ou pea defeituosa, etc. Podem ser transformados
em dados numricos, como por exemplo: 1 solteiro e 2 casado.

Dados ordinais: Trata-se de dados numricos os quais podemos estabelecer
desigualdades. Como exemplo considere 1- alumnio e 2 diamante. Temos
que 2>1 (significa que o diamante mais resistente do que o alumnio).

Dados intervalares: Trata-se de dados numricos os quais podemos
estabelecer desigualdades e formar diferenas. Exemplo: Temperaturas.

Dados de razo: trata-se de dados numricos que podemos estabelecer
desigualdades, diferenas, formar multiplicao e diviso. Exemplos: peso,
altura, dinheiro, volume, dimetro, etc.

Populao Amostra
Estatstica Descritiva
Inferncia
9
Objetivo do Estudo da Estatstica

A utilizao da Estatstica cada vez mais acentuada em qualquer atividade
profissional da vida moderna. Nos seus mais diversificados ramos de atuao, as
pessoas esto freqentemente expostas Estatstica, utilizando-a com maior ou
menor intensidade. Isto se deve s mltiplas aplicaes que o mtodo estatstico
proporciona queles que dele necessitam.

Populao

Conjunto da totalidade dos indivduos sobre o qual de faz uma inferncia.

Em linguagem mais formal, a populao o conjunto constitudo por todos os
indivduos que apresentem pelo menos uma caracterstica comum, cujo
comportamento interessa analisar (inferir).
Essas caractersticas da populao so comumente chamadas de
parmetros, os quais so valores fixos e ordinariamente desconhecidos.

Exemplo:
Suponha que estamos interessados em realizar um estudo sobre a qualidade
das peas produzidas por uma empresa em determinado dia. Neste caso existe uma
observao para cada pea fabricada naquele dia. Podemos limitar a populao a
cada turno de trabalho da empresa, como por exemplo o 2 turno.

Observao:
importante ficar bem claro que uma populao estudada em termos das
caractersticas a serem estudadas. Assim, por exemplo, o dimetro de uma pea
constituem uma populao. Poderia haver uma populao correspondente ao
comprimento dessas mesmas peas.

10
Amostra

Um subconjunto, uma parte selecionada da totalidade de observaes
abrangidas pela populao, atravs da qual se faz um juzo ou inferncia sobre as
caractersticas da populao.

Exemplo:
Avaliao da qualidade das peas produzidas por uma determinada empresa.
Seleciona-se, dentre as peas produzidas em determinado dia, uma porcentagem
destas peas. Avalia-se as peas selecionadas.
A partir da amostra estabelecemos o que conveniente para a populao, ou
seja, fazemos uma inferncia sobre a populao.

Arredondamento de nmeros

Arredondamento por falta
Quando o primeiro dgito, aquele situado mais esquerda entre os que iro
ser eliminados, for igual ou menor que quatro, no dever ser alterado o dgito
anterior.


Nmero a arredondar


Arredondamento para

Nmero arredondado
12,489 Inteiros 12
20,733 Dcimos 20,7
35,992 Centsimos 35,99

Arredondamento por excesso

Quando o primeiro dgito, aquele situado mais esquerda entre os que iro
ser eliminados, for maior ou igual a cinco seguido por dgitos maiores que zero, o
dgito anterior ser acrescido de uma unidade.

11


Nmero a arredondar


Arredondamento para

Nmero arredondado
15,504 Inteiros 16
16,561 Dcimos 16,6
17,578 Centsimos 17,58

Arredondamento centrais

Quando o primeiro dgito, aquele situado mais esquerda dos que sero
eliminados for um cinco ou um cinco seguido somente de zeros, o ltimo dgito
anterior, se for par, no se altera, e se for mpar ser aumentado uma unidade.


Nmero a arredondar


Arredondamento para

Nmero arredondado
15,500 Inteiros 16
16,500 Inteiros 16
17,750 Dcimos 17,8
17,705 Centsimos 17,70

Arredondamento de Soma

Quando se trata de soma, deve-se arredondar primeiro o total, e
posteriormente as parcelas. H aqui dois casos a considerar:

a) Se a soma das parcelas da srie arredondada for superior ao total, deve-se
retornar srie original, arredondando-se, por falta, tantas parcelas quantas
forem as unidades excedentes. Sero escolhidas as parcelas anteriormente
arredondadas por excesso e cujas fraes desprezadas representem o menor
erro relativo.

12
Erro relativo
Dados dois nmeros diferentes de zero x e y com y x > >> > , o erro relativo
entre eles ser calculado pela expresso
x
y x
E
R

= == =

O arredondamento do erro feito de modo a poder identificar a ordem das
parcelas.

Exemplo: O quadro abaixo apresenta um modelo de arredondamento, para inteiro,
da soma total de uma srie.

Srie original Erro relativo Srie arredondada Srie corrigida
5,51 0,082 6 6
7,50 0,062 8 8
14,63 0,025 15 15
20,10 20 20
24,73 0,011 25 24 *
27,52 0,017 28 27 *
Total : 99,99 102 100

Observaes: 1. (*) srie corrigida
2. O arredondamento do erro foi milesimal para poder identificar as
duas menores parcelas.

Veja o clculo dos erros relativos

082 , 0
6
51 , 5 6
=

=
R
E
062 , 0
8
50 , 7 8
=

=
R
E
025 , 0
15
63 , 14 15
=

=
R
E
13
011 , 0
25
73 , 24 25
=

=
R
E
017 , 0
28
52 , 27 28
=

=
R
E

b) Se a soma das parcelas da srie arredondada for inferior ao total, deve-se
retornar srie original, arredondando-se, por excesso, tantas parcelas
quantas forem as unidades em falta. Sero escolhidas as parcelas
anteriormente arredondadas por falta e cujas fraes desprezadas
representem o menor erro relativo.

Exemplo: O quadro abaixo apresenta um modelo de arredondamento, para
centsimo, da soma total de uma srie.

Srie original Erro relativo Srie arredondada Srie corrigida
2,514 0,0016 2,51 2,51
12,502 0,0002 12,50 12,50
4,6355 4,64 4,64
11,1028 0,0002 11,10 11,10
35,733 0,0001 35,73 35,74 *
7,524 0,0005 7,52 7,52
Total : 74,0113 74,00 74,01

Observao: (*) srie corrigida

14
Proporo

Um certo nmero de pessoas foi classificado em quatro categorias. Essas
categorias so, naturalmente, mutuamente exclusivas e exaustivas. Em outras
palavras: uma pessoa s poder estar includa em uma nica categoria, e todas elas
devero estar classificadas.
Em termos simblicos, pode-se escrever:

1
N = nmero de pessoas includas na categoria 1.
2
N = nmero de pessoas includas na categoria 2.
3
N = nmero de pessoas includas na categoria 3.
4
N = nmero de pessoas includas na categoria 4.
4 3 2 1
N N N N N + + + = = nmero total de pessoas consideradas.

Neste caso, a proporo de pessoas pertencentes primeira categoria
determinada mediante o clculo do seguinte quociente
N
N
1


A proporo de pessoas pertencentes segunda categoria determinada
mediante o clculo do seguinte quociente
N
N
2

Sucessivamente temos

N
N
3
e
N
N
4


o clculo da proporo das pessoas pertencentes terceira e quarta categoria.

Observe que

15
1
N
N
N
N
N
N
N
N
N
N
4 3 2 1
= = + + + .

Exemplo: A tabela a seguir apresenta o nmero de scios praticantes e no-
praticantes de futebol em um clube hipottico.

Tabela 1: Nmero de scios praticantes e no-praticantes
de futebol em um clube hipottico
Scios Praticante (exclusivamente) de: Clube 1 Proporo
Futebol de salo 580 0,100
Futebol de campo 430 0,074
No-Praticantes 4810 0,826
Total 5820 1,000
Fonte: Referncia bibliogrfica 1

Porcentagem

As porcentagens so obtidas a partir do clculo das propores, simplesmente
multiplicando-se o quociente obtido por 100. Para represent-las usamos o smbolo
%.

Voltando ao exemplo anterior temos:

Tabela 2: Nmero de scios praticantes e no-praticantes
de futebol em um clube hipottico
Scios Praticante (exclusivamente) de: Clube 1 Porcentagem (%)
Futebol de salo 580 10
Futebol de campo 430 7,4
No-Praticantes 4810 82,6
Total 5820 100
Fonte: Referncia bibliogrfica 1


16
Exerccios

1) Considere as situaes a seguir e identifique a populao e a amostra em cada
caso.

a. Para a anlise de desempenho dos alunos da 8. srie de uma determinada
escola municipal foram escolhidas as notas de portugus de 35 alunos.
b. Uma amostra de sangue foi retirada de um paciente com suspeita de alto
colesterol.
c. Uma maternidade entrevista 20 mes de recm nascidos dos 218 partos, no
ms de janeiro, para avaliar a satisfao na prestao de servio.
d. A fim de avaliar a inteno de voto dos eleitores para deputado estadual, um
candidato entrevista 2.120 eleitores em Minas Gerais.

2) Use os critrios de arredondamento para arredondar cada valor a seguir para
dcimos.

a) 21,24 d) 0,75 g) 3,521
b) 1,088 e) 5,819 h) 9,275
c) 125,5555 f) 0,3333 i) 235,25
3) Aplique os critrios de arredondamento para completar o quadro abaixo:

Nmero a arredondar Arredondamento para Nmero arredondado
25,458 Centsimo
123,99 Dcimo
205,7056 Milsimo
17,561 Inteiro

17
4) Aplique os critrios de arredondamento para completar o quadro abaixo:

Nmero a arredondar Arredondamento para Nmero arredondado
1,23 Dcimo
5,488 Centsimo
0,126 Centsimo
35,4 Inteiro
13,99 Dcimo
25,7056 Milsimo
7,561 Inteiro
690,1555 Centsimo
0,115588 Milsimo

5) A tabela abaixo representa a produo, em unidades, da fbrica X de
determinada pea no segundo semestre de 2005.

Ms Produo
Julho 35.500
Agosto 34.750
Setembro 36.800
Outubro 35.150
Novembro 32.300
Dezembro 31.250

Calcule: (Use arredondamento para centsimos)

a) a proporo de peas produzidas no ms de outubro.
b) a proporo de peas produzidas at setembro.
c) a porcentagem de peas produzidas em dezembro.

18
6) Uma escola ia contratar um grupo de 8 professores para dar um curso sobre
computadores em 48 horas, pagando um total de R$ 9 216,00. No entanto, como
medida de economia, ela resolveu contratar somente 6 professores e dar o curso em
36 horas. Quanto a escola economizar?

7) Joo comprou uma mercadoria em uma loja de utilidades. Quando foi pagar a
conta, o vendedor informou-lhe que devido a uma promoo relmpago, ele teria 8
% de desconto na compra vista pagando, pelo produto, R$ 276,00. Joo optou por
no pagar vista. Quanto ele pagar pela mercadoria se compra-la a prazo?

8) Para as situaes descritas a seguir, identifique a populao e a amostra
correspondente. Discuta a validade do processo de inferncia estatstica, ou seja, se
as amostras foram coletadas corretamente, para cada um dos casos. No esquea
de apontar o erro de cada caso.

a) Uma amostra de sangue foi retirada de um paciente com suspeita de
anemia.

b) Para verificar a audincia de um programa de TV, 563 indivduos foram
entrevistados por telefone com relao ao canal em que estavam
sintonizados.

c) A fim de avaliar a inteno de voto para presidente dos brasileiros, 122
pessoas foram entrevistadas em Braslia.

9) Para encher um reservatrio em 15 dias, so necessrias 3 torneiras. Em quanto
tempo 5 torneiras, idnticas s anteriores, enchero o mesmo reservatrio?

10) Um navio dispe de reservas suficientes para alimentar 14 homens durante 45
dias, mas recebe 4 sobreviventes de um naufrgio. Durante quantos dias duraro as
reservas de alimento?

19
11) Calcule:

a) 15 % de R$ 2 800,00 ?

b) 42 % de R$ 18 300,00 ?

12) Resolva os problemas abaixo:

a) Numa classe foram reprovados 15 % dos alunos, isto , 9 alunos. Quantos
alunos haviam nesta classe?

b) Em uma cidade haviam 5600 eleitores do candidato A e 7800 eleitores do
candidato B.

1) Qual a proporo dos eleitores do candidato A?

2) Qual a proporo dos eleitores do candidato B?

13) Em um colgio existem 1 200 alunos, dos quais 720 so meninos. Determine:

a) Qual a proporo do nmero de meninos?

b) Qual a proporo do nmero de meninas?

14) Num livro de 200 pginas, h 30 linhas em cada pgina. Se houvesse 25 linhas,
quantas pginas teria o livro?

20
Fases do Mtodo Estatstico

Quando se pretende empreender um estudo estatstico completo existem
diversas fases do trabalho que devem ser desenvolvidas para se chegar aos
resultados finais do estudo.

Definio do Problema

A primeira fase do trabalho estatstico consiste em uma definio ou
formulao correta do problema a ser estudado.
O problema deve ser preciso, bem determinado e especfico.
Alm de considerar detidamente o problema objeto do estudo, o analista
dever examinar outros levantamentos realizados no mesmo campo e anlogos,
uma vez que parte da informao de que necessita pode, muitas vezes, ser
encontrada nesses ltimos.
Saber exatamente aquilo que se pretende pesquisar o mesmo que definir
corretamente o problema.

Planejamento

Consiste em se determinar o procedimento necessrio para resolver o
problema e, em especial, como levantar informaes sobre o assunto objeto do
estudo.
Mais especialmente, na fase do planejamento a preocupao maior reside na
escolha das perguntas.
nessa fase que ser escolhido o tipo de levantamento a ser utilizado. Sob
esse aspecto, pode haver dois tipos de levantamento:
a) Levantamento censitrio, quando a contagem abranger todo o
universo.
b) Levantamento por amostragem, quando a contagem for parcial.

Nesta fase temos outros elementos importantes que devem ser tratados.

21
a) cronograma das atividades, atravs do qual so fixados os prazos
para as varias fases;
b) Os custos envolvidos;
c) O exame das informaes disponveis;
d) O delineamento da amostra;
e) A forma como sero escolhidos os dados, etc.

Obs: Os livros mais especficos sobre pesquisa de mercado podero ser
consultados.

Coleta dos Dados

O terceiro passo essencialmente operacional.
A coleta de dados se refere obteno, reunio e registro sistemtico de
dados, com um objetivo determinado.

Espcies de dados:

I) Dados Primrios: quando so publicados ou comunicados pela
prpria pessoa ou organizao que os haja recolhido.
II) Dados Secundrios: Quando so publicados ou comunicados por
outra organizao.

Um conjunto de dados , pois, primrio ou secundrio em relao a
algum.
mais seguro trabalhar com fontes primrias, pois:

a) Uma fonte primria oferece, em geral, informaes mais detalhadas
do que uma secundria.
b) mais provvel que as definies de termos e de unidades figurem
somente nas fontes primrias.
c) O uso da fonte secundria traz o risco adicional de erros de
transcrio.
22
d) Uma fonte primria poder vir acompanhada de cpias dos
impressos utilizados para coletar as informaes, juntamente com o
procedimento adotado na pesquisa, a metodologia seguida e o tipo
de tamanho da amostra.

Essas informaes proporcionam ao usurio uma idia do grau de garantia
que os dados oferecem.
A coleta de dados pode ser realizada de duas maneiras: direta ou
indiretamente.

Coleta Direta

A coleta direta quando obtida diretamente da fonte.

Ex.: Uma empresa pesquisa seus consumidores.

H trs tipos de coleta direta:

a) Coleta direta contnua: quando estes so obtidos ininterruptamente,
automaticamente e na vigncia de um determinado perodo.
Ex.: Registros de nascimento, de casamento, de bito, etc.

b) Coleta direta peridica: quando realizada em perodos curtos,
determinados, de tempo em tempo.
Ex: Recenseamento demogrfico. O censo industrial.

c) Coleta direta ocasional: Quando os dados forem colhidos
esporadicamente, atendendo a uma conjuntura qualquer ou a uma
emergncia.
Ex.: Casos fatais em surto epidmico.

23
Coleta Indireta

A coleta dos dados indireta quando inferida a partir dos elementos
conseguidos pela coleta direta, ou atravs do conhecimento de outros fenmenos
que, de algum modo, estejam relacionados com o fenmeno em questo.
feita, portando, por dedues e conjunturas, podendo ser realizada:
a) Por analogia: quando o conhecimento de um fenmeno induzido a
partir de outro que com ele guarda relaes de casualidade.
b) Por proporcionalizao: Quando o conhecimento de um fato se induz
das condies quantitativas de uma parte dele.
c) Por indcios: quando so escolhidos fenmenos sintomticos para
discutir um aspecto geral da vida social.
d) Por avaliao: quando atravs de informaes fidedignas ou
estimativas cadastrais, se presume o estado quantitativo de um
fenmeno.

Apurao dos Dados

Consiste em resumir os dados, atravs de sua contagem e agrupamento.
Ela pode ser manual, mecnica, eletromecnica ou eletrnica.
Atravs da apurao tem-se a oportunidade de condensar os dados, de modo
a obter um conjunto compacto de nmeros, o qual possibilita distinguir melhor o
comportamento do fenmeno na sua totalidade.
Entretanto, a contrapartida da melhor apreciao dos dados em seu conjunto
a perda correspondentes de detalhes, uma vez que se trata de um processo de
sintetizao.

Apresentao dos Dados

H duas formas de apresentao, que no se excluem mutuamente.

a) Apresentao Tabular: uma apresentao numrica dos dados.
Consiste em dispor os dados em linhas e colunas distribudas de
modo ordenado.
24
b) Apresentao Grfica: Constitui uma Apresentao Geomtrica.
Embora a apresentao tabular seja de extrema importncia, no
sentido de facilitar a anlise numrica dos dados, no permite ao
analista obter uma viso to rpida, fcil e clara do fenmeno e sua
variao como a conseguida atravs de um grfico.

Anlise e Interpretao dos Dados

a ltima fase e a mais importante e tambm a mais delicada.
O interesse maior, nesta etapa, reside em tirar concluses que auxiliem o
pesquisador a resolver seu problema.
A anlise est ligada essencialmente ao clculo de medidas, cuja finalidade
principal descrever o fenmeno.

Obs: As fases do mtodo Estatstico foram tiradas da referncia bibliogrfica 1.
25
Questionrios

Questionrios so o meio mais comum de coleta de informaes.
Dois tipos de questes so usualmente empregados na redao de
questionrios:
Questes de mltipla escolha

Questes de resposta aberta

As alternativas em uma questo de mltipla escolha devem ser claras,
mutuamente excludentes e, quando pedirem opinies, fornecer opes dos dois
lados do assunto. Idealmente, as opes devem cobrir todas as respostas provveis.
Se, entretanto, muitas alternativas so apresentadas, elas podem no ser
suficientemente claras e confundir o respondente no momento de sua deciso. A
grande desvantagem de questes de mltipla escolha que tendem a sugerir uma
resposta, j que limita as respostas possveis, impedindo o respondente de dizer
exatamente o que pensa.
Este tipo de limitao no ocorre nas questes de resposta aberta, em que o
entrevistado usa suas prprias palavras para responder pergunta. Uma pergunta
deste tipo produz uma grande gama de respostas que devem ser classificadas em
grupos homogneos antes que se possa fazer uma anlise estatstica. Esta
classificao uma tarefa difcil quando o nmero de respostas a serem analisadas
muito grande. Por isso, questes de respostas abertas so mais freqentemente
empregadas em estudos pilotos ou nos estgios exploratrios, quando se procura
determinar quais tipos de respostas aparecero. Essas informaes so ento
usadas na construo do questionrio a ser utilizado na obteno dos dados de um
grupo maior. s vezes inevitvel misturar os dois tipos de pergunta, quando, por
exemplo, colocamos a opo outros e pedimos especificao. Se os dados forem
analisados por computador, deve-se pensar na etapa da codificao ao redigir as
perguntas.


26
Ordem das Questes

Um questionrio consistente em uma bateria de questes arranjadas em certa
ordem. As primeiras questes so para estabelecer contato com o respondente e
devem ser bem simples. Quando vrios tpicos esto envolvidos, deve-se completar
um tpico antes de passar a outro. A ordem das questes freqentemente afeta as
respostas dadas pelo respondente, j que as perguntas chamam a ateno do
entrevistado para um conjunto de pensamentos e sentimentos, em cujo contexto as
outras perguntas sero respondidas. Em pesquisa de mercado, por exemplo,
questes que mencionam um produto especfico tendem a viciar as perguntas que
se seguem; conseqentemente, estas questes identificando produtos ou firmas
devem ser colocadas no final, sempre que possvel.

Tipo de Abordagem

Muitas pessoas tendem a racionalizar ou exagerar suas respostas quando
so questionadas diretamente sobre seus motivos, realizaes ou outros assuntos
que envolvam seu prestgio ou auto-estima. Para se evitar a introduo de
tendenciosidade nessas respostas, usa-se freqentemente uma abordagem indireta
na elaborao de questes que envolvem prestgio. Por exemplo, ao invs de
perguntas: Voc terminou o curso secundrio?, pode-se perguntar: Em que ano
voc estava quando deixou de estudar?. Na segunda pergunta tenta-se evitar
constrangimento aos respondentes que no terminaram o curso secundrio.

Clareza nas Perguntas

Uma pergunta deve ter aproximadamente o mesmo sentido para todos os
entrevistados; caso contrrio, os dados obtidos no tero grande utilidade. Termos
com sentido dbio devem ser evitados. As perguntas devem ser simples. Nem todos
os entrevistados entendero questes com enunciado complexo, originando, assim,
resultados ruins.


27
No Sugerir Respostas

Na formulao das perguntas deve-se evitar um tipo de redao como esta:
Voc concorda em que esta bebida, sendo a melhor, deva custar mais caro?
Esta pergunta sugere to obviamente uma resposta que praticamente intil.
Algumas vezes, entretanto, difcil perceber que a redao de uma pergunta possa
sugerir determinada resposta.

A Necessidade do Pr-Teste

Assim que um questionrio tenha sido redigido, deve ser testado em um
estudo piloto. Esta fase fundamental para detectar dificuldades no observadas,
como o lay out do questionrio, ordem e redao das perguntas, necessidade de
instrues mais claras para os entrevistadores, etc. Naturalmente, a correo dessas
imprecises melhorar a qualidade do levantamento.

A Prtica de Pesquisas por Amostragem

O leitor deve convencer-se de que fundamental conhecer as caractersticas
especficas da rea onde pretende participar de pesquisas por amostragem. O
significado especial de algumas palavras, os melhores locais e horrios para se
fazer coleta de dados, o tipo de entrevistador so, entre outros, fatores importantes
para o bom andamento do levantamento. S lendo literatura na rea especfica
que se pode, entretanto, conhecer estes detalhes.


28
Amostragem

Conceitos Fundamentais

Assim que decidimos obter informaes atravs de um levantamento
amostral, temos imediatamente dois problemas:

definir cuidadosamente a populao de interesse e
selecionar a caracterstica que iremos pesquisar.

A populao-alvo a populao sobre a qual vamos fazer inferncias
baseadas na amostra.
Caracterizada a populao-alvo, o prximo passo escolher as
caractersticas que iremos medir. Aqui o erro freqente querer incluir muitas
caractersticas. A qualidade da mensurao cai com o aumento do nmero de
perguntas. Devemos, portanto, fixar-nos apenas em perguntas que contribuam para
a quantificao adequada da caracterstica populacional de real interesse para o
estudo.
Para que possamos fazer inferncias vlidas sobre a populao a partir de
uma amostra, preciso que esta seja representativa. Uma das formas de se
conseguir representatividade fazer com que o processo de escolha da amostra
seja, de alguma forma, aleatrio. Alm disso, a aleatoriedade permite o clculo de
estimativas dos erros envolvidos no processo de inferncia.


29
Amostragem Aleatria Simples

Neste caso a amostra escolhida elemento a elemento.
A populao numerada de 1 a N.
Escolhem-se, em seguida, na tbua de nmeros aleatrios, n nmeros
compreendidos entre 1 e N.
Esse processo equivalente a um sorteio no qual se colocam todos os nmeros
misturados dentro de uma urna. Os elementos correspondentes aos nmeros
escolhidos formaro a amostra.

Exemplo: A tabela a seguir refere-se aos dimetros de 30 eixos produzidos por uma
industria automobilstica (dados hipotticos)

26 32 26 19 20 22 30 31 17 20
16 17 28 15 26 19 14 16 16 26
27 31 13 26 18 29 18 16 21 24

Extrair, sem reposio, uma amostra aleatria de tamanho n = 5.

Soluo: Primeiramente deveremos numerar a populao.

Eixo 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17
Dimetro 26 32 26 19 20 22 30 31 17 20 16 17 28 15 26 19 14

Eixo 18 19 20 21 22 23 24 25 26 27 28 29 30
Dimetro 16 16 26 27 31 13 26 18 29 18 16 21 24

Escolhemos uma coluna na TNA.
Procuramos os 5 primeiros nmeros no superiores a 30, lendo os dos
ltimos algarismos ou os dois primeiros.

30
Obtemos:
2. coluna
Leitura na TNA (2 ltimos) 18 15 22 24 03
Dimetro 16 26 31 26 26


31
Amostragem Estratificada

Quando os elementos da populao esto divididos em grupos no
superpostos, mais fcil e mais eficiente escolher, independentemente, uma
amostra aleatria simples dentro de cada um destes grupos, os quais so chamados
estratos.
Esta forma de amostragem uma das mais utilizadas, j que a maioria das
populaes tem estratos bem definidos: os homens e as mulheres; os alunos das
escolas X, Y, Z; os estados brasileiros; ect.
O mais comum utilizar-se a Amostragem Estratificada Proporcional, que
consiste em selecionar os elementos da amostra entre os vrios estratos, em
nmero proporcional ao tamanho de cada um dos estratos. Em outras palavras,
sejam:

N o nmero de elementos da populao
L o nmero de estratos

i
N o nmero de elementos do estrato i
n o tamanho da amostra a ser selecionada
i
n tamanho de amostra no estrato i


Note que
N = N
1
+ N
2
+ ... + N
L


Calcula-se a frao de amostragem dada por:
f =
N
n

Obs: A frao de amostragem calcula o tamanho de amostra por unidade da
populao.

O nmero de elementos a serem sorteados em cada estrato ser:
.f N n
1 1
=
.f N n
2 2
=
32
.f N n
L L
=
M


Exemplo: Na execuo de uma rede eltrica, uma firma especializada utiliza
eletrodutos de dois tipos: E e F. em uma anlise do custo do material
foram considerados 30 faturas, representadas abaixo pelo preo de 10m
de eletroduto.

Eletroduto (estrato) E

Fatura 01 02 03 04 05 06
Preo (R$) 710 710 715 715 755 760

Eletroduto (estrato) F

Fatura Preo
(R$)
Fatura Preo
(R$)
Fatura Preo
(R$)
Fatura Preo
(R$)
01 750 07 760 13 770 19 790
02 750 08 765 14 770 20 795
03 750 09 765 15 770 21 795
04 750 10 765 16 785 22 800
05 755 11 765 17 785 23 810
06 760 12 765 18 790 24 820


Extrair, sem reposio, uma amostra estratificada proporcional de tamanho
n = 8.

Soluo:

f =
30
8
= 0,27

33
De cada estrato sero sorteadas respectivamente n
E
e n
F
unidades:

n
E
= (0,27) . 6 = 1,62 2

n
F
= (0,27) . 24 = 6,48 6

Para encontrar a amostra referente ao eletroduto E utilizamos TNA (8. coluna
primeiro algarismo) e para encontrar a amostra referente ao eletroduto F utilizamos
TNA (4. coluna ltimos algarismos). Assim obtemos:

Estrato E F
Leitura na
TNA
3 1 20 03 18 17 24 12
Fatura (R$) 715 710 795 750 790 785 820 765

Entre as vantagens da amostragem estratificada destacam-se:
a) os dados so geralmente mais homogneos dentro de cada estrato do que na
populao como um todo;
b) o custo da coleta e anlise dos dados freqentemente menor nesse tipo de
amostragem do que na aleatria simples, devido a convenincias
administrativas;
c) podem-se obter estimativas separadas dos parmetros populacionais para
cada estrato sem selecionar outra amostra e, portanto, sem custo adicional.


34
Amostragem Sistemtica

Uma amostragem sistemtica de tamanho n constituda dos elementos de
ordem K, K+r, K+2r, ... , onde K um inteiro escolhido aleatoriamente entre 1 e n . E
r o inteiro mais prximo da frao

n
N
r

Por exemplo, se a populao tem 100 elementos e vamos escolher uma
amostra de tamanho 6, K um inteiro escolhido aleatoriamente entre 1 e 6, e r =
100/6 = 16,6 = 17.
Pela TNA (8 coluna primeiro algarsmo) K = 3. Assim a amostra ser
composta pelos elementos de posio:

3, 20, 37, 54, 71, 88

Se o tamanho da populao desconhecido, no podemos determinar
exatamente o valor de r. Escolheremos intuitivamente um valor razovel para r.
s vezes a amostragem sistemtica preferida amostragem aleatria
simples, porque mais fcil de executar, estando portando menos sujeita a erros, e
proporciona mais informaes com menor custo.

Exemplo: escolha a tcnica adequada para extrair uma amostra de 50
compradores de uma loja.

Soluo: A amostragem aleatria simples no pode ser empregada neste caso,
pois o entrevistador no pode determinar quais compradores sero includos na
amostra, uma vez que no se conhece o tamanho N da populao, at que todos os
compradores tenham ido loja. Assim, ele pode usar a amostragem sistemtica
(digamos 1 em cada 20 compradores) at obter a amostra do tamanho desejado.

35
Exerccios

1) Com relao a amostragem aleatria simples CORRETO afirmar que:

a) ( ) Utilizamos a tabela de nmeros aleatrios para encontrar o valor do k.
b) ( ) utilizada quando conhecemos parte da populao
c) ( ) Pode ser utilizada quando no conhecemos a populao
d) ( ) um mtodo aleatrio em que no h possibilidade do pesquisador
interferir na escolha da amostra;
e) ( ) Nenhuma das alternativas acima.

2) Com relao a amostragem sistemtica CORRETO afirmar que:

a) ( ) Permite encontrar amostras de populao cujo nmero total de
elementos desconhecido;
b) ( ) A amostra encontrada utilizando uma progresso geomtrica cujo
primeiro termo o primeiro elemento da populao ;
c) ( ) A amostra encontrada utilizando uma progresso aritmtica cujo
primeiro termo o primeiro elemento da populao ;
d) ( ) A amostra encontrada utilizando uma progresso aritmtica cuja razo
encontrada na tabela de nmeros aleatrios;
e) ( ) Nenhuma das alternativas acima.

3) Com relao a amostragem estratificada CORRETO afirmar que:

a) ( ) Permite encontrar amostras de estratos que no possuem nenhuma
caracterstica em comum;
b) ( ) Os estratos devem ser disjuntos;
c) ( ) A amostra sempre dividida em partes iguais para cada estrato;
d) ( ) Utilizamos uma amostragem aleatria simples considerando todos os
estratos juntos;
e) ( ) Nenhuma das alternativas acima.

36
4) O gerente de um determinado banco com o intuito de fazer uma pesquisa junto a
seus clientes utiliza o seguinte processo: Pega o primeiro cliente que compareceu
agncia naquele dia e o entrevista. O segundo a ser entrevistado o 6. cliente. O
terceiro a ser entrevistado o 11. cliente e assim sucessivamente at que a
agncia feche. CORRETO afirmar que:

a) ( ) O gerente utilizou uma amostragem estratificada proporcional;
b) ( ) O gerente utilizou uma amostragem aleatria simples;
c) ( ) O gerente utilizou uma amostragem sistemtica;
d) ( ) O gerente no utilizou nenhum mtodo de amostragem;
e) ( ) Nenhuma das alternativas acima.

5) Considere o seguinte problema: Deve-se extrair uma amostra estratificada
proporcional de tamanho 60 de uma populao de tamanho 4.000, que consiste de
trs estratos de tamanhos N
1
=2.000, N
2
=1.200 e N
3
= 800. CORRETO afirmar que:

a) ( ) Do primeiro estrato dever ser extrada 18 amostras;
b) ( ) Do segundo estrato dever ser extrada 30 amostras;
c) ( ) Do terceiro estrato dever ser extrada 12 amostras;
d) ( ) Dever extrair 20 amostras de cada estrato;
e) ( ) Nenhuma das alternativas acima.

6) A nica opo que traz dois mtodos de amostragem em que preciso conhecer
todos os elementos da populao :

a) ( ) Aleatria simples e por conglomerado;
b) ( ) Por conglomerado e sistemtica;
c) ( ) Aleatria simples e sistemtica;
d) ( ) Estratificada e por conglomerado;
e) ( ) Nenhuma das alternativas acima.

7) Os dados abaixo se referem a taxa de hemoglobina no sangue (em gramas/cm
3
)
de 12 professores de uma determinada escola.

37
Professor 1 2 3 4 5 6 7 8 9 10 11 12
Taxa de
hemoglobina
11,1 12,2 15,2 11,3 14,4 12,7 13,5 15,8 11,7 16,3 14,1 12,5

Extrair uma amostra sistemtica de 3 taxas de hemoglobina. (Usar 7. coluna da
TNA, ltimo algarismo).

8) Os dados abaixo referem-se ao salrio (em salrios mnimos) de 20 funcionrios
administrativos em uma indstria.

10.1 7.3 8.5 5 4.2 3.1 2.2 9 9.4 6.1
3.3 10.7 1.5 8.2 10 4.7 3.5 6.5 8.9 6.1

a) Extraia uma amostra de 6 elementos usando a amostra aleatria simples.
(Usar 2. coluna na TNA, dois ltimos algarismos);

TNA 18 15 03 16 01 19
Salrio 6.5 10 8.5 4.7 10.1 8.9

b) Extraia uma amostra de 5 elementos usando a amostra sistemtica. (Usar
2. coluna na TNA, ltimo algarismo).

9) Uma pesquisa com usurios de transporte coletivo na cidade de So Paulo
indagou sobre os diferentes tipos usados nas suas locomoes dirias. Dentre
nibus, metr e trem, o nmero de diferentes meios de transporte utilizado foi o
seguinte: 2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2 e
3.

a) Extraia uma amostra de 10 elementos usando a amostra aleatria simples.
(Usar 3. coluna na TNA, dois ltimos algarismos);

b) Extraia uma amostra de 10 elementos usando a amostra sistemtica. (Usar
3. coluna na TNA, dois ltimos algarismos);

38
10) A idade dos 20 ingressantes num certo ano no curso de ps-graduao em
jornalismo de uma universidade foi o seguinte: 22, 22, 22, 22, 23, 23, 24, 24, 24, 24,
25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.

a) Extraia uma amostra, com reposio, de 8 elementos usando a amostra
aleatria simples. (Usar 3. coluna na TNA, dois ltimos algarismos);

b) Extraia uma amostra, sem reposio, de 8 elementos usando a amostra
sistemtica. (Usar 3. coluna na TNA, ltimo algrarismo);

11) Um novo medicamento para cicatrizao est sendo testado e um experimento
feito para estudar o tempo (em dias) de completo fechamento em cortes
provenientes de cirurgia. As 30 cobaias tiveram os seguintes tempos: 15, 17, 16, 15,
17, 14, 17, 16, 16, 17, 15, 18, 14, 17, 15, 14, 15, 16, 17, 18, 18, 17, 15, 16, 14, 18,
18, 16, 15 e 14.

a) Extraia uma amostra, sem reposio, de 10 elementos usando a amostra
aleatria simples. (Usar 3. coluna na TNA, dois ltimos algarismos);

b) Extraia uma amostra, sem reposio, de 10 elementos usando a amostra
sistemtica. (Usar 3. coluna na TNA, dois ltimos algarismos);

12) Um exame vestibular para uma faculdade tem 80 questes, sendo 40 de
portugus e 40 de matemtica. Para os 20 melhores classificados, apresentamos o
nmero de acertos em cada disciplina, em ordem decrescente de pontos:

Aluno 1 2 3 4 5 6 7 8 9 10
Portugus 35 35 34 32 31 30 26 26 24 23
Matemtica 31 29 27 28 28 26 30 28 25 23

Aluno 11 12 13 14 15 16 17 18 19 20
Portugus 23 12 11 20 17 12 14 20 8 10
Matemtica 21 32 31 20 21 25 20 13 23 20
39
a) Extraia uma amostra de 5 alunos usando a amostra aleatria simples.
(Usar 3. coluna na TNA, dois ltimos algarismos);

b) Extraia uma amostra de 5 alunos usando a amostra sistemtica. (Usar 3.
coluna na TNA, dois ltimos algarismos);

13) Em uma escola da rede municipal, esto matriculados 370 alunos no curso da
manh. Eles esto distribudos na seguinte maneira:

Salas 5. A 5. B 5. C 6. A 6. B 6. C 6. D 7. A 7. B 8. A 8. B 8. C
Alunos 30 25 30 30 30 25 25 35 40 35 35 30

a) Extraia uma amostra de 74 alunos usando a amostra estratificada. (Usar 3.
coluna na TNA, dois ltimos algarismos)

14) O Departamento de Ensino de uma Escola Particular, de um bairro de classe
mdia, deseja realizar uma pesquisa para saber se seria conveniente criar o 2. grau
em seu quadro de turmas. Isso porque ela ministra apenas da 1. srie 8. srie do
ensino bsico e fundamental.
Para isso ela contrata uma firma de consultoria para realizar esta pesquisa.
Suponhamos que voc faa parte dessa firma e seja indicado(a) para formular
um questionrio a fim de coletar dados que iro ajudar na soluo deste problema.
Ento voc dever criar um questionrio com esse objetivo. Bom trabalho.!!!

15) Os dados a seguir referem-se ao consumo de energia eltrica, em mil MWh. Os
dados so da CEMIG,FURNAS, ELETROBRS.
Setor 2007 2006 2005 2004 2003 2002 2001 2000 1999 1998 1997
Refinaria
de petrleo
301 286 262 248 246 253 238 259 242 236 251
Qumica 3471 3465 3189 3089 2929 2770 2591 2747 2033
Residencial 7301 7118 7047 6965 6963 6785 6899

Extrair uma amostra estratificada proporcional de tamanho 9, sem repetio.
40
Usar: Refinaria: 2 coluna, Qumica: 4 coluna e Residncia: 7 coluna. Ambos
utilizar primeiros lgarsmos.

16) Os dados a seguir referem-se ao nmero de acidentes de trfego durante 50
horas de pico em certa rodovia.

1 0 3 2 3 5 3 0 2 7
0 4 3 1 3 1 5 3 4 4
2 1 3 1 2 2 1 0 2 0
0 1 1 2 4 5 3 4 3 4
3 3 5 2 1 6 1 2 4 6

17) Os dados a seguir referem-se ao nmero de alarmes falsos (acionados
acidentalmente ou por mau funcionamento do equipamento) recebidos em 30 dias
por um servio de monitoramento da segurana.

3 6 2 4 5 8 2 5 6 3
4 7 4 6 5 5 5 4 3 7
4 4 6 3 9 5 7 4 4 6

18) Um artigo em Technometrics (Vol. 19, 1977, pg. 425) apresenta dados sobre
taxas de octanagem de combustvel para motor, de vrias misturas de gasolina. 40
destes resultados so apresentados a seguir:

88,5 94,7 84,3 90,1 89 89,8 91,6 90,3 90 91,5
89,9 98,8 88,3 90,4 91,2 90,6 92,2 87,7 91,1 86,7
93,4 96,1 89,6 90,4 91,6 90,7 88,6 88,3 94,2 85,3
90,1 89,3 91,1 92,2 83,4 91 88,2 88,5 93,3 87,4

Extrair uma amostra sistemtica de tamanho n = 6.
Utilize a tabela de nmeros aleatrios: 1 coluna, primeiro algarismo.
OBS.: A numerao dever ser feita por linha.



41
Distribuio de Freqncia

Dados Brutos

Aps a coleta de dados comum encontr-los desordenados, ou seja, fora de
alguma ordem. Por essa razo, costuma-se cham-los de dados brutos.

Exemplo: Os dados a seguir representam a temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto:

43 45 49 47 52
45 51 46 44 48
51 50 52 44 48
50 49 50 46 46
49 49 51 50 49

Rol

Quando tomamos os dados brutos e colocamos seus elementos em uma
determinada ordem, crescente ou decrescente, obtemos um conjunto organizado
denominado Rol.

43 44 44 45 45
46 46 46 47 48
48 49 49 49 49
49 50 50 50 50
51 51 51 52 52


42
Tabela de freqncia

As tabelas de freqncias so representaes nas quais os valores se
apresentam em correspondncia com suas repeties.
Uma das vantagens da tabela de freqncia proporcionar uma rpida
visualizao dos dados. Tambm possvel calcular medidas com um menor
nmero de clculos.
A seguir apresentamos as tabelas de freqncias simples (no agrupadas em
classes).

Distribuio de Freqncias de Dados Tabulados No-Agrupados em Classes

uma tabela onde cada valor da varivel aparece individualmente com sua
respectiva freqncia, repetio. Esse tipo de apresentao utilizado para
representar uma varivel discreta ou descontinua.

Exemplo: A tabela abaixo representa Os dados a seguir representam a temperatura
de efluentes em dias consecutivos na descarga de uma estao de tratamento de
esgoto:
43
Tabela 3: Temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto:


Temperatura
Freqncia
f
j

43 1
44 2
45 2
46 3
47 1
48 2
49 5
50 4
51 3
52 2
25
Fonte: Estatstica Aplicada e Probabilidade para Engenheiros [2]

Distribuio de Freqncias de Dados Agrupados em Classes

Muitas vezes, mesmo com o risco de se sacrificar algum detalhe manifestado
na ordenao de valores individuais, h vantagem em resumir os dados originais em
uma distribuio, onde os valores observados no mais aparecero individualmente,
mas agrupados em classes.
Para variveis contnuas sempre usamos agrupar. Para variveis discretas e
nmero de valores representativos dessa varivel muito grande tambm agrupamos.

Elementos de uma Distribuio de Freqncias

1) Freqncia Simples Absoluta: f
j


o nmero de observaes correspondentes a essa classe ou a esse valor.
A freqncia simples absoluta, ou simplesmente freqncia, simbolizada por f
j
.
44

2) Amplitude Total: A
t


a diferena entre o maior e o menor valor observado da varivel em estudo.

3) Nmero de Classes

cada um dos grupos de valores em que se subdivide a amplitude total do
conjunto de valores observados da varivel.
Uma classe pode ser identificada por seus extremos ou pela ordem em que
ela se encontra na tabela (valor do ndice j)
O nmero de classes pode ser calculado usando a frmula de Sturges:

k = 1 + 3,3 log
10
N
Onde
k = nmero de classes
N = nmero total de observaes

O arredondamento de k feito para o inteiro imediatamente superior.

4) Limites de classes

Os limites de classe so seus valores extremos.

a) Limite Inferior: o valor mnimo de uma classe.
b) Limite Superior: o valor mximo de uma classe. Este pode no
pertencer classe atual.

5) Amplitude do Intervalo de classe

Amplitude do intervalo de classe ou simplesmente intervalo de classe o
comprimento da classe, sendo geralmente definida como a diferena entre seus
limites superior e inferior.

45
6) Ponto mdio de classe

O ponto mdio ou valor mdio o valor que a representa, para efeito de
clculos de certas medidas. Na distribuio de freqncias com valores
agrupados em classes, considera-se que os resultados includos em cada classe
distribuem-se uniformemente por seu intervalo.

Exemplo 1: Os dados a seguir representam a temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto:

43 44 44 45 45
46 46 46 47 48
48 49 49 49 49
49 50 50 50 50
51 51 51 52 52

Amplitude total = 52 43 = 9
Nmero de classes:
k = 1 + 3,3 x log 25
k = 1 + 3,3 x 1,3979
k = 5,61
k 6

Amplitude do intervalo de classe:
Ac = A
t
/ k = 9 / 6 = 1,5

Obs: Devemos inicialmente testar se o limite superior da ltima classe maior ou
igual ao valor mximo. Para isto utilizamos a frmula

Limite superior da ltima classe = mnimo + k. Ac

Caso o limite superior no seja maior ou igual ao valor mximo ento devemos,
como alternativa, fazer um arredondamento por excesso na amplitude de classe.
Limite superior da ltima classe = 43 + 6. 1,5 = 52
46

Tabela 4: Temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto









Fonte: Estatstica Aplicada e Probabilidade para Engenheiros [2]

Tipos de freqncia

Frequncia simples ( f
j
): a freqncia de cada valor individual ou de cada
classe;
Frequnca acumulada simples ( F
j
): a soma de todas as frequncias simples
anteriores;
Frequncia relativa simples (fr
j
): o valor de cada freqncia simples dividido
pela soma das freqncias;
Frequnca acumulada relativa (Fr
j
): a soma de todas as frequncias
relativas simples anteriores;

temperatura f
j
43,0 |--- 44,5 3
44,5 |--- 46,0 2
46,0 |--- 47,5 4
47,5 |--- 49,0 2
49,0 |--- 50,5 9
50,5 |---| 52,0 5
Total 25
47
Exemplo: Considere a tabela a seguir

Tabela 5: Temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto


temperatura

f
j
Frequncia
acumulada
simples
F
j

Frequncia
relativa
Simples
fr
j
Frequncia
relativa
Acumulada
Fr
j

43,0 |--- 44,5 3 3 0,12 0,12
44,5 |--- 46,0 2 5 0,08 0,20
46,0 |--- 47,5 4 9 0,16 0,36
47,5 |--- 49,0 2 11 0,08 0,44
49,0 |--- 50,5 9 20 0,36 0,80
50,5 |---| 52,0 5 25 0,20 1,00
Total 25 1,00
Fonte: Estatstica Aplicada e Probabilidade para Engenheiros [2]

Observao: A soma total da freqncia relativa simples deve ser igual a 1.
48
ROTEIRO PARA A ELABORAO DE UMA TABELA DE FREQNCIAS COM
DADOS AGRUPADOS EM CLASSES


Para a construo de uma tabela de freqncias, conveniente adotar-se um
roteiro que, embora baseado em critrios relativamente arbitrrios, facilita e torna
operacional o trabalho de quem ir montar a tabela. O roteiro proposto consta dos
seguintes passos:

a) Lista de dados brutos que pode ou no ser transformada em rol;
b) Encontrar a amplitude total do conjunto de valores observados:



c) Calcular o nmero de classes (k) usando a frmula de Sturges:

d) Determinar a amplitude do intervalo de classe.

Muitas vezes convm arredondar o nmero correspondente amplitude
do intervalo de classe a que se chegou para um nmero mais adequado, que
facilite os clculos.

e) Determinar os limites das classes, escolhendo-se preferencialmente,
nmeros inteiros.
f) Construir a tabela de freqncias.


Menor valor do conjunto
Maior valor do conjunto
- A
t
=
49
Manual para Normalizao de Publicaes Tcnico cientificas
Ed. UFMG

Tabelas de distribuio de freqncia

1) As tabelas devem ser dotadas de um ttulo claro e conciso localizado acima
delas. So numeradas seqencialmente em todo o trabalho, com algarismos
arbicos (1, 2, 3, ...), segundo normas do IBGE.
2) No cabealho de cada coluna indica-se o seu contedo. Os ttulos das
colunas podem ser datilografados verticalmente, se necessrio, para
economizar espao.
3) No se deve deixar nenhuma casa vazia no corpo da tabela, usando-se os
smbolos, conforme conveno internacional:

- quando, pela natureza do fenmeno, o dado no existir
Z quando o dado for rigorosamente zero
... quando no se dispuser do clculo

4) Na construo de tabelas usam-se os seguintes traos:

a) trao duplo horizontal, limitando o quadro;
b) trao simples vertical, separando a coluna indicadora das demais e
estas entre si; no corpo da tabela pode ser eliminado desde que o nmero de
colunas seja pequeno e no haja prejuzo na leitura dos dados;
5) a tabela no deve ser fechada lateralmente, tampouco se colocam traos
horizontais separando os dados numricos.


50
Exerccios
Para os exerccios 1 a 5 construa uma tabela de distribuio de freqncia
simples.
1) As cifras abaixo representam os ganhos de 15 vendedores:

425 440 610 518 324
482 624 390 468 457
509 561 482 480 520

2) Do-se a seguir os pesos, em libras, de 20 candidatos a empregos no corpo de
bombeiros de uma cidade:

225 182 194 210 205 172 181 198 164 176
180 193 178 193 208 186 183 170 186 188

3) Os seguintes nmeros de unidades de um produto foram completados em
determinados dia por 20 operrios de uma fbrica de artigos de artesanato:

61 58 59 72 47 55 40 73 66 60
71 69 63 58 51 42 67 80 62 53


4) Uma auditoria em 60 faturas de venda revelou os seguintes nmeros de erros na
fixao de preos:

0 0 2 1 4 1 0 1 3 2
2 0 1 1 1 4 0 3 1 5
1 1 0 2 0 0 1 1 4 3
0 1 0 2 1 4 3 1 0 0
5 1 2 0 3 0 2 1 1 3
1 4 3 0 2 0 1 1 0 1


51
5) Do-se, a seguir, os nmeros de alarmes falsos(acionados acidentalmente ou por
mau funcionamento do equipamento) recebidos em 30 dias por um servio de
monitoramento da segurana:

3 6 2 4 5 8 2 5 6 3
4 7 4 6 5 5 5 4 3 7
4 4 6 3 9 5 7 4 4 6

As questes de 6 a 11 so referentes tabela a seguir. Ela se refere a notas de
alunos, em uma prova de 30 pontos, de uma determinada escola.



6) O valor do limite superior da 4. classe de:

a) ( ) 17;
b) ( ) 18;
c) ( ) 19;
d) ( ) 20;
e) ( ) Nenhuma das alternativas acima.

7) O valor do limite inferior da 3. classe de:

a) ( ) 13;
b) ( ) 14;
Notas f
j
11 I----- 6
I----- 2
I----- 2
I----- 10
I----- 6
21 I----- 4
Total 30
52
c) ( ) 15;
d) ( ) 16;
e) ( ) Nenhuma das alternativas acima.

8) O valor da freqncia acumulada simples da 5. classe de:

a) ( ) 8;
b) ( ) 10;
c) ( ) 20;
d) ( ) 26;
e) ( ) Nenhuma das alternativas acima.

9) O valor da freqncia relativa acumulada 4. classe de:

a) ( ) 0,2000;
b) ( ) 0,2667;
c) ( ) 0,3333;
d) ( ) 0,6667;
e) ( ) Nenhuma das alternativas acima.

10) Porcentagem dos alunos que tiraram abaixo de 50% da nota da prova de:
a) ( ) 20%;
b) ( ) 27%;
c) ( ) 34%;
d) ( ) 67%;
e) ( ) Nenhuma das alternativas acima.

11) A nota em que 66% dos alunos esto acima dela de:

a) ( ) 15;
b) ( ) 16;
c) ( ) 17;
d) ( ) 18;
e) ( ) Nenhuma das alternativas acima.
53

As questes de 12 a 15 so referentes tabela a seguir. Ela se refere a pacientes
internados no hospital X, localidade Y, no ano Z.












12) O valor do limite superior da 4. classe de:

13) O valor do limite inferior da 3. classe de:

14) O valor da freqncia acumulada simples da 5. classe de:

15) O valor da freqncia relativa simples da 4. classe de:

16) Os dados se referem aos pesos dos alunos de uma determinada escola:

60.5 60 70 47.4 60 57 52 47 55 50
55 58 54 66 58.5 63 73 95 39 54.5
72.8 47 58 85.2 49.2 52 56 84 75 50
80.9 57.8 68.5 54.5 48 49 58 60 55 71
55 58 63.5 52.5 51.6 59 87 73 49 86

Aps construir uma tabela de distribuio de freqncia agrupada em classes, a
freqncia simples da terceira classe de:

Grupo etrios (em anos) f
j
20 |--- 1
|--- 3
|--- 5
|--- 6
|--- 4
70 |--- 1
Total 20
54
17) Os dados abaixo se referem aos pesos dos alunos de uma determinada escola:

60.5 60 70 47.4 60 57 52 47 55 50
55 58 54 66 58.5 63 73 95 44 54.5
72.8 47 58 85.2 49.2 52 56 84 75 50
80.9 57.8 68.5 54.5 48 49 58 60 55 71
55 58 63.5 52.5 51.6 59 87 73 49 86

Siga os passos para a construo de uma tabela de distribuio de freqncia com
dados agrupados:

a) Determine a amplitude total

b) Determine a amplitude de classe

c) Construa a tabela usando 7 classes

d) Inclua na tabela as freqncias relativas simples

e) Inclua na tabela as freqncias acumuladas (abaixo de) simples

f) Inclua na tabela as freqncias acumuladas (abaixo de) relativas


18) Com relao tabela de distribuio de freqncia agrupada acima responda:

a) Quantos alunos pesam at 69 kg?

b) Quantos alunos pesam mais de 76 kg?

c) Qual a porcentagem de alunos que pesam menos de 62 kg?

55
19) Uma importante caracterstica de qualidade da gua a concentrao de
material slido suspenso. Em seguida, so apresentadas 60 medidas de slidos
suspensos de um certo lago. Os dados so do livro Estatstica Aplicada e
Probabilidade para Engenheiros.

42,4 54,3 56,3 65,7 54 43,3 29,8 73,1 57,4 58,7
81,3 45,3 52,1 59,9 80,1 55,8 56,9 49,7 57 62,2
42,8 68,7 69,9 42,4 67,3 66,9 59,6 67,3 59 65,8
61,4 42,6 61,4 64 77,4 73,1 64,2 54,7 77,3 72,6
57,1 48,5 72,5 77,3 89,8 46,1 39,3 50,7 53,1 76,4
52 56,1 59,3 59,6 67,2 51,1 66,1 70,7 73,8 31,6

Com o objetivo de construir uma tabela de distribuio de frequncia agrupada em
classes calcule:
a) Valor mnimo e mximo;
b) Amplitude total;
c) Nmero de classes;
d) Amplitude de classes;
e) Construa a tabela apresentando as frequncia simples e relativa simples.
Considere log 60 = 1,7782



56
Medidas de Tendncia Central.

As medidas de tendncia central tm por objetivo localizar o centro dos
dados. Estas medidas so: mdia, mediana e moda.
Em muitos casos estas medidas so diferentes, mas elas tambm podem ser
iguais.
Nesta apostila adotamos, didaticamente, dois casos para o clculo destas
medidas: quando os dados so brutos ou esto em tabela de distribuio simples e
quando os dados esto em tabela de distribuio agrupada em classes.

Dados brutos

1) Mdia Aritmtica Simples


A mdia aritmtica simples, amostral, de um conjunto de n observaes
n
x x x , , ,
2 1
L definida por

n
x
x
n
i
i
=
=
1


A mdia aritmtica simples, populacional, de um conjunto de N observaes
N
x x x , , ,
2 1
L definida por

N
x
N
i
i
=
=
1



57
Exemplo: Os dados a seguir representam as temperaturas (em F) em que ocorrem
uma deflexo, devido carga, em uma amostra de 10 tubos plsticos idnticos.

206 188 205 187 194 193 207 185 189 213

Qual a mdia aritmtica?
Soluo: A mdia ser
7 , 196
10
967 . 1
10
213 189 185 207 193 194 187 205 188 206
1
=
=
+ + + + + + + + +
=
=

=
x
x
x
n
x
x
n
i
i


2) Mediana: Md

Para evitar a possibilidade de sermos enganados por valores muito pequenos
ou muito grandes, ocasionalmente descrevemos o meio ou centrode um
conjunto de dados com outras medidas estatsticas que no a mdia. Uma
dessas medidas, a MEDIANA de n valores, exige que os ordenemos, e se define
como:

O valor do elemento do meio se n mpar, ou a mdia aritmtica dos dois
valores do meio se n par.

Assim dizemos que a mediana o valor do
2
1 n + ++ +
elemento.

58
Exemplo: Os dados a seguir representam as temperaturas (em F) em que ocorrem
uma deflexo, devido carga, em uma amostra de 10 tubos plsticos idnticos.

206 188 205 187 194 193 207 185 189 213

Qual a mediana?

Soluo: Ordenando os elementos temos:

185 187 188 189 193 194 205 206 207 213

Como temos 10 elementos, nmero par, a mediana ser a mdia aritmtica dos dois
elementos centrais. Logo a mediana 5 , 193
2
194 193
=
+
= Md .

Exemplo 2: Em algumas reas, as pessoas autuadas por certas infraes leves de
trfego podem freqentar um curso de direo defensiva em lugar de pagar uma
multa. Se 11 desses cursos foram freqentados por

40 32 37 30 24 40 38 35 40 28 32

Cidados. Qual a mediana?

Soluo: Ordenando os elementos temos:

24 28 30 32 32 35 37 38 40 40 40

Como temos 11 elementos, nmero mpar, a mediana ser o valor do elemento
central. A posio central o 6 elemento, 6
2
1 11
=
+
= Posio . Logo a mediana ser
35.

59
3) Moda: Mo

o valor que ocorre com maior freqncia e mais de uma vez.

Exemplo: Vinte reunies de um clube de dana tiveram as seguintes freqncias de
seus membros

26 25 28 23 25 24 24 21 23 26
28 26 24 32 25 27 24 23 24 22

Qual a moda?
Soluo: A moda vale 24, pois ocorre 5 vezes.

Observao: A moda raramente utilizada em inferncia estatstica pelo fato de
nem sempre existir (o que ocorre quando no h dois valores iguais) ou de,
eventualmente, no ser nica.

Exemplo: Os dados a seguir referem-se a quantidade de pessoas que assistiram a 6
sesses de um filme no cinema:

121 133 121 133 114 141

Qual o nmero modal de pessoas que assistiram ao filme?

Soluo: Temos que os nmeros 121 e 133 repetem, ambos, duas vezes. Portanto a
moda no nica. Logo as modas so 121 e 133.



60
Dados em tabela de distribuio de freqncia

Considere:

x
i
o ponto mdio da classe i ,
f
i
a freqncia da classe i,
k a quantidade de classe.
1) Mdia aritmtica
A mdia aritmtica definida por:

=
=
=
k
i
i
k
i
i i
f
f x
x
1
1
.


OBS.:

Caso tenhamos uma tabela de distribuio agrupada em classes, o valor de
x
i
ser o ponto mdio da classe.
O arredondamento ser sempre uma casa decimal a mais que os dados.
61
Exemplo: A tabela abaixo representa o nmero de defeitos por pea.

Tabela: Nmero de defeitos por pea

Nmero de defeitos (x
i
)
Freqncia
f
j


0 5
1 10
2 18
3 12
4 5
50
Fonte: Referncia bibliogrfica [1]

Calcule nmero mdio de defeitos.
Soluo: Preenchemos a tabela com os valores necessrios

Nmero de defeitos (x
i
)
Freqncia
f
i



X
i
f
i
0 5 0
1 10 10
2 18 36
3 12 36
4 5 20
50 102

A mdia ser
0 , 2
50
102
.
1
1
= = =

=
=
k
i
i
k
i
i i
f
f x
x


62
Exemplo: A tabela abaixo representa as temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto.

Tabela 5: Temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto









Fonte: Estatstica Aplicada e Probabilidade para Engenheiros [2]

Calcule a temperatura mdia.
Soluo: Preenchemos a tabela com os valores necessrios










A temperatura mdia ser
37 , 48
25
25 , 209 . 1
.
1
1
= = =

=
=
k
i
i
k
i
i i
f
f x
x


temperatura f
j
43,0 |--- 44,5 3
44,5 |--- 46,0 2
46,0 |--- 47,5 4
47,5 |--- 49,0 2
49,0 |--- 50,5 9
50,5 |---| 52,0 5
Total 25
temperatura f
j
x
j
x
j
f
j
43,0 |--- 44,5 3 43,75 131,25
44,5 |--- 46,0 2 45,25 90,50
46,0 |--- 47,5 4 46,75 187,00
47,5 |--- 49,0 2 48,25 96,50
49,0 |--- 50,5 9 49,75 447,75
50,5 |---| 52,0 5 51,25 256,25
Total 25 1.209,25
63
2) Mediana

Se tivermos uma tabela de distribuio de freqncia simples, ento podemos
proceder como no caso dos dados estarem na forma bruta.

Exemplo: A tabela abaixo representa o nmero de defeitos por pea.

Tabela: Nmero de defeitos por pea


Nmero de defeitos (x
i
)
Freqncia
f
i


0 5
1 10
2 18
3 12
4 5
50
Fonte: Referncia bibliogrfica [1]

Qual o nmero mediano de defeito?

Soluo: Como temos 50 elementos, o valor mediano dever ser a mdia dos dois
elementos centrais. Neste caso os dois elementos centrais so os elementos de
posio 25 e 26,
2
2
2 2
=
+
. Assim o nmero mediano de defeito 2.
Para uma distribuio de freqncia agrupada em classes, a mediana tal
que metade da rea total dos retngulos do histograma da distribuio est sua
esquerda, e a outra metade est sua direita.
De modo geral podemos calcular a mediana por:

h
F
f
2
n
L x
~
Md
|

\
|

+ = =


64

onde

L: o limite inferior da classe em que a mediana deve estar.
F: a freqncia da classe mediana
h: o intervalo de classe
n: o nmero de elementos ou tamanho da amostra

f : soma das frequncia anteriores classe da mediana



Exemplo: A tabela abaixo representa as temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto.
Calcule a temperatura mdia.

Tabela 5: Temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto









Fonte: Estatstica Aplicada e Probabilidade para Engenheiros [2]

Qual o valor da temperatura mediana?
Soluo: Como temos 25 elementos, o valor mediano dever estar no
5 , 12
2
25
= elemento.
Assim 3 + 2 + 4 + 2 = 11 e 3 + 2 + 4 + 2 + 9 = 20. A mediana estar na 5. classe.
Usando a frmula temos:

L = 49,0, F = 9, h = 1,5 e

f = 11 . Logo
temperatura f
i
43,0 |--- 44,5 3
44,5 |--- 46,0 2
46,0 |--- 47,5 4
47,5 |--- 49,0 2
49,0 |--- 50,5 9
50,5 |---| 52,0 5
Total 25
65
( )
25 , 49
5 , 1
9
11 5 , 12
0 , 49
2
=

+ =

\
|

+ =

Md
Md
h
F
f
n
L Md


Portanto a mediana 49,25.

3) Moda

Se tivermos uma tabela de distribuio de freqncia simples, ento podemos
proceder como no caso dos dados brutos.

Exemplo: A tabela abaixo representa o nmero de defeitos por pea.

Tabela: Nmero de defeitos por pea


Nmero de defeitos (x
i
)
Freqncia
f
i


0 5
1 10
2 18
3 12
4 5
50
Fonte: Referncia bibliogrfica [1]

Qual o nmero de defeito modal?
Soluo: 0 nmero de defeito que mais ocorre 2, pois ocorre 18 vezes. Logo o
nmero de defeito modal Mo = 2.

66
Quando temos uma tabela de distribuio de freqncia agrupada em
classes, o clculo da moda feito utilizando a frmula de Czuber.

1. passo: Identificamos a classe modal ( aquela que possui maior frequncia)
2. passo: Aplica-se a frmula

h L Mo
+

+ =
2 1
1


onde
L: o limite inferior da classe modal.
1
: Diferena entre a freqncia da classe modal e a classe imediatamente anterior.
2
: Diferena entre a freqncia da classe modal e a classe imediatamente
posterior.
h: Amplitude da classe modal

Exemplo: A tabela abaixo representa as temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto.

Tabela 5: Temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto









Fonte: Estatstica Aplicada e Probabilidade para Engenheiros [2]

Calcule a temperatura modal
temperatura f
i
43,0 |--- 44,5 3
44,5 |--- 46,0 2
46,0 |--- 47,5 4
47,5 |--- 49,0 2
49,0 |--- 50,5 9
50,5 |---| 52,0 5
Total 25
67
Soluo:
1. passo: A classe modal a 5., pois ela possui a maior freqncia.
2. passo: Temos
0 , 49 = L , 7 2 9
1
= = , 4 5 9
2
= = e 5 , 1 = h
95 , 49
5 , 1
4 7
7
0 , 49
=

+
+ =
Mo
Mo


Logo a temperatura modal Mo = 49,95.

Obs: Podemos tambm calcular o valor aproximado da moda utilizando a frmula de
Pearson:
x 2 Md 3 Mo =

Exerccios

I) Considere a tabela
Tabela: Quantidade de xido de enxofre (em toneladas)
emitidas por uma indstria em 70 dias
Tempo f
6,2 |--- 9,4 4
9,4 |--- 12,6 8
12,6 |--- 15,8 9
15,8 |--- 19,0 14
19,0 |--- 22,2 14
22,2 |--- 25,4 11
25,4 |--- 28,6 8
28,6 |--- 31,8 2
70
Fonte: referncia bibliogrfica [2]
Calcule:
1) Mdia aritmtica
2) Mediana
3) Moda
4) Compare as medidas calculadas.


68
II) Considere a tabela

Tabela: Tempo de percurso, para o trabalho, de 100 empregados
de um grande escritrio localizado no centro da cidade

Tempo f
11,4 |--- 25,65 20
25,65 |--- 39,90 36
39,90 |--- 54,15 29
54,15 |--- 68,40 5
68,40 |--- 82,65 1
82,65 |--- 96,90 4
96,90 |--- 111,15 3
111,15 |--- 125,40 2
100
Fonte:

Calcule:
1) Mdia aritmtica
2) Mediana
3) Moda
4) Compare as mediadas calculadas.

69
Separatrizes

As separatrizes so medidas de posio, ou seja, so medidas que dividem o
conjunto de dados em partes iguais.
As medidas de posio estudadas nesta apostila so: quartil, decil e percentil.
A seguir destacamos os mtodos de clculo destas medidas.

Dados brutos ou em tabela de distribuio simples

Para o clculo das medidas separatrizes necessrio, primeiramente,
ordenar os dados.

Quartis

Os quartis dividem um conjuto de dados em quatro partes uguais. Assim:
quartil 1 Q
1
=
quartil 2 Q
2
=
quartil 3 Q
3
=
O clculo dos quartis feito utilizando a frmula:
Posio: ( ) 1 N
4
i
PQ
i
+ =
Valor:
( ) ( ) ( )
( )
j 1 j j i
X X
4
i
X Q + =
+
, onde j a parte inteira do resultado de
i
PQ .

Exemplo: Os dados a seguir referem-se a presso sangunea sistlica de 20
pacientes de um hospital.

165 135 151 153 155 182 152 158 146 149
124 162 173 204 159 130 177 162 141 156

Calcule:
1) 2 quartil
Soluo: Ordenando os dados.

124 130 135 141 146 149 151 152 153 155
156 158 159 162 162 165 173 177 182 204

Posio: ( ) 5 , 10 1 20
4
2
PQ
i
= + =
Valor:
( ) ( ) ( )
( ) ( ) 5 , 155 155 156 5 , 0 155 X X
4
i
X Q
j 1 j j i
= + = + =
+

70
2) 3 quartil
Posio: ( ) 75 , 15 1 20
4
3
PQ
i
= + =
Valor:
( ) ( ) ( )
( ) ( ) 2 , 164 162 165 75 , 0 162
4
Q
1 i
= + = + =
+ j j j
X X
i
X

Decis

Os decis dividem um conjuto de dados em dez partes uguais. Assim:
decil 1 D
1
=
decil 2 D
2
=
decil 9 D
9
=
M

O clculo dos decis semelhante ao clculo dos quartis.
Calcula-se a posio utilizando: ( ) 1 N
10
i
PD
i
+ =
Calcula-se o valor de cada decil utilizando a frmula:
( ) ( ) ( )
( )
j 1 j j i
X X
10
i
X D + =
+
, onde j a parte inteira do resultado de
i
PD .


Percentis
Os percentis dividem um conjuto de dados em cem partes uguais. Assim:
percentil 1 P
1
=
percentil 2 P
2
=
percentil 99 P
99
=
M


O clculo dos percentis semelhante ao clculo dos quartis.
Calcula-se a posio utilizando: ( ) 1 N
100
i
PP
i
+ =
Calcula-se o valor de cada percentil utilizando a frmula:
( ) ( ) ( )
( )
j 1 j j i
X X
100
i
X P + =
+
, onde j a parte inteira do resultado de
i
PP .

Exerccios

I) Os dados a seguir referem-se a presso sangunea sistlica de 20 pacientes de
um hospital.

124 130 135 141 146 149 151 152 153 155
156 158 159 162 162 165 173 177 182 204

Calcule:
1) 3 decil;
71
2) 9 decil;
3) 75 percentil;
4) 95 percentil.

II) Exemplo 1: Os dados a seguir representam a temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto:

43 44 44 45 45
46 46 46 47 48
48 49 49 49 49
49 50 50 50 50
51 51 51 52 52

Calcule:
1) 3 decil;
2) 7 decil;
3) 85 percentil;


Dados agrupados em classes

Quartis
Os quartis dividem um conjuto de dados em quatro partes uguais. Assim:
quartil 1 Q
1
=
quartil 2 Q
2
=
quartil 3 Q
3
=
O clculo dos quartis feito utilizando a frmula:

i
i
Q
Q i
F
h f
4
i n
L Q

\
|

+ =


Onde:
i
Q
L : o limite inferior da classe em que o quartil deve estar.
i
Q
F : a freqncia da classe do quartil
h: o intervalo de classe
n: o nmero de elementos ou tamanho da amostra

f : soma das frequncia anteriores classe do quartil



Decis
Os decis dividem um conjuto de dados em dez partes uguais. Assim:
72
decil 1 D
1
=
decil 2 D
2
=
decil 9 D
9
=
M

O clculo dos decis feito utilizando a frmula:

i
i
D
D i
F
h f
10
i n
L D

\
|

+ =


Onde:
i
D
L : o limite inferior da classe em que o decil deve estar.
i
D
F : a freqncia da classe do decil
h: o intervalo de classe
n: o nmero de elementos ou tamanho da amostra

f : soma das frequncia anteriores classe do decil



Percentis

Os percentis dividem um conjuto de dados em cem partes uguais. Assim:
percentil 1 P
1
=
percentil 2 P
2
=
percentil 99 P
99
=
M

O clculo dos percentis feito utilizando a frmula:

i
i
P
P i
F
h f
100
i n
L P

\
|

+ =


Onde:
i
P
L : o limite inferior da classe em que o percentil deve estar.
i
P
F : a freqncia da classe do percentil
h: o intervalo de classe
n: o nmero de elementos ou tamanho da amostra

f : soma das frequncia anteriores classe do percentil



73
Exerccios:
1) Considere a tabela
Tabela: Quantidade de xido de enxofre (em toneladas)
emitidas por uma indstria em 70 dias
Tempo f
6,2 |--- 9,4 4
9,4 |--- 12,6 8
12,6 |--- 15,8 9
15,8 |--- 19,0 14
19,0 |--- 22,2 14
22,2 |--- 25,4 11
25,4 |--- 28,6 8
28,6 |--- 31,8 2
70
Fonte: Referncia bibliogrfica [2]

Calcule:
a) 3 quartil
b) 6 decil
c) 90 percentil

2) Considere a tabela

Tabela: Tempo de percurso, para o trabalho, de 100 empregados
de um grande escritrio localizado no centro da cidade

Tempo f
11,4 |--- 25,65 20
25,65 |--- 39,90 36
39,90 |--- 54,15 29
54,15 |--- 68,40 5
68,40 |--- 82,65 1
82,65 |--- 96,90 4
96,90 |--- 111,15 3
111,15 |--- 125,40 2
100
Fonte:

Calcule:
a) 2 quartil
b) 4 decil
c) 95 percentil

74
3) Em uma fbrica ou um escritrio, o tempo, no horrio de trabalho, durante o qual
uma mquina no est funcionando em virtude de quebra ou falha chamado tempo
parado. A tabela a seguir uma amostra da durao desses tempos parados de
certa mquina.

Tabela: o tempo, no horrio de trabalho, durante o qual
uma mquina no est funcionando em virtude de quebra ou falha

Tempo parado
(minutos)


Frequncia
f
0 ---- 9 2
9 ---- 18 15
18 ---- 27 17
27 ---- 36 12
36 ---- 45 3
45 ---- 54 1
Total 50
Calcule:
a) Tempo 70 percentil.
b) Tempo 3 quartil.

4) O grfico, ramo e folhas, a seguir representa o nmero de clientes que almoaram
em um restaurante. Ele foi gerado pelo software SPSS.

Grfico 1: Nmero de clientes que almoaram em um restaurante

Frequency Stem & Leaf

1,00 4 . 1
3,00 4 . 233
1,00 4 . 5
4,00 4 . 6677
4,00 4 . 8899
5,00 5 . 00111
10,00 5 . 2222233333
9,00 5 . 444555555
12,00 5 . 666666777777
15,00 5 . 888888899999999
16,00 6 . 0000000011111111
15,00 6 . 222222233333333
11,00 6 . 44444445555
7,00 6 . 6666777
2,00 6 . 89
1,00 7 . 1
1,00 7 . 3
1,00 7 . 4
1,00 7 . 6
75

Stem width: 10
Each leaf: 1 case(s)

Baseando no grfico responda:
a) Qual o 6 decil? Use, para calcular a posio do decil, ( ) 1
10
+ = n
i
P
i
D
.

76
Medidas de Variabilidade

So medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou
disperso, dos valores em torno da mdia.
Considere os dois conjuntos de dados a seguir:

Conjunto 1 20 20 20 20 20 20 20
Conjunto 2 30 15 15 20 20 20 20

Grfico: comparao entre a mdia e conjunto de dados 2


Ambos os conjuntos tm mdia 20.
O desvio-padro ou a varincia so mediadas que expresso o grau de
disperso dos em torno da mdia. Quanto maior a disperso maior o desvio-padro.
A seguir apresentamos as frmulas utilizadas para o clculo do devio-padro,
S. A varincia dada como o quuadrado do desvio-padro,
2
S .
Em situaes prticas usado o clculo do desvio-padro devido ao fato de
que ele tem a mesma unidade de medida que os dados.


77
Desvio padro

Smbolo: S
Dados no agrupados

Amostral Populacional

(
(
(
(
(
(

|
|

\
|

=
=
n
x
x
n
S
n
i
i
n
i
i
2
1
1
2
1
1


(
(
(
(
(

\
|
=

=
=
N
x
x
N
N
i
i
N
i
i
2
1
1
2
1


Clculo do desvio padro de dados em tabela de distribuio de freqncia

Sejam :
x
i
o ponto mdio da classe i ,
f
i
a freqncia da classe i,
k a quantidade de classe.

Amostral Populacional

(
(
(
(
(

\
|

=
=
n
f x
f x
n
S
i
k
i
i
k
i
i i
2
1
1
2
.
.
1
1



(
(
(
(
(
(

|
|

\
|
=

=
=
n
f x
f x
n
i
k
i
i
k
i
i i
2
1
1
2
.
.
1


78
Exemplo:
1) Voltando aos dois conjuntos iniciais

Conjunto 1 20 20 20 20 20 20 20
Conjunto 2 30 15 15 20 20 20 20

Temos que o desvio-padro do conjunto 1 0 (zero);
J o desvio-padro do conjunto 2 5 (cinco);

2) Em uma fbrica ou um escritrio, o tempo, no horrio de trabalho, durante o qual
uma mquina no est funcionando em virtude de quebra ou falha chamado tempo
parado.
A tabela a seguir uma amostra da durao desses tempos parados de certa
mquina.
Tabela: o tempo, no horrio de trabalho,
durante o qual uma mquina no est
funcionando em virtude de quebra ou falha

Tempo parado
(minutos)


Frequncia
f
0 |---- 9 2
9 |---- 18 15
18 |---- 27 17
27 |---- 36 12
36 |---- 45 3
45 |---- 54 1
Total 50

Calcule o desvio-padro do tempo parado.
79
Soluo: Para o clculo do desvio-padro necessrio alguns resultados. Podemos
obt-los completando a tabela, veja a seguir:
Tempo parado
(minutos)
Frequncia
f
Tempo
Mdio: x
i


i
f
i
x

i
f
2
i
x
0 |---- 9 2 4,5 9 40,5
9 |---- 18 15 13,5 202,5 2733,75
18 |---- 27 17 22,5 382,5 8606,25
27 |---- 36 12 31,5 378 11907
36 |---- 45 3 40,5 121,5 4920,75
45 |---- 54 1 49,5 49,5 2450,25
Total 50 1143 30658,5

O desvio-padro ser:
( )
[ ]
6 , 9
4392 , 92
98 , 128 . 26 5 , 30658
49
1
50
1143
5 , 30658
1 50
1
.
.
1
1
2
2
1
1
2
=
=
=
(

=
(
(
(
(
(

\
|

=
=
S
S
S
S
n
f x
f x
n
S
i
k
i
i
k
i
i i


Coeficiente de variao:

Quando calculamos a varincia ou o desvio-padro de um conjunto de dados
obtemos valores absolutos. No entanto, muitas das vezes, fundamental comparar
o valor do desvio-padro em termos da mdia. Esta medida relativa denominada
coeficiente de variao.
Assim, o coeficiente de variao uma medida relativa entre a mdia e o
desvio-padro.

80
x
s
CV =
Podemos expressar o valor do coeficiente de variao em porcentagem
multiplicando por 100 o resultado.

Exemplo: considere a tabela a segir
Tabela: Notas obtidas por 500 alunos em um teste de geografia.










Temos que
( )
( )
( )
6 , 20
9975 , 424
75 , 073 . 212
499
1
25 , 651 . 621 . 1 725 . 833 . 1
499
1
500
475 . 28
725 . 833 . 1
1 500
1
2
=
=
=
=
|
|

\
|

=
s
s
s
s
s

Logo o desvio-padro de 19,2.
A mdia 57,0.
O coeficiente de variao dado por:

% 68 , 33 3368 , 0
0 , 57
2 , 19
= = = =
x
s
CV

Notas f
j
x
i
x
i
.f x
i
2
. f
10 |--- 25 44 17,5 770 13.475
25 |--- 40 70 32,5 2.275 73.937,5
40 |--- 55 92 47,5 4.370 207.575
55 |--- 70 147 62,5 9.187,5 574.218,75
70 |--- 85 115 77,5 8.912,5 690.718,75
85 |--- 100 32 92,5 2.960 273.800
Total 500 28.475 1.833.725
81
Neste caso o desvio-padro corresponde a 33,68 % da mdia.
Em um conjunto de dados, seja ele amostral ou populacional, o ideal seria
encontrar desvio-padro igual a zero. No entanto isso difcil. Ento quanto mais
prximo de zero estiver o coeficiente de variao melhor.
Uma pergunta interessante seria a seguinte: se dois conjuntos de dados tem
o mesmo desvio-padro ento eles seriam igualmente bons? A resposta no.
Para ilustrar a finalidade do coeficiente de variao considere os conjuntos:

Conjunto 1:

10 11 12 13 14 15 16

Conjunto 2:

500 501 502 503 504 505 506

Para estes dois conjuntos temos o mesmo desvio-padro de 2,16. No entanto
o coeficiente de variao do conjunto 1 0,166 e do conjunto 2 0,004. Assim
vemos que o desvio-padro do conjunto 1 representa 16,6% da mdia enquanto que
no conjunto 2 representa 0,4%. Logo conclumos que o conjunto 2 melhor que o
conjunto 1. Podemos perceber que variar 2,16 em 503 (mdia do conjunto 2)
melhor que variar 2,16 em 13 (mdia do conjunto 1) .



82
Exerccios

1) A tabela abaixo se refere ao peso, em kg, de 50 alunos de uma determinada
escola.
Peso = x
i
f
i

45 8
55 22
65 8
75 6
85 5
95 1
Total 50

a) Calcule a mdia dos dados agrupados

b) Calcule a varincia.

2) A mdia aritmtica a razo entre:

a) ( ) O nmero de valores e o somatrio;
b) ( ) O somatrio dos valores e o nmero;
c) ( ) Os valores extremos;
d) ( ) Os dois valores centrais.

3) Numa distribuio de valores todos iguais, o desvio-padro :

a) ( ) negativo;
b) ( ) positivo;
c) ( ) a unidade;
d) ( ) zero.

4) A mdia de um conjunto de valores iguais a uma constante :

83
a) ( ) zero;
b) ( ) o valor da constante;
c) ( ) a unidade;
d) ( ) a quantidade de valores que temos

5) O desvio-padro de um conjunto de dados 4. A varincia ser:

a) ( ) 3;
b) ( ) 4;
c) ( ) 16;
d) ( ) 81.

6) Uma empresa possui dois serventes recebendo salrios de R$ 250,00 cada um,
quatro escriturrios recebendo R$ 600,00 cada um, um chefe de escritrio com
salrio de R$ 1.000,00 e trs tcnicos. A mdia de salrios da empresa de R$
1.050,00. Quanto cada tcnico recebe?

7) A mdia do conjunto de valores

46,1 57,5 21,6 16,8 4,2
igual a?

8) O desvio-padro do conjunto de valores

46 57 21 16 4
igual a?

9) Os 20 dados abaixo se referem aos ndices pluviomtricos em determinado
Estado:

144 152 159 160 160 151 157 146 154 145
141 150 142 146 142 141 141 150 143 158

Determine:
84
a) O ndice mdio.
b) O ndice mediano.

10) Os dados abaixo se referem a pesos (em gramas) de 50 ratos usados em um
estudo de deficincia de vitaminas.

136 125 135 137 126 129 124 118 120 126
119 92 115 115 127 95 100 113 95 113
146 103 101 118 121 129 110 126 106 148
137 87 126 119 125 132 108 118 119 117
120 110 82 105 102 104 133 104 132 146

a) Construa uma tabela de distribuio de freqncia agrupada em classes.
b) Qual o peso modal?
c) Qual o desvio-padro?
d) Um rato considerado magro se seu peso menor que s x 2 e gordo se seu
peso maior que s x 2 + . Quais os pesos mximo e mnimo para que um rato seja
considerado magro ou gordo?
e) Baseado na letra e, um rato cujo peso de 135 gramas considerado magro ou
gordo? Justifique sua resposta.

11) D um exemplo numrico, com no mximo 4 amostras, em que a mdia e a
mediana sejam iguais e o desvio-padro seja nulo.

12) D um exemplo numrico, com no mximo 4 amostras, em que a mdia menor
que a mediana.

13) Um artigo de jornal fez meno a determinada pesquisa citando que o conjunto
amostral acusa x = 5, x
2
= 7 e s = 0,5. Por erro esqueceram de citar o tamanho da
amostra utilizado. Considerando as informaes anteriores o que podemos dizer
sobre os possveis tamanho da amostra?
85
14) Uma lista de nmeros acusa x =202, x
2
= 3.452 e n = 15. Qual o desvio-
padro?

15) Em quatro paradas no box, o mecnico dos pneus dianteiros trocou o pneu
dianteiro direito dos carros de corrida em

10,8 12,0 10,5 10,7
segundos. Calcule:

a) o tempo mdio de troca de pneus
b) o desvio-padro.

16) A tabela a seguir apresenta o tempo que 80 estudantes dedicam a atividade de
lazer durante uma semana escolar tpica










Calcule:
a) o tempo mdio
b) o tempo mediano
c) Qual a porcentagem dos alunos que dedicam mais de 25 horas de lazer ?

17) Uma lista de nmeros acusa x =40 e x
2
= 156. Quantos valores figuram na
lista, se seu desvio-padro 2,0?

Horas f
j
10 |--- 15 9
15 |--- 20 28
20 |--- 25 27
25 |--- 30 12
30 |--- 35 4
Total 80
86
18) Um inspetor de controle de qualidade examinou 15 engradados de telhas de
cermica, contendo cada um 144 telhas. Os nmeros de telhas trincadas nessas
caixas foram

2 5 3 4 2 0 1 5 7 3 0 2 2 4 3

Calcule:
a) o nmero mdio de telhas trincadas e
b) o desvio-padro.

19) A tabela de distribuio a seguir apresenta o nmero de peas defeituosas em
uma produo de determinado produto

N. de defeitos N. de peas
0 5
1 10
2 18
3 12
4 5
Total 40

Calcule:
a) a mdia
b) a mediana
c) a moda

87
20) A tabela a seguir apresenta os salrios pagos a 100 operrios de uma empresa










Calcule:
a) o salrio mdio
b) o salrio mediano
c) Qual a porcentagem dos empregados que ganham acima de 4
salrios?
d) O dono da empresa afirmou, em entrevista, que seus funcionrios
ganham, em mdia, R$ 1440,00. Considerando o salrio mnimo no
valor de R$ 330,00, a afirmao do dono da empresa verdadeira?

21) Os dados a seguir referem-se ao consumo de eletricidade (mil MWh) pelo
setor ferrovirio entre os anos de 1978 e 2007. Os dados so do IBGE.

6 5 5 4 3 6 14 8 9
11 8 10 11 12 14 17 19 21

Calcule a varincia e o coeficiente de variao.

22) Em uma fbrica ou um escritrio, o tempo, no horrio de trabalho, durante o qual
uma mquina no est funcionando em virtude de quebra ou falha chamado tempo
parado. A tabela a seguir uma amostra da durao desses tempos parados de
certa mquina.

N. de salrios
mnimos

f
j
0 |--- 2 40
2 |--- 4 30
4 |--- 6 10
6 |--- 8 15
8 |--- 10 5
Total 100
88
Tabela: o tempo, no horrio de trabalho, durante o qual
uma mquina no est funcionando em virtude de quebra ou falha

Tempo parado
(minutos)


Frequncia
f
0 |---- 9 2
9 |---- 18 15
18 |---- 27 17
27 |---- 36 12
36 |---- 45 3
45 |---- 54 1
Total 50
Calcule:
a) Desvio-padro.



89
Representao Grfica


1) Classificao dos grficos segundo o objetivo

Os grficos so usados para apresentar visualmente um conjunto de
dados, proporcionando maior facilidade e rapidez de compreenso dos mesmos,
ou, ento, para apresentar concluses ou resultados de uma anlise.
H, portanto, dois tipos de grficos, conforme o objetivo ou uso a que se
destinam: grficos de informao e grficos de anlise.

a) Grficos de Informao

So grficos destinados principalmente ao pblico em geral, objetivando
proporcionar uma visualizao rpida e clara da intensidade das modalidades e
dos valores relativos ao fenmeno observado.
So grficos tipicamente expositivos, devendo, por conseguinte, ser o mais
completo possvel, dispensando comentrios explicativos adicionais.

b) Grficos de Anlise

Os grficos de anlise prestam-se melhor ao trabalho estatstico,
fornecendo elementos teis fase de anlise dos dados, sem deixar de ser
tambm informativos.
Quando se usam grficos para apresentar os resultados de uma anlise,
esses freqentemente vm acompanhados de uma tabela. Inclui-se, muitas vezes,
um texto dissertativo, chamando a ateno do leitor para os pontos principais
revelados pelo grfico ou pela tabela.






90
2) Histograma

O histograma um grfico de barras verticais.
Cada barra proporcional freqncia (simples ou relativa) da classe que ele
representa. Assim, a soma dos valores correspondentes s reas dos retngulos
ser sempre igual freqncia total.
Para a construo do histograma utiliza-se dois eixos coordenados. No eixo
horizontal so anotados os valores individuais da varivel em estudo, ou os limites
das classes. No eixo vertical temos as freqncias.

Exemplo: Os dados a seguir representam a temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto:

43 45 49 47 52
45 51 46 44 48
51 50 52 44 48
50 49 50 46 46
49 49 51 50 49

Soluo: No R temos:
a) Crie um arquivo, y, com os dados;
b) Use o comando:
hist(y,freq=F,ylab="Frequncia",xlab="Temperatura",main="Temperatura de
efluentes",ylim = c(0, 0.2))
O resultado o grfico a seguir
91
Grfico: temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto


Exemplo: Um artigo em Technometrics (Vol. 19, 1977, pg. 425) apresenta dados
sobre taxas de octanagem de combustvel para motor, de vrias misturas de
gasolina. 20 destes resultados so apresentados a seguir:

88,5 94,7 84,3 90,1 89 89,8 91,6 90,3 90 91,5
89,9 98,8 88,3 90,4 91,2 90,6 92,2 87,7 91,1 86,7

Construa o histograma.
Soluo: No R temos:
a) Crie um arquivo, y, com os dados;
b) Use o comando:
hist(y,freq=T,ylab="Frequncia",xlab="Taxas",main="Taxa de octanagem",ylim = c(0,
10))
O resultado o grfico a seguir
92
Grfico: taxas de octanagem de combustvel para motor,
de vrias misturas de gasolina


No R temos a opo de escolher, atravs do comando nclass= argumento, o
nmero de rtngulos no histograma. Pode ocorrer que o nmero escolhido no seja
vivel. Neste caso o R faz uma aproximao vivel do nmero de retngulos.

3) Box-plot

um grfico em forma de caixa.
Nele encontramos valores numricos do tipo: o ponto de mnimo, 1 quartil,
mediana, 3 quartil e o ponto de mximo.
Dependendo da natureza dos dados estes valores podem ser iguais ou
diferentes.
Para que possamos construir o box-plot necessrio que se conhea os
dados na forma bruta ou rol.
Na construo dos grficos foi utilizado o software R.

Exemplo: Os dados a seguir representam a temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto:
93

43 45 49 47 52
45 51 46 44 48
51 50 52 44 48
50 49 50 46 46
49 49 51 50 49

Consrua o box-plot.

Soluo: Utilizando o R temos:
a) construa o vetor y com os dados;
b) utilize o comando: boxplot(y,ylab="Frequncia",xlab="Temperatura", ylim=c(42,52)
O resultado o grfico

Grfico: temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto


Exemplo: Um artigo em Technometrics (Vol. 19, 1977, pg. 425) apresenta dados
sobre taxas de octanagem de combustvel para motor, de vrias misturas de
gasolina. 20 destes resultados so apresentados a seguir:

88,5 94,7 84,3 90,1 89 89,8 91,6 90,3 90 91,5
94
89,9 98,8 88,3 90,4 91,2 90,6 92,2 87,7 91,1 86,7

Construa o box-plot.
Soluo: Utilizando o R temos:
a) construa o vetor y com os dados;
b) utilize o comando: boxplot(t,ylab="Frequncia",xlab="Taxa",ylim=c(80,100))
O resultado o grfico

Grfico: Taxas de octanagem de combustvel para motor,
de vrias misturas de gasolina


4) Ramo-e-folhas

uma forma de visualizao dos dados originais o qual nos permite ver a
distribuio dos dados sem a perda de informaes.
Permite visualizar a ordenao dos dados.
Para a construo de um grfico ramo-e-folhas tomamos como ramo os
algarismos mais a esquerda e as folhas os algarismos mais a direita. Por exemplo,
no nmero 352, o ramo 35 e a folha o 2.

95
Exemplo: Os dados a seguir representam a temperatura de efluentes em dias
consecutivos na descarga de uma estao de tratamento de esgoto:

43 45 49 47 52
45 51 46 44 48
51 50 52 44 48
50 49 50 46 46
49 49 51 50 49

Construa o grfiico ramo-e-folhas.

Soluo: Utilizando o R temos:
a) construa o vetor y com os dados;
b) utilize o comando: stem(y)
O resultado o grfico

Grfico: Temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto
The decimal point is at the |

42 | 0
44 | 0000
46 | 0000
48 | 0000000
50 | 0000000
52 | 00
Podemos utilizar o comando, scale=argumento, para melhorar a visualizao
dos dados. Veja o mesmo exemplo anterior utilizando o comndo stem(y, scale=2).

96
Grfico: Temperatura de efluentes em dias consecutivos
na descarga de uma estao de tratamento de esgoto

The decimal point is at the |

43 | 0
44 | 00
45 | 00
46 | 000
47 | 0
48 | 00
49 | 00000
50 | 0000
51 | 000
52 | 00

Exemplo: Os valores a seguir so referentes a salrios, em reais, pagos em
determinada empresa. A fonte o livro Estatstica Aplicada Gesto Empresarial.

381 389 389 418 429 430 472 486 568 1209
669 682 699 728 821 821 856 822 904 866

Construa o grfico ramo e folhas.

Soluo: Utilizando o R temos:
a) construa o vetor y com os dados;
b) utilize o comando: stem(y,scale=2)
O resultado o grfico


97
Grfico: Salrios, em reais, pagos em determinada empresa
The decimal point is 2 digit(s) to the right of the |

3 | 899
4 | 23379
5 | 7
6 | 78
7 | 03
8 | 22267
9 | 0
10 |
11 |
12 | 1

c) Considere o conjunto de dados a seguir. Eles so referentes ao nmero de telhas
estragadas em 21 lotes de um milheiro cada.

100 110 121 124 145 135 122 100 146 151 162 121 123 134 122 118 145 151 100
144 125

Construa o grfiico ramo-e-folhas.

Soluo: Utilizando o R temos:
a) construa o vetor y com os dados;
b) utilize o comando: stem(y,scale=2)
O resultado o grfico

98
Grfico: nmero de telhas estragadas em 21 lotes de um milheiro cada
The decimal point is 1 digit(s) to the right of the |

10 | 000
11 | 08
12 | 1122345
13 | 45
14 | 4556
15 | 11
16 | 2


99
Tabelas - Normalizao de Publicaes Tcnico cientificas - Ed. UFMG


6) As tabelas devem ser dotadas de um ttulo claro e conciso localizado acima
delas. So numeradas seqencialmente em todo o trabalho, com algarismos
arbicos (1, 2, 3, ...), segundo normas do IBGE.
7) No cabealho de cada coluna indica-se o seu contedo. Os ttulos das
colunaspodem ser datilografados verticalmente, se necessrio, para
economizar espao.
8) No se deve deixar nenhuma casa vazia no corpo da tabela, usando-se os
smbolos, conforme conveno internacional:

- quando, pela natureza do fenmeno, o dado no existir
Z quando o dado for rigorosamente zero
... quando no se dispuser do clculo

9) Na construo de tabelas usam-se os seguintes traos:

a) trao duplo horizontal, limitando o quadro;
b) trao simples vertical, separando a coluna indicadora das
demais e estas entre si; no corpo da tabela pode ser eliminado
desde que o nmero de colunas seja pequeno e no haja
prejuzo na leitura dos dados;
10) a tabela no deve ser fechada lateralmente, tampouco se colocam traos
horizontais separando os dados numricos.

100
Exerccios

1) Observe o histograma abaixo.

Nmero de defeitos em instrumentos
ticos
40
120
340
290
160
30
0
50
100
150
200
250
300
350
400
0 1 2 3 4 5
Nmero de defeitos
F
r
e
q
u

n
c
i
a


Complete a tabela de distribuio abaixo.

Nmero de defeitos f
i

0
1 120
2
3
4
5
Total





101
Probabilidade

Tcnicas de contagem

Fatorial

O fatorial de um nmero inteiro positivo n representado por ! n (L-se: n
fatorial).
O fatorial do nmero n obtido pela multiplicao de n por todos os inteiros
inferiores at o nmero 1.
( ) ( ) 1 2 n 1 n n ! n = K

Exemplos:
1) 24 1 . 2 . 3 . 4 ! 4 = =
2) 720 1 . 2 . 3 . 4 . 5 . 6 ! 6 = =

Por definio:
1 ! 0 =
1 ! 1 =
Observao:
! 5 . 6 ! 4 . 5 . 6 ! 6 = =
Exemplo:

Qual o valor de
! 3 ! 10
! 12

?
Soluo: 22
6
11 . 12
1 . 2 . 3 . ! 10
! 10 . 11 . 12
! 3 ! 10
! 12
= = =



Exerccio:
Muitas calculadoras ou computadores no podem calcular diretamente valores de
! 70 ou superiores. Para n muito grande, ! n pode ser aproximado por
k
10 ! n = ,
102
onde o valor de k dado por ( ) n 43429448 , 0 39908993 , 0 n log 5 , 0 n k + + = .
Calcule ! 50 utilizando a tecla fatorial da calculadora e utilizando a aproximao.

Princpio Fundamental da Contagem
Se um primeiro acontecimento pode ocorrer de
1
m maneiras distintas, um segundo
pode ocorrer de
2
m maneira distintas e, sucessivamente, um simo n
acontecimento pode ocorrer de
n
m maneiras distintas, sendo todos eventos
independentes, ento o nmero de maneiras distintas em que os n acontecimentos
ocorrem conjuntamente
n 2 1
m . . m . m K .

Exemplos:
1) Quantas placas para identificao de veculos podem ser confeccionadascom 3
letras e 3 algarismos? ( Considere 26 letras, supondo que no h nenhuma
restrio)

2) Existem 5 ruas ligando os supermercados X e Y e 3 ruas ligando os
supermercados Y e W. Quantos trajetos diferentes podem ser utilizados para irmos
de X a W, passando por Y?

Arranjo Simples

Corresponde ao estudo da quantidade de maneiras em que se pode agrupar os
objetos de uma amostra em que a ordem dos objetos seja relevante.

O nmero de arranjos simples (sem repetio) de r elementos escolhidos dentre
n elementos
( )! r n
! n
A
r , n

=

103
Exemplos:

1) No estoque de uma determinada empresa existem 8 caixas diferentes, das quais
devem ser escolhidas e empilhadas 4. De quantas maneiras podemos empilhar
estas 4 caixas?
Soluo: A ordem com que empilhamos as caixas relevante, logo temos um
problema de arranjo. Assim
( )
680 . 1
! 4 8
! 8
A
4 , 8
=

=
2) Um almoxarifado necessita organizar uma estante, destinada a armazenar
suprimentos diversos. Sabendo que existem 3 itens diferentes da rea industrial
(departamento de produo), 6 itens diferentes da rea de transporte e 3 itens
diferentes do departamento de recursos humanos. Calcule:

a) de quantas maneiras os itens poderiam ser organizados?
b) se os itens da produo precisassem necessariamente ficar juntos, quantas
maneiras de organizar todos os itens possveis?
Soluo:
a) Temos 12 itens diferentes. Ao organiz-los a ordem relevante. Assim
( )
600 . 001 . 479
! 12 12
! 12
A
12 , 12
=

=

b) Temos 3 itens diferentes da rea industrial. Os outros 9 no precisam ficar juntos.
Podemos ento considerar os 3 itens da produo como um nico bloco. Assim
teremos
( ) ( )
! 3 . ! 10
! 3 3
! 3
! 10 10
! 10
A . A
3 , 3 10 , 10
=

=

Combinao Simples

Corresponde ao estudo da quantidade de maneiras em que se pode agrupar os
objetos de uma amostra em que a ordem dos objetos seja irrelevante.

104
O nmero de combinaes simples (sem repetio) de r elementos escolhidos
dentre n elementos
( ) ! r . ! r n
! n
C
r , n

=

Exemplos:
1) Uma empresa de pesquisa mercadolgica deseja selecionar uma comisso
formada por 4 consumidores de uma amostra previamente selecionada de 8
pessoas. Calcule:

a) de quantas maneiras possveis as 4 pessoas podero ser selecionadas?
b) se a comisso fosse composta por um presidente, um vice-presidente, um relator
e um secretrio, escolhidos nessa ordem, de quantas maneiras possveis
poderemos formar a comisso?

Soluo:
a)
( )
70
! 4 . ! 4 8
! 8
C
4 , 8
=

=
b)
( )
680 . 1
! 4 8
! 8
A
4 , 8
=

=
2) Em um departamento industrial existem 8 engenheiros eletricistas e 7 tcnicos em
eletrnica. Sabendo que uma comisso dever ser formada, calcule de quantas
maneiras a comisso poder ser elaborada, supondo que:
a) 5 pessoas devem ser escolhidas.
b) 3 engenheiros e 2 tcnicos devem ser escolhidos.

Soluo:
a)
( )
003 . 3
! 5 . ! 5 15
! 15
C
5 , 15
=

=
b)
( ) ( )
176 . 1
! 2 . ! 2 7
! 7
! 3 . ! 3 8
! 8
C C
2 , 7 3 , 8
=

=
105
Clculo de Probabilidade

Definies:

Experimento Aleatrio: qualquer processo que permite ao pesquisador fazer
observaes cujos resultados no podem ser previstos com certeza.

Exemplos:
1
E : Retirar uma carta de um baralho com 52 cartas e observar seu naipe.
2
E :Jogar uma moeda 10 vezes e observar o nmero de caras obtidas.
3
E : Em uma linha de produo, fabricam-se peas em srie e conta-se o
nmero de peas defeituosas produzidas em um perodo de 24 horas.
4
E : Uma lmpada fabricada. Em seguida testada e verifica-se o tempo
de vida.
5
E : Retira-se uma bola de uma urna que contm bolas pretas, vermelhas e
amarelas e observa sua cor.

Espao Amostral: Para cada experimento E, define-se espao amostral S o
conjunto de todos os possveis resultados desse experimento.

Exemplos:

Considerando os experimentos aleatrios anteriores, o espao amostral para cada
um deles pode ser descrito como:

1
S : {ouro, copa, paus, espada}

2
S : {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

3
S : {0, 1, 2, 3, ..., N}, onde N o mximo de peas produzidas em 24 horas.

4
S : {t | t 0}

5
S : {preta, vermelha, amarela}
O espao amostral pode ser:
1. Finito: formado por um nmero limitado de resultados possveis.
106
2. Infinito enumervel: formado por um nmero infinito de resultados, os quais
podem ser listados ou enumerados.

Exemplo: nmero de mensagens que so transmitidas corretamente por dia
em uma rede de computadores.

3. Infinito: formado por intervalo de nmeros reais.

Evento: qualquer subconjunto do espao amostral.
A um evento A S

Em particular S o evento certo e o evento impossvel.
Exemplo:
Considere o experimento
E = jogar uma moeda trs vezes e observar os resultados.
Ento ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) { } k , k , k , c , k , k , k , c , k , k , k , c , c , k , c , c , c , k , k , c , c , c , c , c S =
Seja o evento: A = ocorrer pelo menos duas caras.
Ento ( ) ( ) ( ) ( ) { } c , k , c , c , c , k , k , c , c , c , c , c A =

Eventos Mutuamente Exclusivos: Dois eventos A e B so denominados
mutuamente exclusivos, se eles no puderem ocorrer simultaneamente, isto
= B A .

Exemplo:
Considere o experimento
E = jogar um dado e observar o nmero da parte de cima.
Ento { {{ { } }} } 6 5 4 3 2 1 , , , , , S = == =
Sejam os eventos: A = ocorrer um nmero par, e B = ocorrer um nmero
mpar.
Ento { } 6 , 4 , 2 A = , { } 5 , 3 , 1 B = e = B A .

Definio clssica de probabilidade
107

Dado um experimento aleatrio E, S o espao amostral e A um evento. A
probabilidade do evento A, ( ) A P , uma funo definida em S que associa a cada
evento um nmero real calculada pela relao:

( )
( )
( ) S n
A n
A P =
Onde: ( ) A n : o nmero de vezes em que o evento A pode ocorrer
( ) S n : o nmero de vezes em que o espao amostral S pode ocorrer

Obs: Ao expressar a probabilidade devemos faz-la utilizando as fraes ordinrias
ou com 4 casas decimais.

Exemplos:
1. Considere um baralho com 52 cartas. Qual a probabilidade de se retirar uma
carta de ouro?
Soluo: Em um baralho temos 13 cartas de ouro. Logo considerando o evento A
= retirar uma carta de ouro temos ( )
4
1
52
13
A P = =

2. Num lote de 12 peas, 4 so defeituosas; duas peas so retiradas
aleatoriamente. Qual a probabilidade de ambas serem defeituosas?
Soluo: Evento A = ambas peas so defeituosas.
Nmero de maneiras do evento A ocorrer =
( )
6
! 2 . ! 2 4
! 4
2
4
=

=
|
|

\
|
.
Nmero de maneiras do espao S ocorrer =
( )
66
! 2 . ! 2 12
! 12
2
12
=

=
|
|

\
|
.
Logo ( )
11
1
66
6
A P = = .
3. A MasterCard International efetuou um estudo de fraude em cartes de
crdito. Os resultados esto apresentados na tabela a seguir.

108
Tabela: Tipos de fraude em cartes de crdito
Tipo de fraude Nmero de ocorrncia
Carto roubado 243
Carto falsificado 85
Pedido por correio/ telefone 52
Outros 46

Selecionando aleatoriamente um caso de fraude, qual a probabilidade de:
a) a fraude resultar de um carto roubado?
b) A fraude no ser de carto falsificado?
Soluo:
a) Considere o evento A = carto roubado. Logo
( ) 5704 , 0
426
243
A P = = .
b) Considere o evento B = carto no falsificado. Ento
( ) 8005 , 0
426
341
B P = =

Propriedades da probabilidade

Para cada evento A associado um nmero real ( (( ( ) )) ) A P com as seguintes
propriedades:
1) ( (( ( ) )) ) 1 0 A P
2) ( (( ( ) )) ) 1 = == = S P
3) Se A e B forem eventos mutuamente exclusivos ento
( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) B P A P B A P + ++ + = == =

Eventos complementares: Dois eventos A e B so complementares quando A U B
= S. Neste caso vale a propriedade ( ) ( ) 1 B P A P = + .
Neste caso simbolizamos
c
A B =

Exemplo: O evento A = chuva e o evento B = no chuva so complementares.
109

Evento Composto: qualquer evento que combina dois ou mais eventos simples.

Exemplo: No lanamento de um dado considere o evento A = {2,5}.

Regra da Adio: Se A e B so dois eventos quaisquer, ento:
( ) ( ) ( ) ( ) B A P B P A P B A P + =

Observaes:
( ) B A P denota a probabilidade do evento A, ou do evento B, ou de
ambos.
( ) B A P denota a probabilidade do evento A e do evento B
simultaneamente em um mesmo experimento.

Exemplos:
1) As preferncias de homens e mulheres por cada gnero de filme alugado em uma
locadora de vdeos, esto apresentados na tabela a seguir:
Tabela: Preferncia de homens e mulheres por filmes
Sexo / Filme Comdia Romance Policial
Homens 136 92 248
Mulheres 102 195 62

Sorteando-se ao acaso uma dessas locaes de vdeo, pergunta-se a probabilidade
de:
a) Uma mulher ter alugado um filme ou o filme do gnero policial;
b) Um homem ter alugado um filme ou o filme do gnero romance.
Soluo:
a) Considere os eventos
A = mulher aluga o filme e
B = Filme do gnero policial
( ) ( ) ( ) ( ) B A P B P A P B A P + =
110
( ) 7269 , 0
835
607
835
62
835
310
835
359
B A P = = + =
b) Considere os eventos
A = homem aluga o filme e
B = Filme do gnero romance
( ) ( ) ( ) ( ) B A P B P A P B A P + =
( ) 8036 , 0
835
671
835
92
835
287
835
476
B A P = = + =

2) Uma loja de material de construo possui 2 caixas de conexes. Na primeira,
das 30 conexes 11 so defeituosas. Na segunda, das 12 conexes 4 so
defeituosas. Uma conexo retirada aleatoriamente. Qual a probabilidade de a
conexo ser defeituosa ou ter sido retirada da segunda caixa?
Soluo:
a) Considere os eventos
A = conexo defeituosa.
B = conexo retirada da segunda caixa.
( ) ( ) ( ) ( ) B A P B P A P B A P + =
( ) 5476 , 0
42
23
42
4
42
12
42
15
B A P = = + =
Obs: Este exemplo pode ser melhor visualizado utilizando a rvore de probabilidade.
Ou seja:
111

Regra da Multiplicao: Se A e B so dois eventos quaisquer, ento:

( ) ( ) ( ) B P . A P B A P = se A e B so independentes ou
( ) ( ) ( ) A | B P . A P B A P = se A e B so dependentes

Notao: ( ) A | B P representa a probabilidade de ocorrncia do evento B dado que o
evento A ocorreu. chamado de probabilidade condicional.

Dois eventos A e B so independentes se a ocorrncia de um deles no
afeta a probabilidade de ocorrncia do outro. Caso contrrio eles so
dependentes.

Exemplos:
1) Uma determinada companhia produz um lote de 50 filtros de combustveis, dos
quais 6 so defeituosos. Escolhem-se aleatoriamente e testam-se dois filtros do lote.
Determine a probabilidade de ambos serem bons, se os filtros so selecionados:
a) com reposio;
b) sem reposio.

Soluo: Considere os eventos
A = filtro bom.
112
B = filtro bom.
a) Como processo de escolha com reposio, ento a escolha do primeiro filtro
no afeta a escolha do segundo filtro. Logo so independentes. Assim
( ) ( ) ( ) B P . A P B A P =
( ) 7744 , 0
2500
1936
50
44
50
44
B A P = = =
b) Como processo de escolha sem reposio, ento a escolha do primeiro filtro
afeta a escolha do segundo filtro. Logo so dependentes. Assim
( ) ( ) ( ) A | B P . A P B A P =
( ) 7722 , 0
2450
1892
49
43
50
44
B A P = = =

2) Uma loja de material de construo possui 2 caixas de conexes. Na primeira,
das 30 conexes 11 so defeituosas. Na segunda, das 12 conexes 4 so
defeituosas. Uma conexo retirada aleatoriamente de cada caixa. Calcule a
probabilidade de:

a) Apenas uma ser defeituosa.
b) Ambas serem defeituosas.
c) Ambas no serem defeituosas.
Soluo:
a) Podemos ter os seguintes casos: DB ou BD. Assim
Caso 1:
A = defeituosa na primeira
B = boa na segunda.
( ) ( ) ( ) B P . A P B A P =
( ) 2444 , 0
360
88
12
8
30
11
B A P = = =
Caso 2:
A = defeituosa na segunda
B = boa na primeira.
( ) ( ) ( ) B P . A P B A P =
113
( ) 2111 , 0
360
76
30
19
12
4
B A P = = =
Portanto a probabilidade de apenas uma ser defeituosa de
( ) 4555 , 0 2111 , 0 2444 , 0 defeituosa uma apenas P = + =
b) 12,22%.
c) 42,22%.
114

Teorema da probabilidade total

Considere o espao amostral particionado em k eventos,
k 2 1
A , , A , A K , satisfazendo s seguintes condies:
a) =
j i
A A para todo j i .
b) S A A A
k 2 1
= K .
c) ( ) 0 A P
i
para k i , , 2 , 1 K = .
Seja um evento F qualquer, referente ao espao amostral S . Ento:
( ) ( ) ( )

=
=
k
1 i
i i
A | F P A P F P

Demonstrao: Considere F um evento qualquer em S. Ento
( ) ( ) ( )
k 2 1
A F A F A F F = K
Usando a regra do produto teremos
( ) ( ) ( ) ( )
k 2 1
A F P A F P A F P F P + + + = K
Usando a regra do produto teremos o teorema da probabilidade total
( ) ( ) ( ) ( ) ( ) ( ) ( )
k k 2 2 1 1
A | F P A P A | F P A P A | F P A P F P + + + = K
( ) ( ) ( )

=
=
k
1 i
i i
A | F P A P F P
Cqd.

Exemplo:
Uma determinada pea manufaturada por trs fbricas, denominadas X, Y e Z.
Sabe-se que X produz o dobro de peas que Y, e Y e Z produzem o mesmo
nmero de peas. Sabe-se tambm que 2% das peas produzidas por X e Y so
defeituosas, enquanto que 4% das produzidas por Z so defeituosas. Todas as
peas so colocadas em um depsito, e depois uma pea extrada
aleatoriamente. Qual a probabilidade de que a pea escolhida seja defeituosa?
115
Soluo:Considere os seguintes eventos
F = a pea defeituosa
1
A = a pea provm da fbrica X.
2
A = a pea provm da fbrica Y.
3
A = a pea provm da fbrica Z.
Empregando o teorema da probabilidade total temos
( ) ( ) ( ) ( ) ( ) ( ) ( )
3 3 2 2 1 1
A | F P A P A | F P A P A | F P A P F P + + =
Sabe-se que:
( )
2
1
A P
1
=
( )
4
1
A P
2
=
( )
4
1
A P
3
=
( ) ( ) 02 , 0 A | F P A | F P
2 1
= =
( ) 04 , 0 A | F P
3
=
Logo
( ) 0250 , 0 04 , 0
4
1
02 , 0
4
1
02 , 0
2
1
F P = + + =
Assim, a probabilidade da pea ser defeituosa de 0,0250 ou 2,50%.

116

Teorema de Bayes (Thomas Bayes 1702 - 1761)

Considere o espao amostral particionado em k eventos,
k 2 1
A , , A , A K , satisfazendo s seguintes condies:
a) =
j i
A A para todo j i .
b) S A A A
k 2 1
= K .
c) ( ) 0 A P
i
para k , , 2 , 1 i K = .
Seja um evento F qualquer, referente ao espao amostral S . Ento:
( )
( ) ( )
( ) F P
A | F P A P
F | A P
i i
i
=

Exemplo:
1) (voltando ao exemplo anterior) Uma determinada pea manufaturada por trs
fbricas, denominadas X, Y e Z. Sabe-se que X produz o dobro de peas que Y, e Y
e Z produzem o mesmo nmero de peas. Sabe-se tambm que 2% das peas
produzidas por X e Y so defeituosas, enquanto que 4% das produzidas por Z so
defeituosas. Todas as peas so colocadas em um depsito, e depois uma pea
extrada aleatoriamente. Qual a probabilidade de que a pea escolhida seja
produzida pela fbrica Y dado que ela era defeituosa?
Soluo:Considere os seguintes eventos
F = a pea defeituosa
1
A = a pea provm da fbrica X.
2
A = a pea provm da fbrica Y.
3
A = a pea provm da fbrica Z.
Sabe-se que:
( ) 0250 , 0 F P = (pelo exemplo anterior)
( )
4
1
A P
2
=
( ) ( ) 02 , 0 A | F P A | F P
2 1
= =
Logo
117
( )
( ) ( )
( ) F P
A | F P A P
F | A P
2 2
2
=
( )
0250 , 0
02 , 0
4
1
F | A P
2

=
( )
0250 , 0
005 , 0
F | A P
2
=
( ) 2000 , 0 F | A P
2
=

2) Uma rede local de computadores composta por um servidor e cinco clientes (A,
B, C, D e E). Registros anteriores indicam que dos pedidos de determinado tipo de
processamento, realizados atravs de uma consulta, cerca de 10% vm do cliente A,
15% do B, 15% do C, 40% do D e 20% do E. Se o pedido no for feito de forma
adequada, o processamento apresentar erro. Usualmente, ocorrem os seguintes
percentuais de pedidos inadequados: 1% do cliente A, 2% do cliente B, 0,5% do
cliente C, 2% do cliente D e 8% do cliente E.
a) Qual a probabilidade de o sistema apresentar erro?
b) Qual a probabilidade de que o processo tenha sido pedido pelo cliente E,
sabendo-se que apresentou erro?

3) Um novo mtodo analtico de detectar poluentes em gua testado. Esse novo
mtodo de anlise qumica importante porque, se adotado, poderia ser usado para
detectar trs diferentes contaminantes: poluentes orgnicos, solventes volteis e
compostos clorados, em vez de ter de usar um nico teste para cada poluente.

As pessoas que elaboraram o teste afirmam que ele pode detectar altos nveis de
poluentes orgnicos com 99,7% de acurcia, solventes volteis com 99,95% de
acurcia e composto clorados com 89,7% de acurcia.

Se um poluente no estiver presente, o teste no sinaliza.

118
Amostras so preparadas para calibrao do teste e 60% delas so contaminadas
com poluentes orgnicos, 27% com solventes volteis e 13% com traos de
compostos clorados.

Uma amostra teste selecionada aleatoriamente.

a) Qual a probabilidade de o teste sinalizar?

b) Se o teste sinalizar, qual a probabilidade de os compostos clorados estarem
presentes?

Exerccios:

1) As preferncias de homens e mulheres por cada gnero de filme alugado em
uma locadora de vdeos, esto apresentados na tabela a seguir:

Sexo / Filme Comdia Romance Policial
Homens 136 92 248
Mulheres 102 195 62

Sorteando-se ao acaso uma dessas locaes de vdeo, pergunta-se a probabilidade
de:
c) Uma mulher ter alugado um filme e o filme ser de comdia;
d) Um homem ter alugado um filme e o filme ser de romance.

2) Uma determinada companhia produz um lote de 50 filtros de combustveis, dos
quais 6 so defeituosos. Escolhem-se aleatoriamente e testam-se dois filtros do lote.
Determine a probabilidade de ambos serem bons, se os filtros so selecionados:
c) com reposio;
d) sem reposio.

3) Joga-se dois dados equilibrados e soma-se os dois resultados. Qual a
probabilidade de se obter o total 5 ?

119
4) Se 226 dentre 300 assinantes de um jornal, selecionado aleatoriamente,
afirmaram que lem a seo cmica diariamente. Qual a probabilidade de um
assinante escolhido aleatoriamente no ler a seo cmica?

5) Diga se cada afirmao verdadeira ou se ela falsa.

a. Espao amostral o conjunto de todos os resultados possveis de um
experimento.
b. Se dois eventos no podem ocorrer ao mesmo tempo eles so chamados de
mutuamente excludentes.
c. A regra da adio usada para encontrar a probabilidade de dois eventos
ocorrerem simultaneamente.
d. A amostra um subconjunto da populao. Em todo experimento a amostra pode
ser igual populao.
e. Dado x um evento, ento ( (( ( ) )) ) 1 x P 0 < << < < << < .

6) Dois dados so lanados simultaneamente. Qual a probabilidade de o primeiro
resultado ser maior do que o segundo?

7) Um grupo de 100 alunos de dois cursos de uma faculdade foram escolhidos para
responderem a uma pesquisa. A tabela a seguir apresenta a composio destes
alunos:

Matemtica Pedagogia
Homens 31 10
Mulheres 23 36

Selecionando aleatoriamente um aluno:
a) qual a probabilidade dele ser homem ou ser do curso de Pedagogia?
b) qual a probabilidade dela ser mulher dado que do curso de Matemtica?

8) Uma livraria acaba de receber 40 novos livros, entre eles 12 romances histricos.
Se quatro desses livros so escolhidos aleatoriamente, e sem reposio, qual a
120
probabilidade de nenhum deles ser romance histrico? (Expressar o resultado em
frao)

9) A tabela a seguir apresenta o nmero de pacientes internados no hospital X, por
Alas.

Sexo e Nmero
Alas Masculino Feminino

Total
A 415 220 635
B 250 375 595
C 105 220 325
Total 740 815 1555

A probabilidade de um paciente selecionado aleatoriamente ser do sexo feminino ou
estar internado na ala A de:

10) Complete com V se a afirmao for verdadeira e com F se for falsa.

a. ( ) Espao amostral o conjunto de todos os resultados possveis de um
experimento.

b. ( ) Se dois eventos podem ocorrer ao mesmo tempo eles so chamados de
mutuamente excludentes.

c. ( ) A regra da multiplicao usada para encontrar a probabilidade de dois
eventos ocorrerem simultaneamente.

d. ( ) A amostra um subconjunto da populao. Em todo experimento a amostra
nunca ser igual populao.

e. ( ) Dado x um evento, ento ( ) 1 0 < x P .

121
11) Dois dados so lanados simultaneamente. Qual a probabilidade de o primeiro
resultado ser menor do que o segundo?

12) Um grupo de 100 alunos de dois cursos de uma faculdade foram escolhidos para
responderem a uma pesquisa. A tabela a seguir apresenta a composio destes
alunos:

Matemtica Pedagogia
Homens 31 10
Mulheres 23 36

Selecionando aleatoriamente um aluno(a):
a) qual a probabilidade dele ser homem e ser do curso de Pedagogia?

b) qual a probabilidade dela ser mulher ou ser do curso de Matemtica?

13) Uma livraria acaba de receber 40 novos livros, entre eles 12 romances
histricos. Se um desses livros escolhido aleatoriamente, e sem reposio, qual a
probabilidade dele ser romance histrico? (Expressar o resultado em frao)

14) Quais dos valores abaixo no podem ser probabilidade?

0 ; 0,0001; -0,2 ; 3/2 ; 2/3 ; 2 ; 2 , 0

15) Quanto P(A), se A o evento Fevereiro tem 30 dias este ano?
16) Quanto P(A), se A o evento Novembro tem 30 dias este ano?
17) Qual a probabilidade do resultado cara ao jogar uma moeda?
122
18) A MasterCard International efetuou um estudo de fraude em cartes de crdito.
Os resultados esto na tabela a seguir

Tipo de fraude Nmero
Carto roubado 243
Carto falsificado 85
Pedido por correio/ telefone 52
Outros 46

Selecionado aleatoriamente um caso de fraude, qual a probabilidade de a fraude
resultar de um carto falsificado?
19) Um casal planeja ter 2 filhos.
a) Relacione os diferentes resultados, de acordo com o sexo de cada criana.
b) Determine a probabilidade de o casal ter 2 meninas
c) Determine a probabilidade de exatamente uma criana de cada sexo.

20) Em um teste com 3 questes do tipo verdadeiro/falso, um estudante que no
est preparado deve responder cada uma aleatoriamente.
a) Relacione os diferentes resultados possveis.
b) Qual a probabilidade de responder corretamente todas as trs questes?
c) Qual a probabilidade de palpitar incorretamente todas as trs questes?
d) Qual a probabilidade de acertar duas questes?

21) Diga se os dois eventos so mutuamente excludentes:
a. Escolha de um espectador de televiso do sexo masculino;
b. Escolha de algum que raramente utiliza o controle remoto.

22) Diga se os dois eventos so mutuamente excludentes:
c. Girar uma roleta e obter um nmero 7;
d. Girar uma roleta e obter um nmero par.

23) De um conjunto de cinco empresas, deseja-se selecionar, aleatoriamente, uma
empresa, mas com probabilidade proporcional ao nmero de funcionrios. O nmero
de funcionrios da Empresa A 20; de B 15; de C 7; de D 5 e de E 3.
123
a) Qual a probabilidade de cada uma das empresas ser selecionada?
b) Qual a probabilidade de a Empresa A no ser

Selecionada?
24) Se 4 , 0 ) ( = A P e 5 , 0 ) ( = B P , o que se pode dizer quanto a ) ( B A P se A e B so
eventos mutuamente exclusivos?
25) Num lote de 12 peas, 4 so defeituosas; trs peas so retiradas
aleatoriamente. Calcule:
a. A probabilidade de ambas serem defeituosas.
b. A probabilidade de ambas no serem defeituosas.
c. A probabilidade de ao menos uma ser defeituosa.
26) Um lote formado por 10 peas boas, 4 com defeitos leves e 2 com defeitos
graves. Uma pea escolhida aleatoriamente. Calcule a probabilidade de:
a. Ela no tenha defeitos graves.
b. Ela no tenha defeito.
c. Ela ou seja boa ou tenha defeitos graves.
27) Trs mquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total
de peas de uma fbrica. As porcentagens de peas defeituosas nass respectivas
mquinas so 3%, 5% e 2%. Uma pea selecionada aleatoriamente e verifica-se
que defeituosa. Qual a probabilidade de que a pea tenha vindo da mquina B?
28) A probabilidade de o aluno X resolver um problema de 3/5 e a do aluno Y
resolver o mesmo problema de 4/7. Qual a probabilidade de que o problema seja
resolvido?
29) Um grupo de 15 elementos apresenta a seguinte composio:

Homem Mulher
Menores 5 3
Adultos 5 2

Um elemento escolhido ao acaso. Pergunta-se:
a. Qual a probabilidade de ser homem?
b. Qual a probabilidade de ser adulto?
c. Qual a probabilidade de ser mulher e menor?
124
d. Sabendo-se que o elemento escolhido adulto, qual a probabilidade de ser
homem?
e. Dado que a escolhida mulher, qual a probabilidade de ser menor/

30) Suponha que um fabricante de sorvete recebe 20% de todo o leite que utiliza de
uma fazenda
1
F , 30% de uma outra fazenda
2
F e 50% de
3
F . Um rgo de
fiscalizao inspecionou as fazendas de surpresa, e observou que 20% do leite
produzido por
2
F estava adulterado por adio de gua, enquanto que para
2
F e
3
F , essa proporo era de 5% e 2%, respectivamente. Na indstria de sorvetes os
gales de leite so armazenados em um refrigerador sem identificao das
fazendas. Para um galo escolhido ao acaso, dado que ele foi adulterado, calcule:
a) a probabilidade de que o leite tenha sido produzida pela fazenda
1
F
b) a probabilidade de que o leite tenha sido produzida pela fazenda
2
F
c) a probabilidade de que o leite tenha sido produzida pela fazenda
3
F
31) Uma companhia que fura poos artesianos trabalha numa regio escolhendo
aleatoriamente o ponto de furo. No encontrando gua nessa tentativa, sorteia outro
local e, caso tambm no tenha sucesso, faz uma terceira e ltima tentativa. Admita
probabilidade de 0,7 de encontrar gua em qualquer ponto dessa regio. Calcule a
probabilidade de:
a) encontrar gua na segunda tentativa.
b) encontrar gua em at duas tentativas
encontrar gua.

32) Pastilhas utilizadas na fabricao de semicondutores podem estar
contaminadas. A tabela a seguir apresenta um histrico de pastilhas produzidas por
uma indstria.

Localizao na ferramenta de recolhimento
Contaminao Centro Borda Total
Baixa 514 68 582
Alta 112 246 358
Total 626 314
125
Selecionando-se aleatoriamente uma pastilha qual a probabilidade dela ter alta
contaminao ou a pastilha esteja no centro de uma ferramenta de recolhimento?

126
Distribuies de probabilidade

Varivel Aleatria

Definio:
Sejam E um experimento e S o espao amostral associado ao experimento.
Uma funo X, que associe a cada elemento S s um nmero real ( (( ( ) )) ) s X
denominada varivel aleatria.

Veja a ilustrao


Exemplo:
E: Lanamento de duas moedas;
X: Nmero de caras obtidas nas duas moedas;
( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) ) { {{ { } }} } k , k , c , k , k , c , c , c S = == = , onde c= cara e k= coroa;
A varivel aleatria X pode assumir os valores 0, 1 e 2.

Outros exemplos de variveis aleatrias:
2. X: nmero de acidentes com avies de uma determinada companhia;
3. X: nmero de mulheres entre 10 empregados recm-admitidos;
4. X: nmero de peas produzidas por uma empresa em determinado dia;
5. X: altura de um adulto do sexo masculino selecionado aleatoriamente.

127

Definies:

Uma varivel aleatria discreta admite um nmero finito de valores ou um nmero
infinito enumervel de valores.

Exemplo:
a. O nmero de espectadores que vem um filme.
b. Nmero de peas produzidas em um dia.

Uma varivel aleatria contnua admite um nmero infinito de valores, e esses
valores podem ser associados a mensuraes em uma escala contnua.

Exemplo:
a) A voltagem em uma pilha.
b) Quantidade de leite em um copo.

Distribuio de Probabilidade

Dada uma varivel aleatria discreta, podemos identificar:
1) Quais os possveis resultados podem ocorrer;
2) Qual a probabilidade de cada resultado ocorrer.
Por exemplo: No lanamento de duas moedas no viciadas, o nmero de caras
possveis e suas probabilidades dada por:
128
Tabela: Distribuio de probabilidade do n
de caras no lanamento de duas moedas
N de caras
x
Probabilidade
0 1/4
1 2/4
2 1/4
Total 1

Assim, definimos:
A Distribuio de probabilidade de uma varivel aleatria X a descrio do
conjunto de probabilidades associadas aos possveis resultados de X. Podemos
tambm cham-la de funo de probabilidade.
Simbolicamente temos: ... , 2 , 1 ) ( ) ( = = = i com x X P x p
i i


No caso do exemplo anterior temos:
4
1
) 2 X ( P ) 2 ( p
4
2
) 1 X ( P ) 1 ( p
4
1
) 0 X ( P ) 0 ( p
= = =
= = =
= = =

O grfico da distribuio de probabilidade dada por:

129
Grfico: Distribuio de probabilidade do nmero
de caras no lanamento de duas moedas

A funo de probabilidade deve satisfazer s seguintes propriedades:
1) 0 ) (
i
x p ;
2) 1 ) ( =

i
i
x p .
Funo de distribuio acumulada
Podemos tambm representar uma distribuio de probabilidade por sua
funo de distribuio acumulada definida por:
= x x X P x F ), ( ) (
onde o conjunto dos nmeros naturais.

Obs.: A distribuio acumulada descreve a probabilidade de ocorrer um valor at x.
Exemplo: No lanamento de duas moedas no viciadas, a distribuio acumulada do
nmero de caras possveis dada por:
( )

=
2 1
1
4
3
0
4
1
x se
x se
x se
x F

130
Tabela: Distribuio de probabilidade acumulada do n
de caras no lanamento de duas moedas
Valores possveis
x
Distribuio acumulada
0 1/4
1 3/4
2 4/4

Na tabela acima temos:
( )
4
1
0 ) 0 ( ) 0 ( = = = = X P X P F
( ) ( )
4
3
1 0 ) 1 ( ) 1 ( = = + = = = X P X P X P F
( ) ( ) ( )
4
4
2 1 0 ) 2 ( ) 2 ( = = + = + = = = X P X P X P X P F

O grfico da distribuio acumulada da varivel X = nmero de caras em dois
lanamentos :

Grfico: Distribuio acumulada de probabilidade do nmero
de caras no lanamento de duas moedas

Valor esperado
A mdia ou valor esperado de uma varivel aleatria X dado por:

=
= =
k
1 i
i i
) x ( p . x ) X ( E
131

Varincia
A varincia de uma varivel aleatria X dada por:
( )
2 2 2 2
) ( ) ( = =
i i
x p x X E X Var

Exemplo: No lanamento de duas moedas no viciadas, a mdia e a varincia so
dadas por:
Valores possveis
x
Probabilidade
p(x)
( )
i i
x p x

( )
i
2
i
x p x

0 1/4 0 0
1 2/4 2/4 2/4
2 1/4 2/4 1
Total 1 1 1,5

Assim

=
= =
k
1 i
i i
1 ) x ( p . x

5 , 0 1 5 , 1 ) X ( E ) X ( Var
2 2
= = =


Exerccios
1) Num lote de 12 peas, 4 so defeituosas. Duas peas so retiradas
aleatoriamente sem reposio. Resolva:
a) Encontre a distribuio de probabilidade associada a varivel aleatria
X = nmero de peas defeituosas.
b) Faa o grfico do resultado obtido na letra a.
c) Encontre a distribuio acumulada de X.
d) Faa o grfico do resultado obtido na letra c
e) Encontre a mdia de peas defeituosas, ou seja, a mdia de X.
f) Encontre a varincia do nmero de peas defeituosas, ou seja, a varincia de X.
2) Considere o lanamento de um dado honesto. Encontre a distribuio de
probabilidade associada ao resultado da face deste dado.
132
3) Suponha ( )
5
x
x P = (onde x assume valores 0, 1, 2, 3). ( ) x P Define uma
distribuio de probabilidade?
4) Suponha ( )
3
x
x P = (onde x assume valores 0, 1, 2). ( ) x P Define uma distribuio
de probabilidade?
5) Suponha ( )
( ) [ ] ! x ! x 3 4
3
x P

= (onde x assume valores 0, 1, 2, 3). ( ) x P Define uma


distribuio de probabilidade?
6) O peso de um livro escolhido aleatoriamente uma varivel aleatria discreta ou
contnua?
7) O custo de uma pea escolhida aleatoriamente uma varivel aleatria discreta
ou contnua?
8) Suponha que a varivel aleatria discreta x possa tomar os valores 1, 2, 3, ..., n e
que esses valores sejam igualmente provveis. Mostre que
( )
2
1 n +
= e
( )
12
1 n
2
2

=
Pricipais propriedades:
Considere c constante e X e Y variveis aleatrias.
Mdia Varincia
E(c) = c V(c) = 0
E(X+c) = E(X) + c V(X + c) = V(X)
E(cX) = c E(X) V(cX) = c
2
V(X)
E(X+Y) = E(X) + E(Y) DP(cX) = |c| DP(X)
E(X-Y) = E(X) - E(Y)

133

Distribuies discretas de probabilidade

Para motivar suponha a seguinte situao:
Num lote de 12 peas, 4 so defeituosas. Trs peas so retiradas
aleatoriamente. Calcule:
a) Qual a probabilidade de apenas uma ser defeituosa, considerando retiradas com
reposio?
b) Qual a probabilidade de a primeira pea defeituosa ser a 3 pea, considerando
retiradas com reposio?
c) Qual a probabilidade de apenas uma ser defeituosa, considerando retiradas sem
reposio?
Cada uma destas perguntas tem uma soluo diferente. Passaremos agora a
explicar os mtodos necessrios para a soluo das mesmas.

I) Distribuio Binomial

Premissas assumidas pelo modelo binomial:
a) n provas (ou experimentos) independentes e do mesmo tipo so realizadas;
b) cada prova admite apenas dois resultados: sucesso e falha;
c) a probabilidade de sucesso em cada prova p } sucesso { P = constante em todo o
experimento. Neste caso consideramos amostragem aleatria com reposio.

A probabilidade da varivel X assumir certo valor x, pertencente ao conjunto {0, 1, 2,
...} dada por
x n x
p p
x
n
x X P

|
|

\
|
= = ) 1 .( . ) (
Onde p . n ) X ( E = e ) p 1 .( p . n ) X ( Var = .

Exerccios:
1) Num lote de 12 peas, 4 so defeituosas; duas peas so retiradas
aleatoriamente e com reposio. Calcule:
a) Qual a probabilidade de ambas serem defeituosas?
b) Qual a probabilidade de apenas uma ser defeituosa?
134
Soluo:
a) Usando probabilidade (regra da multiplicao) temos
( )
9
1
12
4
12
4
A P = = .
Resolvendo usando a distribuio binomial temos:
Seja A: uma pea ser defeituosa. Ento ( )
12
4
p A P = = . Assim a probabilidade de
retirar duas peas defeituosas :
9
1
144
16
)
12
8
.(
12
4
.
2
2
)
12
4
1 .(
12
4
.
2
2
) 2 (
0
2
2 2
2
= =
|

\
|
|
|

\
|
=
|

\
|
|
|

\
|
= =

X P
b) Exerccio

2) Cada amostra de ar tem 10% de chance de conter um determinado poluente
orgnico. Considere que as amostras sejam independentes com relao presena
do poluente. Determine:
a) a probabilidade de que nas prximas 18 amostras exatamente 2 contenham o
poluente.
b) a probabilidade de que no mnimo quatro amostras contenham o poluente.
c) a probabilidade de que 7 3 < X .
Soluo:
a) ( ) 2835 , 0 ) 1 , 0 1 .( 1 , 0 .
2
18
) 2 (
2 18 2
=
|
|

\
|
= =

X P

b) ( ) ( ) 098 , 0 ) 1 , 0 1 .( 1 , 0 .
18
1 4 1 ) 4 (
3
0
18
=
|
|

\
|
= < =

=

x
x x
x
X P X P

c) ( ) 265 , 0 ) 1 , 0 1 .( 1 , 0 .
18
) 7 3 (
6
3
18
=
|
|

\
|
= <

=

x
x x
x
X P

3) Dados histricos mostram que 5% dos itens provindos de um fornecedor
apresentam algum tipo de defeito. Considerando um lote de 20 itens, calcule a
probabilidade de (com reposio):
a) haver algum item com defeito;
b) haver exatamente dois itens defeituosos;
c) haver mais de dois itens defeituosos;
d) qual o nmero esperado de itens defeituosos?
135
e) e de itens bons?

4) Se 7% das lmpadas de certa marca so defeituosas, achar a probabilidade de
que, numa amostra de 100 lmpadas, escolhidas ao acaso e com reposio,
tenhamos trs defeituosas.

5) Seja X uma varivel aleatria binomial com 10 = n e 5 , 0 = p . Determine as
seguintes probabilidades:
a) ( ) 5 = X P
b) ( ) 2 X P
c) ( ) 5 2 < X P
6) As linhas telefnicas em um sistema de reservas de uma companhia area esto
ocupadas 40% do tempo. Suponha que os eventos em que as linhas estejam
ocupadas em sucessivas chamadas sejam independentes. Considere que 10
chamadas aconteam.
a) qual a probabilidade de que para exatamente trs chamadas as linhas estejam
ocupadas?
b) qual a probabilidade de que para no mnimo uma chamada as linhas estejam
ocupadas?
c) qual o nmero esperado de chamadas em que as linhas estejam ocupadas?

II) Distribuio geomtrica

Se um caso satisfaz todas as condies de um experimento binomial, exceto
pelo fato de o nmero de provas no ser fixo, ento aplicamos a distribuio
geomtrica.
A distribuio geomtrica se aplica quando estamos interessados na
probabilidade de o primeiro sucesso ocorrer em determinada prova.
Para que o sucesso ocorra, por exemplo na sima x prova, deve-se ser precedido
por 1 x fracassos, cuja probabilidade ( )
1 x
p 1

.


136
A distribuio chamada geomtrica porque seus valores sucessivos
constituem uma progresso geomtrica.
Considere um experimento E e uma varivel aleatria X com
probabilidade de sucesso p. Se X tem distribuio geomtrica, ento a
probabilidade de X obter sucesso na x-sima prova dada por

( ) ( ) L , 3 , 2 , 1 , 1
1
= = =

x p p x X P
x

onde
( )
( )
( )
2
1
1
p
p
X Var
p
X E

=
=



Exerccios;
1) Num lote de 12 peas, 4 so defeituosas. Seleciona-se aleatoriamente 5 peas,
com reposio. Qual a probabilidade de a primeira pea defeituosa ser a 3 pea
escolhida?
Soluo: A probabilidade de uma pea ser defeituosa
( ) 3333 , 0
12
4
defeito p = =

Escolhida 5 peas, a probabilidade da primeira pea defeitosa ser a 3
( ) ( ) 1481 , 0 3333 , 0 1 3333 , 0 3
2
= = = X P

2) A probabilidade de uma pastilha conter uma partcula grande de contaminao
de 0,01. Se for considerado que as pastilhas sejam independentes, qual ser a
probabilidade de que exatamente 125 pastilhas necessitem ser analisadas antes que
uma partcula grande seja detectada?
Soluo:
Seja x: o nmero de amostras analisadas at que uma partcula grande seja
detectada. Ento X uma varivel aleatria geomtrica com 01 , 0 = p . A
probabilidade ento :
( ) ( ) ( ) 0029 , 0 01 , 0 99 , 0 125
124
= = = X P
137

3) A probabilidade de uma criana contrair uma doena contagiosa, qual est
exposta 0,70. Qual a probabilidade de a stima criana exposta doena ser a
primeira a contra-la?

11
1
2
8 4
2 2
8
2
4
) 2 ( =
|
|

\
| +
|
|

\
|

|
|

\
|
= = X P


IV) Distribuio de Poisson

Suponha que queremos avaliar o nmero de ocorrncia de um evento por
unidade de tempo, de comprimento, de rea, de volume, etc.

Exemplo:
a) nmero de consultas em uma base de dados por minuto;
b) nmero de erros de tipografia em um formulrio;
Se tivermos:
a) Independncia entre as ocorrncias do evento e
b) Os eventos ocorrerem de forma aleatria,

Ento a probabilidade da varivel aleatria X assumir um determinado valor dada
por
... , 1 , 0
!
.
) ( = = =

x com
x
e
x X P
x


Onde = = ) X ( Var ) X ( E .

Exerccios:
1) Suponha que as consultas num banco de dados ocorrem de forma independente
e aleatria, com uma taxa mdia de trs consultas por minuto. Qual a probabilidade
de que no prximo minuto ocorram:
a) nenhuma consulta?
138
b) uma consulta?
c) duas consultas?
d) menos do que trs consultas?

Soluo:
Seja = taxa mdia = 3 consultas/min.
a) Queremos a probabilidade de no ter consulta no prximo minuto, ou seja,
x = 0. Assim
0498 , 0
1
1 0498 , 0
! 0
3 .
) 0 (
0 3
=

= = =

e
X P

Portanto a probabilidade de, no prximo minuto, ter nenhuma consulta 0,0498.
b) Queremos a probabilidade de ter 1 consulta no prximo minuto, ou seja,
x = 1. Assim
1494 , 0
1
3 0498 , 0
! 1
3 .
) 1 (
1 3
=

= = =

e
X P

Portanto a probabilidade de, no prximo minuto, ter uma consulta 0,1494.
c) Queremos a probabilidade de ter 2 consultas no prximo minuto, ou seja,
x = 2. Assim
2241 , 0
2
9 0498 , 0
! 2
3 .
) 2 (
2 3
=

= = =

e
X P

Portanto a probabilidade de, no prximo minuto, ter duas consultas 0,2241.

d) Queremos ( ) ( ) ( ) 4233 , 0 2241 , 0 1494 , 0 0498 , 0 2 1 0 = + + = = + = + = X P X P X P


2) Suponha que as consultas num banco de dados ocorrem de forma independente
e aleatria, com uma taxa mdia de trs consultas por minuto. Qual a probabilidade
de que nos prximos dois minutos ocorram mais do que 5 consultas?

3) Suponha que X tenha uma distribuio de Poisson, com uma mdia de 4.
Determine:

a) ( ) 4 = X P
b) ( ) 2 X P
139

4) O nmero de falhas na superfcie de painis de plstico usados no interior de
automveis tem uma distribuio de poisson, com uma mdia de 0,05 falha por p
quadrado de painel de plstico. Considere que o interior de um automvel contm 10
ps quadrados de painel plstico. (Obs.: um p equivale a 30,48 cm)

a) qual a probabilidade de no haver falha na superfcie do interior do automvel?
b) Se 10 carros forem vendidos para uma companhia de aluguel de carros, qual ser
a probabilidade de no mximo um carro ter qualquer falha na superfcie?

5) Trfego de carros tradicionalmente modelado como uma distribuio de
Poisson. Um engenheiro de trfego monitora o fluxo de carros em um cruzamento
que tem uma mdia de 6 carros por minuto.
Calcule: (Para estabelecer o tempo de um sinal, as seguintes probabilidades so
usadas)

a) Qual a probabilidade de trs ou mais carros passarem pelo cruzamento em 30
segundos?

b) Calcule o nmero mnimo de carros que passam pelo cruzamento, em 30
segundos, x , de modo que ( ) 90 , 0 x X P .


140

Distribuies contnuas de probabilidade

Uma varivel aleatria X dita contnua quando ela assume qualquer valor
real dentro de um intervalo.
Exemplos:
1) Altura de uma pessoa;
2) Tempo de viagem;
3) Tempo de uma reao qumica;
4) Volume de leite em um copo; etc
Definio

Seja ) (x f a funo densidade de probabilidade da varivel contnua X.
Ento ) (x f

deve satisfazer s seguintes propriedades:

1)
real x x f , 0 ) (
2)
1 ) ( =

+

dx x f

3) Se [ ] b a A , = , ento

=
b
a
dx x f b X a P ) ( ) ( .


A funo de densidade de probabilidade fornece uma descrio simples das
probabilidades associadas a uma varivel aleatria.

Exemplos:

1) Considere a funo ( ) 3 0 , 1
2
< + = x x x f . Verifique se a funo ( ) x f funo
de densidade de probabilidade.

2) Considere a funo ( )
( )
x e x f
x
< =

4 ,
4
. Verifique se a funo ( ) x f funo de
densidade de probabilidade.

3) Considere a funo ( ) x e x f
x
< =

0 , . Verifique se a funo ( ) x f funo de
densidade de probabilidade.
Funo de distribuio acumulada

141

A funo de distribuio acumulada de uma varivel aleatria contnua X :

( ) ( ) ( )


= =
x
du u f x X P x F
Para < < x .



Seja ) (x f a funo densidade de probabilidade da varivel contnua X, ento temos:
a)

+

= = dx x f x X E ) ( . ) (

b)

+

= = dx x f x X Var ) ( . ) ( ) (
2 2

.


Uma curva de densidade o grfico de uma distribuio contnua
de probabilidade. Deve satisfazer as seguintes propriedades

1. A rea total sob a curva deve ser 1;
2. Todo ponto da curva deve ter uma altura vertical no inferior a 0.


142
I) Distribuio Uniforme.

Uma varivel aleatria X tem distribuio uniforme quando todos os seus valores
possveis tem a mesma probabilidade.
A curva de densidade de X uma reta horizontal.

Uma varivel aleatria X tem distribuio uniforme de parmetros e

com
>
se

=
] , [ , 0
] , [ ,
1
) (



x para
x para
x f

Neste caso
2
) (
+
= X E e
12
) (
) (
2

= X Var .

Exemplos:


1) Um profissional de computao observou que seu sistema gasta entre 20 e 24
segundos para realizar determinada tarefa, segundo uma distribuio uniforme em
[20, 24]. Sua curva de densidade dada por

Grfico: Curva de densidade da probabilidade
de um sistema

143
Exerccio:
1) Um profissional de computao observou que seu sistema gasta entre 20 e 24
segundos para realizar determinada tarefa. Considere a probabilidade uniforme em
[20, 24]. Resolva:
a) Encontre, graficamente, a funo densidade de probabilidade.
b) ) 23 ( > X P .
c) ) ( X E
d) ) ( X Var .

2) Seja a varivel aleatria contnua X a corrente em um fio delgado de cobre,
medida em miliampres. Suponha que a faixa de X seja [ ] mA 20 , 0 e considere que
a funo densidade de probabilidade de X seja ( )
20
1
= x f .
a) Qual a probabilidade de que uma medida da corrente seja menor que 10 mA?
b) Determine x de modo que ( ) 95 , 0 = < x X P .
c) Determine ( ) X E e ( ) X Var .
d) Calcule a funo de distribuio de probabilidade acumulada.

3) A funo de densidade para o peso de pacotes entregues pelo correio

( )
2
69
70
x
x f =

para
70 1 < < x
libras.

Calcule:

a) verifique que f funo de densidade de probabilidade;

b) a probabilidade de ser entregue um pacote com peso entre 60 e 70 libras?

c) Se o custo para despachar for R$ 5,00 por libra, qual ser o custo mdio para
despachar um pacote?

d) a varincia do peso?


144
II) Distribuio Exponencial

Uma distribuio exponencial utilizada quando queremos modelar a varivel
aleatria contnua que representa:
a) Tempo at a prxima consulta a uma base de dados;
b) Tempo entre pedidos a um servidor;
c) Distncia entre defeitos de uma fita.

Sejam as variveis aleatrias:
t
X = nmero de ocorrncias no intervalo de tempo [0, t]; e
T = tempo entre as ocorrncias.
Sendo a taxa mdia de ocorrncias por unidade de tempo, ento, considerando
independncia entre as ocorrncias, T tem distribuio exponencial dada por:
t
e t f
.
. ) (


=

Onde

1
) ( = T E
e
2
1
) (

= T Var

A curva de densidade da varivel T com distribuio exponencial dada por

A probabilidade ( )


=
b
a
t .
e . b T a P

.

145


Exerccios:
1) Seja a varivel aleatria T definida como o tempo de resposta na consulta a um
banco de dados, em minutos. Suponha que essa varivel tenha a seguinte funo
densidade de probabilidade:

<

0 , 0
0 , 2
) (
2
t para
t para e
x f
t


Calcule:
a) A probabilidade de a resposta demorar mais do que 3 minutos?
b) Calcule
) 3 2 ( T P
.

Soluo:
a)
( ) 0025 , 0 0025 , 0 0 e e e dt e . 2 3 T P
3 . 2 . 2
3
t . 2
3
t . 2
= + = + = = =

.
b)
( )
0208 , 0
0183 , 0 0025 , 0 e e e dt e . 2 3 T 2 P
2 . 2 3 . 2 3
2
t . 2
3
2
t . 2
=
+ = + = = =


2) O tempo de vida (em horas) de um transistor uma varivel aleatria T com
distribuio exponencial. O tempo mdio de vida do transistor de 500 horas.
a) Faa a curva de densidade.
b) Calcule a probabilidade de o transistor durar mais do que 500 horas.
c) Calcule a probabilidade de o transistor durar entre 300 e 1000 horas.
146
3) A funo densidade de probabilidade do tempo em que clientes chegam a um
terminal (em minutos depois de 8h)
( )
10
10
x
e
x f

=
para x > 0. Determine a probabilidade de:
a) o primeiro cliente chegar at 9h.
b) o primeiro cliente chegar entre 8h15min e 8h30min.
c) dois ou mais clientes chegarem antes das 8h40min, entre os cinco que chegam ao
terminal. Considere que as chegadas dos clientes sejam independentes.
d) determine a funo de distribuio acumulada.

4) Seja a varivel aleatria X o dimetro de um orifcio perfurado em uma placa
com componentes metlicos. O dimetro-alvo 12,5 milmetros. A maioria dos
distrbios aleatrios no processo resulta em dimetros maiores. Dados histricos
mostram que a distribuio de X pode ser modelada por uma funo de densidadde
de probabilidade
( )
( ) 5 , 12 20
20

=
x
e x f
para 5 , 12 x . Determine:
a) Se uma pea com dimetro maior que 12,60 mm for descartada, qual ser a
proporo de peas descartadas?
b) Qual o dimetro mdio?
c) Qual a varincia?

Sugesto: Utilize integrao por parte

= du v uv dv u


147
III) Distribuio Normal

Uma varivel aleatria X tem distribuio normal se seu histograma tem a
forma de um sino.










Definio
Dados os parmetros e 0 > reais, a funo densidade de probabilidade
da normal dada por:
2
) (
2
1
.
2 .
1
) (

=
x
e x f

Onde = ) ( X E
e
= ) ( X Var
.

Podemos perceber que o clculo de probabilidade usando a distribuio
normal muito difcil devido ao tipo de funo. Uma forma de contornarmos este
problema utilizar a distribuio normal padronizada.
A distribuio normal padronizada tem este nome pois sua mdia 0 e a
varincia um. Com isso os clculos ficam muito mais prticos pois podemos utilizar
as tabelas de probabilidade normal padronizada.
Uma conseqncia importante do fato de uma distribuio Normal ser
completamente caracterizada por sua mdia e desvio-padro que a rea sob a
curva entre um ponto qualquer e a mdia funo somente do nmero de desvios-
padres que o ponto est distante da mdia.
Vendas de auto peas
6
0
0
0
,
0
5
5
0
0
,
0
5
0
0
0
,
0
4
5
0
0
,
0
4
0
0
0
,
0
3
5
0
0
,
0
3
0
0
0
,
0
2
5
0
0
,
0
2
0
0
0
,
0
1
5
0
0
,
0
1
0
0
0
,
0
5
0
0
,
0
0
,
0
200
100
0
Std. Dev = 994,59
Mean = 2516,6
N = 1488,00
148
Como existem uma infinidade de distribuies normais (uma para cada mdia
e desvio-padro), transformamos a unidade estudada seja ela qual for (peso,
espessura, tempo, etc.) na unidade Z, que indica o nmero de desvios-padro a
contar da mdia.
Para padronizar um conjunto de dados que tem distribuio normal s
aplicar a frmula


=
X
z

Utilizao da tabela da normal padronizada
A tabela nos d a rea sobre o grfico, ou seja, a probabilidade.

Exemplo 1: A resistncia trao do papel usado em sacolas de super-mercado
uma caracterstica de qualidade importante.
Sabe-se que essa resistncia segue um modelo Normal com mdia 40 psi e
desvio padro 2 psi.
Se a especificao estabelece que a resistncia deve ser maior que 35 psi,
qual a probabilidade que uma sacola produzida com este material satisfaa a
especificao?
{ } { } 35 X P 1 35 X P =
{ } { } 5 , 2 Z P
2
40 35
Z P 35 X P =
)
`


=
Pela tabela da normal padronizada temos probabilidade de 0,0062.
Logo a resposta 1-0,0062 = 99,38%.



149
Exerccios
1) Utilizando a tabela da distribuio normal padronizada calcule:
a) ( ) 42 , 0 z P <

b) ( ) 75 , 0 z P <

c) ( ) 30 , 0 z P <

d) ( ) 56 , 0 z P >

e) ( ) 72 , 0 z 25 , 0 P < <

f) ( ) 20 , 0 z 25 , 0 P < <

g) o valor de z tal que
( ) 90 , 0 z Z z P = < <
.

Propriedades da distribuio normal

1) a curva simtrica em torno da mdia;
2)
( ) 0 x f lim
x
=


3) a rea total sob a curva igual a 1;

rea=1
rea=0,5 rea=0,5



Comparao entre mdia e varincia

150
A
C
B
x
f(x)


a) da distribuio A para B muda a tendncia central, mas a variabilidade
constante;
b) da distribuio A para C muda a variabilidade, mas a tendncia central
constante;
c) da distribuio B para C muda a tendncia central e a variabilidade.



Exerccios

1) Suponha que a absoro de gua(%) em certo tipo de piso cermico tenha
distribuio normal com mdia 2,5 e desvio-padro 0,6. Selecionando,
aleatoriamente, uma unidade desse piso, qual a probabilidade de ele acusar
absoro de gua entre 2% e 3,5%?
151
2) Uma fbrica de chocolates comercializa barras que pesam em mdia 200g. Os
pesos so normalmente distribudos. Sabe-se que o desvio padro igual a 40g.
Calcule a probabilidade de uma barra de chocolate, escolhida aleatoriamente, pesar
a) entre 200 e 250g;
b) mais de 230g;
c) menos que 150g.
3) Suponha que uma varivel aleatria X tenha distribuio normal com mdia 5 e
desvio-padro 4. Calcule:
( ) 8 X 2 P <




152
Teste de Hiptese

Teste de Hiptese

Em Estatstica, uma hiptese uma afirmao sobre uma propriedade de
uma populao.
Podemos estar interessados em saber informaes sobre a mdia, a
proporo ou a varincia.

Componentes de um teste de hiptese

1) Hiptese nula -
0
H : uma afirmao sobre o valor de um parmetro
populacional. Deve conter o sinal de igualdade e deve escrever-se como = , , .
2) Hiptese alternativa -
1
H : a afirmao que deve ser verdadeira se a hiptese
nula for falsa. No deve conter o sinal de igualdade.

Exemplos:
a) Testar a afirmao de que a mdia populacional 75.
Soluo: Neste caso temos 75 :
0
= H e 75 :
1
H .

b) Testar a afirmao de que a mdia no mximo 2,50.
Soluo: Neste caso temos 50 , 2 :
0
H e 50 , 2 :
1
> H .

3) Erro tipo I: Consiste em rejeitar a hiptese nula quando ela verdadeira.



0
H verdadeira
0
H falsa
Rejeita
0
H Erro tipo I Acerto
No rejeita
0
H Acerto Erro tipo II


4) Nvel de significncia - : A probabilidade do erro tipo I ocorrer.
153
5) Erro tipo II: Consiste em no rejeitar a hiptese nula quando ela falsa.
6) A probabilidade de ocorrer o erro tipo II .
7) Estatstica de teste: uma estatstica amostral baseado nos dados amostrais.
8) Regio crtica: o conjunto de todos os valores da estatstica de teste que
levam rejeio da hiptese nula.
9) Valor Crtico: o valor, ou valores, que separa(m) a regio crtica dos valores
da estatstica de teste que no levam rejeio da hiptese nula.

Concluses no teste de hiptese

Em um teste de hiptese conclumos por:
rejeitar a hiptese nula ou
no rejeitar a hiptese nula.




Tipos de teste

Bilateral (sinal de
1
H : ): a regio crtica est situada nas duas regies.
Neste caso cada rea tem valor
2

.


154




Unilateral esquerdo (sinal de
1
H : <): a regio crtica est situada na parte
esquerda. Neste caso ( ) = I tipo Erro P .





Unilateral direito (sinal de
1
H : >): a regio crtica est situada na parte direita.
( ) = I tipo Erro P .



155
Teste de uma afirmao sobre uma mdia: grandes amostras

Considere uma amostra razoavelmente grande ( 30 n ) para valer o teorema
central do limite, ou que os dados provenham de uma distribuio aproximadamente
normal. Para testarmos alguma informao com respeito mdia populacional
utilizamos a estatstica de teste dada por:

Estatstica de teste:
n
x
z
x


=

Caso seja desconhecido podemos substitu-lo por s .

Os valores crticos so encontrados na Tabela A 2.

Exemplo:
O tempo mdio entre falhas de um rdio da Telektronic Companhy para
avies de pequeno porte 420 horas. Aps terem sido modificados 35 aparelhos de
rdio, em uma tentativa de melhorar sua confiabilidade, os testes acusaram um
tempo mdio de 385 horas para esta amostra, com desvio-padro de 24 horas. Ao
nvel de significncia de 0,05, teste a afirmao de que o tempo mdio, aps as
modificaes, menor que 420 horas .

Soluo:
a) As hipteses so:

<

420 :
420 :
1
0

H
H

b) O teste unilateral esquerdo, pois o sinal de
1
H <.
c) O nvel de significncia 05 , 0 = ;
d) Os valores crticos so 645 , 1 =

z ; Logo temos:
156


e) Os dados amostrais so: 385 = x e 24 = s ;
f) Como n=35 ( 30 n ), a estatstica de teste dada por:

63 , 8
35
24
420 385
=

=
n
x
z
x



g) Concluso: Como a estatstica de teste est na dentro da regio crtica, ento
rejeitamos
0
H .
Exerccios

1) O gerente de uma empresa de transporte suspeita da afirmao de um
vendedor de pneus de que o seu produto tem uma vida mdia de, ao menos,
28 000 milhas. Para verificar a afirmao, a firma instala 40 desses pneus em
seus caminhes, obtendo uma vida mdia de 27 563 milhas, com desvio-
padro de 1 348 milhas. Qual a concluso do gerente, se a probabilidade de
um erro tipo I deve ser 0.01?

2) A vida mdia de uma amostra de 100 lmpadas de certa marca 1615 horas.
Por similaridade com outros processos de fabricao, supomos o desvio-
padro igual a 120 horas. Utilizando um nvel de significncia de 2 %, teste a
afirmao de que a durao mdia de todas as lmpadas dessa marca igual
a 1600 horas.


157
Teste de uma afirmao sobre uma mdia: pequenas amostras


Considere uma amostra pequena ( 30 < n ) , que os dados provenham de uma
distribuio normal e que o desvio-padro populacional desconhecido. Para
testarmos alguma informao com respeito mdia populacional utilizamos a
estatstica de teste dada por:

Estatstica de teste:
n
s
x
t
x

=

Os valores crticos so encontrados na Tabela A 3.
O nmero de Graus de liberdade = n 1.


Exemplo:
Os sete valores relacionados a seguir so cargas axiais (em libras) da
primeira amostra de sete latas de alumnio de 12oz. A carga axial de uma lata o
peso mximo que seus lados podem suportar, e deve ser superior a 165 libras,
porque esta a presso mxima aplicada quando se fixa a tampa no lugar. Ao nvel
de significncia de 0,01, teste a afirmao do engenheiro supervisor de que esta
amostra provm de uma populao com mdia superior a 165 libras.

270 273 258 204 254 228 282


Soluo:
a) As hipteses so:

>

165 :
165 :
1
0

H
H

b) O teste unilateral direito, pois o sinal de
1
H >;
c) O nvel de significncia 01 , 0 = ;
158
d) O valor do grau de liberdade de 7-1 = 6. Logo o valor crtico 143 , 3 =

t ;
Logo temos:




e) Os dados amostrais so: 7 , 252 = x e 6 , 27 = s ;

Como n = 7 ( 30 < n ), a estatstica de teste dada por:

407 , 8
7
6 , 27
165 7 , 252
=

=
n
s
x
t
x



f) Concluso: Como a estatstica de teste est na dentro da regio crtica, ento
rejeitamos
0
H .
Exerccios

1) Admitindo que a presso sangunea arterial em homens siga o modelo
Normal, 7 pacientes foram sorteados e tiveram sua presso medida obtendo
os seguintes resultados:

82 - 84 - 78 - 85 - 69 - 80 - 75

Utilizando um nvel de significncia de 0,02 , teste a afirmao de a mdia da
presso sangunea de 82.
159
2) O inspetor de qualidade da JF Construes mediu 25 barras de ao e obteve
as seguintes medidas em metros:

4,51 5,38 4,84 5,33 4,74 4,99 5,15 5,52 5,82 5,45
4,68 4,74 5,53 5,40 4,72 4,97 5,24 4,94 4,75 5,50
4,81 5,25 4,86 4,93 4,95

Pode-se afirmar, com com nvel de significncia de 5%, que tais barras foram
sacadas de um lote cujo comprimento mdio de 5,00 metros?

Teste de uma afirmao sobre varincia ou desvio-padro

Ao testar uma hiptese sobre o desvio-padro ou a varincia
2
de uma
populao, admitimos que os valores da populao sejam distribudos normalmente.
Para testar uma informao sobre desvio-padro ou a varincia
2
a
estatstica de teste dada por:

Estatstica de teste:
( )
2
2
2
1

s n
= ,

onde

n = tamanho da amostra
2
s = varincia amostral
2
= varincia populacional


Os valores crticos so encontrados na Tabela A 4.
O nmero de Graus de liberdade = n 1.

160



Exemplo:
O tempo para transmitir 10 MB em determinada rede de computadores varia
segundo um modelo normal, com mdia 7,4 segundos e varincia 1,3 segundos.
Depois de algumas mudanas na rede, acredita-se numa reduo no tempo de
transmisso de dados, Alm de uma possvel mudana na variabilidade. Foram
realizados 10 ensaios independentes com um arquivo de 10 MB e foram coletados
os tempos de transmisso, em segundos:

6,8 7,1 5,9 7,5 6,3 6,9 7,2 7,3 6,6 6,3

Resolva:
a) Existe evidncia suficiente de que as mudanas na rede de computadores
alteraram a variabilidade no tempo de transmisso de dados? Ao nvel de
0,05.
b) Existe evidncia suficiente de que as mudanas na rede de computadores
alteraram o tempo mdio de transmisso de dados? Ao nvel de 0,05

Soluo da letra a:

a) As hipteses so:

=
3 , 1 :
3 , 1 :
2
2
0
1

H
H

b) O teste bilateral direito, pois o sinal de
1
H ;
c) O nvel de significncia 05 , 0 = ;
161
d) O valor do grau de liberdade de 10-1 = 9. Logo os valores crticos so
700 , 2
2
= e 023 , 19
2
= ; Logo temos:




e) Os dados amostrais indicam: 261 , 0 = s ;
f) a estatstica de teste dada por:

807 , 1
3 , 1
261 , 0 ) 1 10 (
2
=

=

g) Concluso: Como a estatstica de teste est na dentro da regio crtica, ento
rejeitamos
0
H .

Exerccios

1) A cofap alega que a varincia da vida mdia de seus amortecedores de nove
meses. A Chevrolet ensaia 18 peas e encontra varincia de um ano para a vida
mdia das referidas peas. A 5% de significncia, isso lhe permite refutar a alegao
da Cofap?

2) Um laboratrio fez oito determinaes da quantidade de impurezas em pores
de certo composto. Os valores eram (em mg):

12,4 12,6 12,0 12,0 12,1 12,3 12,5 12,7
162

Teste a hiptese de que o desvio-padro 1, ao nvel se significncia de 0,05.

3) Uma mquina de enchimento automtico usada para encher garrafas com
detergente lquido. Uma amostra aleatria de 20 garrafas resulta em uma varincia
amostral de volume de enchimento de 0,0153 (ona fluida)
2
. Se a varincia do
volume de enchimento exceder 0,01 (ona fluida)
2
, existir uma proporo
inaceitvel de garrafas cujo enchimento no foi completo e cujo enchimento foi em
demasia.
H evidncia nos dados da amostra que sugira que o fabricante tenha um problema
com garrafas cheias com falta e excesso de detergente? Use nvel de significncia
de 5%.


TESTE DE HIPTESE PARA PROPORO

O teste para proporo aplicado em situaes nas quais queremos verificar
se a proporo de algum atributo na populao pode ser igual a certo valor
0
p .
SUPOSIES:
1) So verificadas as condies para um experimento binomial. Isto , temos um
nmero fixo de provas independentes com probabilidade constante, e cada
prova comporta dois resultados, que designamos sucesso e falha.

2) As condies 5 np e 5 nq so ambas verificadas, de modo que a
distribuio binomial das propores amostrais pode ser aproximada por uma
distribuio normal com np = e npq = .

163
______________________________________________________________
NOTAO:

n : nmero de provas;
p : proporo populacional (usada na hiptese nula);
n
x
p =
: proporo amostral;
p q =1
______________________________________________________________

ESTATSTICA DE TESTE:
n
pq
p p
z

=


Os valores crticos so obtidos na tabela A 2 (distribuio normal
padronizada).

Exemplos:
1) Uma empresa retira periodicamente amostras aleatrias de 500 peas de sua
linha de produo para anlise da qualidade. As peas da amostra so
classificadas como defeituosas ou no, sendo que a poltica da empresa
exige que o processo produtivo seja revisto se houver evidncia de mais de
1,5% de peas defeituosas. Na ltima amostra, foram encontradas nove
peas defeituosas. Usando nvel de significncia de 1%, o processo precisa
ser revisto?
Soluo:
h) As hipteses so:

>

015 , 0 :
015 , 0 :
1
0
p H
p H

i) O teste unilateral direito, pois o sinal de
1
H >.
j) O nvel de significncia 01 , 0 = ;
k) O valor crtico 33 , 2 =

z ; Logo temos:
164



l) Os dados amostrais so: 018 , 0
500
9
= = p
m) Critrios para a aproximao normal:

5 , 7 015 , 0 500 = = p n e
5 , 492 985 , 0 500 ) 015 , 0 1 ( 500 = = = q n

n) Estatstica de teste dada por:

552 , 0
005436 , 0
003 , 0
500
985 , 0 015 , 0
015 , 0 018 , 0
= =

=
n
pq
p p
z


o) Concluso: Como a estatstica de teste est fora da regio crtica, ento no
rejeitamos
0
H .

2) Em um estudo da eficcia do air-bag em automveis, constatou-se que, em
821 colises de carros de tamanho mdio equipados com air-bag, 46 colises
resultaram em hospitalizao do motorista. Ao nvel de significncia de 0,01,
teste a afirmao de que a taxa de hospitalizao nos casos de air-bag
inferior taxa de 7,8% para colises de carros de tamanho mdio equipados
com cintos automticos de segurana.
3) O controle estatstico de certo processo de fabricao de determinada
lmpada estabeleceu que pelo menos 94% delas tm que estar sem defeito.
165
Para verificar a validade desta afirmao, foi coletada uma amostra de 150
lmpadas das quais 138 estavam sem defeito.
Com 1% de significncia, h evidncia de que o processo est de acordo com
o esperado?

166
Distribuio Amostral



Um estimador uma estatstica amostral (como a mdia amostral x )
utilizada para obter uma aproximao de um parmetro populacional.

Exemplos:

1) x (mdia amostral) um estimador de (mdia populacional)
2)
2
s (varincia amostral) um estimador de
2
(varincia populacional)

Propriedade do estimador:

1) Tendenciosidade: Um estimador dito no tendencioso se a esperana dele for
igual ao valor populacional. Por exemplo:

( ) = x E
( )
2 2
= s E


Uma estatstica um valor especfico, ou um intervalo de valores, usado
para aproximar um parmetro populacional

Uma estimativa pontual um valor nico usado para aproximar um
parmetro populacional.

Exemplo: considere uma populao formada pelos elementos

1 1 2 3

Suponha uma amostra de tamanho 2

1 3

A mdia amostral 2.
A mdia populacional 1,75.

Uma estimativa intervalar, ou intervalo de confiana, uma amplitude de
valores que tem probabilidade de conter o verdadeiro valor do parmetro
populacional.

O grau de confiana a probabilidade 1 de o intervalo de confiana
conter o verdadeiro valor do parmetro populacional.

Um valor crtico o nmero na fronteira que separa os valores das
estatsticas amostrais provveis de ocorrerem, dos valores que tm pouca chance
de ocorrer.
167

Quando utilizamos dados amostrais para estimar um parmetro populacional
podemos cometer erros. A margem de erro, denotada por E, a diferena mxima
provvel (com probabilidade 1 ) entre o valor amostral e o verdadeiro valor
populacional. A margem de erro E chamada tambm de erro mximo da
estimativa. Veja o clculo dos erros:

Parmetro Clculo do
erro
Intervalo de confiana Tamanho de
amostra
Mdia
(Grandes
amostras)
n
z E

=
2

E x E x + < <
2
2
(
(


=
E
z
n


Mdia
(Pequenas
amostras)
n
s
t E =
2


E x E x + < <
2
2
(
(


=
E
s t
n


Proporo
n
q p
z E

2
=


E p p E p + < <
2
2
2

E
q p z
n
(

ou
2
2
2
25 , 0
E
z
n
(


Varincia
( ) ( )
2
2
2
2
2
1 1
L R
s n s n

< <





Teorema Central do Limite

Se
n
X X X , , ,
2 1
L for uma amostra aleatria de tamanho n, retirada de uma
populao (finita ou infinita), com mdia e varincia
2
, e se X for a mdia
amostral, ento a forma limite da distribuio de

n
X
Z


=
quando n tende ao infinito, a distribuio normal padro.


Ou:

168
Teorema Central do Limite

Se extrairmos todas as amostras aleatrias possveis, de tamanho n, de uma
populao com mdia e varincia
2
, a mdia das mdias se denota por
x
;
assim,

=
x

Por sua vez, o desvio-padro das mdias amostrais se denota por
x
; ento,

n
x

=
Exemplo:

Uma companhia eletrnica fabrica resistores que tm um resistncia mdia de
100 ohms e um desvio-padro de 10 0hms. A distribuio de resistncias normal.
Encontre a probabilidade de uma amostra aleatria de 25 resistores ter uma
resistncia mdia menor que 95 ohms.


Estimador de Mxima Verossimilhana

Um dos melhores mtodos de obter um estimador de um parmetro o
mtodo da mxima verossimilhana. Essa tcnica foi desenvolvida nos anos de
1920 pelo famoso estatstico britnico Sir R. A. Fisher. Como o nome implica, o
estimador ser o valor do parmetro que maximiza a funo verossimilhana.

Suponha que X seja uma varivel aleatria com distribuio de
probabilidade ( ) , x f , em que um nico parmetro desconhecido. Sejam
n
x x x , , ,
2 1
K os valores observados na amostra aleatria de tamanho n . Ento, a
funo verossimilhana da amostra

( ) ( ) ( ) ( ) , , ,
2 1 n
x f x f x f L = L

O estimador de mxima verossimilhana aquele que maximiza a funo de
verossimilhana.

Obs.: A funo de verossimilhana da amostra ( ) L apenas a probabilidade

( )
n n
x X x X P = = , ,
1 1
K

Exemplo:

Seja X normalmente distribuda, com mdia desconhecida e varincia
2

conhecida. Qual o estimador de mxima verossimilhana para a mdia
considerando uma amostra de tamanho n ?

169
Sugesto: Utilize ( )
( )
2
2
2
2
1
,

=
i
x
e x f


170
Correlao

Com muita freqncia, na prtica, verifica-se que existe uma relao entre
duas (ou mais) variveis. Por exemplo: os pesos dos adultos do sexo masculino
dependem, em certo grau, de suas alturas; as circunferncias de crculos dependem
de seus raios; a presso de uma determinada massa de gs depende de sua
temperatura e de seu volume.
Em engenharia uma das perguntas interessantes :

Ser que existe relao entre o desgaste em um ao e a viscosidade do leo
utilizado?

A tabela a seguir apresenta 9 dados do volume desgastado do ao e da
viscosidade do leo. No decorrer da exposio nosso objetivo utilizar os dados da
tabela abaixo para responder a pergunta inicial.
Tabela 1
Volume desgastado
Y (10
-4
mm
3
)
Viscosidade
X
240 1,6
181 9,4
193 15,5
155 20
172 22
110 35,5
113 43
75 40,5
94 33

Dado duas variveis X e Y, ou mais, nosso objetivo verificar se existe
relao entre elas. Por exemplo: Os conjuntos X = {1, 2, 3, 4, 5} e Y = {3, 5, 7, 9, 11}
so tais que Y = 2X+1. Portanto dizemos que as variveis X e Y so
correlacionadas.
Encontrar uma relao entre variveis de fundamental importncia para
podermos predizer valores futuros. Por exemplo: se soubermos que duas variveis
se relacionam por Y = 2X 4, ento os valores de Y so encontrado apenas
atribuindo valores a X.
171
Vamos aqui estudar variveis que se relacionam linearmente. No final deste
estudo daremos um exemplo de variveis que no se relacionam linearmente e sim
de forma quadrtica.

Definio: Existe uma correlao entre duas variveis quando uma delas est, de
alguma forma, relacionada com a outra.

Como estamos interessados em variveis que se relacionam linearmente,
ento estas relaes so descritas por uma equao de uma reta, ou seja, equaes
do tipo Y = b
0
+ b
1
X.
Como no podemos basear nossas concluses apenas em diagramas,
necessitamos de mtodos mais precisos e objetivos para tirarmos concluses.
Vamos utilizar o coeficiente de correlao linear. Ele tambm conhecido como
coeficiente de correlao de Pearson (Karl Pearson).

Definio: O coeficiente de correlao linear r mede o grau de relacionamento
linear entre os valores emparelhados x e y em uma amostra.

Podemos encontrar o valor do coeficiente de correlao linear r atravs da
frmula:



=
2
) (
2
.
2
) (
2
) )( (
y y n x x n
y x xy n
r

Como r calculado com base em dados amostrais, uma estatstica amostral
usada para medir o grau da correlao linear entre x e y. Se tivssemos todos os
pares de valores (x, y) para a populao, a frmulas acima seria um parmetro
populacional.

Arredondamento do coeficiente de correlao linear

Arredondamos o coeficiente de correlao linear r para trs casas decimais,
afim de que seu valor possa ser comparado com os valores crticos da tabela A-6.
172
Propriedades do Coeficiente de Correlao Linear r

1) O valor de r est sempre compreendido entre 1 e +1;
2) O valor de r no varia se todos os valores de qualquer uma das variveis so
convertidos para uma escala diferente;
3) O valor de r no afetado pela escolha de X ou Y;
4) O valor de r mede a intensidade, ou grau, de um relacionamento linear. No
serve para medir a intensidade de um relacionamento no-linear.

Os grficos de disperso a seguir descrevem alguns dos tipos de correlao
existentes.

Correlao linear positiva
0
5
10
15
20
25
30
0 5 10
X
Y

A correlao ser considerada positiva se valores crescentes de X estiverem
associados a valores crescentes de Y, ou valores decrescentes de X estiverem
associados a valores decrescentes de Y. Neste caso 0 < r < 1.

Correlao linear perfeita positiva
0
5
10
15
20
25
30
0 5 10
X
Y

A correlao linear ser considerada perfeita positiva se valores
crescentes de X estiverem perfeitamente alinhados a valores crescentes de Y, ou
valores decrescentes de X estiverem perfeitamente alinhados a valores
decrescentes de Y. Neste caso r = 1.
173

Correlao Negativa
0
5
10
15
20
25
30
0 2 4 6 8 10
X
Y

A correlao considerada negativa quando valores crescentes da varivel X
estiverem associados a valores decrescentes da varivel Y, ou valores decrescentes
de X estiverem associados a valores crescentes da varivel Y. Neste caso 1 < r <
0.

Correlao negativa perfeita
0
5
10
15
20
25
30
0 2 4 6 8 10
X
Y


A correlao linear ser considerada perfeita negativa se valores crescentes
de X estiverem perfeitamente alinhados a valores decrescentes de Y, ou valores
decrescentes de X estiverem perfeitamente alinhados a valores crescentes de Y.
Neste caso r = -1.

Correlao nula
0
5
10
15
20
25
30
0 2 4 6 8 10
X
Y

174
Quando no houver relao entre as variveis X e Y, ou seja, quando as
variaes de X e Y ocorrerem independentemente no existe correlao entre elas.
Neste caso r = 0.

Correlao no-linear
0
10
20
30
0 5 10
X
Y

Quando no houver correlao linear entre as variveis X e Y pode
acontecer que haja outro tipo de correlao. Esta correlao pode ser quadrtica,
exponencial, logartmica, uma curva do 3. grau, etc.

Clculo do coeficiente de correlao para os dados da tabela 1.

Para o clculo do coeficiente de correlao conveniente a construo de
tabelas ampliadas, onde, a partir dos valores de X e Y, so determinadas todas as
somas necessrias.

Volume desgastado
Y (10
-4
mm
3
)
Viscosidade
X
X
2
Y
2
XY
240 1,6 2,56 57600 384
181 9,4 88,36 32761 1701,4
193 15,5 240,25 37249 2991,5
155 20 400 24025 3100
172 22 484 29584 3784
110 35,5 1260,25 12100 3905
113 43 1849 12769 4859
75 40,5 1640,25 5625 3037,5
94 33 1089 8836 3102
1333 220,5 7053,67 220549 26864,4

Assim,
175
( ) ( ) ( )
938 , 0
333 . 1 549 . 220 9 5 , 220 ) 67 , 053 . 7 ( 9
) 333 . 1 ( ) 5 , 220 ( ) 4 , 864 . 26 ( 9
) ( . ) (
) )( (
2 2
2 2 2 2
=


=

=


r
r
y y n x x n
y x xy n
r


O valor de r dado por r = - 0,938.

Interpretao do valor de r

Se o valor de r est prximo de 0 (zero), conclumos que no h correlao
linear significativa entre X e Y, mas se r est prximo de 1 ou +1, conclumos pela
existncia de correlao linear significativa entre X e Y. Como o termo prximo
vaga, temos que adotar um critrio de deciso. Para verificarmos se h correlao
faremos ento um teste de hiptese.

Teste de hiptese para determinar se h correlao

Podemos utilizar dois mtodos para verificar se duas variveis possuem
correlao linear entre elas. Utilizando a teoria do teste de hiptese vamos verificar
se h correlao entre as variveis X e Y de uma populao. Neste caso usaremos o
parmetro para representar a correlao entre duas variveis de uma populao.
Assim temos:
H
0
: = 0 (No h correlao linear entre as variveis X e Y)
H
1
: 0 (H correlao linear significativa entre as variveis X e Y)

176
Mtodo: Estatstica de Teste r. Usamos o valor calculado do Coeficiente de
Correlao Linear de Pearson r.

Estatstica de Teste r para Correlao Linear
Estatstica de Teste: r
Valores crticos: Tabela do Coeficiente de Correlao r de Peason.

Exemplo: Para os dados da Tabela 1 temos: r = - 0,938 (calculado). Utilizando o
teste de hiptese teremos:

A estatstica de teste r = - 0,938. Os valores crticos so r = - 0,666 e r =
0,666 com n = 9 e nvel de significncia 0,05. Como r est dentro da rea crtica,
ento rejeitamos H
0
. Logo h evidncias para apoiar a existncia de uma correlao
linear.
Rejeitar
= 0
No Rejeitar
= 0
Rejeitar
= 0
-1 r = -0,666 r = 0,666 1

Como sabemos que h correlao entre as variveis X e Y, basta agora
encontrar qual a correlao, ou seja, qual a equao que relaciona as duas
variveis. Isto podemos facilmente encontrar usando a Regresso Linear.

177
Regresso Linear

Definio: Dada uma coleo de dados emparelhados (X, Y) populacionais, a
equao de regresso dada por
x y
1 0
+ =
Como no conhecemnos os coeficientes populacionais devemos estim-los.
Ento dada uma coleo de dados amostrais emparelhados (X, Y), a equao
de regresso
x b b y
1 0
+ =
descreve a relao entre as duas variveis. O grfico da equao de regresso
chamado reta de regresso. (ou reta de melhor ajuste, ou reta de mnimos
quadrados)
Esta definio expressa uma relao entre x (chamada varivel independente
ou varivel preditora) e y (chamada varivel dependente ou varivel resposta).
Temos que b
0
o intercepto y e b
1
o coeficiente angular.

Suposies:

1) Estamos investigando apenas relaes lineares.
2) Para cada x, y uma varivel aleatria com distribuio normal. Todas essas
distribuies de y tm a mesma varincia e, ainda, para um dado valor de x, a
mdia da distribuio dos valores de y est sobre a reta de regresso.

Frmulas:
Estimamos os valores b
0
e b
1
, utilizando mtodo dos mnimos quadrados,
pelas frmulas a seguir.

2 2
1
2 2
2
0
) x ( ) x ( n
) y )( x ( ) xy ( n
b
) x ( ) x ( n
) xy )( x ( ) x )( y (
b



=

178

Arredondamentos

Clculos intermedirios arredondar para seis casas decimais. Arredondar o
resultado final para uma casa decimal a mais que os dados.

Voltando ao problema proposto, Tabela 1, vamos calcular a reta de regresso
entre as variveis X e Y.

07 , 234
) 5 , 220 ( ) 67 , 053 . 7 ( 9
) 4 , 864 . 26 )( 5 , 220 ( ) 67 , 053 . 7 )( 333 . 1 (
) ( ) (
) )( ( ) )( (
0
2
0
2 2
2
0
=

=


b
b
x x n
xy x x y
b

e
51 , 3
) 5 , 220 ( ) 67 , 053 . 7 ( 9
) 333 . 1 )( 5 , 220 ( ) 4 , 864 . 26 ( 9
) ( ) (
) )( ( ) (
1
2
1
2 2
1
=


=

=


b
b
x x n
y x xy n
b


Assim a reta de regresso dada por x y 51 , 3 07 , 234 = .
As equaes de regresso podem ser teis quando usadas para predizer o
valor de uma varivel, dado um valor determinado da outra varivel. Ao predizer um
valor de y com base em determinado valor de x:

1) Se no h correlao linear significativa, o melhor valor predito de y a mdia
de y;
2) Se h correlao linear significativa, obtm-se o melhor valor predito de y
substituindo-se o valor de x na equao de regresso.

Por exemplo, se queremos saber qual o desgaste quando a viscosidade for
de 41 ento basta substituir na reta de regresso o valor de x por 41:
179
16 , 90
41 51 , 3 07 , 234
=
=
y
y


Estimativa da varincia

Seja ( )

=
=
n
i
i i E
y y SQ
1
2
a soma dos quadrados dos erros. Uma estimativa da
varincia do modelo dada por
2

=
n
SQ
E
.

No nosso exemplo teremos:

Volume desgastado
Y (10
-4
mm
3
)
Y


2
)

( Y Y

240 228,454 133,3101
181 201,076 403,0458
193 179,665 177,8222
155 163,87 78,6769
172 156,85 229,5225
110 109,465 0,286225
113 83,14 891,6196
75 91,915 286,1172
94 118,24 587,5776
2.787,978

Assim,
28 , 398
7
978 , 787 . 2

2
2
2
=
=

n
SQ
E

180
Exemplo:
1) Os dados a seguir trazem os resultados do experimento que avalia o ndice de
octanagem da gasolina (y) em funo da adio de um novo aditivo (x), em
porcentagem.

x (%) y (%)
1 80
2 81
3 82
4 83
5 83
6 85

A reta de regresso estimada X Y 9 , 0 1 , 79 + = . Qual a estimativa da varincia da
reta estimada?


Teste de hiptese na regresso linear simples

Quando estimamos os coeficientes da regresso linear importante
testarmos a hiptese de que eles so ou no iguais a zero. Caso isso seja
verdadeiro podemos retira-lo do modelo.
No caso da regresso simples testamos:

0 :
0 :
0 1
0 0

H
H
e
0 :
0 :
1 1
1 0

H
H


Para testarmos estar a hiptese sobre
0
utilizamos a estatstica de teste
xx
S
T
2
0
0

= onde
0
T tem distribuio t com n-2 graus de liberdade. Utilizamos
n
x
x S
n
i
i
n
i
i xx
2
1
1
2
|
|

\
|
=

=
=
.

181
Utilizamos o mtodo anlogo para testar
1
. Neste caso a estatstica de teste

xx
S
T
2
1
1

= onde
1
T tem distribuio t com n-2 graus de liberdade.

Exemplo: Voltando ao nosso exemplo anterior teremos:

1 caso: Para testarmos a hiptese sobre
0


( )
42 , 651 . 1
25 , 402 . 5 67 , 053 . 7
9
5 , 220
67 , 053 . 7
2
2
1
1
2
=
=
=
|
|

\
|
=

=
=
xx
xx
xx
n
i
i
n
i
i xx
S
S
S
n
x
x S


Estatstica de teste

63 , 476
42 , 651 . 1
28 , 398
07 , 234

0
0
2
0
0
=
=
=
T
T
S
T
xx



Para valores crticos temos 365 , 2 = t com nvel de significncia 05 , 0 = .
Como a estatstica
0
T est dentro da regio crtica, ento rejeitamos a hiptese
nula. Logo o coeficiente significativo.

2 caso: Para testar hiptese sobre
1
:

Estatstica de teste

182
147 , 7
42 , 651 . 1
28 , 398
51 , 3

1
1
2
1
1
=

=
=
T
T
S
T
xx



Para valores crticos temos 365 , 2 = t com nvel de significncia 05 , 0 = .
Como a estatstica
0
T est dentro da regio crtica, ento rejeitamos a hiptese
nula. Logo o coeficiente significativo.


Intervalo de confiana para os coeficientes

Sob a suposio de que as observaes sejam normal e independentemente
distribudas, um intervalo de confiana de ( )% 1 100 para a inclinao na
regresso linear simples :

xx
n
xx
n
S
t
S
t
2
2 ,
2
1 1
2
2 ,
2
1



+

Similarmente, um intervalo de confiana de ( )% 1 100 para a interseo na
regresso linear simples :

(
(

+ +
(
(

+

xx
n
xx
n
S
x
n
t
S
x
n
t
2
2
2 ,
2
0 0
2
2
2 ,
2
0
1





Exemplo: Considerando o exemplo anterior, um intervalo de confiana de 95% para
os coeficientes dado por:

58 , 266 56 , 201
42 , 651 . 1
5 , 24
9
1
28 , 398 365 , 2 07 , 234
42 , 651 . 1
5 , 24
9
1
28 , 398 365 , 2 07 , 234
42 , 651 . 1
5 , 24
9
1
28 , 398 365 , 2 07 , 234
42 , 651 . 1
5 , 24
9
1
28 , 398 365 , 2 07 , 234
1

0
2
0
2
2
0
2
2
2
2 ,
2
0 0
2
2
2 ,
2
0

(
(

+ +
(
(

+
(
(

+ +
(
(

+
(
(

+ +
(
(



xx
n
xx
n
S
x
n
t
S
x
n
t


e
183

35 , 2 67 , 4
42 , 651 . 1
28 , 398
365 , 2 51 , 3
42 , 651 . 1
28 , 398
365 , 2 51 , 3

1
1
2
2 ,
2
1 1
2
2 ,
2
1

+
+


xx
n
xx
n
S
t
S
t


Exerccio:

1) Considere Y a pureza do oxignio (%) e X o nvel de hidrocarboneto (%). A reta
de regresso entre Y e X dada por:

X Y 947 , 14 283 , 74 + =

A estimativa da varincia de 18 , 1
2
= e 68088 , 0 =
xx
S . Use 05 , 0 = e 18 = n .

Encontre um intervalo de 95% de confiana para a inclinao
1
.


Erro padro da estimativa

O erro padro da estimativa uma medida coletiva da disperso dos pontos
amostrais em torno da reta de regresso. Denotado por
e
S , calculado como:

2
1 0
2


=

n
xy b y b y
S
e



Exemplo: Voltando ao exemplo anterior:


( ) ( )
01 , 20
962 , 403
7
4 , 864 . 26 51 , 3 333 . 1 07 , 234 549 . 220
2
1 0
2
=
=

=


=

e
e
e
e
S
S
S
n
xy b y b y
S

184
Regresso Mltipla

_______________________________________________________________
Definio:
Uma equao de regresso mltipla expressa um relacionamento linear entre
uma varivel dependente y e duas ou mais variveis independentes
( )
k
x x x , , ,
2 1
K .
_______________________________________________________________

Notao:
+ + + + + =
k k
x b x b x b b y L
2 2 1 1 0

: frmula geral da equao de regresso mltipla


estimada;
n : tamanho da amostra;
k : nmero de variveis independentes;
y : valor predito da varivel dependente;
k
x x x , , ,
2 1
K : variveis independentes;
0
: intercepto;
0
b : estimativa de
0

;
k
, , ,
2 1
K : coeficientes das variveis independentes
k
x x x , , ,
2 1
K
;
k
b b b , , ,
2 1
K : estimativas de
k
, , ,
2 1
K
.
: erro

Exemplos:
Os dados seguintes se referem ao mercado brasileiro de tratores e
colheitadeiras. Baseados neles, determine a equao de regresso mltipla da
produo em funo das vendas internas e das exportaes.
185

Ano 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Produo 22,20 22,08 32,18 51,33 28,34 22,19 31,66 33,41 28,22 35,43
Vendas
internas
18,94 16,84 27,41 46,69 22,74 13,97 21,47 24,85 24,70 31,06
Exportaes 4,22 5,82 4,48 5,03 5,26 8,36 10,06 8,86 4,21 5,27

Soluo: Sada do Excel 97. (Ferramentas anlise de dados - regresso)
RESUMO DOS
RESULTADOS


Estatstica de regresso
R mltiplo 0,998739179
R-Quadrado 0,997479948
R-quadrado
ajustado
0,996759933
Erro padro 0,498084785
Observaes 10

ANOVA
gl SQ MQ F F de
significao
Regresso 2 687,3836208 343,6918104 1385,359963 8,03403E-
10
Resduo 7 1,736619173 0,248088453
Total 9 689,12024

Coeficientes Erro padro Stat t valor-P
Interseo -
0,899860129
0,811205051 -
1,109288124
0,303955593
Varivel X 1 1,002741039 0,019093396 52,51768884 2,378E-10
Varivel X 2 1,083108449 0,082237436 13,17050357 3,39691E-06



186

RESULTADOS DE RESDUOS

Observao Y previsto Resduos
1 22,6627728 -0,462772798
2 22,28999013 -0,209990135
3 31,43759759 0,742402407
4 51,36615447 -0,036154466
5 27,59962153 0,740378468
6 22,16321881 0,026781186
7 31,52506097 0,134939033
8 33,61459554 -0,204595539
9 28,4277301 -0,207730097
10 35,95325806 -0,523258059


Interpretaes:
Na primeira tabela:
o valor de R-quadrado igual a 0,997 indica que, na amostra observada, cerca
de 99,7% da variao da produo pode ser explicada por uma relao linear
que envolve as vendas internas e as exportaes.
o valor de R-quadrado ajustado igual a 0,997 o coeficiente mltiplo de
determinao, R-quadrado, modificado de modo a levar em conta o nmero
de variveis e o tamanho da amostra..
Na segunda tabela, o valor de F de significao = 8,034E-10, extremamente
pequeno, mostra que no teste de hiptese rejeitamos a hiptese nula,
0 :
1 0 0
= = = =
k
H K
.
Na terceira tabela temos as estimativas dos coeficientes do modelo. Neste caso o
modelo :
s Exportae Vendas y + + = 083 , 1 003 , 1 900 , 0



187



188
Bibliografia

1. TOLEDO, Geraldo Luciano. OVALLE, Ivo Izidoro. Estatstica Bsica. 2 edio.
So Paulo: Atlas, 1985.

2. MONTGOMERY, Douglas C., RUNGER, George C.. Estatstica aplicada e
probabilidade para engenheiros. Rio de Janeiro: LTC, 2009.

3. MILONE, Giuseppe. Estatstica: geral e aplicada. So Paulo: Thomson Learning,
2006.

4. BRUNI, Adriano Leal. Estatstica aplicada gesto empresarial. 2 edio. So
Paulo: Atlas, 2008.

189
Anexo 1

1. Algoritmo para calcular frequncia em tabela agrupada em classes.

freqagrup<-function(dados){
cat("Dados",dados,"\n\n")

n<-length(dados)
cat("dimenso dados =",n,"\n\n")
menor<-min(dados)
maior<-max(dados)
At<-maior-menor;
k1<-1+3.3*log(n)/log(10);
cat("Numero de classes sem arredondamento =",k1,"\n\n")

k2<-round(1.5+3.3*log(n)/log(10),0);
cat("Nmero de classes arredondado =",k2,"\n\n")
k<-k2
Ac<-At/k;
cat("At =",At,"\n\n")
cat("k =",k,"\n\n")
cat("Ac =",Ac,"\n\n")

for(j in 1:k){
if(j<k){
freq2<-0
freq1<-0
for(i in 1:n){

if((menor+(j-1)*Ac)<=dados[i]&dados[i]<(menor+(j)*Ac)){
freq<-1
freq1<-freq+freq1
}

}
freq2[j]<-freq1

cat("Classe (",j,")=>","De",(menor+(j-1)*Ac),"at",(menor+j*Ac),"=> frequnica
=",freq2[j],"\n\n")
}
if(j==k)
{
freq2<-0
freq1<-0
for(i in 1:n){

if((menor+(j-1)*Ac)<=dados[i]&dados[i]<=(menor+(j)*Ac)){
freq<-1
freq1<-freq+freq1
}
190

}
freq2[j]<-freq1

cat("Classe (",j,")=>","De",(menor+(j-1)*Ac),"at",(menor+j*Ac),"=> frequnica
=",freq2[j],"\n\n")
}
}

}
191
Anexo 2


Comandos Software R

#=======================================================
Gerar amostras aleatrias
#=======================================================

criar vetor de amostras x

sort(x)# ordena os valores de x.

sample(x,5,T)# gera 5 amostras do vetor x com reposio

sample(x,5)# gera 5 amostras do vetor x sem reposio

#=======================================================
# Mudar diretrio
#=======================================================
Arquivo

Mudar diretorio

Nome da pasta
#=======================================================
# Leitura e Preliminares dos Dados
#=======================================================

Leitura dos dados

gasolina <- scan(file="gasolina.txt")

frango <- scan(file="frango.txt")

alcatra <- scan(file="alcatra.txt")

dados<-data.frame(frango,alcatra) # banco de dados juntos frango + alcatra

attach(dados)# apresenta os nomes das variveis

names(dados)# apresenta os nomes das variveis

dim(dados) # dimenso dos dados

dados[1:15]# apresenta os 15 primeiros resultados



192
#==========================================================
# Estatsticas Descritivas
#==========================================================

summary(gasolina)

summary(frango)

mean(gasolina)

median(gasolina)

quantile(gasolina) # retorna os quartis

var(gasolina)# varincia

cov(frango,alcatra) #Covarincia

cor(frango,alcatra)#correlao

#==============================================================
# Tabela
#===============================================================

table(frango)# apresenta tabela distribuio frequencia simples.


#==============================================================
# Graficos
#===============================================================

boxplot(gasolina,ylab="Preos da Gasolina")

boxplot(frango,alcatra,ylab="Preos",xlab="frango X alcatra")

hist(frango)

plot(alcatra)

pairs(cbind(frango,alcatra)) # faz o grfico de disperso x1 versus x2 e vice
versa

t<-ts(frango) # transforma um conjunto de dados frango em uma srie
temporal

plot(t)# faz o grfico da srie temporal

par(mfrow=c(2,1))#divide a tela em 2.

hist(gasolina)
193

abline(v=mean(gasolina))# faz uma linha na mdia de x1.

abline(v=median(gasolina))# faz uma linha na mediana de x1.

abline(v=quantile(gasolina))# faz uma linha nos quantis de x1.



#==============================================================
Regresso linear
#===============================================================

plot(x, y) # grfico de disperso.

fm <- lm(y ~ x) # regresso entre conjuntos pareados y e x.

fm # apresenta os coeficientes da regresso.

anova(fm)# apresenta tabela anova do modelo.

abline(lm(y~x)) # traa a reta de regresso.