Você está na página 1de 89

MATEMTICA

Curso de ps-graduao
lato sensu

PROBABILIDADE
E ESTATSTICA
Marcos Santos de Oliveira
Daniela Carine Ramires de Oliveira

Universidade Aberta do Brasil


Ncleo de Educao a Distncia
Universidade Federal de So Joo del-Rei

Ps-graduao lato sensu


Curso de Matemtica

Probabilidade e Estatstica
Marcos Santos de Oliveira
Daniela Carine Ramires de Oliveira

UFSJ
MEC / SEED / UAB
2009

O48p Oliveira, Marcos Santos de


Probabilidade e estatstica / Marcos Santos de Oliveira ; Daniela
Carine Ramires de Oliveira . So Joo del-Rei, MG : UFSJ, 2009.
87 p.
Apostila do curso de Ps-graduao lato sensu em Matemtica.
1. Matemtica Estudo e ensino 2. Probabilidade 3. Estatstica I.
Oliveira, Daniela Carine Ramires de I. Ttulo.
CDU: 519.2

Reitor
Helvcio Luiz Reis
Coordenador UAB/NEAD/UFSJ
Heitor Antnio Gonalves
Coordenadora do curso Educao Empreendedora
Rosngela Maria de Almeida Camarano Leal
Coordenador do curso Matemtica
Carlos Alberto Raposo da Cunha
Coordenadores do curso Prticas de Letramento e Alfabetizao
Gilberto Aparecido Damiano
Maria Jos Netto Andrade
Conselho Editorial
Adlia Conceio Diniz
Alessandro de Oliveira
Bernadete Oliviera Sidney Viana Dias
Betnia Maria Monteiro Guimares
Frederico Ozanan Neves
Geraldo Tibrcio de Almeida e Silva
Gilberto Aparecido Damiano
Guilherme Chaud Tizziotti
Igncio Csar de Bulhes
Luiz Fernando de Carvalho
Maria do Carmo Santos Neta
Maria do Socorro Alencar Nunes Macedo
Maria Jos Netto Andrade
Marise Santana da Rocha
Rosngela Branca do Carmo
Terezinha Lombello Ferreira
Edio
Ncleo de Educao a Distncia - NEAD-UFSJ
Conselho Editorial NEAD-UFSJ
Capa / Diagramao
Luciano Alexandre Pinto

Probabilidade e Estatstica

Sumrio
Pra comeo de conversa... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 05
Unidade I - Introduo Estatstica e Amostragem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 07
Aula 1 Noes de Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 09
1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 09
1.2 Classificao de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Aula 2 Tcnicas de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Amostragem Aleatria Simples (AAS) . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Amostragem Sistemtica (AS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4 Amostragem Estratificada Proporcional (AEP) . . . . . . . . . . . . . . . . . . . 19
2.5 Amostragem por Conglomerado (AC) . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Unidade II - Explorao de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Aula 1 Tabelas e Grficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.1 Tabelas de Freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2 Tabelas de Classes de Freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3 Grficos para as Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4 Grficos para as Variveis Quantitativas . . . . . . . . . . . . . . . . . . . . . . . . 29
1.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Aula 2 Medidas de Posio e Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.1 Mnimo, Mximo e Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.2 Mdia e Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3 Medidas Separatrizes: Quartis, Decis e Percentis . . . . . . . . . . . . . . . . . . 38
2.4 Amplitude, Varincia e Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Probabilidade e Estatstica

Unidade III - Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43


Aula 1 Introduo Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.1 Processo ou Experimento Aleatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.2 Espao Amostral e Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.3 Definies de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Aula 2 Fundamentos de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.1 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2 Independncia de Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.3 Regra da Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Unidade IV Distribuies de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Aula 1 Variveis Aleatrias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
1.2 Esperana Matemtica e Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
1.3 Distribuies de Probabilidades para Variveis Aleatrias Discretas . . . 66
1.3.1 Modelo Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
1.3.2 Modelo Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
1.3.3 Modelo Hipergeomtrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
1.3.4 Modelo Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Aula 2 Variveis Aleatrias Contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.2 Esperana Matemtica e Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.3 Distribuies de Probabilidades para Variveis Aleatrias Contnuas . . 76
2.3.1 Modelo Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.3.2 Modelo Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

PARA COMEO DE CONVERSA...


A elaborao deste livro nasceu da vontade de produzir um material didtico adequado ao
Ensino a Distncia (EAD) de Probabilidade e Estatstica para o curso de Ps-Graduao Lato
Sensu de Matemtica da Universidade Federal de So Joo del-Rei (UFSJ). O livro foi escrito
com o objetivo de apresentar, de forma resumida e didtica, os conceitos mnimos que so
considerados essenciais no estudo do tema. Isso no significa que o estudante deva se limitar
ao estudo deste volume. Ao contrrio, ele o ponto de partida para busca de um conhecimento
mais amplo e aprofundado sobre o assunto.
O livro est dividido em quatro unidades, contendo duas aulas cada uma. Ao final de cada aula
inclumos exerccios que visam aplicao imediata dos conceitos discutidos.
Esperamos que o(a) prezado(a) Estudante sinta o prazer de estudar este livro na mesma
proporo que os autores sentiram ao elaborar cuidadosamente cada contedo apresentado.
Ateno! Recomendamos insistentemente que voc estude uma aula por semana. Faa todos
os exerccios propostos antes de iniciar o estudo da aula seguinte e tire suas dvidas com os
tutores presenciais e a distncia. Lembre-se de que o ensino a distncia tem suas
peculiaridades e que voc o principal responsvel pelo seu sucesso no curso. Por isso,
necessrio que voc tenha disciplina, dedicao e empenho. No deixe acumular matria. Caso
isso acontea, aproveite os fins de semana para colocar a matria em dia e finalizar cada
unidade proposta.
Ns, professores-autores, bem como os tutores presenciais e os tutores a distncia, estamos
sua disposio para atend-lo(a) da melhor maneira possvel.
Agradecemos equipe do NEAD/UFSJ pelo apoio na produo deste material. Pedimos desde
j desculpas pelos erros que sero eventualmente identificados neste livro. As crticas e
sugestes de colegas e estudantes sero muito bem-vindas e auxiliaro a melhoria da prxima
verso.
Os Autores

UNIDADE I

INTRODUO ESTATSTICA E AMOSTRAGEM

Objetivos
Ao final desta unidade, voc dever ser capaz de
1. Identificar populao e amostra.
2. Conceituar e classificar variveis.
3. Aplicar diferentes tcnicas de amostragem.
4. Diferenciar as tcnicas de amostragem a partir de suas caractersticas.

Aula 1 Noes de Estatstica


1.1 Introduo
A palavra estatstica derivada da palavra latina status (que significa estado). Os primeiros
usos da estatstica envolviam compilao de dados e grficos que descreviam vrios aspectos
de um estado ou pas. Em 1662, John Graunt publicou informao estatstica acerca de
nascimentos e mortes. O trabalho de Graunt foi seguido por estudos sobre taxas de
mortalidade e de doenas, tamanhos de populao, renda e taxas de desemprego. As famlias,
os governos e as empresas se apiam fortemente nos dados estatsticos para orientao. Por
exemplo, taxas de desemprego, taxas de inflao, ndices do consumidor e taxas de
nascimento e morte so cuidadosamente compiladas de modo regular, e os dados resultantes
so usados para tomar decises que afetam futuras contrataes, nveis de produo e
expanso para novos mercados. Assim, necessitamos entender os conceitos bsicos da
Estatstica, bem como as suposies necessrias para o seu emprego de forma criteriosa, em
cada tipo de problema a ser analisado.

O que Estatstica?
Podemos considerar que a Estatstica uma cincia que fornece um conjunto de tcnicas que
nos permitem, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou
experimentos realizados em qualquer rea do conhecimento. Estamos denominando por dados
a um (ou mais) conjunto de valores, numricos ou no. A aplicabilidade das tcnicas a serem
discutidas se d nas mais variadas reas das atividades humanas. Nesse sentido, o principal
objetivo da Estatstica nos auxiliar a tomar decises ou tirar concluses em situaes de
incerteza, a partir de informaes numricas.

A Estatstica pode ser dividida em trs reas, a saber:

Estatstica Descritiva: conjunto de tcnicas destinadas a descrever e resumir os dados, a


fim de tirarmos concluses a respeito de caractersticas de interesse.

Probabilidade: teoria matemtica utilizada para se estudar a incerteza associada a


fenmenos aleatrios.

Inferncia Estatstica: denominao usualmente empregada ao estudo de tcnicas que


possibilitam a extrapolao, a um grande conjunto de dados (populao), das informaes
e concluses obtidas a partir de um subconjunto de valores (amostra).

Estudos complexos envolvendo o tratamento estatstico dos dados usualmente envolvem as


trs reas mencionadas anteriormente. Para exemplificar tal procedimento, considere o
esquema apresentado na Figura 1, a seguir:

Figura 1. Estatstica na prtica.

A Figura 1 ilustra como a Estatstica funciona na prtica. Suponha, inicialmente, que estamos
interessados em estudar algumas caractersticas em um grande conjunto de dados que
denominaremos de populao. Deve-se considerar que, na terminologia estatstica, populao
refere-se no somente a uma coleo de indivduos, mas ao alvo no qual reside nosso
interesse. Assim, todos os clientes de um banco, todos os alunos de uma faculdade, todos os
automveis de uma determinada marca, ou mesmo todo o sangue no corpo de uma pessoa so

10

exemplos de possveis populaes. Algumas vezes podemos acessar todos os dados da


populao (nesse caso dizemos que o censo foi realizado), mas em muitas situaes tal
procedimento no pode ser realizado. Em geral, razes econmicas e ticas so as mais
determinantes dessas situaes. Para contornar esse fato, tomamos alguns elementos da
populao para formar um grupo a ser estudado. Esse subconjunto da populao, em geral
com dimenso sensivelmente menor, denominado amostra.

A seleo de uma amostra pode ser feita de vrias maneiras, dependendo, entre outros fatores,
do grau de conhecimento que temos da populao, da quantidade de recursos disponveis, e
assim por diante. Existem tcnicas adequadas de amostragem que nos auxiliam na obteno de
um subconjunto de valores o mais parecido possvel com a populao que lhe d origem.
Algumas dessas tcnicas sero vistas posteriormente.

Obtida uma amostra, o prximo passo utilizar as tcnicas de Estatstica Descritiva para
organizar e descrever os resultados contidos na amostra. A partir da, podemos usar tcnicas de
Inferncia Estatstica para estimar quantidades desconhecidas, realizar extrapolao dos
resultados e testar algumas hipteses de interesse sobre a populao. As tcnicas de Inferncia
Estatstica no fazem parte da ementa desta disciplina; entretanto, as mesmas sero vistas de
forma detalhada na disciplina Estatstica Aplicada.

Um Pouco da Histria da Cincia Estatstica


A ttulo de curiosidade, apresentamos um pouco da histria da Cincia Estatstica.

5000 a.C. Surgiram os primeiros registros egpcios de presos de guerra.


2000 a.C. Houve o primeiro censo Chins.
695

Primeira utilizao da mdia ponderada pelos rabes na contagem de moedas.

1303

Origem dos nmeros combinatrios (Shihcieh Chu).

1654

Pierre de Fermat e Blaise Pascal, dois famosos matemticos, estabelecem os


Princpios do Clculo das Probabilidades.

1763

Primeiras idias das tcnicas de Inferncia Estatstica (Thomas Bayes).

11

1930

Incio das tcnicas de Controle Estatstico de Qualidade nas indstrias.

1940

Inveno do Computador Eletrnico.

Maiores detalhes sobre a histria da Estatstica podem ser encontrados no site da Associao
Brasileira de Estatstica ABE, no link
http://www.redeabe.org.br/historia.htm

1.2 Classificao de Variveis


Qualquer caracterstica associada a uma populao chamada de varivel. Ela recebe esse
nome porque ela varia de alguma forma. A idade de um indivduo, o sexo ou o estado civil
so possveis exemplos de variveis. Alguns conjuntos de dados consistem de nmeros (tais
como altura de 1,50 m a 2,15 m), enquanto outros so no-numricos (tais como cor dos
olhos: verde e castanho). Os termos dados quantitativos e dados qualitativos so em geral
usados para distinguir entre esses dois tipos. Dessa forma, as variveis podem ser classificadas
como Qualitativas ou Quantitativas. Vejamos um exemplo.

Exemplo 1. A MD Indstria e Comrcio, desejando melhorar o nvel de seus funcionrios,


montou um curso experimental e indicou 25 funcionrios para a primeira turma. Os dados
esto dispostos na Tabela 1. Como havia dvidas quanto adoo de um nico critrio de
avaliao, cada instrutor adotou seu prprio sistema de aferio.

De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais
de um) resultado correspondendo realizao de uma caracterstica (ou caractersticas). Por
exemplo, considerando a varivel conceito em ingls, para cada funcionrio pode-se associar
um dos resultados, A, B, C ou D.

12

Tabela 1. Informaes sobre seo, grau de instruo, nmeros de filhos, notas e conceitos
nas disciplinas redao, ingls, metodologia e poltica de 25 empregados da MD Indstria e
Comrcio.
Grau de
N de
instruo
filhos
1
Pessoal Ensino Mdio
0
2
Pessoal
Fundamental
2
3
Pessoal Ensino Mdio
3
4
Pessoal Ensino Mdio
1
5
Pessoal
Superior
2
6
Pessoal
Superior
1
7
Pessoal
Fundamental
1
8
Tcnica
Fundamental
2
9
Tcnica
Superior
3
10 Tcnica Ensino Mdio
4
11 Tcnica
Fundamental
2
12 Tcnica Ensino Mdio
3
13 Tcnica
Superior
1
14 Tcnica
Superior
1
15
Venda
Ensino Mdio
0
16
Venda
Fundamental
1
17
Venda
Superior
0
18
Venda
Fundamental
0
19
Venda
Superior
3
20
Venda
Superior
2
21
Venda
Fundamental
1
22
Venda
Ensino Mdio
2
23
Venda
Fundamental
1
24
Venda
Superior
0
25
Venda
Superior
1
Fonte: Adaptado de Bussab e Morettin (2006).
Func. Seo

Redao
8,6
7,0
8,0
8,6
8,0
8,5
8,2
7,5
9,4
7,9
8,6
8,3
7,0
8,6
8,6
9,5
6,3
7,6
6,8
7,5
7,7
8,7
7,3
8,5
7,0

Ingls Metodologia Poltica


B
B
D
D
A
B
D
B
B
B
C
D
B
A
C
A
D
C
D
C
D
C
C
A
B

A
C
B
C
A
A
C
C
B
C
B
B
C
B
B
A
C
C
C
B
B
A
C
A
A

9,0
6,5
9,0
6,0
6,5
6,5
9,0
6,0
10,0
9,0
10,0
6,5
6,0
10,0
10,0
9,0
10,0
6,0
6,0
6,0
6,5
6,0
9,0
6,5
9,0

Algumas variveis como seo, grau de instruo, conceito em ingls e conceito em


metodologia apresentam como possveis resultados uma qualidade (ou atributo) do indivduo
pesquisado. Logo, essas variveis so chamadas de variveis qualitativas. Dentre as variveis
qualitativas, ainda podemos fazer uma distino entre dois tipos, a saber: varivel qualitativa
nominal ou varivel qualitativa ordinal.

13

Uma varivel qualitativa nominal se no existe nenhuma ordenao nos possveis


resultados. Possveis exemplos so seo a que o funcionrio pertence, sexo, raa etc.

Uma varivel qualitativa ordinal se existe uma ordem natural nos seus resultados. Alguns
exemplos so grau de instruo, conceito em ingls, classe social etc.
As variveis nota em redao, nota em poltica e nmero de filhos apresentam como possveis
resultados nmeros resultantes de uma contagem ou mensurao. Essas variveis so
chamadas de variveis quantitativas. As variveis quantitativas tambm podem sofrer uma
classificao dicotmica: discreta ou contnua.
Uma varivel quantitativa discreta se os seus possveis valores formam um conjunto finito
ou infinito enumervel de nmeros, e que resultam, freqentemente, de uma contagem. Alguns
exemplos so nmeros de filhos, nmeros de carros na famlia etc.
Uma varivel quantitativa contnua se os seus possveis valores pertencem a um intervalo
de nmeros reais e que resultam de uma mensurao. Possveis exemplos so nota em redao
e poltica, peso, altura etc.
Para cada tipo de varivel existem tcnicas apropriadas para resumir as informaes dos dados
obtidos da amostra. Por exemplo, a utilizao de uma tabela um meio de descrever os dados
de uma forma resumida. Veremos mais detalhes sobre tabelas e grficos nas prximas sees.
Em algumas situaes podemos atribuir valores numricos s vrias qualidades ou atributos de
uma varivel qualitativa e depois se proceder anlise como se esta fosse quantitativa, desde
que o procedimento seja passvel de interpretao.
Existe um tipo de varivel qualitativa para a qual essa quantificao muito til: a chamada
varivel dicotmica. Para essa varivel podem ocorrer somente duas realizaes, usualmente
chamadas de sucesso e fracasso. Exemplos de variveis dicotmicas so sexo, hbito de fumar
(sim ou no) etc.

14

1.3 EXERCCIOS
1. Para as situaes descritas a seguir, identifique a populao e a amostra correspondente e
discuta a validade do processo de inferncia estatstica para cada um dos casos.
a. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
b. Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por
telefone com relao ao canal em que estavam sintonizados.
c. A fim de avaliar a inteno de voto para presidente dos brasileiros, 122 pessoas foram
entrevistadas em Braslia.

2. Classifique cada uma das variveis abaixo em qualitativa (nominal ou ordinal) ou


quantitativa (discreta ou contnua).
a. Inteno de voto para presidente (possveis respostas so os nomes dos candidatos, alm de
no sei).
b. Perda de peso de maratonistas na Corrida de So Silvestre, em quilos.
c. Intensidade da perda de peso de maratonistas na Corrida de So Silvestre (leve, moderada,
forte).
d. Grau de satisfao da populao brasileira com relao ao trabalho de seu presidente
(valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito).
e. Nmero de peas produzidas por uma mquina num dia de trabalho (500, 1000 etc).

15

Aula 2 Tcnicas de Amostragem


2.1 Introduo
A amostragem naturalmente usada em nossa vida diria. Por exemplo, para verificar o
tempero de um alimento em preparao, podemos provar (observar) uma pequena poro deste
alimento. Nesse caso, estamos fazendo uma amostragem, ou seja, extraindo do todo
(populao) uma parte (amostra) com propsito de avaliarmos sobre a qualidade do tempero
de todo o alimento.

Por que realizar amostragem?


Existem vrias razes para o uso de amostragem em levantamento de grandes populaes.
Algumas delas, entre outras, so as seguintes:

Economia: em geral, torna-se bem mais econmico o levantamento de somente uma parte
da populao.

Tempo: numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria
tempo suficiente para pesquisar toda a populao de eleitores do pas.

Operacionalidade: mais fcil realizar operaes de pequena escala. Um dos problemas


tpicos nos grandes censos o controle dos entrevistadores.

Quando o uso de amostragem no interessante?

Populao pequena: no h necessidade de utilizar tcnicas estatsticas, pois neste caso


aconselhvel realizar o censo (anlise de toda a populao).

Caracterstica de fcil mensurao: talvez a populao no seja to pequena, mas a


varivel que se quer observar de to fcil mensurao que no compensa investir num
plano de amostragem. Por exemplo, para verificar a porcentagem de funcionrios
favorveis mudana no horrio de um turno de trabalho, podemos entrevistar toda a
populao no prprio local de trabalho. Esta atitude pode ser politicamente mais
recomendvel.

16

Necessidade de alta preciso: a cada dez anos o IBGE1 realiza um censo demogrfico
para estudar diversas caractersticas da populao brasileira. Dentre estas caractersticas
tem-se o nmero total de habitantes, uma informao fundamental para o planejamento do
pas. Dessa forma, o nmero de habitantes precisa ser avaliado com grande preciso e, por
isso, se pesquisa toda a populao.

2.2 Amostragem Aleatria Simples (AAS)


A tcnica de amostragem aleatria o mtodo mais simples e um dos mais utilizados para a
seleo de uma amostra. Para a seleo de uma AAS precisamos ter uma lista completa dos
elementos da populao. Este tipo de amostragem consiste em selecionar a amostra atravs de
um sorteio. Sua principal caracterstica est no fato de todos os elementos da populao ter
igual probabilidade de serem escolhidos.

Procedimento para o uso deste mtodo


1. Numerar todos os elementos da populao (de 1 a N) e
2. Efetuar sucessivos sorteios at completar o tamanho da amostra (n).

Para realizar este sorteio, podemos utilizar urnas, tabelas de nmeros aleatrios ou algum
software que gere nmeros aleatrios. A Tabela 2 foi construda usando-se o software Excel
(comando aleatorio()).

Exemplo 2. Estamos interessados em estudar a qualidade da gasolina nos postos de uma


determinada cidade. Essa cidade possui N = 40 postos. A empresa que estudar a qualidade
pode investigar apenas uma amostra de n = 4 postos. Para selecionar uma amostra aleatria
simples basta escolhermos uma posio de qualquer linha da tabela de nmeros aleatrios e
extrairmos conjuntos de dois algarismos (pois N, que o tamanho da populao, possui 2
casas decimais), at completarmos os 4 elementos da amostra. Se o nmero sorteado no

IBGE - Instituto Brasileiro de Geografia e Estatstica

17

existir, simplesmente no consideramos e prosseguimos o processo.


Escolhendo a primeira linha da tabela de nmeros aleatrios, temos a seguinte amostra de 4
elementos:
AAS = {16, 24, 18, 27, 25}.

Tabela 2. Tabela de nmeros aleatrios.


1
3
8
3
6
2
0
9
2
7
5
9
7
3
4

6
9
5
9
2
4
8
3
2
6
8
4
8
0
1

8
6
2
2
9
4
8
1
9
3
5
1
4
4
1

1
5
0
0
0
8
3
2
4
6
5
4
7
8
8

5
3
4
9
4
7
2
6
1
6
9
8
4
6
2

2
8
7
0
5
1
2
2
5
4
4
6
8
6
4

9
3
5
3
1
7
2
9
1
9
3
8
2
3
3

6
3
3
5
4
3
7
3
3
1
6
4
6
4
9

4
3
9
6
3
1
7
4
4
2
6
5
1
1
3

5
0
2
2
1
3
8
1
7
1
9
2
8
2
4

7
3
0
2
6
7
9
1
6
8
8
9
5
7
1

0
2
1
3
9
7
3
3
1
6
1
3
6
3
2

2
0
4
5
2
0
5
8
1
7
2
2
0
8
3

4
0
1
7
8
5
9
1
5
3
0
1
5
7
4

8
6
6
2
8
6
1
0
8
8
3
5
7
4
5

5
4
0
5
2
3
8
7
4
3
3
1
9
4
5

8
2
5
5
5
1
9
1
4
8
7
8
3
8
2

3
1
6
8
1
4
8
1
4
1
4
5
9
2
4

6
7
3
2
4
3
2
3
0
8
5
3
0
9
4

6
3
8
2
0
9
4
7
3
8
6
3
0
8
4

8
1
1
3
9
5
2
3
2
8
6
6
4
9
8

4
3
5
6
5
4
2
9
9
9
0
6
3
0
4

4
3
6
8
7
1
2
2
3
8
1
1
2
8
6

6
6
3
5
3
0
1
9
8
8
6
3
4
2
2

6
5
2
3
2
5
7
5
5
7
8
6
3
0
4

7
9
5
4
6
9
1
7
4
8
5
3
4
1
4

1
6
2
7
3
5
8
2
7
6
8
5
3
5
5

8
7
2
3
9
6
3
8
8
3
5
3
9
5
1

7
6
1
5
9
9
1
2
6
1
7
6
6
3
1

2
8
3
2
3
8
1
5
8
6
6
7
7
3
3

2
6
2
6
8
9
6
6
0
8
4
2
2
5
2

7
8
5
6
2
8
4
7
7
6
6
1
7
8
5

5
9
8
4
1
7
8
4
4
7
0
7
5
1
1

1
3
2
1
4
6
4
4
5
5
5
2
5
7
4

2
5
3
3
5
7
8
7
5
5
6
8
6
4
0

5
7
5
7
4
5
1
2
3
2
4
9
4
6
3

1
2
1
2
0
2
9
7
8
6
3
5
6
2
4

6
6
8
7
9
6
5
1
9
8
1
7
6
2
1

7
4
4
3
6
4
8
7
8
5
1
4
7
4
2

5
5
3
5
2
8
7
8
5
7
2
6
6
2
7

2.3 Amostragem Sistemtica (AS)


utilizada quando a populao est naturalmente ordenada, como listas telefnicas, fichas de
cadastramento e em sistemas de produes contnuos como produes de garrafas de cervejas
etc.

Procedimento para o uso deste mtodo


1. Seja N o tamanho da populao e n o tamanho amostral. Calcula-se o intervalo de
amostragem i = N/n (considera-se apenas a parte inteira do nmero i).
2. Sorteia-se, utilizando-se a tabela de nmeros aleatrios, um nmero x entre 1 e i
formando a amostra: {x, (x + i), (x + 2*i), ... , (x + (n-1)*i)}.

18

Exemplo 3. Considerando uma turma com 49 alunos, retire uma amostra de tamanho 5
utilizando a tcnica de amostragem sistemtica.
Soluo: Temos que N = 49 e n = 5 . Logo,
1) i = N/n = 49/5 = 9,8. Considerando a parte inteira do nmero, temos que i = 9;
2) Sortear um nmero x entre 1 e i = 9 da tabela de nmeros aleatrios que contenha um

algarismo, pois i possui 1 casa decimal. Escolhendo a ltima linha, temos que o primeiro
nmero que est entre 1 e 9 4. Logo, a amostra ser composta dos seguintes elementos:
AS = {4, 13, 22, 31, 40}.

2.4 Amostragem Estratificada Proporcional (AEP)


A populao dividida em subgrupos, denominados estratos (por exemplo, por sexo, classe de
renda, bairro etc.) e a AAS ou AS utilizada na seleo de uma amostra de cada estrato. Esses
estratos devem ser internamente mais homogneos do que a populao toda, com respeito s
variveis em estudo. Aqui, um conhecimento prvio sobre a populao em estudo
fundamental.

A AEP tem as seguintes caractersticas:

dentro de cada estrato h uma grande homogeneidade (pequena variabilidade);

entre os estratos h uma grande heterogeneidade (grande variabilidade).


comum os estratos terem tamanhos diferentes. Nesses casos, a proporcionalidade do

tamanho da amostra de cada estrato da populao deve ser mantida na amostra. Por exemplo,
se um estrato corresponde a 20% do tamanho da populao, ele tambm deve corresponder a
20% da amostra.

Exemplo 4. Com o objetivo de realizar uma pesquisa de opinio sobre a gesto atual da

reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A


populao composta por 70 professores, 80 servidores tcnicos administrativos e 800 alunos,

19

que identificaremos da forma apresentada na Tabela 3.

Tabela 3. Listagem da populao.


Professores

P01 P02 ... P70

Servidores

S01 S02 ... S80


A001 A002 ... A800

Alunos

Supondo que a opinio sobre a gesto atual da reitoria possa ser relativamente homognea
dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por
categoria, para obter uma amostra global de tamanho n = 15. A Tabela 4 mostra as relaes de
proporcionalidade.

Tabela 4. Relaes de proporcionalidade.


Estrato

Proporo na populao

Professores

70/950 = 0,074 (7,4 %)

np = 15 x 0,074 1

Servidores

80/950 = 0,084 (8,4%)

ns = 15 x 0,084 1

800/950 = 0,842 (84,2%)

na = 15 x 0,842 13

Alunos

Tamanho do subgrupo na amostra

Para selecionar aleatoriamente um professor, podemos usar a tabela de nmeros aleatrios,


tomando valores com dois algarismos. Usando a primeira linha, encontramos o seguinte
professor selecionado: {P16}. Para o servidor, usando a segunda linha da tabela, temos: {S39}.
Para os alunos, precisamos extrair nmeros de trs algarismos. Usando a terceira linha da
tabela, temos: {A047, A539, A201, A416, A056, A381, A563, A252, A213, A258, A235, A184, A339}. A
amostra {P16, S39, A047, A539, A201, A416, A056, A381, A563, A252, A213, A258, A235, A184, A339}
uma amostra estratificada proporcional da comunidade da universidade. Cada indivduo desta
amostra dever ser pesquisado para se obter a opinio em relao gesto atual da reitoria.

2.5 Amostragem por Conglomerado (AC)


A populao dividida em subpopulaes (conglomerados) distintas (quarteires, residncias,

20

famlias, bairros etc.). Alguns dos conglomerados so selecionados segundo a AAS, e todos os
indivduos nos conglomerados selecionados so observados. Em geral, menos eficiente que a
AAS ou AE, mas, por outro lado, bem mais econmica. Tal procedimento amostral
adequado quando possvel dividir a populao em um grande nmero de pequenas
subpopulaes.

A AC tem as seguintes caractersticas:

dentro de cada conglomerado h uma grande heterogeneidade (grande variabilidade);

entre os conglomerados h uma pequena variabilidade (grande homogeneidade).

Exemplo 5. Realizao de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais.

Usando a tcnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2


zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas:

5
3

Zona

11

2
4

12
10

Entrevistar todos os
eleitores dessas zonas

fcil confundir amostragem estratificada com amostragem por conglomerado porque ambas
envolvem a formao de subgrupos. A diferena que a amostragem por conglomerado usa
todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada
usa uma amostra de membros de todos os estratos.

21

2.6 Exerccios
1. Refaa o Exemplo 4, considerando agora n = 50 indivduos. Encontre todos os professores,

funcionrios e alunos que constituem a amostra estratificada proporcional.


2. Um administrador especialista em avaliar atravs de sistemas informatizados as aes da

BOVESPA est interessado em fazer uma pesquisa nos preos das aes, para indicar aos seus
clientes se hoje um dia favorvel a fazer investimentos. Ele sabe que existe N = 500 aes
em venda. Como o tempo de estudo de cada ao de aproximadamente 10 minutos, decidiuse verificar apenas n = 25 aes. Utilizando-se as tcnicas de amostragem aleatria simples e
sistemtica, quais aes sero selecionadas?
3. Um depsito em uma determinada empresa produtora de materiais eletrnicos possui N =

100 computadores que esto separados em duas qualidades: N1 = 40 computadores Pentium 3


e N2 = 60 computadores Pentium 4. O custo para verificar se cada computador est sob
controle muito alto. O administrador responsvel disse que a empresa tem condies de
verificar apenas n = 12 computadores. Utilizando-se a tcnica de amostragem estratificada
proporcional no primeiro estgio e a AAS no segundo estgio, quais computadores devem ser
selecionados?
4. Uma cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa

eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que esto
dentro dessas zonas eleitorais, isto , foi utilizada amostragem por conglomerado. Apresente
quais sero as 15 zonas eleitorais amostradas.

22

UNIDADE II

EXPLORAO DE DADOS

Objetivos
Ao final desta unidade, voc dever ser capaz de
1. Organizar dados em tabelas de freqncias e tabelas de classes de freqncias.
2. Construir grficos para variveis qualitativas e quantitativas.
3. Calcular e interpretar medidas de posio.
4. Calcular e interpretar medidas de disperso.

23

24

Aula 1 Tabelas e Grficos


1.1 Tabelas de Freqncias
Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o comportamento
dessa varivel, analisando a ocorrncia de seus possveis resultados. Nesta seo veremos uma
maneira de se dispor um conjunto de realizaes, a fim de se ter uma idia global sobre elas,
ou seja, de sua distribuio.

Observando novamente a Tabela 1, especificamente a coluna que contm a varivel grau de


instruo, no conseguimos dizer rapidamente quantos funcionrios possuem ensino

fundamental, mdio e superior. A Tabela 5 mostra uma maneira de representarmos mais


resumidamente os dados da Tabela 1.

Exemplo 6. A Tabela 5 apresenta a distribuio de freqncias da varivel grau de instruo

dos dados da Tabela 1.

Tabela 5. Freqncias e porcentagens da varivel grau de instruo para os 25 funcionrios.


Grau de Instruo

Freqncia (ni)

Proporo (fi)

Porcentagem (100 x fi)

Fundamental

0,32

33,00

Ensino Mdio

0,28

28,00

Superior

10

0,40

40,00

Total

25

1,00

100,00

Interpretao da Tabela 5. Nota-se que, dos 25 empregados, 33% tem nvel fundamental,

28% nvel mdio e 40% nvel superior.

Notao: Usaremos a notao ni para indicar a freqncia (absoluta) de cada classificao ou

categoria da varivel. A notao fi = ni/n para indicar a proporo (ou freqncia relativa) de

25

cada categoria, sendo o n o nmero total de observaes.

As propores (ou porcentagens) so muito teis quando necessitamos comparar resultados de


duas pesquisas distintas. O prximo exemplo ilustra este fato.

Exemplo 7. Suponha que se queira comparar a varivel grau de instruo dos empregados

que fizeram o curso com a mesma varivel para todos os empregados da Companhia MD.
Digamos que a empresa tenha 2000 empregados e que a distribuio de freqncias seja a da
Tabela 6.

Tabela 6. Distribuio de freqncias dos 2000 empregados segundo o grau de instruo.


Grau de Instruo

Freqncia (ni)

Proporo (fi)

Porcentagem (100 x fi)

Fundamental

650

0,325

32,50

Ensino Mdio

500

0,250

25,00

Superior

850

0,425

42,50

Total

2000

1,000

100,00

Comparao entre a Tabela 5 e a Tabela 6. No podemos comparar diretamente as colunas

das freqncias (ni) das duas tabelas, pois os totais de empregados so diferentes nos dois
casos (n = 25 e n = 2000). Mas as colunas da proporo e da porcentagem so comparveis,
pois reduzimos a um mesmo total. Nesse caso, podemos dizer que a distribuio da varivel
grau de instruo dos funcionrios que fizeram o curso no se diferencia da distribuio dessa

mesma varivel para todos os funcionrios da Empresa MD.

1.2 Tabelas de Classes de Freqncias


A construo de tabelas de freqncias para variveis quantitativas necessita de certo cuidado.
Por exemplo, a construo da tabela de freqncias para a varivel nota em redao da
Tabela 1, usando o mesmo procedimento de tabelas de freqncias, no resumir as 25
observaes num grupo menor.

26

Soluo: Agrupar os dados por faixas de notas. Assim, construmos a chamada tabela de

classes de freqncias.

Exemplo 8. A Tabela 7 fornece a distribuio de freqncias das notas em redao dos 25

funcionrios da Companhia MD por faixas de notas.

Tabela 7. Freqncias e porcentagens das notas em redao.


Classe de notas

Freqncia

Porcentagem

6 |- 7

7 |- 8

36

8 |- 9

12

48

9 |- 10

Total

25

100

Procedendo-se desse modo, ao resumir os dados referentes a uma varivel quantitativa, perdese alguma informao. Por exemplo, no sabemos quais so as doze notas da classe de 8 a 9, a
no ser que investiguemos a tabela original. Sem perda de muita preciso, poderamos supor
que todas as doze notas daquela classe fossem iguais ao ponto mdio da referida classe, isto ,
8,5.

A escolha dos intervalos arbitrria. A familiaridade do pesquisador com os dados que lhe
indicar quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar
que, com um nmero pequeno de classes, perde-se informao, e com um nmero grande de
classes, o objetivo de resumir os dados fica prejudicado. Normalmente, sugere-se o uso de 4 a
8 classes com a mesma amplitude.

1.3 Grficos para Variveis Qualitativas


A representao grfica da distribuio de uma varivel tem a vantagem de, rpida e
concisamente, informar sobre sua variabilidade. Existem vrios tipos de grficos para as

27

variveis qualitativas. Aqui sero ilustrados os dois mais simples e freqentemente utilizados:
grficos de barras e de composio em setores (pizza).

Grfico de barras

O grfico de barras consiste em construir retngulos ou barras, em que uma das dimenses
proporcional magnitude a ser representada (ni), sendo a outra arbitrria, porm igual para
todas as barras. Essas barras so dispostas paralelamente uma s outras, horizontalmente ou
verticalmente. No exemplo a seguir temos o grfico de barras (verticais) para a varivel grau
de instruo da Tabela 6.

45

40

42,5
35

Porcentagem

30

32,5

25

25
20

15

10

Fundamental

Mdio
Grau de Instruo

Superior

Figura 2. Grfico de barras para a varivel grau de instruo.

Grfico de composio em setores (pizza)

O grfico de composio em setores (pizza) destina-se a representar a composio,


usualmente em porcentagem, de partes de um todo. Consiste num crculo de raio arbitrrio,
representando o todo, dividido em setores, que correspondem s partes de maneira
proporcional. A Figura 3 ilustra esse grfico para a varivel grau de instruo.

28

Fundamental
33%

Superior
42%

Mdio
25%

Figura 3. Grfico em setores para a varivel grau de instruo.

1.4 Grficos para Variveis Quantitativas


Para variveis quantitativas podemos considerar uma variedade maior de representaes
grficas.

Grfico de barras

O grfico de barras para as variveis quantitativas construdo da mesma forma que o das
variveis qualitativas. Como ilustrao, considere a varivel nmero de filhos dos 25
empregados da Companhia MD. A Tabela 8 apresenta esses dados.
Tabela 8. Freqncias e porcentagens da varivel nmero de filhos.
N de Filhos Freqncia (ni) Porcentagem (100 x fi)

0
1
2
3
4
Total

5
9
6
4
1
25

20
36
24
16
4
100

A Figura 4 ilustra o grfico de barras.

29

40

36

35

Porcentagem

30

25

24
20

20
16

15

10

4
0

3
Nmeros de Filhos

Figura 4. Grfico de barra para a varivel nmero de filhos.

Grfico de pontos (Dot-Plot)

Quando os dados consistem em um pequeno conjunto de nmeros, estes podem ser


representados traando-se uma reta com uma escala que abranja todas as mensuraes
observadas e grafando-se as respectivas freqncias como pontos acima da reta. Por esse
motivo, tambm conhecido como grfico de pontos.

Exemplo 9. Considere a varivel tempo, em segundos, entre carros que passam por um

cruzamento, viajando na mesma direo. As 14 medies realizadas foram


6,0 3,0 5,0 6,0 4,0 3,0 5,0 4,0 6,0 3,0 4,0 5,0 2,0 11

7
Tempo

10

Figura 5. Grfico de pontos para a varivel tempo.

30

11

Histograma

O histograma consiste em retngulos contguos com base nas faixas de valores da varivel e
com rea igual freqncia relativa (fi) da respectiva faixa. Desta forma, a altura de cada
retngulo denominada densidade de freqncia definida pelo quociente da rea pela
amplitude da faixa, ou seja, fi/ai, com ai indicando a amplitude da i-sima classe. Com essa
conveno, a rea total do histograma ser 1 (um).

Exemplo 10. Considerando a varivel nota em redao dos 25 funcionrios da Companhia

MD, dispostos na Tabela 7. O histograma correspondente apresentado na Figura 6.


0,5

48 %

Densidade

0,4

36 %

0,3

0,2

0,1

0,0

8%

8%

8
Notas em Redao

10

Figura 6. Histograma das notas em redao.

Grfico de linhas

um grfico muito importante utilizado para representar observaes feitas ao longo do


tempo, em intervalos iguais ou no. Tais conjuntos de dados constituem as chamadas sries
histricas ou sries temporais. Traduzem o comportamento de um fenmeno em certo
intervalo de tempo.

Exemplo 11. Considere a dvida externa do Brasil (em milhes de dlares) no perodo de 1956

a 2006, apresentados na Tabela 9.

31

Tabela 9. Dvida externa do Brasil de 1956 a 2006, em milhes de dlares.


Ano

Dvida

Ano

Dvida

Ano

Dvida

Ano

Dvida

1956

2736

1969

4635

1982

85487

1995

159256

1957

2491

1970

6240

1983

93745

1996

179935

1958

2870

1971

8284

1984

102127

1997

199998

1959

3160

1972

11464

1985

105171

1998

241644

1960

3738

1973

14857

1986

111203

1999

241468

1961

3291

1974

20032

1987

121188

2000

236156

1962

3533

1975

25115

1988

113511

2001

226067

1963

3612

1976

32145

1989

115506

2002

227689

1964

3294

1977

37951

1990

123439

2003

235414

1965

3823

1978

52187

1991

123910

2004

220182

1966

3771

1979

55803

1992

135949

2005

187987

1967

3440

1980

64259

1993

145726

2006

191999

1968

4092

1981

73963

1994

148295

Fonte: IPEADATA

250000

200000

150000

100000

50000

0
1956

1960

1964

1968

1972

1976

1980

1984

1988

1992

1996

Ano

Figura 7. Grfico de linhas da dvida externa do Brasil.

32

2000

2004

1.5 Exerccios
1. Os dados a seguir referem-se aos conceitos obtidos de 60 alunos, na disciplina de

Estatstica, de uma turma da UFSJ.


Tabela 10. Dados Brutos da disciplina de Estatstica de uma turma da UFSJ.

R: Ruim

M: Mdio

B: Bom

O: timo

M M M

M M

M M M M

M M M M M

a. Organize os dados da Tabela 10 em uma tabela de freqncias contendo ttulo, freqncia

absoluta, freqncia relativa, porcentagens e uma interpretao.


b. Represente os dados da tabela obtido em a. atravs do grfico de composio de setores.

2. A partir da Tabela 1, construa


a. a distribuio de freqncias da varivel conceito em metodologia, com as freqncias

absoluta e relativa, as porcentagens, d um ttulo e interprete;


b. uma tabela de classes de freqncias para a varivel nota em poltica, com as freqncias

absoluta e relativa, as porcentagens, d um ttulo e interprete;


c. Construa o grfico de barras para a tabela montada no item a;
d. Faa o histograma utilizando a tabela de classes obtida do item b.

3. Faa o grfico de linhas para os dados fornecidos na sua conta de luz durante o ltimo ano,

isto , no eixo x coloque os meses e no eixo y coloque o consumo em kwh.

33

Aula 2 Medidas de Posio e Disperso


2.1 Mnimo, Mximo e Moda
O mnimo a menor observao do conjunto de dados, enquanto que o mximo a maior
observao.
Exemplo 12. Considere o seguinte conjunto de dados: 4, 5, 4, 6, 5, 8, 4. Nesse caso, o mnimo

4 e o mximo 8.
A moda o valor ou atributo que ocorre com maior freqncia.
Exemplo 13. Considere os seguintes bancos de dados:

a) 2, 5, 2, 7, 8

Neste caso a moda = 2.

b) 3, 4, 2, 2, 4, 5

As modas so 2 e 4. Dizemos que o conjunto bimodal.

c) 1, 2, 3, 4, 5

O conjunto no apresenta moda, sendo chamado de conjunto amodal.

Podemos calcular o mnimo, mximo e moda se os dados esto agrupados em tabelas de


freqncias. Considere o prximo exemplo.
Exemplo 14. Uma empresa de segurana deseja estudar qual o nmero de ligaes a cobrar

mais freqentes que so recebidas em um determinado bairro de classe alta da cidade de So


Paulo no ms de maro. Foram selecionadas 30 residncias e observado o nmero de ligaes
a cobrar em cada residncia. O resultado se encontra na Tabela 11.

34

Tabela 11. Distribuio de freqncia do nmero de ligaes a cobrar.


Nmero de ligaes a cobrar

Nmero de residncias (ni)

15

Total

30

A moda 2 ligaes a cobrar, pois foi o nmero que ocorreu com maior freqncia. O valor
mnimo foi zero e o valor mximo da varivel foi 3.

2.2 Mdia e Mediana


A mais importante medida de posio a mdia aritmtica. Esse conceito j , sem dvida,
familiar ao Leitor, quando fala, por exemplo, da altura mdia de um grupo de alunos ou da
nota mdia da sala em determinada prova.

A mdia aritmtica a soma das observaes divididas pelo nmero delas. De forma mais
formal, considere n observaes de um conjunto de dados representados por x1, x2,..., xn. A
mdia deste conjunto obtida pela soma das n observaes divididas por n, ou seja,
n

x + x2 + x3 +L + xn
=
x= 1
n

x
i =1

(4.1)

Exemplo 15. Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A mdia das notas


x=

2 + 5 + 3 + 7 + 8 25
=
=5
5
5

Podemos adaptar a frmula (4.1) para o caso de dados agrupados em tabelas de freqncia.
Neste caso, a mdia calculada levando-se em conta as freqncias de cada valor da varivel,
da seguinte forma:

35

x=

x n
i

i =1

(4.2)

onde v a quantidade de resultados que a varivel contm e ni a respectiva freqncia da isima classe. Assim, para o Exemplo 14, temos
n

x=

x n
i

i =1

0x 2 + 1x 5 + 2x15 + 3x8
= 1,9 6 2 .
30

Portanto, o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe


alta da cidade de So Paulo no ms de maro 2.

A mediana o valor que ocupa a posio central da srie de observaes, quando esto
ordenadas em ordem crescente.

Assim, se as cinco observaes de uma varivel forem 3, 4, 7, 8 e 8, a mediana o valor 7,


correspondente terceira observao. Quando o nmero de observaes for par, usa-se como
mediana a mdia aritmtica das duas observaes centrais. Acrescendo-se o valor 9 srie
acima, a mediana ser (7 + 8)/2 = 7,5.

Vamos formalizar o conceito da mediana. Considere que x1, x2, ..., xn so os n valores
(distintos ou no) da varivel X. Considerando as observaes ordenadas em ordem crescente,
podemos denotar a menor observao por x(1), a segunda por x(2), e assim por diante, obtendose
x(1) x(2) ... x(n-1) x(n)

(4.3)

Por exemplo, se x1 = 3, x2 = -2, x3 = 6, x4 = 1 e x5 = 3, ento -2 1 3 3 6, de modo que


x(1) = -2, x(2) = 1, x(3) = 3, x(4) = 3 e x(5) = 6.
As observaes ordenadas como em (4.3) so chamadas estatsticas de ordem.

Com essa notao, a mediana da varivel X pode ser definida como

36

x n +1

med(x) = x n + x n
+1
2
2

se n impar
se n par

Nota: A mediana depende da posio e no dos valores dos elementos na srie ordenada. Essa
uma diferena marcante entre mediana e mdia, pois a mdia se deixa influenciar, e muito,
pelos valores extremos. Vejamos:
Na srie: 5, 7, 10, 13, 15

Mdia = 10 e Mediana = 10;

Na srie: 5, 7, 10, 13, 65

Mdia = 20 e Mediana = 10,

isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia
dos valores extremos, ao passo que a mediana permanece a mesma.

Quando os dados esto agrupados em tabelas de freqncias, o mtodo mais prtico para
calcular a mediana adicionar uma coluna tabela contendo a freqncia acumulada. Vejamos
um exemplo.

Exemplo 16. Considere novamente o Exemplo 14 da empresa de segurana que desejava


estudar qual o nmero de ligaes a cobrar mais freqentes recebidas em um determinado
bairro de classe alta da cidade de So Paulo no ms de maro. Vamos introduzir uma nova
coluna na tabela dos dados referente freqncia acumulada, que obtida acumulando-se as
freqncias absolutas (ni). No caso em particular teremos

F1 = n 1 ,

F2 = n 1 + n 2 ,

F3 = n 1 + n 2 + n 3 e finalmente, F4 = n 1 + n 2 + n 3 + n 4 = n .

Como o rol par, pois n = 30, a mediana ser a mdia dos valores que esto nas posies 15 e
16. Ambos os valores que esto nestas posies so 2 ligaes a cobrar recebida por
residncia, pois F3 a primeira freqncia acumulada que contm os elementos da 15 e 16
posies.

37

Tabela 12. Freqncia absoluta e acumulada do nmero de ligaes a cobrar.


Nmero de ligaes a cobrar

Nmero de Residncias (ni)

Freq. Acumulada (Fi)

15

22

30

Total

30

2.3 Medidas Separatrizes: Quartis, Decis e Percentis


Alm das medidas de posio que estudamos, h outras que, consideradas isoladamente, no
so medidas de tendncia central, mas esto ligadas mediana relativamente sua
caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores.
Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana,
conhecidas pelo nome de separatrizes.

Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais.
Portanto, precisamos de 3 quartis (Q1, Q2 e Q3) para dividir a srie em quatro partes iguais.
Note que o quartil 2 (Q2) por definio a prpria mediana da srie.
O mtodo mais prtico para calcular os quartis utilizar o princpio do clculo da mediana
para os 3 quartis. Na realidade sero calculadas 3 medianas em uma mesma srie.

Exemplo 17. Cosidere a seguinte srie de dados: 5, 2, 6, 9, 10, 13, 15. Ordenando a srie,

temos: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie acima em duas partes iguais 9. Logo a
mediana 9 = Q2. Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores
iguais proporcionados pela mediana. Para o clculo do quartil 1 (Q1) e quartil 3 (Q3) basta
calcular as medianas de cada um desses grupos. Assim, em {2, 5, 6}, a mediana 5 = Q1. Em
{10, 13, 15} a mediana 13 = Q3.

38

Seguindo o mesmo principio dos quartis (que divide em quatro partes a srie de dados) e
levando em conta o aumento do nmero de informaes disponveis, podemos dividir a srie
de dados em 10 partes ou 100 partes. Quando dividimos em 10 partes, obtemos os decis (D1,
D2,..., D9) e em 100 partes obtemos os percentis (P1, P2,..., P99).
Como ilustrao, o decil D6 representa o valor que deixa 60% das informaes a sua esquerda
e, conseqentemente, 40% a sua direita. De forma anloga, o percentil P74 representa o valor
que deixa 74% das observaes a sua esquerda e 26% a sua direita.

2.4 Amplitude, Varincia e Desvio Padro


O resumo de um conjunto de dados por uma nica medida representativa de posio central
esconde toda a informao sobre a variabilidade do conjunto de observaes. Comecemos com
um exemplo de motivao para ilustrar a importncia da utilidade das medidas de disperso,
tambm conhecidas como medidas de variabilidade.

Exemplo 18. Para preencher uma nica vaga existente em uma empresa, 50 candidatos foram

submetidos a 6 provas de mesma importncia sobre conhecimentos especficos de interesse da


empresa. Trs destes candidatos destacaram-se com as notas descritas na Tabela 13.

Tabela 13. Distribuio das notas.


Candidatos

Provas

7,0

7,5

8,0

8,0

8,5

9,0

6,0

7,0

8,0

8,0

9,0

10,0

7,5

8,0

8,0

8,0

8,0

8,5

Fonte: Dados hipotticos

Que candidato escolher? Por um critrio inicial poderia ser escolhido aquele com a maior
mdia, mas todos tm mesma mdia, ou seja, 8. De modo anlogo, nem adianta pensar em

39

moda ou mediana, pois tambm essas medidas so iguais a 8, para todos os candidatos.

Uma possvel soluo seria adotar um segundo critrio: escolher o candidato que apresentou
notas mais homogneas, isto , aquele que apresentou menor disperso das notas. Poderamos
inicialmente calcular a amplitude, que definida pelo intervalo entre o valor mximo e o
valor mnimo da srie de dados, ou seja, A = mx min. Assim, teramos as seguintes
amplitudes: 2, 4 e 1, respectivamente para os candidatos A, B e C. Apesar de fcil de calcular,
a amplitude tem a desvantagem de levar em conta apenas dois valores, desprezando todos os
outros.

Uma medida de disperso mais rica obtida quando consideramos a soma dos quadrados dos
desvios em relao mdia. Essa medida chamada de varincia, sendo denotada por s2 e
definida por
n

(x x) 2 + (x 2 x) 2 + (x 3 x) 2 + L + (x n x) 2
=
s2 = 1
n 1

(x
i =1

x) 2

n 1

(4.4)

A varincia mede a disperso dos dados em torno de sua mdia.

A raiz quadrada positiva da varincia chamada de desvio padro (representado por s):
n

s=

(x
i =1

x) 2

n 1

(4.5)

Note que a unidade de medida do desvio padro a mesma dos dados originais, sendo assim
interpretvel, enquanto que a varincia fornece uma unidade de medida elevada ao quadrado.
O clculo do desvio padro exige o clculo da varincia.
Exemplo 19. A varincia e o desvio padro para o candidato A do Exemplo 18 fica
s 2A =

(7 8) 2 + (7,5 8) 2 + (8 8) 2 + (8 8) 2 + (8,5 8) 2 + (9 8) 2 2,5


=
= 0,5
6 1
5
s A = 0,5 0,7

De forma anloga podemos encontrar a varincia e o desvio padro para os candidatos B e C,

40

dados respectivamente por s 2B = 2 (s B 1,4) e s C2 = 0,1 (s C 0,3) .


Podemos calcular a varincia atravs da seguinte frmula alternativa:

s2 =

1 n 2
2
x i n ( x )
n 1 i =1

(4.6)

A frmula (4.6) obtida atravs de algumas manipulaes algbricas na frmula (4.4). Esta
tem a facilidade de apenas necessitar da informao da mdia ( x ) e da soma dos valores ao
quadrado da varivel

n
i =1

xi .

Karl Pearson

Um pouco de histria

A primeira utilizao do termo desvio padro ocorreu em 1894, sendo


devido Karl Pearson.

2.5 Exerccios
1. Os tempos de sobrevivncia (em meses) de um tipo de bateria esto listados a seguir.

5, 21, 21, 23, 23, 25, 27, 29, 30, 31, 32, 32, 32, 34, 35, 36, 38, 38, 38, 42, 43, 44, 60.

a. Calcule a mdia e mediana. Comente os resultados.


b. Calcule o valor mnimo, Q1, Q2, Q3 e mximo. Interprete estas 5 estatsticas.
c. Calcule a varincia e desvio padro. Comente.

2. Considere o seguinte conjunto de dados: 2, 3, 5, 7, 10. Utilize a formula alternativa para

calcular a varincia, sabendo que a mdia 5,4.

41

3. Um rgo do governo do estado est interessado em determinar padres sobre o

investimento em educao, por habitante, realizado pelas prefeituras. De um levantamento de


dez cidades, foram obtidos os valores (codificados) da tabela abaixo:

Cidade

Investimento

20

16

14

19

15

14

16

19

18

a. Calcule a mdia das observaes.


b. Recebero um programa especial as cidades com valores de investimento inferiores mdia

menos duas vezes o desvio padro. Alguma cidade receber o programa?


c. Ser considerada como investimento bsico a mdia das observaes compreendidas entre a

mdia original menos dois desvios padro e a mdia original mais dois desvios padro.
Calcule o investimento bsico e compare com a mdia obtida no item a. Justifique a diferena
encontrada.

42

UNIDADE III

PROBABILIDADE

Objetivos
Ao final desta unidade, voc dever ser capaz de
1. Relacionar experimentos aleatrios com espaos amostrais.
2. Construir novos eventos a partir das operaes elementares de eventos.
3. Calcular probabilidade a partir de eventos condicionais.
4. Calcular probabilidade a partir de eventos independentes.

43

44

Aula 1 Introduo Probabilidade


1.1 Processo ou Experimento Aleatrio
Qualquer fenmeno que gere resultado incerto ou casual chamado de processo ou
experimento aleatrio.

Exemplo 20. Os quatro itens a seguir ilustram experimentos aleatrios, pois no sabemos,

com certeza, o possvel resultado que ocorrer em cada um.

a. Jogar uma moeda duas vezes e observar a seqncia obtida de caras e coroas.

b. Jogar um dado e observar o nmero mostrado na face superior.

c. Observar o peso de animais.

d. Observar o nmero de filhos de um casal.

1.2 Espao Amostral e Evento


Espao amostral () o conjunto de todos os resultados possveis de um experimento

aleatrio.

Todo experimento aleatrio tem associado um espao amostral. O Exemplo 21 ilustra esse
fato.

45

Exemplo 21. Experimentos aleatrios e seus respectivos espaos amostrais.

Experimento aleatrio

Espao amostral
= {1, 2, 3, 4, 5, 6}

a. Jogar um dado e observar o resultado

b. Lanar uma moeda duas vezes e observar as faces = {CC,CK,KC,KK}, com C = Cara
obtidas

e K = Coroa

c. Dois dados so lanados simultaneamente e = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}


estamos interessados na soma das faces observadas

Evento qualquer subconjunto do espao amostral. Usualmente denotamos os eventos com as


letras iniciais do alfabeto na forma maiscula.

Exemplo 22. Considere o experimento de jogar um dado e observar o resultado. Alguns


possveis eventos desse experimento so: A = {ocorrer a face 5} = {5} ou B = {ocorrer face
par} = {2, 4, 6} etc.
Existem dois eventos especiais: espao todo () e o conjunto vazio (). Esses eventos no
tm aplicaes prticas, mas sero teis para provarmos propriedades das probabilidades.

Operaes com eventos


Utilizando o diagrama de Venn, que foi introduzido em 1881 pelo filsofo e matemtico
britnico John Venn, podemos ilustrar as trs operaes bsicas com eventos, a saber,
interseo, unio e complementar. Assim, sejam A e B dois eventos de um mesmo espao
amostral .

46

O evento interseo de A e B, denotado por AB, o evento

em que A e B ocorrem simultaneamente.

O evento unio de A e B, denotado por AB, o evento em


que A ocorre ou B ocorre (ou ambos).

O evento complementar de A, denotado por A , o evento


A

em que A no ocorre.

Exemplo 23. Operaes com eventos. Seja = {1, 2, 3, 4, 5, 6}. Considere os seguintes
eventos: A = {2, 4, 6}, B = {4, 5, 6} e C = {1, 3, 5}. Os eventos a seguir ficam assim:
A B = {4, 6}

AC=

A B = {2, 4, 5, 6}

A Bc = {1, 2, 3, 4, 6}

Eventos disjuntos
Dois eventos A e B so mutuamente exclusivos ou disjuntos se eles no podem ocorrer
simultaneamente (A B = ).

Exemplo 24. Considere os seguintes eventos: A = {o resultado do dado foi 4} e B = {o


resultado do dado foi 5}. O evento A B = , pois impossvel existir o evento A B =
{ocorrer 4 e 5, simultaneamente, em um nico lanamento do dado}.

Aps essas quatro definies, acreditamos que o leitor esteja preparado para aprender a
calcular probabilidades. Sugerimos assim, que faa os dois primeiros exerccios da seo 1.4
antes de prosseguir.

47

1.3 Definies de Probabilidade


A rea de probabilidade comeou a ser desenvolvida no sculo XVII antes ainda da
formalizao da rea da Estatstica, em questes propostas em jogos de azar. Em 1654, Pierre
de Fermat (1601-1665) e Blaise Pascal (1623-1662), na Frana, estabelecem os Princpios do

Clculo das Probabilidades. Em 1656, Huygens (1629-1695) publica o primeiro Tratado de


Probabilidade.

Fermat

Pascal

Huygens

No entanto, fcil perceber que o termo probabilidade j est enraizado no senso comum,
pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais
como situaes de sua vida pessoal; organizando-se em relao a horrios a cumprir, levando
em conta as circunstncias do trfego; agasalhando-se ao sair de casa se a previso do tempo
indicar uma frente fria. Em resumo, prevenindo-se em situaes de risco.

A pergunta que surge ento Como podemos definir Probabilidade?.

Probabilidade uma medida que quantifica a sua incerteza frente a um possvel


acontecimento futuro.

H vrias maneiras de se medir a incerteza e costume se pensar na seguinte diviso:

1) Mtodo Clssico

3) Mtodo Subjetivo

2) Mtodo Freqentista

4) Mtodo Moderno ou Axiomtico

48

O primeiro devido a Laplace e o mais conhecido, pois relaciona eventos favorveis com
eventos possveis. O segundo consiste em repetir um experimento vrias vezes. O terceiro
baseado na opinio pessoal, e o ltimo devido a Kolmogorov e baseia-se no princpio de que
qualquer experimento pode ser modelado.

Mtodo Clssico
Consideremos o caso em que se joga um dado repetidas vezes. O dado tem seis faces: 1, 2, 3,
4, 5, 6. Se o dado homogneo, equilibrado, jogando-o uma vez no h razo para dizermos
que determinada face tenha preferncia sobre as outras. Todos os seis resultados so
igualmente possveis. Ento a probabilidade de aparecer a face 3, por exemplo, de 1/6. O
evento que nos interessa consiste em um elemento, e o espao amostral tem seis elementos.

Definio 5.1. Se A o evento de interesse, a probabilidade de A, representada por P(A),


dada por

P(A) =

Nmero de casos favorveis ao evento A


Nmero de casos possveis

(5.1)

Essa definio se aplica quando os pontos do espao amostral so equiprovveis.

Exemplo 25. No lanamento de uma moeda equilibrada, qual a probabilidade de aparecer uma
Cara? O espao amostral associado = {Cara, Coroa}. Pela definio clssica, a
probabilidade de ocorrncia do evento A = {Cara} P(A) = 1/2. Note que o nmero de
elementos em 2 e o nmero de elementos em A 1.

Mtodo Freqentista
A definio clssica de probabilidade s se aplica a espaos amostrais em que os eventos
simples so igualmente possveis. Esse o caso da maioria das aplicaes de probabilidades
aos jogos de azar, rea que, precisamente, suscitou os primeiros problemas prticos resolvidos
pela teoria das probabilidades. Esses mesmos jogos, entretanto, repetidos inmeras vezes,
levaram a considerar a probabilidade de um evento como a freqncia relativa, ou seja, como a
proporo de vezes que um evento ocorre em uma srie suficientemente grande de realizaes

49

de um experimento, em condies idnticas. Surgiu ento uma nova definio de


probabilidade, a definio freqentista.

Definio 5.2. Se A o evento de interesse, a probabilidade de A dada por

P( A ) =

Nmero de vezes que A ocorreu


Nmero total de repeties do exp erimento

(5.2)

em que o nmero de repeties deve ser grande.

Mtodo Subjetivo
Definio 5.3. Cada indivduo, baseado em informaes anteriores e em sua opinio a respeito
de um evento em questo, pode ter uma resposta para a probabilidade deste evento.

Exemplo 26. Um mdico experiente consegue calcular uma probabilidade de o indivduo ter
uma determinada doena a partir dos sintomas que o indivduo apresenta. Note que outro
mdico pode calcular uma probabilidade diferente para o mesmo indivduo. Da o carter
subjetivo.

Mtodo Moderno
A definio clssica, freqentista e subjetiva de probabilidade, embora sejam bastante
intuitivas e devendo, por isso, ser sempre lembradas, no so definies matematicamente
aceitveis de probabilidade. Por exemplo, no caso da definio freqentista, como saber se,
medida que o nmero de repeties de um experimento cresce, a freqncia relativa converge
para um nmero. Alm das dificuldades com o limite, existem muitas situaes em que
necessrio o uso de probabilidades, e, no entanto, no nem possvel nem intuitivo pensar em
repeties.

A soluo moderna consiste em axiomatizar algumas relaes intuitivas e construir, a partir


delas, toda a teoria de probabilidades, a exemplo do que se faz no estudo da geometria
euclidiana.

50

Definio 5.4. Probabilidade uma funo P() , que associa a cada evento do espao amostral
, um nmero real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:

Axioma 1. 0 P(A) 1.
Axioma 2. P() = 1.
Axioma 3. Se A e B so eventos mutuamente exclusivos: P(AB) = P(A) + P(B).
A partir desses axiomas, podemos demonstrar as seguintes propriedades:

P1: P() = 0, onde o conjunto vazio.


P2: Seja Ac o evento complementar de A, ento P(Ac) = 1 P(A).
P3: Se A e B forem dois eventos quaisquer, ento P(A B) = P(A) + P(B) P(A B).
P4: Se A B, ento P(A) P(B).

Exemplo 27. Seguem alguns exemplos de funes j descobertas na literatura para calcular
probabilidades, que sero discutidas em detalhes nas prximas sees.

Distribuio
Bernoulli

Binomial

Hipergeomtrica

Poisson

Funo de probabilidades

P(X = x ) = p x (1 p )

1 x

n
nx
P(X = x ) = p x (1 p ) , x = 0, 1, ..., n
x
r N r

P(X = x ) =
x n x

P(X = x ) =
f (x) =

Uniforme

Normal

, x = 0, 1

f (x) =

1
2

51

N
, 0 x mnimo(r, n).
n

e x
, x = 0, 1, ...
x!

1
,<x<

1
22

( x )2

, - < x< +

1.4 Exerccios
1. Determine o espao amostral dos seguintes experimentos:
a. Lanar 2 dados e observar as faces superiores;
b. Lanar 2 dados e observar a soma das faces superiores;
c. Uma urna contm 10 bolas azuis e 10 brancas. 3 bolas so retiradas ao acaso e as cores so

anotadas;
d. Uma moeda lanada consecutivamente at o aparecimento da 1 cara;
e. Uma mquina produz 20 peas por hora. Ao final da primeira hora de produo, observa-se

o n de defeituosas;
f. Medio do tempo de vida de uma lmpada antes de se queimar:
2. Considere o seguinte espao amostral: = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. Defina os eventos:

A = nmero par:

B = nmero mpar:

C = mltiplo de 3:

D = maior ou igual a 6:

E = maior que 8:

F = menor que 5:

G = menor ou igual a 3:

Obtenha os seguintes eventos:


a. A B =

e. C D =

b. A B =

f. E F =

c. (A B)c =

g. (A G)c =

d. (A B)c =

h. (Ec B)c =

3. Atividade Prtica do lanamento da moeda.


Passo 1 Arrume um parceiro e tomem uma moeda chamem o valor numrico da moeda de

COROA (K ) e a outra face de CARA (C). Suponham que haja interesse em saber se a sua
moeda honesta (isto significa saber se a probabilidade de CARA de sua moeda 1/2 ou,
em termos percentuais, se a chance de sair Cara 50%).

52

Passo 2 Um membro do grupo vai lanar a moeda e o outro vai marcar os resultados na

planilha anexa, seguindo as seguintes instrues:


a) Jogar a moeda uma vez e anotar C ou K no espao adequado (linha 2) da planilha.
b) Repetir este procedimento 30 vezes, preenchendo um a um todos os espaos da linha 2.

Passo 3 Continuando com a planilha, trocar de lugar com o parceiro, voltar para os itens a) e

b) das instrues e continuar mais 30 jogadas at perfazer 60.

Passo 4 Voltar ao primeiro da dupla e, ainda com a planilha, seguir as instrues:

c) Depois do registro na linha 2 de todos os resultados como C ou K, passar para a linha 3:


chamar CARA de 1 e COROA de 0 e colocar estes valores na planilha, abaixo de cada
resultado j obtido na linha 2. Cada membro do grupo deve fazer metade um faz a linha de
cima e o outro a linha de baixo.

d) Agora a linha 4 da planilha deve ser preenchida em cada posio deve ser colocado o
nmero acumulado de CARAS, at aquela jogada (verifique que a jogada est explicitada na
linha 1- que a linha n). Discutir com outro membro do grupo para ver se est claro se no,
pergunte! A linha de baixo continuao do acumulado da linha de cima.

e) Finalmente chegamos ltima linha linha 5: colocar a freqncia relativa (m/n) de


CARAS em cada momento o que isso? Discuta com o outro membro do grupo (desprezar
as entradas assinaladas com X).
1)
2)
3)
4)
5)

Jogada(n)
C ou K
1 ou 0
Caras Acumuladas (m)
Frequncia Relativa (m/n)

1)
2)
3)
4)
5)

Jogada(n)
C ou K
1 ou 0
Caras Acumuladas (m)
Frequncia Relativa (m/n)

31 32 33

10

12

14

17

40

20

47

53

25

50

30

55

60

Passo 5 Depois de completar a 1a parte da planilha, construir a seguinte tabela, usando as

linhas 4 e 5 da planilha:
n

10

20

30

40

50

60

m/n
Passo 6 Completar o grfico, usando os valores da tabela recm-construda, do seguinte

modo:
Eixo Y valores m/n Eixo X valores da linha 1: (n)
Passo 7 Comparar os resultados com os colegas e interpretar o resultado comentando sobre a

honestidade da sua moeda.


Grfico da Atividade Prtica
m/n
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
1 2 3 4 5 6 7 8 9 10 20
n

30

40

50

60

Concluso: com isso chegamos a uma possvel definio freqentista de probabilidade, ou

seja, probabilidade o valor em que a freqncia relativa se estabiliza aps um nmero muito
grande de ensaios.

54

Aula 2 Fundamentos de Probabilidades


2.1 Probabilidade Condicional
A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade de
um evento A ocorrer sabendo que um evento B j ocorreu.
Sejam A e B dois eventos associados a um mesmo espao amostral . Denota-se por P(A|B) a
probabilidade condicionada do evento A, quando o evento B tiver ocorrido.
Sempre que calculamos P(A|B), estamos essencialmente calculando P(A) em relao ao
espao amostral reduzido devido a B ter ocorrido, em lugar de faz-lo em relao ao espao
amostral original . Assim, uma definio mais formal de probabilidade condicional dada
pela definio 6.1.
Definio 6.1. Dados dois eventos A e B, a probabilidade condicional de A dado que ocorreu

B representada por P(A | B) e definida por


P(A | B) =

P(A B)
,
P(B)

P(B) > 0

(6.1)

Da expresso (6.1), obtemos a regra do produto de probabilidades dada por

P(A B) = P(B)P(A | B)

(6.2)

Exemplo 28. Um grupo de pessoas foi classificado quanto a peso e presso arterial, de acordo

com as propores do quadro a seguir:


Peso
Presso

Excesso

Normal

Deficiente

Total

Alta

0,10

0,08

0,02

0,20

Normal

0,15

0,45

0,20

0,80

Total

0,25

0,53

0,22

1,00

55

a. Qual a probabilidade de uma pessoa escolhida ao acaso nesse grupo ter presso alta?
b. Se se verifica que a pessoa escolhida tem excesso de peso, qual a probabilidade de ela ter

tambm presso alta?

Soluo:
a. Como a pessoa escolhida ao acaso em um grupo em que 20% tem presso alta, chamando

A o evento ter presso alta, P(A) = 0,20 a probabilidade pedida.

b. Chamemos B o evento ter excesso de peso. Nosso interesse passa a ser

P(A | B) =

P(A B) 0,10
=
= 0,40
P(B)
0,25

O que fizemos foi precisamente estabelecer a probabilidade condicional de A dado B, P(A|B),


a partir de P(A B) = 0,10 e P(B) = 0,25.

2.2 Independncia de Eventos


Dois eventos A e B so independentes se a ocorrncia de um no altera a probabilidade de
ocorrncia do outro, isto , P(A|B) = P(A) ou P(B|A) = P(B), ou ainda, a seguinte forma
equivalente:
P(AB) = P(A) P(B)

(6.3)

Exemplo 29. Joaninha tem probabilidade de 0,8 de passar no vestibular, enquanto que

Joozinho tem probabilidade 0,6. Qual a probabilidade de ambos passarem no vestibular?


Qual a suposio a ser feita nesse caso para calcular a probabilidade?

Soluo: Sejam os eventos A: Joaninha passa no vestibular e B: Joozinho passa no

vestibular. Supondo independncia entre os eventos A e B, temos que a probabilidade de


ambos passarem no vestibular P(AB) = 0,8 x 0,6 = 0,48.

56

2.3 Regra da Probabilidade Total


Considere a seqncia {B1, B2, ..., Bn} como sendo uma partio do espao amostral , isto ,
Bi Bj = sempre que i j e B1 B2 ... Bn = . O diagrama da Figura 8 exibe uma
partio de .

B2
B1

B3

B5

B4

Figura 8. Partio do e um evento qualquer A.

Vamos supor que o evento A possa ocorrer juntamente com um e s um dos n eventos
mutuamente exclusivos B1, B2,..., Bn. Em outras palavras vamos assumir que
A = (A B1) (A B2) ... (A Bn),

(6.4)

onde os eventos A Bi e A Bj (com subscritos distintos i e j) so mutuamente exclusivos.

Aplicando a funo probabilidade em ambos os lados de (6.4) temos que


P(A) = P[(A B1) (A B2) ... (A Bn)].

(6.5)

Utilizando a regra de adio em (6.5) obtemos que


P(A) = P(A B1) + P(A B2) + ... + P(A Bn)

(6.6)

Atravs de (6.2), a expresso (6.6) fica


P(A) = P(A | B1 ) P(B1 ) + P(A | B 2 ) P(B 2 ) + ... + P(A | B n ) P(B n )
(6.7)

= P(A | B i ) P(B i )
i =1

57

A expresso (6.7) denominada Regra da Probabilidade Total.

Exemplo 30. Uma mineradora explora trs minas denominadas B1, B2 e B3. A partir de

pesquisas anteriores, sabe-se que a probabilidade de encontrar ouro na mina B1 0,1, na mina
B2 0,05 e na mina B3 0,2. Alm disso, essa mineradora tem explorado as minas B1, B2 e B3
nas propores 0,3, 0,2 e 0,5, respectivamente. Qual a probabilidade de a mineradora
encontrar ouro?

Soluo: Seja A = {encontrar ouro} e Bj = {explorando a j-sima mina j}. Pela regra da

probabilidade total temos


P(A) = P(A | B1 ) P(B1 ) + P(A | B 2 ) P(B 2 ) + P(A | B 3 ) P(B 3 )

= 0,1x0,3 + 0,05x0,2 + 0,2x0,5 = 0,14

2.4 Teorema de Bayes


Finalmente, uma das relaes mais importantes envolvendo probabilidades condicionais
dada pelo teorema de Bayes. Thomas Bayes (1702-1761) afirmou que as probabilidades
devem ser revistas quando conhecemos algo mais sobre os dados. A forma geral do teorema
de Bayes pode ser introduzida atravs do Teorema 6.1.
Teorema 6.1. A probabilidade de ocorrncia do evento Bi, supondo a ocorrncia do evento A,

dado por
P(B i | A) =

P( A | B i ) P( B i )
n

P(A | B )P(B )
i =1

O teorema de Bayes uma generalizao da probabilidade condicional no caso de mais de


dois eventos.

Exemplo 31. Considere novamente o Exemplo 30. Sabendo-se que a mineradora encontrou
ouro, qual a probabilidade de que tenha sido na mina B3?

58

Soluo: Precisamos calcular a seguinte probabilidade:


P(B 3 | A) =

P( A | B 3 ) P( B 3 )
n

P( A | B ) P( B )
i =1

0,2x 0,5 0,10


=
0,7143
0,14
0,14

2.5 Exerccios
1. O campo da Engenharia da confiabilidade se desenvolveu rapidamente a partir do incio da
dcada de 1960. Um tipo de problema encontrado o de se estimar a confiabilidade de um
sistema a partir das confiabilidades dos subsistemas. A confiabilidade definida aqui como a
probabilidade do funcionamento apropriado durante um certo perodo de tempo. Considere a
estrutura de um sistema em srie simples, como o da figura a seguir:

Subsistema 1

Subsistema 2

O sistema funciona se, e somente se, o subsistema 1 e o subsistema 2 funcionarem. Se os


subsistemas sobrevivem independentemente, a confiabilidade do subsistema 1 de 0,90 e do
subsistema 2 de 0,80, qual a confiabilidade do sistema?

2. Em um centro de mquinas, h quatro mquinas automticas de parafusos. Uma anlise dos


registros de inspeo passados fornece os seguintes dados:

Mquina Percentual de Produo Percentual de Defeituosos Produzidos


1
15
4
2
30
3
3
20
5
4
35
2
As mquinas 2 e 4 so mais novas e, assim, a maior parte da produo foi atribuda a
elas. Suponha que o estoque atual reflita as porcentagens de produo indicadas.

a. Se um parafuso selecionado aleatoriamente do estoque, qual a probabilidade de que seja


defeituoso?

b. Se um parafuso selecionado aleatoriamente do estoque e ele defeituoso, qual a


probabilidade de que seja da mquina 2?

59

60

UNIDADE IV

DISTRIBUIES DE PROBABILIDADES

Objetivos
Ao final desta unidade, voc dever ser capaz de
1. Associar variveis aleatrias discretas com modelos probabilsticos.
2. Calcular probabilidades a partir do modelo Binomial, Hipergeomtrico e de Poisson.
3. Associar variveis aleatrias contnuas com modelos probabilsticos.
4. Calcular probabilidades a partir das distribuies Uniforme e Normal.

61

62

Aula 1 Variveis Aleatrias Discretas


1.1 Introduo
Vamos incorporar o conceito de probabilidade ao estudo de variveis associadas a
caractersticas em uma populao. Muitos experimentos produzem resultados no-numricos.
Antes de analis-los, conveniente transformar seus resultados em nmeros. Isso feito
atravs da varivel aleatria (v.a.), que uma funo que associa um valor numrico a cada
ponto do espao amostral.

Para entender melhor o conceito, considere o exemplo que se segue.

Exemplo 32. Observa-se o sexo das crianas em famlias com trs filhos. O espao amostral
= {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)}
Uma v.a. de interesse X = {n. de crianas do sexo masculino}. A cada evento simples ou
ponto de , associamos um nmero, que o valor assumido pela v.a. X:

Evento

MMM

MMF

MFM

FMM

MFF

FMF

FFM

FFF

Poderamos tambm ter considerado o nmero de crianas do sexo feminino. Os valores de X,


na mesma ordem, seriam ento 0, 1, 1, 1, 2, 2, 2, 3.

O passo fundamental para entendermos uma v.a. associar a cada valor a sua probabilidade,
obtendo assim a sua distribuio de probabilidade.

x1

x2

...

xn

P(X=x)

P(X=x1)

P(X=x2)

...

P(X=xn)

63

A funo de probabilidade (P()) deve satisfazer: 0 P(X=xi) 1 p/ xi e

i =1

P(X = x i ) = 1 .

Exemplo 33. Um certo departamento da UFSJ formado por 35 professores, sendo 21


homens e 14 mulheres. Uma comisso de 3 professores ser constituda, sorteando-se, ao
acaso, trs membros do departamento. Qual a probabilidade de a comisso ser formada pelo
menos com duas mulheres?

Soluo: Seja X = {nmero de mulheres na comisso}.

Espao

Probabilidade

HHH

21 20 19
x x
= 0,203
35 34 33

Distribuio de Probabilidade

HHM

21 20 14
x x
= 0,150
35 34 33

HMH

0,150

MHH

0,150

HMM

21 14 13
x x
= 0,097
35 34 33

MHM

0,097

MMH

0,097

MMM

14 13 12
x x
= 0,056
35 34 33

Amostral

P(X)

0,203 0,450 0,291 0,056

Assim, P(X 2) = P(X = 2) + P(X = 3)


= 0,291+ 0,056
= 0,347

64

1.2 Esperana Matemtica e Varincia


Assim como definimos a mdia de uma distribuio de freqncias como a soma dos produtos
dos diversos valores observados pelas respectivas freqncias relativas, natural definirmos
agora a mdia de uma v.a., ou de sua distribuio de probabilidade, como a soma dos produtos
dos diversos valores de xi da v.a. pelas respectivas probabilidades P(X = xi).
A mdia de uma v.a. X tambm chamada valor esperado ou esperana matemtica, ou
simplesmente esperana de X. representada por E(X) e se define como
n

E (X) = x 1 P(X = x 1 ) + x 2 P(X = x 2 ) + L + x n P(X = x n ) = x i P(X = x i )


i =1

uma mdia ponderada dos xi, em que os pesos so as probabilidades associadas.


Exemplo 34. Um lojista mantm extensos registros das vendas dirias de certo aparelho. O

quadro a seguir d o nmero xi de aparelhos vendidos em uma semana e a respectiva


probabilidade:
Nmero xi

Probabilidade P(X = xi)

0,1

0,1

0,2

0,3

0,2

0,1

Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma
semana?
Soluo: Calculemos inicialmente E(X), que o nmero esperado de aparelhos vendidos em

uma semana:
E(X) = (0)(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70.
Para x unidades vendidas o lucro 20x. Logo, o lucro esperado de R$ 54,00.
Varincia

Assim como a mdia uma medida de posio de uma v.a., natural que procuremos uma
medida de disperso dessa varivel em relao mdia. Essa medida a varincia, a ser
representada por 2 e definida por
n

2 = Var (X) = E[X E (X)] 2 = ( x i E (X)) 2 P(X = x i )


i =1

65

Desenvolvendo o termo quadrtico do somatrio, obtemos uma expresso mais fcil de


calcular a varincia dada por
2 = Var (X) = E(X 2 ) [E (X)]2 ,
n

onde E (X 2 ) = x i2 P(X = x i ) .
i =1

Desvio Padro

O desvio padro () a raiz quadrada positiva da varincia. Tem sobre esse ltimo a vantagem
de exprimir a disperso na mesma unidade de medida da v.a.
= 2

1.3 Distribuies de Probabilidades para Variveis Aleatrias Discretas


Para utilizar a teoria das probabilidades no estudo de um fenmeno concreto, devemos
encontrar um modelo probabilstico adequado a tal fenmeno. Por modelo probabilstico para
uma v.a. X entendemos uma forma especfica de funo de distribuio de probabilidade que
reflita o comportamento de X.
Nesse processo de escolha, lanamos mo, em muitas situaes, de algum modelo clssico.
Nesta seo estudaremos os modelos discretos comumente utilizados: Bernoulli, Binomial,
Hipergeomtrica e Poisson.

1.3.1 Modelo Bernoulli


Na prtica, existem muitos experimentos que admitem apenas dois resultados. Por exemplo,
uma pea classificada como boa ou defeituosa; um entrevistado concorda ou no com a
afirmao feita; o resultado de um exame mdico para deteco de uma doena positivo ou
negativo; no lanamento de um dado ocorre ou no a face 5.

66

Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas
do tipo sucesso-fracasso. Esses experimentos recebem o nome de ensaio de Bernoulli e
originam uma v.a. com distribuio Bernoulli.

Varivel Aleatria de Bernoulli

uma v.a. X que assume apenas dois valores: 1 se ocorrer sucesso, e 0 se ocorrer fracasso,
sendo p a probabilidade de sucesso, 0 < p < 1.

Denotamos por X ~ Bernoulli (p) uma v.a. com distribuio de Bernoulli com parmetro p, se
1,
X=
0,

se ocorrer " sucesso"


se ocorrer " fracasso"

com funo de probabilidade,

P(X = x ) = p x (1 p )

1 x

, x = 0, 1

Da segue que
E(X) = p

Var(X) = 1-p

Repeties independentes de um ensaio de Bernoulli do origem ao modelo binomial.

1.3.2 Modelo Binomial


Um experimento dito ser um experimento Binomial se
a. consiste em n ensaios de Bernoulli;
b. seus ensaios so independentes; e
c. a probabilidade de sucesso em cada ensaio sempre igual a p, 0 < p < 1.

A v.a. X, correspondente ao nmero de sucessos num experimento binomial, tem distribuio


binomial com parmetros n e p, com funo de probabilidade dada por
n
P(X = x ) = p x (1 p) n x ,
x

x = 0,1,K, n ,

n
n!
, n!= n (n 1)(n 2) L (2)(1) e 0!= 1 .
onde =
x x!(n x )!

67

Usamos a seguinte notao: X ~ B(n; p). A mdia e a varincia so dadas, respectivamente,


por
E(X) = np

Var(X) = np(1-p)

Exemplo 35. Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10

pessoas dessa populao forem escolhidas ao acaso e com reposio, determine


a. O n esperado de inadimplentes;
b. A probabilidade de selecionar exatamente 3 pessoas inadimplentes;
c. A probabilidade de selecionar no mximo 3 inadimplentes.

Soluo:
a. X={nmero de pessoas inadimplentes}. Temos que E[X] = 10 x 0,2 = 2.

10
b. P(X = 3) = 0,2 3 (1 0,2)103 0,2
3
3
10
10
10
c. P(X 3) = P(X = i) = 0,810 + 0,210,8 9 + 0,2 2 0,88 + 0,2 3 0,8 7 0,88
i =0
1
2
3

1.3.3 Modelo Hipergeomtrico


A distribuio hipergeomtrica est restritamente relacionada com a distribuio binomial. A
diferena-chave entre as duas distribuies de probabilidade que, com a distribuio
hipergeomtrica, os ensaios no so independentes, e a probabilidade de sucesso muda de
ensaio para ensaio, pois as selees dos elementos so feitas sem reposio, enquanto que na
distribuio binomial as selees dos elementos so feitas com reposio.

Considere um conjunto de N objetos dos quais (r) so do tipo I e (N r) so do tipo II. Um


sorteio de n objetos (n < N) feito ao acaso e sem reposio. A varivel aleatria discreta X
que igual ao nmero de objetos do tipo I selecionados nesse sorteio tem distribuio
hipergeomtrica.

68

Os valores possveis de X vo de 0 a min(r, n), uma vez que no podemos ter mais do que o
nmero de objetos existentes do tipo I, nem mais que o total de sorteados.
Sua funo de probabilidade dada por
r N r

P(X = x ) =
x n x

N
, 0 x mnimo(r, n).
n

Usamos a seguinte notao: X ~ Hipergeomtrica (N; n; r). A esperana e varincia so dadas


por
E(X) = np

Var(X) = np(1-p)(N-n)/(N-1),

onde p = r/N.
Exemplo 36. Uma fbrica produz peas que so embaladas em caixas com 40 unidades. Para

aceitar o lote de caixas enviado por essa fbrica, o controle de qualidade de uma empresa
sorteia uma caixa do lote e sorteia 10 peas, sem reposio, dessa mesma caixa. Se houver
alguma pea defeituosa, o lote inteiro devolvido. Se a caixa sorteada tiver 4 peas
defeituosas, qual a probabilidade de o lote no ser devolvido?
Soluo:

N = 40, n = 10 e r = 4.

X: nmero de peas defeituosas.

4 40 4

P(X = 0) =
0 10 0

40
0,3
10

1.3.4 Modelo Poisson


A distribuio de Poisson empregada em experimentos nos quais no se est interessado no
nmero de sucessos obtido em n tentativas, como ocorre no caso da distribuio binomial, mas
sim no nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um
intervalo de tempo, espao etc. Alguns exemplos de variveis que podem ter a distribuio de
Poisson so

nmero de defeitos por centmetro quadrado;

n de acidentes por dia;

69

n de clientes por hora;

n de chamadas telefnicas recebidas por minuto.

Note-se que a unidade de medida (tempo, rea) contnua, mas a varivel aleatria de
interesse (nmero de ocorrncia) discreta. Alm disso, as falhas no so contveis. No
possvel contar os acidentes que no ocorreram, nem o nmero de defeitos por centmetros
quadrados que no ocorreram.
O limite inferior do nmero de ocorrncias, em todas as situaes dos exemplos, zero,
enquanto que o limite superior ao menos teoricamente infinito, muito embora, na maioria
dos exemplos acima, seja difcil imaginar um nmero infinito de ocorrncias.
As probabilidades, calculadas agora para todos os nmeros inteiros no negativos
x = 0, 1, 2, ... so dadas da seguinte forma:
P(X = x ) =

e x
, x = 0, 1, ...,
x!

onde X = nmeros de sucessos em um intervalo a varivel de interesse, > 0 o nmero


mdio de sucessos da varivel X e e a constante 2,7183 (base dos logaritmos naturais).
Usamos a seguinte notao: X ~ P(). A esperana e varincia so dadas por
E(X) = Var(X) =
Exemplo 37. Um departamento de conserto de mquinas recebe uma mdia de cinco

chamadas por hora. Supondo que a distribuio de Poisson seja adequada nessa situao, obter
a probabilidade de que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente
trs chamadas.
Soluo: Seja X: nmero de chamadas para conserto de mquinas em uma hora. O parmetro

= 5/hora. Aplicando na funo da Poisson, temos


P(X = 3) =

e 5 5 3
0,14
3!

70

1.4 Exerccios
1. A distribuio de X: n de crianas por domiclio numa determinada regio dada pela

tabela abaixo.

P(X = x)

0,10

0,15

0,25

0,30

0,15

0,05

Calcule:
a. O nmero mdio de crianas por domiclio, X.
b. O desvio padro de X, X.
c. A probabilidade P{X - X X X + X}.

2. Sabe-se que 7% dos ratos machos de uma certa linhagem so portadores de um defeito

gentico que no ocorre em fmeas. Responda:


a. Qual a probabilidade de encontrarmos pelo menos 1 animal com esse defeito gentico numa

ninhada com 5 machos?


b. Qual a probabilidade de encontrarmos no mximo 3 animais com esse defeito gentico

numa ninhada com 4 machos?

3. Numa central telefnica, o nmero de chamadas chega segundo uma distribuio Poisson,

com a mdia de oito chamadas por minuto. Determine qual a probabilidade de que num
minuto se tenha(m)
a. duas ou mais chamadas;
b. menos que duas chamadas;
c. entre sete (inclusive) e nove (exclusive) chamadas.

71

Aula 2 Variveis Aleatrias Contnuas


2.1 Introduo
At aqui estudamos variveis aleatrias discretas que so caracterizadas por ter uma
distribuio de probabilidade dada por uma tabela que associa a cada um de seus valores uma
probabilidade. Esta probabilidade um nmero entre 0 e 1 cuja soma igual a 1. Vamos agora
definir uma varivel aleatria contnua.

Seja X uma varivel aleatria. Suponha que os possveis valores de X sejam um intervalo que
possui infinitos valores; ento, dizemos que X uma varivel aleatria contnua.

Exemplo 38. Seguem alguns exemplos de variveis aleatrias contnuas.


a. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real.

Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar
qualquer nmero real positivo.
b. Em campanhas preventivas de hipertenso arterial comum, de tempos em tempos, medir-

se o nvel de colesterol. O valor de cada medida pode ser um nmero real no-negativo.
c. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete,

acendendo-a; observa-se a mesma at que se queime. O tempo de durao da lmpada um


nmero real no negativo.

No Exemplo 38 o nmero observado em cada um dos experimentos aleatrios um nmero


real e resulta em geral de uma medio: altura das mulheres; nvel de colesterol e tempo de
durao da lmpada.

Uma varivel aleatria contnua assume seus possveis valores em um determinado intervalo.
A pergunta que surge Como so atribudas probabilidades neste caso?.

72

Exemplo 39. Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas

aleatoriamente numa populao. O histograma por densidade desses valores apresentado na


Figura 9.
0,05

Densidade

0,04

0,03

0,02

0,01

0,00

30

40

50

60

70
Peso

80

90

100

110

Figura 9. Histograma da varivel peso.

A anlise do histograma indica que a distribuio dos valores da varivel peso


aproximadamente simtrica em torno de 70 kg; a maioria dos valores encontra-se no intervalo
(50; 90); existe uma pequena proporo de valores abaixo de 50 kg e acima de 90 kg.

Seja X = {peso em kg} de uma pessoa adulta escolhida ao acaso da populao. Como se
distribuem os valores da v.a. X, ou seja, qual a distribuio de probabilidades de X?
0,05

Densidade

0,04

0,03

0,02

0,01

0,00

30

40

50

60

70
Peso

80

90

100

110

Figura 10. Histograma da varivel peso com o ajuste da distribuio normal.

73

A Figura 10 ilustra o histograma da varivel peso apresentado na Figura 9 com o ajuste de


uma funo densidade, conhecida como distribuio normal.

Para as variveis contnuas, as probabilidades so atribudas por meio de uma funo cuja rea
entre a funo e o eixo das abscissas (X) igual a um.

Figura 11. Representao de uma funo densidade de probabilidade contnua.

A rea hachurada na Figura 11 ilustra a probabilidade de a v.a. contnua X estar no intervalo


[a, b], ou seja, P(a X b) = rea hachurada.

Esta funo f(x) denominada funo densidade de probabilidade (fdp) da varivel aleatria
contnua X. A rea sob uma curva delimitada por dois valores a e b, como mostra a Figura 11
determinada calculando-se a integral definida entre a e b da densidade de probabilidade
representada pela funo, isto ,
b

f (x )dx = P(a x b)
a

Exemplo 40. Um fabricante de televiso a cores oferece uma garantia de 1 ano para

substituio gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de
anos), x, como uma varivel aleatria contnua com a seguinte fdp
1 x 4
e , x>0
.
f (x ) = 4
0
x0

74

Qual a probabilidade de voc comprar a televiso e necessitar de uma substituio gratuita?


Soluo:
x

1
P( x 1) = e 4 dx 0,2
4
0
Funo Densidade de Probabilidade

Se X uma v.a. contnua, a funo densidade de probabilidade f(X), indicada


abreviadamente por fdp, uma funo que satisfaz s seguintes condies:
a. f(X) 0, X;
+

b. A rea sob a funo densidade de probabilidade 1, isto :

f (x)dx = 1 ;

c. P(a X b) = rea sob a funo densidade de probabilidade f(x) e acima do eixo x entre os
b

pontos a e b, isto , P(a x b) = f ( x )dx ;


a

x0

d. P(X = x0) = 0, porque, P(X = x 0 ) = f ( x )dx = 0 . Como conseqncia, temos


x0

P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b).

Funo de Distribuio Acumulada


Se X uma v.a. contnua, a funo de distribuio acumulada (fda) de X definida como
x

F(X) = P(X x ) =

f (s)ds .

Exemplo 41. Considere a seguinte densidade de probabilidade: f ( x ) = 2x , para 0 x 1 e

f ( x ) = 0 , fora desse intervalo. Obtenha a F(x) de X.


Soluo:
0,

x
F( x ) = 2sds = s 2
0
1

x<0
x
0

75

= x2, 0 x 1
x >1

2.2 Esperana Matemtica e Varincia


Se X uma v. a. contnua, o valor esperado de X (ou esperana matemtica de X) denotada
por E(X) definido como
+

xf (x )dx

E[X] =

Exemplo 42. Para uma varivel que tem densidade f(x) = 2x, 0 < x < 1, ento,
1

2
E[X] = x 2 x dx = 2 x dx = x 3
3
0
0

2
.
3

A varincia de uma varivel aleatria contnua definida por:


1

Var(X) = E(X ) [E(X)] , onde E[X ] = x 2 f ( x ) dx .


2

Exemplo 43. Para uma varivel que tem densidade f(x) = 2x, 0 < x < 1, calcule a varincia de

X, sabendo que E[X] =

2
do Exemplo 42.
3

2
Soluo: E[X ] = x 2x dx = 2x dx = x 4
4
0
0
2

2
. Logo, Var[X] = 2/4 (2/3)2 =1/18.
4

Conseqentemente, o desvio padro de X fica DP[X] =

Var[X ] = 1 / 18 0,236

2.3 Distribuies de Probabilidades para Variveis Aleatrias Contnuas


As distribuies discretas de probabilidades tratam de situaes em que o espao amostral
contm um nmero finito, ou infinito enumervel, de pontos. Se o espao amostral contm um
nmero infinito no-enumervel de pontos, temos que trabalhar com as distribuies contnuas

76

de probabilidades. Abordaremos aqui, em carter mais intuitivo, a distribuio uniforme e a


distribuio normal.

2.3.1 Modelo Uniforme


A distribuio de probabilidade mais simples de uma v.a. X contnua a distribuio uniforme.

Uma v.a. X tem distribuio uniforme U(a , b) se sua funo densidade de probabilidade da
forma
1

,
a<x<b
f (x ) = b a
.
0,
caso contrrio

A mdia e a varincia da distribuio U(a , b) so dadas respectivamente por

E[X] =

a+b
2

Var[X] =

(b a ) 2
12

Note que a mdia exatamente o ponto mdio do intervalo [a, b].

Exemplo 44. Devido presena de quantidades variveis de impureza, o ponto de fuso de

certa substncia pode ser considerado uma v.a. contnua distribuda uniformemente no
intervalo [100, 125]. Qual a probabilidade de a substncia fundir-se entre 110 e 115?
Soluo: Neste caso, a = 100, b = 125 e b a = 25. A funo densidade fica

1
, 100 x 125
f ( x ) = 25
0, caso contrrio
A probabilidade procurada
1
1
115 110 5
P(110 < X < 115) =
dx = x =
=
= 0,2
25
25 110
25
25
110
115

115

77

2.3.2 Modelo Normal


A distribuio Normal a mais importante das distribuies contnuas de probabilidade. Foi
introduzida em 1730 por DMoivre, sendo muito utilizada em Astronomia pelo alemo fsico e
matemtico Gauss, trazendo muita confuso para vrias pessoas que, por esse motivo, acham
que foi Gauss quem a descobriu. Muitos dos fenmenos aleatrios de interesse comportam-se
prximos a essa distribuio com valores muito freqentes em torno da mdia e diminuindo a
freqncia medida que nos afastamos da mdia.

A distribuio normal tem sua densidade dada por

f (x) =

1
2

1 x

, < x <

em que e so os parmetros da distribuio.

As principais caractersticas da distribuio normal so:


A mdia da distribuio ;
O desvio padro ;
A moda e a mediana so iguais a ;
A curva normal simtrica em torno da mdia ;
Os pontos de inflexo so - e + ;
A rea sob a curva e acima do eixo horizontal igual a 1.

A v.a. Normal com mdia e varincia 2 denotada por N(, 2).

78

A distribuio normal depende dos parmetros e 2

Curvas normais com


mesmo desvio padro,
mas com mdias
diferentes.

2
_ _ _ N ( , 1 2 )
_ _ _ N ( , 2 2 )
_ _ _ N ( , 3 2 )
1 2 < 2 2< 3 2

Curvas normais
com mesma
mdia, mas com
desvios padro
diferentes.

A varivel Normal Padronizada

O clculo direto de probabilidades envolvendo a distribuio normal exige recursos de clculo


infinitesimal e, mesmo assim, dada a forma da funo de densidade, no um processo
elementar. Por isso, elas foram tabeladas, permitindo-nos obter diretamente o valor da
probabilidade desejada.
Notemos, entretanto, que a funo de densidade normal depende de dois parmetros, e , de
modo que, se as probabilidades fossem tabeladas diretamente a partir dessa funo, seriam
necessrias tabelas de dupla entrada, complicando-se consideravelmente. Recorre-se, por isso,
a uma mudana de varivel, transformando a v.a. X na v.a. Z assim definida:
Z=

X
.

Essa nova varivel chama-se varivel normal padronizada. Recebe esse nome, porque sua
mdia 0 e seu desvio padro 1. Mediante tal transformao, basta construirmos uma nica

79

tabela, a da normal reduzida e, atravs dela, obteremos as probabilidades associadas a todas as


distribuies N(, 2).

Note que essa transformao no altera a forma da distribuio, apenas refere-se a uma nova
escala.

Assim, se quisermos calcular P(a < X < b) , sendo X ~ N(;2), podemos definir Z =

X
e

calcular a seguinte probabilidade:


b
a X b
a
P(a < X < b) = P(a < X < b ) = P
<
<
<Z<
= P

Uma representao do clculo dessa probabilidade apresentada na Figura 12.


f(x)

f(z)
a

z
a 0 b

Figura 12. Representao do clculo da P(a < X < b) via varivel normal padronizada Z.

De forma anloga, dada uma varivel padronizada Z ~ N (0;1), podemos obter a


v.a. X ~ N(, 2 ) atravs da transformao inversa X = + Z.

80

Tabela da Distribuio Normal Padro


Denotamos: A(z) = P(Z z), para z 0.

A(z) = P(Z z) , z 0.

Parte inteira e primeira decimal de z

Probabilidades Acumuladas da Distribuio Normal (0, 1)


Segunda decimal de z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9

0
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000

1
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000

2
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

3
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

4
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

81

5
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

6
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

7
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

8
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

9
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
0.9999
1.0000

Exemplo 45. Se Z ~ N (0,1), ento:


a. P(Z 1,71) = A(1,71) = 0,9564

b. P(0 < Z 1,71) = A(1,71) A(0)

= 0,9564 0,5000 = 0,4564

Exemplo 46. Seja X = {gasto com lanche semanal}. Aps estudar esta varivel, vimos que

X ~ N (20, 64), ento obtenha


a. P(16<X<22)

Soluo:

16 20 X 20 22 20
<
<
P(16 < X < 22) = P
= P(0,5 < Z < 0,25)
8
8
8
= (A(0,25) A(0)) + (A(0,5) A(0)) = (0,5987 0,5) + (0,6915 0,5) = 0,2902
b. P(X<18 ou X>24)

Soluo:

X 20 24 20
X 20 18 20
P(X < 18 ou X > 24) = P(X < 18 ) + P(X > 24) = P
>
<

+ P
8
8
8
8
= P( Z < 0,25) + P( Z > 0,5) = (1 A(0,25)) + (1 A(0,5))
= (1 0,5987) + (1 0,6915) = 0,7098

82

Como encontrar o valor z da distribuio N(0,1) tal que rea acumulada at ele seja A(z) =
0.975.

a. P(Z z) = 0,975. z tal que A(z) = 0,975. Pela tabela, z = 1,96.

Considere que X ~ N(, 2). Calcule k tal que P(X k) = 0,05. Neste caso temos que
k
X k

k
P ( X k ) = P

= P Z
= 0,05 A
= 0,95


= 1,64 k = + 1,64

Logo, o valor de k k = +1,64 .


Nota Importante: Para toda v.a. X ~ N( ; 2) temos
1. P( X + ) = P(1 Z 1) = 0,683 .
2. P( 2 X + 2) = P(2 Z 2) = 0,955
3. P( 3 X + 3) = P(3 Z 3) = 0,997

83

2.4 Exerccios
1. Se Z ~N(0,1), calcule:
a. P(1,32 < Z 1,79)

d. P(Z 1,5)

b. P(Z -1,3)

e. P(-1,5 Z 1,5)

c. P(-1,32 < Z < 0)

f. P( -2,3 < Z -1,49)

2. Encontre o valor z da distribuio N(0,1) tal que


a. P(0 < Z z) = 0,4975

d. P(Z z) = 0,3

b. P(Z z) = 0,975

e. P(Z z) = 0,10

c. P(-z Z z) = 0,80

3. O dimetro de um cabo eltrico uma varivel aleatria com fdp dada por

0 < x <1
6x (1 x ),
f (x) =
0,
caso contrrio

a. Verifique se f(x) uma fdp, atravs do item b. da definio 8.2.


b. Obtenha a F(x).
c. Qual a probabilidade de o dimetro ser:
c1. Igual a 0,5 cm?

c3. Entre 0,10 e 0,20?

c2. Maior que 0,5?

c4. Menor que 1?

4. A quantia gasta anualmente, em milhes de reais, na manuteno do asfalto de uma cidade

do interior representada pela varivel y, modelada pela funo


8y 4

,
0,5 y 2
f (x) = 9
.
0,
caso contrrio
Qual a probabilidade de a quantia gasta ser inferior a 0,8 milhes de reais?

84

5. O tempo de sobrevivncia de uma bateria (em anos) pode ser modelado pela funo

e x ,
x0
f (x) =
0, caso contrrio
a. Qual a probabilidade de a bateria sobreviver mais que 2 anos?
b. Qual o tempo mdio de sobrevivncia da bateria?

6. O tempo gasto no exame vestibular de uma universidade tem distribuio Normal, com

= 120 min, e = 15 min.


a. Sorteando-se um aluno ao acaso, qual a probabilidade de ele terminar o exame antes de

100 minutos?
b. Qual deve ser o tempo de prova, de modo a permitir que 95% dos vestibulandos a terminem

no prazo estipulado?
c. Qual o intervalo central de tempo tal que 80% dos estudantes gaste para completar o exame?

85

86

Probabilidade e Estatstica

REFERNCIAS

BUSSAB, W. O.; MORETTIN, P.A. Estatstica Bsica. 5. ed. So Paulo: Saraiva, 2006.
FARIAS, A. A.; SOARES, J. F.; CSAR, C. C. Introduo Estatstica. 2. ed. Rio de Janeiro:
LTC, 2003.
GNEDENKO, B. V. Ateoria da probabilidade. Rio de Janeiro: Cincia Moderna, 2008.
JAMES, B. R. Probabilidade: um curso em nvel intermedirio. 2. ed. Rio de Janeiro: SBM,
1996.
MAGALHES, M. N.; PEDROSO DE LIMA, A. C. Noes de Probabilidade e Estatstica.
6. ed. So Paulo: Edusp, 2007.
ROSS, Sheldon. Afirst course in probability. 8. ed. Londres: Prentice Hall, 2005.
TRIOLA, M. F. Introduo estatstica. 10. ed. Rio de Janeiro: LTC, 2008.

87

Você também pode gostar