Você está na página 1de 89

MATEMTICA

Curso de ps-graduao lato sensu

PROBABILIDADE E ESTATSTICA
Marcos Santos de Oliveira Daniela Carine Ramires de Oliveira

Universidade Aberta do Brasil Ncleo de Educao a Distncia Universidade Federal de So Joo del-Rei

Ps-graduao lato sensu Curso de Matemtica

Probabilidade e Estatstica
Marcos Santos de Oliveira Daniela Carine Ramires de Oliveira

UFSJ MEC / SEED / UAB 2009

O48p Oliveira, Marcos Santos de Probabilidade e estatstica / Marcos Santos de Oliveira ; Daniela Carine Ramires de Oliveira . So Joo del-Rei, MG : UFSJ, 2009. 87 p. Apostila do curso de Ps-graduao lato sensu em Matemtica. 1. Matemtica Estudo e ensino 2. Probabilidade 3. Estatstica I. Oliveira, Daniela Carine Ramires de I. Ttulo. CDU: 519.2

Reitor Helvcio Luiz Reis Coordenador UAB/NEAD/UFSJ Heitor Antnio Gonalves Coordenadora do curso Educao Empreendedora Rosngela Maria de Almeida Camarano Leal Coordenador do curso Matemtica Carlos Alberto Raposo da Cunha Coordenadores do curso Prticas de Letramento e Alfabetizao Gilberto Aparecido Damiano Maria Jos Netto Andrade Conselho Editorial Adlia Conceio Diniz Alessandro de Oliveira Bernadete Oliviera Sidney Viana Dias Betnia Maria Monteiro Guimares Frederico Ozanan Neves Geraldo Tibrcio de Almeida e Silva Gilberto Aparecido Damiano Guilherme Chaud Tizziotti Igncio Csar de Bulhes Luiz Fernando de Carvalho Maria do Carmo Santos Neta Maria do Socorro Alencar Nunes Macedo Maria Jos Netto Andrade Marise Santana da Rocha Rosngela Branca do Carmo Terezinha Lombello Ferreira
Edio Ncleo de Educao a Distncia - NEAD-UFSJ Conselho Editorial NEAD-UFSJ Capa / Diagramao Luciano Alexandre Pinto

Probabilidade e Estatstica

Sumrio Pra comeo de conversa... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 05 Unidade I - Introduo Estatstica e Amostragem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 07 Aula 1 Noes de Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 09 1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 09 1.2 Classificao de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Aula 2 Tcnicas de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.2 Amostragem Aleatria Simples (AAS) . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3 Amostragem Sistemtica (AS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.4 Amostragem Estratificada Proporcional (AEP) . . . . . . . . . . . . . . . . . . . 19 2.5 Amostragem por Conglomerado (AC) . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Unidade II - Explorao de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Aula 1 Tabelas e Grficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.1 Tabelas de Freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.2 Tabelas de Classes de Freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.3 Grficos para as Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.4 Grficos para as Variveis Quantitativas . . . . . . . . . . . . . . . . . . . . . . . . 29 1.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Aula 2 Medidas de Posio e Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.1 Mnimo, Mximo e Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.2 Mdia e Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.3 Medidas Separatrizes: Quartis, Decis e Percentis . . . . . . . . . . . . . . . . . . 38 2.4 Amplitude, Varincia e Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Probabilidade e Estatstica

Unidade III - Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Aula 1 Introduo Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 1.1 Processo ou Experimento Aleatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 1.2 Espao Amostral e Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 1.3 Definies de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Aula 2 Fundamentos de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.1 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.2 Independncia de Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 2.3 Regra da Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 2.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 2.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Unidade IV Distribuies de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Aula 1 Variveis Aleatrias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 1.2 Esperana Matemtica e Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 1.3 Distribuies de Probabilidades para Variveis Aleatrias Discretas . . . 66 1.3.1 Modelo Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 1.3.2 Modelo Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 1.3.3 Modelo Hipergeomtrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 1.3.4 Modelo Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Aula 2 Variveis Aleatrias Contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2.2 Esperana Matemtica e Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 2.3 Distribuies de Probabilidades para Variveis Aleatrias Contnuas . . 76 2.3.1 Modelo Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 2.3.2 Modelo Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 2.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

PARA COMEO DE CONVERSA...


A elaborao deste livro nasceu da vontade de produzir um material didtico adequado ao Ensino a Distncia (EAD) de Probabilidade e Estatstica para o curso de Ps-Graduao Lato Sensu de Matemtica da Universidade Federal de So Joo del-Rei (UFSJ). O livro foi escrito com o objetivo de apresentar, de forma resumida e didtica, os conceitos mnimos que so considerados essenciais no estudo do tema. Isso no significa que o estudante deva se limitar ao estudo deste volume. Ao contrrio, ele o ponto de partida para busca de um conhecimento mais amplo e aprofundado sobre o assunto. O livro est dividido em quatro unidades, contendo duas aulas cada uma. Ao final de cada aula inclumos exerccios que visam aplicao imediata dos conceitos discutidos. Esperamos que o(a) prezado(a) Estudante sinta o prazer de estudar este livro na mesma proporo que os autores sentiram ao elaborar cuidadosamente cada contedo apresentado. Ateno! Recomendamos insistentemente que voc estude uma aula por semana. Faa todos os exerccios propostos antes de iniciar o estudo da aula seguinte e tire suas dvidas com os tutores presenciais e a distncia. Lembre-se de que o ensino a distncia tem suas peculiaridades e que voc o principal responsvel pelo seu sucesso no curso. Por isso, necessrio que voc tenha disciplina, dedicao e empenho. No deixe acumular matria. Caso isso acontea, aproveite os fins de semana para colocar a matria em dia e finalizar cada unidade proposta. Ns, professores-autores, bem como os tutores presenciais e os tutores a distncia, estamos sua disposio para atend-lo(a) da melhor maneira possvel. Agradecemos equipe do NEAD/UFSJ pelo apoio na produo deste material. Pedimos desde j desculpas pelos erros que sero eventualmente identificados neste livro. As crticas e sugestes de colegas e estudantes sero muito bem-vindas e auxiliaro a melhoria da prxima verso. Os Autores

UNIDADE I

INTRODUO ESTATSTICA E AMOSTRAGEM

Objetivos
Ao final desta unidade, voc dever ser capaz de 1. Identificar populao e amostra. 2. Conceituar e classificar variveis. 3. Aplicar diferentes tcnicas de amostragem. 4. Diferenciar as tcnicas de amostragem a partir de suas caractersticas.

Aula 1 Noes de Estatstica


1.1 Introduo
A palavra estatstica derivada da palavra latina status (que significa estado). Os primeiros usos da estatstica envolviam compilao de dados e grficos que descreviam vrios aspectos de um estado ou pas. Em 1662, John Graunt publicou informao estatstica acerca de nascimentos e mortes. O trabalho de Graunt foi seguido por estudos sobre taxas de mortalidade e de doenas, tamanhos de populao, renda e taxas de desemprego. As famlias, os governos e as empresas se apiam fortemente nos dados estatsticos para orientao. Por exemplo, taxas de desemprego, taxas de inflao, ndices do consumidor e taxas de nascimento e morte so cuidadosamente compiladas de modo regular, e os dados resultantes so usados para tomar decises que afetam futuras contrataes, nveis de produo e expanso para novos mercados. Assim, necessitamos entender os conceitos bsicos da Estatstica, bem como as suposies necessrias para o seu emprego de forma criteriosa, em cada tipo de problema a ser analisado.

O que Estatstica? Podemos considerar que a Estatstica uma cincia que fornece um conjunto de tcnicas que nos permitem, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos realizados em qualquer rea do conhecimento. Estamos denominando por dados a um (ou mais) conjunto de valores, numricos ou no. A aplicabilidade das tcnicas a serem discutidas se d nas mais variadas reas das atividades humanas. Nesse sentido, o principal objetivo da Estatstica nos auxiliar a tomar decises ou tirar concluses em situaes de incerteza, a partir de informaes numricas.

A Estatstica pode ser dividida em trs reas, a saber: Estatstica Descritiva: conjunto de tcnicas destinadas a descrever e resumir os dados, a fim de tirarmos concluses a respeito de caractersticas de interesse.

Probabilidade: teoria matemtica utilizada para se estudar a incerteza associada a fenmenos aleatrios. Inferncia Estatstica: denominao usualmente empregada ao estudo de tcnicas que possibilitam a extrapolao, a um grande conjunto de dados (populao), das informaes e concluses obtidas a partir de um subconjunto de valores (amostra).

Estudos complexos envolvendo o tratamento estatstico dos dados usualmente envolvem as trs reas mencionadas anteriormente. Para exemplificar tal procedimento, considere o esquema apresentado na Figura 1, a seguir:

Figura 1. Estatstica na prtica.

A Figura 1 ilustra como a Estatstica funciona na prtica. Suponha, inicialmente, que estamos interessados em estudar algumas caractersticas em um grande conjunto de dados que denominaremos de populao. Deve-se considerar que, na terminologia estatstica, populao refere-se no somente a uma coleo de indivduos, mas ao alvo no qual reside nosso interesse. Assim, todos os clientes de um banco, todos os alunos de uma faculdade, todos os automveis de uma determinada marca, ou mesmo todo o sangue no corpo de uma pessoa so

10

exemplos de possveis populaes. Algumas vezes podemos acessar todos os dados da populao (nesse caso dizemos que o censo foi realizado), mas em muitas situaes tal procedimento no pode ser realizado. Em geral, razes econmicas e ticas so as mais determinantes dessas situaes. Para contornar esse fato, tomamos alguns elementos da populao para formar um grupo a ser estudado. Esse subconjunto da populao, em geral com dimenso sensivelmente menor, denominado amostra.

A seleo de uma amostra pode ser feita de vrias maneiras, dependendo, entre outros fatores, do grau de conhecimento que temos da populao, da quantidade de recursos disponveis, e assim por diante. Existem tcnicas adequadas de amostragem que nos auxiliam na obteno de um subconjunto de valores o mais parecido possvel com a populao que lhe d origem. Algumas dessas tcnicas sero vistas posteriormente.

Obtida uma amostra, o prximo passo utilizar as tcnicas de Estatstica Descritiva para organizar e descrever os resultados contidos na amostra. A partir da, podemos usar tcnicas de Inferncia Estatstica para estimar quantidades desconhecidas, realizar extrapolao dos resultados e testar algumas hipteses de interesse sobre a populao. As tcnicas de Inferncia Estatstica no fazem parte da ementa desta disciplina; entretanto, as mesmas sero vistas de forma detalhada na disciplina Estatstica Aplicada.

Um Pouco da Histria da Cincia Estatstica A ttulo de curiosidade, apresentamos um pouco da histria da Cincia Estatstica.

5000 a.C. Surgiram os primeiros registros egpcios de presos de guerra. 2000 a.C. Houve o primeiro censo Chins. 695 1303 1654 Primeira utilizao da mdia ponderada pelos rabes na contagem de moedas. Origem dos nmeros combinatrios (Shihcieh Chu). Pierre de Fermat e Blaise Pascal, dois famosos matemticos, estabelecem os Princpios do Clculo das Probabilidades. 1763 Primeiras idias das tcnicas de Inferncia Estatstica (Thomas Bayes).

11

1930 1940

Incio das tcnicas de Controle Estatstico de Qualidade nas indstrias. Inveno do Computador Eletrnico.

Maiores detalhes sobre a histria da Estatstica podem ser encontrados no site da Associao Brasileira de Estatstica ABE, no link http://www.redeabe.org.br/historia.htm

1.2 Classificao de Variveis


Qualquer caracterstica associada a uma populao chamada de varivel. Ela recebe esse nome porque ela varia de alguma forma. A idade de um indivduo, o sexo ou o estado civil so possveis exemplos de variveis. Alguns conjuntos de dados consistem de nmeros (tais como altura de 1,50 m a 2,15 m), enquanto outros so no-numricos (tais como cor dos olhos: verde e castanho). Os termos dados quantitativos e dados qualitativos so em geral usados para distinguir entre esses dois tipos. Dessa forma, as variveis podem ser classificadas como Qualitativas ou Quantitativas. Vejamos um exemplo.

Exemplo 1. A MD Indstria e Comrcio, desejando melhorar o nvel de seus funcionrios, montou um curso experimental e indicou 25 funcionrios para a primeira turma. Os dados esto dispostos na Tabela 1. Como havia dvidas quanto adoo de um nico critrio de avaliao, cada instrutor adotou seu prprio sistema de aferio.

De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais de um) resultado correspondendo realizao de uma caracterstica (ou caractersticas). Por exemplo, considerando a varivel conceito em ingls, para cada funcionrio pode-se associar um dos resultados, A, B, C ou D.

12

Tabela 1. Informaes sobre seo, grau de instruo, nmeros de filhos, notas e conceitos nas disciplinas redao, ingls, metodologia e poltica de 25 empregados da MD Indstria e Comrcio. Grau de N de instruo filhos 1 Pessoal Ensino Mdio 0 2 Pessoal Fundamental 2 3 Pessoal Ensino Mdio 3 4 Pessoal Ensino Mdio 1 5 Pessoal Superior 2 6 Pessoal Superior 1 7 Pessoal Fundamental 1 8 Tcnica Fundamental 2 9 Tcnica Superior 3 10 Tcnica Ensino Mdio 4 11 Tcnica Fundamental 2 12 Tcnica Ensino Mdio 3 13 Tcnica Superior 1 14 Tcnica Superior 1 15 Venda Ensino Mdio 0 16 Venda Fundamental 1 17 Venda Superior 0 18 Venda Fundamental 0 19 Venda Superior 3 20 Venda Superior 2 21 Venda Fundamental 1 22 Venda Ensino Mdio 2 23 Venda Fundamental 1 24 Venda Superior 0 25 Venda Superior 1 Fonte: Adaptado de Bussab e Morettin (2006). Func. Seo Redao 8,6 7,0 8,0 8,6 8,0 8,5 8,2 7,5 9,4 7,9 8,6 8,3 7,0 8,6 8,6 9,5 6,3 7,6 6,8 7,5 7,7 8,7 7,3 8,5 7,0 Ingls Metodologia Poltica B B D D A B D B B B C D B A C A D C D C D C C A B A C B C A A C C B C B B C B B A C C C B B A C A A 9,0 6,5 9,0 6,0 6,5 6,5 9,0 6,0 10,0 9,0 10,0 6,5 6,0 10,0 10,0 9,0 10,0 6,0 6,0 6,0 6,5 6,0 9,0 6,5 9,0

Algumas variveis como seo, grau de instruo, conceito em ingls e conceito em metodologia apresentam como possveis resultados uma qualidade (ou atributo) do indivduo pesquisado. Logo, essas variveis so chamadas de variveis qualitativas. Dentre as variveis qualitativas, ainda podemos fazer uma distino entre dois tipos, a saber: varivel qualitativa nominal ou varivel qualitativa ordinal.

13

Uma varivel qualitativa nominal se no existe nenhuma ordenao nos possveis resultados. Possveis exemplos so seo a que o funcionrio pertence, sexo, raa etc.

Uma varivel qualitativa ordinal se existe uma ordem natural nos seus resultados. Alguns exemplos so grau de instruo, conceito em ingls, classe social etc. As variveis nota em redao, nota em poltica e nmero de filhos apresentam como possveis resultados nmeros resultantes de uma contagem ou mensurao. Essas variveis so chamadas de variveis quantitativas. As variveis quantitativas tambm podem sofrer uma classificao dicotmica: discreta ou contnua. Uma varivel quantitativa discreta se os seus possveis valores formam um conjunto finito ou infinito enumervel de nmeros, e que resultam, freqentemente, de uma contagem. Alguns exemplos so nmeros de filhos, nmeros de carros na famlia etc. Uma varivel quantitativa contnua se os seus possveis valores pertencem a um intervalo de nmeros reais e que resultam de uma mensurao. Possveis exemplos so nota em redao e poltica, peso, altura etc. Para cada tipo de varivel existem tcnicas apropriadas para resumir as informaes dos dados obtidos da amostra. Por exemplo, a utilizao de uma tabela um meio de descrever os dados de uma forma resumida. Veremos mais detalhes sobre tabelas e grficos nas prximas sees. Em algumas situaes podemos atribuir valores numricos s vrias qualidades ou atributos de uma varivel qualitativa e depois se proceder anlise como se esta fosse quantitativa, desde que o procedimento seja passvel de interpretao. Existe um tipo de varivel qualitativa para a qual essa quantificao muito til: a chamada varivel dicotmica. Para essa varivel podem ocorrer somente duas realizaes, usualmente chamadas de sucesso e fracasso. Exemplos de variveis dicotmicas so sexo, hbito de fumar (sim ou no) etc.

14

1.3 EXERCCIOS
1. Para as situaes descritas a seguir, identifique a populao e a amostra correspondente e discuta a validade do processo de inferncia estatstica para cada um dos casos. a. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. b. Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por telefone com relao ao canal em que estavam sintonizados. c. A fim de avaliar a inteno de voto para presidente dos brasileiros, 122 pessoas foram entrevistadas em Braslia.

2. Classifique cada uma das variveis abaixo em qualitativa (nominal ou ordinal) ou quantitativa (discreta ou contnua). a. Inteno de voto para presidente (possveis respostas so os nomes dos candidatos, alm de no sei). b. Perda de peso de maratonistas na Corrida de So Silvestre, em quilos. c. Intensidade da perda de peso de maratonistas na Corrida de So Silvestre (leve, moderada, forte). d. Grau de satisfao da populao brasileira com relao ao trabalho de seu presidente (valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito). e. Nmero de peas produzidas por uma mquina num dia de trabalho (500, 1000 etc).

15

Aula 2 Tcnicas de Amostragem


2.1 Introduo
A amostragem naturalmente usada em nossa vida diria. Por exemplo, para verificar o tempero de um alimento em preparao, podemos provar (observar) uma pequena poro deste alimento. Nesse caso, estamos fazendo uma amostragem, ou seja, extraindo do todo (populao) uma parte (amostra) com propsito de avaliarmos sobre a qualidade do tempero de todo o alimento.

Por que realizar amostragem? Existem vrias razes para o uso de amostragem em levantamento de grandes populaes. Algumas delas, entre outras, so as seguintes: Economia: em geral, torna-se bem mais econmico o levantamento de somente uma parte da populao. Tempo: numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria tempo suficiente para pesquisar toda a populao de eleitores do pas. Operacionalidade: mais fcil realizar operaes de pequena escala. Um dos problemas tpicos nos grandes censos o controle dos entrevistadores.

Quando o uso de amostragem no interessante? Populao pequena: no h necessidade de utilizar tcnicas estatsticas, pois neste caso aconselhvel realizar o censo (anlise de toda a populao). Caracterstica de fcil mensurao: talvez a populao no seja to pequena, mas a varivel que se quer observar de to fcil mensurao que no compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionrios favorveis mudana no horrio de um turno de trabalho, podemos entrevistar toda a populao no prprio local de trabalho. Esta atitude pode ser politicamente mais recomendvel.

16

Necessidade de alta preciso: a cada dez anos o IBGE1 realiza um censo demogrfico para estudar diversas caractersticas da populao brasileira. Dentre estas caractersticas tem-se o nmero total de habitantes, uma informao fundamental para o planejamento do pas. Dessa forma, o nmero de habitantes precisa ser avaliado com grande preciso e, por isso, se pesquisa toda a populao.

2.2 Amostragem Aleatria Simples (AAS)


A tcnica de amostragem aleatria o mtodo mais simples e um dos mais utilizados para a seleo de uma amostra. Para a seleo de uma AAS precisamos ter uma lista completa dos elementos da populao. Este tipo de amostragem consiste em selecionar a amostra atravs de um sorteio. Sua principal caracterstica est no fato de todos os elementos da populao ter igual probabilidade de serem escolhidos.

Procedimento para o uso deste mtodo 1. Numerar todos os elementos da populao (de 1 a N) e 2. Efetuar sucessivos sorteios at completar o tamanho da amostra (n).

Para realizar este sorteio, podemos utilizar urnas, tabelas de nmeros aleatrios ou algum software que gere nmeros aleatrios. A Tabela 2 foi construda usando-se o software Excel (comando aleatorio()).

Exemplo 2. Estamos interessados em estudar a qualidade da gasolina nos postos de uma determinada cidade. Essa cidade possui N = 40 postos. A empresa que estudar a qualidade pode investigar apenas uma amostra de n = 4 postos. Para selecionar uma amostra aleatria simples basta escolhermos uma posio de qualquer linha da tabela de nmeros aleatrios e extrairmos conjuntos de dois algarismos (pois N, que o tamanho da populao, possui 2 casas decimais), at completarmos os 4 elementos da amostra. Se o nmero sorteado no

IBGE - Instituto Brasileiro de Geografia e Estatstica

17

existir, simplesmente no consideramos e prosseguimos o processo. Escolhendo a primeira linha da tabela de nmeros aleatrios, temos a seguinte amostra de 4 elementos: AAS = {16, 24, 18, 27, 25}.

Tabela 2. Tabela de nmeros aleatrios. 1 3 8 3 6 2 0 9 2 7 5 9 7 3 4 6 9 5 9 2 4 8 3 2 6 8 4 8 0 1 8 6 2 2 9 4 8 1 9 3 5 1 4 4 1 1 5 0 0 0 8 3 2 4 6 5 4 7 8 8 5 3 4 9 4 7 2 6 1 6 9 8 4 6 2 2 8 7 0 5 1 2 2 5 4 4 6 8 6 4 9 3 5 3 1 7 2 9 1 9 3 8 2 3 3 6 3 3 5 4 3 7 3 3 1 6 4 6 4 9 4 3 9 6 3 1 7 4 4 2 6 5 1 1 3 5 0 2 2 1 3 8 1 7 1 9 2 8 2 4 7 3 0 2 6 7 9 1 6 8 8 9 5 7 1 0 2 1 3 9 7 3 3 1 6 1 3 6 3 2 2 0 4 5 2 0 5 8 1 7 2 2 0 8 3 4 0 1 7 8 5 9 1 5 3 0 1 5 7 4 8 6 6 2 8 6 1 0 8 8 3 5 7 4 5 5 4 0 5 2 3 8 7 4 3 3 1 9 4 5 8 2 5 5 5 1 9 1 4 8 7 8 3 8 2 3 1 6 8 1 4 8 1 4 1 4 5 9 2 4 6 7 3 2 4 3 2 3 0 8 5 3 0 9 4 6 3 8 2 0 9 4 7 3 8 6 3 0 8 4 8 1 1 3 9 5 2 3 2 8 6 6 4 9 8 4 3 5 6 5 4 2 9 9 9 0 6 3 0 4 4 3 6 8 7 1 2 2 3 8 1 1 2 8 6 6 6 3 5 3 0 1 9 8 8 6 3 4 2 2 6 5 2 3 2 5 7 5 5 7 8 6 3 0 4 7 9 5 4 6 9 1 7 4 8 5 3 4 1 4 1 6 2 7 3 5 8 2 7 6 8 5 3 5 5 8 7 2 3 9 6 3 8 8 3 5 3 9 5 1 7 6 1 5 9 9 1 2 6 1 7 6 6 3 1 2 8 3 2 3 8 1 5 8 6 6 7 7 3 3 2 6 2 6 8 9 6 6 0 8 4 2 2 5 2 7 8 5 6 2 8 4 7 7 6 6 1 7 8 5 5 9 8 4 1 7 8 4 4 7 0 7 5 1 1 1 3 2 1 4 6 4 4 5 5 5 2 5 7 4 2 5 3 3 5 7 8 7 5 5 6 8 6 4 0 5 7 5 7 4 5 1 2 3 2 4 9 4 6 3 1 2 1 2 0 2 9 7 8 6 3 5 6 2 4 6 6 8 7 9 6 5 1 9 8 1 7 6 2 1 7 4 4 3 6 4 8 7 8 5 1 4 7 4 2 5 5 3 5 2 8 7 8 5 7 2 6 6 2 7

2.3 Amostragem Sistemtica (AS)


utilizada quando a populao est naturalmente ordenada, como listas telefnicas, fichas de cadastramento e em sistemas de produes contnuos como produes de garrafas de cervejas etc. Procedimento para o uso deste mtodo 1. Seja N o tamanho da populao e n o tamanho amostral. Calcula-se o intervalo de amostragem i = N/n (considera-se apenas a parte inteira do nmero i). 2. Sorteia-se, utilizando-se a tabela de nmeros aleatrios, um nmero x entre 1 e i formando a amostra: {x, (x + i), (x + 2*i), ... , (x + (n-1)*i)}.

18

Exemplo 3. Considerando uma turma com 49 alunos, retire uma amostra de tamanho 5 utilizando a tcnica de amostragem sistemtica. Soluo: Temos que N = 49 e n = 5 . Logo, 1) i = N/n = 49/5 = 9,8. Considerando a parte inteira do nmero, temos que i = 9; 2) Sortear um nmero x entre 1 e i = 9 da tabela de nmeros aleatrios que contenha um

algarismo, pois i possui 1 casa decimal. Escolhendo a ltima linha, temos que o primeiro nmero que est entre 1 e 9 4. Logo, a amostra ser composta dos seguintes elementos:
AS = {4, 13, 22, 31, 40}.

2.4 Amostragem Estratificada Proporcional (AEP)


A populao dividida em subgrupos, denominados estratos (por exemplo, por sexo, classe de renda, bairro etc.) e a AAS ou AS utilizada na seleo de uma amostra de cada estrato. Esses estratos devem ser internamente mais homogneos do que a populao toda, com respeito s variveis em estudo. Aqui, um conhecimento prvio sobre a populao em estudo fundamental.

A AEP tem as seguintes caractersticas: dentro de cada estrato h uma grande homogeneidade (pequena variabilidade); entre os estratos h uma grande heterogeneidade (grande variabilidade). comum os estratos terem tamanhos diferentes. Nesses casos, a proporcionalidade do tamanho da amostra de cada estrato da populao deve ser mantida na amostra. Por exemplo, se um estrato corresponde a 20% do tamanho da populao, ele tambm deve corresponder a 20% da amostra.

Exemplo 4. Com o objetivo de realizar uma pesquisa de opinio sobre a gesto atual da

reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A populao composta por 70 professores, 80 servidores tcnicos administrativos e 800 alunos,

19

que identificaremos da forma apresentada na Tabela 3.

Tabela 3. Listagem da populao. Professores Servidores Alunos

P01 P02 ... P70 S01 S02 ... S80 A001 A002 ... A800

Supondo que a opinio sobre a gesto atual da reitoria possa ser relativamente homognea dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para obter uma amostra global de tamanho n = 15. A Tabela 4 mostra as relaes de proporcionalidade.

Tabela 4. Relaes de proporcionalidade. Estrato Professores Servidores Alunos Proporo na populao Tamanho do subgrupo na amostra

70/950 = 0,074 (7,4 %) 80/950 = 0,084 (8,4%) 800/950 = 0,842 (84,2%)

np = 15 x 0,074 1 ns = 15 x 0,084 1 na = 15 x 0,842 13

Para selecionar aleatoriamente um professor, podemos usar a tabela de nmeros aleatrios, tomando valores com dois algarismos. Usando a primeira linha, encontramos o seguinte professor selecionado: {P16}. Para o servidor, usando a segunda linha da tabela, temos: {S39}. Para os alunos, precisamos extrair nmeros de trs algarismos. Usando a terceira linha da tabela, temos: {A047, A539, A201, A416, A056, A381, A563, A252, A213, A258, A235, A184, A339}. A amostra {P16, S39, A047, A539, A201, A416, A056, A381, A563, A252, A213, A258, A235, A184, A339} uma amostra estratificada proporcional da comunidade da universidade. Cada indivduo desta amostra dever ser pesquisado para se obter a opinio em relao gesto atual da reitoria.

2.5 Amostragem por Conglomerado (AC)


A populao dividida em subpopulaes (conglomerados) distintas (quarteires, residncias,

20

famlias, bairros etc.). Alguns dos conglomerados so selecionados segundo a AAS, e todos os indivduos nos conglomerados selecionados so observados. Em geral, menos eficiente que a AAS ou AE, mas, por outro lado, bem mais econmica. Tal procedimento amostral adequado quando possvel dividir a populao em um grande nmero de pequenas subpopulaes.

A AC tem as seguintes caractersticas: dentro de cada conglomerado h uma grande heterogeneidade (grande variabilidade); entre os conglomerados h uma pequena variabilidade (grande homogeneidade).

Exemplo 5. Realizao de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais.

Usando a tcnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas:

5 3 Zona 1 6 7 4 8 10 9 11

12

Entrevistar todos os eleitores dessas zonas

fcil confundir amostragem estratificada com amostragem por conglomerado porque ambas envolvem a formao de subgrupos. A diferena que a amostragem por conglomerado usa todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa uma amostra de membros de todos os estratos.

21

2.6 Exerccios
1. Refaa o Exemplo 4, considerando agora n = 50 indivduos. Encontre todos os professores,

funcionrios e alunos que constituem a amostra estratificada proporcional.


2. Um administrador especialista em avaliar atravs de sistemas informatizados as aes da

BOVESPA est interessado em fazer uma pesquisa nos preos das aes, para indicar aos seus clientes se hoje um dia favorvel a fazer investimentos. Ele sabe que existe N = 500 aes em venda. Como o tempo de estudo de cada ao de aproximadamente 10 minutos, decidiuse verificar apenas n = 25 aes. Utilizando-se as tcnicas de amostragem aleatria simples e sistemtica, quais aes sero selecionadas?
3. Um depsito em uma determinada empresa produtora de materiais eletrnicos possui N =

100 computadores que esto separados em duas qualidades: N1 = 40 computadores Pentium 3 e N2 = 60 computadores Pentium 4. O custo para verificar se cada computador est sob controle muito alto. O administrador responsvel disse que a empresa tem condies de verificar apenas n = 12 computadores. Utilizando-se a tcnica de amostragem estratificada proporcional no primeiro estgio e a AAS no segundo estgio, quais computadores devem ser selecionados?
4. Uma cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa

eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que esto dentro dessas zonas eleitorais, isto , foi utilizada amostragem por conglomerado. Apresente quais sero as 15 zonas eleitorais amostradas.

22

UNIDADE II

EXPLORAO DE DADOS

Objetivos
Ao final desta unidade, voc dever ser capaz de 1. Organizar dados em tabelas de freqncias e tabelas de classes de freqncias. 2. Construir grficos para variveis qualitativas e quantitativas. 3. Calcular e interpretar medidas de posio. 4. Calcular e interpretar medidas de disperso.

23

24

Aula 1 Tabelas e Grficos


1.1 Tabelas de Freqncias
Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o comportamento dessa varivel, analisando a ocorrncia de seus possveis resultados. Nesta seo veremos uma maneira de se dispor um conjunto de realizaes, a fim de se ter uma idia global sobre elas, ou seja, de sua distribuio.

Observando novamente a Tabela 1, especificamente a coluna que contm a varivel grau de


instruo, no conseguimos dizer rapidamente quantos funcionrios possuem ensino

fundamental, mdio e superior. A Tabela 5 mostra uma maneira de representarmos mais resumidamente os dados da Tabela 1.

Exemplo 6. A Tabela 5 apresenta a distribuio de freqncias da varivel grau de instruo

dos dados da Tabela 1.

Tabela 5. Freqncias e porcentagens da varivel grau de instruo para os 25 funcionrios. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)

Fundamental Ensino Mdio Superior


Total

8 7 10 25

0,32 0,28 0,40 1,00

33,00 28,00 40,00 100,00

Interpretao da Tabela 5. Nota-se que, dos 25 empregados, 33% tem nvel fundamental,

28% nvel mdio e 40% nvel superior.

Notao: Usaremos a notao ni para indicar a freqncia (absoluta) de cada classificao ou

categoria da varivel. A notao fi = ni/n para indicar a proporo (ou freqncia relativa) de

25

cada categoria, sendo o n o nmero total de observaes.

As propores (ou porcentagens) so muito teis quando necessitamos comparar resultados de duas pesquisas distintas. O prximo exemplo ilustra este fato.

Exemplo 7. Suponha que se queira comparar a varivel grau de instruo dos empregados

que fizeram o curso com a mesma varivel para todos os empregados da Companhia MD. Digamos que a empresa tenha 2000 empregados e que a distribuio de freqncias seja a da Tabela 6.

Tabela 6. Distribuio de freqncias dos 2000 empregados segundo o grau de instruo. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)

Fundamental Ensino Mdio Superior


Total

650 500 850 2000

0,325 0,250 0,425 1,000

32,50 25,00 42,50 100,00

Comparao entre a Tabela 5 e a Tabela 6. No podemos comparar diretamente as colunas

das freqncias (ni) das duas tabelas, pois os totais de empregados so diferentes nos dois casos (n = 25 e n = 2000). Mas as colunas da proporo e da porcentagem so comparveis, pois reduzimos a um mesmo total. Nesse caso, podemos dizer que a distribuio da varivel
grau de instruo dos funcionrios que fizeram o curso no se diferencia da distribuio dessa

mesma varivel para todos os funcionrios da Empresa MD.

1.2 Tabelas de Classes de Freqncias


A construo de tabelas de freqncias para variveis quantitativas necessita de certo cuidado. Por exemplo, a construo da tabela de freqncias para a varivel nota em redao da Tabela 1, usando o mesmo procedimento de tabelas de freqncias, no resumir as 25 observaes num grupo menor.

26

Soluo: Agrupar os dados por faixas de notas. Assim, construmos a chamada tabela de

classes de freqncias.

Exemplo 8. A Tabela 7 fornece a distribuio de freqncias das notas em redao dos 25

funcionrios da Companhia MD por faixas de notas.

Tabela 7. Freqncias e porcentagens das notas em redao. Classe de notas Freqncia Porcentagem

6 |- 7 7 |- 8 8 |- 9 9 |- 10
Total

2 9 12 2 25

8 36 48 8 100

Procedendo-se desse modo, ao resumir os dados referentes a uma varivel quantitativa, perdese alguma informao. Por exemplo, no sabemos quais so as doze notas da classe de 8 a 9, a no ser que investiguemos a tabela original. Sem perda de muita preciso, poderamos supor que todas as doze notas daquela classe fossem iguais ao ponto mdio da referida classe, isto , 8,5.

A escolha dos intervalos arbitrria. A familiaridade do pesquisador com os dados que lhe indicar quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um nmero pequeno de classes, perde-se informao, e com um nmero grande de classes, o objetivo de resumir os dados fica prejudicado. Normalmente, sugere-se o uso de 4 a 8 classes com a mesma amplitude.

1.3 Grficos para Variveis Qualitativas


A representao grfica da distribuio de uma varivel tem a vantagem de, rpida e concisamente, informar sobre sua variabilidade. Existem vrios tipos de grficos para as

27

variveis qualitativas. Aqui sero ilustrados os dois mais simples e freqentemente utilizados: grficos de barras e de composio em setores (pizza).

Grfico de barras

O grfico de barras consiste em construir retngulos ou barras, em que uma das dimenses proporcional magnitude a ser representada (ni), sendo a outra arbitrria, porm igual para todas as barras. Essas barras so dispostas paralelamente uma s outras, horizontalmente ou verticalmente. No exemplo a seguir temos o grfico de barras (verticais) para a varivel grau
de instruo da Tabela 6.

45

40

42,5
35

30

32,5

Porcentagem

25

25
20

15

10

Fundamental

Mdio Grau de Instruo

Superior

Figura 2. Grfico de barras para a varivel grau de instruo.

Grfico de composio em setores (pizza)

O grfico de composio em setores (pizza) destina-se a representar a composio, usualmente em porcentagem, de partes de um todo. Consiste num crculo de raio arbitrrio, representando o todo, dividido em setores, que correspondem s partes de maneira proporcional. A Figura 3 ilustra esse grfico para a varivel grau de instruo.

28

Superior 42%

Fundamental 33%

Mdio 25%

Figura 3. Grfico em setores para a varivel grau de instruo.

1.4 Grficos para Variveis Quantitativas


Para variveis quantitativas podemos considerar uma variedade maior de representaes grficas.

Grfico de barras

O grfico de barras para as variveis quantitativas construdo da mesma forma que o das variveis qualitativas. Como ilustrao, considere a varivel nmero de filhos dos 25 empregados da Companhia MD. A Tabela 8 apresenta esses dados.
Tabela 8. Freqncias e porcentagens da varivel nmero de filhos. N de Filhos Freqncia (ni) Porcentagem (100 x fi)

0 1 2 3 4 Total A Figura 4 ilustra o grfico de barras.

5 9 6 4 1 25

20 36 24 16 4 100

29

40

35

36

30

Porcentagem

25

24
20

20 16

15

10

4
0

3 Nmeros de Filhos

Figura 4. Grfico de barra para a varivel nmero de filhos.

Grfico de pontos (Dot-Plot)

Quando os dados consistem em um pequeno conjunto de nmeros, estes podem ser representados traando-se uma reta com uma escala que abranja todas as mensuraes observadas e grafando-se as respectivas freqncias como pontos acima da reta. Por esse motivo, tambm conhecido como grfico de pontos.

Exemplo 9. Considere a varivel tempo, em segundos, entre carros que passam por um

cruzamento, viajando na mesma direo. As 14 medies realizadas foram


6,0 3,0 5,0 6,0 4,0 3,0 5,0 4,0 6,0 3,0 4,0 5,0 2,0 11

7 Tempo

10

11

Figura 5. Grfico de pontos para a varivel tempo.

30

Histograma

O histograma consiste em retngulos contguos com base nas faixas de valores da varivel e com rea igual freqncia relativa (fi) da respectiva faixa. Desta forma, a altura de cada retngulo denominada densidade de freqncia definida pelo quociente da rea pela amplitude da faixa, ou seja, fi/ai, com ai indicando a amplitude da i-sima classe. Com essa conveno, a rea total do histograma ser 1 (um).

Exemplo 10. Considerando a varivel nota em redao dos 25 funcionrios da Companhia

MD, dispostos na Tabela 7. O histograma correspondente apresentado na Figura 6.


0,5
48 %

0,4 Densidade

36 %

0,3

0,2

0,1

8%

8%

0,0

8 Notas em Redao

10

Figura 6. Histograma das notas em redao.

Grfico de linhas

um grfico muito importante utilizado para representar observaes feitas ao longo do tempo, em intervalos iguais ou no. Tais conjuntos de dados constituem as chamadas sries histricas ou sries temporais. Traduzem o comportamento de um fenmeno em certo intervalo de tempo.

Exemplo 11. Considere a dvida externa do Brasil (em milhes de dlares) no perodo de 1956

a 2006, apresentados na Tabela 9.

31

Tabela 9. Dvida externa do Brasil de 1956 a 2006, em milhes de dlares.


Ano 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 Dvida 2736 2491 2870 3160 3738 3291 3533 3612 3294 3823 3771 3440 4092 Ano 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 Dvida 4635 6240 8284 11464 14857 20032 25115 32145 37951 52187 55803 64259 73963 Ano 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 Dvida 85487 93745 102127 105171 111203 121188 113511 115506 123439 123910 135949 145726 148295 Ano 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 Dvida 159256 179935 199998 241644 241468 236156 226067 227689 235414 220182 187987 191999

Fonte: IPEADATA

250000

200000

150000

100000

50000

0 1956 1960 1964 1968 1972 1976 1980 Ano 1984 1988 1992 1996 2000 2004

Figura 7. Grfico de linhas da dvida externa do Brasil.

32

1.5 Exerccios
1. Os dados a seguir referem-se aos conceitos obtidos de 60 alunos, na disciplina de

Estatstica, de uma turma da UFSJ.


Tabela 10. Dados Brutos da disciplina de Estatstica de uma turma da UFSJ.

R: Ruim M B B R M B M M M R B M B B O R M

M: Mdio B R B M M M R M R B B

B: Bom B M B M M M M R B M B R B M B

O: timo R B B B M O B B B R M O

M M M M M

a. Organize os dados da Tabela 10 em uma tabela de freqncias contendo ttulo, freqncia

absoluta, freqncia relativa, porcentagens e uma interpretao.


b. Represente os dados da tabela obtido em a. atravs do grfico de composio de setores.

2. A partir da Tabela 1, construa a. a distribuio de freqncias da varivel conceito em metodologia, com as freqncias

absoluta e relativa, as porcentagens, d um ttulo e interprete;


b. uma tabela de classes de freqncias para a varivel nota em poltica, com as freqncias

absoluta e relativa, as porcentagens, d um ttulo e interprete;


c. Construa o grfico de barras para a tabela montada no item a; d. Faa o histograma utilizando a tabela de classes obtida do item b.

3. Faa o grfico de linhas para os dados fornecidos na sua conta de luz durante o ltimo ano,

isto , no eixo x coloque os meses e no eixo y coloque o consumo em kwh.

33

Aula 2 Medidas de Posio e Disperso


2.1 Mnimo, Mximo e Moda
O mnimo a menor observao do conjunto de dados, enquanto que o mximo a maior observao.
Exemplo 12. Considere o seguinte conjunto de dados: 4, 5, 4, 6, 5, 8, 4. Nesse caso, o mnimo

4 e o mximo 8. A moda o valor ou atributo que ocorre com maior freqncia.


Exemplo 13. Considere os seguintes bancos de dados:

a) 2, 5, 2, 7, 8 b) 3, 4, 2, 2, 4, 5 c) 1, 2, 3, 4, 5

Neste caso a moda = 2. As modas so 2 e 4. Dizemos que o conjunto bimodal. O conjunto no apresenta moda, sendo chamado de conjunto amodal.

Podemos calcular o mnimo, mximo e moda se os dados esto agrupados em tabelas de freqncias. Considere o prximo exemplo.
Exemplo 14. Uma empresa de segurana deseja estudar qual o nmero de ligaes a cobrar

mais freqentes que so recebidas em um determinado bairro de classe alta da cidade de So Paulo no ms de maro. Foram selecionadas 30 residncias e observado o nmero de ligaes
a cobrar em cada residncia. O resultado se encontra na Tabela 11.

34

Tabela 11. Distribuio de freqncia do nmero de ligaes a cobrar. Nmero de ligaes a cobrar Nmero de residncias (ni)

0 1 2 3
Total

2 5 15 8 30

A moda 2 ligaes a cobrar, pois foi o nmero que ocorreu com maior freqncia. O valor mnimo foi zero e o valor mximo da varivel foi 3.

2.2 Mdia e Mediana


A mais importante medida de posio a mdia aritmtica. Esse conceito j , sem dvida, familiar ao Leitor, quando fala, por exemplo, da altura mdia de um grupo de alunos ou da nota mdia da sala em determinada prova.

A mdia aritmtica a soma das observaes divididas pelo nmero delas. De forma mais formal, considere n observaes de um conjunto de dados representados por x1, x2,..., xn. A mdia deste conjunto obtida pela soma das n observaes divididas por n, ou seja, x + x2 + x3 +L + xn = x= 1 n
n

x
i =1

(4.1)

Exemplo 15. Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A mdia das notas


x= 2 + 5 + 3 + 7 + 8 25 = =5 5 5

Podemos adaptar a frmula (4.1) para o caso de dados agrupados em tabelas de freqncia. Neste caso, a mdia calculada levando-se em conta as freqncias de cada valor da varivel, da seguinte forma:

35

x=

x n
i =1 i

(4.2)

onde v a quantidade de resultados que a varivel contm e ni a respectiva freqncia da isima classe. Assim, para o Exemplo 14, temos
n

x=

x n
i =1 i

0x 2 + 1x 5 + 2x15 + 3x8 = 1,9 6 2 . 30

Portanto, o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe alta da cidade de So Paulo no ms de maro 2.

A mediana o valor que ocupa a posio central da srie de observaes, quando esto ordenadas em ordem crescente.

Assim, se as cinco observaes de uma varivel forem 3, 4, 7, 8 e 8, a mediana o valor 7, correspondente terceira observao. Quando o nmero de observaes for par, usa-se como mediana a mdia aritmtica das duas observaes centrais. Acrescendo-se o valor 9 srie acima, a mediana ser (7 + 8)/2 = 7,5.

Vamos formalizar o conceito da mediana. Considere que x1, x2, ..., xn so os n valores (distintos ou no) da varivel X. Considerando as observaes ordenadas em ordem crescente, podemos denotar a menor observao por x(1), a segunda por x(2), e assim por diante, obtendose x(1) x(2) ... x(n-1) x(n) x(1) = -2, x(2) = 1, x(3) = 3, x(4) = 3 e x(5) = 6. As observaes ordenadas como em (4.3) so chamadas estatsticas de ordem. (4.3) Por exemplo, se x1 = 3, x2 = -2, x3 = 6, x4 = 1 e x5 = 3, ento -2 1 3 3 6, de modo que

Com essa notao, a mediana da varivel X pode ser definida como

36

x n +1 2 med(x) = x n + x n +1 2 2 2

se n impar se n par

Nota: A mediana depende da posio e no dos valores dos elementos na srie ordenada. Essa
uma diferena marcante entre mediana e mdia, pois a mdia se deixa influenciar, e muito, pelos valores extremos. Vejamos: Na srie: 5, 7, 10, 13, 15 Na srie: 5, 7, 10, 13, 65 Mdia = 10 e Mediana = 10; Mdia = 20 e Mediana = 10,

isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma.

Quando os dados esto agrupados em tabelas de freqncias, o mtodo mais prtico para calcular a mediana adicionar uma coluna tabela contendo a freqncia acumulada. Vejamos um exemplo.

Exemplo 16. Considere novamente o Exemplo 14 da empresa de segurana que desejava


estudar qual o nmero de ligaes a cobrar mais freqentes recebidas em um determinado bairro de classe alta da cidade de So Paulo no ms de maro. Vamos introduzir uma nova coluna na tabela dos dados referente freqncia acumulada, que obtida acumulando-se as freqncias absolutas (ni). No caso em particular teremos
F1 = n 1 , F2 = n 1 + n 2 ,

F3 = n 1 + n 2 + n 3 e finalmente, F4 = n 1 + n 2 + n 3 + n 4 = n .

Como o rol par, pois n = 30, a mediana ser a mdia dos valores que esto nas posies 15 e 16. Ambos os valores que esto nestas posies so 2 ligaes a cobrar recebida por residncia, pois F3 a primeira freqncia acumulada que contm os elementos da 15 e 16 posies.

37

Tabela 12. Freqncia absoluta e acumulada do nmero de ligaes a cobrar. Nmero de ligaes a cobrar Nmero de Residncias (ni) Freq. Acumulada (Fi)

0 1 2 3
Total

2 5 15 8 30

2 7 22 30

2.3 Medidas Separatrizes: Quartis, Decis e Percentis


Alm das medidas de posio que estudamos, h outras que, consideradas isoladamente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores. Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo nome de separatrizes.

Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Portanto, precisamos de 3 quartis (Q1, Q2 e Q3) para dividir a srie em quatro partes iguais. Note que o quartil 2 (Q2) por definio a prpria mediana da srie. O mtodo mais prtico para calcular os quartis utilizar o princpio do clculo da mediana para os 3 quartis. Na realidade sero calculadas 3 medianas em uma mesma srie.

Exemplo 17. Cosidere a seguinte srie de dados: 5, 2, 6, 9, 10, 13, 15. Ordenando a srie,

temos: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie acima em duas partes iguais 9. Logo a mediana 9 = Q2. Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais proporcionados pela mediana. Para o clculo do quartil 1 (Q1) e quartil 3 (Q3) basta calcular as medianas de cada um desses grupos. Assim, em {2, 5, 6}, a mediana 5 = Q1. Em {10, 13, 15} a mediana 13 = Q3.

38

Seguindo o mesmo principio dos quartis (que divide em quatro partes a srie de dados) e levando em conta o aumento do nmero de informaes disponveis, podemos dividir a srie de dados em 10 partes ou 100 partes. Quando dividimos em 10 partes, obtemos os decis (D1, D2,..., D9) e em 100 partes obtemos os percentis (P1, P2,..., P99). Como ilustrao, o decil D6 representa o valor que deixa 60% das informaes a sua esquerda e, conseqentemente, 40% a sua direita. De forma anloga, o percentil P74 representa o valor que deixa 74% das observaes a sua esquerda e 26% a sua direita.

2.4 Amplitude, Varincia e Desvio Padro


O resumo de um conjunto de dados por uma nica medida representativa de posio central esconde toda a informao sobre a variabilidade do conjunto de observaes. Comecemos com um exemplo de motivao para ilustrar a importncia da utilidade das medidas de disperso, tambm conhecidas como medidas de variabilidade.

Exemplo 18. Para preencher uma nica vaga existente em uma empresa, 50 candidatos foram

submetidos a 6 provas de mesma importncia sobre conhecimentos especficos de interesse da empresa. Trs destes candidatos destacaram-se com as notas descritas na Tabela 13.

Tabela 13. Distribuio das notas. Candidatos Provas

1 7,0 6,0 7,5

2 7,5 7,0 8,0

3 8,0 8,0 8,0

4 8,0 8,0 8,0

5 8,5 9,0 8,0

6 9,0 10,0 8,5

A B C

Fonte: Dados hipotticos

Que candidato escolher? Por um critrio inicial poderia ser escolhido aquele com a maior mdia, mas todos tm mesma mdia, ou seja, 8. De modo anlogo, nem adianta pensar em

39

moda ou mediana, pois tambm essas medidas so iguais a 8, para todos os candidatos.

Uma possvel soluo seria adotar um segundo critrio: escolher o candidato que apresentou notas mais homogneas, isto , aquele que apresentou menor disperso das notas. Poderamos inicialmente calcular a amplitude, que definida pelo intervalo entre o valor mximo e o valor mnimo da srie de dados, ou seja, A = mx min. Assim, teramos as seguintes amplitudes: 2, 4 e 1, respectivamente para os candidatos A, B e C. Apesar de fcil de calcular, a amplitude tem a desvantagem de levar em conta apenas dois valores, desprezando todos os outros.

Uma medida de disperso mais rica obtida quando consideramos a soma dos quadrados dos desvios em relao mdia. Essa medida chamada de varincia, sendo denotada por s2 e definida por (x x) 2 + (x 2 x) 2 + (x 3 x) 2 + L + (x n x) 2 = s2 = 1 n 1 A varincia mede a disperso dos dados em torno de sua mdia.

(x
i =1

x) 2 (4.4)

n 1

A raiz quadrada positiva da varincia chamada de desvio padro (representado por s):

s=

(x
i =1

x) 2
(4.5)

n 1

Note que a unidade de medida do desvio padro a mesma dos dados originais, sendo assim interpretvel, enquanto que a varincia fornece uma unidade de medida elevada ao quadrado. O clculo do desvio padro exige o clculo da varincia.
Exemplo 19. A varincia e o desvio padro para o candidato A do Exemplo 18 fica
s2 = A (7 8) 2 + (7,5 8) 2 + (8 8) 2 + (8 8) 2 + (8,5 8) 2 + (9 8) 2 2,5 = = 0,5 6 1 5 s A = 0,5 0,7

De forma anloga podemos encontrar a varincia e o desvio padro para os candidatos B e C,

40

2 dados respectivamente por s 2 = 2 (s B 1,4) e s C = 0,1 (s C 0,3) . B

Podemos calcular a varincia atravs da seguinte frmula alternativa:

s2 =

1 n 2 2 x i n ( x ) n 1 i =1

(4.6)

A frmula (4.6) obtida atravs de algumas manipulaes algbricas na frmula (4.4). Esta tem a facilidade de apenas necessitar da informao da mdia ( x ) e da soma dos valores ao quadrado da varivel

n i =1

xi .

Karl Pearson

Um pouco de histria

A primeira utilizao do termo desvio padro ocorreu em 1894, sendo devido Karl Pearson.

2.5 Exerccios
1. Os tempos de sobrevivncia (em meses) de um tipo de bateria esto listados a seguir.

5, 21, 21, 23, 23, 25, 27, 29, 30, 31, 32, 32, 32, 34, 35, 36, 38, 38, 38, 42, 43, 44, 60.

a. Calcule a mdia e mediana. Comente os resultados. b. Calcule o valor mnimo, Q1, Q2, Q3 e mximo. Interprete estas 5 estatsticas. c. Calcule a varincia e desvio padro. Comente.

2. Considere o seguinte conjunto de dados: 2, 3, 5, 7, 10. Utilize a formula alternativa para

calcular a varincia, sabendo que a mdia 5,4.

41

3. Um rgo do governo do estado est interessado em determinar padres sobre o

investimento em educao, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram obtidos os valores (codificados) da tabela abaixo:

Cidade Investimento

20

16

14

19

15

14

16

19

18

a. Calcule a mdia das observaes. b. Recebero um programa especial as cidades com valores de investimento inferiores mdia

menos duas vezes o desvio padro. Alguma cidade receber o programa?


c. Ser considerada como investimento bsico a mdia das observaes compreendidas entre a

mdia original menos dois desvios padro e a mdia original mais dois desvios padro. Calcule o investimento bsico e compare com a mdia obtida no item a. Justifique a diferena encontrada.

42

UNIDADE III

PROBABILIDADE

Objetivos
Ao final desta unidade, voc dever ser capaz de 1. Relacionar experimentos aleatrios com espaos amostrais. 2. Construir novos eventos a partir das operaes elementares de eventos. 3. Calcular probabilidade a partir de eventos condicionais. 4. Calcular probabilidade a partir de eventos independentes.

43

44

Aula 1 Introduo Probabilidade


1.1 Processo ou Experimento Aleatrio
Qualquer fenmeno que gere resultado incerto ou casual chamado de processo ou
experimento aleatrio.

Exemplo 20. Os quatro itens a seguir ilustram experimentos aleatrios, pois no sabemos,

com certeza, o possvel resultado que ocorrer em cada um.

a. Jogar uma moeda duas vezes e observar a seqncia obtida de caras e coroas.

b. Jogar um dado e observar o nmero mostrado na face superior.

c. Observar o peso de animais.

d. Observar o nmero de filhos de um casal.

1.2 Espao Amostral e Evento


Espao amostral () o conjunto de todos os resultados possveis de um experimento

aleatrio.

Todo experimento aleatrio tem associado um espao amostral. O Exemplo 21 ilustra esse fato.

45

Exemplo 21. Experimentos aleatrios e seus respectivos espaos amostrais.

Experimento aleatrio
a. Jogar um dado e observar o resultado

Espao amostral
= {1, 2, 3, 4, 5, 6}

b. Lanar uma moeda duas vezes e observar as faces = {CC,CK,KC,KK}, com C = Cara obtidas e K = Coroa c. Dois dados so lanados simultaneamente e = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} estamos interessados na soma das faces observadas

Evento qualquer subconjunto do espao amostral. Usualmente denotamos os eventos com as


letras iniciais do alfabeto na forma maiscula.

Exemplo 22. Considere o experimento de jogar um dado e observar o resultado. Alguns


possveis eventos desse experimento so: A = {ocorrer a face 5} = {5} ou B = {ocorrer face par} = {2, 4, 6} etc. Existem dois eventos especiais: espao todo () e o conjunto vazio (). Esses eventos no tm aplicaes prticas, mas sero teis para provarmos propriedades das probabilidades.

Operaes com eventos


Utilizando o diagrama de Venn, que foi introduzido em 1881 pelo filsofo e matemtico britnico John Venn, podemos ilustrar as trs operaes bsicas com eventos, a saber, interseo, unio e complementar. Assim, sejam A e B dois eventos de um mesmo espao amostral .

46

O evento interseo de A e B, denotado por AB, o evento em que A e B ocorrem simultaneamente. O evento unio de A e B, denotado por AB, o evento em que A ocorre ou B ocorre (ou ambos).
c

A B

A B

O evento complementar de A, denotado por A , o evento em que A no ocorre.

Exemplo 23. Operaes com eventos. Seja = {1, 2, 3, 4, 5, 6}. Considere os seguintes
eventos: A = {2, 4, 6}, B = {4, 5, 6} e C = {1, 3, 5}. Os eventos a seguir ficam assim: A B = {4, 6} A B = {2, 4, 5, 6} AC= A Bc = {1, 2, 3, 4, 6}

Eventos disjuntos
Dois eventos A e B so mutuamente exclusivos ou disjuntos se eles no podem ocorrer simultaneamente (A B = ).

Exemplo 24. Considere os seguintes eventos: A = {o resultado do dado foi 4} e B = {o


resultado do dado foi 5}. O evento A B = , pois impossvel existir o evento A B = {ocorrer 4 e 5, simultaneamente, em um nico lanamento do dado}.

Aps essas quatro definies, acreditamos que o leitor esteja preparado para aprender a calcular probabilidades. Sugerimos assim, que faa os dois primeiros exerccios da seo 1.4 antes de prosseguir.

47

1.3 Definies de Probabilidade


A rea de probabilidade comeou a ser desenvolvida no sculo XVII antes ainda da formalizao da rea da Estatstica, em questes propostas em jogos de azar. Em 1654, Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662), na Frana, estabelecem os Princpios do

Clculo das Probabilidades. Em 1656, Huygens (1629-1695) publica o primeiro Tratado de Probabilidade.

Fermat

Pascal

Huygens

No entanto, fcil perceber que o termo probabilidade j est enraizado no senso comum, pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais como situaes de sua vida pessoal; organizando-se em relao a horrios a cumprir, levando em conta as circunstncias do trfego; agasalhando-se ao sair de casa se a previso do tempo indicar uma frente fria. Em resumo, prevenindo-se em situaes de risco.

A pergunta que surge ento Como podemos definir Probabilidade?.

Probabilidade uma medida que quantifica a sua incerteza frente a um possvel


acontecimento futuro.

H vrias maneiras de se medir a incerteza e costume se pensar na seguinte diviso:

1) Mtodo Clssico 2) Mtodo Freqentista

3) Mtodo Subjetivo 4) Mtodo Moderno ou Axiomtico

48

O primeiro devido a Laplace e o mais conhecido, pois relaciona eventos favorveis com eventos possveis. O segundo consiste em repetir um experimento vrias vezes. O terceiro baseado na opinio pessoal, e o ltimo devido a Kolmogorov e baseia-se no princpio de que qualquer experimento pode ser modelado.

Mtodo Clssico
Consideremos o caso em que se joga um dado repetidas vezes. O dado tem seis faces: 1, 2, 3, 4, 5, 6. Se o dado homogneo, equilibrado, jogando-o uma vez no h razo para dizermos que determinada face tenha preferncia sobre as outras. Todos os seis resultados so igualmente possveis. Ento a probabilidade de aparecer a face 3, por exemplo, de 1/6. O evento que nos interessa consiste em um elemento, e o espao amostral tem seis elementos.

Definio 5.1. Se A o evento de interesse, a probabilidade de A, representada por P(A),


dada por

P(A) =

Nmero de casos favorveis ao evento A Nmero de casos possveis

(5.1)

Essa definio se aplica quando os pontos do espao amostral so equiprovveis.

Exemplo 25. No lanamento de uma moeda equilibrada, qual a probabilidade de aparecer uma
Cara? O espao amostral associado = {Cara, Coroa}. Pela definio clssica, a probabilidade de ocorrncia do evento A = {Cara} P(A) = 1/2. Note que o nmero de elementos em 2 e o nmero de elementos em A 1.

Mtodo Freqentista
A definio clssica de probabilidade s se aplica a espaos amostrais em que os eventos simples so igualmente possveis. Esse o caso da maioria das aplicaes de probabilidades aos jogos de azar, rea que, precisamente, suscitou os primeiros problemas prticos resolvidos pela teoria das probabilidades. Esses mesmos jogos, entretanto, repetidos inmeras vezes, levaram a considerar a probabilidade de um evento como a freqncia relativa, ou seja, como a proporo de vezes que um evento ocorre em uma srie suficientemente grande de realizaes

49

de um experimento, em condies idnticas. Surgiu ento uma nova definio de probabilidade, a definio freqentista.

Definio 5.2. Se A o evento de interesse, a probabilidade de A dada por

P( A ) =

Nmero de vezes que A ocorreu Nmero total de repeties do exp erimento

(5.2)

em que o nmero de repeties deve ser grande.

Mtodo Subjetivo Definio 5.3. Cada indivduo, baseado em informaes anteriores e em sua opinio a respeito
de um evento em questo, pode ter uma resposta para a probabilidade deste evento.

Exemplo 26. Um mdico experiente consegue calcular uma probabilidade de o indivduo ter
uma determinada doena a partir dos sintomas que o indivduo apresenta. Note que outro mdico pode calcular uma probabilidade diferente para o mesmo indivduo. Da o carter subjetivo.

Mtodo Moderno
A definio clssica, freqentista e subjetiva de probabilidade, embora sejam bastante intuitivas e devendo, por isso, ser sempre lembradas, no so definies matematicamente aceitveis de probabilidade. Por exemplo, no caso da definio freqentista, como saber se, medida que o nmero de repeties de um experimento cresce, a freqncia relativa converge para um nmero. Alm das dificuldades com o limite, existem muitas situaes em que necessrio o uso de probabilidades, e, no entanto, no nem possvel nem intuitivo pensar em repeties.

A soluo moderna consiste em axiomatizar algumas relaes intuitivas e construir, a partir delas, toda a teoria de probabilidades, a exemplo do que se faz no estudo da geometria euclidiana.

50

Definio 5.4. Probabilidade uma funo P() , que associa a cada evento do espao amostral
, um nmero real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:

Axioma 1. 0 P(A) 1. Axioma 2. P() = 1. Axioma 3. Se A e B so eventos mutuamente exclusivos: P(AB) = P(A) + P(B).
A partir desses axiomas, podemos demonstrar as seguintes propriedades:

P1: P() = 0, onde o conjunto vazio. P2: Seja Ac o evento complementar de A, ento P(Ac) = 1 P(A). P3: Se A e B forem dois eventos quaisquer, ento P(A B) = P(A) + P(B) P(A B). P4: Se A B, ento P(A) P(B).

Exemplo 27. Seguem alguns exemplos de funes j descobertas na literatura para calcular
probabilidades, que sero discutidas em detalhes nas prximas sees.

Distribuio
Bernoulli

Funo de probabilidades

P(X = x ) = p x (1 p )

1 x

, x = 0, 1

Binomial

n nx P(X = x ) = p x (1 p ) , x = 0, 1, ..., n x r N r P(X = x ) = x n x N , 0 x mnimo(r, n). n

Hipergeomtrica

Poisson

P(X = x ) = f (x) =

e x , x = 0, 1, ... x!

Uniforme

1 ,<x<
1 22

Normal

f (x) =

1 2

( x )2

, - < x< +

51

1.4 Exerccios
1. Determine o espao amostral dos seguintes experimentos: a. Lanar 2 dados e observar as faces superiores; b. Lanar 2 dados e observar a soma das faces superiores; c. Uma urna contm 10 bolas azuis e 10 brancas. 3 bolas so retiradas ao acaso e as cores so

anotadas;
d. Uma moeda lanada consecutivamente at o aparecimento da 1 cara; e. Uma mquina produz 20 peas por hora. Ao final da primeira hora de produo, observa-se

o n de defeituosas;
f. Medio do tempo de vida de uma lmpada antes de se queimar: 2. Considere o seguinte espao amostral: = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. Defina os eventos:

A = nmero par: C = mltiplo de 3: E = maior que 8: G = menor ou igual a 3:

B = nmero mpar: D = maior ou igual a 6: F = menor que 5:

Obtenha os seguintes eventos:


a. A B = b. A B = c. (A B)c = d. (A B)c = e. C D = f. E F = g. (A G)c = h. (Ec B)c =

3. Atividade Prtica do lanamento da moeda. Passo 1 Arrume um parceiro e tomem uma moeda chamem o valor numrico da moeda de

COROA (K ) e a outra face de CARA (C). Suponham que haja interesse em saber se a sua moeda honesta (isto significa saber se a probabilidade de CARA de sua moeda 1/2 ou, em termos percentuais, se a chance de sair Cara 50%).

52

Passo 2 Um membro do grupo vai lanar a moeda e o outro vai marcar os resultados na

planilha anexa, seguindo as seguintes instrues: a) Jogar a moeda uma vez e anotar C ou K no espao adequado (linha 2) da planilha. b) Repetir este procedimento 30 vezes, preenchendo um a um todos os espaos da linha 2.

Passo 3 Continuando com a planilha, trocar de lugar com o parceiro, voltar para os itens a) e

b) das instrues e continuar mais 30 jogadas at perfazer 60.

Passo 4 Voltar ao primeiro da dupla e, ainda com a planilha, seguir as instrues:

c) Depois do registro na linha 2 de todos os resultados como C ou K, passar para a linha 3: chamar CARA de 1 e COROA de 0 e colocar estes valores na planilha, abaixo de cada resultado j obtido na linha 2. Cada membro do grupo deve fazer metade um faz a linha de cima e o outro a linha de baixo.

d) Agora a linha 4 da planilha deve ser preenchida em cada posio deve ser colocado o nmero acumulado de CARAS, at aquela jogada (verifique que a jogada est explicitada na linha 1- que a linha n). Discutir com outro membro do grupo para ver se est claro se no, pergunte! A linha de baixo continuao do acumulado da linha de cima.

e) Finalmente chegamos ltima linha linha 5: colocar a freqncia relativa (m/n) de CARAS em cada momento o que isso? Discuta com o outro membro do grupo (desprezar
as entradas assinaladas com X).
1) 2) 3) 4) 5) Jogada(n) C ou K 1 ou 0 Caras Acumuladas (m) Frequncia Relativa (m/n) 1 2 3 4 5 6 7 8 9 10 12 14 17 20 25 30

1) 2) 3) 4) 5)

Jogada(n) C ou K 1 ou 0 Caras Acumuladas (m) Frequncia Relativa (m/n)

31 32 33

40

47

50

55

60

53

Passo 5 Depois de completar a 1a parte da planilha, construir a seguinte tabela, usando as

linhas 4 e 5 da planilha:
n m/n Passo 6 Completar o grfico, usando os valores da tabela recm-construda, do seguinte

10

20

30

40

50

60

modo: Eixo Y valores m/n Eixo X valores da linha 1: (n)


Passo 7 Comparar os resultados com os colegas e interpretar o resultado comentando sobre a

honestidade da sua moeda.


Grfico da Atividade Prtica
m/n 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 1 2 3 4 5 6 7 8 9 10 20 n 30 40 50 60

Concluso: com isso chegamos a uma possvel definio freqentista de probabilidade, ou

seja, probabilidade o valor em que a freqncia relativa se estabiliza aps um nmero muito grande de ensaios.

54

Aula 2 Fundamentos de Probabilidades


2.1 Probabilidade Condicional
A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade de um evento A ocorrer sabendo que um evento B j ocorreu. Sejam A e B dois eventos associados a um mesmo espao amostral . Denota-se por P(A|B) a probabilidade condicionada do evento A, quando o evento B tiver ocorrido. Sempre que calculamos P(A|B), estamos essencialmente calculando P(A) em relao ao espao amostral reduzido devido a B ter ocorrido, em lugar de faz-lo em relao ao espao amostral original . Assim, uma definio mais formal de probabilidade condicional dada pela definio 6.1.
Definio 6.1. Dados dois eventos A e B, a probabilidade condicional de A dado que ocorreu

B representada por P(A | B) e definida por P(A | B) = P(A B) , P(B) P(B) > 0 (6.1)

Da expresso (6.1), obtemos a regra do produto de probabilidades dada por

P(A B) = P(B)P(A | B)

(6.2)

Exemplo 28. Um grupo de pessoas foi classificado quanto a peso e presso arterial, de acordo

com as propores do quadro a seguir:


Peso Presso Alta Normal Total Excesso Normal Deficiente Total

0,10 0,15 0,25

0,08 0,45 0,53

0,02 0,20 0,22

0,20 0,80 1,00

55

a. Qual a probabilidade de uma pessoa escolhida ao acaso nesse grupo ter presso alta? b. Se se verifica que a pessoa escolhida tem excesso de peso, qual a probabilidade de ela ter

tambm presso alta?

Soluo: a. Como a pessoa escolhida ao acaso em um grupo em que 20% tem presso alta, chamando

A o evento ter presso alta, P(A) = 0,20 a probabilidade pedida.

b. Chamemos B o evento ter excesso de peso. Nosso interesse passa a ser

P(A | B) =

P(A B) 0,10 = = 0,40 P(B) 0,25

O que fizemos foi precisamente estabelecer a probabilidade condicional de A dado B, P(A|B), a partir de P(A B) = 0,10 e P(B) = 0,25.

2.2 Independncia de Eventos


Dois eventos A e B so independentes se a ocorrncia de um no altera a probabilidade de ocorrncia do outro, isto , P(A|B) = P(A) ou P(B|A) = P(B), ou ainda, a seguinte forma equivalente: P(AB) = P(A) P(B) (6.3)

Exemplo 29. Joaninha tem probabilidade de 0,8 de passar no vestibular, enquanto que

Joozinho tem probabilidade 0,6. Qual a probabilidade de ambos passarem no vestibular? Qual a suposio a ser feita nesse caso para calcular a probabilidade?

Soluo: Sejam os eventos A: Joaninha passa no vestibular e B: Joozinho passa no

vestibular. Supondo independncia entre os eventos A e B, temos que a probabilidade de ambos passarem no vestibular P(AB) = 0,8 x 0,6 = 0,48.

56

2.3 Regra da Probabilidade Total


Considere a seqncia {B1, B2, ..., Bn} como sendo uma partio do espao amostral , isto , Bi Bj = sempre que i j e B1 B2 ... Bn = . O diagrama da Figura 8 exibe uma partio de .

B2 B1 B3

B5

B4

Figura 8. Partio do e um evento qualquer A.

Vamos supor que o evento A possa ocorrer juntamente com um e s um dos n eventos mutuamente exclusivos B1, B2,..., Bn. Em outras palavras vamos assumir que A = (A B1) (A B2) ... (A Bn), (6.4) onde os eventos A Bi e A Bj (com subscritos distintos i e j) so mutuamente exclusivos.

Aplicando a funo probabilidade em ambos os lados de (6.4) temos que P(A) = P[(A B1) (A B2) ... (A Bn)]. (6.5)

Utilizando a regra de adio em (6.5) obtemos que P(A) = P(A B1) + P(A B2) + ... + P(A Bn) (6.6)

Atravs de (6.2), a expresso (6.6) fica


P(A) = P(A | B1 ) P(B1 ) + P(A | B 2 ) P(B 2 ) + ... + P(A | B n ) P(B n ) = P(A | B i ) P(B i )
i =1 n

(6.7)

57

A expresso (6.7) denominada Regra da Probabilidade Total.

Exemplo 30. Uma mineradora explora trs minas denominadas B1, B2 e B3. A partir de

pesquisas anteriores, sabe-se que a probabilidade de encontrar ouro na mina B1 0,1, na mina B2 0,05 e na mina B3 0,2. Alm disso, essa mineradora tem explorado as minas B1, B2 e B3 nas propores 0,3, 0,2 e 0,5, respectivamente. Qual a probabilidade de a mineradora encontrar ouro?

Soluo: Seja A = {encontrar ouro} e Bj = {explorando a j-sima mina j}. Pela regra da

probabilidade total temos P(A) = P(A | B1 ) P(B1 ) + P(A | B 2 ) P(B 2 ) + P(A | B 3 ) P(B 3 )

= 0,1x0,3 + 0,05x0,2 + 0,2x0,5 = 0,14

2.4 Teorema de Bayes


Finalmente, uma das relaes mais importantes envolvendo probabilidades condicionais dada pelo teorema de Bayes. Thomas Bayes (1702-1761) afirmou que as probabilidades devem ser revistas quando conhecemos algo mais sobre os dados. A forma geral do teorema de Bayes pode ser introduzida atravs do Teorema 6.1.
Teorema 6.1. A probabilidade de ocorrncia do evento Bi, supondo a ocorrncia do evento A,

dado por
P(B i | A) = P( A | B i ) P( B i )

P(A | B )P(B )
i =1 i i

O teorema de Bayes uma generalizao da probabilidade condicional no caso de mais de dois eventos.

Exemplo 31. Considere novamente o Exemplo 30. Sabendo-se que a mineradora encontrou
ouro, qual a probabilidade de que tenha sido na mina B3?

58

Soluo: Precisamos calcular a seguinte probabilidade:


P(B 3 | A) = P( A | B 3 ) P( B 3 )

P( A | B ) P( B )
i =1 i i

0,2x 0,5 0,10 = 0,7143 0,14 0,14

2.5 Exerccios
1. O campo da Engenharia da confiabilidade se desenvolveu rapidamente a partir do incio da
dcada de 1960. Um tipo de problema encontrado o de se estimar a confiabilidade de um sistema a partir das confiabilidades dos subsistemas. A confiabilidade definida aqui como a probabilidade do funcionamento apropriado durante um certo perodo de tempo. Considere a estrutura de um sistema em srie simples, como o da figura a seguir:

Subsistema 1

Subsistema 2

O sistema funciona se, e somente se, o subsistema 1 e o subsistema 2 funcionarem. Se os subsistemas sobrevivem independentemente, a confiabilidade do subsistema 1 de 0,90 e do subsistema 2 de 0,80, qual a confiabilidade do sistema?

2. Em um centro de mquinas, h quatro mquinas automticas de parafusos. Uma anlise dos


registros de inspeo passados fornece os seguintes dados:

Mquina Percentual de Produo Percentual de Defeituosos Produzidos 1 15 4 2 30 3 3 20 5 4 35 2 As mquinas 2 e 4 so mais novas e, assim, a maior parte da produo foi atribuda a
elas. Suponha que o estoque atual reflita as porcentagens de produo indicadas.

a. Se um parafuso selecionado aleatoriamente do estoque, qual a probabilidade de que seja


defeituoso?

b. Se um parafuso selecionado aleatoriamente do estoque e ele defeituoso, qual a


probabilidade de que seja da mquina 2?

59

60

UNIDADE IV

DISTRIBUIES DE PROBABILIDADES

Objetivos
Ao final desta unidade, voc dever ser capaz de 1. Associar variveis aleatrias discretas com modelos probabilsticos. 2. Calcular probabilidades a partir do modelo Binomial, Hipergeomtrico e de Poisson. 3. Associar variveis aleatrias contnuas com modelos probabilsticos. 4. Calcular probabilidades a partir das distribuies Uniforme e Normal.

61

62

Aula 1 Variveis Aleatrias Discretas


1.1 Introduo
Vamos incorporar o conceito de probabilidade ao estudo de variveis associadas a caractersticas em uma populao. Muitos experimentos produzem resultados no-numricos. Antes de analis-los, conveniente transformar seus resultados em nmeros. Isso feito atravs da varivel aleatria (v.a.), que uma funo que associa um valor numrico a cada ponto do espao amostral.

Para entender melhor o conceito, considere o exemplo que se segue.

Exemplo 32. Observa-se o sexo das crianas em famlias com trs filhos. O espao amostral
= {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)} Uma v.a. de interesse X = {n. de crianas do sexo masculino}. A cada evento simples ou ponto de , associamos um nmero, que o valor assumido pela v.a. X:

Evento X

MMM 3

MMF 2

MFM 2

FMM 2

MFF 1

FMF 1

FFM 1

FFF 0

Poderamos tambm ter considerado o nmero de crianas do sexo feminino. Os valores de X, na mesma ordem, seriam ento 0, 1, 1, 1, 2, 2, 2, 3.

O passo fundamental para entendermos uma v.a. associar a cada valor a sua probabilidade, obtendo assim a sua distribuio de probabilidade.

X P(X=x)

x1 P(X=x1)

x2 P(X=x2)

... ...

xn P(X=xn)

63

A funo de probabilidade (P()) deve satisfazer: 0 P(X=xi) 1 p/ xi e

i =1

P(X = x i ) = 1 .

Exemplo 33. Um certo departamento da UFSJ formado por 35 professores, sendo 21


homens e 14 mulheres. Uma comisso de 3 professores ser constituda, sorteando-se, ao acaso, trs membros do departamento. Qual a probabilidade de a comisso ser formada pelo menos com duas mulheres?

Soluo: Seja X = {nmero de mulheres na comisso}.

Espao Amostral
HHH

Probabilidade

21 20 19 x x = 0,203 35 34 33 21 20 14 x x = 0,150 35 34 33 0,150 0,150 21 14 13 x x = 0,097 35 34 33 0,097 0,097 14 13 12 x x = 0,056 35 34 33

Distribuio de Probabilidade

HHM HMH MHH HMM MHM MMH MMM

1 1 1 2 2 2 3

X P(X)

0,203 0,450 0,291 0,056

Assim, P(X 2) = P(X = 2) + P(X = 3) = 0,291+ 0,056 = 0,347

64

1.2 Esperana Matemtica e Varincia


Assim como definimos a mdia de uma distribuio de freqncias como a soma dos produtos dos diversos valores observados pelas respectivas freqncias relativas, natural definirmos agora a mdia de uma v.a., ou de sua distribuio de probabilidade, como a soma dos produtos dos diversos valores de xi da v.a. pelas respectivas probabilidades P(X = xi). A mdia de uma v.a. X tambm chamada valor esperado ou esperana matemtica, ou simplesmente esperana de X. representada por E(X) e se define como

E (X) = x 1 P(X = x 1 ) + x 2 P(X = x 2 ) + L + x n P(X = x n ) = x i P(X = x i )


i =1

uma mdia ponderada dos xi, em que os pesos so as probabilidades associadas.


Exemplo 34. Um lojista mantm extensos registros das vendas dirias de certo aparelho. O

quadro a seguir d o nmero xi de aparelhos vendidos em uma semana e a respectiva probabilidade: Nmero xi Probabilidade P(X = xi) 0 0,1 1 0,1 2 0,2 3 0,3 4 0,2 5 0,1

Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma semana?
Soluo: Calculemos inicialmente E(X), que o nmero esperado de aparelhos vendidos em

uma semana: E(X) = (0)(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70. Para x unidades vendidas o lucro 20x. Logo, o lucro esperado de R$ 54,00.
Varincia

Assim como a mdia uma medida de posio de uma v.a., natural que procuremos uma medida de disperso dessa varivel em relao mdia. Essa medida a varincia, a ser representada por 2 e definida por 2 = Var (X) = E[X E (X)] 2 = ( x i E (X)) 2 P(X = x i )
i =1 n

65

Desenvolvendo o termo quadrtico do somatrio, obtemos uma expresso mais fcil de calcular a varincia dada por 2 = Var (X) = E(X 2 ) [E (X)]2 , onde E (X 2 ) = x i2 P(X = x i ) .
i =1 n

Desvio Padro

O desvio padro () a raiz quadrada positiva da varincia. Tem sobre esse ltimo a vantagem de exprimir a disperso na mesma unidade de medida da v.a. = 2

1.3 Distribuies de Probabilidades para Variveis Aleatrias Discretas


Para utilizar a teoria das probabilidades no estudo de um fenmeno concreto, devemos encontrar um modelo probabilstico adequado a tal fenmeno. Por modelo probabilstico para uma v.a. X entendemos uma forma especfica de funo de distribuio de probabilidade que reflita o comportamento de X. Nesse processo de escolha, lanamos mo, em muitas situaes, de algum modelo clssico. Nesta seo estudaremos os modelos discretos comumente utilizados: Bernoulli, Binomial, Hipergeomtrica e Poisson.

1.3.1 Modelo Bernoulli


Na prtica, existem muitos experimentos que admitem apenas dois resultados. Por exemplo, uma pea classificada como boa ou defeituosa; um entrevistado concorda ou no com a afirmao feita; o resultado de um exame mdico para deteco de uma doena positivo ou negativo; no lanamento de um dado ocorre ou no a face 5.

66

Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas do tipo sucesso-fracasso. Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma v.a. com distribuio Bernoulli.

Varivel Aleatria de Bernoulli

uma v.a. X que assume apenas dois valores: 1 se ocorrer sucesso, e 0 se ocorrer fracasso, sendo p a probabilidade de sucesso, 0 < p < 1.

Denotamos por X ~ Bernoulli (p) uma v.a. com distribuio de Bernoulli com parmetro p, se 1, X= 0, se ocorrer " sucesso" se ocorrer " fracasso" com funo de probabilidade,
1 x

P(X = x ) = p x (1 p )
Da segue que E(X) = p e

, x = 0, 1

Var(X) = 1-p

Repeties independentes de um ensaio de Bernoulli do origem ao modelo binomial.

1.3.2 Modelo Binomial


Um experimento dito ser um experimento Binomial se
a. consiste em n ensaios de Bernoulli; b. seus ensaios so independentes; e c. a probabilidade de sucesso em cada ensaio sempre igual a p, 0 < p < 1.

A v.a. X, correspondente ao nmero de sucessos num experimento binomial, tem distribuio binomial com parmetros n e p, com funo de probabilidade dada por n P(X = x ) = p x (1 p) n x , x x = 0,1,K, n ,

n n! onde = x x!(n x )! , n!= n (n 1)(n 2) L (2)(1) e 0!= 1 .

67

Usamos a seguinte notao: X ~ B(n; p). A mdia e a varincia so dadas, respectivamente, por E(X) = np e Var(X) = np(1-p)

Exemplo 35. Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10

pessoas dessa populao forem escolhidas ao acaso e com reposio, determine


a. O n esperado de inadimplentes; b. A probabilidade de selecionar exatamente 3 pessoas inadimplentes; c. A probabilidade de selecionar no mximo 3 inadimplentes.

Soluo: a. X={nmero de pessoas inadimplentes}. Temos que E[X] = 10 x 0,2 = 2.

10 b. P(X = 3) = 0,2 3 (1 0,2)103 0,2 3


3 10 10 10 c. P(X 3) = P(X = i) = 0,810 + 0,210,8 9 + 0,2 2 0,88 + 0,2 3 0,8 7 0,88 1 2 3 i =0

1.3.3 Modelo Hipergeomtrico


A distribuio hipergeomtrica est restritamente relacionada com a distribuio binomial. A diferena-chave entre as duas distribuies de probabilidade que, com a distribuio hipergeomtrica, os ensaios no so independentes, e a probabilidade de sucesso muda de ensaio para ensaio, pois as selees dos elementos so feitas sem reposio, enquanto que na distribuio binomial as selees dos elementos so feitas com reposio.

Considere um conjunto de N objetos dos quais (r) so do tipo I e (N r) so do tipo II. Um sorteio de n objetos (n < N) feito ao acaso e sem reposio. A varivel aleatria discreta X que igual ao nmero de objetos do tipo I selecionados nesse sorteio tem distribuio hipergeomtrica.

68

Os valores possveis de X vo de 0 a min(r, n), uma vez que no podemos ter mais do que o nmero de objetos existentes do tipo I, nem mais que o total de sorteados. Sua funo de probabilidade dada por r N r P(X = x ) = x n x N , 0 x mnimo(r, n). n

Usamos a seguinte notao: X ~ Hipergeomtrica (N; n; r). A esperana e varincia so dadas por E(X) = np onde p = r/N.
Exemplo 36. Uma fbrica produz peas que so embaladas em caixas com 40 unidades. Para

Var(X) = np(1-p)(N-n)/(N-1),

aceitar o lote de caixas enviado por essa fbrica, o controle de qualidade de uma empresa sorteia uma caixa do lote e sorteia 10 peas, sem reposio, dessa mesma caixa. Se houver alguma pea defeituosa, o lote inteiro devolvido. Se a caixa sorteada tiver 4 peas defeituosas, qual a probabilidade de o lote no ser devolvido?
Soluo:

N = 40, n = 10 e r = 4.

X: nmero de peas defeituosas. 40 0,3 10

4 40 4 P(X = 0) = 0 10 0

1.3.4 Modelo Poisson


A distribuio de Poisson empregada em experimentos nos quais no se est interessado no nmero de sucessos obtido em n tentativas, como ocorre no caso da distribuio binomial, mas sim no nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um intervalo de tempo, espao etc. Alguns exemplos de variveis que podem ter a distribuio de Poisson so nmero de defeitos por centmetro quadrado; n de acidentes por dia;

69

n de clientes por hora; n de chamadas telefnicas recebidas por minuto. Note-se que a unidade de medida (tempo, rea) contnua, mas a varivel aleatria de interesse (nmero de ocorrncia) discreta. Alm disso, as falhas no so contveis. No possvel contar os acidentes que no ocorreram, nem o nmero de defeitos por centmetros quadrados que no ocorreram. O limite inferior do nmero de ocorrncias, em todas as situaes dos exemplos, zero, enquanto que o limite superior ao menos teoricamente infinito, muito embora, na maioria dos exemplos acima, seja difcil imaginar um nmero infinito de ocorrncias. As probabilidades, calculadas agora para todos os nmeros inteiros no negativos x = 0, 1, 2, ... so dadas da seguinte forma: P(X = x ) = e x , x = 0, 1, ..., x!

onde X = nmeros de sucessos em um intervalo a varivel de interesse, > 0 o nmero mdio de sucessos da varivel X e e a constante 2,7183 (base dos logaritmos naturais). Usamos a seguinte notao: X ~ P(). A esperana e varincia so dadas por E(X) = Var(X) =
Exemplo 37. Um departamento de conserto de mquinas recebe uma mdia de cinco

chamadas por hora. Supondo que a distribuio de Poisson seja adequada nessa situao, obter a probabilidade de que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente trs chamadas.
Soluo: Seja X: nmero de chamadas para conserto de mquinas em uma hora. O parmetro

= 5/hora. Aplicando na funo da Poisson, temos P(X = 3) = e 5 5 3 0,14 3!

70

1.4 Exerccios
1. A distribuio de X: n de crianas por domiclio numa determinada regio dada pela

tabela abaixo.

X P(X = x)

0 0,10

1 0,15

2 0,25

3 0,30

4 0,15

5 0,05

Calcule:
a. O nmero mdio de crianas por domiclio, X. b. O desvio padro de X, X. c. A probabilidade P{X - X X X + X}.

2. Sabe-se que 7% dos ratos machos de uma certa linhagem so portadores de um defeito

gentico que no ocorre em fmeas. Responda:


a. Qual a probabilidade de encontrarmos pelo menos 1 animal com esse defeito gentico numa

ninhada com 5 machos?


b. Qual a probabilidade de encontrarmos no mximo 3 animais com esse defeito gentico

numa ninhada com 4 machos?

3. Numa central telefnica, o nmero de chamadas chega segundo uma distribuio Poisson,

com a mdia de oito chamadas por minuto. Determine qual a probabilidade de que num minuto se tenha(m)
a. duas ou mais chamadas; b. menos que duas chamadas; c. entre sete (inclusive) e nove (exclusive) chamadas.

71

Aula 2 Variveis Aleatrias Contnuas


2.1 Introduo
At aqui estudamos variveis aleatrias discretas que so caracterizadas por ter uma distribuio de probabilidade dada por uma tabela que associa a cada um de seus valores uma probabilidade. Esta probabilidade um nmero entre 0 e 1 cuja soma igual a 1. Vamos agora definir uma varivel aleatria contnua.

Seja X uma varivel aleatria. Suponha que os possveis valores de X sejam um intervalo que possui infinitos valores; ento, dizemos que X uma varivel aleatria contnua.

Exemplo 38. Seguem alguns exemplos de variveis aleatrias contnuas. a. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real.

Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar qualquer nmero real positivo.
b. Em campanhas preventivas de hipertenso arterial comum, de tempos em tempos, medir-

se o nvel de colesterol. O valor de cada medida pode ser um nmero real no-negativo.
c. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete,

acendendo-a; observa-se a mesma at que se queime. O tempo de durao da lmpada um nmero real no negativo.

No Exemplo 38 o nmero observado em cada um dos experimentos aleatrios um nmero real e resulta em geral de uma medio: altura das mulheres; nvel de colesterol e tempo de durao da lmpada.

Uma varivel aleatria contnua assume seus possveis valores em um determinado intervalo. A pergunta que surge Como so atribudas probabilidades neste caso?.

72

Exemplo 39. Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas

aleatoriamente numa populao. O histograma por densidade desses valores apresentado na Figura 9.
0,05

0,04

Densidade

0,03

0,02

0,01

0,00

30

40

50

60

70 Peso

80

90

100

110

Figura 9. Histograma da varivel peso.

A anlise do histograma indica que a distribuio dos valores da varivel peso aproximadamente simtrica em torno de 70 kg; a maioria dos valores encontra-se no intervalo (50; 90); existe uma pequena proporo de valores abaixo de 50 kg e acima de 90 kg.

Seja X = {peso em kg} de uma pessoa adulta escolhida ao acaso da populao. Como se distribuem os valores da v.a. X, ou seja, qual a distribuio de probabilidades de X?
0,05

0,04

Densidade

0,03

0,02

0,01

0,00

30

40

50

60

70 Peso

80

90

100

110

Figura 10. Histograma da varivel peso com o ajuste da distribuio normal.

73

A Figura 10 ilustra o histograma da varivel peso apresentado na Figura 9 com o ajuste de uma funo densidade, conhecida como distribuio normal.

Para as variveis contnuas, as probabilidades so atribudas por meio de uma funo cuja rea entre a funo e o eixo das abscissas (X) igual a um.

Figura 11. Representao de uma funo densidade de probabilidade contnua.

A rea hachurada na Figura 11 ilustra a probabilidade de a v.a. contnua X estar no intervalo [a, b], ou seja, P(a X b) = rea hachurada.

Esta funo f(x) denominada funo densidade de probabilidade (fdp) da varivel aleatria contnua X. A rea sob uma curva delimitada por dois valores a e b, como mostra a Figura 11 determinada calculando-se a integral definida entre a e b da densidade de probabilidade representada pela funo, isto ,

f (x )dx = P(a x b)
a

Exemplo 40. Um fabricante de televiso a cores oferece uma garantia de 1 ano para

substituio gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de anos), x, como uma varivel aleatria contnua com a seguinte fdp 1 x 4 e , x>0 . f (x ) = 4 0 x0

74

Qual a probabilidade de voc comprar a televiso e necessitar de uma substituio gratuita?


Soluo:

1 P( x 1) = e 4 dx 0,2 4 0
Funo Densidade de Probabilidade

Se X uma v.a. contnua, a funo densidade de probabilidade f(X), indicada abreviadamente por fdp, uma funo que satisfaz s seguintes condies:
a. f(X) 0, X;
+

b. A rea sob a funo densidade de probabilidade 1, isto :

f (x)dx = 1 ;

c. P(a X b) = rea sob a funo densidade de probabilidade f(x) e acima do eixo x entre os

pontos a e b, isto , P(a x b) = f ( x )dx ;


a

d. P(X = x0) = 0, porque, P(X = x 0 ) = f ( x )dx = 0 . Como conseqncia, temos


x0

x0

P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b).

Funo de Distribuio Acumulada


Se X uma v.a. contnua, a funo de distribuio acumulada (fda) de X definida como F(X) = P(X x ) =

f (s)ds .

Exemplo 41. Considere a seguinte densidade de probabilidade: f ( x ) = 2x , para 0 x 1 e

f ( x ) = 0 , fora desse intervalo. Obtenha a F(x) de X.


Soluo:
0, x F( x ) = 2sds = s 2 0 1 x<0
x 0

= x2, 0 x 1 x >1

75

2.2 Esperana Matemtica e Varincia


Se X uma v. a. contnua, o valor esperado de X (ou esperana matemtica de X) denotada por E(X) definido como
+

E[X] =

xf (x )dx
1

Exemplo 42. Para uma varivel que tem densidade f(x) = 2x, 0 < x < 1, ento,

2 E[X] = x 2 x dx = 2 x dx = x 3 3 0 0
2

=
0

2 . 3

A varincia de uma varivel aleatria contnua definida por: Var(X) = E(X ) [E(X)] , onde E[X ] = x 2 f ( x ) dx .
2 2
2 0 1

Exemplo 43. Para uma varivel que tem densidade f(x) = 2x, 0 < x < 1, calcule a varincia de

X, sabendo que E[X] =

2 do Exemplo 42. 3

2 Soluo: E[X ] = x 2x dx = 2x dx = x 4 4 0 0
2 2 3

=
0

2 . Logo, Var[X] = 2/4 (2/3)2 =1/18. 4


Var[X ] = 1 / 18 0,236

Conseqentemente, o desvio padro de X fica DP[X] =

2.3 Distribuies de Probabilidades para Variveis Aleatrias Contnuas


As distribuies discretas de probabilidades tratam de situaes em que o espao amostral contm um nmero finito, ou infinito enumervel, de pontos. Se o espao amostral contm um nmero infinito no-enumervel de pontos, temos que trabalhar com as distribuies contnuas

76

de probabilidades. Abordaremos aqui, em carter mais intuitivo, a distribuio uniforme e a distribuio normal.

2.3.1 Modelo Uniforme


A distribuio de probabilidade mais simples de uma v.a. X contnua a distribuio uniforme.

Uma v.a. X tem distribuio uniforme U(a , b) se sua funo densidade de probabilidade da forma 1 , a<x<b f (x ) = b a . 0, caso contrrio

A mdia e a varincia da distribuio U(a , b) so dadas respectivamente por

E[X] =

a+b 2

Var[X] =

(b a ) 2 12

Note que a mdia exatamente o ponto mdio do intervalo [a, b].

Exemplo 44. Devido presena de quantidades variveis de impureza, o ponto de fuso de

certa substncia pode ser considerado uma v.a. contnua distribuda uniformemente no intervalo [100, 125]. Qual a probabilidade de a substncia fundir-se entre 110 e 115?
Soluo: Neste caso, a = 100, b = 125 e b a = 25. A funo densidade fica

1 , 100 x 125 f ( x ) = 25 0, caso contrrio A probabilidade procurada 1 1 115 110 5 P(110 < X < 115) = dx = x = = = 0,2 25 25 110 25 25 110
115 115

77

2.3.2 Modelo Normal


A distribuio Normal a mais importante das distribuies contnuas de probabilidade. Foi introduzida em 1730 por DMoivre, sendo muito utilizada em Astronomia pelo alemo fsico e matemtico Gauss, trazendo muita confuso para vrias pessoas que, por esse motivo, acham que foi Gauss quem a descobriu. Muitos dos fenmenos aleatrios de interesse comportam-se prximos a essa distribuio com valores muito freqentes em torno da mdia e diminuindo a freqncia medida que nos afastamos da mdia.

A distribuio normal tem sua densidade dada por

f (x) =

1 2
2

1 x 2

, < x <

em que e so os parmetros da distribuio.

As principais caractersticas da distribuio normal so: A mdia da distribuio ; O desvio padro ; A moda e a mediana so iguais a ; A curva normal simtrica em torno da mdia ; Os pontos de inflexo so - e + ; A rea sob a curva e acima do eixo horizontal igual a 1. A v.a. Normal com mdia e varincia 2 denotada por N(, 2).

78

A distribuio normal depende dos parmetros e 2

Curvas normais com mesmo desvio padro, mas com mdias diferentes.

1
Curvas normais com mesma mdia, mas com desvios padro diferentes.

2
_ _ _ N ( , 1 2 ) _ _ _ N ( , 2 2 ) _ _ _ N ( , 3 2 ) 1 2 < 2 2< 3 2

A varivel Normal Padronizada

O clculo direto de probabilidades envolvendo a distribuio normal exige recursos de clculo infinitesimal e, mesmo assim, dada a forma da funo de densidade, no um processo elementar. Por isso, elas foram tabeladas, permitindo-nos obter diretamente o valor da probabilidade desejada. Notemos, entretanto, que a funo de densidade normal depende de dois parmetros, e , de modo que, se as probabilidades fossem tabeladas diretamente a partir dessa funo, seriam necessrias tabelas de dupla entrada, complicando-se consideravelmente. Recorre-se, por isso, a uma mudana de varivel, transformando a v.a. X na v.a. Z assim definida: Z= X .

Essa nova varivel chama-se varivel normal padronizada. Recebe esse nome, porque sua mdia 0 e seu desvio padro 1. Mediante tal transformao, basta construirmos uma nica

79

tabela, a da normal reduzida e, atravs dela, obteremos as probabilidades associadas a todas as distribuies N(, 2).

Note que essa transformao no altera a forma da distribuio, apenas refere-se a uma nova escala.

Assim, se quisermos calcular P(a < X < b) , sendo X ~ N(;2), podemos definir Z = calcular a seguinte probabilidade:

X e

b a X b a P(a < X < b) = P(a < X < b ) = P < < <Z< = P

Uma representao do clculo dessa probabilidade apresentada na Figura 12.


f(x)

f(z) a

z a 0 b Figura 12. Representao do clculo da P(a < X < b) via varivel normal padronizada Z.

De forma anloga, dada uma varivel padronizada Z ~ N (0;1), podemos obter a v.a. X ~ N(, 2 ) atravs da transformao inversa X = + Z.

80

Tabela da Distribuio Normal Padro Denotamos: A(z) = P(Z z), para z 0.

Probabilidades Acumuladas da Distribuio Normal (0, 1) Segunda decimal de z


0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 0 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000 1 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000 2 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 3 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 4 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 5 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 6 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000

A(z) = P(Z z) , z 0.
7 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 8 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 9 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 0.9999 1.0000

Parte inteira e primeira decimal de z

81

Exemplo 45. Se Z ~ N (0,1), ento: a. P(Z 1,71) = A(1,71) = 0,9564 b. P(0 < Z 1,71) = A(1,71) A(0)

= 0,9564 0,5000 = 0,4564

Exemplo 46. Seja X = {gasto com lanche semanal}. Aps estudar esta varivel, vimos que

X ~ N (20, 64), ento obtenha


a. P(16<X<22)

Soluo:

16 20 X 20 22 20 < < P(16 < X < 22) = P = P(0,5 < Z < 0,25) 8 8 8 = (A(0,25) A(0)) + (A(0,5) A(0)) = (0,5987 0,5) + (0,6915 0,5) = 0,2902
b. P(X<18 ou X>24)

Soluo:

X 20 24 20 X 20 18 20 P(X < 18 ou X > 24) = P(X < 18 ) + P(X > 24) = P > < + P 8 8 8 8 = P( Z < 0,25) + P( Z > 0,5) = (1 A(0,25)) + (1 A(0,5)) = (1 0,5987) + (1 0,6915) = 0,7098

82

Como encontrar o valor z da distribuio N(0,1) tal que rea acumulada at ele seja A(z) = 0.975.

a. P(Z z) = 0,975. z tal que A(z) = 0,975. Pela tabela, z = 1,96.

Considere que X ~ N(, 2). Calcule k tal que P(X k) = 0,05. Neste caso temos que k X k k P ( X k ) = P = P Z = 0,05 A = 0,95 k = 1,64 k = + 1,64 Logo, o valor de k k = +1,64 .
Nota Importante: Para toda v.a. X ~ N( ; 2) temos 1. P( X + ) = P(1 Z 1) = 0,683 . 2. P( 2 X + 2) = P(2 Z 2) = 0,955 3. P( 3 X + 3) = P(3 Z 3) = 0,997

83

2.4 Exerccios
1. Se Z ~N(0,1), calcule: a. P(1,32 < Z 1,79) b. P(Z -1,3) c. P(-1,32 < Z < 0) d. P(Z 1,5) e. P(-1,5 Z 1,5) f. P( -2,3 < Z -1,49)

2. Encontre o valor z da distribuio N(0,1) tal que a. P(0 < Z z) = 0,4975 b. P(Z z) = 0,975 c. P(-z Z z) = 0,80 d. P(Z z) = 0,3 e. P(Z z) = 0,10

3. O dimetro de um cabo eltrico uma varivel aleatria com fdp dada por

0 < x <1 6x (1 x ), f (x) = 0, caso contrrio


a. Verifique se f(x) uma fdp, atravs do item b. da definio 8.2. b. Obtenha a F(x). c. Qual a probabilidade de o dimetro ser: c1. Igual a 0,5 cm? c2. Maior que 0,5? c3. Entre 0,10 e 0,20? c4. Menor que 1?

4. A quantia gasta anualmente, em milhes de reais, na manuteno do asfalto de uma cidade

do interior representada pela varivel y, modelada pela funo 8y 4 , 0,5 y 2 f (x) = 9 . 0, caso contrrio Qual a probabilidade de a quantia gasta ser inferior a 0,8 milhes de reais?

84

5. O tempo de sobrevivncia de uma bateria (em anos) pode ser modelado pela funo

e x , x0 f (x) = 0, caso contrrio


a. Qual a probabilidade de a bateria sobreviver mais que 2 anos? b. Qual o tempo mdio de sobrevivncia da bateria?

6. O tempo gasto no exame vestibular de uma universidade tem distribuio Normal, com

= 120 min, e = 15 min.


a. Sorteando-se um aluno ao acaso, qual a probabilidade de ele terminar o exame antes de

100 minutos?
b. Qual deve ser o tempo de prova, de modo a permitir que 95% dos vestibulandos a terminem

no prazo estipulado?
c. Qual o intervalo central de tempo tal que 80% dos estudantes gaste para completar o exame?

85

86

Probabilidade e Estatstica

REFERNCIAS

BUSSAB, W. O.; MORETTIN, P.A. Estatstica Bsica. 5. ed. So Paulo: Saraiva, 2006. FARIAS, A. A.; SOARES, J. F.; CSAR, C. C. Introduo Estatstica. 2. ed. Rio de Janeiro: LTC, 2003. GNEDENKO, B. V. Ateoria da probabilidade. Rio de Janeiro: Cincia Moderna, 2008. JAMES, B. R. Probabilidade: um curso em nvel intermedirio. 2. ed. Rio de Janeiro: SBM, 1996. MAGALHES, M. N.; PEDROSO DE LIMA, A. C. Noes de Probabilidade e Estatstica. 6. ed. So Paulo: Edusp, 2007. ROSS, Sheldon. Afirst course in probability. 8. ed. Londres: Prentice Hall, 2005. TRIOLA, M. F. Introduo estatstica. 10. ed. Rio de Janeiro: LTC, 2008.

87

Você também pode gostar