Escolar Documentos
Profissional Documentos
Cultura Documentos
P.E I (Materia)
P.E I (Materia)
PROBABILIDADE E ESTATSTICA
Marcos Santos de Oliveira Daniela Carine Ramires de Oliveira
Universidade Aberta do Brasil Ncleo de Educao a Distncia Universidade Federal de So Joo del-Rei
Probabilidade e Estatstica
Marcos Santos de Oliveira Daniela Carine Ramires de Oliveira
O48p Oliveira, Marcos Santos de Probabilidade e estatstica / Marcos Santos de Oliveira ; Daniela Carine Ramires de Oliveira . So Joo del-Rei, MG : UFSJ, 2009. 87 p. Apostila do curso de Ps-graduao lato sensu em Matemtica. 1. Matemtica Estudo e ensino 2. Probabilidade 3. Estatstica I. Oliveira, Daniela Carine Ramires de I. Ttulo. CDU: 519.2
Reitor Helvcio Luiz Reis Coordenador UAB/NEAD/UFSJ Heitor Antnio Gonalves Coordenadora do curso Educao Empreendedora Rosngela Maria de Almeida Camarano Leal Coordenador do curso Matemtica Carlos Alberto Raposo da Cunha Coordenadores do curso Prticas de Letramento e Alfabetizao Gilberto Aparecido Damiano Maria Jos Netto Andrade Conselho Editorial Adlia Conceio Diniz Alessandro de Oliveira Bernadete Oliviera Sidney Viana Dias Betnia Maria Monteiro Guimares Frederico Ozanan Neves Geraldo Tibrcio de Almeida e Silva Gilberto Aparecido Damiano Guilherme Chaud Tizziotti Igncio Csar de Bulhes Luiz Fernando de Carvalho Maria do Carmo Santos Neta Maria do Socorro Alencar Nunes Macedo Maria Jos Netto Andrade Marise Santana da Rocha Rosngela Branca do Carmo Terezinha Lombello Ferreira
Edio Ncleo de Educao a Distncia - NEAD-UFSJ Conselho Editorial NEAD-UFSJ Capa / Diagramao Luciano Alexandre Pinto
Probabilidade e Estatstica
Sumrio Pra comeo de conversa... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 05 Unidade I - Introduo Estatstica e Amostragem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 07 Aula 1 Noes de Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 09 1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 09 1.2 Classificao de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Aula 2 Tcnicas de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.2 Amostragem Aleatria Simples (AAS) . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3 Amostragem Sistemtica (AS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.4 Amostragem Estratificada Proporcional (AEP) . . . . . . . . . . . . . . . . . . . 19 2.5 Amostragem por Conglomerado (AC) . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Unidade II - Explorao de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Aula 1 Tabelas e Grficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.1 Tabelas de Freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.2 Tabelas de Classes de Freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.3 Grficos para as Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.4 Grficos para as Variveis Quantitativas . . . . . . . . . . . . . . . . . . . . . . . . 29 1.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Aula 2 Medidas de Posio e Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.1 Mnimo, Mximo e Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.2 Mdia e Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.3 Medidas Separatrizes: Quartis, Decis e Percentis . . . . . . . . . . . . . . . . . . 38 2.4 Amplitude, Varincia e Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Probabilidade e Estatstica
Unidade III - Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Aula 1 Introduo Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 1.1 Processo ou Experimento Aleatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 1.2 Espao Amostral e Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 1.3 Definies de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Aula 2 Fundamentos de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.1 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.2 Independncia de Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 2.3 Regra da Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 2.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 2.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Unidade IV Distribuies de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Aula 1 Variveis Aleatrias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 1.2 Esperana Matemtica e Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 1.3 Distribuies de Probabilidades para Variveis Aleatrias Discretas . . . 66 1.3.1 Modelo Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 1.3.2 Modelo Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 1.3.3 Modelo Hipergeomtrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 1.3.4 Modelo Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 1.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Aula 2 Variveis Aleatrias Contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2.2 Esperana Matemtica e Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 2.3 Distribuies de Probabilidades para Variveis Aleatrias Contnuas . . 76 2.3.1 Modelo Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 2.3.2 Modelo Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 2.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
UNIDADE I
Objetivos
Ao final desta unidade, voc dever ser capaz de 1. Identificar populao e amostra. 2. Conceituar e classificar variveis. 3. Aplicar diferentes tcnicas de amostragem. 4. Diferenciar as tcnicas de amostragem a partir de suas caractersticas.
O que Estatstica? Podemos considerar que a Estatstica uma cincia que fornece um conjunto de tcnicas que nos permitem, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos realizados em qualquer rea do conhecimento. Estamos denominando por dados a um (ou mais) conjunto de valores, numricos ou no. A aplicabilidade das tcnicas a serem discutidas se d nas mais variadas reas das atividades humanas. Nesse sentido, o principal objetivo da Estatstica nos auxiliar a tomar decises ou tirar concluses em situaes de incerteza, a partir de informaes numricas.
A Estatstica pode ser dividida em trs reas, a saber: Estatstica Descritiva: conjunto de tcnicas destinadas a descrever e resumir os dados, a fim de tirarmos concluses a respeito de caractersticas de interesse.
Probabilidade: teoria matemtica utilizada para se estudar a incerteza associada a fenmenos aleatrios. Inferncia Estatstica: denominao usualmente empregada ao estudo de tcnicas que possibilitam a extrapolao, a um grande conjunto de dados (populao), das informaes e concluses obtidas a partir de um subconjunto de valores (amostra).
Estudos complexos envolvendo o tratamento estatstico dos dados usualmente envolvem as trs reas mencionadas anteriormente. Para exemplificar tal procedimento, considere o esquema apresentado na Figura 1, a seguir:
A Figura 1 ilustra como a Estatstica funciona na prtica. Suponha, inicialmente, que estamos interessados em estudar algumas caractersticas em um grande conjunto de dados que denominaremos de populao. Deve-se considerar que, na terminologia estatstica, populao refere-se no somente a uma coleo de indivduos, mas ao alvo no qual reside nosso interesse. Assim, todos os clientes de um banco, todos os alunos de uma faculdade, todos os automveis de uma determinada marca, ou mesmo todo o sangue no corpo de uma pessoa so
10
exemplos de possveis populaes. Algumas vezes podemos acessar todos os dados da populao (nesse caso dizemos que o censo foi realizado), mas em muitas situaes tal procedimento no pode ser realizado. Em geral, razes econmicas e ticas so as mais determinantes dessas situaes. Para contornar esse fato, tomamos alguns elementos da populao para formar um grupo a ser estudado. Esse subconjunto da populao, em geral com dimenso sensivelmente menor, denominado amostra.
A seleo de uma amostra pode ser feita de vrias maneiras, dependendo, entre outros fatores, do grau de conhecimento que temos da populao, da quantidade de recursos disponveis, e assim por diante. Existem tcnicas adequadas de amostragem que nos auxiliam na obteno de um subconjunto de valores o mais parecido possvel com a populao que lhe d origem. Algumas dessas tcnicas sero vistas posteriormente.
Obtida uma amostra, o prximo passo utilizar as tcnicas de Estatstica Descritiva para organizar e descrever os resultados contidos na amostra. A partir da, podemos usar tcnicas de Inferncia Estatstica para estimar quantidades desconhecidas, realizar extrapolao dos resultados e testar algumas hipteses de interesse sobre a populao. As tcnicas de Inferncia Estatstica no fazem parte da ementa desta disciplina; entretanto, as mesmas sero vistas de forma detalhada na disciplina Estatstica Aplicada.
Um Pouco da Histria da Cincia Estatstica A ttulo de curiosidade, apresentamos um pouco da histria da Cincia Estatstica.
5000 a.C. Surgiram os primeiros registros egpcios de presos de guerra. 2000 a.C. Houve o primeiro censo Chins. 695 1303 1654 Primeira utilizao da mdia ponderada pelos rabes na contagem de moedas. Origem dos nmeros combinatrios (Shihcieh Chu). Pierre de Fermat e Blaise Pascal, dois famosos matemticos, estabelecem os Princpios do Clculo das Probabilidades. 1763 Primeiras idias das tcnicas de Inferncia Estatstica (Thomas Bayes).
11
1930 1940
Incio das tcnicas de Controle Estatstico de Qualidade nas indstrias. Inveno do Computador Eletrnico.
Maiores detalhes sobre a histria da Estatstica podem ser encontrados no site da Associao Brasileira de Estatstica ABE, no link http://www.redeabe.org.br/historia.htm
Exemplo 1. A MD Indstria e Comrcio, desejando melhorar o nvel de seus funcionrios, montou um curso experimental e indicou 25 funcionrios para a primeira turma. Os dados esto dispostos na Tabela 1. Como havia dvidas quanto adoo de um nico critrio de avaliao, cada instrutor adotou seu prprio sistema de aferio.
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais de um) resultado correspondendo realizao de uma caracterstica (ou caractersticas). Por exemplo, considerando a varivel conceito em ingls, para cada funcionrio pode-se associar um dos resultados, A, B, C ou D.
12
Tabela 1. Informaes sobre seo, grau de instruo, nmeros de filhos, notas e conceitos nas disciplinas redao, ingls, metodologia e poltica de 25 empregados da MD Indstria e Comrcio. Grau de N de instruo filhos 1 Pessoal Ensino Mdio 0 2 Pessoal Fundamental 2 3 Pessoal Ensino Mdio 3 4 Pessoal Ensino Mdio 1 5 Pessoal Superior 2 6 Pessoal Superior 1 7 Pessoal Fundamental 1 8 Tcnica Fundamental 2 9 Tcnica Superior 3 10 Tcnica Ensino Mdio 4 11 Tcnica Fundamental 2 12 Tcnica Ensino Mdio 3 13 Tcnica Superior 1 14 Tcnica Superior 1 15 Venda Ensino Mdio 0 16 Venda Fundamental 1 17 Venda Superior 0 18 Venda Fundamental 0 19 Venda Superior 3 20 Venda Superior 2 21 Venda Fundamental 1 22 Venda Ensino Mdio 2 23 Venda Fundamental 1 24 Venda Superior 0 25 Venda Superior 1 Fonte: Adaptado de Bussab e Morettin (2006). Func. Seo Redao 8,6 7,0 8,0 8,6 8,0 8,5 8,2 7,5 9,4 7,9 8,6 8,3 7,0 8,6 8,6 9,5 6,3 7,6 6,8 7,5 7,7 8,7 7,3 8,5 7,0 Ingls Metodologia Poltica B B D D A B D B B B C D B A C A D C D C D C C A B A C B C A A C C B C B B C B B A C C C B B A C A A 9,0 6,5 9,0 6,0 6,5 6,5 9,0 6,0 10,0 9,0 10,0 6,5 6,0 10,0 10,0 9,0 10,0 6,0 6,0 6,0 6,5 6,0 9,0 6,5 9,0
Algumas variveis como seo, grau de instruo, conceito em ingls e conceito em metodologia apresentam como possveis resultados uma qualidade (ou atributo) do indivduo pesquisado. Logo, essas variveis so chamadas de variveis qualitativas. Dentre as variveis qualitativas, ainda podemos fazer uma distino entre dois tipos, a saber: varivel qualitativa nominal ou varivel qualitativa ordinal.
13
Uma varivel qualitativa nominal se no existe nenhuma ordenao nos possveis resultados. Possveis exemplos so seo a que o funcionrio pertence, sexo, raa etc.
Uma varivel qualitativa ordinal se existe uma ordem natural nos seus resultados. Alguns exemplos so grau de instruo, conceito em ingls, classe social etc. As variveis nota em redao, nota em poltica e nmero de filhos apresentam como possveis resultados nmeros resultantes de uma contagem ou mensurao. Essas variveis so chamadas de variveis quantitativas. As variveis quantitativas tambm podem sofrer uma classificao dicotmica: discreta ou contnua. Uma varivel quantitativa discreta se os seus possveis valores formam um conjunto finito ou infinito enumervel de nmeros, e que resultam, freqentemente, de uma contagem. Alguns exemplos so nmeros de filhos, nmeros de carros na famlia etc. Uma varivel quantitativa contnua se os seus possveis valores pertencem a um intervalo de nmeros reais e que resultam de uma mensurao. Possveis exemplos so nota em redao e poltica, peso, altura etc. Para cada tipo de varivel existem tcnicas apropriadas para resumir as informaes dos dados obtidos da amostra. Por exemplo, a utilizao de uma tabela um meio de descrever os dados de uma forma resumida. Veremos mais detalhes sobre tabelas e grficos nas prximas sees. Em algumas situaes podemos atribuir valores numricos s vrias qualidades ou atributos de uma varivel qualitativa e depois se proceder anlise como se esta fosse quantitativa, desde que o procedimento seja passvel de interpretao. Existe um tipo de varivel qualitativa para a qual essa quantificao muito til: a chamada varivel dicotmica. Para essa varivel podem ocorrer somente duas realizaes, usualmente chamadas de sucesso e fracasso. Exemplos de variveis dicotmicas so sexo, hbito de fumar (sim ou no) etc.
14
1.3 EXERCCIOS
1. Para as situaes descritas a seguir, identifique a populao e a amostra correspondente e discuta a validade do processo de inferncia estatstica para cada um dos casos. a. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. b. Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por telefone com relao ao canal em que estavam sintonizados. c. A fim de avaliar a inteno de voto para presidente dos brasileiros, 122 pessoas foram entrevistadas em Braslia.
2. Classifique cada uma das variveis abaixo em qualitativa (nominal ou ordinal) ou quantitativa (discreta ou contnua). a. Inteno de voto para presidente (possveis respostas so os nomes dos candidatos, alm de no sei). b. Perda de peso de maratonistas na Corrida de So Silvestre, em quilos. c. Intensidade da perda de peso de maratonistas na Corrida de So Silvestre (leve, moderada, forte). d. Grau de satisfao da populao brasileira com relao ao trabalho de seu presidente (valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito). e. Nmero de peas produzidas por uma mquina num dia de trabalho (500, 1000 etc).
15
Por que realizar amostragem? Existem vrias razes para o uso de amostragem em levantamento de grandes populaes. Algumas delas, entre outras, so as seguintes: Economia: em geral, torna-se bem mais econmico o levantamento de somente uma parte da populao. Tempo: numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria tempo suficiente para pesquisar toda a populao de eleitores do pas. Operacionalidade: mais fcil realizar operaes de pequena escala. Um dos problemas tpicos nos grandes censos o controle dos entrevistadores.
Quando o uso de amostragem no interessante? Populao pequena: no h necessidade de utilizar tcnicas estatsticas, pois neste caso aconselhvel realizar o censo (anlise de toda a populao). Caracterstica de fcil mensurao: talvez a populao no seja to pequena, mas a varivel que se quer observar de to fcil mensurao que no compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionrios favorveis mudana no horrio de um turno de trabalho, podemos entrevistar toda a populao no prprio local de trabalho. Esta atitude pode ser politicamente mais recomendvel.
16
Necessidade de alta preciso: a cada dez anos o IBGE1 realiza um censo demogrfico para estudar diversas caractersticas da populao brasileira. Dentre estas caractersticas tem-se o nmero total de habitantes, uma informao fundamental para o planejamento do pas. Dessa forma, o nmero de habitantes precisa ser avaliado com grande preciso e, por isso, se pesquisa toda a populao.
Procedimento para o uso deste mtodo 1. Numerar todos os elementos da populao (de 1 a N) e 2. Efetuar sucessivos sorteios at completar o tamanho da amostra (n).
Para realizar este sorteio, podemos utilizar urnas, tabelas de nmeros aleatrios ou algum software que gere nmeros aleatrios. A Tabela 2 foi construda usando-se o software Excel (comando aleatorio()).
Exemplo 2. Estamos interessados em estudar a qualidade da gasolina nos postos de uma determinada cidade. Essa cidade possui N = 40 postos. A empresa que estudar a qualidade pode investigar apenas uma amostra de n = 4 postos. Para selecionar uma amostra aleatria simples basta escolhermos uma posio de qualquer linha da tabela de nmeros aleatrios e extrairmos conjuntos de dois algarismos (pois N, que o tamanho da populao, possui 2 casas decimais), at completarmos os 4 elementos da amostra. Se o nmero sorteado no
17
existir, simplesmente no consideramos e prosseguimos o processo. Escolhendo a primeira linha da tabela de nmeros aleatrios, temos a seguinte amostra de 4 elementos: AAS = {16, 24, 18, 27, 25}.
18
Exemplo 3. Considerando uma turma com 49 alunos, retire uma amostra de tamanho 5 utilizando a tcnica de amostragem sistemtica. Soluo: Temos que N = 49 e n = 5 . Logo, 1) i = N/n = 49/5 = 9,8. Considerando a parte inteira do nmero, temos que i = 9; 2) Sortear um nmero x entre 1 e i = 9 da tabela de nmeros aleatrios que contenha um
algarismo, pois i possui 1 casa decimal. Escolhendo a ltima linha, temos que o primeiro nmero que est entre 1 e 9 4. Logo, a amostra ser composta dos seguintes elementos:
AS = {4, 13, 22, 31, 40}.
A AEP tem as seguintes caractersticas: dentro de cada estrato h uma grande homogeneidade (pequena variabilidade); entre os estratos h uma grande heterogeneidade (grande variabilidade). comum os estratos terem tamanhos diferentes. Nesses casos, a proporcionalidade do tamanho da amostra de cada estrato da populao deve ser mantida na amostra. Por exemplo, se um estrato corresponde a 20% do tamanho da populao, ele tambm deve corresponder a 20% da amostra.
Exemplo 4. Com o objetivo de realizar uma pesquisa de opinio sobre a gesto atual da
reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A populao composta por 70 professores, 80 servidores tcnicos administrativos e 800 alunos,
19
P01 P02 ... P70 S01 S02 ... S80 A001 A002 ... A800
Supondo que a opinio sobre a gesto atual da reitoria possa ser relativamente homognea dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para obter uma amostra global de tamanho n = 15. A Tabela 4 mostra as relaes de proporcionalidade.
Tabela 4. Relaes de proporcionalidade. Estrato Professores Servidores Alunos Proporo na populao Tamanho do subgrupo na amostra
Para selecionar aleatoriamente um professor, podemos usar a tabela de nmeros aleatrios, tomando valores com dois algarismos. Usando a primeira linha, encontramos o seguinte professor selecionado: {P16}. Para o servidor, usando a segunda linha da tabela, temos: {S39}. Para os alunos, precisamos extrair nmeros de trs algarismos. Usando a terceira linha da tabela, temos: {A047, A539, A201, A416, A056, A381, A563, A252, A213, A258, A235, A184, A339}. A amostra {P16, S39, A047, A539, A201, A416, A056, A381, A563, A252, A213, A258, A235, A184, A339} uma amostra estratificada proporcional da comunidade da universidade. Cada indivduo desta amostra dever ser pesquisado para se obter a opinio em relao gesto atual da reitoria.
20
famlias, bairros etc.). Alguns dos conglomerados so selecionados segundo a AAS, e todos os indivduos nos conglomerados selecionados so observados. Em geral, menos eficiente que a AAS ou AE, mas, por outro lado, bem mais econmica. Tal procedimento amostral adequado quando possvel dividir a populao em um grande nmero de pequenas subpopulaes.
A AC tem as seguintes caractersticas: dentro de cada conglomerado h uma grande heterogeneidade (grande variabilidade); entre os conglomerados h uma pequena variabilidade (grande homogeneidade).
Exemplo 5. Realizao de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais.
Usando a tcnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas:
5 3 Zona 1 6 7 4 8 10 9 11
12
fcil confundir amostragem estratificada com amostragem por conglomerado porque ambas envolvem a formao de subgrupos. A diferena que a amostragem por conglomerado usa todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa uma amostra de membros de todos os estratos.
21
2.6 Exerccios
1. Refaa o Exemplo 4, considerando agora n = 50 indivduos. Encontre todos os professores,
BOVESPA est interessado em fazer uma pesquisa nos preos das aes, para indicar aos seus clientes se hoje um dia favorvel a fazer investimentos. Ele sabe que existe N = 500 aes em venda. Como o tempo de estudo de cada ao de aproximadamente 10 minutos, decidiuse verificar apenas n = 25 aes. Utilizando-se as tcnicas de amostragem aleatria simples e sistemtica, quais aes sero selecionadas?
3. Um depsito em uma determinada empresa produtora de materiais eletrnicos possui N =
100 computadores que esto separados em duas qualidades: N1 = 40 computadores Pentium 3 e N2 = 60 computadores Pentium 4. O custo para verificar se cada computador est sob controle muito alto. O administrador responsvel disse que a empresa tem condies de verificar apenas n = 12 computadores. Utilizando-se a tcnica de amostragem estratificada proporcional no primeiro estgio e a AAS no segundo estgio, quais computadores devem ser selecionados?
4. Uma cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa
eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que esto dentro dessas zonas eleitorais, isto , foi utilizada amostragem por conglomerado. Apresente quais sero as 15 zonas eleitorais amostradas.
22
UNIDADE II
EXPLORAO DE DADOS
Objetivos
Ao final desta unidade, voc dever ser capaz de 1. Organizar dados em tabelas de freqncias e tabelas de classes de freqncias. 2. Construir grficos para variveis qualitativas e quantitativas. 3. Calcular e interpretar medidas de posio. 4. Calcular e interpretar medidas de disperso.
23
24
fundamental, mdio e superior. A Tabela 5 mostra uma maneira de representarmos mais resumidamente os dados da Tabela 1.
Tabela 5. Freqncias e porcentagens da varivel grau de instruo para os 25 funcionrios. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)
8 7 10 25
Interpretao da Tabela 5. Nota-se que, dos 25 empregados, 33% tem nvel fundamental,
categoria da varivel. A notao fi = ni/n para indicar a proporo (ou freqncia relativa) de
25
As propores (ou porcentagens) so muito teis quando necessitamos comparar resultados de duas pesquisas distintas. O prximo exemplo ilustra este fato.
Exemplo 7. Suponha que se queira comparar a varivel grau de instruo dos empregados
que fizeram o curso com a mesma varivel para todos os empregados da Companhia MD. Digamos que a empresa tenha 2000 empregados e que a distribuio de freqncias seja a da Tabela 6.
Tabela 6. Distribuio de freqncias dos 2000 empregados segundo o grau de instruo. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)
das freqncias (ni) das duas tabelas, pois os totais de empregados so diferentes nos dois casos (n = 25 e n = 2000). Mas as colunas da proporo e da porcentagem so comparveis, pois reduzimos a um mesmo total. Nesse caso, podemos dizer que a distribuio da varivel
grau de instruo dos funcionrios que fizeram o curso no se diferencia da distribuio dessa
26
Soluo: Agrupar os dados por faixas de notas. Assim, construmos a chamada tabela de
classes de freqncias.
Tabela 7. Freqncias e porcentagens das notas em redao. Classe de notas Freqncia Porcentagem
6 |- 7 7 |- 8 8 |- 9 9 |- 10
Total
2 9 12 2 25
8 36 48 8 100
Procedendo-se desse modo, ao resumir os dados referentes a uma varivel quantitativa, perdese alguma informao. Por exemplo, no sabemos quais so as doze notas da classe de 8 a 9, a no ser que investiguemos a tabela original. Sem perda de muita preciso, poderamos supor que todas as doze notas daquela classe fossem iguais ao ponto mdio da referida classe, isto , 8,5.
A escolha dos intervalos arbitrria. A familiaridade do pesquisador com os dados que lhe indicar quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um nmero pequeno de classes, perde-se informao, e com um nmero grande de classes, o objetivo de resumir os dados fica prejudicado. Normalmente, sugere-se o uso de 4 a 8 classes com a mesma amplitude.
27
variveis qualitativas. Aqui sero ilustrados os dois mais simples e freqentemente utilizados: grficos de barras e de composio em setores (pizza).
Grfico de barras
O grfico de barras consiste em construir retngulos ou barras, em que uma das dimenses proporcional magnitude a ser representada (ni), sendo a outra arbitrria, porm igual para todas as barras. Essas barras so dispostas paralelamente uma s outras, horizontalmente ou verticalmente. No exemplo a seguir temos o grfico de barras (verticais) para a varivel grau
de instruo da Tabela 6.
45
40
42,5
35
30
32,5
Porcentagem
25
25
20
15
10
Fundamental
Superior
O grfico de composio em setores (pizza) destina-se a representar a composio, usualmente em porcentagem, de partes de um todo. Consiste num crculo de raio arbitrrio, representando o todo, dividido em setores, que correspondem s partes de maneira proporcional. A Figura 3 ilustra esse grfico para a varivel grau de instruo.
28
Superior 42%
Fundamental 33%
Mdio 25%
Grfico de barras
O grfico de barras para as variveis quantitativas construdo da mesma forma que o das variveis qualitativas. Como ilustrao, considere a varivel nmero de filhos dos 25 empregados da Companhia MD. A Tabela 8 apresenta esses dados.
Tabela 8. Freqncias e porcentagens da varivel nmero de filhos. N de Filhos Freqncia (ni) Porcentagem (100 x fi)
5 9 6 4 1 25
20 36 24 16 4 100
29
40
35
36
30
Porcentagem
25
24
20
20 16
15
10
4
0
3 Nmeros de Filhos
Quando os dados consistem em um pequeno conjunto de nmeros, estes podem ser representados traando-se uma reta com uma escala que abranja todas as mensuraes observadas e grafando-se as respectivas freqncias como pontos acima da reta. Por esse motivo, tambm conhecido como grfico de pontos.
Exemplo 9. Considere a varivel tempo, em segundos, entre carros que passam por um
7 Tempo
10
11
30
Histograma
O histograma consiste em retngulos contguos com base nas faixas de valores da varivel e com rea igual freqncia relativa (fi) da respectiva faixa. Desta forma, a altura de cada retngulo denominada densidade de freqncia definida pelo quociente da rea pela amplitude da faixa, ou seja, fi/ai, com ai indicando a amplitude da i-sima classe. Com essa conveno, a rea total do histograma ser 1 (um).
0,4 Densidade
36 %
0,3
0,2
0,1
8%
8%
0,0
8 Notas em Redao
10
Grfico de linhas
um grfico muito importante utilizado para representar observaes feitas ao longo do tempo, em intervalos iguais ou no. Tais conjuntos de dados constituem as chamadas sries histricas ou sries temporais. Traduzem o comportamento de um fenmeno em certo intervalo de tempo.
Exemplo 11. Considere a dvida externa do Brasil (em milhes de dlares) no perodo de 1956
31
Fonte: IPEADATA
250000
200000
150000
100000
50000
0 1956 1960 1964 1968 1972 1976 1980 Ano 1984 1988 1992 1996 2000 2004
32
1.5 Exerccios
1. Os dados a seguir referem-se aos conceitos obtidos de 60 alunos, na disciplina de
R: Ruim M B B R M B M M M R B M B B O R M
M: Mdio B R B M M M R M R B B
B: Bom B M B M M M M R B M B R B M B
O: timo R B B B M O B B B R M O
M M M M M
2. A partir da Tabela 1, construa a. a distribuio de freqncias da varivel conceito em metodologia, com as freqncias
3. Faa o grfico de linhas para os dados fornecidos na sua conta de luz durante o ltimo ano,
33
a) 2, 5, 2, 7, 8 b) 3, 4, 2, 2, 4, 5 c) 1, 2, 3, 4, 5
Neste caso a moda = 2. As modas so 2 e 4. Dizemos que o conjunto bimodal. O conjunto no apresenta moda, sendo chamado de conjunto amodal.
Podemos calcular o mnimo, mximo e moda se os dados esto agrupados em tabelas de freqncias. Considere o prximo exemplo.
Exemplo 14. Uma empresa de segurana deseja estudar qual o nmero de ligaes a cobrar
mais freqentes que so recebidas em um determinado bairro de classe alta da cidade de So Paulo no ms de maro. Foram selecionadas 30 residncias e observado o nmero de ligaes
a cobrar em cada residncia. O resultado se encontra na Tabela 11.
34
Tabela 11. Distribuio de freqncia do nmero de ligaes a cobrar. Nmero de ligaes a cobrar Nmero de residncias (ni)
0 1 2 3
Total
2 5 15 8 30
A moda 2 ligaes a cobrar, pois foi o nmero que ocorreu com maior freqncia. O valor mnimo foi zero e o valor mximo da varivel foi 3.
A mdia aritmtica a soma das observaes divididas pelo nmero delas. De forma mais formal, considere n observaes de um conjunto de dados representados por x1, x2,..., xn. A mdia deste conjunto obtida pela soma das n observaes divididas por n, ou seja, x + x2 + x3 +L + xn = x= 1 n
n
x
i =1
(4.1)
Podemos adaptar a frmula (4.1) para o caso de dados agrupados em tabelas de freqncia. Neste caso, a mdia calculada levando-se em conta as freqncias de cada valor da varivel, da seguinte forma:
35
x=
x n
i =1 i
(4.2)
onde v a quantidade de resultados que a varivel contm e ni a respectiva freqncia da isima classe. Assim, para o Exemplo 14, temos
n
x=
x n
i =1 i
Portanto, o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe alta da cidade de So Paulo no ms de maro 2.
A mediana o valor que ocupa a posio central da srie de observaes, quando esto ordenadas em ordem crescente.
Assim, se as cinco observaes de uma varivel forem 3, 4, 7, 8 e 8, a mediana o valor 7, correspondente terceira observao. Quando o nmero de observaes for par, usa-se como mediana a mdia aritmtica das duas observaes centrais. Acrescendo-se o valor 9 srie acima, a mediana ser (7 + 8)/2 = 7,5.
Vamos formalizar o conceito da mediana. Considere que x1, x2, ..., xn so os n valores (distintos ou no) da varivel X. Considerando as observaes ordenadas em ordem crescente, podemos denotar a menor observao por x(1), a segunda por x(2), e assim por diante, obtendose x(1) x(2) ... x(n-1) x(n) x(1) = -2, x(2) = 1, x(3) = 3, x(4) = 3 e x(5) = 6. As observaes ordenadas como em (4.3) so chamadas estatsticas de ordem. (4.3) Por exemplo, se x1 = 3, x2 = -2, x3 = 6, x4 = 1 e x5 = 3, ento -2 1 3 3 6, de modo que
36
x n +1 2 med(x) = x n + x n +1 2 2 2
se n impar se n par
Nota: A mediana depende da posio e no dos valores dos elementos na srie ordenada. Essa
uma diferena marcante entre mediana e mdia, pois a mdia se deixa influenciar, e muito, pelos valores extremos. Vejamos: Na srie: 5, 7, 10, 13, 15 Na srie: 5, 7, 10, 13, 65 Mdia = 10 e Mediana = 10; Mdia = 20 e Mediana = 10,
isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma.
Quando os dados esto agrupados em tabelas de freqncias, o mtodo mais prtico para calcular a mediana adicionar uma coluna tabela contendo a freqncia acumulada. Vejamos um exemplo.
F3 = n 1 + n 2 + n 3 e finalmente, F4 = n 1 + n 2 + n 3 + n 4 = n .
Como o rol par, pois n = 30, a mediana ser a mdia dos valores que esto nas posies 15 e 16. Ambos os valores que esto nestas posies so 2 ligaes a cobrar recebida por residncia, pois F3 a primeira freqncia acumulada que contm os elementos da 15 e 16 posies.
37
Tabela 12. Freqncia absoluta e acumulada do nmero de ligaes a cobrar. Nmero de ligaes a cobrar Nmero de Residncias (ni) Freq. Acumulada (Fi)
0 1 2 3
Total
2 5 15 8 30
2 7 22 30
Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Portanto, precisamos de 3 quartis (Q1, Q2 e Q3) para dividir a srie em quatro partes iguais. Note que o quartil 2 (Q2) por definio a prpria mediana da srie. O mtodo mais prtico para calcular os quartis utilizar o princpio do clculo da mediana para os 3 quartis. Na realidade sero calculadas 3 medianas em uma mesma srie.
Exemplo 17. Cosidere a seguinte srie de dados: 5, 2, 6, 9, 10, 13, 15. Ordenando a srie,
temos: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie acima em duas partes iguais 9. Logo a mediana 9 = Q2. Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais proporcionados pela mediana. Para o clculo do quartil 1 (Q1) e quartil 3 (Q3) basta calcular as medianas de cada um desses grupos. Assim, em {2, 5, 6}, a mediana 5 = Q1. Em {10, 13, 15} a mediana 13 = Q3.
38
Seguindo o mesmo principio dos quartis (que divide em quatro partes a srie de dados) e levando em conta o aumento do nmero de informaes disponveis, podemos dividir a srie de dados em 10 partes ou 100 partes. Quando dividimos em 10 partes, obtemos os decis (D1, D2,..., D9) e em 100 partes obtemos os percentis (P1, P2,..., P99). Como ilustrao, o decil D6 representa o valor que deixa 60% das informaes a sua esquerda e, conseqentemente, 40% a sua direita. De forma anloga, o percentil P74 representa o valor que deixa 74% das observaes a sua esquerda e 26% a sua direita.
Exemplo 18. Para preencher uma nica vaga existente em uma empresa, 50 candidatos foram
submetidos a 6 provas de mesma importncia sobre conhecimentos especficos de interesse da empresa. Trs destes candidatos destacaram-se com as notas descritas na Tabela 13.
A B C
Que candidato escolher? Por um critrio inicial poderia ser escolhido aquele com a maior mdia, mas todos tm mesma mdia, ou seja, 8. De modo anlogo, nem adianta pensar em
39
moda ou mediana, pois tambm essas medidas so iguais a 8, para todos os candidatos.
Uma possvel soluo seria adotar um segundo critrio: escolher o candidato que apresentou notas mais homogneas, isto , aquele que apresentou menor disperso das notas. Poderamos inicialmente calcular a amplitude, que definida pelo intervalo entre o valor mximo e o valor mnimo da srie de dados, ou seja, A = mx min. Assim, teramos as seguintes amplitudes: 2, 4 e 1, respectivamente para os candidatos A, B e C. Apesar de fcil de calcular, a amplitude tem a desvantagem de levar em conta apenas dois valores, desprezando todos os outros.
Uma medida de disperso mais rica obtida quando consideramos a soma dos quadrados dos desvios em relao mdia. Essa medida chamada de varincia, sendo denotada por s2 e definida por (x x) 2 + (x 2 x) 2 + (x 3 x) 2 + L + (x n x) 2 = s2 = 1 n 1 A varincia mede a disperso dos dados em torno de sua mdia.
(x
i =1
x) 2 (4.4)
n 1
A raiz quadrada positiva da varincia chamada de desvio padro (representado por s):
s=
(x
i =1
x) 2
(4.5)
n 1
Note que a unidade de medida do desvio padro a mesma dos dados originais, sendo assim interpretvel, enquanto que a varincia fornece uma unidade de medida elevada ao quadrado. O clculo do desvio padro exige o clculo da varincia.
Exemplo 19. A varincia e o desvio padro para o candidato A do Exemplo 18 fica
s2 = A (7 8) 2 + (7,5 8) 2 + (8 8) 2 + (8 8) 2 + (8,5 8) 2 + (9 8) 2 2,5 = = 0,5 6 1 5 s A = 0,5 0,7
40
s2 =
1 n 2 2 x i n ( x ) n 1 i =1
(4.6)
A frmula (4.6) obtida atravs de algumas manipulaes algbricas na frmula (4.4). Esta tem a facilidade de apenas necessitar da informao da mdia ( x ) e da soma dos valores ao quadrado da varivel
n i =1
xi .
Karl Pearson
Um pouco de histria
A primeira utilizao do termo desvio padro ocorreu em 1894, sendo devido Karl Pearson.
2.5 Exerccios
1. Os tempos de sobrevivncia (em meses) de um tipo de bateria esto listados a seguir.
5, 21, 21, 23, 23, 25, 27, 29, 30, 31, 32, 32, 32, 34, 35, 36, 38, 38, 38, 42, 43, 44, 60.
a. Calcule a mdia e mediana. Comente os resultados. b. Calcule o valor mnimo, Q1, Q2, Q3 e mximo. Interprete estas 5 estatsticas. c. Calcule a varincia e desvio padro. Comente.
41
investimento em educao, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram obtidos os valores (codificados) da tabela abaixo:
Cidade Investimento
20
16
14
19
15
14
16
19
18
a. Calcule a mdia das observaes. b. Recebero um programa especial as cidades com valores de investimento inferiores mdia
mdia original menos dois desvios padro e a mdia original mais dois desvios padro. Calcule o investimento bsico e compare com a mdia obtida no item a. Justifique a diferena encontrada.
42
UNIDADE III
PROBABILIDADE
Objetivos
Ao final desta unidade, voc dever ser capaz de 1. Relacionar experimentos aleatrios com espaos amostrais. 2. Construir novos eventos a partir das operaes elementares de eventos. 3. Calcular probabilidade a partir de eventos condicionais. 4. Calcular probabilidade a partir de eventos independentes.
43
44
Exemplo 20. Os quatro itens a seguir ilustram experimentos aleatrios, pois no sabemos,
a. Jogar uma moeda duas vezes e observar a seqncia obtida de caras e coroas.
aleatrio.
Todo experimento aleatrio tem associado um espao amostral. O Exemplo 21 ilustra esse fato.
45
Experimento aleatrio
a. Jogar um dado e observar o resultado
Espao amostral
= {1, 2, 3, 4, 5, 6}
b. Lanar uma moeda duas vezes e observar as faces = {CC,CK,KC,KK}, com C = Cara obtidas e K = Coroa c. Dois dados so lanados simultaneamente e = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} estamos interessados na soma das faces observadas
46
O evento interseo de A e B, denotado por AB, o evento em que A e B ocorrem simultaneamente. O evento unio de A e B, denotado por AB, o evento em que A ocorre ou B ocorre (ou ambos).
c
A B
A B
Exemplo 23. Operaes com eventos. Seja = {1, 2, 3, 4, 5, 6}. Considere os seguintes
eventos: A = {2, 4, 6}, B = {4, 5, 6} e C = {1, 3, 5}. Os eventos a seguir ficam assim: A B = {4, 6} A B = {2, 4, 5, 6} AC= A Bc = {1, 2, 3, 4, 6}
Eventos disjuntos
Dois eventos A e B so mutuamente exclusivos ou disjuntos se eles no podem ocorrer simultaneamente (A B = ).
Aps essas quatro definies, acreditamos que o leitor esteja preparado para aprender a calcular probabilidades. Sugerimos assim, que faa os dois primeiros exerccios da seo 1.4 antes de prosseguir.
47
Clculo das Probabilidades. Em 1656, Huygens (1629-1695) publica o primeiro Tratado de Probabilidade.
Fermat
Pascal
Huygens
No entanto, fcil perceber que o termo probabilidade j est enraizado no senso comum, pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais como situaes de sua vida pessoal; organizando-se em relao a horrios a cumprir, levando em conta as circunstncias do trfego; agasalhando-se ao sair de casa se a previso do tempo indicar uma frente fria. Em resumo, prevenindo-se em situaes de risco.
48
O primeiro devido a Laplace e o mais conhecido, pois relaciona eventos favorveis com eventos possveis. O segundo consiste em repetir um experimento vrias vezes. O terceiro baseado na opinio pessoal, e o ltimo devido a Kolmogorov e baseia-se no princpio de que qualquer experimento pode ser modelado.
Mtodo Clssico
Consideremos o caso em que se joga um dado repetidas vezes. O dado tem seis faces: 1, 2, 3, 4, 5, 6. Se o dado homogneo, equilibrado, jogando-o uma vez no h razo para dizermos que determinada face tenha preferncia sobre as outras. Todos os seis resultados so igualmente possveis. Ento a probabilidade de aparecer a face 3, por exemplo, de 1/6. O evento que nos interessa consiste em um elemento, e o espao amostral tem seis elementos.
P(A) =
(5.1)
Exemplo 25. No lanamento de uma moeda equilibrada, qual a probabilidade de aparecer uma
Cara? O espao amostral associado = {Cara, Coroa}. Pela definio clssica, a probabilidade de ocorrncia do evento A = {Cara} P(A) = 1/2. Note que o nmero de elementos em 2 e o nmero de elementos em A 1.
Mtodo Freqentista
A definio clssica de probabilidade s se aplica a espaos amostrais em que os eventos simples so igualmente possveis. Esse o caso da maioria das aplicaes de probabilidades aos jogos de azar, rea que, precisamente, suscitou os primeiros problemas prticos resolvidos pela teoria das probabilidades. Esses mesmos jogos, entretanto, repetidos inmeras vezes, levaram a considerar a probabilidade de um evento como a freqncia relativa, ou seja, como a proporo de vezes que um evento ocorre em uma srie suficientemente grande de realizaes
49
de um experimento, em condies idnticas. Surgiu ento uma nova definio de probabilidade, a definio freqentista.
P( A ) =
(5.2)
Mtodo Subjetivo Definio 5.3. Cada indivduo, baseado em informaes anteriores e em sua opinio a respeito
de um evento em questo, pode ter uma resposta para a probabilidade deste evento.
Exemplo 26. Um mdico experiente consegue calcular uma probabilidade de o indivduo ter
uma determinada doena a partir dos sintomas que o indivduo apresenta. Note que outro mdico pode calcular uma probabilidade diferente para o mesmo indivduo. Da o carter subjetivo.
Mtodo Moderno
A definio clssica, freqentista e subjetiva de probabilidade, embora sejam bastante intuitivas e devendo, por isso, ser sempre lembradas, no so definies matematicamente aceitveis de probabilidade. Por exemplo, no caso da definio freqentista, como saber se, medida que o nmero de repeties de um experimento cresce, a freqncia relativa converge para um nmero. Alm das dificuldades com o limite, existem muitas situaes em que necessrio o uso de probabilidades, e, no entanto, no nem possvel nem intuitivo pensar em repeties.
A soluo moderna consiste em axiomatizar algumas relaes intuitivas e construir, a partir delas, toda a teoria de probabilidades, a exemplo do que se faz no estudo da geometria euclidiana.
50
Definio 5.4. Probabilidade uma funo P() , que associa a cada evento do espao amostral
, um nmero real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:
Axioma 1. 0 P(A) 1. Axioma 2. P() = 1. Axioma 3. Se A e B so eventos mutuamente exclusivos: P(AB) = P(A) + P(B).
A partir desses axiomas, podemos demonstrar as seguintes propriedades:
P1: P() = 0, onde o conjunto vazio. P2: Seja Ac o evento complementar de A, ento P(Ac) = 1 P(A). P3: Se A e B forem dois eventos quaisquer, ento P(A B) = P(A) + P(B) P(A B). P4: Se A B, ento P(A) P(B).
Exemplo 27. Seguem alguns exemplos de funes j descobertas na literatura para calcular
probabilidades, que sero discutidas em detalhes nas prximas sees.
Distribuio
Bernoulli
Funo de probabilidades
P(X = x ) = p x (1 p )
1 x
, x = 0, 1
Binomial
Hipergeomtrica
Poisson
P(X = x ) = f (x) =
e x , x = 0, 1, ... x!
Uniforme
1 ,<x<
1 22
Normal
f (x) =
1 2
( x )2
, - < x< +
51
1.4 Exerccios
1. Determine o espao amostral dos seguintes experimentos: a. Lanar 2 dados e observar as faces superiores; b. Lanar 2 dados e observar a soma das faces superiores; c. Uma urna contm 10 bolas azuis e 10 brancas. 3 bolas so retiradas ao acaso e as cores so
anotadas;
d. Uma moeda lanada consecutivamente at o aparecimento da 1 cara; e. Uma mquina produz 20 peas por hora. Ao final da primeira hora de produo, observa-se
o n de defeituosas;
f. Medio do tempo de vida de uma lmpada antes de se queimar: 2. Considere o seguinte espao amostral: = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. Defina os eventos:
3. Atividade Prtica do lanamento da moeda. Passo 1 Arrume um parceiro e tomem uma moeda chamem o valor numrico da moeda de
COROA (K ) e a outra face de CARA (C). Suponham que haja interesse em saber se a sua moeda honesta (isto significa saber se a probabilidade de CARA de sua moeda 1/2 ou, em termos percentuais, se a chance de sair Cara 50%).
52
Passo 2 Um membro do grupo vai lanar a moeda e o outro vai marcar os resultados na
planilha anexa, seguindo as seguintes instrues: a) Jogar a moeda uma vez e anotar C ou K no espao adequado (linha 2) da planilha. b) Repetir este procedimento 30 vezes, preenchendo um a um todos os espaos da linha 2.
Passo 3 Continuando com a planilha, trocar de lugar com o parceiro, voltar para os itens a) e
c) Depois do registro na linha 2 de todos os resultados como C ou K, passar para a linha 3: chamar CARA de 1 e COROA de 0 e colocar estes valores na planilha, abaixo de cada resultado j obtido na linha 2. Cada membro do grupo deve fazer metade um faz a linha de cima e o outro a linha de baixo.
d) Agora a linha 4 da planilha deve ser preenchida em cada posio deve ser colocado o nmero acumulado de CARAS, at aquela jogada (verifique que a jogada est explicitada na linha 1- que a linha n). Discutir com outro membro do grupo para ver se est claro se no, pergunte! A linha de baixo continuao do acumulado da linha de cima.
e) Finalmente chegamos ltima linha linha 5: colocar a freqncia relativa (m/n) de CARAS em cada momento o que isso? Discuta com o outro membro do grupo (desprezar
as entradas assinaladas com X).
1) 2) 3) 4) 5) Jogada(n) C ou K 1 ou 0 Caras Acumuladas (m) Frequncia Relativa (m/n) 1 2 3 4 5 6 7 8 9 10 12 14 17 20 25 30
1) 2) 3) 4) 5)
31 32 33
40
47
50
55
60
53
linhas 4 e 5 da planilha:
n m/n Passo 6 Completar o grfico, usando os valores da tabela recm-construda, do seguinte
10
20
30
40
50
60
seja, probabilidade o valor em que a freqncia relativa se estabiliza aps um nmero muito grande de ensaios.
54
B representada por P(A | B) e definida por P(A | B) = P(A B) , P(B) P(B) > 0 (6.1)
P(A B) = P(B)P(A | B)
(6.2)
Exemplo 28. Um grupo de pessoas foi classificado quanto a peso e presso arterial, de acordo
55
a. Qual a probabilidade de uma pessoa escolhida ao acaso nesse grupo ter presso alta? b. Se se verifica que a pessoa escolhida tem excesso de peso, qual a probabilidade de ela ter
Soluo: a. Como a pessoa escolhida ao acaso em um grupo em que 20% tem presso alta, chamando
P(A | B) =
O que fizemos foi precisamente estabelecer a probabilidade condicional de A dado B, P(A|B), a partir de P(A B) = 0,10 e P(B) = 0,25.
Exemplo 29. Joaninha tem probabilidade de 0,8 de passar no vestibular, enquanto que
Joozinho tem probabilidade 0,6. Qual a probabilidade de ambos passarem no vestibular? Qual a suposio a ser feita nesse caso para calcular a probabilidade?
vestibular. Supondo independncia entre os eventos A e B, temos que a probabilidade de ambos passarem no vestibular P(AB) = 0,8 x 0,6 = 0,48.
56
B2 B1 B3
B5
B4
Vamos supor que o evento A possa ocorrer juntamente com um e s um dos n eventos mutuamente exclusivos B1, B2,..., Bn. Em outras palavras vamos assumir que A = (A B1) (A B2) ... (A Bn), (6.4) onde os eventos A Bi e A Bj (com subscritos distintos i e j) so mutuamente exclusivos.
Aplicando a funo probabilidade em ambos os lados de (6.4) temos que P(A) = P[(A B1) (A B2) ... (A Bn)]. (6.5)
Utilizando a regra de adio em (6.5) obtemos que P(A) = P(A B1) + P(A B2) + ... + P(A Bn) (6.6)
(6.7)
57
Exemplo 30. Uma mineradora explora trs minas denominadas B1, B2 e B3. A partir de
pesquisas anteriores, sabe-se que a probabilidade de encontrar ouro na mina B1 0,1, na mina B2 0,05 e na mina B3 0,2. Alm disso, essa mineradora tem explorado as minas B1, B2 e B3 nas propores 0,3, 0,2 e 0,5, respectivamente. Qual a probabilidade de a mineradora encontrar ouro?
Soluo: Seja A = {encontrar ouro} e Bj = {explorando a j-sima mina j}. Pela regra da
probabilidade total temos P(A) = P(A | B1 ) P(B1 ) + P(A | B 2 ) P(B 2 ) + P(A | B 3 ) P(B 3 )
dado por
P(B i | A) = P( A | B i ) P( B i )
P(A | B )P(B )
i =1 i i
O teorema de Bayes uma generalizao da probabilidade condicional no caso de mais de dois eventos.
Exemplo 31. Considere novamente o Exemplo 30. Sabendo-se que a mineradora encontrou
ouro, qual a probabilidade de que tenha sido na mina B3?
58
P( A | B ) P( B )
i =1 i i
2.5 Exerccios
1. O campo da Engenharia da confiabilidade se desenvolveu rapidamente a partir do incio da
dcada de 1960. Um tipo de problema encontrado o de se estimar a confiabilidade de um sistema a partir das confiabilidades dos subsistemas. A confiabilidade definida aqui como a probabilidade do funcionamento apropriado durante um certo perodo de tempo. Considere a estrutura de um sistema em srie simples, como o da figura a seguir:
Subsistema 1
Subsistema 2
O sistema funciona se, e somente se, o subsistema 1 e o subsistema 2 funcionarem. Se os subsistemas sobrevivem independentemente, a confiabilidade do subsistema 1 de 0,90 e do subsistema 2 de 0,80, qual a confiabilidade do sistema?
Mquina Percentual de Produo Percentual de Defeituosos Produzidos 1 15 4 2 30 3 3 20 5 4 35 2 As mquinas 2 e 4 so mais novas e, assim, a maior parte da produo foi atribuda a
elas. Suponha que o estoque atual reflita as porcentagens de produo indicadas.
59
60
UNIDADE IV
DISTRIBUIES DE PROBABILIDADES
Objetivos
Ao final desta unidade, voc dever ser capaz de 1. Associar variveis aleatrias discretas com modelos probabilsticos. 2. Calcular probabilidades a partir do modelo Binomial, Hipergeomtrico e de Poisson. 3. Associar variveis aleatrias contnuas com modelos probabilsticos. 4. Calcular probabilidades a partir das distribuies Uniforme e Normal.
61
62
Exemplo 32. Observa-se o sexo das crianas em famlias com trs filhos. O espao amostral
= {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)} Uma v.a. de interesse X = {n. de crianas do sexo masculino}. A cada evento simples ou ponto de , associamos um nmero, que o valor assumido pela v.a. X:
Evento X
MMM 3
MMF 2
MFM 2
FMM 2
MFF 1
FMF 1
FFM 1
FFF 0
Poderamos tambm ter considerado o nmero de crianas do sexo feminino. Os valores de X, na mesma ordem, seriam ento 0, 1, 1, 1, 2, 2, 2, 3.
O passo fundamental para entendermos uma v.a. associar a cada valor a sua probabilidade, obtendo assim a sua distribuio de probabilidade.
X P(X=x)
x1 P(X=x1)
x2 P(X=x2)
... ...
xn P(X=xn)
63
i =1
P(X = x i ) = 1 .
Espao Amostral
HHH
Probabilidade
Distribuio de Probabilidade
1 1 1 2 2 2 3
X P(X)
64
quadro a seguir d o nmero xi de aparelhos vendidos em uma semana e a respectiva probabilidade: Nmero xi Probabilidade P(X = xi) 0 0,1 1 0,1 2 0,2 3 0,3 4 0,2 5 0,1
Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma semana?
Soluo: Calculemos inicialmente E(X), que o nmero esperado de aparelhos vendidos em
uma semana: E(X) = (0)(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70. Para x unidades vendidas o lucro 20x. Logo, o lucro esperado de R$ 54,00.
Varincia
Assim como a mdia uma medida de posio de uma v.a., natural que procuremos uma medida de disperso dessa varivel em relao mdia. Essa medida a varincia, a ser representada por 2 e definida por 2 = Var (X) = E[X E (X)] 2 = ( x i E (X)) 2 P(X = x i )
i =1 n
65
Desenvolvendo o termo quadrtico do somatrio, obtemos uma expresso mais fcil de calcular a varincia dada por 2 = Var (X) = E(X 2 ) [E (X)]2 , onde E (X 2 ) = x i2 P(X = x i ) .
i =1 n
Desvio Padro
O desvio padro () a raiz quadrada positiva da varincia. Tem sobre esse ltimo a vantagem de exprimir a disperso na mesma unidade de medida da v.a. = 2
66
Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas do tipo sucesso-fracasso. Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma v.a. com distribuio Bernoulli.
uma v.a. X que assume apenas dois valores: 1 se ocorrer sucesso, e 0 se ocorrer fracasso, sendo p a probabilidade de sucesso, 0 < p < 1.
Denotamos por X ~ Bernoulli (p) uma v.a. com distribuio de Bernoulli com parmetro p, se 1, X= 0, se ocorrer " sucesso" se ocorrer " fracasso" com funo de probabilidade,
1 x
P(X = x ) = p x (1 p )
Da segue que E(X) = p e
, x = 0, 1
Var(X) = 1-p
A v.a. X, correspondente ao nmero de sucessos num experimento binomial, tem distribuio binomial com parmetros n e p, com funo de probabilidade dada por n P(X = x ) = p x (1 p) n x , x x = 0,1,K, n ,
67
Usamos a seguinte notao: X ~ B(n; p). A mdia e a varincia so dadas, respectivamente, por E(X) = np e Var(X) = np(1-p)
Exemplo 35. Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10
Considere um conjunto de N objetos dos quais (r) so do tipo I e (N r) so do tipo II. Um sorteio de n objetos (n < N) feito ao acaso e sem reposio. A varivel aleatria discreta X que igual ao nmero de objetos do tipo I selecionados nesse sorteio tem distribuio hipergeomtrica.
68
Os valores possveis de X vo de 0 a min(r, n), uma vez que no podemos ter mais do que o nmero de objetos existentes do tipo I, nem mais que o total de sorteados. Sua funo de probabilidade dada por r N r P(X = x ) = x n x N , 0 x mnimo(r, n). n
Usamos a seguinte notao: X ~ Hipergeomtrica (N; n; r). A esperana e varincia so dadas por E(X) = np onde p = r/N.
Exemplo 36. Uma fbrica produz peas que so embaladas em caixas com 40 unidades. Para
Var(X) = np(1-p)(N-n)/(N-1),
aceitar o lote de caixas enviado por essa fbrica, o controle de qualidade de uma empresa sorteia uma caixa do lote e sorteia 10 peas, sem reposio, dessa mesma caixa. Se houver alguma pea defeituosa, o lote inteiro devolvido. Se a caixa sorteada tiver 4 peas defeituosas, qual a probabilidade de o lote no ser devolvido?
Soluo:
N = 40, n = 10 e r = 4.
4 40 4 P(X = 0) = 0 10 0
69
n de clientes por hora; n de chamadas telefnicas recebidas por minuto. Note-se que a unidade de medida (tempo, rea) contnua, mas a varivel aleatria de interesse (nmero de ocorrncia) discreta. Alm disso, as falhas no so contveis. No possvel contar os acidentes que no ocorreram, nem o nmero de defeitos por centmetros quadrados que no ocorreram. O limite inferior do nmero de ocorrncias, em todas as situaes dos exemplos, zero, enquanto que o limite superior ao menos teoricamente infinito, muito embora, na maioria dos exemplos acima, seja difcil imaginar um nmero infinito de ocorrncias. As probabilidades, calculadas agora para todos os nmeros inteiros no negativos x = 0, 1, 2, ... so dadas da seguinte forma: P(X = x ) = e x , x = 0, 1, ..., x!
onde X = nmeros de sucessos em um intervalo a varivel de interesse, > 0 o nmero mdio de sucessos da varivel X e e a constante 2,7183 (base dos logaritmos naturais). Usamos a seguinte notao: X ~ P(). A esperana e varincia so dadas por E(X) = Var(X) =
Exemplo 37. Um departamento de conserto de mquinas recebe uma mdia de cinco
chamadas por hora. Supondo que a distribuio de Poisson seja adequada nessa situao, obter a probabilidade de que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente trs chamadas.
Soluo: Seja X: nmero de chamadas para conserto de mquinas em uma hora. O parmetro
70
1.4 Exerccios
1. A distribuio de X: n de crianas por domiclio numa determinada regio dada pela
tabela abaixo.
X P(X = x)
0 0,10
1 0,15
2 0,25
3 0,30
4 0,15
5 0,05
Calcule:
a. O nmero mdio de crianas por domiclio, X. b. O desvio padro de X, X. c. A probabilidade P{X - X X X + X}.
2. Sabe-se que 7% dos ratos machos de uma certa linhagem so portadores de um defeito
3. Numa central telefnica, o nmero de chamadas chega segundo uma distribuio Poisson,
com a mdia de oito chamadas por minuto. Determine qual a probabilidade de que num minuto se tenha(m)
a. duas ou mais chamadas; b. menos que duas chamadas; c. entre sete (inclusive) e nove (exclusive) chamadas.
71
Seja X uma varivel aleatria. Suponha que os possveis valores de X sejam um intervalo que possui infinitos valores; ento, dizemos que X uma varivel aleatria contnua.
Exemplo 38. Seguem alguns exemplos de variveis aleatrias contnuas. a. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real.
Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar qualquer nmero real positivo.
b. Em campanhas preventivas de hipertenso arterial comum, de tempos em tempos, medir-
se o nvel de colesterol. O valor de cada medida pode ser um nmero real no-negativo.
c. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete,
acendendo-a; observa-se a mesma at que se queime. O tempo de durao da lmpada um nmero real no negativo.
No Exemplo 38 o nmero observado em cada um dos experimentos aleatrios um nmero real e resulta em geral de uma medio: altura das mulheres; nvel de colesterol e tempo de durao da lmpada.
Uma varivel aleatria contnua assume seus possveis valores em um determinado intervalo. A pergunta que surge Como so atribudas probabilidades neste caso?.
72
Exemplo 39. Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas
aleatoriamente numa populao. O histograma por densidade desses valores apresentado na Figura 9.
0,05
0,04
Densidade
0,03
0,02
0,01
0,00
30
40
50
60
70 Peso
80
90
100
110
A anlise do histograma indica que a distribuio dos valores da varivel peso aproximadamente simtrica em torno de 70 kg; a maioria dos valores encontra-se no intervalo (50; 90); existe uma pequena proporo de valores abaixo de 50 kg e acima de 90 kg.
Seja X = {peso em kg} de uma pessoa adulta escolhida ao acaso da populao. Como se distribuem os valores da v.a. X, ou seja, qual a distribuio de probabilidades de X?
0,05
0,04
Densidade
0,03
0,02
0,01
0,00
30
40
50
60
70 Peso
80
90
100
110
73
A Figura 10 ilustra o histograma da varivel peso apresentado na Figura 9 com o ajuste de uma funo densidade, conhecida como distribuio normal.
Para as variveis contnuas, as probabilidades so atribudas por meio de uma funo cuja rea entre a funo e o eixo das abscissas (X) igual a um.
A rea hachurada na Figura 11 ilustra a probabilidade de a v.a. contnua X estar no intervalo [a, b], ou seja, P(a X b) = rea hachurada.
Esta funo f(x) denominada funo densidade de probabilidade (fdp) da varivel aleatria contnua X. A rea sob uma curva delimitada por dois valores a e b, como mostra a Figura 11 determinada calculando-se a integral definida entre a e b da densidade de probabilidade representada pela funo, isto ,
f (x )dx = P(a x b)
a
Exemplo 40. Um fabricante de televiso a cores oferece uma garantia de 1 ano para
substituio gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de anos), x, como uma varivel aleatria contnua com a seguinte fdp 1 x 4 e , x>0 . f (x ) = 4 0 x0
74
1 P( x 1) = e 4 dx 0,2 4 0
Funo Densidade de Probabilidade
Se X uma v.a. contnua, a funo densidade de probabilidade f(X), indicada abreviadamente por fdp, uma funo que satisfaz s seguintes condies:
a. f(X) 0, X;
+
f (x)dx = 1 ;
c. P(a X b) = rea sob a funo densidade de probabilidade f(x) e acima do eixo x entre os
x0
f (s)ds .
= x2, 0 x 1 x >1
75
E[X] =
xf (x )dx
1
Exemplo 42. Para uma varivel que tem densidade f(x) = 2x, 0 < x < 1, ento,
2 E[X] = x 2 x dx = 2 x dx = x 3 3 0 0
2
=
0
2 . 3
A varincia de uma varivel aleatria contnua definida por: Var(X) = E(X ) [E(X)] , onde E[X ] = x 2 f ( x ) dx .
2 2
2 0 1
Exemplo 43. Para uma varivel que tem densidade f(x) = 2x, 0 < x < 1, calcule a varincia de
2 do Exemplo 42. 3
2 Soluo: E[X ] = x 2x dx = 2x dx = x 4 4 0 0
2 2 3
=
0
76
de probabilidades. Abordaremos aqui, em carter mais intuitivo, a distribuio uniforme e a distribuio normal.
Uma v.a. X tem distribuio uniforme U(a , b) se sua funo densidade de probabilidade da forma 1 , a<x<b f (x ) = b a . 0, caso contrrio
E[X] =
a+b 2
Var[X] =
(b a ) 2 12
certa substncia pode ser considerado uma v.a. contnua distribuda uniformemente no intervalo [100, 125]. Qual a probabilidade de a substncia fundir-se entre 110 e 115?
Soluo: Neste caso, a = 100, b = 125 e b a = 25. A funo densidade fica
1 , 100 x 125 f ( x ) = 25 0, caso contrrio A probabilidade procurada 1 1 115 110 5 P(110 < X < 115) = dx = x = = = 0,2 25 25 110 25 25 110
115 115
77
f (x) =
1 2
2
1 x 2
, < x <
As principais caractersticas da distribuio normal so: A mdia da distribuio ; O desvio padro ; A moda e a mediana so iguais a ; A curva normal simtrica em torno da mdia ; Os pontos de inflexo so - e + ; A rea sob a curva e acima do eixo horizontal igual a 1. A v.a. Normal com mdia e varincia 2 denotada por N(, 2).
78
Curvas normais com mesmo desvio padro, mas com mdias diferentes.
1
Curvas normais com mesma mdia, mas com desvios padro diferentes.
2
_ _ _ N ( , 1 2 ) _ _ _ N ( , 2 2 ) _ _ _ N ( , 3 2 ) 1 2 < 2 2< 3 2
O clculo direto de probabilidades envolvendo a distribuio normal exige recursos de clculo infinitesimal e, mesmo assim, dada a forma da funo de densidade, no um processo elementar. Por isso, elas foram tabeladas, permitindo-nos obter diretamente o valor da probabilidade desejada. Notemos, entretanto, que a funo de densidade normal depende de dois parmetros, e , de modo que, se as probabilidades fossem tabeladas diretamente a partir dessa funo, seriam necessrias tabelas de dupla entrada, complicando-se consideravelmente. Recorre-se, por isso, a uma mudana de varivel, transformando a v.a. X na v.a. Z assim definida: Z= X .
Essa nova varivel chama-se varivel normal padronizada. Recebe esse nome, porque sua mdia 0 e seu desvio padro 1. Mediante tal transformao, basta construirmos uma nica
79
tabela, a da normal reduzida e, atravs dela, obteremos as probabilidades associadas a todas as distribuies N(, 2).
Note que essa transformao no altera a forma da distribuio, apenas refere-se a uma nova escala.
Assim, se quisermos calcular P(a < X < b) , sendo X ~ N(;2), podemos definir Z = calcular a seguinte probabilidade:
X e
f(z) a
z a 0 b Figura 12. Representao do clculo da P(a < X < b) via varivel normal padronizada Z.
De forma anloga, dada uma varivel padronizada Z ~ N (0;1), podemos obter a v.a. X ~ N(, 2 ) atravs da transformao inversa X = + Z.
80
A(z) = P(Z z) , z 0.
7 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 8 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 9 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 0.9999 1.0000
81
Exemplo 45. Se Z ~ N (0,1), ento: a. P(Z 1,71) = A(1,71) = 0,9564 b. P(0 < Z 1,71) = A(1,71) A(0)
Exemplo 46. Seja X = {gasto com lanche semanal}. Aps estudar esta varivel, vimos que
Soluo:
16 20 X 20 22 20 < < P(16 < X < 22) = P = P(0,5 < Z < 0,25) 8 8 8 = (A(0,25) A(0)) + (A(0,5) A(0)) = (0,5987 0,5) + (0,6915 0,5) = 0,2902
b. P(X<18 ou X>24)
Soluo:
X 20 24 20 X 20 18 20 P(X < 18 ou X > 24) = P(X < 18 ) + P(X > 24) = P > < + P 8 8 8 8 = P( Z < 0,25) + P( Z > 0,5) = (1 A(0,25)) + (1 A(0,5)) = (1 0,5987) + (1 0,6915) = 0,7098
82
Como encontrar o valor z da distribuio N(0,1) tal que rea acumulada at ele seja A(z) = 0.975.
Considere que X ~ N(, 2). Calcule k tal que P(X k) = 0,05. Neste caso temos que k X k k P ( X k ) = P = P Z = 0,05 A = 0,95 k = 1,64 k = + 1,64 Logo, o valor de k k = +1,64 .
Nota Importante: Para toda v.a. X ~ N( ; 2) temos 1. P( X + ) = P(1 Z 1) = 0,683 . 2. P( 2 X + 2) = P(2 Z 2) = 0,955 3. P( 3 X + 3) = P(3 Z 3) = 0,997
83
2.4 Exerccios
1. Se Z ~N(0,1), calcule: a. P(1,32 < Z 1,79) b. P(Z -1,3) c. P(-1,32 < Z < 0) d. P(Z 1,5) e. P(-1,5 Z 1,5) f. P( -2,3 < Z -1,49)
2. Encontre o valor z da distribuio N(0,1) tal que a. P(0 < Z z) = 0,4975 b. P(Z z) = 0,975 c. P(-z Z z) = 0,80 d. P(Z z) = 0,3 e. P(Z z) = 0,10
3. O dimetro de um cabo eltrico uma varivel aleatria com fdp dada por
do interior representada pela varivel y, modelada pela funo 8y 4 , 0,5 y 2 f (x) = 9 . 0, caso contrrio Qual a probabilidade de a quantia gasta ser inferior a 0,8 milhes de reais?
84
5. O tempo de sobrevivncia de uma bateria (em anos) pode ser modelado pela funo
6. O tempo gasto no exame vestibular de uma universidade tem distribuio Normal, com
100 minutos?
b. Qual deve ser o tempo de prova, de modo a permitir que 95% dos vestibulandos a terminem
no prazo estipulado?
c. Qual o intervalo central de tempo tal que 80% dos estudantes gaste para completar o exame?
85
86
Probabilidade e Estatstica
REFERNCIAS
BUSSAB, W. O.; MORETTIN, P.A. Estatstica Bsica. 5. ed. So Paulo: Saraiva, 2006. FARIAS, A. A.; SOARES, J. F.; CSAR, C. C. Introduo Estatstica. 2. ed. Rio de Janeiro: LTC, 2003. GNEDENKO, B. V. Ateoria da probabilidade. Rio de Janeiro: Cincia Moderna, 2008. JAMES, B. R. Probabilidade: um curso em nvel intermedirio. 2. ed. Rio de Janeiro: SBM, 1996. MAGALHES, M. N.; PEDROSO DE LIMA, A. C. Noes de Probabilidade e Estatstica. 6. ed. So Paulo: Edusp, 2007. ROSS, Sheldon. Afirst course in probability. 8. ed. Londres: Prentice Hall, 2005. TRIOLA, M. F. Introduo estatstica. 10. ed. Rio de Janeiro: LTC, 2008.
87