Escolar Documentos
Profissional Documentos
Cultura Documentos
ndice
1. Introduo Estatstica 1.1. 1.2. 1.3. 1.4. 2. O que Estatstica? Estatstica na Prtica Um pouco da histria da Estatstica Exerccios 1 1 1 2 2 3 3 3 5 6 6 6 6 6 7 8 9 10 11 11 12 13 14 15 15 15 15 16 18
ii
____/____/____
Variveis 2.1. 2.2. 2.3. Definio de Varivel Classificao das Variveis Exerccios
3.
Amostragem 3.1. 3.2. 3.3. Por que fazer Amostragem? Quando o uso de amostragem no interessante? Tipos de Amostragem 3.3.1. Amostragem Aleatria Simples (AAS) 3.3.2. Amostragem Sistemtica (AS) 3.3.3. Amostragem Estratificada (AE) 3.3.4. Amostragem por Conglomerado (AC) Exerccios
3.4. 4.
Tabulao de Variveis 4.1. 4.2. 4.3. 4.4. Variveis Qualitativas Unidimensionais Variveis Quantitativas Unidimensionais Variveis Qualitativas e Quantitativas Bidimensionais Exerccios
5.
Medidas de Posio 5.1. 5.2. 5.3. 5.4. 5.5. Mnimo e Mximo Moda Mdia Mediana Exerccios
Prof. Daniela
6.
Medidas de Disperso 6.1. 6.2. 6.3. 6.4. 6.5. Motivao Amplitude Varincia e Desvio Padro Intervalo Interquartil Exerccios
19 19 19 19 21 21 22 22 22 23 23 25 25 26 26 27 28 29 31 32 32 32 35 37 39 40 41 44 44 44 45 46 47
____/____/____
7.
Estatstica Grfica 7.1. Grficos para as Variveis Qualitativas 7.1.1. Grfico em Barras 7.1.2. Grfico de Composio em Setores (Pizza) 7.1.3. Grfico de Pareto Grficos para as Variveis Quantitativas 7.2.1. Grfico em Barras 7.2.2. Grfico de Pontos 7.2.3. Histograma 7.2.4. Grfico em Linhas (ou Grfico Temporal) 7.2.5. Ramo-e-Folhas 7.2.6. Desenho Esquemtico ou Diagrama de Caixas (Box-Plot) Exerccios
7.2.
7.3 8.
Correlao e Regresso 8.1. 8.2. 8.3. 8.4. 8.5. 8.6. Estudo da relao entre variveis Diagrama de Disperso Coeficiente de Correlao Regresso Linear Simples Coeficiente de Determinao Exerccios
Definio Clssica Definio Freqentista Definio Subjetiva Definio Moderna Probabilidade Condicional Independncia de Eventos Regra da Probabilidade Total Teorema de Bayes
48 49 51 51 52 53 54 54 56 56 57 58 58 58 59 60 60 61 61 62 63 65 66 69 73 74 77 77 77 79 79 81 81 83
Varivel Aleatria Discreta 10.1. 10.2. 10.3. 10.4. 10.5. 10.6. 10.7. 10.8. 10.9 10.10. 10.11. Introduo Esperana Matemtica (Mdia) Varincia Exerccio Modelo Bernoulli Modelo Binomial Exerccios Distribuio Hipergeomtrica Exerccio Distribuio Poisson Exerccios
11.
Varivel Aleatria Contnua 11.1. 11.2. 11.3. 11.4. Esperana e Varincia Distribuio Normal Tabela da Distribuio Normal Padro Exerccios
Lista de Exerccios 2 12. Estimao 12.1. 12.2. 12.3. 12.4. 12.5. 12.6. 12.7. Inferncia Estatstica Estimao Pontual e Intervalar para Proporo Exerccios Estimativa Pontual e Intervalar para a Mdia Populacional Exerccios Estimativa para a Mdia Populacional com Varincia Desconhecida Exerccio
Prof. Daniela
iv
____/____/____
13.
Testes de Hipteses 13.1. 13.2. 13.3. 13.4. 13.5. 13.6. 13.7. 13.8 13.9 13.10. Introduo Formulao das Hipteses Tipos de Erros possveis nos Testes de Hipteses Nvel de Significncia de um Teste de Hiptese () Teste de Hipteses para a Proporo Exerccios Teste de Hipteses para Mdia com Varincia Conhecida Exerccios Teste de Hipteses para Mdia com Varincia Desconhecida Exerccios
84 84 84 84 85 85 87 88 90 91 93 94
Lista de Exerccios 3 Apndice A B C D Gabarito da Lista de Exerccios 1 Gabarito da Lista de Exerccios 2 Gabarito da Lista de Exerccios 3 Aula no Laboratrio de Computao
Prof. Daniela
____/____/____
1. INTRODUO ESTATSTICA
1.1. O que Estatstica? Estatstica uma cincia que nos permite coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer rea do conhecimento. Estamos denominando por dados a um (ou mais) conjunto de valores, numricos ou no. A aplicabilidade das tcnicas a serem discutidas se d nas mais variadas reas das atividades humanas. Assim, o principal objetivo da Estatstica nos auxiliar a tomar decises ou tirar concluses em situaes de incerteza, a partir de informaes numricas. 1.2. Estatstica na Prtica
Tcnicas de amostragem
Populao (Caractersticas)
Amostra
Planejamento de Experimentos Anlise descritiva descritiva
Inferncia Estatstica
Clculo de Probabilidades
Populao: o conjunto de todos os elementos que nos interessa estudar. Deve ser notado que na terminologia estatstica, populao refere-se no somente a uma coleo de indivduos, mas ao alvo no qual reside nosso interesse. Exemplos: todos os clientes de um banco, todos os alunos de uma faculdade, todos os automveis da Ford, todo o sangue no corpo de uma pessoa, etc. Tcnicas de Amostragem: ferramentas que nos auxiliam a coletar amostras. Planejamento de Experimentos: cria esquemas e teorias para verificao de hipteses cientficas. Amostra: qualquer subconjunto da populao. Anlise Descritiva: Conjunto de tcnicas destinadas a descrever e resumir os dados a fim de tirarmos concluses a respeito de caractersticas de interesse. Probabilidade: Teoria utilizada para se estudar a incerteza associada a fenmenos aleatrios. Inferncia Estatstica: Tcnicas que possibilitam a extrapolao, a um grande conjunto de dados (populao), das informaes e concluses obtidas a partir de um subconjunto de valores (amostra).
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
1.3. Um pouco da histria da Estatstica 5000 AC 2000 AC 695 1654 1763 1930 1959 1996 1997 2001 Registros egpcios de presos de guerra; Censo Chins; Primeira utilizao da mdia ponderada pelos rabes na contagem de moedas; Pierre de Fermat e Blaise Pascal estabelecem os Princpios do Clculo das Probabilidades; Inferncia Estatstica (Reverendo Bayes); Controle de Qualidade nas indstrias; Estudo retrospectivo de doenas (Mantel & Haenszel); Profundidade da Regresso (Rousseeuw e Hubert); Modelos Fatoriais; 100 anos da Biometrika.
Maiores detalhes sobre a histria da Estatstica no site: http://www.redeabe.org.br/historia.htm 1.4. Exerccios Parte I A1 1) Para as situaes descritas a seguir, identifique a populao e a amostra correspondente. (a) Para avaliar a eficcia de uma campanha de vacinao no Estado de Minas Gerais, 200 mes de recm-nascidos durante o primeiro semestre de um dado ano, em uma dada maternidade em Belo Horizonte, foram perguntadas a respeito da ltima vez que vacinaram seus filhos. Populao: Amostra: (b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. Populao: Amostra: (c) Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por telefone com relao ao canal em que estavam sintonizados. Populao: Amostra:
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
2. VARIVEIS
2.1. Definio de Varivel Qualquer caracterstica associada a uma populao chamada de varivel. Porque o nome varivel? Porque ela varia de alguma forma. Exemplos: Idade: pode variar de 0, 1 , 2, ... anos Sexo: pode ser masculino ou feminino Estado Civil: pode ser solteiro, casado, divorciado, etc. 2.2. Classificao das Variveis As variveis podem ser classificadas como Qualitativas ou Quantitativas. Algumas variveis como sexo, grau de instruo, estado civil, regio de procedncia, apresentam como possveis resultados uma qualidade (ou atributo) do indivduo pesquisado, logo, estas variveis so chamadas de variveis Qualitativas. As variveis como nmero de filhos, salrio, idade, apresentam como possveis resultados nmeros resultantes de uma contagem ou mensurao, logo, estas variveis so chamadas de variveis Quantitativas. Exemplo: Um pesquisador est interessado em fazer um levantamento sobre alguns aspectos socio-econmicos dos empregados da seo de oramentos de uma empresa. Usando informaes obtidas do departamento pessoal, ele elaborou a Tabela 2.1. Tabela 2.1: Informaes sobre estado civil, grau de instruo, nmero de filhos, salrio (expresso como frao do salrio mnimo), idade (medida em anos e meses) e procedncia de 36 empregados da seo de oramentos de uma Empresa.
Idade
N 1 2 ... 35 36 Estado Civil Solteiro Casado ... Casado Casado Grau de Instruo Fundamental Fundamental ... Mdio Superior N de Filhos ... 1 ... 2 3 Salrio 4,00 4,56 ... 19,40 23,30 Anos 26 32 ... 48 42 Meses 3 10 ... 11 2 Regio de Procedncia Interior Capital ... Capital Interior
Fonte: Bussab e Morettin (2002) Observaes sobre a Tabela 2.1. De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais de um) resultado correspondendo realizao de uma caracterstica (ou caractersticas). Por exemplo, considerando a varivel estado civil, para cada empregado pode-se associar um dos resultados, solteiro ou casado (note que poderia haver outras possibilidades, como separado, divorciado, mas somente as duas mencionadas foram consideradas no estudo).
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
Dentre as variveis Qualitativas, ainda podemos fazer uma distino entre dois tipos: Varivel Qualitativa Nominal: para a qual no existe nenhuma ordenao nos possveis resultados. Exemplo: Regio de Procedncia, etc. Varivel Qualitativa Ordinal: para a qual existe uma ordem natural nos seus resultados. Exemplo: Grau de instruo, etc. As variveis Quantitativas tambm podem sofrer uma classificao dicotmica: Varivel Quantitativa Discreta: cujos possveis valores formam um conjunto finito ou enumervel de nmeros, e que resultam, freqentemente, de uma contagem. Exemplo: N de Filhos, etc. Varivel Quantitativa Contnua: cujos possveis valores pertencem a um intervalo de nmeros reais e que resultam de uma mensurao. Exemplo: Salrio, etc. Resumindo Como as variveis so classificadas e outros exemplos: Qualitativa Nominal Ordinal Discreta Contnua Sexo, Cor dos Olhos. Estado Civil, Classe social. Nmeros de carros. Peso, altura.
Quantitativa
Para cada tipo de varivel existem tcnicas apropriadas para resumir as informaes dos dados obtidos da amostra. Por exemplo, a utilizao de uma tabela uma forma de escrever os dados de uma forma resumida. Em algumas situaes podem-se atribuir valores numricos s vrias qualidades ou atributos de uma varivel qualitativa e depois se proceder anlise como se esta fosse quantitativa, desde que o procedimento seja passvel de interpretao. Existe um tipo de varivel qualitativa para a qual essa quantificao muito til: a chamada varivel dicotmica. Para essa varivel podem ocorrer somente duas realizaes, usualmente chamadas de sucesso e fracasso. Exemplos: Sexo (Masculino ou Feminino), Hbito de Fumar (Sim ou No), etc.
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
2.3. Exerccios Parte I A1 1) Um questionrio foi aplicado aos alunos do primeiro ano de uma escola fornecendo as seguintes informaes: ID: Identificao do aluno; Turma: Turma a que o aluno foi alocado (A ou B); Sexo: Feminino (F) ou Masculino (M); Idade: Idade; Alt: Altura; Peso: Peso; Filh: Nmero de filhos na famlia; Fuma: Hbito de fumar (sim ou no); Toler: Tolerncia ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M) Incomoda Muito; Exer: Horas de atividade fsica, por semana; Cine: Nmero de vezes que vai ao cinema por semana; OpCine: Opinio a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa TV: Horas gastas assistindo TV, por semana OpTV: Opinio da programao na TV: (R) Ruim, (M) Mdia, (B) Boa e (N) no sabe. Tabela 2.2: Informaes do questionrio estudantil. ID Turma Sexo Idade Alt Peso Filh Fuma Toler Exer Cine Opcine Tv 1 A F 17 1,60 60,5 2 No P 0 1 B 16,5 2 A F 18 1,69 55,0 1 No M 0 1 B 7 ... ... ... ... ... ... ... ... ... ... ... ... ... 49 B M 17 1,80 71,0 1 No P 7 0 M 14 50 B M 18 1,83 86,0 1 No P 7 7 M 20 Fonte: Magalhes e Lima (2004). Classifique as variveis da Tabela 2.2. como Varivel Qualitativa Nominal:
OpTV R R ... R B
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
3. AMOSTRAGEM
A amostragem naturalmente usada em nossa vida diria. Por exemplo, para verificar o tempero de um alimento em preparao, podemos provar (observar) uma pequena poro deste alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (populao), uma parte (amostra) com propsito de avaliarmos sobre a qualidade do tempero de todo o alimento. 3.1. Por que fazer Amostragem? Existem vrias razes para o uso de amostragem em levantamento de grandes populaes. Algumas delas so: Economia: Em geral, torna-se bem mais econmico o levantamento de somente uma parte da populao. Tempo: Numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria tempo suficiente para pesquisar toda a populao de eleitores do pas. Operacionalidade: mais fcil realizar operaes de pequena escala. Um dos problemas tpicos nos grandes censos o controle dos entrevistadores. 3.2. Quando o uso de amostragem no interessante? Populao pequena: No h necessidade de utilizar tcnicas estatsticas, pois neste caso aconselhvel realizar o censo (anlise de toda a populao). Caracterstica de fcil mensurao: Talvez a populao no seja to pequena, mas a varivel que se quer observar de to fcil mensurao, que no compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionrios favorveis mudana no horrio de um turno de trabalho, podemos entrevistar toda a populao no prprio local de trabalho. Esta atitude pode ser politicamente mais recomendvel. Necessidade de alta preciso: A cada dez anos o IBGE realiza um Censo1 Demogrfico para estudar diversas caracterstica da populao brasileira. Dentre estas caractersticas tmse o nmero total de habitantes, que fundamental para o planejamento do pas. Desta forma, o nmero de habitantes precisa ser avaliado com grande preciso e, por isto, se pesquisa toda a populao.
3.3. Tipos de Amostragem 3.3.1. Amostragem Aleatria Simples (AAS) A tcnica de Amostragem Aleatria Simples (ou Amostragem Casual Simples) o mtodo mais simples e um dos mais importantes para a seleo de uma amostra. Para a seleo de uma AAS precisamos ter uma lista completa dos elementos da populao. Este tipo de amostragem consiste em selecionar a amostra atravs de um sorteio. Sua principal caracterstica est no fato de todos os elementos da populao ter igual probabilidade de serem escolhidos.
1
Oliveira, D. C. R. e Oliveira, M. S.
Procedimento para o uso deste mtodo: 1) Numerar todos os elementos da populao (N elementos); 2) Efetuar sucessivos sorteios at completar o tamanho da amostra (n).
Para realizar este sorteio, podemos utilizar urnas, tabelas de nmeros aleatrios ou algum software que gere nmeros aleatrios. A Tabela abaixo foi feita usando o Excel. Tabela de Nmeros Aleatrios
6 9 5 5 8 1 3 8 0 9 1 2 5 9 6 1 4 0 8 0 2 1 5 8 0 9 7 6 2 3 0 4 4 9 4 8 4 1 5 1 1 9 1 5 3 9 7 0 3 8 7 5 8 8 2 5 1 9 1 1 2 4 5 4 9 5 8 9 9 5 8 2 4 2 2 6 0 0 2 6 6 7 6 6 9 9 3 5 3 5 2 9 5 7 3 3 6 5 3 0 6 5 9 5 8 9 9 5 0 2 2 9 4 2 3 3 8 6 8 7 8 9 7 1 5 1 3 7 1 6 2 9 3 9 0 5 3 9 5 8 0 2 3 4 8 1 6 2 4 3 1 8 0 2 1 8 0 1 5 2 7 0 1 3 9 1 2 0 8 2 5 1 0 2 0 8 1 4 2 4 9 1 5 9 5 6 4 2 5 3 9 5 7 1 7 5 3 8 6 8 4 5 5 8 5 6 4 8 4 8 7 2 1 2 7 9 6 8 9 8 5 2 9 7 4 7 2 7 4 4 7 9 9 6 4 2 0 6 0 1 7 4 2 7 6 3 8 6 3 6 0 3 3 2 0 9 0 6 5 3 2 7 3 2 1 3 6 0 3 1 0 3 3 0 2 1 4 2 1 3 2 9 1 0 3 4 3 0 3 1 0 5 0 4 0 5 8 5 0 6 5 1 3 0 4 5 9 4 8 5 9 2 1 4 8 7 9 8 0 8 9 8 7 5 8 6 5 4 5 7 0 7 1 4 9 4 7 8 2 7 3 8 5 6 4 0 2 1 5 6 7 4 9 3 9 2 0 8 3 1 9 5 5 8 5 6 5 6 0 6 0 2 9 0 2 1 5 4 6 4 4 6 3 2 3 1 1 6 0 3 2 6 8 6 1 1 3 2 5 2 5 4 3 1 0 9 9 9 8 2 2 2 0 7 0 8 8 2 4 2 5 8 0 7 3 3 1 1 4 1 9 0 1 5 5 9 2 4 9 2 3 5 4 0 8 6 9 4 2 8 8 1 1 0 0 0 9 8 8 9 2 5 0 9 6 3 6 3 2 1 1 4 2 5 6 1 2 2 3 1 5 9 6 5 4 2 5 3 6 3 5 0 1 0 0 3 4 9 8 5 5 6 6 3 2 4 3 3 2 2 8 2 1 9 2 8 0 8 1 5 7 2 6 5 5 7 1 7 6 3 9 2 9 2 8 9 1 5 8 4 0 6 3 2 6 7 5 5 5 4 9 2 4 9 6 2 6 5 4 9 4 8 2 2 1 4 4 7 2 7 0 3 4 8 8 1 0 0 3 0 0 8 8 6 8 2 9 8 5 0 0 0 1 0 3 2 9 9 4 9
Exemplo: Estamos interessados em estudar a qualidade da gasolina nos postos de uma determinada cidade. Essa cidade possui N = 40 postos. A empresa que estudar a qualidade pode investigar apenas uma amostra de n = 4 postos. Para selecionarmos uma amostra, utilizando a amostragem casual simples, basta escolhermos uma posio de qualquer linha da tabela de nmeros aleatrios e extrairmos conjuntos de dois algarismos (pois N, que o tamanho da populao, possui 2 casas decimais), at completarmos os 4 elementos da amostra. Se o nmero sorteado no existir, simplesmente no consideramos e prosseguimos o processo. Escolhendo a primeira linha da Tabela de Nmeros Aleatrios, temos a seguinte amostra de 4 elementos: {09, 26, 29, 11}. Exemplo: Considere agora, uma populao com 500 elementos e, deseja-se retirar dessa populao 10 elementos. Obtenha uma AAS utilizando a primeira linha da Tabela de Nmeros Aleatrios. 3.3.2. Amostragem Sistemtica (AS) utilizada quando a populao est naturalmente ordenada, como listas telefnicas, fichas de cadastramento, produo de garrafas da cervejas, etc. Procedimento para o uso deste mtodo: 1) Seja N o tamanho da populao e n o tamanho amostral. Calcula-se o intervalo da amostragem i = N/n (considera-se apenas a parte inteira do nmero).
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
2) Sorteia-se, utilizando a tabela de nmeros aleatrios, um nmero x entre 1 e i formando a amostra: x, (x + i), (x + 2*i), ... , (x + (n-1)*i). Exemplo: Numa turma com N = 36 alunos, deseja-se retirar uma amostra de n = 5 elementos para verificar uma caracterstica de interesse. Utilize a tcnica de amostragem sistemtica para retirar essa amostra. 1) Calcular: i = N/n = 36/5 = 7,2. Considerando a parte inteira do nmero, temos que i = 7; 2) Sortear um nmero entre 1 e 7 da Tabela de Nmeros Aleatrios. Escolhendo a ltima linha e a primeira coluna, temos que o primeiro nmero que est entre 1 e 7 6. Logo a amostra ser composta dos elementos: {06, 13, 20, 27, 34} Exemplo: Considere agora, uma populao com 500 elementos e, deseja-se retirar dessa populao 10 elementos. Obtenha uma AS utilizando a primeira linha da Tabela de Nmeros Aleatrios, quando for necessrio. 3.3.3. Amostragem Estratificada (AE) A populao dividida em subgrupos, denominados estratos (por exemplo, por sexo, renda, bairro, etc.) e a AAS utilizada na seleo de uma amostra de cada estrato. Esses estratos devem ser internamente mais homogneos do que a populao toda, com respeito s variveis em estudo. Aqui, um conhecimento prvio sobre a populao em estudo fundamental. Estrato 1 Estrato 2 ... Estrato k Subgrupo 1 da amostra Subgrupo 2 da amostra ... Subgrupo k da amostra
...
Amostra Estratificada
A AE tem as seguintes caractersticas: dentro de cada estrato h uma grande homogeneidade (pequena variabilidade); entre os estratos h uma grande heterogeneidade (grande variabilidade). Em geral, utiliza-se a AE proporcional. Neste caso, a proporcionalidade do tamanho da amostra de cada estrato da populao mantida na amostra. Por exemplo, se um estrato corresponde a 20% do tamanho da populao, ele tambm deve corresponder a 20% da amostra. Exemplo: Com o objetivo de realizar uma pesquisa de opinio sobre a gesto atual da reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A populao composta por 100 professores, 100 servidores tcnicos administrativos e 300 alunos, que identificaremos da seguinte forma: Populao Professores Servidores Alunos P001 P002 P100 S001 S002 ... S100 A001 A002 ... A300
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
Supondo que a opinio sobre a gesto atual da reitoria possa ser relativamente homogneo dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para obter uma amostra global de tamanho n = 10. A tabela a seguir mostra as relaes de proporcionalidade. Estrato Proporo na Populao Tamanho do subgrupo na amostra np = ( 0,20)*10 = 2 ns = ( 0,20)*10 = 2 na = ( 0,60)*10 = 6
Professores 100/500 = 0,20 (ou 20%) Servidores 100/500 = 0,20 (ou 20%) Alunos 300/500 = 0,60 (ou 60%)
Para selecionar aleatoriamente dois professores, podemos usar a Tabela de Nmeros Aleatrios, tomando dois nmeros com trs algarismos. Usando, por exemplo a primeira linha da tabela de nmeros aleatrios, temos os seguintes professores selecionados: {P045, P020}. Para os servidores, usando a segunda linha da tabela, temos: {S055, S058}. Usando a terceira linha da tabela, temos a seguinte amostra de alunos: {A050, A136, A270, A152, A247, A004}. A amostra {P045, P020, S055, S058, A050, A136, A270, A152, A247, A004} uma amostra estratificada proporcional da comunidade da universidade. Cada indivduo desta amostra dever ser pesquisado para se obter a opinio em relao gesto atual da reitoria. 3.3.4. Amostragem por Conglomerado (AC) A populao dividida em subpopulaes (conglomerados) distintas (quarteires, residncias, famlias, bairros, etc.). Alguns dos conglomerados so selecionados segundo a AAS e todos os indivduos nos conglomerados selecionados so observados. Em geral, menos eficiente que a AAS ou AE, mas por outro lado bem mais econmica. Tal procedimento amostral adequado quando possvel dividir a populao em um grande nmero de pequenas subpopulaes. A AC tem as seguintes caractersticas: dentro de cada conglomerado h uma grande heterogeneidade (grande variabilidade); entre os conglomerados h uma pequena variabilidade (grande homogeneidade). Exemplo: Realizao de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais. Usando a tcnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas
5 3 Zona 1 6 7 4 8 10 9 11
12
____/____/____
Obs.: fcil confundir amostragem estratificada com amostragem por conglomerado, porque ambas envolvem a formao de subgrupos. A diferena que a amostragem por conglomerado usa todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa uma amostra de membros de todos os estratos. Curiosidade Tambm podemos encontrar na prtica a Tcnica de Amostragem de Convenincia que simplesmente usa resultados que sejam muito fceis de obter.
Ei! Voc a favor da pena de m orte?
3.4. Exerccios Parte I A1 1) Um administrador especialista em avaliar atravs de sistemas informatizados as aes da BOVESPA, est interessado em fazer uma pesquisa nos preos das aes, para indicar aos seus clientes se hoje um dia favorvel a fazer investimentos. Ele sabe que existe N = 500 aes em venda. Como o tempo de estudo de cada ao de aproximadamente 10 minutos, decidiu-se verificar apenas n = 25 aes. Utilizando as tcnicas de amostragem aleatria simples, quais aes sero selecionadas (Use a primeira linha da tabela de nmeros aleatrios)? 2) Um gerente de controle de qualidade estudar fontes de computador que passam numa esteira transportadora dentro da empresa onde trabalha. Sabendo que por dia passam N = 85 fontes e na amostra dever ter n = 10 fontes, quais sero as fontes selecionadas utilizando a tcnica de amostragem sistemtica? (Quando for necessrio utilizar a Tabela de Nmeros Aleatrios utilize a primeira linha) 3) Num depsito em uma determinada empresa produtora de materiais eletrnicos possui N = 100 computadores que esto separados em duas qualidades. N1 = 40 computadores Pentium 3 e N2 = 60 computadores Pentium 4. O custo para verificar se cada computador est sob controle muito alto. O administrador responsvel disse que a empresa tem condies de verificar apenas n = 12 computadores. Utilizando a tcnica de amostragem estratificada proporcional, quais computadores sero selecionados? (Quando for necessrio utilizar a Tabela de Nmeros Aleatrios utilize a primeira linha)
Oliveira, D. C. R. e Oliveira, M. S.
10
____/____/____
4. TABULAO DE VARIVEIS
4.1. Variveis Qualitativas Unidimensionais Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o comportamento dessa varivel, analisando a ocorrncia de seus possveis resultados. A tabela a seguir apresenta a distribuio de freqncias da varivel grau de instruo dos dados da Tabela 2.1. Tabela 4.1: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da Companhia MB segundo o grau de instruo. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi) Fundamental 12 Mdio 18 Superior 6 n = 36 1,0000 Total Fonte: Bussab e Morettin (2002) Interpretao da Tabela 4.1.: Nota-se que dos 36 empregados da seo de oramentos, 33,33% tem nvel fundamental, 50% nvel mdio e apenas 16,67% nvel superior. Notao: Usaremos a notao ni para indicar a freqncia (absoluta) de cada classificao ou categoria da varivel. A notao fi = ni/n para indicar a proporo (ou freqncia relativa) de cada categoria, sendo o n o nmero total de observaes. As propores so muito teis quando se querem comparar resultados de duas pesquisas distintas. O prximo exemplo ilustra este fato. Exemplo: Suponhamos que se queira comparar a varivel grau de instruo para empregados da seo de oramentos com a mesma varivel para todos os empregados da Companhia MB. Digamos que a empresa tenha 2000 empregados e que a distribuio de freqncias seja a tabela abaixo: Tabela 4.2: Freqncias e Porcentagens dos 2000 empregados da Companhia MB, segundo o grau de instruo. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi) Fundamental 650 Mdio 1020 0,5100 Superior n = 2000 1,0000 Total Fonte: Bussab e Morettin (2002) Comparao entre a Tabela 4.1. e a Tabela 4.2.: No podemos comparar diretamente as colunas das freqncias (ni) das duas tabelas pois os totais de empregados so diferentes nos dois casos (n = 36 e n = 2000). Mas as colunas das porcentagens (ou propores) so comparveis, pois reduzimos as freqncias relativas a um mesmo total.
Oliveira, D. C. R. e Oliveira, M. S.
11
____/____/____
4.2. Variveis Quantitativas Unidimensionais A construo de tabelas de freqncias para variveis quantitativas necessita de certos cuidados. Por exemplo, a construo da tabela de freqncias para a varivel Salrio da Tabela 2.1., usando o mesmo procedimento que o grau de instruo, no resumir as 36 observaes num grupo menor, pois no existem observaes iguais. Soluo: Agrupar os dados por faixas de salrio. Assim, construmos uma tabela chamada Tabela de Classes de Freqncias. Exemplo: Distribuio de Freqncias dos salrios dos 36 empregados da seo de oramentos da Companhia MB por faixas de salrio: Tabela 4.3: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da Companhia MB por faixas de salrio. Classe de Salrio Freqncia (ni) Proporo (fi) Porcentagem (100 x fi) 04 |-- 08 10 0,2778 27,78% 08 |-- 12 12 12 |-- 16 8 16 |-- 20 5 20 |-- 24 1 36 1,0000 Total Obs.: Procedendo desse modo, ao resumir os dados referentes a uma varivel quantitativa, perde-se alguma informao. Por exemplo, no sabemos quais so os oito salrios da classe de 12 a 16, a no ser que investiguemos a tabela original. Sem perda de muita preciso, poderamos supor que todos os oito salrios daquela classe fossem iguais ao ponto mdio da referida classe, isto , 14. Nmero de Classes A escolha dos intervalos arbitrria. A familiaridade do pesquisador com os dados que lhe indicar quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um nmero pequeno de classes, perde-se informao, e com um nmero grande de classes, o objetivo de resumir os dados fica prejudicado. Soluo: Normalmente, sugere-se o uso de 4 a 8 classes com a mesma amplitude. Dentre muitas regras citadas na literatura, duas tem sido universalmente adotadas, caso o pesquisador no tenha idia alguma sobre o nmero de classes adotar. O nmero ideal de classes um nmero inteiro prximo de: Regra 1:
C = 1 + 3,2 x log n
Regra 2:
C= n
onde n o nmero de elementos pesquisado. As duas regras so equivalentes para n 80. A partir da, a Regra 2 fornece valores que crescem rapidamente e desse modo a Regra 1, proposta por Sturges tem sido preferida.
Oliveira, D. C. R. e Oliveira, M. S.
12
____/____/____
As tabelas usadas neste caso so conhecidas como tabela de dupla entrada, tabela de associao, tabela de contingncia ou distribuies conjuntas de freqncias.
Tabela 4.4: Distribuio dos funcionrios da empresa MB, segundo o conceito em Metodologia e a Seo a que pertence. Seo Conceito em Metodologia Total por Seo A B C Dep. Pessoal 3 1 3 7 Sc. Tcnica 0 4 3 7 Sec. Venda 4 3 4 11 7 8 10 25 Total por Conceito
Tabela 4.5: Vendas dos Produtos A, B, C, no supermercado Glria, no Primeiro semestre de 2005. Meses Vendas em 1000 R$ Total por Ms A B C Janeiro 40,0 25,2 8,1 73,3 Fevereiro 40,1 28,0 10,0 78,1 Maro 35,1 28,0 15,4 78,5 Abril 28,2 20,2 22,3 70,7 Maio 14,1 25,6 28,1 67,8 Junho 5,0 30,0 35,2 70,2 162,5 157,0 119,1 438,6 Total por Produto Fonte: Dados Hipotticos.
Tabela 4.6: Distribuio dos alunos da Faculdade Vitria, segundo suas notas em Matemtica e Estatstica. Estatstica Matemtica Totais em Estatstica 0 |- 4 4 |- 7 7 |- 10 0 |- 4 32 25 5 62 4 |- 7 20 183 82 285 7 |- 10 7 27 19 53 59 235 106 400 Totais em Matemtica Fonte: Dados Hipotticos.
Oliveira, D. C. R. e Oliveira, M. S.
13
____/____/____
4.4. Exerccios Parte I A1 Tabela 4.7: Conjuntos de dados da empresa MB Indstria e Comrcio
Admin. Direito Redao Estat. Ingls Metodologia Poltica 8,0 9,0 8,6 9,0 B A 9,0 8,0 9,0 7,0 9,0 B C 6,5 8,0 9,0 8,0 8,0 D B 9,0 6,0 9,0 8,6 8,0 D C 6,0 8,0 9,0 8,0 9,0 A A 6,5 8,0 9,0 8,5 10,0 B A 6,5 8,0 9,0 8,2 8,0 D C 9,0 10,0 9,0 7,5 8,0 B C 6,0 8,0 9,0 9,4 9,0 B B 10,0 10,0 9,0 7,9 8,0 B C 9,0 8,0 9,0 8,6 10,0 C B 10,0 8,0 9,0 8,3 7,0 D B 6,5 6,0 9,0 7,0 7,0 B C 6,0 10,0 9,0 8,6 9,0 A B 10,0 8,0 9,0 8,6 9,0 C B 10,0 8,0 9,0 9,5 7,0 A A 9,0 8,0 9,0 6,3 8,0 D C 10,0 6,0 9,0 7,6 9,0 C C 6,0 6,0 9,0 6,8 4,0 D C 6,0 6,0 9,0 7,5 7,0 C B 6,0 8,0 9,0 7,7 7,0 D B 6,5 6,0 9,0 8,7 8,0 C A 6,0 8,0 9,0 7,3 10,0 C C 9,0 8,0 9,0 8,5 9,0 A A 6,5 8,0 9,0 7,0 9,0 B A 9,0 (*) P = Departamento Pessoal; T = Seo Tcnica e V = Seo de Vendas. Fonte: Bussab e Morettin (2002) Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Seo* P P P P P P P T T T T T T T V V V V V V V V V V V Economia 8,5 8,0 8,5 8,5 9,0 9,5 7,0 8,5 8,0 7,5 8,5 8,0 8,5 7,5 7,0 7,5 7,5 8,5 9,5 8,5 8,0 9,0 7,0 9,0 8,5
1) Baseado na Tabela 4.7., construa a distribuio de freqncias da varivel Metodologia, com as freqncias absoluta e relativa, as porcentagens, d um ttulo e interprete. 2) Ainda baseado na Tabela 4.7., construa uma Tabela de Classes de Freqncias para a varivel Redao, com as freqncias absoluta e relativa, as porcentagens, d um ttulo e interprete. 3) Construa uma tabela de dupla entrada para as variveis seo e conceito tirado em Ingls da Tabela 4.7. 4) Construa uma tabela de contingncia para as variveis seo e notas em estatstica da Tabela 4.7. 5) Construa uma tabela de contingncia para as variveis notas em redao e poltica da Tabela 4.7.
Oliveira, D. C. R. e Oliveira, M. S.
14
____/____/____
5. MEDIDAS DE POSIO
5.1. Mnimo e Mximo
O mnimo a menor observao do conjunto de dados, enquanto que o mximo a maior observao.
Exemplo: Considere o seguinte conjunto de dados: 4, 5, 4, 6, 5, 8, 4. Logo, Min = __ e Max = __. 5.2. Moda
Valor ou atributo que ocorre com maior freqncia. Exemplo (a): 2, 5, 2, 7, 8 Moda = __ . Exemplo (b): 3, 4, 2, 2, 4, 5 Moda = __ e __. Exemplo (c): 1, 2, 3, 4, 5 Moda = no tem
Moda para dados agrupados em Tabelas de Freqncias
Conjunto _ _ _ _ _ _ _ Conjunto _ _ _ _ _ _
Exemplo: Uma empresa de segurana deseja estudar qual o nmero de ligaes a cobrar mais freqentes que so recebidas em um determinado bairro de classe alta da cidade de So Paulo no ms de maro. Foram selecionadas 30 residncias e observadas 10 ligaes em cada residncia. O resultado foi:
Moda = __. Interpretao: __ ligaes a cobrar foi o que ocorreu com maior freqncia.
5.3. Mdia
Valor que representa o centro do conjunto de dados. Considere n observaes de um conjunto de dados representados por x1, x2, ..., xn. A mdia desse conjunto obtida pela soma das n observaes dividido por n, ou seja,
i x1 + x 2 + x3 + L + x n i =1 = x= n n Exemplo: Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A mdia das notas ___.
(5.1)
Oliveira, D. C. R. e Oliveira, M. S.
15
____/____/____
Mdia para dados agrupados em Tabelas de Freqncias Exemplo: Considere novamente o exemplo da empresa de segurana, mas suponha que o interesse seja estudar o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe alta da cidade de So Paulo no ms de maro.
Nesse caso, a mdia calculada levando em conta as freqncias de cada valor da varivel, da seguinte forma: , (5.2) n onde v a quantidade de resultados que a varivel contm e ni a respectiva freqncia da i-sima classe. Assim, para o exemplo temos: 0 x 2 + 1x5 + 2 x15 + 3x8 = ___. n 30 Logo, o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe alta da cidade de So Paulo no ms de maro ___.
x=
i =1 i i
x=
x n
i =1 i
x n
5.4. Mediana
o valor que divide os dados, isto , metade dos dados ser maior ou igual que a mediana e metade ser menor ou igual. Considere a seguinte srie de valores: 5, 2, 6, 13, 9, 15, 10. De acordo com a definio de mediana, o primeiro passo a ser dado ordenar o conjunto de valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie em duas partes iguais 9. Logo, a mediana 9.
Mtodo prtico para o clculo da Mediana para dados em Rol 1) Ordenar os valores do menor para o maior, isto , x(1),...., x(n), onde x(1) o mnimo e x(n) o mximo. n +1 . 2) Calcular em que posio estar a mediana nos dados ordenados atravs da frmula: p = 2 3) O valor da mediana ser: (a) Se p for um nmero inteiro, ento a mediana ser o valor que est na posio p nos dados ordenados, isto Mediana = x(p)
Oliveira, D. C. R. e Oliveira, M. S.
16
____/____/____
(b) Se p no for inteiro, considere p- e p+ os inteiros imediatamente abaixo e acima de p, respectivamente. A mediana ser a mdia dos valores que esto nas posies p- e p+ nos dados ordenados, ou seja,
Mediana =
x (P ) + x (P+ ) 2
Exemplo: Calcule a mediana da seguinte srie de dados: 1, 3, 0, 0, 2, 4, 1, 2, 5 1 ordenar a srie: __, __, __, __, __, __, __, __, __. n = __ . Logo, P = (n + 1)/2 dado por P = (__+1)/2 = 5, ou seja, o 5 elemento da srie ordenada ser a mediana. Assim, mediana = __ . Exemplo: Calcule a mediana da seguinte srie de dados: 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 1 ordenar a srie: __, __, __, __, __, __, __, __, __, __. n = __. P = (n + 1)/2 dado por P = (__+1)/2 = 5.5, logo, P- = 5 e P+ = 6, ou seja, o 5 e o 6 elementos da srie ordenada, que representam os seguintes valores: __ e __, respectivamente. Pela definio, a mediana ser a mdia aritmtica do 5 e 6 termos da srie, ou seja, Mediana = (2+3)/2 = 2,5. Notas: 1) Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. 2) Quando o nmero de elementos da srie estatstica for par, a mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie. 3) Em uma srie de dados, a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. 4) A mediana, depende da posio e no dos valores dos elementos na srie ordenada. Essa uma diferena marcante entre mediana e mdia (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Na srie: 5, 7, 10, 13, 15 Mdia = 10 e Mediana = 10; Na srie: 5, 7, 10, 13, 65 Mdia = 20 e Mediana = 10, isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma.
Nesse caso, utilizamos a freqncia acumulada para identificar qual o valor da mediana.
Exemplo: Considere novamente o exemplo da empresa de segurana que desejava estudar qual o nmero de ligaes a cobrar mais freqentes recebidas em um determinado bairro de classe alta da cidade de So Paulo no ms de maro. Vamos introduzir uma nova coluna na tabela dos dados referentes a freqncia acumulada.
Oliveira, D. C. R. e Oliveira, M. S.
17
____/____/____
Como o rol par, pois n = __, a mediana a mdia dos valores que esto nas posies 15 e 16. Ambos valores que esto nestas posies so __ ligaes a cobrar recebida por residncia, pois F3 a primeira freqncia acumulada que contm os elementos 15 e 16.
1) Os tempos de sobrevivncia (em meses) de um tipo de bateria esto listados a seguir. 5, 21, 21, 23, 23, 25, 27, 29, 30, 31, 32, 32, 32, 34, 35, 36, 38, 38, 38, 42, 43, 44, 60. Calcule o mnimo, mximo, moda, mdia e mediana. 2) Um artigo em Computers and Industrial Engineering (2001, p.51) descreve os dados de tempos de falha (em horas) para motores de jatos. Alguns desses dados esto a seguir. Mquina # 1 2 3 4 5 6 7 8 9 10 11 12 13
Tabela 5.1: Dados Brutos (em horas) Tempo de Falha Mquina # Tempo de Falha 150 14 171 291 15 197 93 16 200 53 17 262 2 18 255 65 19 286 183 20 206 144 21 179 223 22 232 197 23 165 187 24 155 197 25 203 213
Obtenha mnimo, mximo, moda, mdia e mediana dos tempos de falhas das mquinas e interprete os resultados. 3) As idades dos 20 ingressantes num certo curso de ps-graduao em finanas de uma universidade foram as seguintes: 22, 22, 22, 22, 23, 23, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 27, 28, 35 e 40. Construa uma tabela de freqncias e calcule o mnimo, mximo, moda, mdia e mediana das idades organizadas nessa tabela.
Oliveira, D. C. R. e Oliveira, M. S.
18
____/____/____
6. MEDIDAS DE DISPERSO
6.1. Motivao
Para preencher uma nica vaga existente em uma empresa, 50 candidatos foram submetidos a 6 provas sobre conhecimentos especficos de interesse da empresa. Trs destes candidatos destacaram-se com as notas descritas na tabela abaixo:
Tabela 6.1: Distribuio das Notas Provas Candidatos 1 2 3 4 5 A 7,0 7,5 8,0 8,0 8,5 B 6,0 7,0 8,0 8,0 9,0 C 7,5 8,0 8,0 8,0 8,0 Fonte: Dados Hipotticos
Que candidato escolher? Um critrio inicial poderia ser o de escolher o que tem a maior mdia, mas: Candidatos A B C Mdia De modo anlogo, nem adianta pensar em moda ou mediana, pois: Candidatos A B C Moda Mediana Soluo: Um segundo critrio de escolha pode ser escolher o candidato que apresentou notas mais homogneas, isto , aquele que apresentou menor disperso das notas.
6.2. Amplitude
A amplitude definida pelo intervalo entre o valor mximo e o valor mnimo da srie de dados, ou seja, Amplitude = Mximo Mnimo (6.1) Exemplo: Para os trs candidatos temos: Candidatos A B C Amplitude
6.3. Varincia e Desvio Padro
(x
i =1
x)2 (6.2)
____/____/____
n 1
19
(6.3)
Candidato A
2 sA =
7,0
7,5
8,5
9,0
Mdia 8,0
s A = 0,5 0,7
Candidato B
2 sB =
6,0
7,0
9,0
10,0
6 1
Notas 8,0 8,0
sB =
Candidato C
2 sC =
7,5
8,0
8,0
8,5 =
Mdia 8,0 =
6 1
sC =
Resumindo Tabela 6.2: Medidas de Posio e Disperso dos 3 melhores candidatos Candidatos Mdia Moda Mediana Amplitude Varincia Desvio Padro A 8,0 8,0 8,0 B 8,0 8,0 8,0 C 8,0 8,0 8,0 Frmula alternativa para o clculo da varincia
Podemos calcular a varincia atravs da seguinte frmula alternativa:
s2 =
1 n 2 2 xi n ( x ) n 1 i =1
(6.4)
. A frmula (6.4) obtida atravs de algumas manipulaes algbricas na frmula (6.2). Esta tem a facilidade de apenas necessitar da informao da mdia ( x ) e da soma dos valores ao 2 quadrado da varivel xi .
Oliveira, D. C. R. e Oliveira, M. S.
20
____/____/____
Oliveira, D. C. R. e Oliveira, M. S.
21
____/____/____
7. ESTATSTICA GRFICA
7.1. Grficos para as Variveis Qualitativas
A representao grfica da distribuio de uma varivel tem a vantagem de, rpida e concisamente, informar sobre sua variabilidade. Existem vrios tipos de grficos para as variveis Qualitativas. Aqui sero ilustrados trs deles: Grficos em Barras, o de Composio em Setores (Pizza) e o Grfico de Pareto.
Tabela 7.1: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da Companhia MB segundo o grau de instruo. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi) Fundamental 12 0,3333 33,33% Mdio 18 0,5000 50,00% Superior 6 0,1667 16,67% n = 36 1,0000 100,00% Total Fonte: Bussab e Morettin (2002)
18
18
16 14 12 Freqncia (ni)
12
10 8 6 4 2 0 Fundamental Mdio Grau de Instruo Superior
22
____/____/____
33%
Superior
17%
Figura 7.2: Grfico em Setores para a varivel Grau de Instruo 7.1.3. Grfico de Pareto O grfico de Pareto um grfico de barras representando a freqncia absoluta com um grfico de linha, representando a porcentagem acumulada. Ele exibe a freqncia absoluta e a porcentagem acumulada no eixo vertical e as categorias da classificao no eixo horizontal (Ver Figura 7.3 a seguir). Organizamos sempre as categorias em ordem decrescente da freqncia de ocorrncia, isto , a de maior freqncia absoluta fica esquerda, seguida pela segunda de maior freqncia, e assim por diante.
500
100
300
60
200
40
100
20
MD-737 MD-777 MD-757 MD-767 MD-717 MD-747 281 55 45 44 32 25 57,5 11,2 9,2 9,0 6,5 5,1 57,5 68,7 77,9 86,9 93,5 98,6
Figura 7.3: Produo de avies em 2000. (Fonte: Boeing Commercial Airplane Company)
Oliveira, D. C. R. e Oliveira, M. S.
23
____/____/____
Porcentagem Acumulada
80
A Figura 7.3 apresenta um grfico de Pareto para a produo de avies de transporte da Boeing Commercial Airplane Company no ano de 2000. Note que o 737 foi o modelo mais popular, seguido pelos 777, 757, 767, 717, 747, MD-11 e o MD-90. A linha no grfico de Pareto conecta as porcentagens acumuladas dos k modelos produzidos com maior freqncia (k = 1, 2, 3, 4, 5). Nesse exemplo, os dois modelos produzidos com maior freqncia respondem aproximadamente 69% do total dos avies produzidos em 2000.
Nmero de Defeitos
80 70 60 50 40 30 20 10 0
30 21 6 6 5 5 4 4
100 80 60 40 20 0
Tipo de Defeito
ia as es as as os as iv tr nc nt ur ad o ad o t u e r h c i l n O a /g q ifi an sa co as ap br /r se s d l o s u l a d te ro de en m o ar fu /f ra a s n P s r o e e e F s d rt Fo lh r te ta ta Pa l a n P E Fa Count 30 21 6 6 5 5 4 4 Percent 37,0 25,9 7,4 7,4 6,2 6,2 4,9 4,9 Cum % 37,0 63,0 70,4 77,8 84,0 90,1 95,1 100,0 o rn
Os grficos de Pareto so muito teis na anlise dos dados defeituosos em sistemas de produo. A Figura 7.4 apresenta um grfico de Pareto que mostra a freqncia com que vrios tipos de defeitos ocorrem em peas de metal usadas em um componente estrutural da moldura de uma porta de automvel. Note como o grfico de Pareto reala os relativamente poucos defeitos que so responsveis pela maioria dos defeitos observados na pea. O grfico de Pareto parte importante no programa de melhora da qualidade, porque permite que a gerncia e a engenharia concentrem sua ateno nos defeitos mais crticos do produto ou processo. Uma vez identificados esses defeitos crticos, devem-se desenvolver e implementar aes corretivas para reduzi-los ou elimin-los.
Curiosidade: O grfico de Pareto tem esse nome em homenagem ao economista italiano Vilfredo Pareto que estabeleceu a teoria de que, em certas economias, a maior parte da riqueza (80%) pertence minoria da populao (20%).
Oliveira, D. C. R. e Oliveira, M. S.
24
____/____/____
Porcentagem Acumulada
90
Tabela 7.2: Freqncias e Porcentagens dos empregados da seo de oramentos da Companhia MB, segundo o nmero de filhos. Nmeros de Filhos (xi) Freqncia (ni) Porcentagem (100 x fi) 0 4 20 1 5 25 2 7 35 3 3 15 4 0 0 5 1 5 Total n = 20 100 Fonte: Bussab e Morettin (2002)
Oliveira, D. C. R. e Oliveira, M. S.
25
____/____/____
Exemplo: Considere a varivel tempo, em segundos, entre carros que passam por um cruzamento, viajando na mesma direo: 6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4, 5, 2, 10.
10
7.2.3. Histograma
O Histograma utilizado para representar a distribuio de freqncia. um grfico de barras contguas, com bases proporcionais aos intervalos de classes e a rea de cada retngulo proporcional respectiva freqncia relativa. Indicaremos a amplitude do i-simo intervalo por ai. Para que a rea do retngulo respectivo seja proporcional a fi, a sua altura deve ser proporcional a di = fi/ai, que chamada de densidade de freqncia da i-sima classe. Quanto mais dados tivermos em cada classe, mais alto deve ser o retngulo. Com essa conveno, a rea total do histograma ser 1 (um).
Exemplo: Considerando a varivel Salrio dos empregados da seo de oramentos da Companhia MB, temos os seguintes dados: Tabela 7.3: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da Companhia MB, por faixas de salrio Classe de Freqncia Proporo Porcentagem Densidade de Freqncia Salrio (ni) (fi) (100 x fi) (di = fi/ai) 04 |-- 08 10 0,2778 27,78 0,0695 08 |-- 12 12 0,3333 33,33 0,0833 12 |-- 16 8 0,2222 22,22 0,0556 16 |-- 20 5 0,1389 13,89 0,0347 20 |-- 24 1 0,0278 2,78 0,0070 n = 36 1,0000 100,00 Total
Oliveira, D. C. R. e Oliveira, M. S.
26
____/____/____
0,09 0,08
D ensidade de Freqncia
0,0347
0,007
04 |-- 08
08 |-- 12
16 |-- 20
20 |-- 24
Figura 7.7: Histograma da varivel Salrio 7.2.4. Grfico em Linhas (ou Grfico Temporal)
um grfico utilizado para representar observaes feitas ao longo do tempo, em intervalos iguais ou no. Tais conjuntos de dados constituem as chamadas sries histricas, ou sries temporais. Traduzem o comportamento de um fenmeno em certo intervalo de tempo.
Tabela 7.4: Dvida Externa do Brasil de 1956 a 2006, em Milhes de Dlares. Ano Dvida Ano Dvida Ano Dvida
1956 2736 1957 2491 1958 2870 1959 3160 1960 3738 1961 3291 1962 3533 1963 3612 1964 3294 1965 3823 1966 3771 1967 3440 1968 4092 1969 4635 1970 6240 1971 8284 1972 11464 Fonte: IPEADATA
Oliveira, D. C. R. e Oliveira, M. S.
1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
14857 20032 25115 32145 37951 52187 55803 64259 73963 85487 93745 102127 105171 111203 121188 113511 115506
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
123439 123910 135949 145726 148295 159256 179935 199998 241644 241468 236156 226067 227689 235414 220182 187987 191999
27
____/____/____
250000
200000
150000
100000
50000
20 0
19 9
19 7
19 7
19 9
19 7
19 6
19 9
19 5
19 6
19 7
19 5
19 8
19 8
19 6
19 8
19 6
Ano
Figura 7.8: Grfico de Linhas para a varivel Dvida Externa do Brasil no perodo 1956 a 2006 7.2.5. Ramo-e-Folhas
Suponha que os dados sejam representados por x1, x2, ..., xn, e que cada nmero xi consista em, pelo menos, dois dgitos. Para construir um diagrama ramo-e-folhas dividimos cada nmero xi em duas partes: um ramo, que consiste em um ou mais dos dgitos lderes, e uma folha, que consiste nos dgitos restantes. Por exemplo, se os dados representam porcentagens de defeitos (valores entre 0 e 100), em lotes de placas de semicondutores, ento poderamos dividir o valor 76 no ramo 7 e na folha 6. Em geral, devemos escolher poucos ramos em comparao com o nmero de observaes. Usualmente, utilizado entre 5 e 20 ramos. Uma vez escolhido um conjunto de ramos, eles so listados ao longo da margem esquerda do diagrama e, ao lado de cada ramo, so listadas todas as folhas que correspondem aos valores dos dados observados.
Tabela 7.5: Fora de ruptura em libras por polegada para 100 garrafas descartveis de 1 litro de refrigerante. 176 221 242 253 261 265 271 278 286 301 187 223 243 254 262 265 272 278 287 307 197 228 245 254 263 267 274 280 290 308 200 231 246 257 263 267 274 280 293 317 205 231 248 258 264 268 274 280 294 318 208 234 248 258 264 268 274 280 296 321 210 235 250 260 265 269 275 281 298 328 214 235 250 260 265 269 276 281 299 334 215 235 250 260 265 270 276 283 299 337 220 242 251 260 265 271 277 283 300 346
Fonte: Hines et al. (2006), p. 157.
Oliveira, D. C. R. e Oliveira, M. S. ____/____/____
28
19 8
19 8
19 6
19 7
19 9
19 9
20 0
20 0
20 0
1 17 6 2 18 7 3 19 7 6 20 058 9 21 045 13 22 0138 19 23 114555 26 24 2235688 36 25 0001344788 (22) 26 0000123344555555778899 42 27 01124444566788 28 28 0000113367 18 29 0346899 11 30 0178 7 31 78 5 32 18 3 33 47 1 34 6 Figura 7.9: Diagrama ramo-e-folhas para os dados da fora de ruptura de garrafas da Tabela 7.5. O ramo-e-folhas resultante est representado na Figura 7.9. A inspeo dessa representao revela imediatamente que a maioria das foras de ruptura fica entre 220 e 308 psi, e que o valor central est em algum ponto entre 260 e 270 psi. Alm disso, as foras de ruptura esto distribudas de maneira aproximadamente simtrica em torno do valor central. Assim, o ramo-e-folhas, como o histograma, nos permite determinar rapidamente algumas caractersticas importantes dos dados que no eram to imediatamente bvias na apresentao original da Tabela 7.5. Note que, aqui, os nmeros originais no se perdem, como ocorre em um histograma. Atravs do ramo-e-folhas podemos calcular qualquer medida de posio e disperso.
M x im o
Q1 M n im o
25%
Q 1 -1 ,5 (Q 3 -Q 1 )
29
____/____/____
O diagrama de caixas ou desenho esquemtico ou box-plot til na comparao de duas ou mais amostras. Para ilustrar considere os dados da Tabela 7.6, retirados de Hines et al (2006), que representam leituras de viscosidade em trs misturas diferentes de uma matria-prima usada em uma linha de produo. Um dos objetivos do estudo que Hines et al discutem comparar as trs misturas.
Tabela 7.6: Medidas de viscosidade para trs misturas Mistura 1 Mistura 2 Mistura 3 22,02 21,49 20,33 23,5 22,56 20,49 23,83 22,67 21,67 25,38 22,78 21,95 25,49 24,18 22,28 25,9 24,46 22,45 26,67 24,62 27,00
A Figura 7.11 a seguir apresenta os box-plot para os dados da viscosidade. Essa apresentao permite uma interpretao fcil dos dados. A mistura 1 tem viscosidade mais alta do que a mistura 2, e esta tem viscosidade mais alta que a mistura 3. A distribuio da viscosidade no simtrica, porque as linhas superior e inferior e os comprimentos das caixas superior e inferior em torno da linha mediana no so iguais. O valor da viscosidade mxima da mistura 3 parece alta, em comparao com os demais valores da mistura 3 e, tambm, maior que os valores das demais misturas 1 e 2. Essa observao um outlier, e ela exige exame e anlise mais aprofundados.
27
26,67 27
26
25,9 25,38
Viscosidade (centipoise)
25 24
23,5
24,62 24,46
23 22 21
22,02 21,49
22,78 22,56
22,45 21,95
20,49
20 Mistura 1 Mistura 2
20,33
Mistura 3
Figura 7.11: Diagramas de caixas para os dados de viscosidade da mistura na Tabela 7.6.
Oliveira, D. C. R. e Oliveira, M. S.
30
____/____/____
Oliveira, D. C. R. e Oliveira, M. S.
31
____/____/____
8. CORRELAO E REGRESSO
8.1. Estudo da relao entre variveis
O objetivo investigar a presena ou ausncia de relao linear sob trs pontos de vista: (a) Inspeo visual: diagrama de disperso (b) Quantificando a fora dessa relao: coeficiente de correlao. (c) Explicitando a forma dessa relao: ajuste de uma reta.
Exemplos: 1) Idade e altura das crianas; 2) Tempo de prtica de esportes e ritmo cardaco; 3) Tempo de estudo e nota na prova; 4) Taxa de desemprego e taxa de criminalidade; 5) Expectativa de vida e taxa de analfabetismo. 8.2. Diagrama de Disperso
Utilizado para estudar a relao entre duas variveis quantitativas, fornecendo uma representao grfica das duas variveis.
Tabela 8.1: Pares de observaes (Xi, Yi) Tempo Nota 3,0 4,5 7,0 6,5 2,0 3,7 1,5 4,0 12,0 9,3 Construo do Grfico de Disperso
No Excel podemos fazer: Coluna A: Valores de X (Tempo) Coluna B: Valores de Y (Notas) Selecione as duas colunas e clique no cone Assistente de Grfico. Selecione o grfico de Disperso (XY).
Oliveira, D. C. R. e Oliveira, M. S.
32
____/____/____
10 9 8 7 6
Nota
5 4 3 2 1 0
6
Tempo
10
12
14
Exemplo: Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual gasta com Assistncia Mdica. Numa pesquisa feita com 11 famlias com renda bruta mensal entre 10 e 60 salrios mnimos mediram-se: X: renda bruta mensal (em salrios mnimos) Y: porcentagem da renda bruta anual gasta com assistncia mdica
Tabela 8.2
X 12 16 18 20 28 30 Y 7,2 7,4 7,0 6,5 6,6 6,7 X 40 48 50 54 32 Y 6,0 5,6 6,0 5,5 6,5
Oliveira, D. C. R. e Oliveira, M. S.
33
____/____/____
10
20
40
50
60
Figura 8.2: Diagrama de Disperso para as variveis Renda Bruta Mensal e Porcentagem da Renda Bruta Anual gasta com Assistncia Mdica.
Nesta Figura 8.2, temos o diagrama de disperso de X (Renda Bruta Mensal) e Y (Porcentagem da Renda Bruta Anual gasta com Assist. Mdica). Podemos notar que, conforme aumenta a renda bruta mensal, a porcentagem da renda bruta anual gasta com assistncia mdica diminui. Nota-se tambm uma tendncia linear decrescente. Fazendo apenas uma mudana na escala do eixo Y da Figura 8.2, obtemos a Figura 8.3, que ilustra com maior clareza essa tendncia linear decrescente.
7,5
6,5
5,5
10
20
40
50
60
Figura 8.3: Diagrama de Disperso para as variveis Renda Bruta Mensal e Porcentagem da Renda Bruta Anual gasta com Assistncia Mdica.
Oliveira, D. C. R. e Oliveira, M. S.
34
____/____/____
(X
i =1
X )(Yi Y )
(n 1) S x S y
X Y
i =1
i i
nXY (9.1)
(n 1) S x S y
onde
X e Y so as mdias amostrais das variveis X e Y , respectivamente. S x e S y so os desvios padro das variveis X e Y , respectivamente
Recordando: S x =
(X
i =1
X )2 e Sy =
(Y
i =1
Y )2
n 1
n 1
30
Y
20 10 10 20 30 40 50
Oliveira, D. C. R. e Oliveira, M. S.
35
____/____/____
O valor do coeficiente de correlao no depende da escala que medimos as variveis. Para as duas figuras abaixo o valor do coeficiente de correlao r = 0,46 .
Y
Z=Y/10+0,8
r 0,01
O coeficiente de correlao linear sensvel a valores discrepantes.
r =0
r = 0.91
Oliveira, D. C. R. e Oliveira, M. S.
36
____/____/____
Exemplo: Considere o Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual gasta com Assistncia Mdica. Obter o coeficiente de correlao com os dados da Tabela 8.2. Medidas Descritivas com os dados da Tabela 8.2 Mdia X 31,63636 Mdia Y 6,454545 Desvio de X 14,63744 Desvio de Y 0,62348 n 11 Soma XY 2160,4
r=
i =1
X i Yi nXY (n 1)S x S y
Podemos observar uma correlao negativa entre a renda bruta mensal e a porcentagem da renda bruta anual gasta com assistncia mdica, isto quanto maior for a renda bruta mensal, menor a porcentagem de sua renda gasta com assistncia mdica.
8.4. Regresso Linear Simples
Definio de a e b a: intercepto; b: inclinao da reta. Interpretao de b: Para cada aumento de uma unidade em X, temos um aumento mdio de b unidades em Y.
Podemos calcular a e b utilizando o mtodo de mnimos quadrados, que visa encontrar os valores de a e b, que minimiza a soma dos quadrados dos erros (ou desvios)
O problema agora se restringe a encontrar o mnimo de uma funo de duas variveis, a e b. Derivando e igualando a zero, observamos que as solues de a e b devem satisfazer:
a = Y bX
Oliveira, D. C. R. e Oliveira, M. S.
b=
37
i =1
X i Yi nXY
(n 1) S x2
____/____/____
Reta Ajustada - Uso do Excel Coluna A: varivel Y; Coluna B: varivel X. Para pedir reta que se ajusta aos dados devemos utilizar os seguintes comandos: =INTERCEPO(A1:An;B1:Bn): Mostrar o intercepto (a); =INCLINAO(A1:An;B1:Bn): Mostrar a inclinao (b). Exemplo: Consumo de cerveja e temperatura As variveis foram observadas em nove localidades com as mesmas caractersticas demogrficas e scio-econmicas. Y: consumo de cerveja em um dia (em 100 litros) X: temperatura mxima (em C) Os dados amostrais esto dispostos na Tabela 8.3. Tabela 8.3 Consumo Temperatura 290 36 374 36 393 22 425 15 406
Y=
Sy =
X Y
i =1
i i
Figura 8.4: Diagrama de Disperso para as variveis Temperatura Mxima e Consumo de Cerveja, juntamente com a Reta de Regresso
Oliveira, D. C. R. e Oliveira, M. S.
38
____/____/____
A quantidade r2 = (quadrado do coeficiente de correlao x 100%) chama-se coeficiente de determinao e , em geral, usada para julgar-se a adequao de um modelo de regresso. Claramente, 0 r2 100. Na prtica, nos referimos a r2 de modo mais informal como a quantidade de variabilidade nos dados explicada pelo, ou devido ao, modelo de regresso.
Exemplo: Considere o estudo da renda bruta mensal pela porcentagem da renda bruta anual gasta com assistncia mdica, onde o coeficiente de correlao deu aproximadamente -0,9399, com os dados da Tabela 8.2, logo, o coeficiente de determinao ser r2 88,35%, isto , 88,35% da variabilidade nos dados explicada pelo modelo de regresso y = 7,7212 0,04x.
7,5
6,5
5,5 y = -0,04x + 7,7212 2 R = 0,8835 5 10 15 20 25 30 35 40 45 50 55 60 renda bruta mensal (em salrios mnimos)
Oliveira, D. C. R. e Oliveira, M. S.
39
____/____/____
Tempo Nota
3 4,5
7 6,5
2 3,7
1,5 4
12 9,3
(a) Faa o Grfico de Disperso. (b) Obtenha o Coeficiente de Correlao. (c) Calcule a Reta de Regresso e represente no Grfico de Disperso. (d) Obtenha o coeficiente de determinao.
Oliveira, D. C. R. e Oliveira, M. S.
40
____/____/____
Lista de Exerccios 1 1) Identifique a populao e a amostra correspondente : A fim de avaliar a inteno de voto para presidente dos brasileiros, 122 pessoas foram entrevistadas em Braslia. 2) Classifique as seguintes variveis: a) Conceitos obtidos na Disciplina Estatstica (R:Ruim, M:Mdio, B:Bom e O:timo); b) Bacias Hidrogrficas (A:Amaznica, P:Platina, SF:So Francisco, N:do Nordeste, L:do Leste, S:do Sul); c) Nmero de sementes germinadas (0, 1, 2, 3, 4, 5); d) Renda; 3) Selecione uma amostra de tamanho 10 dentre 80 funcionrios, utilizando as tcnicas de amostragem aleatria simples e sistemtica. Depois, levando em conta que o sexo dos funcionrios importante na pesquisa, obtenha uma amostra de mesmo tamanho utilizando amostragem estratificada proporcional considerando que dos 80 funcionrios, 30 so mulheres e 50 so homens. (Utilize a primeira linha da tabela de nmeros aleatrios, quando for necessrio) 4) Uma certa cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que esto dentro dessas zonas eleitorais, isto , foi utilizada amostragem por conglomerado. Apresentem quais sero as 15 zonas eleitorais amostradas. (Utilize a primeira linha da tabela de nmeros aleatrios, quando for necessrio) 5) Os dados a seguir referem-se aos conceitos obtidos de n = 60 alunos, na disciplina de Estatstica na Escola E. Tabela 1: Dados Brutos R : Ruim M : Mdio B: Bom O : timo M R M M M R B B M M R B M M M M R B B R B M R M B M R M R M B M R M R M B M B M B B B B O M M M M M B B B B B B B O B O a) Organize os dados abaixo em uma Tabela de Freqncias, com ttulo, freqncias absoluta e relativa, porcentagens e interpretao. b) Faa os grficos de barras,o de composio em setores e o de Pareto para os dados da Tabela 1. 6) Os dados abaixo se referem ao comprimento de 31 canos PVC vendidos em uma loja de material de construo. Tabela 2: Dados Brutos (em m) 19,5 20,0 14,1 16,1 10,0 16,0 22,0 20,5 15,0 16,7 22,0 12,5 16,3 15,3 16,0 13,8 19,7 17,0 14,1 18,8 12,3 15,5 14,7 20,3 17,4 19,5 17,9 18,2 16,9 19,3 16,9
a) Obtenha as medidas de posio: mnimo, mximo, mdia, moda, mediana, Q1 e Q3. b) Obtenha as medidas de disperso: amplitude, varincia, desvio-padro e intervalo-interquartil.
Oliveira, D. C. R. e Oliveira, M. S.
41
____/____/____
c) Organize os dados da Tabela 2 em uma Tabela de Classes de Freqncias, com ttulo, freqncias absoluta e relativa, porcentagem e interpretao. Utilize uma amplitude de 2 para as classes. d) Faa o histograma utilizando os dados agrupados em (c), baseados na Tabela 2. e) Construa o dot-plot, box-plot e o ramo-e-folhas para os dados da Tabela 2.
7) Medidas da pulsao de 15 ndios nativos dos Alpes Peruanos esto apresentadas a seguir: Tabela 3: Medidas da pulsao 64 64 68 68 76 60 72 68 80 60 72 88 60 88 60 a) Calcule: Mdia, Mediana. Comente os resultados; b) Calcule: Mnimo, Q1, Q3 e Mximo. Interprete estas 4 estatsticas; c) Calcule: Varincia e Desvio Padro. Comente. d) Construa o grfico de barras para os dados de pulsao dos ndios. 8) Um rgo do governo do estado est interessado em determinar padres sobre o investimento em educao, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram obtidos os valores (codificados) da tabela abaixo: Tabela 4: Valores codificados do investimento em educao A B C D E F G H I J Cidade 7 19 15 14 16 19 18 Investimento 20 16 14 a) Calcule a mdia e o desvio-padro das observaes; b) Recebero um programa especial s cidades com valores de investimento inferiores mdia menos duas vezes o desvio padro. Alguma cidade receber o programa? c) Ser considerado como investimento bsico a mdia das observaes compreendidas entre a mdia original menos dois desvios padro e a mdia original mais dois desvios padro. Calcule o investimento bsico e compare com a mdia obtida no item a). Justifique a diferena encontrada. 9) Trs medicamentos para cicatrizao esto sendo testados e um experimento feito para estudar o tempo (em dias) do completo fechamento em cortes provenientes de cirurgia. Os resultados abaixo mostram o tempo de cicatrizao em cobaias submetidas a um dos trs tratamentos (A, B, C): Tabela 5: Tempo (em dias) do completo fechamento em cortes provenientes de cirurgia A 13 14 15 13 15 14 15 15 14 14 B 14 12 13 13 14 14 13 14 C 12 12 13 13 12 13 11 11 Analise os dados descritivamente utilizando todas as medidas apresentadas em aula e comente. 10) A seguir, temos informaes do nmero de peixes-boi mortos e o nmero de barcos de turismo (em milhares) que circulam em seu habitat na Flrida-EUA. Tabela 6: Dados Brutos Barcos(X) 68 68 67 70 71 73 76 81 83 84 Mortes(Y) 53 38 35 49 42 60 54 67 82 78
Oliveira, D. C. R. e Oliveira, M. S.
42
____/____/____
a) Observe o diagrama de disperso e comente sobre a relao linear dessas duas variveis. b) Verifique se a correlao significativa (atravs do coeficiente de correlao (r)). c) Obtenha a reta de regresso, considerando o nmero de peixes mortos a varivel dependente e o nmero de barcos como a varivel independente. d) Interprete o coeficiente de determinao (r2).
11) esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relao uma nutricionista selecionou 18 mulheres com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y). Tabela 7: Dados Brutos X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78 73 68 Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77 73 78 a) Faa o diagrama de disperso dos dados. b) Calcule o coeficiente de correlao linear entre X e Y e interprete-o. c) Ajuste uma reta de regresso para mostrar a relao linear entre as variveis Y: massa muscular (dependente) e X: idade (independente) e interprete os coeficientes.
X
i =1
18
= 1108 ;
X
i =1
18
2 i
= 70362 ;
Y
i =1
18
= 1530 ;
Y
i =1
18
= 133300 e
X Y
i =1
18
i i
= 91964 .
Oliveira, D. C. R. e Oliveira, M. S.
43
____/____/____
9. PROBABILIDADE
9.1. Processo ou Experimento Aleatrio Definio 1: Qualquer fenmeno que gere resultado incerto ou casual chamado de Processo ou Experimento Aleatrio. Exemplos: 1) Jogar uma moeda duas vezes e observar a seqncia obtida de caras e coroas;
3) Peso de Animais;
9.2. Espao Amostral () Definio 2: Espao amostral () o conjunto de todos os resultados possveis de um experimento aleatrio. Exemplos: Obtenha o espao amostral dos seguintes experimentos: 1) Jogar um dado e observar o resultado: = {1, 2, 3, 4, 5, 6}.
2) Lanar uma moeda duas vezes e observar as faces obtidas: 3) Uma urna contm 10 bolas azuis e 10 brancas. 3 bolas so retiradas ao acaso e as cores so anotadas: 4) Dois dados so lanados simultaneamente e estamos interessados na soma das faces observadas: 5) Uma moeda lanada consecutivamente at o aparecimento da 1 cara: 6) Uma mquina produz 20 peas por hora. Ao final da primeira hora de produo, observa-se o n de defeituosas: 7) Medio do tempo de vida de uma lmpada antes de se queimar:
Oliveira, D. C. R. e Oliveira, M. S.
44
____/____/____
9.3. Evento Definio 3: Evento qualquer subconjunto do espao amostral. Exemplos: (a) Alguns eventos do experimento 1: A = {5}, B = {2, 4, 6}, etc.
(b) Alguns eventos do experimento 2: Existem dois eventos especiais: espao todo () e o conjunto vazio ().
Operaes com Eventos Sejam A e B dois eventos de um mesmo espao amostral: O evento interseo de A e B, denotado AB, o evento em que A e B ocorrem simultaneamente.
A B
O evento unio de A e B, denotado AB, o evento em que A ocorre ou B ocorre (ou ambos).
A B
Exemplos: Operaes com Eventos. Seja 1 = {1, 2, 3, 4, 5, 6} e considere os seguintes eventos A = {2, 4, 6}, B = {4, 5, 6} e C = {1, 3, 5}. Faa as seguintes operaes: AB= AC = AB= A Bc = Eventos Disjuntos Definio 4: Dois eventos A e B so mutuamente exclusivos ou disjuntos se eles no podem ocorrer simultaneamente (A B = ).
A B
Exemplo:
Oliveira, D. C. R. e Oliveira, M. S.
45
____/____/____
2) Considere o seuinte espao amostral: = = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} Defina os eventos: A = nmero par: B = nmero mpar: C = mltiplo de 3: D = maior ou igual a 6: E = maior que 8: F = menor que 5: G = menor ou igual a 3: Obtenha os seguintes eventos: (a) A B = (b) A B = (c) (A B)c = (d) (A B)c = (e) C D = (f) E F = (g) (A G)c = (h) (Ec B)c =
Oliveira, D. C. R. e Oliveira, M. S.
46
____/____/____
1654 Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662), na Frana, estabelecem os Princpios do Clculo das Probabilidades.
No entanto, fcil perceber que o termo probabilidade j est enraizado no senso comum, pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais como: situaes de sua vida pessoal; organizando-se em relaes a horrios a cumprir, levando em conta as circunstncias do trfego; agasalhando-se ao sair de casa se a previso do tempo indicar uma frente fria. Em resumo, prevenindo-se em situaes de risco. Como podemos definir Probabilidade?
Probabilidade uma medida que quantifica a sua incerteza frente a um possvel acontecimento futuro.
H vrias maneiras de se medir a incerteza e costume se pensar na seguinte diviso: 1) Mtodo Clssico 3) Mtodo Subjetivo 2) Mtodo Freqentista 4) Mtodo Moderno ou Axiomtico O primeiro devido a Laplace e o mais conhecido, pois relaciona eventos favorveis com eventos possveis. O segundo consiste em repetir um experimento vrias vezes. O terceiro baseado na opinio pessoal e o ltimo devido a Kolmogorov e baseia-se no princpio de que qualquer experimento pode ser modelado.
Oliveira, D. C. R. e Oliveira, M. S.
47
____/____/____
9.6. Definio Clssica Definio 5 (Clssica): Dado um conjunto de N eventos equiprovveis, a probabilidade de ocorrncia de um determinado evento A, dado pela razo n P ( A) = N onde n o nmero de elementos em A e N o nmero de elementos em .
Exemplo: Considere o lanamento de uma moeda equilibrada, nesse caso o espao amostral associado = {Cara, Coroa}. Ento, pela definio clssica, a probabilidade de ocorrncia do evento cara P(cara) = . Exemplo: Populao Residente em So Joo del Rei em 2006
Idade Menor 1 Masculino 600 572 Feminino Total 1172 1a4 2592 2457 5049 5 a 9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 e mais 3411 3491 3774 7027 6699 5528 3300 2222 1085 397 3257 3482 3692 7059 7096 5863 3894 2910 1781 763 6668 6973 7466 14086 13795 11391 7194 5132 2866 1160 Total 40126 42826 82952
= conjunto de 82.952 habitantes residentes em So Joo del Rei em 2006 por faixa etria. Possveis eventos de interesse: M = Indivduo sorteado do sexo masculino F = Indivduo sorteado do sexo feminino A = Indivduo sorteado tem mais que 80 anos B = Indivduo sorteado tem entre 15 e 29 anos M A = Indivduo sorteado do sexo masculino e tem mais de 80 anos F B = Indivduo sorteado do sexo feminino ou tem entre 15 e 29 anos
Distribuio da Faixa Etria da Cidade de So Joo del Rei em 2006, por Sexo
16,69 16,57 20,00 17,51
18,00
Porcentagem
8,50
10,00 6,46
7,61
8,13
5,54 6,79
8,00
1,50 1,34
4,16
4,00
5,74
2,70
6,00
8,70
9,41
12,00
16,48
13,78
16,00
Oliveira, D. C. R. e Oliveira, M. S.
1,78
2,00
0,99
48
____/____/____
Exerccio Parte II A2: Suponha que um indivduo escolhido aleatoriamente na cidade de So Joo del Rei em 2006. Determine a probabilidade de ocorrer cada um dos eventos definidos.
9.7. Definio Freqentista Definio 6 (Freqentista): A probabilidade de ocorrncia de um determinado evento igual freqncia relativa de ocorrncia de tal evento, quando o processo aleatrio que o gerou for repetido infinitas vezes. Exemplo: Atividade Prtica do lanamento da moeda. Passo 1 Agrupem-se 2 a 2 e peguem uma moeda chamem o valor numrico da moeda de COROA (K ) e a outra face de CARA (C). Suponham que haja interesse em saber se a sua moeda honesta (isto significa saber se a probabilidade de CARA de sua moeda ou, em termos percentuais, se a probabilidade de sair Cara 50%). Passo 2 Um membro do grupo vai lanar a moeda e o outro vai marcar os resultados na planilha anexa, seguindo as seguintes instrues: a) Jogar a moeda uma vez e anotar C ou K no espao adequado (linha 2) da planilha. b) Repetir este procedimento 30 vezes, preenchendo um a um todos os espaos da linha 2. Passo 3 Continuando com a planilha, trocar de lugar com o parceiro, voltar para os itens a) e b) das instrues e continuar mais 30 jogadas at perfazer 60. Passo 4 Voltar ao primeiro da dupla e, ainda com a planilha, seguir as instrues: c) Depois do registro na linha 2 de todos os resultados como C ou K, passar para a linha 3: chamar CARA de 1 e COROA de 0 e colocar estes valores na planilha, abaixo de cada resultado j obtido na linha 2. Cada membro do grupo deve fazer metade um faz a linha de cima e o outro a linha de baixo.
d) Agora a linha 4 da planilha deve ser preenchida em cada posio deve ser colocado o nmero acumulado de CARAS, at aquela jogada (verifique que a jogada est explicitada na linha 1- que a linha n). Discutir com outro membro do grupo para ver se est claro se no, pergunte! A linha de baixo continuao do acumulado da linha de cima. e) Finalmente chegamos ltima linha linha 5: colocar a freqncia relativa (m/n) de CARAS em cada momento o que isto? Discuta com o outro membro do grupo (desprezar as entradas assinaladas com X).
Oliveira, D. C. R. e Oliveira, M. S.
49
____/____/____
1) 2) 3) 4) 5)
10
12
14
17
20
25
30
1) 2) 3) 4) 5)
31 32 33
40
47
50
55
60
Passo 5 depois de completar a 1a parte da planilha, construir a seguinte tabela, usando as linhas 4 e 5 da planilha:
n m/n 1 2 3 4 5 6 7 8 9 10 20 30 40 50 60
Passo 6 Completar o grfico, usando os valores da tabela recm construda, do seguinte modo: Eixo Y valores m/n Eixo X valores da linha 1: (n)
m/n 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1
1 2 3 4 5 6 7 8 9 10 20 n
30
40
50
60
Passo 7 Comparar os resultados com os colegas e interpretar o resultado comentando sobre a honestidade da sua moeda. Concluso: Com isto chegamos a uma possvel definio freqentista de probabilidade, ou seja, probabilidade o valor em que a freqncia relativa se estabiliza aps um nmero muito grande de ensaios.
Oliveira, D. C. R. e Oliveira, M. S.
50
____/____/____
9.8. Definio Subjetiva Definio 7 (Subjetiva): Cada indivduo, baseado em informaes anteriores e na sua opinio pessoal a respeito de um evento em questo, pode ter uma resposta para a probabilidade desse evento. Exemplo: Um mdico experiente consegue calcular uma probabilidade do indivduo ter uma determinada doena baseado nos sintomas que o indivduo apresenta. 9.9. Definio Moderna Definio 8 (Moderna): Probabilidade uma funo P(.), que associa a cada evento do espao amostral , um nmero real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:
(1) 0 P(A) 1. (2) P() = 1. (3) Se A e B so eventos mutuamente exclusivos: P(AB) = P(A) + P(B).
Exemplos:
Segue alguns exemplos de funes j descobertas na literatura para calcular probabilidades, que sero discutidas em detalhes nos captulos posteriores. 1) Distribuio Bernoulli
P(X = x ) = p x (1 p )1 x , x = 0, 1. 2) Distribuio Binomial n x nx P(X = x ) = p p (1 p ) , x = 0, 1, ..., n. 3) Distribuio Hipergeomtrica r N r x n x , 0 x mnimo(r, n). P(X = x ) = N n 4) Distribuio Poisson
e x , x = 0, 1, ... x!
51
____/____/____
6) Distribuio t de Student
2 [(k + 1) / 2] 1 + x f (x) = k [k / 2] k 7) Distribuio Qui-Quadrado
(k +1) / 2
, - < x< +
f (x) =
1
k k/2 22
k 1 x 2
e 2,x>0
Propriedades P1: P() = 0, onde o conjunto vazio. P2: Se Ac for o evento complementar de A, ento P(Ac) = 1 P(A). P3: Se A e B forem dois eventos quaisquer, ento P(A B) = P(A) + P(B) P(A B). P4: Se A B, ento P(A) P(B). Nos captulos posteriores veremos algumas distribuies de probabilidade para variveis discretas e contnuas comumente utilizadas. 9.10. Probabilidade Condicional A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade de um evento A ocorrer sabendo que um evento B j ocorreu. Sejam A e B dois eventos associados a um mesmo espao amostral . Denota-se por P(A|B) a probabilidade condicionada do evento A, quando o evento B tiver ocorrido. Sempre que calculamos P(A|B), estamos essencialmente calculando P(A) em relao ao espao amostral reduzido devido a B ter ocorrido, em lugar de faz-lo em relao ao espao amostral original . Assim, uma definio mais formal de probabilidade condicional dada pela definio 9. Definio 9 (Probabilidade Condicional): Dados dois eventos A e B, a probabilidade condicional de A dado que ocorreu B representada por P(A | B) e definida por P( A B) P( A | B) = , P( B) > 0 P ( B) Da definio de probabilidade condicional, obtemos a regra do produto de probabilidades.
P( A B) = P( B)P( A | B)
Exemplo: Voltando ao Exemplo da Populao Residente em So Joo del Rei em 2006, temos:
Idade Menor 1 Masculino 600 Feminino 572 Total 1172 1a4 2592 2457 5049 5 a 9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 e mais 3411 3491 3774 7027 6699 5528 3300 2222 1085 397 3257 3482 3692 7059 7096 5863 3894 2910 1781 763 6668 6973 7466 14086 13795 11391 7194 5132 2866 1160 Total 40126 42826 82952
52
____/____/____
Se soubermos que um indivduo sorteado do sexo masculino, qual a probabilidade de que ele tenha idade entre 30 e 39 anos? B = indivduo do sexo masculino e A = tem idade entre 30 e 39 anos 6699 P(A B) 82952 6699 P(A | B) = = = = 0,167 40126 40126 P(B) 82952
Exerccio Parte II A2: Na Segunda Guerra Mundial, houve um esforo de pesquisa operacional na Inglaterra direcionado a estabelecer padres de busca de submarinos alemes pelas patrulhas areas. Por algum tempo, houve uma tendncia em concentrar os vos em reas prximas costa, uma vez que se acreditava que mais avistamentos tinham ocorrido ali. O grupo de pesquisa estudou os registros de 1000 patrulhas, obtendo os seguintes resultados (os dados so fictcios):
Prximo costa (B1) Alto-mar (B2) Total Houve avistamento (A1) 80 20 100 No houve avistamento (A2) 820 80 900 Total de Patrulhas 900 100 1000 (a) Dado que a patrulha estava prximo costa, qual a probabilidade de que houve avistamento? (b) Dado que a patrulha estava em alto-mar, qual a probabilidade de que houve avistamento? (c) Os resultados de (a) e (b) indicam uma estratgia de busca contrria prtica anterior?
9.11. Independncia de Eventos Definio 10: Dois eventos A e B so independentes se a ocorrncia de um no altera a probabilidade de ocorrncia do outro, isto , P(A|B) = P(A) ou P(B|A) = P(B), ou ainda, a seguinte forma equivalente:
P(AB) = P(A) P(B)
Exemplo: Joaninha tem probabilidade de 0,8 de passar no vestibular enquanto que Joozinho tem probabilidade de 0,6. Qual a probabilidade dos dois passarem no vestibular? Qual a suposio a ser feita nesse caso para calcular a probabilidade? Sejam os eventos: A: Joaninha passa no vestibular e B: Joozinho passa no vestibular P(AB) = 0,8.0,6 = 0,48 Exerccio Parte II A2: O campo da Engenharia da confiabilidade se desenvolveu rapidamente a partir do incio da dcada de 1960. Um tipo de problema encontrado o de se estimar a confiabilidade de um sistema a partir das confiabilidades dos subsistemas. A confiabilidade definida, aqui, como a probabilidade do funcionamento apropriado durante um certo perodo de tempo. Considere a estrutura de um sistema em srie simples, como o da figura a seguir: Sistema
Subsistema 1
Oliveira, D. C. R. e Oliveira, M. S.
Subsistema 2
53
____/____/____
O sistema funciona se e somente se o subsistema 1 e o subsistema 2 funcionarem. Se os subsistemas sobrevivem independentemente, a confiabilidade do subsistema 1 de 0,90 e do subsistema 2 de 0,80, qual a confiabilidade do sistema?
P(A) = P(B).P(A | B) + P(Bc).P(A | Bc) Exemplo: O Cruzeiro ganha com probabilidade 0.7 se chove e 0.8 se no chove. Em maio a probabilidade de chuva de 0.3. Qual a probabilidade do Cruzeiro ganhar uma partida no ms de maio? A: Cruzeiro vencer; B: chove; Bc: No chove P(A) = P(B).P(A | B) + P(Bc).P(A | Bc) = 0,3.0,7 + 0,7.0,8 = 0,77 Exerccio Parte II A2: Em um centro de mquinas, h quatro mquinas automticas de parafusos. Uma anlise dos registros de inspeo passados fornece os seguintes dados: Mquina Percentual de Produo Percentual de Defeituosos Produzidos 1 15 4 2 30 3 3 20 5 4 35 2 As mquinas 2 e 4 so mais novas e, assim, a maior parte da produo foi atribuda a elas. Suponha que o estoque atual reflita as porcentagens de produo indicadas. Se um parafuso selecionado aleatoriamente do estoque, qual a probabilidade de que seja defeituoso? 9.13. Teorema de Bayes
Finalmente, uma das relaes mais importantes envolvendo probabilidades condicionais dada pelo Teorema de Bayes. Thomas Bayes (1702-1761) afirmou que as probabilidades devem ser revistas quando conhecemos algo mais sobre os dados. A verso mais simples desse teorema dada pela frmula P(A B) P(B | A) P(A) P(A | B) = = P(B) P(B) A forma geral do Teorema de Bayes pode ser introduzida da seguinte forma: Considere a seqncia {C1, C2, ..., Cn} como sendo uma partio do espao amostral , isto , Ci Cj = sempre que i j e C1 C2 ... Cn = . Considere um evento qualquer A em . Suponha que sejam conhecidas as probabilidades de cada partio (P(Ci)) e as probabilidades condicionais P(A|Ci).
Oliveira, D. C. R. e Oliveira, M. S.
54
____/____/____
Logo, temos o seguinte teorema: Teorema: A probabilidade de ocorrncia do evento Ci, supondo a ocorrncia do evento A, dado por P(C i )(A | C i ) P (C i | A ) = n P(C j )(A | C j )
j=1
Curiosidade O teorema de Bayes, que aparentemente poderia ser encarado como mais um resultado na teoria de probabilidades, tem importncia fundamental, pois fornece a base para uma abordagem da inferncia estatstica conhecida como inferncia bayesiana. Como estamos falando do Thomas Bayes, no podemos deixar de fazer um breve comentrio sobre o que chamamos de probabilidades subjetivas, ou seja, cada indivduo, baseado em informaes anteriores e na sua opinio pessoal a respeito de um evento em questo, pode ter uma resposta para a probabilidade desse evento. A inferncia Bayesiana toma como uma de suas bases o fato de que todas as probabilidades so subjetivas. O teorema de Bayes tem um papel importante nesse tipo de inferncia, pois passa a ser visto como um mecanismo de atualizao de opinies, ou seja, o indivduo aprende B e passa a ter opinio P(A|B) sobre A. As probabilidades associadas a eventos de modo subjetivo tm propriedades anlogas as que foram mencionadas nesse texto. Exemplo:
Nveis Histricos de Qualidade de Dois Fornecedores
% de Peas Ruins 2 5
Considere uma empresa fabricante que recebe embarques de peas de dois diferentes fornecedores. Atualmente, 65% das peas compradas pela empresa so do fornecedor 1 e o restante, 35%, so do fornecedor 2. Dado que uma pea selecionada seja defeituosa, qual a probabilidade dela ter vindo do fornecedor 2? P ( F2 | D ) = P(D | F2) P(F2) P(D | F2) P(F2) 0,05.0,35 0,0175 = = = 0,57 P ( D) P(D | F1) P(F1) + P(D | F2) P(F2) 0,02.0,65 + 0,05.0,35 0,0305
Exerccio Parte II A2: Em um centro de mquinas, h quatro mquinas automticas de parafusos. Uma anlise dos registros de inspeo passados fornece os seguintes dados: Mquina Percentual de Produo Percentual de Defeituosos Produzidos 1 15 4 2 30 3 3 20 5 4 35 2 Suponha que o estoque atual reflita as porcentagens de produo indicadas. Se um parafuso selecionado aleatoriamente do estoque e ele defeituoso, qual a probabilidade de que seja da mquina 2?
Oliveira, D. C. R. e Oliveira, M. S.
55
____/____/____
10.1. Introduo Vamos incorporar o conceito de probabilidade ao estudo de variveis associadas a caractersticas em uma populao. Muitos experimentos produzem resultados no-numricos. Antes de analis-los, conveniente transformar seus resultados em nmeros. Isto feito atravs da varivel aleatria que uma funo que associa um valor numrico a cada ponto do espao amostral. Para entender melhor o conceito, considere o seguinte exemplo. Exemplo: Observa-se o sexo das crianas em famlias com trs filhos. O espao amostral = {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)} Uma varivel aleatria de interesse : X = {n. de crianas do sexo masculino}. A cada evento simples, ou ponto de , associamos um nmero, que o valor assumido pela varivel aleatria X:
Evento X MMM 3 MMF 2 MFM 2 FMM 2 MFF 1 FMF 1 FFM 1 FFF 0
Poderamos tambm ter considerado o n. de crianas do sexo feminino. Os valores de X, na mesma ordem, seriam ento 0, 1, 1, 1, 2, 2, 2, 3.
Obs: A expresso varivel aleatria ser abreviada por v.a.. Definio: uma v.a. discreta quando o conjunto de valores possveis for finito ou infinito numervel. Exemplos: Nmero de filhos, Nmero de bactrias numa lmina, nmero de lmpadas em uma residncia, etc. O passo fundamental para entendermos uma v.a. discreta associar a cada valor a sua probabilidade, obtendo o que se chamamos de distribuio de probabilidade.
X P(X=x)
Oliveira, D. C. R. e Oliveira, M. S.
x1 P(X=x1)
x2 P(X=x2)
56
... ...
xn P(X=xn)
____/____/____
n i =1
P ( X = xi ) = 1
Exemplo: Um certo departamento da UFSJ formado por 35 professores, sendo 21 homens e 14 mulheres. Uma comisso de 3 professores ser constituda, sorteando-se, ao acaso, trs membros do departamento. Qual a probabilidade da comisso ser formada por pelo menos duas mulheres?
Seja X = { n. de mulheres na comisso}.
Espao Amostral HHH HHM HMH MHH HMM MHM MMH MMM
X 0 1 1 1 2 2 2 3
14 13 12 x x = 0,056 35 34 33
10.2. Esperana Matemtica (Mdia) Assim como definimos a mdia de uma distribuio de freqncias como a soma dos produtos dos diversos valores observados pelas respectivas freqncias relativas, natural definirmos agora a mdia de uma v.a., ou de sua distribuio de probabilidade, como a soma dos produtos dos diversos valores de xi da v.a. pelas respectivas probabilidades P(xi). A mdia de uma v.a. X tambm chamada valor esperado ou esperana matemtica, ou simplesmente esperana de X. representada por E(X) e se define como
Nmero xi 0 1 2 3 4 5 Probabilidade P(X = xi) 0,1 0,1 0,2 0,3 0,2 0,1 Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma semana?
Oliveira, D. C. R. e Oliveira, M. S.
57
____/____/____
Soluo: Calculemos inicialmente E(X), que o nmero esperado de aparelhos vendidos em uma semana: E(X) = (0)(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70. Para x unidades vendidas o lucro 20x. Logo, o lucro esperado de R$ 54,00. 10.3. Varincia Assim como a mdia uma medida de posio de uma v.a., natural que procuremos uma medida de disperso dessa varivel em relao mdia. Essa medida a varincia, a ser representada por 2 e definida por
Desenvolvendo o termo quadrtico do somatrio, obtemos uma expresso mais fcil de calcular a varincia dada por: 2 = Var (X) = E(X 2 ) [E (X)]2 onde E(X 2 ) = x i2 P(X = x i ) .
i =1 n
Desvio Padro O desvio padro () a raiz quadrada positiva da varincia. Tem sobre essa ltima a vantagem de exprimir a disperso na mesma unidade de medida da v.a.:
= 2
10.4. Exerccio Parte II A2 1) A distribuio de X: n de crianas por domiclio numa determinada regio dada pela tabela abaixo: X 0 1 2 3 4 5 P(X = x) 0,10 0,15 0,25 0,30 0,15 0,05 Calcule: (a) O nmero mdio de crianas por domiclio, X. (b) O desvio padro de X, X. (c) A probabilidade P{X - X X X + X}.
10.5. Distribuio Bernoulli Na prtica existem muitos experimentos que admitem apenas dois resultados. Exemplos: 1) Uma pea classificada como boa ou defeituosa; 2) Um entrevistado concorda ou no com a afirmao feita; 3) O resultado de um exame mdico para deteco de uma doena positivo ou negativo; 4) No lanamento de um dado ocorre ou no a face 5.
Oliveira, D. C. R. e Oliveira, M. S.
58
____/____/____
Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas do tipo sucesso-fracasso. Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma v.a. com distribuio Bernoulli.
Varivel Aleatria de Bernoulli uma v.a. X que assume apenas dois valores: 1 se ocorrer sucesso, e 0 se ocorrer fracasso, e, sendo p a probabilidade de sucesso, 0 < p < 1. Denotamos por X ~ Bernoulli (p) uma v. a. com distribuio de Bernoulli com parmetro p.
1, se ocorrer sucesso X= 0, se ocorrer fracasso e funo de probabilidade, X P(X=x) Segue-se que E(X) = p e Var(X) = p(1-p) Repeties independentes de um ensaio de Bernoulli do origem ao modelo binomial.
10.6. Distribuio Binomial Experimento Binomial: o experimento (a) que consiste em n ensaios de Bernoulli; (b) cujos ensaios so independentes; e (c) para o qual a probabilidade de sucesso em cada ensaio sempre igual a p, 0 < p < 1. A v.a. X, correspondente ao nmero de sucessos num experimento binomial, tem distribuio binomial com parmetros n e p, com funo de probabilidade dada por: n x n x P( X = x ) = , x = 0, 1, K , n x p (1 p)
n n! onde = x! (n x )! , n!= n (n 1)(n 2) L (2)(1) e 0!= 1 . x
1 p
0 1-p
e
59
Var(X) = np(1-p)
____/____/____
Exemplo: Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10 pessoas dessa populao forem escolhidas ao acaso e com reposio, determine: (a) O n esperado de inadimplentes. (b) A probabilidade de selecionar exatamente 3 pessoas inadimplentes. (c) A probabilidade de selecionar no mximo 3 inadimplentes. 10.7. Exerccios Parte II A2
1) Nos Estados Unidos, 29% dos advogados e juzes so mulheres (Statistical Abstract of the United States, 1997). Em uma jurisdio com 30 advogados e juzes, qual o nmero esperado de mulheres? Qual a varincia e o desvio padro? 2) O maior nmero de reclamaes dos proprietrios de automveis com dois anos de uso se referem ao desempenho do sistema eltrico. Considere que um questionrio anual, enviado aos proprietrios de mais de 300 marcas e modelos de automveis, revelou que 10% dos proprietrios de automveis com dois anos de uso encontraram pontos com problemas no sistema eltrico, que incluam o motor de arranque, o alternador, a bateria, controles diversos, luzes e radio. Qual a probabilidade de que uma amostra de 12 proprietrios de automveis com dois anos ter (a) exatamente dois proprietrios com problemas no sistema eltrico (b) pelo menos dois proprietrios com problemas no sistema eltrico (c) no mximo um proprietrio com problemas no sistema eltrico.
60
____/____/____
Exemplo: Uma fbrica produz peas que so embaladas em caixas com 40 unidades. Para aceitar o lote de caixas enviado por essa fbrica, o controle de qualidade de uma empresa sorteia uma caixa do lote e sorteia 10 peas, sem reposio, dessa mesma caixa. Se houver alguma pea defeituosa o lote inteiro devolvido. Se a caixa sorteada tiver 4 peas defeituosas, qual a probabilidade do lote no ser devolvido? N = 40, n = 10 e r = 4 X: nmero de peas defeituosas 4 40 4 0 10 0 0,3 P(X = 0) = 40 10 10.9. Exerccio Parte II A2: Para fazer o controle de qualidade numa empresa, lotes com 100 peas so examinados. O nmero de peas com defeito no lote 10. Aps colher uma amostra de 5 peas sem reposio, calcule a probabilidade de que nessa amostra no haja nenhum item defeituoso.
10.10. Distribuio Poisson A distribuio de Poisson empregada em experimentos nos quais no se est interessado no nmero de sucessos obtido em n tentativas, como ocorre no caso da distribuio binomial, mas sim no nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um intervalo de tempo, espao, etc. Alguns exemplos de variveis que podem ter a distribuio de Poisson so (a) nmero de defeitos por centmetro quadrado; (b) n de acidentes por dia; (c) n de clientes por hora; (d) n de chamadas telefnicas recebidas por minuto; (e) n de falhas de um computador num dia de operao; (f) n de relatrios de acidentes enviados a uma companhia de seguros numa semana.
Note-se que a unidade de medida (tempo, rea) contnua, mas a varivel aleatria de interesse (nmero de ocorrncia) discreta. Alm disso, as falhas no so contveis. No possvel contar os acidentes que no ocorreram, nem o nmero de defeitos por centmetros quadrados que no ocorreram. O limite inferior do nmero de ocorrncias, em todos as situaes dos exemplos, ________, enquanto que o limite superior ao menos teoricamente infinito, muito embora, na maioria dos exemplos acima, seja difcil imaginar um nmero infinito de ocorrncias. As probabilidades, calculadas agora para todos os nmeros inteiros no negativos k = 0, 1, 2, ... so dadas da seguinte forma: e x P(X = x ) = , x = 0, 1, ...
x!
onde X = nmeros de sucessos em um intervalo a varivel de interesse, > 0 o nmero mdio de sucessos da varivel X e e a constante 2,7183 (base dos logaritmos naturais).
Exemplo: Um departamento de conserto de mquinas recebe uma mdia de cinco chamadas por hora. Supondo que a distribuio de Poisson seja adequada nessa situao, obter a probabilidade de que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente trs chamadas:
10.11. Exerccios Parte II A2 1) Numa central telefnica, o nmero de chamadas chega segundo uma distribuio Poisson, com a mdia de oito chamadas por minuto. Determine qual a probabilidade de que num minuto se tenha: (a) duas ou mais chamadas;
Oliveira, D. C. R. e Oliveira, M. S.
62
____/____/____
Definio: Seja X uma varivel aleatria. Suponha que os possveis valores de X seja um intervalo que possui infinitos valores, ento diremos que X uma varivel aleatria contnua. Exemplos: 1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real. Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar qualquer n real positivo. 2. Em um exame fsico para selecionar um jogador de futebol medido o peso de cada candidato; aqui tambm consideramos que o resultado pode ser qualquer nmero real positivo. 3. Em campanhas preventivas de hipertenso arterial comum de tempos em tempos medir-se o nvel de colesterol. O valor de cada medida pode ser um nmero real no negativo. 4. Para pacientes que se apresentam num hospital a primeira atitude medir-se a temperatura; o valor da temperatura um nmero real que se pode considerar compreendido entre 35 e 42C. 5. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete acendendo-a; observa-se a mesma at que se queime. O tempo de durao da lmpada um n real no negativo. Nos exemplos de 1 a 5, o nmero observado no experimento aleatrio um nmero real e resulta em geral de uma medio: altura das mulheres; peso do atleta; nvel de colesterol; temperatura; tempo de durao da lmpada. Uma varivel aleatria contnua assume seus valores em um intervalo. Como so atribudas probabilidades nesse caso? Exemplo: Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas aleatoriamente numa populao. O histograma por densidade desses valores apresentado abaixo.
Oliveira, D. C. R. e Oliveira, M. S.
63
____/____/____
A anlise do histograma indica que: a distribuio dos valores da varivel PESO aproximadamente simtrica em torno de 70kg; a maioria dos valores encontra-se no intervalo (55;85); existe uma pequena proporo de valores abaixo de 48kg e acima de 92kg.
Seja X = {peso em kg} de uma pessoa adulta escolhida ao acaso da populao. Como se distribuem os valores da varivel aleatria X, ou seja, qual a distribuio de probabilidades de X?
Para as variveis contnuas as probabilidades so atribudas por meio de uma funo cuja rea entre a mesma e o eixo das abscissas (X) igual a um.
P(a X b) = rea hachurada Esta funo f(x) denominada funo densidade de probabilidade da varivel aleatria contnua X. A rea sob uma curva delimitada por dois valores a e b, como mostra a figura, determinada calculando-se a integral definida entre a e b da densidade de probabilidade representada pela funo, isto ,
f(x)dx = P(a x b)
a
Oliveira, D. C. R. e Oliveira, M. S.
64
____/____/____
Exemplo: Um fabricante de televiso a cores oferece uma garantia de 1 ano para substituio gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de anos), x, como uma varivel aleatria contnua com a seguinte fdp 1 x f (x) = e 4 , x > 0 4 = 0, caso contrrio Qual a probabilidade de voc comprar a televiso e necessitar de uma substituio gratuita?
1 P( x 1) = e 4 dx = 4 0
1 x
0,2
Definio: Se X uma v.a. contnua, a funo densidade de probabilidade f(X), indicada abreviadamente por fdp, uma funo que satisfaz s seguintes condies: (a) f(X) 0, X; (b) A rea sob a funo densidade de probabilidade 1, isto :
f ( x )dx = 1
(c) P(a X b) = rea sob a funo densidade de probabilidade f(x) e acima do eixo x entre os pontos a e b, isto :
P(a X b) = f ( x )dx
a
Conseqncia:
Definio: Se X uma v.a. contnua, a funo de distribuio acumulada (fda) de X definida como:
F( x ) = P(X x ) = f (s)ds
Exemplo: Considere a seguinte densidade de probabilidade: f(x) = 2x, para 0 x 1 e f(x) = 0, fora desse intervalo. Obtenha a F(x) de X. x<0 0, x x F( x ) = 2s =s 2 = x 2 , 0 x 1 0 0 x >1 1, 11.1. Esperana e Varincia Definio: Se X uma v. a. contnua, o valor esperado de X (ou esperana matemtica de X) denotada por E(X) definido como:
E(X) =
x f (x ) dx
____/____/____
Oliveira, D. C. R. e Oliveira, M. S.
65
Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0<x<1, ento:
E (X) = x 2x dx = 2 x 2 dx =
0 0 1 1
2 31 2 x 0= 3 3
f ( x ) dx
Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0<x<1, ento:
E(X) = 2 3 E (X 2 ) = x 2 2 x dx = 2 x 3 dx =
0 0 1 1
2 41 2 x 0= 4 4
Logo, Var(X) = 2/4 (2/3)2 =1/18 = 0,056 Tambm podemos obter o Desvio Padro: 0,056 0,23
Exerccios Parte II A2: 1) O dimetro de um cabo eltrico uma varivel aleatria com fdp dada por: f(x) = 6x(1-x) para 0 < x < 1 e f(x) = 0 fora desse intervalo. Qual a probabilidade do dimetro ser: (a) Igual a 0,5 cm? (b) Entre 0,10 e 0,20? (c) Maior que 0,5? (d) Menor que 1?
2) A quantia gasta anualmente, em milhes de reais, na manuteno do asfalto de uma cidade do interior representada pela varivel y modelada pela funo: f(y) = (8/9)y (4/9), se 0,5 y 2 e f(y) = 0, caso contrrio. Qual a probabilidade da quantia gasta ser inferior a 0,8 milhes de reais? 3) O tempo de sobrevivncia de uma bateria (em anos) pode ser modelado pela funo: f(x) = e-x, se x 0 e f(x) = 0, caso contrrio. (a) Qual a probabilidade da bateria sobreviver mais que 2 anos? (b) Qual o tempo mdio de sobrevivncia da bateria? 4) O dimetro de um cabo eltrico uma v. a. com fdp dada por: f(x) = 6x(1-x) para 0 < x < 1 e f(x) = 0 fora desse intervalo. (a) Verifique se f(x) uma fdp, atravs do item (b) da definio 2. (b) Obtenha a F(x).
66
____/____/____
Muitos dos fenmenos aleatrios de interesse comportam-se prximos a essa distribuio com valores muito freqentes em torno da mdia e diminuindo a freqncia medida que nos afastamos da mdia. Nem todos os fenmenos se ajustam distribuio Normal. Por exemplo, considere a varivel tempo de durao, em horas, de uma lmpada de certa marca. A experincia sugere que esta distribuio deve ser assimtrica com uma grande proporo de valores entre 0 e 500 horas e uma pequena proporo de valores acima de 1500 horas
Obs: A distribuio utilizada nesse caso a Distribuio Exponencial. Funo Densidade de Probabilidade da Distribuio Normal
1 x 2
2
f ( x) =
O grfico da densidade normal Propriedades: