Você está na página 1de 109

Estatstica e Probabilidade

Professores: Daniela Carine Ramires de Oliveira Marcos Santos de Oliveira

ndice
1. Introduo Estatstica 1.1. 1.2. 1.3. 1.4. 2. O que Estatstica? Estatstica na Prtica Um pouco da histria da Estatstica Exerccios 1 1 1 2 2 3 3 3 5 6 6 6 6 6 7 8 9 10 11 11 12 13 14 15 15 15 15 16 18
ii
____/____/____

Variveis 2.1. 2.2. 2.3. Definio de Varivel Classificao das Variveis Exerccios

3.

Amostragem 3.1. 3.2. 3.3. Por que fazer Amostragem? Quando o uso de amostragem no interessante? Tipos de Amostragem 3.3.1. Amostragem Aleatria Simples (AAS) 3.3.2. Amostragem Sistemtica (AS) 3.3.3. Amostragem Estratificada (AE) 3.3.4. Amostragem por Conglomerado (AC) Exerccios

3.4. 4.

Tabulao de Variveis 4.1. 4.2. 4.3. 4.4. Variveis Qualitativas Unidimensionais Variveis Quantitativas Unidimensionais Variveis Qualitativas e Quantitativas Bidimensionais Exerccios

5.

Medidas de Posio 5.1. 5.2. 5.3. 5.4. 5.5. Mnimo e Mximo Moda Mdia Mediana Exerccios

Prof. Daniela

6.

Medidas de Disperso 6.1. 6.2. 6.3. 6.4. 6.5. Motivao Amplitude Varincia e Desvio Padro Intervalo Interquartil Exerccios

19 19 19 19 21 21 22 22 22 23 23 25 25 26 26 27 28 29 31 32 32 32 35 37 39 40 41 44 44 44 45 46 47
____/____/____

7.

Estatstica Grfica 7.1. Grficos para as Variveis Qualitativas 7.1.1. Grfico em Barras 7.1.2. Grfico de Composio em Setores (Pizza) 7.1.3. Grfico de Pareto Grficos para as Variveis Quantitativas 7.2.1. Grfico em Barras 7.2.2. Grfico de Pontos 7.2.3. Histograma 7.2.4. Grfico em Linhas (ou Grfico Temporal) 7.2.5. Ramo-e-Folhas 7.2.6. Desenho Esquemtico ou Diagrama de Caixas (Box-Plot) Exerccios

7.2.

7.3 8.

Correlao e Regresso 8.1. 8.2. 8.3. 8.4. 8.5. 8.6. Estudo da relao entre variveis Diagrama de Disperso Coeficiente de Correlao Regresso Linear Simples Coeficiente de Determinao Exerccios

Lista de Exerccios 1 9. Probabilidade 9.1. 9.2. 9.3. 9.4. 9.5.


Prof. Daniela

Processo ou Experimento Aleatrio Espao Amostral () Evento Exerccios Introduo Probabilidade


iii

9.6. 9.7. 9.8. 9.9. 9.10. 9.11. 9.12. 9.13. 10.

Definio Clssica Definio Freqentista Definio Subjetiva Definio Moderna Probabilidade Condicional Independncia de Eventos Regra da Probabilidade Total Teorema de Bayes

48 49 51 51 52 53 54 54 56 56 57 58 58 58 59 60 60 61 61 62 63 65 66 69 73 74 77 77 77 79 79 81 81 83

Varivel Aleatria Discreta 10.1. 10.2. 10.3. 10.4. 10.5. 10.6. 10.7. 10.8. 10.9 10.10. 10.11. Introduo Esperana Matemtica (Mdia) Varincia Exerccio Modelo Bernoulli Modelo Binomial Exerccios Distribuio Hipergeomtrica Exerccio Distribuio Poisson Exerccios

11.

Varivel Aleatria Contnua 11.1. 11.2. 11.3. 11.4. Esperana e Varincia Distribuio Normal Tabela da Distribuio Normal Padro Exerccios

Lista de Exerccios 2 12. Estimao 12.1. 12.2. 12.3. 12.4. 12.5. 12.6. 12.7. Inferncia Estatstica Estimao Pontual e Intervalar para Proporo Exerccios Estimativa Pontual e Intervalar para a Mdia Populacional Exerccios Estimativa para a Mdia Populacional com Varincia Desconhecida Exerccio

Prof. Daniela

iv

____/____/____

13.

Testes de Hipteses 13.1. 13.2. 13.3. 13.4. 13.5. 13.6. 13.7. 13.8 13.9 13.10. Introduo Formulao das Hipteses Tipos de Erros possveis nos Testes de Hipteses Nvel de Significncia de um Teste de Hiptese () Teste de Hipteses para a Proporo Exerccios Teste de Hipteses para Mdia com Varincia Conhecida Exerccios Teste de Hipteses para Mdia com Varincia Desconhecida Exerccios

84 84 84 84 85 85 87 88 90 91 93 94

Lista de Exerccios 3 Apndice A B C D Gabarito da Lista de Exerccios 1 Gabarito da Lista de Exerccios 2 Gabarito da Lista de Exerccios 3 Aula no Laboratrio de Computao

95 101 102 104

Prof. Daniela

____/____/____

1. INTRODUO ESTATSTICA
1.1. O que Estatstica? Estatstica uma cincia que nos permite coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer rea do conhecimento. Estamos denominando por dados a um (ou mais) conjunto de valores, numricos ou no. A aplicabilidade das tcnicas a serem discutidas se d nas mais variadas reas das atividades humanas. Assim, o principal objetivo da Estatstica nos auxiliar a tomar decises ou tirar concluses em situaes de incerteza, a partir de informaes numricas. 1.2. Estatstica na Prtica
Tcnicas de amostragem

Populao (Caractersticas)

Amostra
Planejamento de Experimentos Anlise descritiva descritiva

Concluses sobre as caractersticas da populao

Inferncia Estatstica

Clculo de Probabilidades

Informaes contidas nos dados

Populao: o conjunto de todos os elementos que nos interessa estudar. Deve ser notado que na terminologia estatstica, populao refere-se no somente a uma coleo de indivduos, mas ao alvo no qual reside nosso interesse. Exemplos: todos os clientes de um banco, todos os alunos de uma faculdade, todos os automveis da Ford, todo o sangue no corpo de uma pessoa, etc. Tcnicas de Amostragem: ferramentas que nos auxiliam a coletar amostras. Planejamento de Experimentos: cria esquemas e teorias para verificao de hipteses cientficas. Amostra: qualquer subconjunto da populao. Anlise Descritiva: Conjunto de tcnicas destinadas a descrever e resumir os dados a fim de tirarmos concluses a respeito de caractersticas de interesse. Probabilidade: Teoria utilizada para se estudar a incerteza associada a fenmenos aleatrios. Inferncia Estatstica: Tcnicas que possibilitam a extrapolao, a um grande conjunto de dados (populao), das informaes e concluses obtidas a partir de um subconjunto de valores (amostra).
Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

1.3. Um pouco da histria da Estatstica 5000 AC 2000 AC 695 1654 1763 1930 1959 1996 1997 2001 Registros egpcios de presos de guerra; Censo Chins; Primeira utilizao da mdia ponderada pelos rabes na contagem de moedas; Pierre de Fermat e Blaise Pascal estabelecem os Princpios do Clculo das Probabilidades; Inferncia Estatstica (Reverendo Bayes); Controle de Qualidade nas indstrias; Estudo retrospectivo de doenas (Mantel & Haenszel); Profundidade da Regresso (Rousseeuw e Hubert); Modelos Fatoriais; 100 anos da Biometrika.

Maiores detalhes sobre a histria da Estatstica no site: http://www.redeabe.org.br/historia.htm 1.4. Exerccios Parte I A1 1) Para as situaes descritas a seguir, identifique a populao e a amostra correspondente. (a) Para avaliar a eficcia de uma campanha de vacinao no Estado de Minas Gerais, 200 mes de recm-nascidos durante o primeiro semestre de um dado ano, em uma dada maternidade em Belo Horizonte, foram perguntadas a respeito da ltima vez que vacinaram seus filhos. Populao: Amostra: (b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. Populao: Amostra: (c) Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por telefone com relao ao canal em que estavam sintonizados. Populao: Amostra:

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

2. VARIVEIS
2.1. Definio de Varivel Qualquer caracterstica associada a uma populao chamada de varivel. Porque o nome varivel? Porque ela varia de alguma forma. Exemplos: Idade: pode variar de 0, 1 , 2, ... anos Sexo: pode ser masculino ou feminino Estado Civil: pode ser solteiro, casado, divorciado, etc. 2.2. Classificao das Variveis As variveis podem ser classificadas como Qualitativas ou Quantitativas. Algumas variveis como sexo, grau de instruo, estado civil, regio de procedncia, apresentam como possveis resultados uma qualidade (ou atributo) do indivduo pesquisado, logo, estas variveis so chamadas de variveis Qualitativas. As variveis como nmero de filhos, salrio, idade, apresentam como possveis resultados nmeros resultantes de uma contagem ou mensurao, logo, estas variveis so chamadas de variveis Quantitativas. Exemplo: Um pesquisador est interessado em fazer um levantamento sobre alguns aspectos socio-econmicos dos empregados da seo de oramentos de uma empresa. Usando informaes obtidas do departamento pessoal, ele elaborou a Tabela 2.1. Tabela 2.1: Informaes sobre estado civil, grau de instruo, nmero de filhos, salrio (expresso como frao do salrio mnimo), idade (medida em anos e meses) e procedncia de 36 empregados da seo de oramentos de uma Empresa.
Idade
N 1 2 ... 35 36 Estado Civil Solteiro Casado ... Casado Casado Grau de Instruo Fundamental Fundamental ... Mdio Superior N de Filhos ... 1 ... 2 3 Salrio 4,00 4,56 ... 19,40 23,30 Anos 26 32 ... 48 42 Meses 3 10 ... 11 2 Regio de Procedncia Interior Capital ... Capital Interior

Fonte: Bussab e Morettin (2002) Observaes sobre a Tabela 2.1. De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais de um) resultado correspondendo realizao de uma caracterstica (ou caractersticas). Por exemplo, considerando a varivel estado civil, para cada empregado pode-se associar um dos resultados, solteiro ou casado (note que poderia haver outras possibilidades, como separado, divorciado, mas somente as duas mencionadas foram consideradas no estudo).

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

Dentre as variveis Qualitativas, ainda podemos fazer uma distino entre dois tipos: Varivel Qualitativa Nominal: para a qual no existe nenhuma ordenao nos possveis resultados. Exemplo: Regio de Procedncia, etc. Varivel Qualitativa Ordinal: para a qual existe uma ordem natural nos seus resultados. Exemplo: Grau de instruo, etc. As variveis Quantitativas tambm podem sofrer uma classificao dicotmica: Varivel Quantitativa Discreta: cujos possveis valores formam um conjunto finito ou enumervel de nmeros, e que resultam, freqentemente, de uma contagem. Exemplo: N de Filhos, etc. Varivel Quantitativa Contnua: cujos possveis valores pertencem a um intervalo de nmeros reais e que resultam de uma mensurao. Exemplo: Salrio, etc. Resumindo Como as variveis so classificadas e outros exemplos: Qualitativa Nominal Ordinal Discreta Contnua Sexo, Cor dos Olhos. Estado Civil, Classe social. Nmeros de carros. Peso, altura.

Quantitativa

Para cada tipo de varivel existem tcnicas apropriadas para resumir as informaes dos dados obtidos da amostra. Por exemplo, a utilizao de uma tabela uma forma de escrever os dados de uma forma resumida. Em algumas situaes podem-se atribuir valores numricos s vrias qualidades ou atributos de uma varivel qualitativa e depois se proceder anlise como se esta fosse quantitativa, desde que o procedimento seja passvel de interpretao. Existe um tipo de varivel qualitativa para a qual essa quantificao muito til: a chamada varivel dicotmica. Para essa varivel podem ocorrer somente duas realizaes, usualmente chamadas de sucesso e fracasso. Exemplos: Sexo (Masculino ou Feminino), Hbito de Fumar (Sim ou No), etc.

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

2.3. Exerccios Parte I A1 1) Um questionrio foi aplicado aos alunos do primeiro ano de uma escola fornecendo as seguintes informaes: ID: Identificao do aluno; Turma: Turma a que o aluno foi alocado (A ou B); Sexo: Feminino (F) ou Masculino (M); Idade: Idade; Alt: Altura; Peso: Peso; Filh: Nmero de filhos na famlia; Fuma: Hbito de fumar (sim ou no); Toler: Tolerncia ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M) Incomoda Muito; Exer: Horas de atividade fsica, por semana; Cine: Nmero de vezes que vai ao cinema por semana; OpCine: Opinio a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa TV: Horas gastas assistindo TV, por semana OpTV: Opinio da programao na TV: (R) Ruim, (M) Mdia, (B) Boa e (N) no sabe. Tabela 2.2: Informaes do questionrio estudantil. ID Turma Sexo Idade Alt Peso Filh Fuma Toler Exer Cine Opcine Tv 1 A F 17 1,60 60,5 2 No P 0 1 B 16,5 2 A F 18 1,69 55,0 1 No M 0 1 B 7 ... ... ... ... ... ... ... ... ... ... ... ... ... 49 B M 17 1,80 71,0 1 No P 7 0 M 14 50 B M 18 1,83 86,0 1 No P 7 7 M 20 Fonte: Magalhes e Lima (2004). Classifique as variveis da Tabela 2.2. como Varivel Qualitativa Nominal:

OpTV R R ... R B

Varivel Qualitativa Ordinal:

Varivel Quantitativa Discreta:

Varivel Quantitativa Contnua:

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

3. AMOSTRAGEM
A amostragem naturalmente usada em nossa vida diria. Por exemplo, para verificar o tempero de um alimento em preparao, podemos provar (observar) uma pequena poro deste alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (populao), uma parte (amostra) com propsito de avaliarmos sobre a qualidade do tempero de todo o alimento. 3.1. Por que fazer Amostragem? Existem vrias razes para o uso de amostragem em levantamento de grandes populaes. Algumas delas so: Economia: Em geral, torna-se bem mais econmico o levantamento de somente uma parte da populao. Tempo: Numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria tempo suficiente para pesquisar toda a populao de eleitores do pas. Operacionalidade: mais fcil realizar operaes de pequena escala. Um dos problemas tpicos nos grandes censos o controle dos entrevistadores. 3.2. Quando o uso de amostragem no interessante? Populao pequena: No h necessidade de utilizar tcnicas estatsticas, pois neste caso aconselhvel realizar o censo (anlise de toda a populao). Caracterstica de fcil mensurao: Talvez a populao no seja to pequena, mas a varivel que se quer observar de to fcil mensurao, que no compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionrios favorveis mudana no horrio de um turno de trabalho, podemos entrevistar toda a populao no prprio local de trabalho. Esta atitude pode ser politicamente mais recomendvel. Necessidade de alta preciso: A cada dez anos o IBGE realiza um Censo1 Demogrfico para estudar diversas caracterstica da populao brasileira. Dentre estas caractersticas tmse o nmero total de habitantes, que fundamental para o planejamento do pas. Desta forma, o nmero de habitantes precisa ser avaliado com grande preciso e, por isto, se pesquisa toda a populao.

3.3. Tipos de Amostragem 3.3.1. Amostragem Aleatria Simples (AAS) A tcnica de Amostragem Aleatria Simples (ou Amostragem Casual Simples) o mtodo mais simples e um dos mais importantes para a seleo de uma amostra. Para a seleo de uma AAS precisamos ter uma lista completa dos elementos da populao. Este tipo de amostragem consiste em selecionar a amostra atravs de um sorteio. Sua principal caracterstica est no fato de todos os elementos da populao ter igual probabilidade de serem escolhidos.
1

Censo: estudo de todos os elementos da populao. 6


____/____/____

Oliveira, D. C. R. e Oliveira, M. S.

Procedimento para o uso deste mtodo: 1) Numerar todos os elementos da populao (N elementos); 2) Efetuar sucessivos sorteios at completar o tamanho da amostra (n).

Para realizar este sorteio, podemos utilizar urnas, tabelas de nmeros aleatrios ou algum software que gere nmeros aleatrios. A Tabela abaixo foi feita usando o Excel. Tabela de Nmeros Aleatrios
6 9 5 5 8 1 3 8 0 9 1 2 5 9 6 1 4 0 8 0 2 1 5 8 0 9 7 6 2 3 0 4 4 9 4 8 4 1 5 1 1 9 1 5 3 9 7 0 3 8 7 5 8 8 2 5 1 9 1 1 2 4 5 4 9 5 8 9 9 5 8 2 4 2 2 6 0 0 2 6 6 7 6 6 9 9 3 5 3 5 2 9 5 7 3 3 6 5 3 0 6 5 9 5 8 9 9 5 0 2 2 9 4 2 3 3 8 6 8 7 8 9 7 1 5 1 3 7 1 6 2 9 3 9 0 5 3 9 5 8 0 2 3 4 8 1 6 2 4 3 1 8 0 2 1 8 0 1 5 2 7 0 1 3 9 1 2 0 8 2 5 1 0 2 0 8 1 4 2 4 9 1 5 9 5 6 4 2 5 3 9 5 7 1 7 5 3 8 6 8 4 5 5 8 5 6 4 8 4 8 7 2 1 2 7 9 6 8 9 8 5 2 9 7 4 7 2 7 4 4 7 9 9 6 4 2 0 6 0 1 7 4 2 7 6 3 8 6 3 6 0 3 3 2 0 9 0 6 5 3 2 7 3 2 1 3 6 0 3 1 0 3 3 0 2 1 4 2 1 3 2 9 1 0 3 4 3 0 3 1 0 5 0 4 0 5 8 5 0 6 5 1 3 0 4 5 9 4 8 5 9 2 1 4 8 7 9 8 0 8 9 8 7 5 8 6 5 4 5 7 0 7 1 4 9 4 7 8 2 7 3 8 5 6 4 0 2 1 5 6 7 4 9 3 9 2 0 8 3 1 9 5 5 8 5 6 5 6 0 6 0 2 9 0 2 1 5 4 6 4 4 6 3 2 3 1 1 6 0 3 2 6 8 6 1 1 3 2 5 2 5 4 3 1 0 9 9 9 8 2 2 2 0 7 0 8 8 2 4 2 5 8 0 7 3 3 1 1 4 1 9 0 1 5 5 9 2 4 9 2 3 5 4 0 8 6 9 4 2 8 8 1 1 0 0 0 9 8 8 9 2 5 0 9 6 3 6 3 2 1 1 4 2 5 6 1 2 2 3 1 5 9 6 5 4 2 5 3 6 3 5 0 1 0 0 3 4 9 8 5 5 6 6 3 2 4 3 3 2 2 8 2 1 9 2 8 0 8 1 5 7 2 6 5 5 7 1 7 6 3 9 2 9 2 8 9 1 5 8 4 0 6 3 2 6 7 5 5 5 4 9 2 4 9 6 2 6 5 4 9 4 8 2 2 1 4 4 7 2 7 0 3 4 8 8 1 0 0 3 0 0 8 8 6 8 2 9 8 5 0 0 0 1 0 3 2 9 9 4 9

Exemplo: Estamos interessados em estudar a qualidade da gasolina nos postos de uma determinada cidade. Essa cidade possui N = 40 postos. A empresa que estudar a qualidade pode investigar apenas uma amostra de n = 4 postos. Para selecionarmos uma amostra, utilizando a amostragem casual simples, basta escolhermos uma posio de qualquer linha da tabela de nmeros aleatrios e extrairmos conjuntos de dois algarismos (pois N, que o tamanho da populao, possui 2 casas decimais), at completarmos os 4 elementos da amostra. Se o nmero sorteado no existir, simplesmente no consideramos e prosseguimos o processo. Escolhendo a primeira linha da Tabela de Nmeros Aleatrios, temos a seguinte amostra de 4 elementos: {09, 26, 29, 11}. Exemplo: Considere agora, uma populao com 500 elementos e, deseja-se retirar dessa populao 10 elementos. Obtenha uma AAS utilizando a primeira linha da Tabela de Nmeros Aleatrios. 3.3.2. Amostragem Sistemtica (AS) utilizada quando a populao est naturalmente ordenada, como listas telefnicas, fichas de cadastramento, produo de garrafas da cervejas, etc. Procedimento para o uso deste mtodo: 1) Seja N o tamanho da populao e n o tamanho amostral. Calcula-se o intervalo da amostragem i = N/n (considera-se apenas a parte inteira do nmero).
Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

2) Sorteia-se, utilizando a tabela de nmeros aleatrios, um nmero x entre 1 e i formando a amostra: x, (x + i), (x + 2*i), ... , (x + (n-1)*i). Exemplo: Numa turma com N = 36 alunos, deseja-se retirar uma amostra de n = 5 elementos para verificar uma caracterstica de interesse. Utilize a tcnica de amostragem sistemtica para retirar essa amostra. 1) Calcular: i = N/n = 36/5 = 7,2. Considerando a parte inteira do nmero, temos que i = 7; 2) Sortear um nmero entre 1 e 7 da Tabela de Nmeros Aleatrios. Escolhendo a ltima linha e a primeira coluna, temos que o primeiro nmero que est entre 1 e 7 6. Logo a amostra ser composta dos elementos: {06, 13, 20, 27, 34} Exemplo: Considere agora, uma populao com 500 elementos e, deseja-se retirar dessa populao 10 elementos. Obtenha uma AS utilizando a primeira linha da Tabela de Nmeros Aleatrios, quando for necessrio. 3.3.3. Amostragem Estratificada (AE) A populao dividida em subgrupos, denominados estratos (por exemplo, por sexo, renda, bairro, etc.) e a AAS utilizada na seleo de uma amostra de cada estrato. Esses estratos devem ser internamente mais homogneos do que a populao toda, com respeito s variveis em estudo. Aqui, um conhecimento prvio sobre a populao em estudo fundamental. Estrato 1 Estrato 2 ... Estrato k Subgrupo 1 da amostra Subgrupo 2 da amostra ... Subgrupo k da amostra

...

Amostra Estratificada

A AE tem as seguintes caractersticas: dentro de cada estrato h uma grande homogeneidade (pequena variabilidade); entre os estratos h uma grande heterogeneidade (grande variabilidade). Em geral, utiliza-se a AE proporcional. Neste caso, a proporcionalidade do tamanho da amostra de cada estrato da populao mantida na amostra. Por exemplo, se um estrato corresponde a 20% do tamanho da populao, ele tambm deve corresponder a 20% da amostra. Exemplo: Com o objetivo de realizar uma pesquisa de opinio sobre a gesto atual da reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A populao composta por 100 professores, 100 servidores tcnicos administrativos e 300 alunos, que identificaremos da seguinte forma: Populao Professores Servidores Alunos P001 P002 P100 S001 S002 ... S100 A001 A002 ... A300

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

Supondo que a opinio sobre a gesto atual da reitoria possa ser relativamente homogneo dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para obter uma amostra global de tamanho n = 10. A tabela a seguir mostra as relaes de proporcionalidade. Estrato Proporo na Populao Tamanho do subgrupo na amostra np = ( 0,20)*10 = 2 ns = ( 0,20)*10 = 2 na = ( 0,60)*10 = 6

Professores 100/500 = 0,20 (ou 20%) Servidores 100/500 = 0,20 (ou 20%) Alunos 300/500 = 0,60 (ou 60%)

Para selecionar aleatoriamente dois professores, podemos usar a Tabela de Nmeros Aleatrios, tomando dois nmeros com trs algarismos. Usando, por exemplo a primeira linha da tabela de nmeros aleatrios, temos os seguintes professores selecionados: {P045, P020}. Para os servidores, usando a segunda linha da tabela, temos: {S055, S058}. Usando a terceira linha da tabela, temos a seguinte amostra de alunos: {A050, A136, A270, A152, A247, A004}. A amostra {P045, P020, S055, S058, A050, A136, A270, A152, A247, A004} uma amostra estratificada proporcional da comunidade da universidade. Cada indivduo desta amostra dever ser pesquisado para se obter a opinio em relao gesto atual da reitoria. 3.3.4. Amostragem por Conglomerado (AC) A populao dividida em subpopulaes (conglomerados) distintas (quarteires, residncias, famlias, bairros, etc.). Alguns dos conglomerados so selecionados segundo a AAS e todos os indivduos nos conglomerados selecionados so observados. Em geral, menos eficiente que a AAS ou AE, mas por outro lado bem mais econmica. Tal procedimento amostral adequado quando possvel dividir a populao em um grande nmero de pequenas subpopulaes. A AC tem as seguintes caractersticas: dentro de cada conglomerado h uma grande heterogeneidade (grande variabilidade); entre os conglomerados h uma pequena variabilidade (grande homogeneidade). Exemplo: Realizao de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais. Usando a tcnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas
5 3 Zona 1 6 7 4 8 10 9 11

12

Entrevistar todos os eleitores dessas zonas


Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

Obs.: fcil confundir amostragem estratificada com amostragem por conglomerado, porque ambas envolvem a formao de subgrupos. A diferena que a amostragem por conglomerado usa todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa uma amostra de membros de todos os estratos. Curiosidade Tambm podemos encontrar na prtica a Tcnica de Amostragem de Convenincia que simplesmente usa resultados que sejam muito fceis de obter.
Ei! Voc a favor da pena de m orte?

3.4. Exerccios Parte I A1 1) Um administrador especialista em avaliar atravs de sistemas informatizados as aes da BOVESPA, est interessado em fazer uma pesquisa nos preos das aes, para indicar aos seus clientes se hoje um dia favorvel a fazer investimentos. Ele sabe que existe N = 500 aes em venda. Como o tempo de estudo de cada ao de aproximadamente 10 minutos, decidiu-se verificar apenas n = 25 aes. Utilizando as tcnicas de amostragem aleatria simples, quais aes sero selecionadas (Use a primeira linha da tabela de nmeros aleatrios)? 2) Um gerente de controle de qualidade estudar fontes de computador que passam numa esteira transportadora dentro da empresa onde trabalha. Sabendo que por dia passam N = 85 fontes e na amostra dever ter n = 10 fontes, quais sero as fontes selecionadas utilizando a tcnica de amostragem sistemtica? (Quando for necessrio utilizar a Tabela de Nmeros Aleatrios utilize a primeira linha) 3) Num depsito em uma determinada empresa produtora de materiais eletrnicos possui N = 100 computadores que esto separados em duas qualidades. N1 = 40 computadores Pentium 3 e N2 = 60 computadores Pentium 4. O custo para verificar se cada computador est sob controle muito alto. O administrador responsvel disse que a empresa tem condies de verificar apenas n = 12 computadores. Utilizando a tcnica de amostragem estratificada proporcional, quais computadores sero selecionados? (Quando for necessrio utilizar a Tabela de Nmeros Aleatrios utilize a primeira linha)

Oliveira, D. C. R. e Oliveira, M. S.

10

____/____/____

4. TABULAO DE VARIVEIS
4.1. Variveis Qualitativas Unidimensionais Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o comportamento dessa varivel, analisando a ocorrncia de seus possveis resultados. A tabela a seguir apresenta a distribuio de freqncias da varivel grau de instruo dos dados da Tabela 2.1. Tabela 4.1: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da Companhia MB segundo o grau de instruo. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi) Fundamental 12 Mdio 18 Superior 6 n = 36 1,0000 Total Fonte: Bussab e Morettin (2002) Interpretao da Tabela 4.1.: Nota-se que dos 36 empregados da seo de oramentos, 33,33% tem nvel fundamental, 50% nvel mdio e apenas 16,67% nvel superior. Notao: Usaremos a notao ni para indicar a freqncia (absoluta) de cada classificao ou categoria da varivel. A notao fi = ni/n para indicar a proporo (ou freqncia relativa) de cada categoria, sendo o n o nmero total de observaes. As propores so muito teis quando se querem comparar resultados de duas pesquisas distintas. O prximo exemplo ilustra este fato. Exemplo: Suponhamos que se queira comparar a varivel grau de instruo para empregados da seo de oramentos com a mesma varivel para todos os empregados da Companhia MB. Digamos que a empresa tenha 2000 empregados e que a distribuio de freqncias seja a tabela abaixo: Tabela 4.2: Freqncias e Porcentagens dos 2000 empregados da Companhia MB, segundo o grau de instruo. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi) Fundamental 650 Mdio 1020 0,5100 Superior n = 2000 1,0000 Total Fonte: Bussab e Morettin (2002) Comparao entre a Tabela 4.1. e a Tabela 4.2.: No podemos comparar diretamente as colunas das freqncias (ni) das duas tabelas pois os totais de empregados so diferentes nos dois casos (n = 36 e n = 2000). Mas as colunas das porcentagens (ou propores) so comparveis, pois reduzimos as freqncias relativas a um mesmo total.
Oliveira, D. C. R. e Oliveira, M. S.

11

____/____/____

4.2. Variveis Quantitativas Unidimensionais A construo de tabelas de freqncias para variveis quantitativas necessita de certos cuidados. Por exemplo, a construo da tabela de freqncias para a varivel Salrio da Tabela 2.1., usando o mesmo procedimento que o grau de instruo, no resumir as 36 observaes num grupo menor, pois no existem observaes iguais. Soluo: Agrupar os dados por faixas de salrio. Assim, construmos uma tabela chamada Tabela de Classes de Freqncias. Exemplo: Distribuio de Freqncias dos salrios dos 36 empregados da seo de oramentos da Companhia MB por faixas de salrio: Tabela 4.3: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da Companhia MB por faixas de salrio. Classe de Salrio Freqncia (ni) Proporo (fi) Porcentagem (100 x fi) 04 |-- 08 10 0,2778 27,78% 08 |-- 12 12 12 |-- 16 8 16 |-- 20 5 20 |-- 24 1 36 1,0000 Total Obs.: Procedendo desse modo, ao resumir os dados referentes a uma varivel quantitativa, perde-se alguma informao. Por exemplo, no sabemos quais so os oito salrios da classe de 12 a 16, a no ser que investiguemos a tabela original. Sem perda de muita preciso, poderamos supor que todos os oito salrios daquela classe fossem iguais ao ponto mdio da referida classe, isto , 14. Nmero de Classes A escolha dos intervalos arbitrria. A familiaridade do pesquisador com os dados que lhe indicar quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um nmero pequeno de classes, perde-se informao, e com um nmero grande de classes, o objetivo de resumir os dados fica prejudicado. Soluo: Normalmente, sugere-se o uso de 4 a 8 classes com a mesma amplitude. Dentre muitas regras citadas na literatura, duas tem sido universalmente adotadas, caso o pesquisador no tenha idia alguma sobre o nmero de classes adotar. O nmero ideal de classes um nmero inteiro prximo de: Regra 1:
C = 1 + 3,2 x log n

Regra 2:

C= n

onde n o nmero de elementos pesquisado. As duas regras so equivalentes para n 80. A partir da, a Regra 2 fornece valores que crescem rapidamente e desse modo a Regra 1, proposta por Sturges tem sido preferida.
Oliveira, D. C. R. e Oliveira, M. S.

12

____/____/____

4.3. Variveis Qualitativas e Quantitativas Bidimensionais

As tabelas usadas neste caso so conhecidas como tabela de dupla entrada, tabela de associao, tabela de contingncia ou distribuies conjuntas de freqncias.
Tabela 4.4: Distribuio dos funcionrios da empresa MB, segundo o conceito em Metodologia e a Seo a que pertence. Seo Conceito em Metodologia Total por Seo A B C Dep. Pessoal 3 1 3 7 Sc. Tcnica 0 4 3 7 Sec. Venda 4 3 4 11 7 8 10 25 Total por Conceito

Tabela 4.5: Vendas dos Produtos A, B, C, no supermercado Glria, no Primeiro semestre de 2005. Meses Vendas em 1000 R$ Total por Ms A B C Janeiro 40,0 25,2 8,1 73,3 Fevereiro 40,1 28,0 10,0 78,1 Maro 35,1 28,0 15,4 78,5 Abril 28,2 20,2 22,3 70,7 Maio 14,1 25,6 28,1 67,8 Junho 5,0 30,0 35,2 70,2 162,5 157,0 119,1 438,6 Total por Produto Fonte: Dados Hipotticos.

Tabela 4.6: Distribuio dos alunos da Faculdade Vitria, segundo suas notas em Matemtica e Estatstica. Estatstica Matemtica Totais em Estatstica 0 |- 4 4 |- 7 7 |- 10 0 |- 4 32 25 5 62 4 |- 7 20 183 82 285 7 |- 10 7 27 19 53 59 235 106 400 Totais em Matemtica Fonte: Dados Hipotticos.

Oliveira, D. C. R. e Oliveira, M. S.

13

____/____/____

4.4. Exerccios Parte I A1 Tabela 4.7: Conjuntos de dados da empresa MB Indstria e Comrcio
Admin. Direito Redao Estat. Ingls Metodologia Poltica 8,0 9,0 8,6 9,0 B A 9,0 8,0 9,0 7,0 9,0 B C 6,5 8,0 9,0 8,0 8,0 D B 9,0 6,0 9,0 8,6 8,0 D C 6,0 8,0 9,0 8,0 9,0 A A 6,5 8,0 9,0 8,5 10,0 B A 6,5 8,0 9,0 8,2 8,0 D C 9,0 10,0 9,0 7,5 8,0 B C 6,0 8,0 9,0 9,4 9,0 B B 10,0 10,0 9,0 7,9 8,0 B C 9,0 8,0 9,0 8,6 10,0 C B 10,0 8,0 9,0 8,3 7,0 D B 6,5 6,0 9,0 7,0 7,0 B C 6,0 10,0 9,0 8,6 9,0 A B 10,0 8,0 9,0 8,6 9,0 C B 10,0 8,0 9,0 9,5 7,0 A A 9,0 8,0 9,0 6,3 8,0 D C 10,0 6,0 9,0 7,6 9,0 C C 6,0 6,0 9,0 6,8 4,0 D C 6,0 6,0 9,0 7,5 7,0 C B 6,0 8,0 9,0 7,7 7,0 D B 6,5 6,0 9,0 8,7 8,0 C A 6,0 8,0 9,0 7,3 10,0 C C 9,0 8,0 9,0 8,5 9,0 A A 6,5 8,0 9,0 7,0 9,0 B A 9,0 (*) P = Departamento Pessoal; T = Seo Tcnica e V = Seo de Vendas. Fonte: Bussab e Morettin (2002) Func. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Seo* P P P P P P P T T T T T T T V V V V V V V V V V V Economia 8,5 8,0 8,5 8,5 9,0 9,5 7,0 8,5 8,0 7,5 8,5 8,0 8,5 7,5 7,0 7,5 7,5 8,5 9,5 8,5 8,0 9,0 7,0 9,0 8,5

1) Baseado na Tabela 4.7., construa a distribuio de freqncias da varivel Metodologia, com as freqncias absoluta e relativa, as porcentagens, d um ttulo e interprete. 2) Ainda baseado na Tabela 4.7., construa uma Tabela de Classes de Freqncias para a varivel Redao, com as freqncias absoluta e relativa, as porcentagens, d um ttulo e interprete. 3) Construa uma tabela de dupla entrada para as variveis seo e conceito tirado em Ingls da Tabela 4.7. 4) Construa uma tabela de contingncia para as variveis seo e notas em estatstica da Tabela 4.7. 5) Construa uma tabela de contingncia para as variveis notas em redao e poltica da Tabela 4.7.

Oliveira, D. C. R. e Oliveira, M. S.

14

____/____/____

5. MEDIDAS DE POSIO
5.1. Mnimo e Mximo

O mnimo a menor observao do conjunto de dados, enquanto que o mximo a maior observao.
Exemplo: Considere o seguinte conjunto de dados: 4, 5, 4, 6, 5, 8, 4. Logo, Min = __ e Max = __. 5.2. Moda

Valor ou atributo que ocorre com maior freqncia. Exemplo (a): 2, 5, 2, 7, 8 Moda = __ . Exemplo (b): 3, 4, 2, 2, 4, 5 Moda = __ e __. Exemplo (c): 1, 2, 3, 4, 5 Moda = no tem
Moda para dados agrupados em Tabelas de Freqncias

Conjunto _ _ _ _ _ _ _ Conjunto _ _ _ _ _ _

Exemplo: Uma empresa de segurana deseja estudar qual o nmero de ligaes a cobrar mais freqentes que so recebidas em um determinado bairro de classe alta da cidade de So Paulo no ms de maro. Foram selecionadas 30 residncias e observadas 10 ligaes em cada residncia. O resultado foi:

Nmeros de Ligaes a Cobrar (xi) 0 1 2 3 Total

Nmero de Residncias (ni) 2 5 15 8 30

Moda = __. Interpretao: __ ligaes a cobrar foi o que ocorreu com maior freqncia.
5.3. Mdia

Valor que representa o centro do conjunto de dados. Considere n observaes de um conjunto de dados representados por x1, x2, ..., xn. A mdia desse conjunto obtida pela soma das n observaes dividido por n, ou seja,
i x1 + x 2 + x3 + L + x n i =1 = x= n n Exemplo: Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A mdia das notas ___.

(5.1)

Oliveira, D. C. R. e Oliveira, M. S.

15

____/____/____

Mdia para dados agrupados em Tabelas de Freqncias Exemplo: Considere novamente o exemplo da empresa de segurana, mas suponha que o interesse seja estudar o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe alta da cidade de So Paulo no ms de maro.

Nmeros de Ligaes a Cobrar (xi) 0 1 2 3 Total

Nmero de Residncias (ni) 2 5 15 8 30

Nesse caso, a mdia calculada levando em conta as freqncias de cada valor da varivel, da seguinte forma: , (5.2) n onde v a quantidade de resultados que a varivel contm e ni a respectiva freqncia da i-sima classe. Assim, para o exemplo temos: 0 x 2 + 1x5 + 2 x15 + 3x8 = ___. n 30 Logo, o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe alta da cidade de So Paulo no ms de maro ___.
x=
i =1 i i

x=

x n
i =1 i

x n

5.4. Mediana

o valor que divide os dados, isto , metade dos dados ser maior ou igual que a mediana e metade ser menor ou igual. Considere a seguinte srie de valores: 5, 2, 6, 13, 9, 15, 10. De acordo com a definio de mediana, o primeiro passo a ser dado ordenar o conjunto de valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie em duas partes iguais 9. Logo, a mediana 9.
Mtodo prtico para o clculo da Mediana para dados em Rol 1) Ordenar os valores do menor para o maior, isto , x(1),...., x(n), onde x(1) o mnimo e x(n) o mximo. n +1 . 2) Calcular em que posio estar a mediana nos dados ordenados atravs da frmula: p = 2 3) O valor da mediana ser: (a) Se p for um nmero inteiro, ento a mediana ser o valor que est na posio p nos dados ordenados, isto Mediana = x(p)
Oliveira, D. C. R. e Oliveira, M. S.

16

____/____/____

(b) Se p no for inteiro, considere p- e p+ os inteiros imediatamente abaixo e acima de p, respectivamente. A mediana ser a mdia dos valores que esto nas posies p- e p+ nos dados ordenados, ou seja,

Mediana =

x (P ) + x (P+ ) 2

Exemplo: Calcule a mediana da seguinte srie de dados: 1, 3, 0, 0, 2, 4, 1, 2, 5 1 ordenar a srie: __, __, __, __, __, __, __, __, __. n = __ . Logo, P = (n + 1)/2 dado por P = (__+1)/2 = 5, ou seja, o 5 elemento da srie ordenada ser a mediana. Assim, mediana = __ . Exemplo: Calcule a mediana da seguinte srie de dados: 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 1 ordenar a srie: __, __, __, __, __, __, __, __, __, __. n = __. P = (n + 1)/2 dado por P = (__+1)/2 = 5.5, logo, P- = 5 e P+ = 6, ou seja, o 5 e o 6 elementos da srie ordenada, que representam os seguintes valores: __ e __, respectivamente. Pela definio, a mediana ser a mdia aritmtica do 5 e 6 termos da srie, ou seja, Mediana = (2+3)/2 = 2,5. Notas: 1) Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. 2) Quando o nmero de elementos da srie estatstica for par, a mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie. 3) Em uma srie de dados, a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. 4) A mediana, depende da posio e no dos valores dos elementos na srie ordenada. Essa uma diferena marcante entre mediana e mdia (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Na srie: 5, 7, 10, 13, 15 Mdia = 10 e Mediana = 10; Na srie: 5, 7, 10, 13, 65 Mdia = 20 e Mediana = 10, isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma.

Mediana para dados agrupados em Tabelas de Freqncias

Nesse caso, utilizamos a freqncia acumulada para identificar qual o valor da mediana.
Exemplo: Considere novamente o exemplo da empresa de segurana que desejava estudar qual o nmero de ligaes a cobrar mais freqentes recebidas em um determinado bairro de classe alta da cidade de So Paulo no ms de maro. Vamos introduzir uma nova coluna na tabela dos dados referentes a freqncia acumulada.
Oliveira, D. C. R. e Oliveira, M. S.

17

____/____/____

Nmeros de Ligaes a Cobrar (xi) 0 1 2 3 Total

Nmero de Residncias (ni) 2 5 15 8 30

Freqncia Acumulada (Fi)

Como o rol par, pois n = __, a mediana a mdia dos valores que esto nas posies 15 e 16. Ambos valores que esto nestas posies so __ ligaes a cobrar recebida por residncia, pois F3 a primeira freqncia acumulada que contm os elementos 15 e 16.

5.5. Exerccios Parte I A1

1) Os tempos de sobrevivncia (em meses) de um tipo de bateria esto listados a seguir. 5, 21, 21, 23, 23, 25, 27, 29, 30, 31, 32, 32, 32, 34, 35, 36, 38, 38, 38, 42, 43, 44, 60. Calcule o mnimo, mximo, moda, mdia e mediana. 2) Um artigo em Computers and Industrial Engineering (2001, p.51) descreve os dados de tempos de falha (em horas) para motores de jatos. Alguns desses dados esto a seguir. Mquina # 1 2 3 4 5 6 7 8 9 10 11 12 13
Tabela 5.1: Dados Brutos (em horas) Tempo de Falha Mquina # Tempo de Falha 150 14 171 291 15 197 93 16 200 53 17 262 2 18 255 65 19 286 183 20 206 144 21 179 223 22 232 197 23 165 187 24 155 197 25 203 213

Obtenha mnimo, mximo, moda, mdia e mediana dos tempos de falhas das mquinas e interprete os resultados. 3) As idades dos 20 ingressantes num certo curso de ps-graduao em finanas de uma universidade foram as seguintes: 22, 22, 22, 22, 23, 23, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 27, 28, 35 e 40. Construa uma tabela de freqncias e calcule o mnimo, mximo, moda, mdia e mediana das idades organizadas nessa tabela.

Oliveira, D. C. R. e Oliveira, M. S.

18

____/____/____

6. MEDIDAS DE DISPERSO
6.1. Motivao

Para preencher uma nica vaga existente em uma empresa, 50 candidatos foram submetidos a 6 provas sobre conhecimentos especficos de interesse da empresa. Trs destes candidatos destacaram-se com as notas descritas na tabela abaixo:
Tabela 6.1: Distribuio das Notas Provas Candidatos 1 2 3 4 5 A 7,0 7,5 8,0 8,0 8,5 B 6,0 7,0 8,0 8,0 9,0 C 7,5 8,0 8,0 8,0 8,0 Fonte: Dados Hipotticos

6 9,0 10,0 8,5

Que candidato escolher? Um critrio inicial poderia ser o de escolher o que tem a maior mdia, mas: Candidatos A B C Mdia De modo anlogo, nem adianta pensar em moda ou mediana, pois: Candidatos A B C Moda Mediana Soluo: Um segundo critrio de escolha pode ser escolher o candidato que apresentou notas mais homogneas, isto , aquele que apresentou menor disperso das notas.
6.2. Amplitude

A amplitude definida pelo intervalo entre o valor mximo e o valor mnimo da srie de dados, ou seja, Amplitude = Mximo Mnimo (6.1) Exemplo: Para os trs candidatos temos: Candidatos A B C Amplitude
6.3. Varincia e Desvio Padro

A varincia mede a disperso dos dados em torno de sua mdia. ( x x ) 2 + ( x 2 x ) 2 + ( x3 x ) 2 + L + ( x n x ) 2 = s2 = 1 n 1


Oliveira, D. C. R. e Oliveira, M. S.

(x
i =1

x)2 (6.2)
____/____/____

n 1

19

O desvio padro simplesmente a raiz quadrada positiva da varincia


s = s2

(6.3)

Exemplo: Vamos calcular a varincia e o desvio padro para os trs candidatos:

Candidato A
2 sA =

7,0

7,5

Notas 8,0 8,0

8,5

9,0

Mdia 8,0
s A = 0,5 0,7

(7 8) 2 + (7,5 8) 2 + (8 8) 2 + (8 8) 2 + (8,5 8) 2 + (9 8) 2 2,5 = = 0,5 6 1 5


Notas 8,0 8,0 Mdia 8,0

Candidato B
2 sB =

6,0

7,0

9,0

10,0

6 1
Notas 8,0 8,0

sB =

Candidato C
2 sC =

7,5

8,0

8,0

8,5 =

Mdia 8,0 =

6 1

sC =

Resumindo Tabela 6.2: Medidas de Posio e Disperso dos 3 melhores candidatos Candidatos Mdia Moda Mediana Amplitude Varincia Desvio Padro A 8,0 8,0 8,0 B 8,0 8,0 8,0 C 8,0 8,0 8,0 Frmula alternativa para o clculo da varincia
Podemos calcular a varincia atravs da seguinte frmula alternativa:

s2 =

1 n 2 2 xi n ( x ) n 1 i =1

(6.4)

. A frmula (6.4) obtida atravs de algumas manipulaes algbricas na frmula (6.2). Esta tem a facilidade de apenas necessitar da informao da mdia ( x ) e da soma dos valores ao 2 quadrado da varivel xi .

Oliveira, D. C. R. e Oliveira, M. S.

20

____/____/____

6.4. Intervalo Interquartil


O intervalo interquartil a diferena entre o terceiro quartil (Q3) e o primeiro quartil (Q1), ou seja, (6.5) IQ = Q3 Q1. Essa medida nos d a informao da amplitude dos 50% pontos centrais do conjunto de dados ordenados.

6.5. Exerccios Parte I A1


1) Considere o seguinte conjunto de dados: 2, 3, 5, 7, 10. Utilize a frmula alternativa para calcular a varincia, sabendo que a mdia 5,4. 2) Foram coletados aleatoriamente 5 empregados de 3 empresas (A, B e C) e perguntado para cada um deles o seu salrio (em salrios mnimos). Se estas 3 empresas estivessem oferecendo emprego, em qual delas voc trabalharia sendo que o resultado da pesquisa com os 15 funcionrios entrevistados foi: Empresa A Empresa B Empresa C 5,5 4 5 6 5 6 6 6 6 6 6 6 6,5 9 7 Obs: Obtenha a Amplitude, Varincia, Desvio Padro e o Intervalo-Interquartil de cada empresa para tomar sua deciso. 3) Um laboratrio clnico precisa decidir comprar um dentre trs aparelhos (A, B, C) para dosagem de sangue. Para isto o responsvel pelas anlises preparou uma substncia de concentrao conhecida (10 mg/ml) e extraiu vrias amostras para serem dosadas pelos trs aparelhos. Os resultados obtidos em cada um deles foram os seguintes: A 5 10 7 15 16 12 4 8 10 13 B 10 9 10 9 11 8 9 7 8 9 C 10 11 9 10 10 9 11 12 8 10 Em medidas clnicas trs termos so utilizados freqentemente: Preciso: refere-se disperso dos resultados No-viciado: refere-se tendncia de um conjunto de medidas produzir um resultado igual ao verdadeiro valor Exato: refere-se ao instrumento preciso e no-viciado (a) Descreva os trs instrumentos em termos das definies acima. (b) Qual instrumento lhe parece recomendvel? Justifique sua resposta.

Oliveira, D. C. R. e Oliveira, M. S.

21

____/____/____

7. ESTATSTICA GRFICA
7.1. Grficos para as Variveis Qualitativas
A representao grfica da distribuio de uma varivel tem a vantagem de, rpida e concisamente, informar sobre sua variabilidade. Existem vrios tipos de grficos para as variveis Qualitativas. Aqui sero ilustrados trs deles: Grficos em Barras, o de Composio em Setores (Pizza) e o Grfico de Pareto.

7.1.1. Grfico em Barras


O grfico em Barras consiste em construir retngulos ou barras, em que uma das dimenses proporcional magnitude a ser representada (ni), sendo a outra arbitrria, porm igual para todas as barras. Essas barras so dispostas paralelamente uma s outras, horizontalmente ou verticalmente. No exemplo a seguir temos o grfico em barras (verticais) para a varivel Grau de Instruo.

Tabela 7.1: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da Companhia MB segundo o grau de instruo. Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi) Fundamental 12 0,3333 33,33% Mdio 18 0,5000 50,00% Superior 6 0,1667 16,67% n = 36 1,0000 100,00% Total Fonte: Bussab e Morettin (2002)

18

18
16 14 12 Freqncia (ni)

12
10 8 6 4 2 0 Fundamental Mdio Grau de Instruo Superior

Figura 7.1: Grfico em Barras para a varivel Grau de Instruo


Oliveira, D. C. R. e Oliveira, M. S.

22

____/____/____

7.1.2. Grfico de Composio em Setores (Pizza)


O grfico de composio em setores (pizza), destina-se a representar a composio, usualmente em porcentagem, de partes de um todo. Consiste num crculo de raio arbitrrio, representando o todo, dividido em setores, que correspondem s partes de maneira proporcional. Para o exemplo anterior temos o seguinte grfico:
50%
Fundamental Mdio

33%
Superior

17%

Figura 7.2: Grfico em Setores para a varivel Grau de Instruo 7.1.3. Grfico de Pareto O grfico de Pareto um grfico de barras representando a freqncia absoluta com um grfico de linha, representando a porcentagem acumulada. Ele exibe a freqncia absoluta e a porcentagem acumulada no eixo vertical e as categorias da classificao no eixo horizontal (Ver Figura 7.3 a seguir). Organizamos sempre as categorias em ordem decrescente da freqncia de ocorrncia, isto , a de maior freqncia absoluta fica esquerda, seguida pela segunda de maior freqncia, e assim por diante.

500

100

300

60

200

40

100

20

Modelo-Avies Count Percent Cum %

MD-737 MD-777 MD-757 MD-767 MD-717 MD-747 281 55 45 44 32 25 57,5 11,2 9,2 9,0 6,5 5,1 57,5 68,7 77,9 86,9 93,5 98,6

MD-11 4 0,8 99,4

MD-90 3 0,6 100,0

Figura 7.3: Produo de avies em 2000. (Fonte: Boeing Commercial Airplane Company)
Oliveira, D. C. R. e Oliveira, M. S.

23

____/____/____

Porcentagem Acumulada

400 Frequencia Absoluta

80

A Figura 7.3 apresenta um grfico de Pareto para a produo de avies de transporte da Boeing Commercial Airplane Company no ano de 2000. Note que o 737 foi o modelo mais popular, seguido pelos 777, 757, 767, 717, 747, MD-11 e o MD-90. A linha no grfico de Pareto conecta as porcentagens acumuladas dos k modelos produzidos com maior freqncia (k = 1, 2, 3, 4, 5). Nesse exemplo, os dois modelos produzidos com maior freqncia respondem aproximadamente 69% do total dos avies produzidos em 2000.

Nmero de Defeitos

80 70 60 50 40 30 20 10 0
30 21 6 6 5 5 4 4

100 80 60 40 20 0

Tipo de Defeito

ia as es as as os as iv tr nc nt ur ad o ad o t u e r h c i l n O a /g q ifi an sa co as ap br /r se s d l o s u l a d te ro de en m o ar fu /f ra a s n P s r o e e e F s d rt Fo lh r te ta ta Pa l a n P E Fa Count 30 21 6 6 5 5 4 4 Percent 37,0 25,9 7,4 7,4 6,2 6,2 4,9 4,9 Cum % 37,0 63,0 70,4 77,8 84,0 90,1 95,1 100,0 o rn

Figura 7.4: Grfico de Pareto dos defeitos em elementos estruturais da porta.

Os grficos de Pareto so muito teis na anlise dos dados defeituosos em sistemas de produo. A Figura 7.4 apresenta um grfico de Pareto que mostra a freqncia com que vrios tipos de defeitos ocorrem em peas de metal usadas em um componente estrutural da moldura de uma porta de automvel. Note como o grfico de Pareto reala os relativamente poucos defeitos que so responsveis pela maioria dos defeitos observados na pea. O grfico de Pareto parte importante no programa de melhora da qualidade, porque permite que a gerncia e a engenharia concentrem sua ateno nos defeitos mais crticos do produto ou processo. Uma vez identificados esses defeitos crticos, devem-se desenvolver e implementar aes corretivas para reduzi-los ou elimin-los.

Curiosidade: O grfico de Pareto tem esse nome em homenagem ao economista italiano Vilfredo Pareto que estabeleceu a teoria de que, em certas economias, a maior parte da riqueza (80%) pertence minoria da populao (20%).

Oliveira, D. C. R. e Oliveira, M. S.

24

____/____/____

Porcentagem Acumulada

90

7.2. Grficos para as Variveis Quantitativas


Para variveis Quantitativas podemos considerar uma variedade maior de representaes grficas.

7.2.1. Grfico em Barras


O grfico em Barras para as variveis quantitativas construdo da mesma forma ao das variveis qualitativas. Como ilustrao, considere a varivel Nmero de Filhos dos empregados casados da seo de oramentos da Companhia MB. A Tabela 7.2 apresenta os dados.

Tabela 7.2: Freqncias e Porcentagens dos empregados da seo de oramentos da Companhia MB, segundo o nmero de filhos. Nmeros de Filhos (xi) Freqncia (ni) Porcentagem (100 x fi) 0 4 20 1 5 25 2 7 35 3 3 15 4 0 0 5 1 5 Total n = 20 100 Fonte: Bussab e Morettin (2002)

Figura 7.5: Grfico de Barras para a varivel Nmeros de Filhos

Oliveira, D. C. R. e Oliveira, M. S.

25

____/____/____

7.2.2. Grfico de Pontos ou Grfico de Disperso Unidimensional (ou Dot-Plot)


Quando os dados consistem em um pequeno conjunto de nmeros, estes podem ser representados traando-se uma reta com uma escala que abranja todas as mensuraes observadas e grafando-se as respectivas freqncias como pontos acima da reta. Por esse motivo, tambm conhecido como grfico de pontos.

Exemplo: Considere a varivel tempo, em segundos, entre carros que passam por um cruzamento, viajando na mesma direo: 6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4, 5, 2, 10.

4 5 6 7 8 Figura 7.6: Grfico de Disperso Dot Plot

10

7.2.3. Histograma
O Histograma utilizado para representar a distribuio de freqncia. um grfico de barras contguas, com bases proporcionais aos intervalos de classes e a rea de cada retngulo proporcional respectiva freqncia relativa. Indicaremos a amplitude do i-simo intervalo por ai. Para que a rea do retngulo respectivo seja proporcional a fi, a sua altura deve ser proporcional a di = fi/ai, que chamada de densidade de freqncia da i-sima classe. Quanto mais dados tivermos em cada classe, mais alto deve ser o retngulo. Com essa conveno, a rea total do histograma ser 1 (um).

Exemplo: Considerando a varivel Salrio dos empregados da seo de oramentos da Companhia MB, temos os seguintes dados: Tabela 7.3: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da Companhia MB, por faixas de salrio Classe de Freqncia Proporo Porcentagem Densidade de Freqncia Salrio (ni) (fi) (100 x fi) (di = fi/ai) 04 |-- 08 10 0,2778 27,78 0,0695 08 |-- 12 12 0,3333 33,33 0,0833 12 |-- 16 8 0,2222 22,22 0,0556 16 |-- 20 5 0,1389 13,89 0,0347 20 |-- 24 1 0,0278 2,78 0,0070 n = 36 1,0000 100,00 Total

Oliveira, D. C. R. e Oliveira, M. S.

26

____/____/____

0,09 0,08

D ensidade de Freqncia

0,07 0,06 0,05 0,04 0,03 0,02 0,01 0

0,0833 0,0695 0,0556

0,0347

0,007

04 |-- 08

08 |-- 12

12 |-- 16 Classes de Salrios

16 |-- 20

20 |-- 24

Figura 7.7: Histograma da varivel Salrio 7.2.4. Grfico em Linhas (ou Grfico Temporal)
um grfico utilizado para representar observaes feitas ao longo do tempo, em intervalos iguais ou no. Tais conjuntos de dados constituem as chamadas sries histricas, ou sries temporais. Traduzem o comportamento de um fenmeno em certo intervalo de tempo.

Tabela 7.4: Dvida Externa do Brasil de 1956 a 2006, em Milhes de Dlares. Ano Dvida Ano Dvida Ano Dvida
1956 2736 1957 2491 1958 2870 1959 3160 1960 3738 1961 3291 1962 3533 1963 3612 1964 3294 1965 3823 1966 3771 1967 3440 1968 4092 1969 4635 1970 6240 1971 8284 1972 11464 Fonte: IPEADATA
Oliveira, D. C. R. e Oliveira, M. S.

1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989

14857 20032 25115 32145 37951 52187 55803 64259 73963 85487 93745 102127 105171 111203 121188 113511 115506

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

123439 123910 135949 145726 148295 159256 179935 199998 241644 241468 236156 226067 227689 235414 220182 187987 191999

27

____/____/____

250000

200000

Dvida em Milhes de Dlares

150000

100000

50000

20 0

19 9

19 7

19 7

19 9

19 7

19 6

19 9

19 5

19 6

19 7

19 5

19 8

19 8

19 6

19 8

19 6

Ano

Figura 7.8: Grfico de Linhas para a varivel Dvida Externa do Brasil no perodo 1956 a 2006 7.2.5. Ramo-e-Folhas
Suponha que os dados sejam representados por x1, x2, ..., xn, e que cada nmero xi consista em, pelo menos, dois dgitos. Para construir um diagrama ramo-e-folhas dividimos cada nmero xi em duas partes: um ramo, que consiste em um ou mais dos dgitos lderes, e uma folha, que consiste nos dgitos restantes. Por exemplo, se os dados representam porcentagens de defeitos (valores entre 0 e 100), em lotes de placas de semicondutores, ento poderamos dividir o valor 76 no ramo 7 e na folha 6. Em geral, devemos escolher poucos ramos em comparao com o nmero de observaes. Usualmente, utilizado entre 5 e 20 ramos. Uma vez escolhido um conjunto de ramos, eles so listados ao longo da margem esquerda do diagrama e, ao lado de cada ramo, so listadas todas as folhas que correspondem aos valores dos dados observados.

Tabela 7.5: Fora de ruptura em libras por polegada para 100 garrafas descartveis de 1 litro de refrigerante. 176 221 242 253 261 265 271 278 286 301 187 223 243 254 262 265 272 278 287 307 197 228 245 254 263 267 274 280 290 308 200 231 246 257 263 267 274 280 293 317 205 231 248 258 264 268 274 280 294 318 208 234 248 258 264 268 274 280 296 321 210 235 250 260 265 269 275 281 298 328 214 235 250 260 265 269 276 281 299 334 215 235 250 260 265 270 276 283 299 337 220 242 251 260 265 271 277 283 300 346
Fonte: Hines et al. (2006), p. 157.
Oliveira, D. C. R. e Oliveira, M. S. ____/____/____

28

19 8

19 8

19 6

19 7

19 9

19 9

20 0

20 0

20 0

1 17 6 2 18 7 3 19 7 6 20 058 9 21 045 13 22 0138 19 23 114555 26 24 2235688 36 25 0001344788 (22) 26 0000123344555555778899 42 27 01124444566788 28 28 0000113367 18 29 0346899 11 30 0178 7 31 78 5 32 18 3 33 47 1 34 6 Figura 7.9: Diagrama ramo-e-folhas para os dados da fora de ruptura de garrafas da Tabela 7.5. O ramo-e-folhas resultante est representado na Figura 7.9. A inspeo dessa representao revela imediatamente que a maioria das foras de ruptura fica entre 220 e 308 psi, e que o valor central est em algum ponto entre 260 e 270 psi. Alm disso, as foras de ruptura esto distribudas de maneira aproximadamente simtrica em torno do valor central. Assim, o ramo-e-folhas, como o histograma, nos permite determinar rapidamente algumas caractersticas importantes dos dados que no eram to imediatamente bvias na apresentao original da Tabela 7.5. Note que, aqui, os nmeros originais no se perdem, como ocorre em um histograma. Atravs do ramo-e-folhas podemos calcular qualquer medida de posio e disperso.

7.2.6. Desenho Esquemtico ou Diagrama de Caixas (Box-Plot)


Representa os dados utilizando os trs quartis (Q1, Q2 ou mediana e Q3), o mnimo e o mximo em uma caixa retangular, alinhada verticalmente. A caixa inclui o intervalo-interquartil para o clculo das linhas extremas. * (Outlier ou Ponto Discrepante ou Ponto Aberrante)
Q 3 + 1,5 (Q 3 -Q 1)

M x im o

Q3 M ed ian a 75% 50%

Q1 M n im o

25%

Q 1 -1 ,5 (Q 3 -Q 1 )

Figura 7.10: Desenho esquemtico geral.


Oliveira, D. C. R. e Oliveira, M. S.

29

____/____/____

O diagrama de caixas ou desenho esquemtico ou box-plot til na comparao de duas ou mais amostras. Para ilustrar considere os dados da Tabela 7.6, retirados de Hines et al (2006), que representam leituras de viscosidade em trs misturas diferentes de uma matria-prima usada em uma linha de produo. Um dos objetivos do estudo que Hines et al discutem comparar as trs misturas.

Tabela 7.6: Medidas de viscosidade para trs misturas Mistura 1 Mistura 2 Mistura 3 22,02 21,49 20,33 23,5 22,56 20,49 23,83 22,67 21,67 25,38 22,78 21,95 25,49 24,18 22,28 25,9 24,46 22,45 26,67 24,62 27,00
A Figura 7.11 a seguir apresenta os box-plot para os dados da viscosidade. Essa apresentao permite uma interpretao fcil dos dados. A mistura 1 tem viscosidade mais alta do que a mistura 2, e esta tem viscosidade mais alta que a mistura 3. A distribuio da viscosidade no simtrica, porque as linhas superior e inferior e os comprimentos das caixas superior e inferior em torno da linha mediana no so iguais. O valor da viscosidade mxima da mistura 3 parece alta, em comparao com os demais valores da mistura 3 e, tambm, maior que os valores das demais misturas 1 e 2. Essa observao um outlier, e ela exige exame e anlise mais aprofundados.
27
26,67 27

26

25,9 25,38

Viscosidade (centipoise)

25 24
23,5

24,62 24,46

23 22 21
22,02 21,49

22,78 22,56

22,45 21,95

20,49

20 Mistura 1 Mistura 2

20,33

Mistura 3

Figura 7.11: Diagramas de caixas para os dados de viscosidade da mistura na Tabela 7.6.

Oliveira, D. C. R. e Oliveira, M. S.

30

____/____/____

7.3. Exerccios Parte I A1


1) Faa o grfico de barras, o de composio em setores e o de Pareto para os dados fornecidos na Tabela 7.7. Tabela 7.7: Defeitos em elementos estruturais da porta Tipo de Defeito Frequncia Absoluta Partes Salientes 5 Fora do Contorno 30 Partes mal aparadas 25 Total 60 2) Observe a sua conta de luz de 2007 e construa um grfico temporal e um grfico de barras, colocando no eixo x, os meses (janeiro, ..., dezembro) e no eixo y, consumo de energia (em kWh). 3) Desenhe o ramo-e-folhas, box-plot e o dot plot para os dados das taxas mdias geomtricas de incremento anual (por 100 habitantes) dos 30 maiores municpios do Brasil abaixo: 3,67 1,82 3,73 4,10 4,30 1,28 8,14 2,43 4,17 5,36 3,96 6,54 5,84 7,35 3,63 2,93 2,82 8,45 5,28 5,41 7,77 4,65 1,88 2,12 4,26 2,78 5,54 0,90 5,09 4,07 4) Construa uma tabela de classes de freqncias para os dados do exerccio 3, com intervalos de amplitude 1, de 0 a 10, isto : Taxas [0, 1) [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7) [7, 8) [8, 9) [9, 10] Freqncia Absoluta Proporo Densidade

em seguida, faa o histograma.

Oliveira, D. C. R. e Oliveira, M. S.

31

____/____/____

8. CORRELAO E REGRESSO
8.1. Estudo da relao entre variveis
O objetivo investigar a presena ou ausncia de relao linear sob trs pontos de vista: (a) Inspeo visual: diagrama de disperso (b) Quantificando a fora dessa relao: coeficiente de correlao. (c) Explicitando a forma dessa relao: ajuste de uma reta.

Exemplos: 1) Idade e altura das crianas; 2) Tempo de prtica de esportes e ritmo cardaco; 3) Tempo de estudo e nota na prova; 4) Taxa de desemprego e taxa de criminalidade; 5) Expectativa de vida e taxa de analfabetismo. 8.2. Diagrama de Disperso
Utilizado para estudar a relao entre duas variveis quantitativas, fornecendo uma representao grfica das duas variveis.

Exemplo: Nota na Prova e Tempo de Estudo


X: tempo de estudo (em horas) Y: nota obtida na prova

Tabela 8.1: Pares de observaes (Xi, Yi) Tempo Nota 3,0 4,5 7,0 6,5 2,0 3,7 1,5 4,0 12,0 9,3 Construo do Grfico de Disperso
No Excel podemos fazer: Coluna A: Valores de X (Tempo) Coluna B: Valores de Y (Notas) Selecione as duas colunas e clique no cone Assistente de Grfico. Selecione o grfico de Disperso (XY).
Oliveira, D. C. R. e Oliveira, M. S.

32

____/____/____

10 9 8 7 6

Nota

5 4 3 2 1 0

6
Tempo

10

12

14

Figura 8.1: Diagrama de Disperso para as variveis Tempo e Nota

Exemplo: Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual gasta com Assistncia Mdica. Numa pesquisa feita com 11 famlias com renda bruta mensal entre 10 e 60 salrios mnimos mediram-se: X: renda bruta mensal (em salrios mnimos) Y: porcentagem da renda bruta anual gasta com assistncia mdica

Tabela 8.2
X 12 16 18 20 28 30 Y 7,2 7,4 7,0 6,5 6,6 6,7 X 40 48 50 54 32 Y 6,0 5,6 6,0 5,5 6,5

Oliveira, D. C. R. e Oliveira, M. S.

33

____/____/____

Porcentagem da Renda Bruta Anual gasta com Assist. Mdica

10

20

30 Renda Bruta Mensal (em sal. mnimos)

40

50

60

Figura 8.2: Diagrama de Disperso para as variveis Renda Bruta Mensal e Porcentagem da Renda Bruta Anual gasta com Assistncia Mdica.
Nesta Figura 8.2, temos o diagrama de disperso de X (Renda Bruta Mensal) e Y (Porcentagem da Renda Bruta Anual gasta com Assist. Mdica). Podemos notar que, conforme aumenta a renda bruta mensal, a porcentagem da renda bruta anual gasta com assistncia mdica diminui. Nota-se tambm uma tendncia linear decrescente. Fazendo apenas uma mudana na escala do eixo Y da Figura 8.2, obtemos a Figura 8.3, que ilustra com maior clareza essa tendncia linear decrescente.
7,5

Porcentagem da Renda Bruta Anual gasta com Assist. Mdica

6,5

5,5

10

20

30 Renda Bruta Mensal (em sal. mnimos)

40

50

60

Figura 8.3: Diagrama de Disperso para as variveis Renda Bruta Mensal e Porcentagem da Renda Bruta Anual gasta com Assistncia Mdica.
Oliveira, D. C. R. e Oliveira, M. S.

34

____/____/____

8.3. Coeficiente de Correlao


O coeficiente de correlao linear definido como:
r=

(X
i =1

X )(Yi Y )

(n 1) S x S y

X Y
i =1

i i

nXY (9.1)

(n 1) S x S y

onde

X e Y so as mdias amostrais das variveis X e Y , respectivamente. S x e S y so os desvios padro das variveis X e Y , respectivamente

Recordando: S x =

(X
i =1

X )2 e Sy =

(Y
i =1

Y )2

n 1

n 1

Propriedades do coeficiente de correlao linear

O valor do coeficiente de correlao linear situa no intervalo [-1, 1], ou seja, 1 r 1


Classificao da correlao 1. r = 1 indica correlao linear positiva e perfeita; indica correlao linear negativa e perfeita; 2. r = 1 3. r = 0 indica inexistncia de correlao linear; 4. 1 r 0 indica correlao linear negativa; 5. 0 r 1 indica correlao linear positiva. Grficos - Exemplos da classificao da correlao

r = 1 , correlao linear positiva e perfeita

r = 1 , correlao linear negativa e perfeita

r 0 , inexistncia de correlao linear


40

30

Y
20 10 10 20 30 40 50

Oliveira, D. C. R. e Oliveira, M. S.

35

____/____/____

-1 r 0, correlao linear negativa

0 r 1, correlao linear positiva.

O valor do coeficiente de correlao no depende da escala que medimos as variveis. Para as duas figuras abaixo o valor do coeficiente de correlao r = 0,46 .
Y

Z=Y/10+0,8

O coeficiente de correlao linear mede apenas o grau de associao LINEAR.


Y

r 0,01
O coeficiente de correlao linear sensvel a valores discrepantes.

r =0

r = 0.91

Oliveira, D. C. R. e Oliveira, M. S.

36

____/____/____

Exemplo: Considere o Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual gasta com Assistncia Mdica. Obter o coeficiente de correlao com os dados da Tabela 8.2. Medidas Descritivas com os dados da Tabela 8.2 Mdia X 31,63636 Mdia Y 6,454545 Desvio de X 14,63744 Desvio de Y 0,62348 n 11 Soma XY 2160,4

r=

i =1

X i Yi nXY (n 1)S x S y

2160,4 11.31,636363.6,454545 = -0,9399564 10.14,63744.0,62348

Podemos observar uma correlao negativa entre a renda bruta mensal e a porcentagem da renda bruta anual gasta com assistncia mdica, isto quanto maior for a renda bruta mensal, menor a porcentagem de sua renda gasta com assistncia mdica.
8.4. Regresso Linear Simples

Objetivo: ajustar uma reta entre duas variveis quantitativas.


Reta Ajustada A reta ajustada de duas variveis quantitativas Y e X dado por
) Y = a + bX

Definio de a e b a: intercepto; b: inclinao da reta. Interpretao de b: Para cada aumento de uma unidade em X, temos um aumento mdio de b unidades em Y.

Podemos calcular a e b utilizando o mtodo de mnimos quadrados, que visa encontrar os valores de a e b, que minimiza a soma dos quadrados dos erros (ou desvios)

SQ(a, b) = ei2 = {Yi (a + bX i )}2


i =1 i =1

O problema agora se restringe a encontrar o mnimo de uma funo de duas variveis, a e b. Derivando e igualando a zero, observamos que as solues de a e b devem satisfazer:
a = Y bX
Oliveira, D. C. R. e Oliveira, M. S.

b=
37

i =1

X i Yi nXY

(n 1) S x2
____/____/____

Reta Ajustada - Uso do Excel Coluna A: varivel Y; Coluna B: varivel X. Para pedir reta que se ajusta aos dados devemos utilizar os seguintes comandos: =INTERCEPO(A1:An;B1:Bn): Mostrar o intercepto (a); =INCLINAO(A1:An;B1:Bn): Mostrar a inclinao (b). Exemplo: Consumo de cerveja e temperatura As variveis foram observadas em nove localidades com as mesmas caractersticas demogrficas e scio-econmicas. Y: consumo de cerveja em um dia (em 100 litros) X: temperatura mxima (em C) Os dados amostrais esto dispostos na Tabela 8.3. Tabela 8.3 Consumo Temperatura 290 36 374 36 393 22 425 15 406

Temperatura 16 31 38 39 37 A correlao entre X e Y : X= Sx =

Consumo 370 365 320 270

Y=

Sy =

X Y
i =1

i i

A reta ajustada para este exemplo :


450 430 410 y = 5,2194x + 200,42 390 Consumo de Cerveja 370 350 330 310 290 270 250 10 15 20 25 30 35 40 45 Temperatura Mxima

Figura 8.4: Diagrama de Disperso para as variveis Temperatura Mxima e Consumo de Cerveja, juntamente com a Reta de Regresso
Oliveira, D. C. R. e Oliveira, M. S.

38

____/____/____

(a) Qual a interpretao de b para o exemplo consumo de cerveja e temperatura?

(b) Qual o consumo previsto para uma temperatura de 25C?


8.5. Coeficiente de Determinao

A quantidade r2 = (quadrado do coeficiente de correlao x 100%) chama-se coeficiente de determinao e , em geral, usada para julgar-se a adequao de um modelo de regresso. Claramente, 0 r2 100. Na prtica, nos referimos a r2 de modo mais informal como a quantidade de variabilidade nos dados explicada pelo, ou devido ao, modelo de regresso.
Exemplo: Considere o estudo da renda bruta mensal pela porcentagem da renda bruta anual gasta com assistncia mdica, onde o coeficiente de correlao deu aproximadamente -0,9399, com os dados da Tabela 8.2, logo, o coeficiente de determinao ser r2 88,35%, isto , 88,35% da variabilidade nos dados explicada pelo modelo de regresso y = 7,7212 0,04x.
7,5

porcentagem da renda bruta anual gasta com assistncia mdica

6,5

5,5 y = -0,04x + 7,7212 2 R = 0,8835 5 10 15 20 25 30 35 40 45 50 55 60 renda bruta mensal (em salrios mnimos)

Oliveira, D. C. R. e Oliveira, M. S.

39

____/____/____

8.6. Exerccios Parte I A1

1) Considere o exemplo das variveis Nota na Prova e Tempo de Estudo


X : tempo de estudo (em horas) Y : nota obtida na prova

Tempo Nota

3 4,5

7 6,5

2 3,7

1,5 4

12 9,3

(a) Faa o Grfico de Disperso. (b) Obtenha o Coeficiente de Correlao. (c) Calcule a Reta de Regresso e represente no Grfico de Disperso. (d) Obtenha o coeficiente de determinao.

Oliveira, D. C. R. e Oliveira, M. S.

40

____/____/____

Lista de Exerccios 1 1) Identifique a populao e a amostra correspondente : A fim de avaliar a inteno de voto para presidente dos brasileiros, 122 pessoas foram entrevistadas em Braslia. 2) Classifique as seguintes variveis: a) Conceitos obtidos na Disciplina Estatstica (R:Ruim, M:Mdio, B:Bom e O:timo); b) Bacias Hidrogrficas (A:Amaznica, P:Platina, SF:So Francisco, N:do Nordeste, L:do Leste, S:do Sul); c) Nmero de sementes germinadas (0, 1, 2, 3, 4, 5); d) Renda; 3) Selecione uma amostra de tamanho 10 dentre 80 funcionrios, utilizando as tcnicas de amostragem aleatria simples e sistemtica. Depois, levando em conta que o sexo dos funcionrios importante na pesquisa, obtenha uma amostra de mesmo tamanho utilizando amostragem estratificada proporcional considerando que dos 80 funcionrios, 30 so mulheres e 50 so homens. (Utilize a primeira linha da tabela de nmeros aleatrios, quando for necessrio) 4) Uma certa cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que esto dentro dessas zonas eleitorais, isto , foi utilizada amostragem por conglomerado. Apresentem quais sero as 15 zonas eleitorais amostradas. (Utilize a primeira linha da tabela de nmeros aleatrios, quando for necessrio) 5) Os dados a seguir referem-se aos conceitos obtidos de n = 60 alunos, na disciplina de Estatstica na Escola E. Tabela 1: Dados Brutos R : Ruim M : Mdio B: Bom O : timo M R M M M R B B M M R B M M M M R B B R B M R M B M R M R M B M R M R M B M B M B B B B O M M M M M B B B B B B B O B O a) Organize os dados abaixo em uma Tabela de Freqncias, com ttulo, freqncias absoluta e relativa, porcentagens e interpretao. b) Faa os grficos de barras,o de composio em setores e o de Pareto para os dados da Tabela 1. 6) Os dados abaixo se referem ao comprimento de 31 canos PVC vendidos em uma loja de material de construo. Tabela 2: Dados Brutos (em m) 19,5 20,0 14,1 16,1 10,0 16,0 22,0 20,5 15,0 16,7 22,0 12,5 16,3 15,3 16,0 13,8 19,7 17,0 14,1 18,8 12,3 15,5 14,7 20,3 17,4 19,5 17,9 18,2 16,9 19,3 16,9

a) Obtenha as medidas de posio: mnimo, mximo, mdia, moda, mediana, Q1 e Q3. b) Obtenha as medidas de disperso: amplitude, varincia, desvio-padro e intervalo-interquartil.
Oliveira, D. C. R. e Oliveira, M. S.

41

____/____/____

c) Organize os dados da Tabela 2 em uma Tabela de Classes de Freqncias, com ttulo, freqncias absoluta e relativa, porcentagem e interpretao. Utilize uma amplitude de 2 para as classes. d) Faa o histograma utilizando os dados agrupados em (c), baseados na Tabela 2. e) Construa o dot-plot, box-plot e o ramo-e-folhas para os dados da Tabela 2.
7) Medidas da pulsao de 15 ndios nativos dos Alpes Peruanos esto apresentadas a seguir: Tabela 3: Medidas da pulsao 64 64 68 68 76 60 72 68 80 60 72 88 60 88 60 a) Calcule: Mdia, Mediana. Comente os resultados; b) Calcule: Mnimo, Q1, Q3 e Mximo. Interprete estas 4 estatsticas; c) Calcule: Varincia e Desvio Padro. Comente. d) Construa o grfico de barras para os dados de pulsao dos ndios. 8) Um rgo do governo do estado est interessado em determinar padres sobre o investimento em educao, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram obtidos os valores (codificados) da tabela abaixo: Tabela 4: Valores codificados do investimento em educao A B C D E F G H I J Cidade 7 19 15 14 16 19 18 Investimento 20 16 14 a) Calcule a mdia e o desvio-padro das observaes; b) Recebero um programa especial s cidades com valores de investimento inferiores mdia menos duas vezes o desvio padro. Alguma cidade receber o programa? c) Ser considerado como investimento bsico a mdia das observaes compreendidas entre a mdia original menos dois desvios padro e a mdia original mais dois desvios padro. Calcule o investimento bsico e compare com a mdia obtida no item a). Justifique a diferena encontrada. 9) Trs medicamentos para cicatrizao esto sendo testados e um experimento feito para estudar o tempo (em dias) do completo fechamento em cortes provenientes de cirurgia. Os resultados abaixo mostram o tempo de cicatrizao em cobaias submetidas a um dos trs tratamentos (A, B, C): Tabela 5: Tempo (em dias) do completo fechamento em cortes provenientes de cirurgia A 13 14 15 13 15 14 15 15 14 14 B 14 12 13 13 14 14 13 14 C 12 12 13 13 12 13 11 11 Analise os dados descritivamente utilizando todas as medidas apresentadas em aula e comente. 10) A seguir, temos informaes do nmero de peixes-boi mortos e o nmero de barcos de turismo (em milhares) que circulam em seu habitat na Flrida-EUA. Tabela 6: Dados Brutos Barcos(X) 68 68 67 70 71 73 76 81 83 84 Mortes(Y) 53 38 35 49 42 60 54 67 82 78
Oliveira, D. C. R. e Oliveira, M. S.

42

____/____/____

a) Observe o diagrama de disperso e comente sobre a relao linear dessas duas variveis. b) Verifique se a correlao significativa (atravs do coeficiente de correlao (r)). c) Obtenha a reta de regresso, considerando o nmero de peixes mortos a varivel dependente e o nmero de barcos como a varivel independente. d) Interprete o coeficiente de determinao (r2).
11) esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relao uma nutricionista selecionou 18 mulheres com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y). Tabela 7: Dados Brutos X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78 73 68 Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77 73 78 a) Faa o diagrama de disperso dos dados. b) Calcule o coeficiente de correlao linear entre X e Y e interprete-o. c) Ajuste uma reta de regresso para mostrar a relao linear entre as variveis Y: massa muscular (dependente) e X: idade (independente) e interprete os coeficientes.

Alguns resultados: n = 18;

X
i =1

18

= 1108 ;

X
i =1

18

2 i

= 70362 ;

Y
i =1

18

= 1530 ;

Y
i =1

18

= 133300 e

X Y
i =1

18

i i

= 91964 .

Observao: O gabarito da Lista de Exerccios 1 encontra-se no Apndice A

Oliveira, D. C. R. e Oliveira, M. S.

43

____/____/____

9. PROBABILIDADE
9.1. Processo ou Experimento Aleatrio Definio 1: Qualquer fenmeno que gere resultado incerto ou casual chamado de Processo ou Experimento Aleatrio. Exemplos: 1) Jogar uma moeda duas vezes e observar a seqncia obtida de caras e coroas;

2) Jogar um dado e observar o nmero mostrado na face superior;

3) Peso de Animais;

4) Nmero de filhos de um casal.

9.2. Espao Amostral () Definio 2: Espao amostral () o conjunto de todos os resultados possveis de um experimento aleatrio. Exemplos: Obtenha o espao amostral dos seguintes experimentos: 1) Jogar um dado e observar o resultado: = {1, 2, 3, 4, 5, 6}.
2) Lanar uma moeda duas vezes e observar as faces obtidas: 3) Uma urna contm 10 bolas azuis e 10 brancas. 3 bolas so retiradas ao acaso e as cores so anotadas: 4) Dois dados so lanados simultaneamente e estamos interessados na soma das faces observadas: 5) Uma moeda lanada consecutivamente at o aparecimento da 1 cara: 6) Uma mquina produz 20 peas por hora. Ao final da primeira hora de produo, observa-se o n de defeituosas: 7) Medio do tempo de vida de uma lmpada antes de se queimar:

Oliveira, D. C. R. e Oliveira, M. S.

44

____/____/____

9.3. Evento Definio 3: Evento qualquer subconjunto do espao amostral. Exemplos: (a) Alguns eventos do experimento 1: A = {5}, B = {2, 4, 6}, etc.
(b) Alguns eventos do experimento 2: Existem dois eventos especiais: espao todo () e o conjunto vazio ().

Operaes com Eventos Sejam A e B dois eventos de um mesmo espao amostral: O evento interseo de A e B, denotado AB, o evento em que A e B ocorrem simultaneamente.
A B

O evento unio de A e B, denotado AB, o evento em que A ocorre ou B ocorre (ou ambos).
A B

O evento complementar de A, denotado Ac, o evento em que A no ocorre.


A B

Exemplos: Operaes com Eventos. Seja 1 = {1, 2, 3, 4, 5, 6} e considere os seguintes eventos A = {2, 4, 6}, B = {4, 5, 6} e C = {1, 3, 5}. Faa as seguintes operaes: AB= AC = AB= A Bc = Eventos Disjuntos Definio 4: Dois eventos A e B so mutuamente exclusivos ou disjuntos se eles no podem ocorrer simultaneamente (A B = ).
A B

Exemplo:

A = o resultado do dado foi 4, e B = o resultado do dado foi 5 A B =

Aps essas quatro definies, estamos preparados para calcular probabilidades.

Oliveira, D. C. R. e Oliveira, M. S.

45

____/____/____

9.4. Exerccios Parte II A2


1) Determine o espao amostral dos seguintes experimentos: (a) Lanar 2 dados e observar as faces superiores;

(b) Lanar 2 dados e observar a soma das faces superiores;

2) Considere o seuinte espao amostral: = = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} Defina os eventos: A = nmero par: B = nmero mpar: C = mltiplo de 3: D = maior ou igual a 6: E = maior que 8: F = menor que 5: G = menor ou igual a 3: Obtenha os seguintes eventos: (a) A B = (b) A B = (c) (A B)c = (d) (A B)c = (e) C D = (f) E F = (g) (A G)c = (h) (Ec B)c =

Oliveira, D. C. R. e Oliveira, M. S.

46

____/____/____

9.5. Introduo Probabilidade


A rea de Probabilidade comeou a ser desenvolvida no sculo XVII antes ainda da formalizao da rea da Estatstica, em questes propostas em jogos de azar.

1654 Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662), na Frana, estabelecem os Princpios do Clculo das Probabilidades.

1656 - Huygens (1629-1695) publica o primeiro Tratado de Probabilidade.

No entanto, fcil perceber que o termo probabilidade j est enraizado no senso comum, pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais como: situaes de sua vida pessoal; organizando-se em relaes a horrios a cumprir, levando em conta as circunstncias do trfego; agasalhando-se ao sair de casa se a previso do tempo indicar uma frente fria. Em resumo, prevenindo-se em situaes de risco. Como podemos definir Probabilidade?

Probabilidade uma medida que quantifica a sua incerteza frente a um possvel acontecimento futuro.
H vrias maneiras de se medir a incerteza e costume se pensar na seguinte diviso: 1) Mtodo Clssico 3) Mtodo Subjetivo 2) Mtodo Freqentista 4) Mtodo Moderno ou Axiomtico O primeiro devido a Laplace e o mais conhecido, pois relaciona eventos favorveis com eventos possveis. O segundo consiste em repetir um experimento vrias vezes. O terceiro baseado na opinio pessoal e o ltimo devido a Kolmogorov e baseia-se no princpio de que qualquer experimento pode ser modelado.
Oliveira, D. C. R. e Oliveira, M. S.

47

____/____/____

9.6. Definio Clssica Definio 5 (Clssica): Dado um conjunto de N eventos equiprovveis, a probabilidade de ocorrncia de um determinado evento A, dado pela razo n P ( A) = N onde n o nmero de elementos em A e N o nmero de elementos em .

Exemplo: Considere o lanamento de uma moeda equilibrada, nesse caso o espao amostral associado = {Cara, Coroa}. Ento, pela definio clssica, a probabilidade de ocorrncia do evento cara P(cara) = . Exemplo: Populao Residente em So Joo del Rei em 2006
Idade Menor 1 Masculino 600 572 Feminino Total 1172 1a4 2592 2457 5049 5 a 9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 e mais 3411 3491 3774 7027 6699 5528 3300 2222 1085 397 3257 3482 3692 7059 7096 5863 3894 2910 1781 763 6668 6973 7466 14086 13795 11391 7194 5132 2866 1160 Total 40126 42826 82952

Fonte: DATASUS (http://www.datasus.gov.br)

= conjunto de 82.952 habitantes residentes em So Joo del Rei em 2006 por faixa etria. Possveis eventos de interesse: M = Indivduo sorteado do sexo masculino F = Indivduo sorteado do sexo feminino A = Indivduo sorteado tem mais que 80 anos B = Indivduo sorteado tem entre 15 e 29 anos M A = Indivduo sorteado do sexo masculino e tem mais de 80 anos F B = Indivduo sorteado do sexo feminino ou tem entre 15 e 29 anos

Distribuio da Faixa Etria da Cidade de So Joo del Rei em 2006, por Sexo
16,69 16,57 20,00 17,51

18,00

14,00 13,69 Masculino Feminino 8,22 8,62 9,09

Porcentagem

8,50

10,00 6,46

7,61

8,13

5,54 6,79

8,00

1,50 1,34

4,16

4,00

5,74

2,70

6,00

8,70

9,41

12,00

16,48

13,78

16,00

0,00 Menos que 1 1a4 5a9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 Grupos de Idade acima de 80

Oliveira, D. C. R. e Oliveira, M. S.

1,78

2,00

0,99

48

____/____/____

Exerccio Parte II A2: Suponha que um indivduo escolhido aleatoriamente na cidade de So Joo del Rei em 2006. Determine a probabilidade de ocorrer cada um dos eventos definidos.

9.7. Definio Freqentista Definio 6 (Freqentista): A probabilidade de ocorrncia de um determinado evento igual freqncia relativa de ocorrncia de tal evento, quando o processo aleatrio que o gerou for repetido infinitas vezes. Exemplo: Atividade Prtica do lanamento da moeda. Passo 1 Agrupem-se 2 a 2 e peguem uma moeda chamem o valor numrico da moeda de COROA (K ) e a outra face de CARA (C). Suponham que haja interesse em saber se a sua moeda honesta (isto significa saber se a probabilidade de CARA de sua moeda ou, em termos percentuais, se a probabilidade de sair Cara 50%). Passo 2 Um membro do grupo vai lanar a moeda e o outro vai marcar os resultados na planilha anexa, seguindo as seguintes instrues: a) Jogar a moeda uma vez e anotar C ou K no espao adequado (linha 2) da planilha. b) Repetir este procedimento 30 vezes, preenchendo um a um todos os espaos da linha 2. Passo 3 Continuando com a planilha, trocar de lugar com o parceiro, voltar para os itens a) e b) das instrues e continuar mais 30 jogadas at perfazer 60. Passo 4 Voltar ao primeiro da dupla e, ainda com a planilha, seguir as instrues: c) Depois do registro na linha 2 de todos os resultados como C ou K, passar para a linha 3: chamar CARA de 1 e COROA de 0 e colocar estes valores na planilha, abaixo de cada resultado j obtido na linha 2. Cada membro do grupo deve fazer metade um faz a linha de cima e o outro a linha de baixo.
d) Agora a linha 4 da planilha deve ser preenchida em cada posio deve ser colocado o nmero acumulado de CARAS, at aquela jogada (verifique que a jogada est explicitada na linha 1- que a linha n). Discutir com outro membro do grupo para ver se est claro se no, pergunte! A linha de baixo continuao do acumulado da linha de cima. e) Finalmente chegamos ltima linha linha 5: colocar a freqncia relativa (m/n) de CARAS em cada momento o que isto? Discuta com o outro membro do grupo (desprezar as entradas assinaladas com X).

Oliveira, D. C. R. e Oliveira, M. S.

49

____/____/____

1) 2) 3) 4) 5)

Jogada(n) C ou K 1 ou 0 Caras Acumuladas (m) Frequncia Relativa (m/n)

10

12

14

17

20

25

30

1) 2) 3) 4) 5)

Jogada(n) C ou K 1 ou 0 Caras Acumuladas (m) Frequncia Relativa (m/n)

31 32 33

40

47

50

55

60

Passo 5 depois de completar a 1a parte da planilha, construir a seguinte tabela, usando as linhas 4 e 5 da planilha:
n m/n 1 2 3 4 5 6 7 8 9 10 20 30 40 50 60

Passo 6 Completar o grfico, usando os valores da tabela recm construda, do seguinte modo: Eixo Y valores m/n Eixo X valores da linha 1: (n)

m/n 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1

Grfico da Atividade Prtica - Parte II A2

1 2 3 4 5 6 7 8 9 10 20 n

30

40

50

60

Passo 7 Comparar os resultados com os colegas e interpretar o resultado comentando sobre a honestidade da sua moeda. Concluso: Com isto chegamos a uma possvel definio freqentista de probabilidade, ou seja, probabilidade o valor em que a freqncia relativa se estabiliza aps um nmero muito grande de ensaios.
Oliveira, D. C. R. e Oliveira, M. S.

50

____/____/____

9.8. Definio Subjetiva Definio 7 (Subjetiva): Cada indivduo, baseado em informaes anteriores e na sua opinio pessoal a respeito de um evento em questo, pode ter uma resposta para a probabilidade desse evento. Exemplo: Um mdico experiente consegue calcular uma probabilidade do indivduo ter uma determinada doena baseado nos sintomas que o indivduo apresenta. 9.9. Definio Moderna Definio 8 (Moderna): Probabilidade uma funo P(.), que associa a cada evento do espao amostral , um nmero real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:
(1) 0 P(A) 1. (2) P() = 1. (3) Se A e B so eventos mutuamente exclusivos: P(AB) = P(A) + P(B).

Exemplos:
Segue alguns exemplos de funes j descobertas na literatura para calcular probabilidades, que sero discutidas em detalhes nos captulos posteriores. 1) Distribuio Bernoulli

P(X = x ) = p x (1 p )1 x , x = 0, 1. 2) Distribuio Binomial n x nx P(X = x ) = p p (1 p ) , x = 0, 1, ..., n. 3) Distribuio Hipergeomtrica r N r x n x , 0 x mnimo(r, n). P(X = x ) = N n 4) Distribuio Poisson

P(X = x ) = 5) Distribuio Normal

e x , x = 0, 1, ... x!

(x ) 1 2 f (x) = e 2 , - < x< + 2


2
Oliveira, D. C. R. e Oliveira, M. S.

51

____/____/____

6) Distribuio t de Student
2 [(k + 1) / 2] 1 + x f (x) = k [k / 2] k 7) Distribuio Qui-Quadrado

(k +1) / 2

, - < x< +

f (x) =

1
k k/2 22

k 1 x 2

e 2,x>0

Propriedades P1: P() = 0, onde o conjunto vazio. P2: Se Ac for o evento complementar de A, ento P(Ac) = 1 P(A). P3: Se A e B forem dois eventos quaisquer, ento P(A B) = P(A) + P(B) P(A B). P4: Se A B, ento P(A) P(B). Nos captulos posteriores veremos algumas distribuies de probabilidade para variveis discretas e contnuas comumente utilizadas. 9.10. Probabilidade Condicional A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade de um evento A ocorrer sabendo que um evento B j ocorreu. Sejam A e B dois eventos associados a um mesmo espao amostral . Denota-se por P(A|B) a probabilidade condicionada do evento A, quando o evento B tiver ocorrido. Sempre que calculamos P(A|B), estamos essencialmente calculando P(A) em relao ao espao amostral reduzido devido a B ter ocorrido, em lugar de faz-lo em relao ao espao amostral original . Assim, uma definio mais formal de probabilidade condicional dada pela definio 9. Definio 9 (Probabilidade Condicional): Dados dois eventos A e B, a probabilidade condicional de A dado que ocorreu B representada por P(A | B) e definida por P( A B) P( A | B) = , P( B) > 0 P ( B) Da definio de probabilidade condicional, obtemos a regra do produto de probabilidades.

P( A B) = P( B)P( A | B)
Exemplo: Voltando ao Exemplo da Populao Residente em So Joo del Rei em 2006, temos:
Idade Menor 1 Masculino 600 Feminino 572 Total 1172 1a4 2592 2457 5049 5 a 9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 e mais 3411 3491 3774 7027 6699 5528 3300 2222 1085 397 3257 3482 3692 7059 7096 5863 3894 2910 1781 763 6668 6973 7466 14086 13795 11391 7194 5132 2866 1160 Total 40126 42826 82952

Fonte: DATASUS (http://www.datasus.gov.br)


Oliveira, D. C. R. e Oliveira, M. S.

52

____/____/____

Se soubermos que um indivduo sorteado do sexo masculino, qual a probabilidade de que ele tenha idade entre 30 e 39 anos? B = indivduo do sexo masculino e A = tem idade entre 30 e 39 anos 6699 P(A B) 82952 6699 P(A | B) = = = = 0,167 40126 40126 P(B) 82952

Exerccio Parte II A2: Na Segunda Guerra Mundial, houve um esforo de pesquisa operacional na Inglaterra direcionado a estabelecer padres de busca de submarinos alemes pelas patrulhas areas. Por algum tempo, houve uma tendncia em concentrar os vos em reas prximas costa, uma vez que se acreditava que mais avistamentos tinham ocorrido ali. O grupo de pesquisa estudou os registros de 1000 patrulhas, obtendo os seguintes resultados (os dados so fictcios):
Prximo costa (B1) Alto-mar (B2) Total Houve avistamento (A1) 80 20 100 No houve avistamento (A2) 820 80 900 Total de Patrulhas 900 100 1000 (a) Dado que a patrulha estava prximo costa, qual a probabilidade de que houve avistamento? (b) Dado que a patrulha estava em alto-mar, qual a probabilidade de que houve avistamento? (c) Os resultados de (a) e (b) indicam uma estratgia de busca contrria prtica anterior?

9.11. Independncia de Eventos Definio 10: Dois eventos A e B so independentes se a ocorrncia de um no altera a probabilidade de ocorrncia do outro, isto , P(A|B) = P(A) ou P(B|A) = P(B), ou ainda, a seguinte forma equivalente:
P(AB) = P(A) P(B)

Exemplo: Joaninha tem probabilidade de 0,8 de passar no vestibular enquanto que Joozinho tem probabilidade de 0,6. Qual a probabilidade dos dois passarem no vestibular? Qual a suposio a ser feita nesse caso para calcular a probabilidade? Sejam os eventos: A: Joaninha passa no vestibular e B: Joozinho passa no vestibular P(AB) = 0,8.0,6 = 0,48 Exerccio Parte II A2: O campo da Engenharia da confiabilidade se desenvolveu rapidamente a partir do incio da dcada de 1960. Um tipo de problema encontrado o de se estimar a confiabilidade de um sistema a partir das confiabilidades dos subsistemas. A confiabilidade definida, aqui, como a probabilidade do funcionamento apropriado durante um certo perodo de tempo. Considere a estrutura de um sistema em srie simples, como o da figura a seguir: Sistema

Subsistema 1
Oliveira, D. C. R. e Oliveira, M. S.

Subsistema 2
53
____/____/____

O sistema funciona se e somente se o subsistema 1 e o subsistema 2 funcionarem. Se os subsistemas sobrevivem independentemente, a confiabilidade do subsistema 1 de 0,90 e do subsistema 2 de 0,80, qual a confiabilidade do sistema?

9.12. Regra da Probabilidade Total


Se A e B so eventos, temos duas maneiras de A ocorrer: A e B ocorrem (A B) ou A e Bc ocorrem (A Bc) Assim temos que: A = (A B) (A Bc) pela Regra da Soma temos: P(A) = P(A B) + P(A Bc) e finalmente pela Regra do Produto temos:

P(A) = P(B).P(A | B) + P(Bc).P(A | Bc) Exemplo: O Cruzeiro ganha com probabilidade 0.7 se chove e 0.8 se no chove. Em maio a probabilidade de chuva de 0.3. Qual a probabilidade do Cruzeiro ganhar uma partida no ms de maio? A: Cruzeiro vencer; B: chove; Bc: No chove P(A) = P(B).P(A | B) + P(Bc).P(A | Bc) = 0,3.0,7 + 0,7.0,8 = 0,77 Exerccio Parte II A2: Em um centro de mquinas, h quatro mquinas automticas de parafusos. Uma anlise dos registros de inspeo passados fornece os seguintes dados: Mquina Percentual de Produo Percentual de Defeituosos Produzidos 1 15 4 2 30 3 3 20 5 4 35 2 As mquinas 2 e 4 so mais novas e, assim, a maior parte da produo foi atribuda a elas. Suponha que o estoque atual reflita as porcentagens de produo indicadas. Se um parafuso selecionado aleatoriamente do estoque, qual a probabilidade de que seja defeituoso? 9.13. Teorema de Bayes
Finalmente, uma das relaes mais importantes envolvendo probabilidades condicionais dada pelo Teorema de Bayes. Thomas Bayes (1702-1761) afirmou que as probabilidades devem ser revistas quando conhecemos algo mais sobre os dados. A verso mais simples desse teorema dada pela frmula P(A B) P(B | A) P(A) P(A | B) = = P(B) P(B) A forma geral do Teorema de Bayes pode ser introduzida da seguinte forma: Considere a seqncia {C1, C2, ..., Cn} como sendo uma partio do espao amostral , isto , Ci Cj = sempre que i j e C1 C2 ... Cn = . Considere um evento qualquer A em . Suponha que sejam conhecidas as probabilidades de cada partio (P(Ci)) e as probabilidades condicionais P(A|Ci).
Oliveira, D. C. R. e Oliveira, M. S.

54

____/____/____

Logo, temos o seguinte teorema: Teorema: A probabilidade de ocorrncia do evento Ci, supondo a ocorrncia do evento A, dado por P(C i )(A | C i ) P (C i | A ) = n P(C j )(A | C j )
j=1

para todo i = 1, 2, ..., n.

Curiosidade O teorema de Bayes, que aparentemente poderia ser encarado como mais um resultado na teoria de probabilidades, tem importncia fundamental, pois fornece a base para uma abordagem da inferncia estatstica conhecida como inferncia bayesiana. Como estamos falando do Thomas Bayes, no podemos deixar de fazer um breve comentrio sobre o que chamamos de probabilidades subjetivas, ou seja, cada indivduo, baseado em informaes anteriores e na sua opinio pessoal a respeito de um evento em questo, pode ter uma resposta para a probabilidade desse evento. A inferncia Bayesiana toma como uma de suas bases o fato de que todas as probabilidades so subjetivas. O teorema de Bayes tem um papel importante nesse tipo de inferncia, pois passa a ser visto como um mecanismo de atualizao de opinies, ou seja, o indivduo aprende B e passa a ter opinio P(A|B) sobre A. As probabilidades associadas a eventos de modo subjetivo tm propriedades anlogas as que foram mencionadas nesse texto. Exemplo:
Nveis Histricos de Qualidade de Dois Fornecedores

% de Peas Boas Fornecedor 1 Fornecedor 2 98 95

% de Peas Ruins 2 5

Considere uma empresa fabricante que recebe embarques de peas de dois diferentes fornecedores. Atualmente, 65% das peas compradas pela empresa so do fornecedor 1 e o restante, 35%, so do fornecedor 2. Dado que uma pea selecionada seja defeituosa, qual a probabilidade dela ter vindo do fornecedor 2? P ( F2 | D ) = P(D | F2) P(F2) P(D | F2) P(F2) 0,05.0,35 0,0175 = = = 0,57 P ( D) P(D | F1) P(F1) + P(D | F2) P(F2) 0,02.0,65 + 0,05.0,35 0,0305

Exerccio Parte II A2: Em um centro de mquinas, h quatro mquinas automticas de parafusos. Uma anlise dos registros de inspeo passados fornece os seguintes dados: Mquina Percentual de Produo Percentual de Defeituosos Produzidos 1 15 4 2 30 3 3 20 5 4 35 2 Suponha que o estoque atual reflita as porcentagens de produo indicadas. Se um parafuso selecionado aleatoriamente do estoque e ele defeituoso, qual a probabilidade de que seja da mquina 2?
Oliveira, D. C. R. e Oliveira, M. S.

55

____/____/____

10. VARIVEL ALEATRIA DISCRETA


Exemplos 1. Lana-se uma moeda 10 vezes e anota-se o nmero de caras. Este nmero pode ser 0, 1, 2 ...10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um determinado produto. O nmero de pessoas que compram o produto varia de 0 a 200. 3. Conta-se o n de acidentes que ocorrem em uma rodovia num feriado prolongado. O nmero de acidentes em questo pode ser: 0, 1, 2 Como no temos um valor que limite esse nmero, supomos que o nmero de acidentes qualquer inteiro no negativo. 4. Nmero de chamadas telefnicas que chegam a uma central em um intervalo de tempo.

10.1. Introduo Vamos incorporar o conceito de probabilidade ao estudo de variveis associadas a caractersticas em uma populao. Muitos experimentos produzem resultados no-numricos. Antes de analis-los, conveniente transformar seus resultados em nmeros. Isto feito atravs da varivel aleatria que uma funo que associa um valor numrico a cada ponto do espao amostral. Para entender melhor o conceito, considere o seguinte exemplo. Exemplo: Observa-se o sexo das crianas em famlias com trs filhos. O espao amostral = {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)} Uma varivel aleatria de interesse : X = {n. de crianas do sexo masculino}. A cada evento simples, ou ponto de , associamos um nmero, que o valor assumido pela varivel aleatria X:
Evento X MMM 3 MMF 2 MFM 2 FMM 2 MFF 1 FMF 1 FFM 1 FFF 0

Poderamos tambm ter considerado o n. de crianas do sexo feminino. Os valores de X, na mesma ordem, seriam ento 0, 1, 1, 1, 2, 2, 2, 3.

Obs: A expresso varivel aleatria ser abreviada por v.a.. Definio: uma v.a. discreta quando o conjunto de valores possveis for finito ou infinito numervel. Exemplos: Nmero de filhos, Nmero de bactrias numa lmina, nmero de lmpadas em uma residncia, etc. O passo fundamental para entendermos uma v.a. discreta associar a cada valor a sua probabilidade, obtendo o que se chamamos de distribuio de probabilidade.
X P(X=x)
Oliveira, D. C. R. e Oliveira, M. S.

x1 P(X=x1)

x2 P(X=x2)
56

... ...

xn P(X=xn)
____/____/____

A funo de probabilidade (P()) deve satisfazer: 0 P(X=xi) 1 p/ xi e

n i =1

P ( X = xi ) = 1

Exemplo: Um certo departamento da UFSJ formado por 35 professores, sendo 21 homens e 14 mulheres. Uma comisso de 3 professores ser constituda, sorteando-se, ao acaso, trs membros do departamento. Qual a probabilidade da comisso ser formada por pelo menos duas mulheres?
Seja X = { n. de mulheres na comisso}.

Espao Amostral HHH HHM HMH MHH HMM MHM MMH MMM

X 0 1 1 1 2 2 2 3

Probabilidade 21 20 19 x x = 0,203 35 34 33 21 20 14 x x = 0,150 35 34 33

Distribuio de Probabilidade X P(X) 0 1 2 3 0,203 0,450 0,291 0,056

Assim, P(X 2) = P(X = 2) + P(X = 3) 21 14 13 x x = 0,097 35 34 33 = 0,291+ 0,056 = 0,347

14 13 12 x x = 0,056 35 34 33

10.2. Esperana Matemtica (Mdia) Assim como definimos a mdia de uma distribuio de freqncias como a soma dos produtos dos diversos valores observados pelas respectivas freqncias relativas, natural definirmos agora a mdia de uma v.a., ou de sua distribuio de probabilidade, como a soma dos produtos dos diversos valores de xi da v.a. pelas respectivas probabilidades P(xi). A mdia de uma v.a. X tambm chamada valor esperado ou esperana matemtica, ou simplesmente esperana de X. representada por E(X) e se define como

E (X) = x 1 P(X = x 1 ) + x 2 P(X = x 2 ) + L + x n P(X = x n ) = x i P(X = x i )


i =1

uma mdia ponderada dos xi, em que os pesos so as probabilidades associadas.


Exemplo: Um lojista mantm extensos registros das vendas dirias de certo aparelho. O quadro a seguir d o nmero xi de aparelhos vendidos em uma semana e a respectiva probabilidade:

Nmero xi 0 1 2 3 4 5 Probabilidade P(X = xi) 0,1 0,1 0,2 0,3 0,2 0,1 Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma semana?
Oliveira, D. C. R. e Oliveira, M. S.

57

____/____/____

Soluo: Calculemos inicialmente E(X), que o nmero esperado de aparelhos vendidos em uma semana: E(X) = (0)(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70. Para x unidades vendidas o lucro 20x. Logo, o lucro esperado de R$ 54,00. 10.3. Varincia Assim como a mdia uma medida de posio de uma v.a., natural que procuremos uma medida de disperso dessa varivel em relao mdia. Essa medida a varincia, a ser representada por 2 e definida por

2 = Var (X) = ( x i E (X)) 2 P(X = x i )


i =1

Desenvolvendo o termo quadrtico do somatrio, obtemos uma expresso mais fcil de calcular a varincia dada por: 2 = Var (X) = E(X 2 ) [E (X)]2 onde E(X 2 ) = x i2 P(X = x i ) .
i =1 n

Desvio Padro O desvio padro () a raiz quadrada positiva da varincia. Tem sobre essa ltima a vantagem de exprimir a disperso na mesma unidade de medida da v.a.:

= 2
10.4. Exerccio Parte II A2 1) A distribuio de X: n de crianas por domiclio numa determinada regio dada pela tabela abaixo: X 0 1 2 3 4 5 P(X = x) 0,10 0,15 0,25 0,30 0,15 0,05 Calcule: (a) O nmero mdio de crianas por domiclio, X. (b) O desvio padro de X, X. (c) A probabilidade P{X - X X X + X}.

10.5. Distribuio Bernoulli Na prtica existem muitos experimentos que admitem apenas dois resultados. Exemplos: 1) Uma pea classificada como boa ou defeituosa; 2) Um entrevistado concorda ou no com a afirmao feita; 3) O resultado de um exame mdico para deteco de uma doena positivo ou negativo; 4) No lanamento de um dado ocorre ou no a face 5.
Oliveira, D. C. R. e Oliveira, M. S.

58

____/____/____

Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas do tipo sucesso-fracasso. Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma v.a. com distribuio Bernoulli.
Varivel Aleatria de Bernoulli uma v.a. X que assume apenas dois valores: 1 se ocorrer sucesso, e 0 se ocorrer fracasso, e, sendo p a probabilidade de sucesso, 0 < p < 1. Denotamos por X ~ Bernoulli (p) uma v. a. com distribuio de Bernoulli com parmetro p.

1, se ocorrer sucesso X= 0, se ocorrer fracasso e funo de probabilidade, X P(X=x) Segue-se que E(X) = p e Var(X) = p(1-p) Repeties independentes de um ensaio de Bernoulli do origem ao modelo binomial.
10.6. Distribuio Binomial Experimento Binomial: o experimento (a) que consiste em n ensaios de Bernoulli; (b) cujos ensaios so independentes; e (c) para o qual a probabilidade de sucesso em cada ensaio sempre igual a p, 0 < p < 1. A v.a. X, correspondente ao nmero de sucessos num experimento binomial, tem distribuio binomial com parmetros n e p, com funo de probabilidade dada por: n x n x P( X = x ) = , x = 0, 1, K , n x p (1 p)
n n! onde = x! (n x )! , n!= n (n 1)(n 2) L (2)(1) e 0!= 1 . x

1 p

0 1-p

Notao: X ~ B(n; p). Mdia e Varincia da Binomial


A Mdia e a Varincia so dadas, respectivamente, por: E(X) = np
Oliveira, D. C. R. e Oliveira, M. S.

e
59

Var(X) = np(1-p)
____/____/____

Exemplo: Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10 pessoas dessa populao forem escolhidas ao acaso e com reposio, determine: (a) O n esperado de inadimplentes. (b) A probabilidade de selecionar exatamente 3 pessoas inadimplentes. (c) A probabilidade de selecionar no mximo 3 inadimplentes. 10.7. Exerccios Parte II A2
1) Nos Estados Unidos, 29% dos advogados e juzes so mulheres (Statistical Abstract of the United States, 1997). Em uma jurisdio com 30 advogados e juzes, qual o nmero esperado de mulheres? Qual a varincia e o desvio padro? 2) O maior nmero de reclamaes dos proprietrios de automveis com dois anos de uso se referem ao desempenho do sistema eltrico. Considere que um questionrio anual, enviado aos proprietrios de mais de 300 marcas e modelos de automveis, revelou que 10% dos proprietrios de automveis com dois anos de uso encontraram pontos com problemas no sistema eltrico, que incluam o motor de arranque, o alternador, a bateria, controles diversos, luzes e radio. Qual a probabilidade de que uma amostra de 12 proprietrios de automveis com dois anos ter (a) exatamente dois proprietrios com problemas no sistema eltrico (b) pelo menos dois proprietrios com problemas no sistema eltrico (c) no mximo um proprietrio com problemas no sistema eltrico.

10.8. Distribuio Hipergeomtrica


A distribuio Hipergeomtrica est restritamente relacionada com a distribuio binomial. A diferena chave entre as duas distribuies de probabilidade que com a distribuio hipergeomtrica os ensaios no so independentes e a probabilidade de sucesso muda de ensaio para ensaio, pois as selees dos elementos so feitas sem reposio, enquanto que na distribuio binomial as selees dos elementos so feitas com reposio. Considere um conjunto de N objetos dos quais r so do tipo I e N - r so do tipo II. Um sorteio de n objetos (n < N) feito ao acaso e sem reposio. Definio: A varivel aleatria discreta X que igual ao nmero de objetos do tipo I selecionados nesse sorteio tem distribuio Hipergeomtrica. Os valores possveis de X vo de 0 a min(r, n), uma vez que no podemos ter mais do que o nmero de objetos existentes do tipo I, nem mais que o total de sorteados. Sua funo de probabilidade dada por: r N r x n x , 0 x mnimo(r, n). P(X = x ) = N n Notao: X ~ Hipergeomtrica (N; n; r) Esperana: E(X) = np Varincia: Var(X) = np(1-p)(N-n)/(N-1), onde p = r/N.
Oliveira, D. C. R. e Oliveira, M. S.

60

____/____/____

Exemplo: Uma fbrica produz peas que so embaladas em caixas com 40 unidades. Para aceitar o lote de caixas enviado por essa fbrica, o controle de qualidade de uma empresa sorteia uma caixa do lote e sorteia 10 peas, sem reposio, dessa mesma caixa. Se houver alguma pea defeituosa o lote inteiro devolvido. Se a caixa sorteada tiver 4 peas defeituosas, qual a probabilidade do lote no ser devolvido? N = 40, n = 10 e r = 4 X: nmero de peas defeituosas 4 40 4 0 10 0 0,3 P(X = 0) = 40 10 10.9. Exerccio Parte II A2: Para fazer o controle de qualidade numa empresa, lotes com 100 peas so examinados. O nmero de peas com defeito no lote 10. Aps colher uma amostra de 5 peas sem reposio, calcule a probabilidade de que nessa amostra no haja nenhum item defeituoso.

10.10. Distribuio Poisson A distribuio de Poisson empregada em experimentos nos quais no se est interessado no nmero de sucessos obtido em n tentativas, como ocorre no caso da distribuio binomial, mas sim no nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um intervalo de tempo, espao, etc. Alguns exemplos de variveis que podem ter a distribuio de Poisson so (a) nmero de defeitos por centmetro quadrado; (b) n de acidentes por dia; (c) n de clientes por hora; (d) n de chamadas telefnicas recebidas por minuto; (e) n de falhas de um computador num dia de operao; (f) n de relatrios de acidentes enviados a uma companhia de seguros numa semana.
Note-se que a unidade de medida (tempo, rea) contnua, mas a varivel aleatria de interesse (nmero de ocorrncia) discreta. Alm disso, as falhas no so contveis. No possvel contar os acidentes que no ocorreram, nem o nmero de defeitos por centmetros quadrados que no ocorreram. O limite inferior do nmero de ocorrncias, em todos as situaes dos exemplos, ________, enquanto que o limite superior ao menos teoricamente infinito, muito embora, na maioria dos exemplos acima, seja difcil imaginar um nmero infinito de ocorrncias. As probabilidades, calculadas agora para todos os nmeros inteiros no negativos k = 0, 1, 2, ... so dadas da seguinte forma: e x P(X = x ) = , x = 0, 1, ...

x!

onde X = nmeros de sucessos em um intervalo a varivel de interesse, > 0 o nmero mdio de sucessos da varivel X e e a constante 2,7183 (base dos logaritmos naturais).

Notao: X ~ P() Esperana e Varincia:


Oliveira, D. C. R. e Oliveira, M. S.

E (X) = Var (X) =


61
____/____/____

Exemplo: Um departamento de conserto de mquinas recebe uma mdia de cinco chamadas por hora. Supondo que a distribuio de Poisson seja adequada nessa situao, obter a probabilidade de que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente trs chamadas:

10.11. Exerccios Parte II A2 1) Numa central telefnica, o nmero de chamadas chega segundo uma distribuio Poisson, com a mdia de oito chamadas por minuto. Determine qual a probabilidade de que num minuto se tenha: (a) duas ou mais chamadas;

(b) menos que duas chamadas;

(c) entre sete (inclusive) e nove (exclusive) chamadas.

Oliveira, D. C. R. e Oliveira, M. S.

62

____/____/____

11. VARIVEL ALEATRIA CONTNUA


At aqui estudamos variveis aleatrias discretas que so caracterizadas por ter uma distribuio de probabilidade dada por uma tabela que associa a cada um de seus valores uma probabilidade. Esta probabilidade um nmero entre 0 e 1 cuja soma igual a 1.

Definio: Seja X uma varivel aleatria. Suponha que os possveis valores de X seja um intervalo que possui infinitos valores, ento diremos que X uma varivel aleatria contnua. Exemplos: 1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real. Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar qualquer n real positivo. 2. Em um exame fsico para selecionar um jogador de futebol medido o peso de cada candidato; aqui tambm consideramos que o resultado pode ser qualquer nmero real positivo. 3. Em campanhas preventivas de hipertenso arterial comum de tempos em tempos medir-se o nvel de colesterol. O valor de cada medida pode ser um nmero real no negativo. 4. Para pacientes que se apresentam num hospital a primeira atitude medir-se a temperatura; o valor da temperatura um nmero real que se pode considerar compreendido entre 35 e 42C. 5. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete acendendo-a; observa-se a mesma at que se queime. O tempo de durao da lmpada um n real no negativo. Nos exemplos de 1 a 5, o nmero observado no experimento aleatrio um nmero real e resulta em geral de uma medio: altura das mulheres; peso do atleta; nvel de colesterol; temperatura; tempo de durao da lmpada. Uma varivel aleatria contnua assume seus valores em um intervalo. Como so atribudas probabilidades nesse caso? Exemplo: Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas aleatoriamente numa populao. O histograma por densidade desses valores apresentado abaixo.

Oliveira, D. C. R. e Oliveira, M. S.

63

____/____/____

A anlise do histograma indica que: a distribuio dos valores da varivel PESO aproximadamente simtrica em torno de 70kg; a maioria dos valores encontra-se no intervalo (55;85); existe uma pequena proporo de valores abaixo de 48kg e acima de 92kg.

Seja X = {peso em kg} de uma pessoa adulta escolhida ao acaso da populao. Como se distribuem os valores da varivel aleatria X, ou seja, qual a distribuio de probabilidades de X?

Para as variveis contnuas as probabilidades so atribudas por meio de uma funo cuja rea entre a mesma e o eixo das abscissas (X) igual a um.

P(a X b) = rea hachurada Esta funo f(x) denominada funo densidade de probabilidade da varivel aleatria contnua X. A rea sob uma curva delimitada por dois valores a e b, como mostra a figura, determinada calculando-se a integral definida entre a e b da densidade de probabilidade representada pela funo, isto ,

f(x)dx = P(a x b)
a
Oliveira, D. C. R. e Oliveira, M. S.

64

____/____/____

Exemplo: Um fabricante de televiso a cores oferece uma garantia de 1 ano para substituio gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de anos), x, como uma varivel aleatria contnua com a seguinte fdp 1 x f (x) = e 4 , x > 0 4 = 0, caso contrrio Qual a probabilidade de voc comprar a televiso e necessitar de uma substituio gratuita?
1 P( x 1) = e 4 dx = 4 0
1 x

0,2

Definio: Se X uma v.a. contnua, a funo densidade de probabilidade f(X), indicada abreviadamente por fdp, uma funo que satisfaz s seguintes condies: (a) f(X) 0, X; (b) A rea sob a funo densidade de probabilidade 1, isto :

f ( x )dx = 1

(c) P(a X b) = rea sob a funo densidade de probabilidade f(x) e acima do eixo x entre os pontos a e b, isto :

P(a X b) = f ( x )dx
a

(d) P(X = x0) = 0, porque:


P(X = x 0 ) = f ( x )dx = 0
x0 x0

Conseqncia:

P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b)

Definio: Se X uma v.a. contnua, a funo de distribuio acumulada (fda) de X definida como:
F( x ) = P(X x ) = f (s)ds

Exemplo: Considere a seguinte densidade de probabilidade: f(x) = 2x, para 0 x 1 e f(x) = 0, fora desse intervalo. Obtenha a F(x) de X. x<0 0, x x F( x ) = 2s =s 2 = x 2 , 0 x 1 0 0 x >1 1, 11.1. Esperana e Varincia Definio: Se X uma v. a. contnua, o valor esperado de X (ou esperana matemtica de X) denotada por E(X) definido como:

E(X) =

x f (x ) dx
____/____/____

Oliveira, D. C. R. e Oliveira, M. S.

65

Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0<x<1, ento:
E (X) = x 2x dx = 2 x 2 dx =
0 0 1 1

2 31 2 x 0= 3 3

Definio: A varincia de uma varivel aleatria contnua definida por:


Var(X) = E(X2) [E(X)]2, onde E(X2) =

f ( x ) dx

Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0<x<1, ento:
E(X) = 2 3 E (X 2 ) = x 2 2 x dx = 2 x 3 dx =
0 0 1 1

2 41 2 x 0= 4 4

Logo, Var(X) = 2/4 (2/3)2 =1/18 = 0,056 Tambm podemos obter o Desvio Padro: 0,056 0,23

Exerccios Parte II A2: 1) O dimetro de um cabo eltrico uma varivel aleatria com fdp dada por: f(x) = 6x(1-x) para 0 < x < 1 e f(x) = 0 fora desse intervalo. Qual a probabilidade do dimetro ser: (a) Igual a 0,5 cm? (b) Entre 0,10 e 0,20? (c) Maior que 0,5? (d) Menor que 1?
2) A quantia gasta anualmente, em milhes de reais, na manuteno do asfalto de uma cidade do interior representada pela varivel y modelada pela funo: f(y) = (8/9)y (4/9), se 0,5 y 2 e f(y) = 0, caso contrrio. Qual a probabilidade da quantia gasta ser inferior a 0,8 milhes de reais? 3) O tempo de sobrevivncia de uma bateria (em anos) pode ser modelado pela funo: f(x) = e-x, se x 0 e f(x) = 0, caso contrrio. (a) Qual a probabilidade da bateria sobreviver mais que 2 anos? (b) Qual o tempo mdio de sobrevivncia da bateria? 4) O dimetro de um cabo eltrico uma v. a. com fdp dada por: f(x) = 6x(1-x) para 0 < x < 1 e f(x) = 0 fora desse intervalo. (a) Verifique se f(x) uma fdp, atravs do item (b) da definio 2. (b) Obtenha a F(x).

11.2. Distribuio Normal


A distribuio Normal uma das mais importantes distribuies contnuas de probabilidade. Foi introduzida em 1730 por DMoivre e depois foi muito utilizada em Astronomia pelo alemo fsico/matemtico Gauss, trazendo muita confuso para vrias pessoas que por esse motivo, acham que foi Gauss que a descobriu.
Oliveira, D. C. R. e Oliveira, M. S.

66

____/____/____

Muitos dos fenmenos aleatrios de interesse comportam-se prximos a essa distribuio com valores muito freqentes em torno da mdia e diminuindo a freqncia medida que nos afastamos da mdia. Nem todos os fenmenos se ajustam distribuio Normal. Por exemplo, considere a varivel tempo de durao, em horas, de uma lmpada de certa marca. A experincia sugere que esta distribuio deve ser assimtrica com uma grande proporo de valores entre 0 e 500 horas e uma pequena proporo de valores acima de 1500 horas

Obs: A distribuio utilizada nesse caso a Distribuio Exponencial. Funo Densidade de Probabilidade da Distribuio Normal
1 x 2
2

f ( x) =
O grfico da densidade normal Propriedades:

1 2
2

< x<

A curva normal simtrica em torno da mdia ; A moda e a mediana so iguais a ; Os pontos de inflexo so - e + ; A rea sob a curva e acima do eixo horizontal igual a 1.

Parmetros: : mdia ou valor esperado 2: varincia Notao : X ~ N(, 2)

Oliveira, D. C. R. e Oliveira, M. S.

67

____/____/____

A distribuio normal depende dos parmetros e 2


Curvas normais com mesmo desvio padro, mas com mdias diferentes.

Curvas normais com mesma mdia, mas com desvios padro diferentes.

___N( , 12) ___N( , 22) ___N( , 32) 12 < 22< 32

Clculo de Probabilidades
P(a < X < b)

rea sob a curva e acima do eixo horizontal (x) entre a e b.

Oliveira, D. C. R. e Oliveira, M. S.

68

____/____/____

Se X ~ N( ; 2), definimos: Z =

X .

Ento, E(Z) = 0 e Var(Z) = 1.

f(x)

f(z) a

0 b

A varivel Z ~ N (0,1) denomina-se normal padro ou reduzida. Portanto, b a X b a < < <Z< P (a < X < b) = P = P Dada a v.a. Z ~N (0;1) podemos obter a v.a. X ~ N (;2) atravs da transformao inversa X = + Z

Oliveira, D. C. R. e Oliveira, M. S.

69

____/____/____

11.3. Tabela da Distribuio Normal Padro Denotamos: A(z) = P(Z z), para z 0.

Probabilidades Acumuladas da Distribuio Normal (0, 1) Segunda decimal de z


0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 0 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000 1 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000 2 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 3 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 4 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 5 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 6 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000

A(z) = P(Z z) , z 0.
7 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 8 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997 0.9998 0.9999 0.9999 0.9999 1.0000 9 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 0.9999 1.0000

Parte inteira e primeira decimal de z

Oliveira, D. C. R. e Oliveira, M. S.

70

____/____/____

Exemplos: Seja Z ~ N (0,1), calcular: a) P(Z 1,71) = A(1,71) = 0,9564

b) P(0 < Z 1,71) =

c) P(1,32 < Z 1,79)

d) P(Z 1,5)

e) P(Z -1,3)

f) P(-1,5 Z 1,5)

g) P(-1,32 < Z < 0)

h) P( -2,3 < Z -1,49)

i) P(-1 Z 2)

Oliveira, D. C. R. e Oliveira, M. S.

71

____/____/____

Exemplo: Seja X o gasto com lanche semanal. Aps estudar esta varivel, vimos que X ~ N (20, 64), ento obtenha: a) P(16 < X < 22) =

b) P(X < 18 ou X > 24) = P(X < 18) + P(X > 24) =

Como encontrar o valor z da distribuio N(0,1) tal que: (i) P(Z z) = 0,975 z tal que A(z) = 0,975. Pela tabela, z = 1,96.

(ii) P(0 < Z z) = 0,4975

(iii) P(Z z) = 0,3

(iv) P(Z z) = 0,975

(v) P(Z z) = 0,10

(vi) P(-z Z z) = 0,80

Oliveira, D. C. R. e Oliveira, M. S.

72

____/____/____

Calcule: a) k tal que P( X k) = 0,05

b) k tal que P( X k) = 0,025

Nota Importante: Para toda v.a. X ~ N( ; 2) temos:


(i) P( X + ) = P( 1 Z 1) = 0,6826. (ii) P( 2 X + 2) = P( 2 Z 2) = 0,955. (iii) P( 3 X +3) = P(3 Z 3) = 0,997.

11.4. Exerccios Parte II A2


1) O tempo gasto no exame vestibular de uma universidade tem distribuio Normal, com = 120 min e = 15 min. (a) Sorteando-se um aluno ao acaso, qual a probabilidade dele terminar o exame antes de 100 minutos? (b) Qual deve ser o tempo de prova, de modo a permitir que 95% dos vestibulandos terminem no prazo estipulado? (c) Qual o intervalo central de tempo, tal que 80% dos estudantes gastam para completar o exame?
Oliveira, D. C. R. e Oliveira, M. S.

73

____/____/____

Lista de Exerccios 2 Exerccio 01 Sendo A e B dois eventos de um mesmo espao amostral, traduza para a linguagem da teoria dos conjuntos as seguintes situaes: (a) Pelo menos um dos eventos ocorre. (b) Exatamente um dos eventos ocorre. (c) Nenhum dos eventos ocorre. (d) A ocorre, mas B no ocorre. Exerccio 02 Dois processadores, A e B, so colocados em teste por 50 mil horas. A probabilidade de um erro acontecer em A 2/60, em B 1/80 e em ambos 1/100. Calcule a probabilidade de que: (a) Pelo menos um processador apresente erro. (b) Nenhum apresente erro. (c) Somente A apresente erro. Exerccio 03 A probabilidade de que um homem que possui veculo motorizado se acidente num perodo de um ano de 0,113 e uma mulher que tenha um veculo motorizado se acidente num perodo de um ano de 0,057. Suponha que 55% dos motoristas em Lucas Country sejam homens. No preenchimento de um questionrio de histrico sobre desempenho ao volante, uma pessoa de Lucas Country indicou um envolvimento em acidente com veculo motorizado durante o ltimo ano. Qual a probabilidade de essa pessoa ser uma mulher? Exerccio 04 Um pai leva o filho ao cinema e gasta R$15,00 nas duas entradas. O filho vai pedir para comer pipoca com probabilidade 0,7 e pedir para comer bala com probabilidade 0,9. Os pedidos so atendidos pelo pai com probabilidade 0,5 independentemente. Se a pipoca custa R$2,00 e a bala R$3,00 estude a varivel aleatria despesa efetuada com a ida ao cinema construindo sua distribuio de probabilidade. Exerccio 05 Suponha que a probabilidade de que um item produzido por uma mquina seja defeituoso de 0,2. Se 4 itens so produzidos por esta mquina so selecionados ao acaso, qual a probabilidade de que no mais do que um item defeituoso seja encontrado? Exerccio 06 Na manufatura de certo artigo, sabido que a proporo de artigos defeituosos de 0,1. Qual a probabilidade de que uma amostra casual de tamanho 5 contenha: (a) nenhum defeituoso: (b) exatamente um defeituoso: (c) no mais que 2 defeituosos:

Oliveira, D. C. R. e Oliveira, M. S.

74

____/____/____

Exerccio 07 De acordo com o Beverage Digest, a Coca Cola e a Pepsi se posicionaram como a nmero um e a nmero dois em vendas em 1996 (The Wall Street Journal Almanac, 1998). Suponha que de um grupo de 10 indivduos, 6 prefiram a Coca Cola e 4 prefiram a Pepsi. Uma amostra aleatria sem reposio de 3 desses indivduos selecionada. (a) Qual a probabilidade de que exatamente dois prefiram a Coca Cola? (b) Qual a probabilidade de que a maioria (tanto dois como trs) prefira Pepsi? Exerccio 08 Dos 25 estudantes (14 meninos e 11 meninas) na sala de aula de uma escola, 5 estudantes estavam ausentes na quinta-feira. (a) Qual a probabilidade de que 2 dos ausentes fossem meninas? (b) Qual a probabilidade de que 2 dos ausentes fossem meninos? (c) Qual a probabilidade de que todos os ausentes fossem meninos? (d) Qual a probabilidade de que nenhum dos ausentes fosse um menino? Exerccio 09 Num certo tipo de fabricao de fita magntica, ocorrem cortes a uma taxa de um por 2000 ps. Qual a probabilidade de que um rolo com 2000 ps de fita magntica tenha: (a) nenhum corte; (b) no mximo 3 cortes; (c) pelo menos dois cortes. Exerccio 10 Os passageiros de uma linha area chegam s instalaes de passageiros de um grande aeroporto internacional a uma taxa mdia de 10 por minuto. (a) Qual a probabilidade de nenhuma chegada em 1 minuto? (b) Qual a probabilidade de que 3 passageiros ou menos cheguem em um perodo de 1 minuto? Qual a probabilidade de nenhuma chegada em um perodo de 15 minutos? (c) Exerccio 11 Depois de tomarmos vrias amostras, decidiu-se adotar um modelo para as medidas do permetro do trax de uma populao de homens adultos com os parmetros: mdia = 40 polegadas e desvio padro = 2 polegadas. (a) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax entre 40 e 43 polegadas? (b) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax maior ou igual a 43 polegadas? (c) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax menor que 35 polegadas? (d) Qual o valor do trax que seria ultrapassado por 25% da populao?

Oliveira, D. C. R. e Oliveira, M. S.

75

____/____/____

Exerccio 12 Considere a altura de 351 mulheres idosas como seguindo uma distribuio normal com mdia = 160 cm e desvio padro = 6 cm. Sorteia-se uma mulher, qual a probabilidade de que ela tenha: (a) Altura entre 160 cm e 165 cm? (b) Altura menor do que 145 cm? (c) Altura maior do que 170 cm? Exerccio 13 O dimetro X de rolamentos de esfera fabricados por certa fbrica tem distribuio Normal com mdia = 0,6140 e varincia = (0,0025)2. O lucro T de cada esfera depende de seu dimetro, e: T = 0,10 se a esfera boa (0,6100 < X < 0,6180); T = 0,05 se a esfera recupervel (0,6080 < X < 0,6100 ou 0,6180 < X < 0,6200); T = - 0,10 se a esfera defeituosa (X < 0,6080 ou X > 0,62). Calcular: (a) As probabilidades das esferas serem boas, recuperveis e defeituosas. (b) A esperana do lucro ( E(T) ).

Observao: O gabarito da Lista de Exerccios 2 encontra-se no Apndice B

Oliveira, D. C. R. e Oliveira, M. S.

76

____/____/____

12. ESTIMAO
12.1. Inferncia Estatstica
A tomada de decises sobre a populao com base em estudos feitos sobre os dados da amostra constitui o problema central da Inferncia Estatstica. A tais decises esto sempre associados um grau de incerteza e, conseqentemente, uma probabilidade de erro. A generalizao da amostra para a populao feita com o auxlio de um modelo estatstico para a situao em estudo.

Parmetro: Exemplos: Estatstica ou Estimador:


Exemplos:

Conceitos Importantes qualquer funo da populao (). P (proporo), (mdia), 2 (varincia).


). qualquer funo da amostra ( (proporo), X (mdia), S2 (varincia). P valor que a estatstica (ou o estimador) assume em uma amostra (0). (proporo), x (mdia), s2 (varincia). p

Estimativa: Exemplos:

12.2. Estimao Pontual e Intervalar para Proporo Objetivo Estimar uma proporo p (desconhecida) de elementos de uma populao, apresentando certa caracterstica de interesse, a partir da informao fornecida de uma amostra. Exemplos p: proporo de consumidores satisfeitos com os servios prestados por uma empresa de telefonia;
p: proporo de eleitores de So Joo del-Rei que votariam em um determinado candidato, caso a eleio para prefeito se realizasse hoje; p: proporo de crianas de 2 a 6 anos, do estado de Minas Gerais, que no esto matriculadas em escola de educao infantil.

Estimador Pontual O estimador pontual para p (proporo amostral) definido por: = X P n sendo que X denota o nmero de elementos na amostra que apresentam a caracterstica; n denota o tamanho da amostra coletada. na amostra denominado estimativa pontual para p. O valor assumido por p
Oliveira, D. C. R. e Oliveira, M. S.

77

____/____/____

Exemplo: Sejam, p: proporo de alunos da UFSJ que foram ao cinema pelo menos uma vez no ltimo ms, e X: nmero de estudantes que respondem sim em uma pesquisa com n entrevistados. Suponha que foram entrevistados n = 500 estudantes e que, desses, x = 100 teriam afirmado que foram ao cinema pelo menos uma vez no ltimo ms. A estimativa pontual = ( x / n ) = (100 / 500 ) = 0, 20 , ou seja, 20% dos estudantes (proporo amostral) dada por: p entrevistados afirmaram que foram ao cinema pelo menos uma vez no ltimo ms. Note que, outra amostra de mesmo tamanho pode levar a uma outra estimativa pontual para p. Estimativa Intervalar Idia: Se selecionarmos vrias amostras de uma populao contendo n dados, observaremos que cada amostra ter sua respectiva proporo. A fim de obtermos uma estimativa da proporo da populao em estudo com certo grau de confiabilidade, recorremos a um intervalo de confiana, que delimita essa proporo. A estimativa por intervalo de p corresponde a um intervalo determinado da seguinte maneira:

[p

+ ], ; p

sendo que representa o erro amostral ou margem de erro. Na prtica o intervalo de confiana com um coeficiente de confiana dado por:
(1 p ) (1 p ) p p z +z ;p IC (p,) = p n n

(1 p ) p . O valor de z obtido da distribuio normal padro. Assim, os valores n de z que limitam os nveis de confiana, onde z tal que = P(-z Z z) na N (0,1) so: Note que, = z
z

90%

95%

99%

Exemplos = 0,20 . Construa um intervalo de confiana 1) No exemplo da UFSJ, considere agora, n = 500 e p para p com coeficiente de confiana = 0,95. Resoluo: Como = 0,95 fornece z = 1,96, o intervalo dado por:
(1 p ) (1 p ) 0,20 x0,80 0,20 x0,80 p p z +z ;p ; 0,20 + 1,96 p = 0,20 1,96 = [0,165; 0,235] n 500 500 n

Nesse intervalo (=0,95), a estimativa pontual para p 0,20, com um erro amostral igual a 0,035.

Interpretao do IC com = 95%: Se sortearmos 100 amostras de tamanho n = 500 e construirmos os respectivos 100 intervalos de confiana, com coeficiente de confiana de 95%, esperamos que, aproximadamente, 95 destes intervalos contenham o verdadeiro valor de p.
Oliveira, D. C. R. e Oliveira, M. S.

78

____/____/____

2) Ainda no exemplo da UFSJ, considere k = 100 e n = 500. Qual a probabilidade da estimativa pontual estar a uma distncia de, no mximo, 0,03 da verdadeira proporo?
= 0,20; = 0,03 = ? Dados do problema: n = 500; p Com esses dados podemos calcular o valor de z e, assim, obter , o nvel de confiana do intervalo. Clculo de z: z=

n
(1 p ) p

0,03 500 0,2 x0,8

= 1,68

Logo, obtemos: 2 A(z) 1 = 2 A(1,68) 1 = 2 x 0,953 1 = 0,906 (90,6 %). Portanto a probabilidade da estimativa pontual estar a uma distncia de no mximo 0,03 da verdadeira proporo de 90,6 %.

12.3. Exerccios Parte III A3 1) A gerente de uma empresa quer estimar a proporo p de clientes que gostaram da ltima exposio de arte apresentada pela empresa. Numa amostra de 300 clientes, 270 afirmaram que gostaram da exposio. Qual seria a estimativa pontual de p? 2) Numa eleio de segundo turno, um instituto de pesquisa de opinio obteve, num levantamento de boca de urna, que 40% (p = 0,40) dos entrevistados votaram no candidato A. (a) Construa intervalos de confiana para a verdadeira proporo p de eleitores que votaram no candidato A com coeficientes de confiana de 90%, 95% e 99%. Compare os intervalos. Comente. Admita aqui que o tamanho da amostra seja n = 150.
= 0,40 foi obtida de b) Construa intervalos de confiana para p admitindo que a estimativa p amostras de tamanho n = 100, n = 150 e n = 200. Compare os intervalos. Comente. Considere aqui um coeficiente de confiana de 90%.

12.4. Estimativa Pontual e Intervalar para a Mdia Populacional Objetivo Estimar a mdia de uma varivel aleatria X, que representa uma caracterstica de interesse de uma populao, a partir de uma amostra. Exemplos : quantia mdia gasta por cliente; : salrio mdio dos empregados de um a indstria; : tempo mdio gasto usando a Internet. Estimativa Pontual Vamos observar n elementos, extrados ao acaso de uma populao; Para cada elemento selecionado, observamos o valor da varivel X de interesse.
Oliveira, D. C. R. e Oliveira, M. S.

79

____/____/____

Obtemos, ento, uma amostra aleatria de tamanho n de X, que representamos por X1, X2, ..., Xn. Uma estimador pontual para dado pela mdia amostral,

X=

X1 + X 2 + K + X n = n

i =1

Xi n

Estimativa Intervalar Se selecionarmos vrias amostras de uma populao contendo n dados, observaremos que cada amostra ter sua respectiva mdia. A fim de obtermos uma estimativa da mdia da populao em estudo com certo grau de confiabilidade, recorremos a um intervalo de confiana, que delimita essa mdia. Uma estimador intervalar ou intervalo de confiana para tem a forma:

[X ; X + ]

sendo o erro amostral (margem de erro). Teorema Central do Limite Se X1, ..., Xn representa uma amostra aleatria de uma varivel X de mdia e desvio padro , ento para n grande

2 X ~ N , n

Portanto, para n grande a mdia amostral tem distribuio Normal de mdia e desvio padro

/ n

Na prtica, temos que o intervalo de confiana para com um nvel de confiana dado por:

x z n ; x + z n
onde x a mdia amostral, o desvio padro populacional e n o tamanho amostral. Sendo assim, temos que o erro : = z . n Exemplo: No se conhece o consumo mdio de combustvel de automveis da marca T. Sabe-se, no entanto, que o desvio padro do consumo de combustvel de automveis dessa marca 10 km/l. Na anlise de 100 automveis da marca T, obteve-se consumo mdio de combustvel de 8 km/l. Encontre um intervalo de confiana para o consumo mdio de combustvel dessa marca de carro. Adote um nvel de confiana igual a 95%.
X: Consumo de combustvel da marca T; = 10 km/l n = 100 x = 8 km/l = 0,95 z=1,96

10 10 ;X + z ;8 + 1,96 X z = 8 1,96 = [8 1,96 ;8 + 1,96 ] = [6,04 ;9,96 ] n n 100 100


Portanto, a estimativa intervalar de 95% de confiana [6,04 ;9,96 ] .
Oliveira, D. C. R. e Oliveira, M. S.

80

____/____/____

Exemplo: Deseja-se estimar o tempo mdio de estudo (em anos) da populao adulta de um municpio. Sabe-se que o tempo de estudo tem distribuio normal com desvio padro = 2,6 anos. Foram entrevistados n = 25 indivduos, obtendo-se para essa amostra, um tempo mdio de estudo igual h 10,5 anos. Obter um intervalo de 90% de confiana para o tempo mdio de estudo populacional.
X: tempo de estudo, em anos X ~ N(, 2,62) n = 25 x = 10,5 anos = 0,90 z=1,65 A estimativa intervalar com 90% de confiana dada por:

2 ,6 2 ,6 ;X + z ;10 ,5 + 1,65 X z = 10 ,5 1,65 = [9 ,64 ;11,36 ] n n 25 25

12.5. Exerccios Parte III A3 1) Estabelea um intervalo de confiana para a mdia populacional, sendo que o desvio padro populacional 4, o tamanho amostral n = 36 e a mdia amostral igual a 30. Utilize um nvel de confiana de 95% para a mdia.

2) Uma amostra de n = 64 elementos de uma varivel normalmente distribuda forneceu mdia 25,4, sendo que o desvio padro populacional 5,2. Determine o intervalo de confiana de 90% para a mdia.

12.6. Estimativa para Mdia Populacional com Varincia Desconhecida Na prtica, a varincia populacional 2 desconhecida e substituda por sua estimativa:

S2 =

n 1 ( X i X )2 ( n 1) i =1

Lembrar que a estimativa amostral do desvio padro s =

s2

Oliveira, D. C. R. e Oliveira, M. S.

81

____/____/____

Distribuio t Student: Valores tc tais que P(-tc t tc) = 1 - p


Graus de Liberdade Graus de Liberdade 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 50 60 120 Graus de Liberdade

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 50 60 120 Graus de Liberdade

p = 90% 0,158 0,142 0,137 0,134 0,132 0,131 0,130 0,130 0,129 0,129 0,129 0,128 0,128 0,128 0,128 0,128 0,128 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,126 0,126 0,126 0,126 0,126 p = 90%

80% 0,325 0,289 0,277 0,271 0,267 0,265 0,263 0,262 0,261 0,260 0,260 0,259 0,259 0,258 0,258 0,258 0,257 0,257 0,257 0,257 0,257 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,255 0,255 0,254 0,254 0,254 80%

70% 0,510 0,445 0,424 0,414 0,408 0,404 0,402 0,399 0,398 0,397 0,396 0,395 0,394 0,393 0,393 0,392 0,392 0,392 0,391 0,391 0,391 0,390 0,390 0,390 0,390 0,390 0,389 0,389 0,389 0,389 0,388 0,388 0,387 0,387 0,386 70%

60% 0,727 0,617 0,584 0,569 0,559 0,553 0,549 0,546 0,543 0,542 0,540 0,539 0,538 0,537 0,536 0,535 0,534 0,534 0,533 0,533 0,532 0,532 0,532 0,531 0,531 0,531 0,531 0,530 0,530 0,530 0,529 0,529 0,528 0,527 0,526 60%

50% 1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,684 0,683 0,683 0,682 0,681 0,679 0,679 0,677 50%

40% 1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,852 0,851 0,849 0,848 0,845 40%

30% 1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,052 1,050 1,047 1,045 1,041 30%

20% 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,306 1,303 1,299 1,296 1,289 20%

10% 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,690 1,684 1,676 1,671 1,658 10%

5% 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,030 2,021 2,009 2,000 1,980 5%

4% 15,894 4,849 3,482 2,998 2,756 2,612 2,517 2,449 2,398 0,359 2,328 2,303 2,282 2,264 2,248 2,235 2,224 2,214 2,205 2,197 2,189 2,183 2,177 2,172 2,166 2,162 2,158 2,154 2,150 2,147 2,133 2,123 2,109 2,099 2,076 4%

2% 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,438 2,423 2,403 2,390 2,358 2%

1% 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,724 2,704 2,678 2,660 2,617 1%

Exemplo: 1) Para n = 11 e p = 10%, 3) Para n = 11 e p = 1%,

temos t = temos t =

2) Para n = 11 e p = 5%, 4) Para n = 20 e p = 15%,

temos t = temos t =

Nessa situao, para calcularmos o intervalo de confiana substitumos a varivel z por t, onde t possui distribuio t de Student com n-1 graus de liberdade. Assim, uma estimativa intervalar para a mdia populacional , quando desconhecido,

s s x t n ; x + t n
A varivel t bem prxima da normal padro z quando a amostra maior ou igual a 25,
Oliveira, D. C. R. e Oliveira, M. S.

82

____/____/____

porm para amostras menores que esse valor essa varivel vai se afastando de z e, quanto menor for o valor de n, maior o afastamento existente entre a varivel t e z. A tabela que fornece os valores de t, contm na 1a. linha, a rea locada nas caudas da curva, esquerda de t e direita de t. Na 1a. coluna, est os graus de liberdade (n-1). Na interseo dos valores considerados, temos os valores de t correspondente.

Exemplo: Qual o intervalo de confiana para a mdia, no nvel de 95%, sendo que uma amostra de tamanho 20 forneceu mdia 38 e desvio padro 5? Soluo: x = 38 , n = 20, s = 5. No nvel de 95%, obtemos o valor de t cruzando na tabela da t Student: p = 5% e gl = n-1 = 20-1 = 19 t = 2,093. Assim:
s s 5 5 IC[, 95%] = x t , x+t , 38 + 2,093 = [35.66 , 40.34] = 38 2,093 n n 20 20

Exemplo: Estabelea limites de confiana para a mdia, no nvel de 90%, sendo que uma amostra de tamanho 16 forneceu mdia 70 e desvio padro 6,8? Soluo: Temos que x = 70 , n = 16, s = 6,8 e para um nvel de 90%, obtemos o valor de t cruzando na tabela da t Student: p = 10% e gl = n-1 = 16-1 = 15 t = 1,753. Assim:
6,8 6,8 s s , x +t , 70 + 1,753 IC[ , 90%] = x t = 70 1,753 = [ 67.02 , 72.98] 16 16 n n

12.7. Exerccio Parte III A3 Determine o intervalo de confiana de 99% para a mdia, sendo que uma amostra de tamanho n = 9 forneceu mdia 75 e desvio padro 7.

Oliveira, D. C. R. e Oliveira, M. S.

83

____/____/____

13. TESTES DE HIPTESES


Estimao Qual a probabilidade de "cara" no lanamento de uma moeda?
Qual a proporo de eleitores favorveis ao candidato A? Qual a proporo de motoristas que tiveram sua carteira apreendida aps a vigncia da nova lei de trnsito?

versus

Teste de Hipteses A moeda honesta ou desequilibrada?


O candidato A tem at 50% das intenes de voto ou tem mais? Pelo menos 2% dos motoristas habilitados de SP tiveram suas carteiras apreendidas aps a entrada da nova lei do trnsito ou no?

13.1. Introduo Quando colhemos uma amostra de uma determinada populao, nosso objetivo tirar concluses sobre os parmetros dessa populao. Assim, a partir das informaes amostrais estimamos os parmetros da populao. Entretanto, se existe algum referencial sobre valores que os parmetros de uma populao devem assumir, podemos testar hipteses, formuladas sobre esses parmetros, de conformidade com as informaes obtidas da amostra. Igualmente, pode-se testar a hiptese de que uma amostra pertence a uma populao de parmetros dados ou ainda, se duas populaes tm parmetros iguais. 13.2. Formulao das Hipteses Para testarmos parmetros de uma populao, formulamos hipteses a respeito desses parmetros. Essas hipteses so denominadas: H0: Hiptese nula Ha: Hiptese alternativa Testar hipteses formuladas consiste em decidir se aceita ou se rejeita a hiptese nula (H0). Quando se rejeita a hiptese nula, automaticamente est sendo aceita a hiptese alternativa (Ha). Exemplo: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 4 defeituosas. A proporo de peas defeituosas p =0,05?
Testes de Hipteses possveis: a) H0: p = 0,05 Ha: p 0,05 Teste Bilateral

b) H0: p = 0,05 Ha: p > 0,05 Teste unilateral direita

c) H0: p = 0,05 Ha: p < 0,05 Teste unilateral esquerda

13.3. Tipos de Erros possveis nos Testes de Hipteses


Erro tipo I: () Rejeitar a hiptese H0 quando na realidade ela verdadeira. ( chamado de nvel de significncia do teste)

Oliveira, D. C. R. e Oliveira, M. S.

84

____/____/____

Erro tipo II () Aceitar a hiptese H0 quando na realidade ela falsa. (a) Os valores de e so as probabilidades de cada um dos erros tipo I e tipo II ocorrerem, respectivamente, ou seja,

= P(erro tipo I) = P(rejeitar Ho dado que Ho verdadeira) = P(erro tipo II) = P(aceitar Ho dado que Ho falsa)

13.4. Nvel de Significncia de um Teste de Hiptese () a probabilidade mxima que aceitamos cometer o erro do tipo I (): Os nveis de significncia usualmente adotados so 0,10 (10%), 0,05 (5%) e 0,01 (1%). Quando se deseja testar hipteses, o primeiro passo fixar o nvel de significncia, antes mesmo de se colher uma amostra. Geralmente, quanto menor for probabilidade de se cometer o erro tipo I, maior ser a probabilidade de se cometer o erro do tipo II. A nica forma de se reduzir s probabilidades relativas aos dois tipos de erros aumentando o tamanho da amostra, pois quanto maior for amostra, maior ser a preciso das estimativas dos parmetros. 13.5. Teste de Hipteses para a Proporo Exemplo 1: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 4 defeituosas. Testar ao nvel de significncia de 5%, a hiptese de que a proporo de peas defeituosas p = 0,03 ou maior. Soluo: Hipteses: H0: p = 0,03 Ha: p > 0,03 (curva unilateral direita ) Para um nvel de significncia de 5% temos da Tabela da distribuio Normal Padro que o z que fornece a rea cinza de 0,05, representada na figura, z = 1,64. Frmula para obter o z observado na amostra: p 0,01 0,04 0,03 p = = 0,5103 zobs = 0,0384 0,03(1 0,03) p(1 p) 100 100 n

Regio de Aceitao

Regio Crtica

Concluso do Teste de Hipteses: Como zobs = 0,5103 < z = 1,64, no conseguimos rejeitar H0, isto , aceita-se a hiptese de que a proporo de peas defeituosas igual a 0,03.
Oliveira, D. C. R. e Oliveira, M. S.

85

____/____/____

Exemplo 2: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 3 defeituosas. Testar ao nvel de significncia de 5%, a hiptese de que a proporo de peas defeituosas p = 0,08 ou menor. Soluo: Hipteses: H0: p = 0,08 H: p < 0,08 (curva unilateral esquerda)
Regra de deciso para Nvel de Significncia = 0,05:

0,05 Regio Crtica

Regio de Aceitao

Para um nvel de significncia de 0,05 temos que z = - 1,64. O valor de z observado na amostra : p 0,05 p 0,03 0,08 zobs = = = 1,84 p(1 p) 0,08(1 0,08) 0,0736 n 100 100 Concluso do Teste de Hipteses: Como zobs = -1,84 < z = -1,64, ento rejeito H0, ou seja, h indcios de que a proporo de peas defeituosas menor que 0,08.

Exemplo 3: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 4 defeituosas. Testar ao nvel de significncia de 5%, a hiptese de que a proporo de peas defeituosas p = 0,05 ou diferente. Soluo: Hipteses: H0: p = 0,05 Ha: p 0,05 (teste bilateral)
Regra de deciso para Nvel de Significncia = 0,05:

0,025 0,025 Regio de Aceitao

Regies Crticas

Considerando o nvel de significncia de 5%, temos que os zs que fornecem as reas cinza representada na figura acima, z = - 1,96 e z= 1,96. O valor de z observado na amostra :
Oliveira, D. C. R. e Oliveira, M. S.

86

____/____/____

p 0,01 0,04 0,05 p = = 0,46 0,05 . 0,95 0,05(1 0,05) p(1 p) 100 100 n Concluso do Teste de Hipteses: Como z = -1,96 < zobs = -0,46 < z = 1,96, ento no rejeitamos H0, isto , aceito a hiptese de que a proporo de peas defeituosas igual a 0,05. zobs =

13.6. Exerccios Parte III A3 1) Uma nova srie de televiso precisa provar que tem mais do que 25% de audincia de telespectadores depois das 13 primeiras semanas de exibio para ser julgada bem-sucedida. Considere que uma amostra de 400 famlias, 112 estavam vendo a nova srie. Com um nvel de significncia de 10%, a srie pode ser julgada bem-sucedida com base na informao da amostra? Qual a sua concluso do teste de hiptese?

2) Um contador acredita que os problemas de fluxo de caixa de uma empresa so o resultado direto do lento recebimento das contas a receber. O contador afirma que pelo menos 70% das atuais contas a receber tm mais de dois meses de idade. Uma amostra de 120 contas a receber mostrou que 78 tm mais do que dois meses de idade. Teste a afirmao do contador a um nvel de significncia de 5%.

Oliveira, D. C. R. e Oliveira, M. S.

87

____/____/____

13.7. Teste de Hipteses para Mdia com Varincia Conhecida Estimao


Qual a quantidade mdia de leite das caixinhas de leite da marca A? Qual o peso mdio das mulheres que estudam na UFSJ e esto no quarto perodo de Administrao?

Versus

Teste de Hipteses
As caixinhas de leite da marca A tm em mdia 1 litro de leite ou mais? O peso mdio das mulheres que esto no quarto perodo de Administrao na UFSJ igual a 60 kg ou diferente?

Formulao das hipteses Exemplo: Um comerciante atacadista de cereal admite uma mdia de impureza de 0,5 kg nas sacas de 60 kg desse cereal. Ao se tomar uma amostra de certo nmero de sacas de um novo fornecedor, obtm-se um valor para a mdia e o desvio padro, que permitiro, com certa probabilidade de xito, decidir se a mdia de impurezas por saca do novo fornecedor igual a 0,5 kg, ou se maior ou menor que 0,5 kg.
Testes de Hipteses possveis: a) H0: = 0,5 Ha: 0,5

b) H0: = 0,5 Ha: > 0,5

c) H0: = 0,5 Ha: < 0,5

Teste da mdia com varincia conhecida Exemplo 1: Uma amostra de 36 elementos de uma varivel X normalmente distribuda forneceu mdia x = 42,3. Sabendo que a desvio padro populacional = 5,2, teste ao nvel de significncia de 5%, a hiptese de que a mdia maior que 40. Soluo: Hipteses: H0: = 40 Ha: > 40 (curva unilateral direita )
Nvel de significncia = 5% z = 1,64. Valor de z observado na amostra:
Zobs

42,3 40 42,3 40 2,3 . 6 = = = 2,65 5,2 5,2 5,2 6 36

Regio de Aceitao

Regio Crtica

Concluso do Teste de Hipteses: Como zobs = 2,65 > z = 1,64, ento rejeito H0, isto , aceito a hiptese de que a mdia da populao maior que 40.
Oliveira, D. C. R. e Oliveira, M. S.

88

____/____/____

Exemplo 2: Uma amostra de 36 elementos de uma varivel X normalmente distribuda forneceu mdia x = 42. Sabendo que o desvio padro populacional = 12. Testar ao nvel de significncia de 5%, a hiptese de que a mdia menor que 44. Soluo: Hipteses: H0: = 44 Ha: < 44 (curva unilateral esquerda )
Nvel de significncia = 5% z = 1,64. Valor de z observado na amostra: zobs = x = 42 44 42 44 2 = = = 1 12 12 2 6 36

0,05
Regio Crtica

Regio de Aceitao

Concluso do Teste de Hipteses: Como zobs = -1 > z = -1,64, ento aceito H0, isto , aceito a hiptese de que a mdia da populao igual a 44. Exemplo 3: Uma amostra de 36 elementos de uma varivel X normalmente distribuda forneceu mdia x = 40. Sabendo que o desvio padro populacional = 12. Testar ao nvel de significncia de 5%, a hiptese de que a mdia diferente de 40.
Hipteses: H0: = 40 Ha: 40 (teste bilateral)

Nvel de significncia = 5% z = -1,96 e z = 1,96. x 40 40 40 40 0 Valor de z observado na amostra: zobs = = = = =0 12 12 2 6 n 36


0,025 0,025
Regio de Aceitao

Regies Crticas

Concluso do Teste de Hipteses: Como z = -1,96 < zobs = 0 < z = 1,96, ento aceito H0, isto , aceito a hiptese de que a mdia da populao igual a 40.
Oliveira, D. C. R. e Oliveira, M. S.

89

____/____/____

13.8. Exerccios Parte III A3 1) Uma mquina automtica de encher pacotes de caf enche-os segundo uma distribuio normal, com mdia e varincia (conhecida) 400 g2. A mquina foi regulada para = 500g. Desejamos, de meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produo est sob controle, isto , se = 500g ou no. Se uma dessas amostras apresentasse uma mdia x = 492g, voc pararia ou no a produo? Considere um nvel de significncia de 1%.

2) Sabe-se que o consumo mensal per capita de um determinado produto tem distribuio normal, com desvio padro (conhecido) 2 kg. A diretoria de uma firma que fabrica esse produto resolveu que retiraria o produto da linha de produo se a mdia de consumo per capita fosse menor que 8 kg. Caso contrrio, continuaria a fabric-lo. Foi realizada uma pesquisa de mercado, tomando-se uma amostra de 25 indivduos, e verificou-se um consumo mensal mdio de x = 7,2. Construa um teste de hiptese adequado, utilizando um nvel de significncia de 5%, e com base na amostra colhida, determine a deciso a ser tomada pela diretoria da firma.

Oliveira, D. C. R. e Oliveira, M. S.

90

____/____/____

13.9. Teste de Hipteses para Mdia com Varincia Desconhecida Exemplo 1: Foi testada uma amostra de 9 cigarros de uma certa marca, com relao ao nvel de nicotina, fornecendo mdia x = 42 mg e desvio padro s = 6 mg. Testar ao nvel de significncia de 5%, a hiptese de que a mdia maior que 40 mg. Soluo: Hipteses: H0: = 40 Ha: > 40 (curva unilateral direita) Nvel de significncia de 5%, obtemos na Tabela da t-Student o t que fornece a rea cinza de 0,05, representada na figura. Graus de liberdade: n 1 = 9 1 = 8. Se o teste tiver cauda unilateral direita: p = 2 x = 2 x 0,05 = 0,10 = 10%. Ento: t = 1,860. x 42 40 2 2 = = =1 Valor de t observado na amostra: tobs = = s 6 6 2 3 n 9

Concluso do Teste de Hipteses: Como tobs = 1 < t = 1,860, ento aceito H0, isto , aceito a hiptese de que a mdia da populao igual a 40. Exemplo 2: Uma nova amostra de 16 cigarros da mesma marca forneceu mdia x = 40 mg e desvio padro s = 4 mg. Testar ao nvel de significncia de 5%, a hiptese de que a mdia menor que 44 mg. Soluo: Hipteses: H0: = 44 Ha: < 44 (curva unilateral esquerda)
Nvel de significncia de 5%, obtemos na Tabela da t-Student o t que fornece a rea cinza de 0,05, representada na figura. Graus de liberdade: n 1 = 16 1 = 15. Se o teste tiver cauda unilateral esquerda: p = 2 x = 2 x 0,05 = 0,10 = 10%. Ento: t = 1,753. x 40 44 4 4 Valor de t observado na amostra: tobs = = = = = 4 s 4 4 1 4 n 16
Oliveira, D. C. R. e Oliveira, M. S.

91

____/____/____

Concluso do Teste de Hipteses: Como tobs = -4 < t = -1,860, ento rejeito H0, isto , aceito a hiptese de que a mdia da populao menor que 44. Exemplo 3: Outra amostra de 16 cigarros forneceu mdia x = 42 mg e desvio padro s = 4 mg. Testar ao nvel de significncia de 5%, a hiptese de que a mdia diferente de 40. Hipteses: H0: = 40 Ha: 40 (teste bilateral) Nvel de significncia de 5%, obtemos na Tabela da t-Student o t que fornece a rea cinza de 0,05, representada na figura. Graus de liberdade: n 1 = 16 1 = 15. Se o teste tiver cauda bilateral: p = = 0,05 = 5%. Ento: t = -2,131 e t = 2,131. x 42 40 2 2 Valor de t observado na amostra: tobs = = = = =2 s 4 4 1 4 n 16
Regio de Aceitao

Regio de Rejeio

Concluso do Teste de Hipteses: Como t = -2,131 < tobs = 2 < t = 2,131, ento aceito H0, isto , aceito a hiptese de que a mdia da populao igual a 40.

Oliveira, D. C. R. e Oliveira, M. S.

92

____/____/____

13.10. Exerccios Parte III A3 1) A experincia de muitos anos de uso de um dispositivo eletrnico, da marca A, tem mostrado que sua vida mdia de = 286 horas. Uma amostra de n = 16 dispositivos de uma nova marca B deu uma vida mdia de x = 290 horas com desvio padro de s = 8 horas. Testar, ao nvel de significncia de 10%, se os dispositivos das duas marcas tm a mesma vida mdia ou se a vida mdia do B maior que a do A.

2) A experincia de muitos anos de uso de uma lmpada, da marca A, tem mostrado que sua vida mdia de = 300 horas. Uma amostra de n = 9 lmpadas de uma nova marca B deu uma vida mdia de x = 290 horas com desvio padro de s = 6 horas. Testar, ao nvel de significncia de 10%, se as lmpadas das duas marcas tm a mesma vida mdia ou se a vida mdia da B menor que a da A.

3) Uma amostra de 16 empregados de uma empresa forneceu os seguintes resultados com relao s alturas: mdia 173 cm e desvio padro 16 cm. Testar ao nvel de 10% as hipteses de que a mdia da populao igual ou diferente 175cm.

Oliveira, D. C. R. e Oliveira, M. S.

93

____/____/____

Lista de Exerccios 3 Exerccio 01 Examinando 100 peas produzidas por uma mquina, foram encontradas 3 defeituosas. Obter a estimativa intervalar, no nvel de 95%, para a proporo de peas defeituosas dessa mquina. Exerccio 02 Uma amostra de 50 estudantes de uma Universidade mostrou que 8 destes apresentam problemas visuais. Obter a estimativa intervalar, no nvel de 90%, para a verdadeira percentagem dos estudantes com problemas visuais. Exerccio 03 Uma amostra de n = 64 elementos de uma varivel normalmente distribuda forneceu mdia 25,4, sendo que o desvio padro populacional 5,2. Determine o intervalo de confiana de 90% para a mdia. Exerccio 04 Determine o intervalo de confiana de 99% para a mdia do ponto de fuso de uma substncia qumica, sendo que uma amostra de tamanho n = 9 pontos de fuso desta mesma substncia forneceu uma mdia 75 e um desvio padro amostral igual a 7. Exerccio 05: Uma moeda lanada 100 vezes, obteve-se 42 caras. Testar com um nvel de significncia de 10% a hiptese de que essa moeda viciada. Exerccio 06: Uma amostra de 50 alunos de uma escola de 1o grau apresentou 3 canhotos. Testar, ao nvel de significncia 10%, a hiptese de que a percentagem de alunos canhotos dessa escola diferente de 0,05. Exerccio 07: Sabe-se que o consumo mensal per capita de um determinado produto tem distribuio normal, com desvio padro 2 kg. A diretoria de uma firma que fabrica esse produto resolveu que retiraria o produto da linha de produo se a mdia de consumo per capita fosse menor que 8 kg. Caso contrrio, continuaria a fabric-lo. Foi realizada uma pesquisa de mercado, tomando-se uma amostra de 25 indivduos, e verificou-se um consumo mensal mdio de x = 7,2. Construa um teste de hiptese adequado, utilizando um nvel de significncia de 5%, e com base na amostra colhida, determine a deciso a ser tomada pela diretoria. Exerccio 08: A experincia de muitos anos de uso de uma lmpada, da marca A, tem mostrado que sua vida mdia de = 300 horas. Uma amostra de n = 9 lmpadas de uma nova marca B deu uma vida mdia de x = 290 horas com desvio padro de s = 6 horas. Testar, ao nvel de significncia de 10%, se as lmpadas das duas marcas tm a mesma vida mdia ou se a vida mdia da B menor que a da A. Exerccio 09: Uma amostra de 16 empregados de uma empresa deu os seguintes resultados com relao s alturas: mdia 173 cm e desvio padro 16 cm. Testar ao nvel de 10% as hipteses de que a mdia da populao igual ou diferente 175cm. Observao: O gabarito da Lista de Exerccios 3 encontra-se no Apndice C

Oliveira, D. C. R. e Oliveira, M. S.

94

____/____/____

APNDICE A
Gabarito da Lista de Exerccios 1
1) Populao: eleitores brasileiros. Amostra: 122 pessoas entrevistadas em Braslia.

2) (a) Qualitativa Ordinal; (b) Qualitativa Nominal; (c) Quantitativa Discreta; (d) Quantitativa Contnua. 3) Aleatria Simples: 61, 09, 26, 29, 11, 77, 79, 04, 57, 59. Sistemtica:N/n = 80/10 = 8; x = 6; Amostra: 6, 14, 22, 30, 38, 46, 54, 62, 70, 78. Estratificada: Mulheres (4): 09, 26, 29, 11. Homens (6): 09, 26, 29, 11, 04, 02. 4) Zonas: 045, 020, 099, 033, 197, 166, 040, 005, 038, 115, 041, 173, 030, 025, 123. 5) (a) Tabela: Conceitos obtidos de 60 alunos na disciplina de Estatstica na Escola E Conceitos Freqncia Absoluta Proporo Porcentagem timo 03 0,05 05,0 Bom 22 0,367 36,7 Mdio 25 0,417 41,7 Ruim 10 0,166 16,6 Total 60 1 100 Interpretao: Podemos observar na Tabela acima que a maior proporo dos alunos da Escola E obtiveram conceito Mdio na disciplina Estatstica (42%) e apenas 5% conquistaram o conceito timo. Alm disso, 37% concluram com conceito Bom e 16% com conceito Ruim. (b)
25
22 25

20 Frequncia Absoluta

15

10

10

tim o

Bom Conce it o

Mdio

Ruim

Figura: Grfico de Barras para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da Escola E.

Oliveira, D. C. R. e Oliveira, M. S.

95

____/____/____

R 16,7%

O 5,0%

B 36,7%

M 41,7%

Figura: Grfico de Composio em Setores para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da Escola E. (O : timo; B : Bom; M : Mdio; R : Ruim)

60 50 Freqncia Absoluta 40

100

80

60 30 40 20 10 0 Conceitos Count Percent Cum % 20

Mdio 25 41,7 41,7

Bom 22 36,7 78,3

Ruim 10 16,7 95,0

timo 3 5,0 100,0

Figura: Grfico de Pareto para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da Escola E.

Oliveira, D. C. R. e Oliveira, M. S.

96

____/____/____

Porcentagem Acumulada

6) (a) mnimo = 10; mximo = 22; mdia = 16,913; moda = 14.1, 16, 16.9, 19.5, 22; mediana = 16,9; Q1 = 15,0; Q3 = 19,5. (b) amplitude = 12; varincia = 8,296; desvio-padro = 2,88; intervalo-interquartil = 4,5. (c) Tabela: Comprimento de 31 canos PVC vendidos em uma loja de material de construo Comprimento Freqncia Absoluta Proporo Porcentagem Densidade [10, 12) 1 0,0322581 3,2 0,0161290 [12, 14) 3 0,0967742 9,7 0,0483871 [14, 16) 6 0,1935480 19,4 0,0967742 [16, 18) 10 0,3225810 32,2 0,1612900 [18, 20) 6 0, 1935480 19,4 0,0967742 [20, 22] 5 0,1612907 16,1 0,0806452 Total 31 1 100 -----Interpretao: A maior parte dos canos tem comprimento entre 16 e 18m (32,2%), ....(descrever a coluna da porcentagem) (d)
0,18 0,16 0,14 0,12 Densidade 0,10 0,08 0,06 0,04 0,02 0,00 10
0,016129 0,0483871 0,0967742 0,0967742 0,0806452 0,16129

12

14

16 Comprimento

18

20

22

Figura: Histograma do comprimento de 31 canos PVC vendidos em uma loja de material de construo.

(e)

10

11

12

13

14

15 16 17 Compriment o

18

19

20

21

22

Figura: Diagrama de disperso unidimensional do comprimento de 31 canos PVC vendidos em uma loja de material de construo.
Oliveira, D. C. R. e Oliveira, M. S.

97

____/____/____

22

20

18 Comprimento
4 Freqncia Absoluta 3 2 1 0

16

14

12

10

Figura: Box-plot do comprimento de 31 canos PVC vendidos em uma loja de material de construo. 1 10 0 1 11 3 12 35 4 13 8 7 14 117 10 15 035 (7) 16 0013799 14 17 049 11 18 28 9 19 3557 5 20 035 2 21 2 22 00 Figura: Ramo-e-folhas do comprimento de 31 canos PVC vendidos em uma loja de material de construo. 7) a) Mdia = 69,87 e Mediana = 68. A mdia e a mediana foram bem diferentes. Embora 50% dos ndios tenham pulsao abaixo de 68, os ndios com maior pulsao, fez com que o valor mdio da pulsao fosse maior, isto , aproximadamente 70. Quando os valores so distintos da mdia e mediana, implica que os dados so assimtricos. (conforme mostra o grfico da alternativa (d) desse exerccio) b) Mnimo = 60, Q1 = 60, Q3 = 76 e Mximo = 88.A menor e a maior pulsao foram 60 e 88, respectivamente. 25% dos ndios tiveram pulsao inferior a 60 e 25% superior a 76. 50% obtiveram entre 60 e 76. c) Varincia = 91,12 e Desvio Padro = 9,55. A variabilidade das pulsaes foi de 9,55 em torno do valor mdio da pulsao. d)

60

64

68

72 P u ls a o

76

80

88

Figura: Grfico de barras das medidas da pulsao de 15 ndios nativos dos Alpes Peruanos.
Oliveira, D. C. R. e Oliveira, M. S.

98

____/____/____

8) (a) Mdia = 15,8; Desvio Padro 3,8. (b) Mdia 2*Desvio 8,3. Sim, a cidade D. (c) Fazer a mdia dos investimentos das cidades que tiver 8,3 Investimento 23,3. Ivestimento Bsico 16,8. O valor no item (a) era menor em 1 unidade, pois a cidade D foi retirada do clculo, por no ter o investimento dentro do intervalo pr-estabelecido. A mdia no item (a) foi menor, porque a cidade D um possvel outlier e o valor da mdia sensvel aos valores discrepantes, isto , o seu valor influenciado por valores pequenos ou grandes. 9) Medicamentos N De Cobaias 10 8 8 Mnimo Mximo Mdia Mediana Q1 Q3 Amplitude Varincia Desvio Padro 0,789 0,744 0,835 IQ

A B C

13 12 11

15 14 13

14,2 13,375 12,125

14 13,5 12

13,5 13 11,5

15 14 13

2 2 2

0,622 0,554 0,696

1,5 1 1,5

Embora as medidas de disperso, em geral, mostram que o medicamento C tem maior variabilidade dos dados, as medidas de posio mostraram que o medicamento C o que fornece menor tempo de cicatrizao do completo fechamento dos cortes provenientes de cirurgia. 10) (a)

80

70

Mortes

60

50

40

30 65 70 75 Barcos 80 85

Figura: Grfico de Disperso do nmero de peixes-boi mortos versus o nmero de barcos de turismo (em milhares) que circulam em seu habitat na Flrida-EUA. Podemos observar visualmente que h uma relao linear positiva entre o nmero de peixes-boi mortos com o nmero de barcos de turismo (em milhares), isto , quanto mais barcos passar no habitat dos peixes-boi, maior ser o nmero de mortes. (b) r 0,922. Podemos notar atravs de r, que a correlao positiva entre X e Y significativa. (c) Mortes = 2,27*Barcos 113
Oliveira, D. C. R. e Oliveira, M. S.

99

____/____/____

d) r2 = 84,9%. 84,9% da variao do nmero de peixes mortos explicado pelo nmero de barcos (em milhares) que passam no seu habitat. 15,1% devido a outros fatores que no foram estudados, tais como, substncias qumicas eliminadas no habitat dos peixe-boi, pescadores, etc. 11) (a)
120

110

100 Massa 90

80

70

60 40 50 60 Idade 70 80

Figura: Grfico de Disperso da idade versus a massa muscular de 18 mulheres com idade entre 40 e 79 anos. (b) r = 0,837. O valor do coeficiente de correlao indica que as variveis idade e massa muscular esto relacionadas linearmente de forma negativa, ou seja, quanto maior a idade menor a massa muscular. (c) Y = 148,197 1,027 X. O coeficiente a = 148,197 (intercepto) no pode ser interpretado, porque a variao de X no contm o valor 0. O coeficiente b = - 1,027 (inclinao) indica que a cada aumento de um ano na idade, espera um decrscimo de aproximadamente 1 da massa muscular.

Oliveira, D. C. R. e Oliveira, M. S.

100

____/____/____

APNDICE B
Gabarito da Lista de Exerccios 2
1) (a) (A B) b) (A Bc) (Ac B) c) (A B)c d) (A Bc) 2) a) P(AB) 0,0358 b) P((A B)c) 0,9641 c) P((A Bc)) 0,023 3) P(M|A) = 0,292 4) X 15 17 18 20 E[X] = P(X) 0,3575 0,1925 0,2925 0,1575 17,05 5) 0,8192 6) (a) 0,59049 (b) 0,32805 (c) 0,99144 7) (a) 0,5 (b) 0,33333 8) (a) 0,376812 (b) 0,282609 (c) 0,0376812 (d) 0,0086957 9) (a) 0,367879 (b) 0,981011 (c) 0,264242 10) (a) 0,0000454(b) 0,0103361 (c) 0 11) (a) 0,4332 (b) 0,0668 (c) 0,0062 (d) 41,34 12) (a) 0,2967 (b) 0,0062 (c) 0,0475 13) (a) boas: 0,8904 recuperveis: 0,0932 defeituosas: 0,0164 (b) E[T] 0,09

Oliveira, D. C. R. e Oliveira, M. S.

101

____/____/____

APNDICE C
Gabarito da Lista de Exerccios 3

1) IC[P ; 95%] = 0,03 1,96

0,03.0,97 0,03.0,97 ; 0,03 + 1,96 = [0 ; 0,0634] 100 100 0,16.0,84 0,16.0,84 ; 0,16 + 1,645 = [0,075 ; 0,245] 50 50 5,2 64 9 ; 25,4 + 1,645 5,2 = [24.3 ; 26.5] 64

2) IC[P ; 90%] = 0,16 1,645

3) IC[ ; 90%] = 25,4 1,645

4) IC[ ; 99%] = 75 3,355

; 75 + 3,355

7 = [67.2 ; 82.8] 9

5) Hipteses: Ho: p = 0,5 Ha: p 0,5 Nvel de Significncia: = 0,10 Proporo Amostral:

= 0,42 p
0,42 0,5 0,5.0,5 100 = 1.6

Estatstica do Teste: z observado =

Regra de Deciso: Pela tabela da distribuio normal, Ha e nvel de significncia: RC = (- , -1.645] [1.645 , +) RA = (-1.645 , 1.645) Concluso: Como zobservado RA, ento no rejeito Ho com um nvel de significncia de 10%, ou seja, no podemos afirmar que a moeda viciada. 6) Hipteses: Ho: p = 0,05 Ha: p 0,05 Nvel de Significncia: = 0,10

= 0,06 Proporo Amostral: p


Estatstica do Teste:

z observado =

0,06 0,05 0,05.0,95 50

0.32

Regra de Deciso: Pela tabela da distribuio normal, Ha e nvel de significncia: RC = (- , -1.645] [1.645 , +) RA = (-1.645 , 1.645) Concluso: Como zobservado RA, ento no rejeito Ho com um nvel de significncia de 10%, ou seja, podemos afirmar que 5% dos alunos dessa escola de 1 grau so canhotos. 7) Hipteses: Ho: = 8 kg Ha: < 8 kg Nvel de Significncia: = 0,05

Oliveira, D. C. R. e Oliveira, M. S.

102

____/____/____

Estatstica do Teste:

z observado =

7,2 8 = 2 2 25

Regra de Deciso: Pela tabela da distribuio normal, Ha e nvel de significncia: RC = (- , -1.645] RA = (-1.645 , +) Concluso: Como zobservado RC, ento rejeito Ho com um nvel de significncia de 5%, ou seja, a mdia de consumo per capita menor que 8 kg. 8) Hipteses: Ho: = 300 Ha: < 300 Nvel de Significncia: = 0,10 Estatstica do Teste: t observado

290 300 = 5 6 9

Regra de Deciso: Pela tabela da t de Student com Graus de Liberdade = 8 e p = 20%, Ha e nvel de significncia: RC = (- , -1.397] RA = (-1.397 , +) Concluso: Como zobservado RC, ento rejeito Ho com um nvel de significncia de 10%, ou seja, a vida mdia de B menor que a de A. 9) Hipteses: Ho: = 175 Ha: 175 Nvel de Significncia: = 0,10 Estatstica do Teste: t observado

173 175 = 0,5 16 16

Regra de Deciso: Pela tabela da t de Student com Graus de Liberdade = 15 e p = 10%, Ha e nvel de significncia: RC = (- , -1.753] [1.753 , +) RA = (-1.753 , 1.753) Concluso: Como zobservado RA, ento no rejeito Ho com um nvel de significncia de 10%, ou seja, podemos afirmar que a altura mdia de 175 cm.

Oliveira, D. C. R. e Oliveira, M. S.

103

____/____/____

APNDICE D - Aula no Laboratrio de Computao


1) Em certa localidade, obtiveram-se os seguintes dados sobre precipitao pluviomtrica anual, X (cm) e colheita de algodo, Y (kg/are) para um perodo de 7 anos: Ano 1 2 3 4 5 6 7 X 1,0 158,85 118,65 114,80 75,0 127,15 111,15 Y 520 190 208 213 310 194 160 a) Obtenha a mdia, mediana, Quartil 1, Quartil 3 e desvio-padro de X e Y. b) Quantos pontos aberrantes voc encontrou em cada Box-plot de X e Y? c) Construa o Dot-Plot de X no MINITAB e escreva em qual intervalo de valores de X esto a maior parte dos dados. d) Construa o Ramo-e-Folhas de Y no MINITAB e escreva em qual intervalo de valores de X esto a maior parte dos dados. e) Construa o diagrama de disperso entre X e Y no MINITAB. Qual a relao entre X e Y visualmente? f) Obtenha o valor da correlao e a reta de regresso entre X e Y. g) Faa o teste-t para testar, com um nvel de significncia de 5% se: Ho: = 50 contra Ha: 50.
X X

h) Sabendo que o desvio de Y igual a 10, teste com um nvel de significncia de 10% as hipteses: Ho: = 256 contra Ha: > 256.
Y

2) Se entrevistamos 1500 pessoas e 1050 so a favor de um candidato, teste com um nvel de significncia de 1% se ele vencer as eleies.

3) Quando uma mquina nova est funcionando adequadamente, somente 3% dos itens produzidos apresentam defeitos. Suponha que 5 itens so selecionadas aleatoriamente. (a) Qual a probabilidade de encontrarmos 2 defeituosos? (b) Qual a probabilidade de encontrarmos 3 ou mais defeituosos? 4) Para fazer o controle de qualidade numa empresa, lotes com 100 peas so examinados. Todo lote composto por 10 peas defeituosas. Aps coletar uma amostra de 5 peas sem reposio, calcule a probabilidade de que nessa amostra no haja nenhum item defeituoso? 5) Durante o perodo de tempo em que reservas por telefone esto sendo feitas na universidade local, as chamadas chegam razo de uma a cada dois minutos. (a) Qual a probabilidade de 3 chamadas em 2 minutos? (b) Qual a probabilidade de 2 ou mais chamadas em um perodo de 4 minutos?

Oliveira, D. C. R. e Oliveira, M. S.

104

____/____/____

Você também pode gostar