Você está na página 1de 85

Universidade de Caxias do Sul Centro de Cincias Exatas e Tecnologia

Probabilidade e EstatsticA
EST0204 Prof Daiane Scopel Boff, Ms.
a

PROBABILIDADE
E ESTATSTICA

2012

SUMRIO
1 ESTATSTICA DESCRITIVA............................................................................................... 5 1.1 Introduo ......................................................................................................................... 5 1.2 Conceitos bsicos ............................................................................................................... 6 1.3 Tabelas ............................................................................................................................... 8 1.3.1 Tabela de dupla entrada............................................................................................ 9 1.4 Distribuio de frequncia ............................................................................................... 9 1.4.1 Distribuio de frequncia por categoria ................................................................ 9 1.4.2 Distribuio de frequncia por classe .................................................................... 11 1.5 Grficos ............................................................................................................................ 13 1.5.1 Grfico em linha ou em curva................................................................................. 13 1.5.2 Grfico em colunas ou em barras ........................................................................... 14 1.5.3 Grfico em setores.................................................................................................... 16 1.5.4 Histograma de frequncia ....................................................................................... 16 1.5.5 Cartograma .............................................................................................................. 17 1.5.6 Pictograma ................................................................................................................ 17 1.6 Medidas de tendncia central (medidas de posio) .................................................... 22 Propriedades da mdia ..................................................................................................... 22 1.6.1 Mdia aritmtica simples ........................................................................................ 22 1.6.2 Mdia aritmtica ponderada................................................................................... 23 1.6.3 Mdia geomtrica ..................................................................................................... 24 1.6.4 Mdia harmnica ..................................................................................................... 24 1.6.5 Relao entre as mdias aritmtica, geomtrica e harmnica ............................. 24 1.6.6 Mediana .................................................................................................................... 25 1.6.7 Moda.......................................................................................................................... 26 1.6.8 Clculo da moda pela frmula de Pearson ............................................................ 27 1.6.9 Aspecto das distribuies ........................................................................................ 28 1.7 Medidas de variabilidade ............................................................................................... 32 1.7.1 Amplitude total......................................................................................................... 32 1.7.2 Varincia................................................................................................................... 32 1.7.3 Desvio padro ........................................................................................................... 33 1.7.4 Coeficiente de variao de Pearson ........................................................................ 34 2. PROBABILIDADE ............................................................................................................... 36

2.1 Apresentao ................................................................................................................... 36 2.2 Experimento determinstico ........................................................................................... 36 2.3 Experimento aleatrio .................................................................................................... 36 2.4 Espao amostral .............................................................................................................. 37 2.5 Funo de probabilidade ................................................................................................ 38 2.5.1 Definio de probabilidade ..................................................................................... 38 2.6 Regras da adio ............................................................................................................. 40 2.7 Regras da multiplicao ................................................................................................. 41 3 PERMUTAES E COMBINAES ............................................................................... 46 3.1 Permutaes..................................................................................................................... 46 3.2 Combinaes .................................................................................................................... 46 4. VARIVEL ALEATRIA .................................................................................................. 49 4.1 Distribuio de probabilidades de variveis aleatrias ............................................... 49 4.2 Esperana matemtica ou valor esperado .................................................................... 50 4.3 Varincia.......................................................................................................................... 51 5. DISTRIBUIES DE PROBABILIDADE ....................................................................... 52 5.1 Distribuies discretas .................................................................................................... 52 5.1.1 Distribuio Binomial .............................................................................................. 52 5.1.2 Distribuio de Poisson............................................................................................ 55 5.2 Distribuio Contnua .................................................................................................... 59 5.2.1 Distribuio Normal ................................................................................................ 59 6. AMOSTRAGEM................................................................................................................... 66 6.1 Processos de amostragem ............................................................................................... 67 6.1.1 Amostragem aleatria (ou amostragem aleatria simples) ..................................... 67 6.1.2 Amostragem sistemtica .......................................................................................... 69 6.1.3 Amostragem estratificada proporcional ................................................................ 69 7. DISTRIBUIES AMOSTRAIS........................................................................................ 73 7.1 Distribuio amostral da mdia..................................................................................... 73 7.2 Distribuio amostral da proporo ............................................................................. 75 8 MTODOS INFERENCIAIS ............................................................................................... 76 8.1 Estimao ......................................................................................................................... 76 8.1.1 Estimativa por ponto ............................................................................................... 76 8.1.2 Estimativa por intervalo .......................................................................................... 76 8.1.2.1 Intervalo de confiana para a mdia populacional ................................................ 76
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

8.1.2.2 Intervalo de confiana para a proporo populacional ......................................... 79 8.2 Testes estatsticos ............................................................................................................ 81 8.2.1 Etapas bsicas em um teste de hiptese ................................................................. 81

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

1 ESTATSTICA DESCRITIVA
1.1 Introduo A palavra estatstica origina-se da palavra Status (Estado em latim). Com a finalidade de orientar decises governamentais, inicialmente ligadas ao levantamento de dados, a taxao de impostos (censo em latim significa taxar), a regimentao de homens para a guerra, a determinao de estratgias de batalhas, e outros, era fundamental conhecer quantas armas, homens e cavalos se dispunham para uma batalha, ou mesmo quantas famlias deveriam pagar impostos. Assim, se desenvolveram mtodos para coleta, resumo, organizao e apresentao de dados. Podemos considerar a estatstica como a cincia que se preocupa com a coleta, a organizao, a anlise e a interpretao de dados experimentais e, a partir deles, faz inferncias a respeito da populao que os origina. Seu maior desenvolvimento deu-se, a partir do sculo XVII, com os estudos de Bernoulli, Pascal, Laplace, Gauss, Pearson, Fisher, Poisson e outros, que estabeleceram a forma mais atual de seu uso. Contudo, uma cincia nova, que continua a se desenvolver de acordo com o avano tecnolgico e a ampliao de suas aplicaes no estudo das populaes. Cabe observar que alguns autores no a consideram como cincia, mas sim como mtodo quando utilizada como instrumento para outra cincia. Popularmente, o uso da estatstica est ligado representao de dados experimentais atravs de tabelas e grficos. Exemplos: movimento nas bolsas de valores, estatsticas de sade, estatsticas de acidentes, estatsticas populacionais, etc. Entretanto, esta noo apenas parcial, pois envolve somente a organizao e a descrio de dados observados. Alm deste enfoque tem-se todo um campo de atuao dentro da estatstica, que se refere anlise e a interpretao desses dados para inferir sobre a populao que os deu origem. A inferncia estatstica carece decisivamente da teoria da probabilidade e conhecer probabilidade faz-se extremamente til a quem quer prever e inferir sobre acontecimentos. A cincia estatstica aplicvel a qualquer ramo do conhecimento onde se manipulem dados experimentais. Assim, a fsica, a qumica, a engenharia, a medicina, a psicologia, a biologia, as cincias sociais, as cincias administrativas, a agronomia, entre outros, tendem, cada vez mais, a servir-se dos mtodos estatsticos como ferramenta de trabalho; justificando a sua grande importncia. Dentro desta ideia podemos considerar a cincia estatstica, dividida em duas grandes partes:

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

Estatstica Descritiva: o ramo da estatstica que compreende a organizao, o resumo e, em geral, a simplificao de informaes. Utiliza mtodos numricos e grficos para descrever fatos. Estatstica Indutiva (inferncia estatstica): o ramo da estatstica que tem por objetivo obter e generalizar concluses a partir da anlise e interpretao de dados amostrais. A ideia bsica da amostragem efetuar determinada mensurao sobre uma parcela pequena, mas representativa, de determinada populao e utilizar esta informao para fazer inferncia sobre a populao. Relaciona-se diretamente com a teoria da probabilidade analisando situaes que envolvem o acaso. Permite analisar o tamanho do erro amostral ao se fazer inferncia.

Observa-se que estas divises no so totalmente distintas, sua utilizao e abrangncia possuem pontos de entrelaamento, como a descrio de dados, a teoria da probabilidade, a anlise e a interpretao de dados amostrais. A Estatstica fornece mtodos para a coleta, organizao, apresentao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A coleta, a organizao e a descrio dos dados esto a cargo da Estatstica Descritiva, enquanto a anlise e a interpretao desses dados ficam a cargo da Estatstica Indutiva.

1.2 Conceitos bsicos Estatstica: estuda fenmenos coletivos, sociais, ultrapassando o aspecto individual. No singular, significa o conjunto de procedimentos usados na coleta, anlise e interpretao dos dados numricos. Estatsticas ou estimativas: no plural, referem-se aos resultados das relaes calculadas com dados de uma amostra. Populao ou universo (N): um conjunto de todas as N unidades em observao (pessoas, objetos, experimentos ou eventos) sobre o fenmeno em estudo, onde N o tamanho fixo e algumas vezes desconhecido da populao, sendo que a partir destas unidades se deseja tomar uma deciso. Essas observaes apresentam pelo menos uma caracterstica comum e observvel, delimitando inequivocamente quais os elementos que pertencem populao e quais os que no pertencem. Deste modo uma populao pode ser finita ou infinita. Populao finita: aquela em que o nmero de unidades em observao pode ser contado e assume um nmero limitado. Exemplos: eleitores de um municpio; clientes atendidos em um supermercado no dia; 100 lanamentos de uma moeda e quantidade de experimentos realizados num ms. Populao infinita: aquela em que o nmero de observaes no possui uma quantidade limitada. Exemplos: clientes de um supermercado; sucessivos lanamentos de uma moeda e unidades produzidas em uma linha de produo (incluindo as produzidas at o momento e as que sero produzidas no futuro).

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

Censo ou recenseamento: o levantamento envolvendo todos os elementos da populao. Propriedades principais do censo: admite erro processual zero e tem confiabilidade de 100%; caro; lento; quase sempre desatualizado e nem sempre vivel. Amostra (n): um subconjunto representativo da populao (no-vazio e finito), ou seja, uma frao de tamanho n obtida da populao, onde todos esses n elementos sero examinados para a realizao do estudo desejado. Os resultados obtidos da amostra devem ser muito prximos dos obtidos do estudo da populao. intuitivo que quanto maior a amostra, mais precisas e mais confiveis devero ser as indues realizadas sobre a populao. Desta forma, poderamos dizer que o ideal seria o exame completo da populao (censo); porm esta concluso vlida em teoria, mas na prtica isto nem sempre se configura, at porque o levantamento de toda populao demanda custo, tempo, acesso a populao e um grande nmero de pessoas envolvidas, o que nem sempre possvel. Algumas vezes no se conhece toda a populao, e nem sempre o resultado da populao traz melhores resultados do que os dados colhidos atravs de um bom processo de amostragem. Amostragem: o processo para selecionar os n elementos de uma populao cujo objetivo posterior fazer generalizaes sobre esta populao. Estimadores: referem-se a uma caracterstica numrica estabelecida para uma amostra e so simbolizados por caracteres latinos. Parmetros: refere-se a uma caracterstica numrica estabelecida para toda a populao e so simbolizados por caracteres gregos. Inferncia ou estimao: produzir afirmaes sobre uma dada caracterstica dos elementos da populao a partir de dados colhidos de uma amostra representativa da populao. Propriedades principais da estimao: admite erro processual positivo e tem confiabilidade menor que 100%; barata; rpida; atualizada e sempre vivel. Variveis: sem rigor matemtico diremos que so as caractersticas investigativas, e se dividem em: Qualitativas: que apresentam uma qualidade ou atributo e podem ser nominais e ordinais. Nominais: no existe nenhuma ordenao nas possveis realizaes. Exemplos: sexo; religio; estado de um produto (bom ou defeituoso); cor de cabelos; e outros. Ordinais: existe certa ordenao nos seus resultados. Exemplos: grau de instruo; graduaes como: bom, razovel e ruim; e outros. Quantitativas: que apresentam nmeros resultantes de uma contagem ou de uma mensurao, podendo ser discretas ou contnuas. Discretas ou descontnuas: cujos possveis valores formam um conjunto finito ou enumervel de nmeros e resultam, freqentemente, de uma contagem assumindo valores inteiros. Exemplos: nmero de filhos de uma famlia; nmero de defeitos em uma unidade e nmero de empregados de uma empresa. Contnuas: cujos possveis valores formam um intervalo de nmeros reais e resultam, normalmente, de uma mensurao. Exemplos: altura; peso; renda; temperatura; presso e tempo de durao de um dispositivo eltrico.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

As variveis so expressas atravs de escalas de medidas. Estas escalas podem ser do tipo nominal, intervalar, ordinal ou de razo. Escala nominal: as categorias de variveis so associadas a nmeros (esses no possuem significados matemticos). Exemplos: a) cor dos olhos: 1. castanhos 2. azuis 3. verdes b) sexo: 1. masculino 2. feminino Escala ordinal: as variveis so numeradas conforme uma numerao crescente ou decrescente, dada pela ordem natural. possvel determinar-se que uma categoria melhor ou no do que a outra, apesar de no podermos quantificar estas diferenas. Exemplos: a) situao em uma linha de produo: 1. no satisfatrio 2. satisfatrio 3. timo b) desempenho 1. baixo 2. regular 3. bom 4. excelente Escala intervalar: ocorre quando conhecemos a ordem e a relao numrica entre as variveis, inclusive a diferena intervalar que ocorre. Exemplos: a) temperatura b) valores de balano

Escala de razo: assumem as mesmas caractersticas das variveis intervalares, porm possuem um verdadeiro ponto zero como origem. Exemplos: a) medies de uma pea b) tempo c) massa

1.3 Tabelas Uma tabela organizao em forma de matriz (linha/coluna) onde se resume um conjunto de observaes. Compe-se de: a) b) c) d) e) Ttulo Coluna indicadora Corpo Casa ou clula Fonte

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

Exemplo:

Colunas Indicadoras CAPITAL BRASILEIRO NO EXTERIOR Anos US$ bi 2001 68,59 2002 72,32 2003 82,69
FONTE: Banco Central

Ttulo

Linha

Casa ou Clula 1.3.1 Tabela de dupla entrada Apresenta, em uma nica tabela, a variao de valores de mais de uma varivel. Exemplo: DESAPARECIMENTO DE ESPCIES NATIVAS NA INGLATERRA Plantas Anos de estudo Espcies pesquisadas Quantas sofreram reduo expressiva
FONTE: Revista VEJA, maro 2004

Pssaros 20 201 108

Borboletas 20 58 41

40 1254 351

1.4 Distribuio de frequncia Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o comportamento dessa varivel, analisando a ocorrncia de suas possveis realizaes. A Estatstica tem por objetivo encontrar leis de comportamento para todo o conjunto de dados, por meio da sistematizao dos dados numricos, sob a forma de tabelas e grficos. Entre estas sistematizaes encontra-se a distribuio de frequncia que se constitui por uma srie estatstica especfica, onde os dados encontram-se dispostos em classes ou categorias, juntamente com as frequncias correspondentes. 1.4.1 Distribuio de frequncia por categoria Utilizada em variveis qualitativas e quantitativas, discretas e contnuas (pode ser numerada uma a uma). Os dados so agrupados com suas respectivas frequncias absolutas. Uma medida importante na interpretao das tabelas de frequncias proporo de cada n realizao em relao ao total, chamada de frequncia relativa, cujo clculo dado por: f r = i n onde ni o nmero de realizaes na categoria i e n o nmero total de realizaes. 9

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

Dado que: xi: identifica as categorias em que a varivel em estudo se divide. fi: corresponde a frequncia absoluta, isto , o nmero de vezes que cada uma das categorias ocorrem. fr: corresponde a frequncia relativa, isto , a porcentagem de cada categoria presente na amostra, ou populao. N: somatrio das frequncias (fi), ou seja, o total dos elementos da populao. Se for amostra usa-se n. Exemplo1: Nmero de assinantes de jornais Cidade A - julho/2008 Jornal (xi) Correio de povo Pioneiro Zero Hora Total Exemplo 2:
Fonte: Dados aleatrios

N. de assinaturas Freqncia absoluta (fi) 1.256 2.468 2.130

Freqncia relativa (fr)

Nmero de erros por pgina Livro de matemtica/2005 N de erros (xi) N de pginas (fi) 0 35 1 20 2 13 3 6 4 4 5 2 Total Exemplo 3:
Fonte: Dados aleatrios

fr

(xi) notas (fi) n de notas fr

Notas de matemtica de 45 alunos Turma A - 1 Trimestre/2007 21 22 23 24 25 26 28 30 31 33 38 40 1 1 3 4 5 6 7 6 5 4 2

1 45

Fonte: Secretaria da escola E. Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

10

Exemplo 4: Reclamaes referentes ao desconforto em avies Companhia H - 2 Trimestre/2006 N de reclamaes Natureza das reclamaes (xi) (fi) Espao insuficiente para as pernas 719 Assentos desconfortveis 914 Corredores estreitos 146 Espao insuficiente para bagagem de mo 218 Banheiros insuficientes 58 Outras reclamaes 348 Total ()
Fonte: SIMON, A gary; FREUND, E. John. Estatstica Aplicada.

fr

1.4.2 Distribuio de frequncia por classe Utilizada em varveis discretas ou contnuas. A organizao dos dados de maneira agrupada com auxlio de intervalos numricos. Quando a varivel discreta, em um determinado intervalo, o nmero de elementos finito, quando a varivel contnua, em um determinado intervalo, o nmero de elementos pode ser ilimitado. Faixa etria dos internos Hospital A Idade (xi) N internos (fi) 0 10 10 20 20 30 30 40 40 50 50 60 60 70 70 80 N
Fonte: Dados Aleatrios

10 15 8 5 12 9 11 10 80

Para distribuio de frequncia de dados agrupados por classe, faz necessrio algumas definies e procedimentos: Dados brutos: O conjunto de valores numricos obtidos na pesquisa que ainda no foram organizados.

Exemplo: As idades dos internos no Hospital A por ordem de internao (as 80 idades no esto em ordem crescente, nem em ordem decrescente).
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

11

Rol: arranjo, organizao dos dados brutos, em ordem crescente ou decrescente. Amplitude do rol, ou Range (R): Diferena entre o maior e o menor elemento do rol. R = Ls Li (limite superior menos limite inferior).

Exemplo: As idades dos pacientes 0,1, 2, 3, 3, 4, 6, 6, 8,... 77, 77, 78, 78, 79.

Exemplo: R = 79 0 R = 79. Nmero de classes (k): No h uma frmula exata para o clculo do nmero de classes. O que existe so alguns critrios que podem auxiliar o pesquisador a ter uma idia do melhor nmero de classes. Uma opo usar K= N

Para N > 25 pode ser utilizada a frmula de Sturges: K 1 + 3,3 log N quando for populao ou K 1 + 3,3 log n quando for amostra. Exemplo: N = 79, ento K

79 , ou seja, K 8,9. Pode-se trabalhar com 9 classes

Pela frmula de Sturges, temos: K 1 + 3,3 log 79, ou seja, K 1 + 3,3. 1, 9, ou seja, K 7,27 Podemos arredondar para 8 classes (se deixarmos 7 classes poder sobrar elementos na distribuio das frequncias). As regras de arredondamento no precisam ser seguidas. Amplitude da classe (h): Toma-se como base a amplitude total (R) e divide-se pelo nmero de classes, ajustando esse resultado, de acordo com a convenincia. amplitude h= n de classes 79 Exemplo: h = , ou seja, h 10 ; ficando assim com 8 classes de amplitude igual a 10 8 unidades. Limites das classes: a b ou ]a; b[ : compreende os elementos entre os extremos a e b , excluindo o a e b; a b ou [a; b[ : compreende os elementos entre a e b, incluindo o a e excluindo o b; a b ou ] a; b] : compreende os elementos entre a e b, excluindo o a e incluindo o b; a b ou [a; b] : compreende os elementos entre a e b, incluindo o a e o b; Ponto mdio da classe (xm ou xi): o ponto equidistante dos extremos. Em muitas situaes o representante da classe. Para calcul-lo, basta somar os dois extremos e dividir essa soma por 2.

Exemplo: Para a classe [35,44[ temos:

35 + 44 = 39,5 . Portanto xm= 39,5 (este xm ser o 2 representante de todos os xis da classe e poder ser escrito como xi).
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

12

Frequncia absoluta (fi): nmero de elementos em cada classe. Frequncia relativa (fr): dada pela razo entre o nmero da frequncia absoluta e o f nmero total de elementos a populao ou amostra. fr = i . Para saber a porcentagem N do valor, basta multiplicar por 100, ou seja, fr. 100. Frequncia acumulada (fac): a soma das frequncias dos valores anteriores ou iguais ao valor dado. Frequncia acumulada relativa (frac): dada pela razo entre o nmero da frequncia f acumulada e o nmero total de elementos a populao ou amostra: frac = ac . Para N saber a porcentagem do valor, basta multiplicar por 100. frac . 100 Histograma: a representao grfica de uma distribuio de frequncia por meio de retngulos justapostos. Polgono de frequncia: a representao grfica de uma distribuio por meio de um polgono.

1.5 Grficos A representao grfica de uma srie de dados permite, ao mesmo tempo, uma viso geral e alguma caracterizao particular da populao por meio de uma correspondncia entre as categorias ou valores e uma determinada figura geomtrica, de tal modo que cada valor ou categoria representado por uma figura proporcional. Para isso ser realmente eficiente deve-se respeitar certos requisitos para a representao grfica: Simplicidade Clareza Veracidade 1.5.1 Grfico em linha ou em curva Os grficos de linha so bastante utilizados na identificao de tendncias de aumento ou diminuio dos valores numricos de um fenmeno. Encontra-se com frequncia esse tipo de representao em anlises de lucros de empresas, incidncia de doenas, ndice de crescimento populacional ou de mortalidade infantil, ndices de custo de vida, etc. No eixo horizontal, marca-se o tempo. Exemplo: Taxa de desemprego na grande So Paulo TAXA DE DESEMPREGO NA GRANDE SO PAULO ANO HOMENS (%) MULHERES (%) 1996 13,5 17,1 1997 14,1 18,3 1998 16 21 1999 17,5 21,8 2000 15,1 20,8 2001 15 20,7
FONTE: Exame (Meu Dinheiro), Abril 2002. Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

13

Taxa de desemprego na grande So Paulo

22 20 18 Homens 16 14 12 10 1996 Mulheres

Taxa (%)

1997

1998 Anos

1999

2000

2001

1.5.2 Grfico em colunas ou em barras a representao de uma srie por meio de retngulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados. Um grfico de colunas mostra as alteraes dos dados em um intervalo de tempo ou ilustra comparaes entre categorias, as quais so organizadas de maneira horizontal e os valores de maneira vertical para enfatizar a variao ao longo do tempo. Quando em barras, os retngulos tm a mesma altura e os comprimentos so proporcionais aos dados. Um grfico de barras ilustra comparaes entre categorias; estas so organizadas verticalmente, enquanto os valores tm disposio horizontal, para enfatizar a comparao de valores e dar menos nfase ao tempo. No grfico de colunas e de barras, tambm indiferente a ordem de apresentao dos retngulos, por se tratar de uma srie ordenada segundo uma caracterstica qualitativa. Nesses casos, no h, em geral, uma ordem nica, tcnica e logicamente admissvel, podendo ocorrer diversas ordens, correspondentes a diversos critrios. Exemplo 1: Grfico de colunas Frequncia do perodo de aleitamento materno observado entre as crianas avaliadas Tempo de aleitamento Freqncia 0 ms 16 At 3 meses 31 De 4 a 6 meses 30 De 7 a 12 meses 36 De 13 a 24 meses 27 Mais de 24 meses 15 Total 155
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

Fonte: APCD, setembro/outubro 2007.

14

Exemplo 2: Grfico em colunas ou barras mltiplas Este tipo de grfico geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenmenos estudados com o propsito de comparao. estudados, BALANA COMERCIAL DO BRASIL 1989 93 VALOR ( U$ 1.000.000 ) 1989 1990 1991 1992 31.414 31.620 34.383 35.793 18.263 20.661 21.041 20.554

ESPECIFICAES Exportao Importao

1993 38.783 25.711

FONTE: Ministrio da Fazenda

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

15

1.5.3 Grfico em setores Consiste em distribuir em um crculo setores (ou categorias) proporcionais aos dados do problema.

Exemplo: O grfico acima mostra quais so as partes do corpo de um atleta que mais sofrem com a prtica do vlei. O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes. As reas dos setores so proporcionais aos dados da srie. Obtemos cada setor por meio de uma regra de trs simples e direta, lembrando que o total da srie corresponde a 360.
Total 360 o

Parte ___ x o

Se a srie j apresenta os dados percentuais, obtemos os respectivos valores em graus multiplicando o valor percentual por 3,6. Obs.: As escalas usadas nos eixos horizontal e vertical so muito importantes. Pode-se distorcer a verdade se o seu uso for mal empregado. 1.5.4 Histograma de frequncia um grfico de barras justapostas, com bases proporcionais aos intervalos das classes e a rea de cada retngulo proporcional respectiva frequncia. Pode-se usar tanto a frequncia absoluta como a frequncia relativa. Exemplo: Histograma do consumo de gua em m.
Consumo de gua. em m, de 75 contas da CORSAN
0,40 0,30 0,20 0,10 0,00 0 ----| 10 10 ----| 20 20 ----| 30 30 ----| 40 40 ----| 50 50 ----| 60

FONTE: Corsan Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

16

1.5.5 Cartograma a representao sobre uma carta geogrfica. Esse grfico empregado quando o objetivo o de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas. Exemplo:

1.5.6 Pictograma O pictograma constitui um dos processos grficos que melhor fala ao pblico, pela sua forma ao mesmo tempo atraente e sugestiva. A representao grfica consta de figuras. Exemplo:

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

17

Atividades de estudo 1: 1) Represente a srie abaixo usando um grfico de linhas: COMRCIO EXTERIOR BRASIL 1984 a 1993 QUANTIDADE ( 1.000 t ) EXPORTAO IMPORTAO 141.737 53.988 146.351 48.870 133.832 60.597 142.378 61.975 58.035 169.666 177.033 57.293 168.095 57.184 63.278 165.974 167.295 68.059 182.561 77.813

ANOS 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993

FONTE: Min. Indstria, Comrcio e Turismo

2) Represente a tabela usando um grfico em colunas: PRODUO BRASILEIRA DE PETRLEO BRUTO 1991-1993 QUANTIDADE ANOS ( 1.000 m ) 1991 36.180,4 1992 36.410,5 1993 37.164,3
FONTE: Petrobrs

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

18

3) Represente a tabela por meio de grfico em barras: PRODUO DE FERRO-GUSA BRASIL - 1993 UNIDADES DA PRODUO FEDERAO ( 1.000 t ) Minas Gerais 12.888 Esprito Santo 3.174 Rio de Janeiro 5.008 So Paulo 2.912
FONTE: Instituto Brasileiro de Siderurgia

4) Numa regio verifica-se que em dezembro de 2001, 864 pessoas morreram por doenas do aparelho circulatrio, 443 pessoas morreram por doenas ligadas ao aparelho respiratrio e 440 devido a tumores malignos, os demais bitos no foram diagnosticados. Sabendo que o total de bitos de 2676. Organize estes dados em uma tabela e aps faa um grfico de setores para demonstr-los. Nesta tabela registre tambm os valores em porcentagem

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

19

Atividades de estudo 2: 1) 0s dados abaixo representam as medidas das alturas em cm, de 50 alunos de uma turma de alunos, da escola X, no ano de 2010 182, 175, 166, 140, 145, 142, 147, 148, 151, 153, 152, 156, 158, 159, 160, 162, 163, 178, 170, 167, 184, 165, 174, 163, 160, 158, 159, 169, 168, 178, 175, 183, 178, 168, 162, 170, 161, 173, 174, 172, 170, 169, 181, 165, 180, 164, 167, 159, 150, 177 Determine: a) O rol dos dados b) A amplitude do rol (R) c) O nmero de classe (K) e a amplitude de cada classe (h) d) Faa a distribuio de frequncia em classe e) Calcule as frequncias relativas percentuais e as frequncias acumuladas f) Construa o histograma de frequncia

2) Os dados que seguem representam as notas bimestrais da disciplina de Fsica de uma turma de alunos da escola B: 3, 4, 4, 5, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6. a) Construir a distribuio de frequncia b) Determinar as frequncias relativas percentuais c) Determinar as frequncias acumuladas d) Definir a amplitude total do rol e) Qual a porcentagem de notas maiores que 5?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

20

3) A distribuio abaixo representa os salrios dos funcionrios de uma empresa H. Calcule fr%, fac, xi (valor mdio da classe).
Salrio (R$) fi xi fr% fiac frac%

500 600 700 800 900 1 000

600 700 800 900 1000 1100

8 10 16 14 10 5 2

1 100 1 200 Total

a) Qual o percentual de salrios menores que R$ 900,00? b) Qual o percentual de salrios entre R$ 700,00 e R$ 800,00? c) Qual a faixa salarial com maior frequncia? O que isso significa? d) Construa o polgono de frequncia absoluta

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

21

1.6 Medidas de tendncia central (medidas de posio) Uma medida de tendncia central ou de posio de um conjunto de dados mostra o valor em torno do qual se agrupam as observaes (resume um conjunto de dados). Representa o fenmeno pelo valor mdio, em torno da qual os dados tendem a concentrar-se. a medida de posio que orienta quanto posio da distribuio dos dados no eixo x do plano cartesiano. As principais medidas de tendncia central so: a mdia aritmtica (ou mdia), a mediana e a moda. Outras mdias utilizadas na estatstica so: a mdia geomtrica, a mdia harmnica, a mdia quadrtica, a mdia cbica e a mdia biquadrtica. Existem ainda as medidas definidas como separatrizes (quartis, decis, percentis). As medidas de tendncia central, juntamente com as medidas de disperso ou variabilidade, de assimetria, de curtose, entre outras, permitem caracterizar de forma concisa, um conjunto de dados. Propriedades da mdia A mdia de um conjunto de nmeros pode sempre ser calculada. Para um dado conjunto de nmeros, a mdia nica. A mdia sensvel a (ou afetada por) todos os valores do conjunto. Assim, se um valor se modifica, a mdia tambm se modifica. Somando-se uma constante a cada valor do conjunto, a mdia ficar aumentada do valor dessa constante (ex: somando-se 4, 5, a cada um dos valores do conjunto, a mdia ficar aumentada de 4,5). Quando se subtrai, se multiplica ou se divide cada um dos elementos do conjunto por um valor constante, a mdia ficar subtrada, multiplicada ou dividida pelo referido valor. O somatrio dos desvios dos elementos do conjunto a contar da mdia zero, ou seja,

d = x xi = 0
1.6.1 Mdia aritmtica simples A mdia aritmtica simples dada pelo quociente entre o somatrio () dos valores do conjunto e o nmero de elementos (n ou N). A mdia aritmtica simples calculada quando os dados so apresentados de forma no agrupados.

x x=
n

(elementos de uma amostra)

x
N

(elementos de uma populao)

Exemplo 1: Suponha que em um escritrio tenha cinco funcionrios cujos salrios so equivalentes a: R$ 260, 00, R$ 340, 00, R$ 430, 00, R$ 790,00 e R$ 540,00. Qual a mdia salarial entre o salrio dos funcionrios?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

22

1.6.2 Mdia aritmtica ponderada A mdia aritmtica ponderada dada pelo quociente entre o somatrio do produto dos valores das variveis e suas respectivas frequncias e a soma das frequncias (n. de elementos). A mdia ponderada calculada sempre que os dados estiveram agrupados em distribuio de frequncia.

x f x= f
i

i i

(amostra)

x f f
i

i i

(populao)

Exemplo 2: As idades de 15 pessoas aparecem distribudas na tabela de distribuio que segue. Determinar a mdia ponderada entre as idades. Idade (xi) 13 16 18 21 26 N pessoas (fi) 3 4 5 2 1 xi . fi

Exemplo 3: A tabela abaixo apresenta os dados correspondentes ao consumo de eletricidade de 80 usurios, calcular a mdia aritmtica do consumo de energia em kw/h. Consumo kw/h (xis) 5 25 25 45 45 65 65 85 85 105 105 125 125 145 145 1 65 N usurios (fi) 4 6 14 26 14 8 6 2 xi xi.fi

Exemplo 4: Um professor realiza quatro provas por ano em uma matria X, atribuindo a cada um os seguintes pesos: 1, 2, 3, 4. Se um aluno tiver recebido as notas 8, 7, 9 e 9, nessa ordem, qual a mdia aritmtica final desse aluno?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

23

1.6.3 Mdia geomtrica A mdia geomtrica utilizada quando se deseja fazer a mdia de taxas de juro, por exemplo. Neste caso, multiplicam-se os n termos e em seguida extra-se a raiz de ordem n. A mdia geomtrica o resultado da raiz de ordem n do produto de todos os valores da populao ou da amostra. Mdia Geomtrica =
n

x i com xi = x1 . x2 . x3. ... . xn

Exemplo 5: Calcular a mdia geomtrica de: 12

14

16

1.6.4 Mdia harmnica A mdia harmnica de um conjunto de n nmeros a recproca da mdia aritmtica dos recprocos dos nmeros. Mdia Harmnica =

1 = 1 1 x n i

1
i

Exemplo 6: Calcular a mdia harmnica de: 12

14 16

1.6.5 Relao entre as mdias aritmtica, geomtrica e harmnica A mdia geomtrica de um conjunto de nmeros positivos menor ou igual sua mdia aritmtica, mas maior ou igual sua mdia harmnica. Quanto maior a variabilidade, maior ser a diferena entre as mdias harmnica, geomtrica e aritmtica. HG X O sinal de igualdade vale somente quando todos os nmeros forem iguais.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

24

1.6.6 Mediana dada pelo valor que ocupa a posio central de um conjunto de dados quando organizados em ordem crescente ou decrescente. A mediana considerada uma medida separatriz, pelo fato de separar o rol em duas partes iguais. Exemplo 1: Sejam os elementos da srie 2 3 4 4 5 6 6 6 7 7 8 8 8 9 9 10 11 12 13 14 15 Este rol tem N = 21 (21 elementos), um nmero impar de elementos, ento, a mediana o valor que ocupa a 11 posio, ou seja, o valor 8. A posio da mediana em uma srie com nmero N impar de elementos encontrada por N +1 2 Exemplo 2: Sejam os elementos de uma srie 3 6 9 12 14 15 17 20 ( a mediana est entre 12 e 14)

Como o rol constitui-se de N = 8 (8 elementos), um nmero par de elementos, pode-se dizer N N que a mediana encontra-se entre os elementos que ocupam os lugares e + 1 . No 2 2 exemplo tem-se: O elemento que ocupa o 4 lugar 12, o elemento que ocupa o 5 lugar 14. Assim o valor 12 + 14 correspondente a mediana = 13 2 Exemplo 3: A tabela abaixo representa a distribuio do nmero de crianas, por idade, vacinadas contra a catapora. Determinar o valor da mediana. xi (idade) fi facm 2 1 3 4 5 5 6 3 7 2

O procedimento para definir o valor da Mediana (Md) de valores agrupados em distribuio no em classe igual aos procedimentos utilizados nos exemplos anteriores: achase o nmero de elementos e procura-se o lugar central, associando o elemento que ocupa este lugar. Usar frequncia acumulada uma boa opo.
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

25

Para definir o valor da Mediana (Md) para dados agrupados em classe, o clculo realizado por interpolao, sendo que o valor da mediana ser o valor da varivel que divide a N srie contnua ao meio . Tratando de representao geomtrica, o valor da mediana ser a 2 abscissa que divide o histograma ao meio. Para definir o valor da mediana, encontra-se: N a classe da mediana a partir de ; 2 a frequncia acumulada aplica-se a frmula N

f aca 2 M d = li + .h f Md

onde: N: nmero de elementos. li : limite inferior da classe da Md f aca : frequncia acumulada anterior a classe da mediana
f Md

: frequncia da classe mediana h : amplitude da classe da mediana.

1.6.7 Moda dada pelo valor que ocorre com maior frequncia no conjunto. Exemplo 4: 10, 10, 8, 6, 10, o valor que mais se repete o valor 10, logo este valor representa a moda do conjunto de valores. Quando no existir valor repetido ou todos aparecerem com a mesma intensidade diz-se que a classe amodal. Quando houver dois valores que se repetem na mesma quantidade de vezes a srie bimodal, mais que dois valores predominantes, tm-se uma classe plurimodal. Quando a srie estiver distribuda em frequncia, o valor da moda ser dado pelo elemento que tiver maior frequncia. Quando esta distribuio for em classe, o valor que representa a moda poder ser calculado pela frmula de Czuber.

Mo = li + h.
Onde:

1 1 + 2

Mo: Moda (achar a classe modal) 1 : fmo fant (diferena entre a classe modal e a classe anterior a classe modal) li : limite inferior a classe modal h: amplitude da classe moda

2 : fmo fpost (diferena entre a classe modal e a classe posterior a classe modal)

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

26

Exemplo 5: A tabela abaixo apresenta o agrupamento das idades de vinte funcionrios de uma empresa. Encontre a moda e a idade mediana Classe Idade (xis) 10 20 20 30 30 40 40 50 50 60 fi 2 4 8 5 1 facm

1.6.8 Clculo da moda pela frmula de Pearson A moda aproximadamente a diferena entre o triplo da mediana e o dobro da mdia aritmtica. Mo = 3M d 2 x Valendo-se do exemplo anterior calcule o valor da moda, utilizando a equao de Pearson.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

27

1.6.9 Aspecto das distribuies Simtrica Uniforme

Mdia Mediana Moda Assimtrica esquerda

Mdia Mediana Assimtrica direita

Mdia < Mediana < Moda Atividades de estudo 3

Moda < Mediana < Mdia

1. Em um escritrio de consultoria, trabalham cinco funcionrios que recebem os seguintes salrios: R$ 800,00; R$ 780,00; R$ 820,00; R$ 810,00 e R$790,00. Calcule o valor da mdia salarial do grupo.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

28

2. Um professor realiza quatro provas por ano em uma matria X, atribuindo a cada um os seguintes pesos: 1, 2, 3, 4. Se um aluno tiver recebido as notas 8, 7, 9 e 9. Nessa ordem, qual a mdia aritmtica final desse aluno?

3. Sabendo que a produo leiteira diria de uma vaca A, durante uma semana foi de 10, 14, 13, 15, 16, 18 e 12 litros de leite. Determine a medida da mdia aritmtica, da mediana e da moda

4. Se o exame final, em um curso, tem peso 3 e as provas realizadas no semestre tm peso 1, e um aluno tem notas 85 no exame, 70 e 90 nas provas realizadas no semestre, calcule a mdia aritmtica ponderada obtida

5. Os salrios mdios anuais dos professores do ensino elementar em trs cidades so R$14.500,00, R$16.300,00, R$20.200,00. Havendo 720, 660 e 520 professores de ensino elementar nessas cidades. Calcule a mdia salarial entre as trs cidades

6. Em uma companhia de produo mltipla, as margens de lucro para as 4 linhas de produto da firma durante o ltimo ano fiscal foram: linha A - 4,2%; linha B - 5,5%; linha C - 7,4% e linha D - 10,1%. Calcule a mdia aritmtica da margem de lucro

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

29

7. Se no problema 6 considerarmos que o valor correspondente a venda de cada linha seja diferente, a mdia de lucro dever ser calculada com respaldo no valor vendido. Supondo que as vendas sejam de acordo com a tabela que segue, calcule a mdia geral do lucro. Linha A B C D Margem de lucro (xi) 4,2 5,5 7,4 10,1 = Vendas R$ (fi) 30.000,00 20.000,00 5.000,00 3.000,00 = xi.fi

8. Uma pesquisa amostral efetuada junto a uma Universidade mostra que as notas obtidas pelos alunos esto relacionadas com o tempo de estudo extraclasse, em horas, conforme mostra a tabela que segue. Determine o valor mdio de horas de estudo considerando o n de horas mdias por pessoa e suas respectivas freqncias Nota (informao) 7 8 9 N de horas mdias por pessoa (xi) 0,9 0,7 1,0 N de estudantes (fi) 80 70 65 xi .fi

9. Determine o lugar e o valor da mediana na srie de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9.

10. Determine o valor da mdia, da mediana e da moda na srie amostral: 152, 132, 164, 127, 10, 142.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

30

11. A tabela abaixo apresenta o agrupamento das idades de uma amostra de pessoas que participam de um grupo ligado a assistncia social, responsvel pelos donativos de alimentos para asilos. Classe Idade (xi) 10 18 18 26 26 34 34 42 42 50 50 58 58 66 Determine: a) A mdia aritmtica das idades das pessoas. b) A medida da mediana e a medida da moda. c) Fazer o histograma, a linha poligonal e marcar o valor das trs medidas de tendncia central. d) O desvio de cada elemento em relao a mdia aritmtica. e) Escreva o que significa cada uma dessas medidas. f) Qual o percentual das pessoas com idade menor que 42 anos. fi 2 3 6 8 6 3 2

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

31

1.7 Medidas de variabilidade O resumo de um conjunto de dados por uma nica medida representativa de posio central esconde toda a informao sobre a variabilidade do conjunto de observaes. Por exemplo, se temos trs amostras de observaes dadas pelas sries que seguem: A: 20, 20, 20
xA =

B: 15, 10, 20, 25, 30


xB =

C: 16, 20, 20, 24, 20


xC =

Apesar das mdias serem iguais, na srie A no se tem disperso, a srie B apresenta disperso maior que a srie C. Dessa forma, podemos dizer que na srie A a mdia mais representativa que em B e que em C a mdia mais representativa que em B. Dessa forma faz-se necessrio o estudo das medidas de disperso que so utilizadas para avaliar o grau de variabilidade dos valores em torno da mdia. Servem para medir a representatividade da mdia. As medidas de variabilidade (disperso) indicam se os valores esto prximos uns dos outros ou se esto mais longe.

Pequena disperso 1.7.1 Amplitude total

Grande disperso

dado pela diferena entre o maior e o menor valor da srie. tambm conhecida como intervalo entre um grupo de valores. R = xmx - xmin Exemplo 1: 1, 5, 7, 9 Exemplo 2: 14, 3, 17, 4, 8, 80, 83, 42, 31 R= 9 1 R = 8 R= 83 3 R= 80

uma medida pouco utilizada por ser muito limitada, pois depende apenas dos valores extremos da srie, no considerando os valores intermedirios. 1.7.2 Varincia dada pela mdia aritmtica dos quadrados dos desvios dos valores a contar da mdia. uma medida de disperso que nos leva a determinar a medida do desvio padro (principal medida de disperso). Para calcular a varincia necessrio: Calcular o desvio de cada elemento a partir da mdia
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

32

Elevar ao quadrado cada um dos desvios antes de som-los. Quando o trabalho est sendo feito com dados distribudos em frequncia, cada desvio ao quadrado deve ser multiplicado por sua frequncia antes da soma Varincia amostral (S2)

Varincia populacional (2) Dados no agrupados

(x =

(x =

n 1

Dados agrupados

(x =

x . fi N

(x =

fi

n 1

Na anlise inferencial usa-se (n-1) no divisor para ter uma melhor estimativa da varincia populacional. A unidade resultante do clculo da varincia sempre o quadrado da unidade original. Por exemplo, se a varivel em estudo medida em metros (m), a unidade da varincia ser em m2. Para se ter a unidade original, h necessidade de outra medida de disperso, que definimos como sendo o desvio padro. 1.7.3 Desvio padro dado pela raiz quadrada positiva da varincia. Para calcular o valor da medida do desvio padro, basta extrair a raiz quadrada da varincia. Obs.: O desvio padro nada mais do que a distancia mdia em que os elementos de uma srie ou distribuio encontram-se da mdia aritmtica dos referidos elementos. Desvio padro de uma populao Desvio padro amostral
S = S2

Exemplo 1: Calcular a varincia e o desvio padro da amostra: 2, 4, 6, 8, 10

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

33

1.7.4 Coeficiente de variao de Pearson As medidas de disperso apresentam a variao dos valores de um conjunto, em relao a uma medida de tendncia central, geralmente a mdia aritmtica. Entretanto, na comparao de dois ou mais conjuntos diferentes, pode acontecer que todos eles ou alguns apresentem a mesma medida de disperso, ou seja, o mesmo desvio padro; ou ainda, pode ocorrer que os termos dos conjuntos sejam heterogneos, com unidades diferentes, o que nos impede de compar-los diretamente. Devemos, nesses casos, usar uma outra medida que nos permita verificar a variao desejada. Com essa finalidade, existem os coeficientes de variao, dentre os quais, o mais utilizado o coeficiente de variao de Pearson, dado pelo quociente entre o valor do desvio padro ( ) ou (S) e a mdia aritmtica () ou ( x ).

Coeficiente de Variao =

Desvio Padro Mdia Aritmtica

CV =

(para amostra usa-se S e x )

Essa frmula pode ser expressa na forma de porcentagem: CV =

.100

Exemplo 1: Numa empresa, o salrio mdio dos homens de R$ 4.000,00, com desvio padro de R$ 1.500,00, e o das mulheres em mdia de R$ 3.000,00, com desvio padro de R$ 1.200,00. Qual o coeficiente de variao para os homens? E para as mulheres?

Obs.: Diz-se que uma distribuio possui pequena variabilidade quando o coeficiente der menor que 10%, mdia disperso quando o coeficiente estiver acima de 10% e abaixo de 20%, e grande quando o coeficiente for maior que 20%. No entanto, alguns analistas estatsticos consideram: Baixa disperso: CV 15% ; Mdia disperso: 15% < CV < 30% e Alta disperso: CV 30%

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

34

Atividades de estudo 4: 1. O tempo gasto por 6 alunos para fazer um trabalho foi, em minutos: 6, 5, 5, 3 ,3 e 2. Nessas condies, calcule a mdia aritmtica, a varincia, o desvio padro e o coeficiente de variao dessa srie. Resp.: mdia: 4; varincia: 2; desvio padro: 1,41 CV: 35,25%

2. Dado o rol que representa as notas de um grupo de alunos (avaliados de zero a cem) que estudam em uma escola que tem 2300 alunos, faa a distribuio em 7 classes e calcule: Os valores das medidas de tendncia central (mdia, mediana, moda) As medidas de variabilidade (varincia, desvio padro) O coeficiente de variabilidade 3 5 7 8 9 12 15 18 20 22 22 25 27 28 29 31 36 37 38 39 40 41 45 46 48 49 51 53 53 53 55 57 57 58 59 59 60 63 64 65 67 71 75 75 79 79 80 85 87 98

3. A tabela abaixo representa as estaturas em (cm) de uma amostra. Estatura (xi) 150 154 154 158 158 162 162 166 166 170 170 174 fi 4 9 11 8 5 3 xi xi . fi

Calcule: a) A mdia das estaturas b) A medida do desvio padro. Explique o que essa medida representa c) O coeficiente de variabilidade

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

35

2. PROBABILIDADE
2.1 Apresentao Vivemos num mundo probabilstico, falamos probabilisticamente quase todo o tempo, embora frequentemente vivamos como se os acontecimentos da vida fossem sempre certos. Conhecer probabilidade faz-se extremamente til a quem quer prever e inferir sobre acontecimentos, quer sejam reais ou fictcios. Neste ponto, a inferncia estatstica carece decisivamente da teoria da probabilidade. A incluso da probabilidade no estudo de estatstica se justifica pelo fato de a maioria dos fenmenos estatsticos ser de natureza aleatria ou probabilstica. Em qualquer experimento aleatrio, h sempre uma incerteza quanto ocorrncia ou no, de determinando evento. A fim de obtermos uma medida de chance ou de probabilidade, com que podemos esperar a ocorrncia de determinado evento, conveniente que atribuamos um nmero entre 0 e 1. Se tivermos certeza de que o evento ocorrer, dizemos que sua probabilidade de 100% ou de 1; se estivermos certos de que no ocorrer, dizemos que sua 1 probabilidade zero. Se, por exemplo, a probabilidade , diremos que h uma chance a cada 4 4 ocorrncias, ou seja existe a chance de 25% de ocorrncia e a chance de 75% de noocorrncia. H dois processos importantes para se obter a estimativa da probabilidade de um evento: 1. Processo clssico ou a priori: aquele que decorre da possibilidade de calcular os casos totais possveis e os casos favorveis utilizado normalmente nos mundos artificiais, como: o baralho, a roleta, os dados, etc. Antes de comear o experimento sabe-se o que pode acontecer. 2. Processo de frequncia ou a posteriori: Nas cincias aplicadas, fsicas e tecnolgicas, a probabilidade a priori no pode ser usada normalmente. Pois no conhecemos a priori os possveis resultados, como por exemplo, do nmero de produtos defeituosos que uma mquina pode produzir. Seria necessrio contar, inspecionar toda a produo (o que impraticvel ou impossvel). Nestes casos, tomamos uma amostra e desenvolvemos sobre esta a inspeo para verificao da quantidade de peas defeituosas. 2.2 Experimento determinstico So aqueles experimentos repetidos, que sob mesmas condies iniciais, conduzem sempre a um mesmo resultado. Se as alteraes no resultado final forem mnimas elas podem ser desprezadas. Exemplo: a queda livre de um objeto de certa altura considerando o tempo de queda. 2.3 Experimento aleatrio So fenmenos que, mesmo repetido vrias vezes sob condies semelhantes, apresentam resultados imprevisveis. O resultado final depende do acaso. Se o fenmeno seguir o modelo no-determinstico, temos um experimento aleatrio, que apresenta as seguintes caractersticas:
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

36

o experimento pode ser repetido; embora no se possa prever que resultado particular ocorrer, pode-se descrever o conjunto dos resultados possveis; a medida que se aumenta o nmero de repeties tende a aparecer uma regularidade nos resultados.

Exemplo: O lanamento de um dado anotando o nmero de pontos obtidos na face superior. Dificilmente se consegue repetir o lanamento exatamente nas mesmas condies anteriores. Estas pequenas variaes que podem ocorrer na repetio do lanamento podem provocar mudanas no nmero de pontos apresentados na face superior. Essas mudanas no podem ser desprezadas, pois o fenmeno admitir por repetio, mais de um resultado. 2.4 Espao amostral O espao amostral (S) ou conjunto universo o conjunto dos possveis resultados de um experimento aleatrio. Pode ser: finito: se tem um nmero finito de elementos infinito enumervel: quando tem tantos elementos (infinitos) quantos so os nmeros naturais 0,1,2,3,4..., (espao discreto) infinito no enumervel: se tem tantos elementos (infinitos) quantos forem os pontos de um determinado segmento de reta, ou seja, um intervalo numrico, por exemplo: 0 x 3, (espao contnuo) Obs.: Quando todos os elementos do espao amostral tm a mesma chance de acontecer, o espao amostral chamado de conjunto equiprovvel. Cada elemento do espao amostral que corresponde a um dos possveis resultados recebe o nome de ponto amostral. Um evento um subconjunto do espao amostral. Os eventos podem ser certos, impossveis e mutuamente exclusivos. Evento certo: quando o evento coincide com o espao amostral (probabilidade um) Evento impossvel: quando o evento vazio (probabilidade zero) Eventos exclusivos: quando a interseo entre dois ou mais eventos vazia, ou seja, quando eles no puderem acontecer mutuamente

Exemplo: No experimento aleatrio lanar um dado e registrar o resultado, podemos ter: Evento A: ocorrncia de um nmero menor que 7 e maior que zero ___________________ Evento B: ocorrncia de nmero maior que 6 _____________________________________ Evento C: ocorrncia de nmero par ____________________________________________ Evento D: ocorrncia de nmero impar __________________________________________

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

37

Sabendo que um evento um subconjunto do espao amostral (S), podemos considerar as operaes de unio, interseo e complementar de um evento. Unio de eventos: Se A e B forem eventos, AUB ser o evento que ocorrer se e somente se A ou B ocorrerem (ou ambos ocorrerem). Interseco de eventos: Se A e B forem eventos, AB ser o evento que ocorrer se e somente se A e B ocorrerem simultaneamente. Complementar de um evento: Se A for um evento de S, o complementar de A, denotado por A C ou A , ser o conjunto formado por todos os resultados de S que no esto em A. Exemplo: No espao amostral do exemplo anterior temos:

A B= A B= C D= C D= CC = BC = DC =

2.5 Funo de probabilidade Ao conhecermos o espao amostral de um evento, podemos associar a cada elemento a sua probabilidade de ocorrncia. A funo de probabilidade uma funo definida no espao amostral S do experimento, assumindo valores reais, com as seguintes propriedades: a probabilidade de um evento um valor que varia entre 0 e 1; ( 0 p 1) a soma de todas as probabilidades de um espao amostral igual a 1. Notao bsica de probabilidade P denota uma probabilidade. A, B, C denotam eventos especficos. P(A) denota a probabilidade de ocorrncia do evento A. 2.5.1 Definio de probabilidade
Aproximao da probabilidade pela frequncia relativa Realize (ou observe) um experimento um grande nmero de vezes e conte quantas vezes o evento A ocorre efetivamente. Ento P(A) estimada como segue:

P( A) =

nmero de ocorrncias de A nmero de repeties do exp erimento

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

38

Definio Clssica de Probabilidade Suponha que um experimento tenha n eventos simples diferentes, cada um dos quais com a mesma chance de ocorrer. Se o evento A pode ocorrer em s dentre as n maneiras, ento

P( A ) =

nmero de maneiras como A pode ocorrer n( A ) = nmero de eventos simples diferentes n(S)

Queremos estudar as frequncias de ocorrncia das faces de um dado. Um procedimento seria lanar o dado certo nmero de vezes, n, e depois contar o nmero s de vezes em que s determinam a distribuio de frequncias do ocorre a face em questo. As propores n experimento realizado. Lanando o dado um nmero diferente de vezes da anterior, teramos outra distribuio de frequncias, mas com um padro que esperamos ser muito prximo do anterior.
Lei dos Grandes Nmeros Ao repetirmos um experimento um grande nmero de vezes, a probabilidade encontrada por meio da frequncia relativa de um evento tende para a probabilidade terica

Nessas condies, o modelo terico (ou probabilstico) para o experimento dado na tabela a seguir: Face Frequncia terica 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 Total 1

Atividades de estudo 5: 1) Um experimento consiste no lanamento de dois dados, o resultado um par ordenado de nmeros e pode se representado por (x1, x2) onde x1 representa o resultado do primeiro dado e x2 representa o resultado do segundo dado. a) Descreva o espao amostral do experimento b) Descreva os seguintes eventos: A = {(x1, x2) / x1 > x2 } B = {(x1, x2) / x1 + x2 = 10 } C = {(x1, x2) / x1 = x2 } D = {(x1, x2) / x1 < x2 }

c) Determine as probabilidades: P(A), P(B), P(C), P(D), P(AUB), P(AUD), P(AC), P(BC), P()

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

39

2) No lanamento simultneo de trs moedas perfeitas distinguveis, qual a probabilidade de serem obtidas a) pelo menos duas caras? b) exatamente duas caras?

2.6 Regras da adio As regras da adio so utilizadas quando desejamos determinar a probabilidade P(A ou B) de ocorrer o evento A ou o evento B (ou ambos) como resultado de um experimento. A palavrachave aqui a conjuno ou. Na linguagem da teoria dos conjuntos, isto conhecido como unio de A e B e a probabilidade designada por P( A B) . Existem duas variaes da regra de adio, dependendo de serem os dois eventos mutuamente exclusivos ou no. A regra para eventos mutuamente exclusivos :

P ( A ou B ) = P ( A B ) = P ( A) + P ( B)
Exemplo 1: Ao retirar uma carta de um baralho, os eventos s e rei so mutuamente exclusivos. A probabilidade de tirar um s ou um rei numa nica tentativa :
P( A ou K ) = P( A) + P( K ) = 4 4 8 2 + = = 52 52 52 13

Para eventos que no so mutuamente exclusivos, subtrada da soma a probabilidade da ocorrncia conjunta dos eventos. Podemos representar a probabilidade da ocorrncia conjunta por P( A e B) . Em linguagem de teoria dos conjuntos isto chamado de interseco de A e B, e a probabilidade indicada por P( A B) . Ento, a regra da adio para eventos que no so mutuamente exclusivos :

P ( A ou B ) = P ( A) + P ( B) P( A e B)
Exemplo 2: Ao retirar uma carta de um baralho, os eventos s e espadas no so mutuamente exclusivos. A probabilidade de retirar um s ou espada (ou ambos) em uma s tentativa

P( A ou E ) = P( A) + P( E ) P( A e E ) =

4 13 1 16 4 + = = 52 52 52 52 13

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

40

2.7 Regras da multiplicao As regras de multiplicao se relacionam com a determinao da probabilidade da ocorrncia conjunta de A e B. Temos, ento, a interseco de A e B, sendo a probabilidade designada por P( A B) . Existem duas variaes da regra de multiplicao, conforme os eventos sejam independentes ou dependentes.

P( A e B) = P( A B) = P( A) . P( B)
Exemplo 3: 1. Uma moeda lanada duas vezes. A probabilidade de que ambos os resultados sejam cara :

P(cara e cara) =

1 1 1 x = 2 2 4

2. Um jri consiste em 9 pessoas naturais do local e 3 pessoas naturais de outros estados. Se dois jurados so selecionados aleatoriamente para uma entrevista, qual a probabilidade de serem ambos naturais de outro estado?

P( A) =

3 12

P( B) =

2 11

P ( A e B) = P ( A) P( B) =

3 2 1 . = 12 11 22

3. Na extrao de duas cartas de um baralho bem misturado, determine a probabilidade de que a primeira carta seja um s e a segunda seja um rei. (Admita que a primeira carta extrada no seja reposta antes da extrao da segunda carta.)

P(s e rei) =

4 4 x = 0,00603 52 51

4. Deve-se inspecionar uma grande remessa de caixas de chocolate. Os registros indicam que 2% das caixas acusam contedo inferior ao estipulado. Escolhidas duas caixas aleatoriamente, qual a probabilidade de ambas acusarem contedo inferior, admitindo-se que a remessa inspecionada semelhante s anteriores? P(ambas defeituosas) = (0,02) . (0,02) = 0,0004
A Probabilidade de ao menos um

* Ao menos 1 equivalente a 1 ou mais * O complemento de obter ao menos 1 item de determinado tipo no obter item daquele tipo

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

41

A regra da multiplicao e a regra dos complementos podem ser conjugadas para simplificar consideravelmente certos tipos de problemas, como a determinao da probabilidade de que, em vrias tentativas, ao menos 1 tenha um resultado especificado. Vamos supor que um empregado de uma cidade precise falar com 1 de seus 5 colegas em sua casa. Admita que os 5 colegas sejam escolhas aleatrias de uma populao, e que 39,5% dos nmeros de telefone da cidade no estejam na lista. Devemos determinar a probabilidade de que ao menos 1 dos 5 colegas de trabalho do nosso empregado tenha seu nmero de telefone na lista. Exemplo 4: Determine a probabilidade de ao menos 1 dentre os 5 empregados na cidade ter o nmero de telefone na lista (podendo, portanto, ser chamado). Suponha que os nmeros de telefone sejam independentes e que, na cidade, 39,5% dos nmeros no estejam na lista. Passo 1: Represente por um smbolo a probabilidade desejada. Em nosso caso, seja L = ao menos 1 nmero na lista, dentre os nmeros dos 5 empregados. Passo 2: Identifique o complemento do evento indicado no passo 1.

L = nenhum nmero na lista dentre os 5 empregados = 5 nmeros no listados dentre os 5 empregados


Passo 3: Determine a probabilidade do complemento do passo 2.
P ( L ) = P( 5 nmeros no listados entre os 5 empregados)

= (0,395). (0,395). (0,395). (0,395). (0,395) = 0,00962 Passo 4: Determine a probabilidade do evento considerado, subtraindo de 1 a probabilidade do complemento.

P(L) = 1 - P ( L ) = 1- 0,00962 = 0,990


Portanto, temos 99% de probabilidade de ao menos 1 dos empregados ter seu nmero na lista, podendo, ento, ser contatado
Probabilidade condicional

A probabilidade condicional de B dado A a probabilidade de ocorrncia do evento B, dado que o evento A j ocorreu. Pode ser determinada dividindo-se a probabilidade de ocorrncia de ambos os eventos A e B pela probabilidade do evento A

P ( B | A) =

P( A e B) P( A)
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

42

Observao: Podemos determinar a probabilidade condicional de B dado A supondo que A j tenha ocorrido e, sob essa hiptese, calcular a probabilidade de ocorrncia do evento B. Exemplo 5: Considere a situao do status da promoo de oficiais masculinos e femininos de uma fora policial. Esta fora policial consiste em 1200 oficiais, sendo 960 homens e 240 mulheres. Nos dois ltimos anos, 324 oficiais foram promovidos, cuja diviso est na tabela a seguir. Depois de rever o registro de promoes, um comit feminino de oficiais levantou um caso de discriminao com base em que 288 oficiais masculinos receberam promoes, mas somente 36 oficiais femininas foram promovidas. Vamos mostrar como a probabilidade condicional poderia ser usada para analisar a acusao de discriminao. Homens Mulheres Total Promovidos 288 36 324 No promovidos 672 204 876 Total 960 240 1200 Seja H = evento em que um oficial seja um homem M = evento em que um oficial seja uma mulher A = evento em que um oficial promovido AC = evento em que um oficial no promovido

Obtemos as seguintes probabilidades:

P( H A) =

288 = 0,24 = probabilidade de que o oficial seja um homem e promovido. 1200 672 = 0,56 = probabilidade de que o oficial seja um homem e no promovido. 1200

P( H AC ) = P ( M A) =

36 = 0,03 = probabilidade de que o oficial seja uma mulher e promovida. 1200 204 = 0,17 = probabilidade de que o oficial seja uma mulher e no promovida. 1200

P( M AC ) =

Vamos comear a anlise de probabilidade condicional calculando a probabilidade de que um oficial seja promovido dado que o oficial seja um homem.

P( A | H ) =

P( A e H ) = P( H )

Vamos agora calcular a probabilidade condicional de que um oficial seja promovido dado que seja uma mulher.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

43

P( A | M ) =

P( A e M ) = P(M )

A probabilidade de uma promoo dado que um oficial seja um homem 0,30, isto , duas vezes a probabilidade de 0,15 de uma promoo dado que o oficial seja uma mulher. Atividades de estudo 6: 1. Joga-se um par de dados equilibrados: a) Qual a probabilidade de ambas as faces serem seis? b) Qual a probabilidade de ambas as faces serem dois? c) Qual a probabilidade de ambas as faces serem nmeros pares?

2. As falhas de diferentes mquinas so independentes umas das outras. Se h quatro mquinas e, se suas respectivas probabilidades de falha so 1%, 2%, 5% e 10% em determinado dia, calcule as probabilidades: a) De todas falharem em determinado dia b) De nenhuma falhar c) De ao menos uma falhar

3. Numa escola de ensino fundamental, 30% dos estudantes so do primeiro ciclo, 35% do segundo, 20% do terceiro e os restantes, do quarto ciclo. Um dos estudantes ganhou uma bolsa de estudos. Determine as seguintes probabilidades: a) De o estudante ser do quarto ciclo b) De ser do primeiro ou do segundo ciclo c) De no ser do quarto ciclo

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

44

4. Os dados da tabela resumem resultados de um estudo de 1000 mortes, selecionadas aleatoriamente, de homens com idade de 45 a 64 anos. Causa da morte Cncer Doena Cardaca 135 310 55 155 Outros 205 140

Fumante No fumante

a) Se, dos 1000 indivduos, 1 selecionado aleatoriamente, determine a probabilidade de se obter um fumante.

b) Se, dos 1000 indivduos, 1 selecionado aleatoriamente, determine a probabilidade de se obter um fumante ou algum que tenha morrido em conseqncia de doena cardaca.

c) Escolhidos aleatoriamente dois indivduos, determine a probabilidade de ambos terem morrido de cncer.

d) Escolhidos aleatoriamente um indivduo, determine a probabilidade de obter um no fumante que tenha morrido de cncer.

e) Escolhidos aleatoriamente trs indivduos diferentes, determine a probabilidade de serem todos fumantes.

f)

Escolhido aleatoriamente um indivduo, determine a probabilidade de se tratar de um fumante, dado que morreu de cncer.

g) Escolhido aleatoriamente um indivduo, determine a probabilidade de obter algum que tenha morrido de cncer, dado que se tratava de um fumante.

Respostas:
1) a) 1/36 b) 1/36 c) b) 0,829 c) 0,171 c) 0,85 c) 0,0359 d) 0,055 e) 0,274 f) 0,711 g) 0,208

2) a) 0,000001 3) a) 0,15 4) a) 0,65

b) 0,65 b) 0,805

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

45

3 PERMUTAES E COMBINAES
At agora, o valor da probabilidade foi calculado baseado na razo do nmero de resultados igualmente provveis que so favorveis ao evento pelo nmero total de resultados possveis. Quando os problemas so simples, o nmero de resultados pode ser diretamente contado. Contudo, para problemas mais complexos so necessrios os mtodos de permutaes e combinaes para determinar o nmero de resultados possveis. 3.1 Permutaes O nmero de permutaes de n objetos o nmero de maneiras pelas quais os objetos podem ser arranjados em termos de ordem: Permutaes de n objetos = n! = (n) . (n-1) . ... . 2 . 1 Exemplo 1: Trs membros de uma organizao social se oferecem como voluntrios para comporem a diretoria para o prximo ano, assumindo as funes de Presidente, Tesoureiro e Secretrio. O nmero de maneiras (permutaes) pelas quais os trs podem assumir tais cargos : n! = 3! = 3 . 2 . 1 = 6 Geralmente estamos interessados no nmero de permutaes de algum subgrupo dos n objetos, e no em todos os n objetos. Isto , estamos interessados no nmero de permutaes de n objetos tomados r de cada vez, onde r menor do que n:

Pn , r =

n! (n r )!

Exemplo 2: No exemplo 1, suponha que existem 10 membros na organizao social e que nenhuma indicao tenha sido feita para os cargos de Presidente, Tesoureiro e Secretrio. O nmero de diferentes disposies de trs diretores eleitos entre os 10 membros do clube :

Pn , r = P ,3 = 10
3.2 Combinaes

10! 10! = = 720 (10 3)! 7!

No caso de permutaes, importante a ordem na qual os objetos esto dispostos. No caso das combinaes, interessa-nos o nmero de diferentes agrupamentos de objetos que podem ocorrer sem levar a ordem em considerao. Por conseguinte, o interesse em combinaes sempre se relaciona com o nmero de diferentes subgrupos que se pode formar com n objetos. O nmero de combinaes de n objetos tomados r de cada vez :
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

46

Cn , r =

n! r!(n r )!

Em diversos textos a combinao de n objetos tomados r de cada vez representada por

n . Note que isto no uma frao. r


Exemplo 3: Suponhamos que trs membros de uma pequena organizao social de 10 membros vo ser escolhidos para formar uma comisso. O nmero de diferentes grupos de 3 pessoas que podem ser escolhidos, sem ter em conta as diferentes ordens em que cada indivduo poderia ser escolhido, :

Cn , r = C10,3 =
Atividades de estudo 7:

10! =120 3!(10 3)!

1. Cinco pessoas que constituem a junta diretora de uma pequena empresa manufatureira sentaro juntas em um banquete. a) Determinar o nmero de arranjos de lugares possveis para as cinco pessoas. b) Suponha que somente trs dos cinco diretores sero convidados a representar a empresa no banquete. Quantos arranjos diferentes seriam possveis?

2. Para o problema 1-b suponha que no estejamos interessados no nmero possvel de arranjos de lugares, mas, sim, no nmero de diferentes grupos de trs diretores (dentre cinco) que poderiam ir ao banquete. Quantos grupos so possveis?

3. De quantas maneiras podemos formar um comit de trs pessoas dentre cinco?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

47

4. Um representante de vendas deve visitar seis cidades durante uma viagem. Se h dez cidades na rea geogrfica que vai visitar, quantos grupos diferentes de 6 cidades pode ele visitar?

5. Suponhamos que existam 10 cidades na regio que ele visitar e suponhamos, tambm, que a sequncia das visitas programadas s cidades selecionadas seja importante. Quantas diferentes seqncias existem de seis cidades escolhidas de um grupo de dez?

6. Um vendedor de automveis deseja impressionar os possveis compradores com o nmero de combinaes diferentes possveis. Um modelo pode ser dotado de trs tipos de motor, dois tipos de transmisso, cinco cores externas e duas internas. Quantas so as escolhas possveis?

7. Um cardpio oferece cinco tipos de carne ou peixe, trs de salada, dois de batatas e quatro de vegetais. Quantos pratos so possveis de serem formados, com um tipo de cada um?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

48

4. VARIVEL ALEATRIA
Definio: Seja E um experimento aleatrio e S o espao amostral associado ao experimento. Uma funo f que associa a cada elemento s S um nmero real f(s) denominada varivel aleatria. 4.1 Distribuio de probabilidades de variveis aleatrias Definio: Funo de probabilidade a funo que associa a cada valor assumido pela varivel aleatria, a probabilidade do evento correspondente, isto , P(X=xi) = P(Ai), i= {1, 2, 3, ....,n}. Exemplo 1: Uma urna contm duas bolas brancas (B) e trs bolas vermelhas (V). Suponha que so sorteadas duas bolas ao acaso, sem reposio. Defina a varivel aleatria X: nmero de bolas vermelhas obtidas nas duas extraes. X 0 1 2 P(X=x) 1/10 6/10 3/10

Distribuio de probabilidade: x = 0; P(0) = P(X=0) = P(BB) = 1/10 x = 1; P(1) = P(X=1) = P(BV ou VB) = 6/10. x = 2; P(2) = P(X=2) = P(VV) = 3/10 A soma de todas as probabilidades de uma funo igual a 1: A p(xi) 0 para todo xi

p( xi) = 1
1

Exemplo 2: Na jogada de duas moedas o espao amostral S={ } Sendo a varivel aleatria X: nmero de coroas. Estabelea a distribuio de probabilidade. X 0 1 2 Evento P(x)

Exemplo 3: Um casal pretende ter trs filhos. Sendo a varivel aleatria X: o nmero de filhos homens que o casal poder ter. Faa a distribuio de probabilidades. S= {........,.........,..........,.........,........,.........,.........,.......} X P(X=xi) 0 1 2 3

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

49

Obs.: Para calcular o nmero de elementos do espao amostral S, basta multiplicar o nmero de possibilidades em cada situao, como no exemplo: dos filhos: 2 . 2. . 2 = 8 na jogado dos dois dados: 6 . 6 = 36 na jogada das trs moedas: 2 . 2. 2 = 8

4.2 Esperana matemtica ou valor esperado O valor esperado de um experimento uma mdia aritmtica, podendo ser calculada por uma equao matemtica do tipo E(x) = xi . P (xi) Esperana (x) = (x) O conceito de esperana matemtica surgiu em relao aos jogos de azar e, em sua forma mais simples, o produto da quantia que um jogador aposta pela respectiva probabilidade de ganho. Exemplo 1: Qual a esperana matemtica se comprarmos um dos 2 000 bilhetes de rifa de um aparelho de TV avaliado em R$ 640,00? 1 Como a probabilidade de ganhar o aparelho de TV de = 0,0005 , assim a 2.000 esperana matemtica de 640 . (0,0005) = R$ 0,32. Do ponto de vista econmico incoerente pagar mais do que R$ 0,32 pelo bilhete. Nesse exemplo tem-se um nico prmio, mas dois resultados possveis R$ 0,00 ou o aparelho de TV avaliado em R$ 640,00. Atividades de estudo 8: 1. Uma agncia de seguros paga R$ 20.000,00 em caso de acidente de carro e cobra uma taxa de R$ 1.000,00. Sabe-se que a probabilidade de que um carro sofra acidente de 3%. Quanto espera a seguradora ganhar por carro segurado? Resoluo: R: R$ 400,00 X=x 1000,00 -19000,00 p(x)

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

50

2. Um comerciante que deseja obter uma concesso para a venda de refrigerantes num jogo de futebol pode esperar lucrar R$ 500,00 com a venda de refri se o dia for ensolarado, mas somente R$ 250,00 se o dia estiver encoberto e R$ 170,00 se chover. As probabilidades para esses eventos so 0,65, 0,25 e 0,10, respectivamente. Qual o lucro esperado do vendedor? R: R$ 404,50

3. Um investigador julga que tem 0, 40 de probabilidade de ganhar R$ 25.000,00 e 0,60 de probabilidade de perder R$15.000,00 num investimento. Seu ganho esperado de:

4.3 Varincia Assim como a mdia uma medida de tendncia central de uma v. a., natural que procuremos uma medida de disperso dessa varivel em relao mdia. Essa medida a varincia , a ser representada por 2 e definida por: 2 = Var(X) = E [(X E(X))2 ] = E [X2 - 2XE(X) + (E(X))2] = E(X2) - (E(X))2.
n Logo: Var ( X ) = x p ( x i ) x i p ( x i ) i =1 i =1 2 2 ou = Var(X) = ( xi E ( x )) .P ( xi )
n

2 i

O desvio padro () a raiz quadrada positiva da varincia. Tem sobre esta a vantagem de exprimir a disperso na mesma unidade de medida da v. a.:

= Var ( X )
Exemplo 1: Dada a distribuio, calcule a esperana matemtica, a varincia e o desvio padro. x P(x) 8 1/8 12 1/6 16 3/8 20 1/4 24 1/12

R: E(x)= 16; 2= 19,09; =4,47

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

51

5. DISTRIBUIES DE PROBABILIDADE
As variveis aleatrias numricas podem ser descritas por intermdio de distribuies de probabilidades, as quais devem contemplar todas as possveis manifestaes do fenmeno examinado e as respectivas probabilidades ou frequncias relativas. Esses dados so obtidos por meio de cadastros, os quais se classificam em: tericos, gerados por modelos matemticos que representem, com graus variados de sucesso, os fenmenos examinados. empricos, elaborados com base nas frequncias efetivamente observadas. subjetivos, que reflitam as convices do pesquisador acerca das frequncias

O primeiro tipo de cadastro permite definir funes de distribuio de probabilidades, com base nas quais so calculadas, com preciso, as probabilidades de ocorrncia de quaisquer possveis manifestaes da varivel aleatria. Os modelos de distribuio de probabilidade apresentam caractersticas especficas conforme as variveis aleatrias numricas sejam discretas ou contnuas. 5.1 Distribuies discretas As distribuies discretas (descontnuas) de probabilidades envolvem variveis aleatrias relativas a dados que podem ser contados, como o nmero de ocorrncias por amostra, ou o nmero de ocorrncias por unidade num intervalo de tempo, de rea, ou de distncia. 5.1.1 Distribuio Binomial Usa-se o termo binomial para designar situaes em que os resultados de uma varivel aleatria podem ser agrupados em duas classes ou categorias. As principais propriedades da distribuio binomial so: h n observaes ou provas idnticas; cada prova tem dois resultados possveis, usualmente chamados sucesso e fracasso; as probabilidades p de sucesso e ( 1 p ) de fracasso permanecem constantes em todas as provas e so complementares; os resultados das provas so independentes uns dos outros.

H muitos exemplos de variveis aleatrias que podem ser classificadas como variveis binomiais: respostas a um teste tipo V ou F, respostas do tipo sim ou no a um questionrio, produtos manufaturados classificados como perfeitos ou defeituosos. Alm disso, variveis com resultados mltiplos podem frequentemente ser tratadas como binomiais, quando apenas um resultado tem interesse. Pode haver bolas de cinco cores em uma urna, mas se nosso interesse apenas na extrao de uma bola verde, as bolas podem classificar-se como verdes e no-verdes. O fenmeno estudado que segue uma distribuio binomial o que trata da quantidade de sucessos observados em uma amostra. Conhecendo a quantidade n de observaes contidas na amostra e a probabilidade p de sucesso, a distribuio binomial representada pela seguinte equao:
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

52

P( x) =

n! . p x . (1 p ) ( n x ) x! (n x)!

Onde: P(x) = probabilidade de que sejam observados x sucessos, dados n e p x = quantidade de sucessos da amostra (varia de zero a n ) n = tamanho da amostra p = probabilidade de sucesso (1-p) = probabilidade de fracasso Exemplos: a) Qual a probabilidade de se obter exatamente 2 caras em 3 lanamentos de uma moeda?

b) Aplicando a frmula da probabilidade binomial, determine a probabilidade de obter 3 estudantes canhotos em uma turma de 15 estudantes, dado que 10% da populao so canhotos.

Atividades de estudo 9: 1. Uma moeda lanada 10 vezes, qual a probabilidade de se obter exatamente 6 caras?

R: 0, 2047

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

53

2.

Lanando uma moeda quatro vezes, qual a probabilidade de se obter exatamente trs caras? R: 0,25

3. Um dado lanado cinco vezes. Qual a probabilidade de se obter face 4, no mximo duas vezes? R: 0, 9645

4. Qual a probabilidade de ocorrer trs faces 6 em 5 jogadas de um dado? R: 0, 032

5. Dos estudantes de um colgio, 41% fumam cigarro. Escolhem-se seis alunos ao acaso pra darem sua opinio sobre o fumo. Determine: a) A probabilidade de nenhum dos seis ser fumante. R: 0, 042 b) De todos os seis serem fumantes. R: 0, 0048

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

54

6. Supondo que os 10 componentes de um sistema funcionem independentemente e se p = 0,6 a probabilidade de cada componente funcionar, qual a probabilidade de que no mximo 8 componentes funcionem?

7. Se 20% dos parafusos produzidos por uma mquina so defeituosos, determinar a probabilidade de, entre 4 parafusos escolhidos ao acaso, um ser defeituoso. R: 0,4096

5.1.2 Distribuio de Poisson A distribuio de Poisson tem dupla importncia: uma como modelo probabilstico para inmeros fenmenos aleatrios nas mais diversas reas, e outra, como uma aproximao da distribuio binomial, esta difcil de calcular quando n grande. A distribuio de Poisson til para descrever as probabilidades do nmero de ocorrncias num campo ou num intervalo contnuo (em geral tempo ou espao). Eis alguns exemplos de variveis que podem ter como modelo a distribuio de Poisson: Defeitos por centmetro quadrado. Acidentes por dia. Nmero de chamadas telefnicas recebidas por uma central durante 5 minutos. Nmero de falhas de um computador num dia de operao. Nmero de relatrios de acidentes enviados a uma companhia de seguros numa semana.

Note-se que a unidade de medida (tempo, rea) contnua, mas a varivel aleatria (nmero de ocorrncias) discreta. Alm disso, as falhas no so contveis. No possvel contar os acidentes que no aconteceram, nem to pouco o nmero de chamadas que no foram feitas, nem o nmero de defeitos que no ocorreram. A distribuio de Poisson baseia-se nas seguintes condies:

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

55

1. A probabilidade de uma ocorrncia a mesma em todo o campo de observao, portanto, o nmero de ocorrncias durante qualquer intervalo depende somente da extenso do intervalo; 2. As ocorrncias ocorrem independentemente, ou seja, um excesso ou falta de ocorrncias em algum intervalo no exerce efeito sobre o nmero de ocorrncias em outro intervalo; 3. A possibilidade de duas ou mais ocorrncias acontecerem em um pequeno intervalo muito pequena (aproximadamente zero) quando comparada de uma nica ocorrncia. O limite inferior do nmero de ocorrncias, em todas essas situaes, 0, enquanto que o limite superior ao menos teoricamente infinito, muito embora, na maioria dos exemplos acima, seja difcil imaginar um nmero ilimitado de ocorrncias. A distribuio de Poisson fica completamente caracterizada por um nico parmetro: a mdia do processo. Assim, sabendo que uma varivel aleatria tem resultados distribudos segundo Poisson, e conhecendo o nmero mdio de ocorrncias por unidade, podemos determinar a probabilidade de qualquer dos resultados possveis. Assim como no caso binomial, podemos usar tabelas individuais onde se encontram as probabilidades para algumas mdias, e tambm usar uma frmula para calcular a probabilidade para qualquer mdia. A frmula de Poisson:

e x P ( x) = x!
Onde x o nmero de ocorrncias e a base dos logaritmos naturais a taxa mdia por unidade multiplicada pelo nmero de unidades

Exemplos: 1) Um processo mecnico produz tecido para tapetes com uma mdia de dois defeitos por metro quadrado. Determine a probabilidade de um metro quadrado ter exatamente um defeito, admitindo que o processo possa ser bem aproximado por uma distribuio de Poissson. R: = 2 defeitos por m

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

56

2) Suponhamos que os navios cheguem a um porto uma razo de 2 navios/hora, e que essa razo seja bem aproximada por um processo de Poisson. Observando o processo durante um perodo de meia hora, determine a probabilidade de no chegar nenhum navio; chegarem 3 navios.

3) Uma central telefnica recebe, em mdia, cinco chamadas por minuto. Supondo que a distribuio de Poisson seja adequada nessa situao, obter a probabilidade de que a central no receba chamada durante um intervalo de um minuto. receba no mximo duas chamadas em quatro minutos.

Atividades de estudo 10: 1. As chamadas de emergncia chegam a uma delegacia de polcia razo de 4 por hora em dias teis, e podem ser aproximadas por uma distribuio de Poisson. a) Quantas chamadas de emergncia so esperadas num perodo de 30 minutos? b) Qual a probabilidade de nenhuma chamada num perodo de 30 minutos? c) Qual a probabilidade de ao menos 2 chamadas no mesmo perodo?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

57

2. O nmero de rdios vendidos por dia por uma empresa tem distribuio aproximadamente de Poisson com mdia 1,5. Determine a probabilidade de a firma vender quatro ou mais rdios num perodo de 3 dias.

3. Os defeitos em rolos de filme fotogrfico colorido ocorrem razo de 0,1 defeito/rolo, e a distribuio dos defeitos de Poisson. Determine a probabilidade de um rolo em particular conter um ou mais defeitos.

4. Os clientes chegam a uma loja razo de 6,5/hora (Poisson). Determine a probabilidade de que, durante qualquer hora: a) no chegue cliente. b) chegue 1 cliente ou mais.

Respostas 1) a) 2 chamadas 2) 0,6577 3) 0,0952 4) a) 0,0015 b) 0,135 b) 0,9985


Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

c) 0,594

58

5.2 Distribuio Contnua Definio 1: Uma funo X, definida sobre o espao amostral S e assumindo valores num intervalo de nmeros reais, chamada de funo de variveis contnuas. O ponteiro da figura abaixo ilustra o conceito de varivel contnua. Uma vez que tenha sido posto a girar, o ponteiro pode parar em qualquer posio ao longo do crculo. No se pode esperar que venha a parar exatamente num dos valores do crculo. Mesmo levando-se em conta as limitaes na mensurao feita ao longo do crculo, ainda assim, h um nmero extremamente grande de pontos de paradas possveis. 0 7 1

4 O polgono de variveis contnuas de uma amostra ou de uma populao apresentado a partir de uma curva definida por uma equao do tipo y = p (x), onde a probabilidade de ocorrncia do evento corresponde a rea total limitada pela curva que se originou da funo e o eixo x . A rea da referida curva igual a 1, e a rea compreendida entre as verticais a e b sombreada, d a probabilidade de X cair entre a e b , podendo ser representada por P(a x b).

Definio 2: Seja X varivel aleatria contnua. A funo f chamada de distribuio ou de funo de probabilidade contnua (ou funo densidade) de X, satisfaz as condies: a) f(x) 0 b)

f ( x)dx = P (a x b) , b > a;

c)

f ( x )dx

=1

Isto , f no-negativa e a rea total sob seu grfico 1. 5.2.1 Distribuio Normal Entre as distribuies tericas de varivel aleatria contnua, uma das mais empregadas a distribuio normal.
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

59

A distribuio normal, tambm chamada de gaussiana por razo das contribuies da teoria de Kart F. Gauss no sculo XVII, alm de representar a distribuio de frequncias observadas em fenmenos naturais e fsicos, serve como aproximao de probabilidades binomiais, quando o nmero de experimentos n muito grande. Muitas das variveis analisadas na pesquisa scio-econmica correspondem distribuio normal ou dela se aproximam. Definio: Diz-se que uma varivel aleatria X tem distribuio normal com parmetro (mdia da distribuio) e (desvio padro), com - < < + e 0 < < , se sua densidade dada por :
1 e 2
1 ( x )2 2

f(x) =

A distribuio normal constitui, na realidade, uma famlia infinitamente grande de distribuies, uma para cada combinao possvel de mdia e desvio padro. Dessa forma, seria intil procurar tabelas que atendessem a todas as necessidades. A distribuio normal padronizada a mais usada. Grfico:

Propriedades da Curva Normal

1a A varivel aleatria X pode assumir todo e qualquer valor real. 2 A representao grfica da distribuio normal uma curva simtrica em torno da mdia, que recebe o nome de curva normal ou de Gauss. 3 A rea total limitada pela curva e pelo eixo das abscissas igual a 1, j que essa rea corresponde probabilidade de a varivel aleatria X assumir qualquer valor real. 4 A curva normal assinttica em relao ao eixo das abscissas, isto , aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcan-lo. 5 Como a curva simtrica em torno da mdia, a probabilidade de ocorrer valor maior que a mdia igual probabilidade de ocorrer valor menor do que a mdia, isto , ambas as probabilidades so iguais a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

60

Sendo o perfil de uma curva normal determinado pelo desvio padro, pode-se reduzir qualquer curva normal a uma curva normal padro. A varivel X da distribuio normal transformada numa varivel Z, que constitui uma distribuio normal padro ou reduzida.

z=
onde

z = nmero de desvios padres a contar da mdia x = valor arbitrrio = mdia da distribuio = desvio padro

Sendo a mdia igual a zero (0) e o desvio igual a um (1) constantes, as reas sob a curva normal padro podem ser calculadas e tabeladas, pois dependem exclusivamente do valor da varivel z.

Quando temos em mos uma varivel aleatria com distribuio normal, nosso principal interesse obter a probabilidade de essa varivel aleatria assumir um valor em um determinado intervalo.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

61

Exemplo 1: Seja X a varivel aleatria que representa os dimetros dos parafusos produzidos por certa mquina. Vamos supor que essa varivel tenha distribuio normal com mdia = 2 cm e desvio padro = 0,04 cm. Qual a probabilidade de um parafuso ter o dimetro com valor entre 2 e 2,05 cm ? Com o auxlio de uma distribuio normal reduzida, isto , uma distribuio normal de mdia = 0 e desvio padro = 1. Resolveremos o problema atravs da varivel z, onde
Z = X

Utilizaremos tambm uma tabela normal reduzida, que nos d a probabilidade de z tomar qualquer valor entre a mdia 0 e um dado valor z, isto : P (0 < z < z) Nessa tabela, a primeira coluna e a primeira linha do o valor de z, sendo que a coluna da valores de z, com primeiro dgito decimal e a linha, com o segundo dgito decimal. Nas interseces da coluna com linha, encontramos a rea sob a curva, que a probabilidade de a varivel situar-se entre zero ( 0) e o valor de z procurado. No nosso problema queremos calcular P(2 < X < 2,05). Para obter esta probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a x = 2,05. z = (2,05 - 2) / 0,04 = 1,25 Utilizao da tabela Z

Procuremos, agora, na tabela Z o valor de z = 1,25. Na primeira coluna encontramos o valor at uma casa decimal = 1,2. Em seguida, encontramos, na primeira linha, o valor 5, que corresponde ao ltimo algarismo do nmero 1,25. Na interseco da linha e coluna correspondentes encontramos o valor 0, 3944, o que nos permite escrever: P (0 < Z < 1,25) = 0, 3944 ou 39,44 %, assim a probabilidade de um certo parafuso apresentar um dimetro entre a mdia = 2 cm e x = 2,05 cm de 39,44 %.

Atividades de estudo 11: 1) Dado que uma populao com mdia 25 e desvio padro 2 tem distribuio normal, determine os valores de z para os seguintes valores de populao. a) x=23 b) x= 23,5

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

62

2) Uma distribuio normal tem mdia () 40 e desvio padro () 5. Que percentagem da populao est em cada um dos intervalos. a) de 40 a 50 b) de 40 a 48 c) 45 a 55

3) Defina a probabilidade para a rea sob a curva normal entre a mdia e: (represente a curva). a) Um desvio padro para a esquerda e um para a direita. b) Dois desvios padres para a esquerda e dois para a direita. c) Trs desvios padres para a esquerda e trs para a direita.

4) As alturas dos alunos de determinada escola so normalmente distribudas com mdia de 1,60m e desvio padro 0,30m. Encontra a probabilidade de um aluno medir: a) entre 1,50 e 1,80m. b) mais de 1,75m c) menos de 1,48m (R: 37,79%; 30,85%; 34,46%)

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

63

5) Um fabricante de bateria sabe, por experincia passada que as baterias de sua fabricao tm vida mdia de 600 dias e desvio padro de 100 dias, sendo que a durao tem aproximadamente distribuio normal. Oferece uma garantia de 312 dias, isto , troca as baterias que apresentarem falhas nesse perodo. Fabrica 10 000 baterias mensalmente. Quantas baterias devero ser trocadas pelo uso da garantia, mensalmente? (R: 20 baterias)

6) A durao de certo componente eletrnico tem mdia de 850 dias e desvio padro de 40 dias. Sabendo que a durao normalmente distribuda, calcule a probabilidade de esse componente durar: a) entre 700 e 1000 dias. b) mais de 800 dias. c) menos de 750 dias.

7) Suponha que a renda mdia de uma grande comunidade possa ser razoavelmente aproximada por distribuio normal com mdia de 12 salrios mnimos e desvio padro de 3 salrios mnimos. a) Que porcentagem da populao ter renda superior a 15 salrios mnimos? b) Numa amostra de 50 assalariados, quantos podemos esperar que ganhem menos de 9 salrios mnimos?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

64

Atividades de estudo 12: 1. Determine as probabilidades: a) P(-1,25 < Z < 0) =

b) P(-0,5 < Z < 1,48) =

c) P(0,8 < Z < 1,23) =

d) P(-1,25 < Z < -1,20) =

e) P(Z < 0,92) =

f) P(Z > 0,6) =

2. Os salrios de uma categoria profissional so distribudos normalmente, em torno da mdia R$ 10.000,00, com desvio padro de R$ 800,00. Calcule a probabilidade de um bancrio ter o salrio situado entre R$ 9.800,00 e R$ 10.400,00.

3. Uma mquina empacota produtos com mdia de peso de 1 kg com variaes de peso de 20 g. Qual a probabilidade de termos pacotes com: a) menos de 950 g b) com peso variando de 940 g a 1030 g

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

65

6. AMOSTRAGEM
A amostragem naturalmente usada em nossa vida diria. Por exemplo, para verificar o tempero de um alimento em preparao, podemos provar (observar) uma pequena poro deste alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (populao) uma parte (amostra), com o propsito de avaliarmos (inferirmos) a qualidade de tempero de todo o alimento. Assim, a populao um conjunto de elementos passveis de serem mensurados, com respeito s variveis que se pretende levantar. A populao pode ser formada por pessoas, famlias, pacotes de biscoito, estabelecimentos industriais, ou qualquer outro tipo de elementos, dependendo basicamente dos objetivos da pesquisa (Todos os elementos do grupo a ser estudado constituem a populao. A parte da populao efetivamente examinada a amostra). comum termos interesse em descrever certas caractersticas especficas dos elementos da populao, que denominaremos parmetros. Exemplos: 1) Numa pesquisa eleitoral a uma semana de uma eleio estadual, a populao pode ser definida como todos os eleitores com domiclio eleitoral no estado. Os parmetros devem ser as porcentagens de votos de cada candidato o governo do estado, no momento da pesquisa. 2) Para planejar projetos de recursos humanos numa empresa, com centenas de funcionrios, podemos realizar uma pesquisa para avaliar alguns parmetros da populao de funcionrios desta empresa como: porcentagem de funcionrios que concluram o ensino fundamental, tempo mdio de servio dos funcionrios na empresa. Estes dois exemplos ilustram a dificuldade que se pode ter em pesquisar toda a populao. So situaes onde se recorre amostragem. O termo inferncia estatstica refere-se ao uso apropriado dos dados da amostra para se ter conhecimento sobre os parmetros da populao. Os valores calculados a partir dos dados obtidos pela amostra so chamados estimativas desse parmetro. Citaremos, agora, quatro razes para o uso de amostragem em levantamentos de grandes populaes. 1) Economia: Em geral, torna-se bem mais econmico o levantamento de somente uma parte da populao. 2) Tempo: Numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria tempo suficiente para pesquisar toda a populao de eleitores do pas, mesmo que houvesse recursos financeiros disponveis. 3) Confiabilidade dos dados: Quando se pesquisa um nmero reduzido de elementos, pode-se dar mais ateno a casos individuais, evitando erros nas respostas. 4) Operacionalidade: mais fcil realizar operaes de pequena escala. Um dos problemas dos grandes censos o controle dos entrevistadores. Mas h situaes em que no necessrio realizar amostragem: 1) Populao pequena: Se a populao for pequena, por exemplo, 50 elementos, para termos uma amostra capaz de gerar resultados precisos para os parmetros da
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

66

populao, necessitamos de uma amostra relativamente grande, em torno de 80% da populao. 2) Caracterstica de fcil mensurao: Talvez a populao no seja to pequena, mas a varivel que se quer observar de to fcil mensurao que no compensa investir num plano de amostragem. 3) Necessidade de alta preciso: Algumas caractersticas de alunos da rede municipal de ensino so importantes para o planejamento do municpio, por exemplo, o que leva a prefeitura a coletar informaes a respeito de toda a populao. Os estudos que utilizam mtodos estatsticos vo desde os que so bem concebidos e executados, dando resultados confiveis, aos que so concebidos deficientemente e mal executados, levando a concluses enganosas e sem qualquer valor real. Eis alguns pontos importantes para o planejamento de um estudo eficaz de produzir resultados vlidos: Identificar com preciso a questo a ser respondida e definir com clareza a populao de interesse. Estabelecer um plano para coleta de dados. Esse plano deve descrever detalhadamente a realizao de um estudo observacional ou de um experimento, e deve ser elaborado cuidadosamente, de modo que os dados coletados representem efetivamente a populao em questo. Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem resultar de uma coleta tendenciosa de dados. Analisar os dados e tirar concluses. Identificar tambm possveis fontes de erros.

6.1 Processos de amostragem 6.1.1 Amostragem aleatria (ou amostragem aleatria simples) Em uma amostra aleatria, os elementos da populao so escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatria simples de n elementos, de maneira que toda amostra de tamanho n possvel tenha a mesma chance de ser escolhida). As amostras aleatrias podem ser escolhidas por diversos mtodos, inclusive a utilizao de tabelas de nmeros aleatrios e de computadores para gerar nmeros aleatrios. Este tipo de amostragem equivalente a um sorteio lotrico. Na prtica, a amostragem aleatria simples pode ser realizada numerando-se a populao de 1 a n e sorteando-se, a seguir por meio de um dispositivo aleatrio qualquer, k nmeros dessa sequncia, os quais correspondero aos elementos pertencentes amostra. Observao: A amostra aleatria simples pode ser realizada pelo software Excel na funo ALEATRIOENTRE, onde entramos com o intervalo da amostra determinado e o software nos retorna com o valor k correspondente da amostra. 1 passo Selecionar o item Ferramentas 2 passo Em Ferramentas aciona o item Suplementos...
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

67

3 passo Acionar conforme a janela a seguir -

OK

4 passo Inserir funo

Categoria Todas

funo ALEATRIOENTRE

OK

Exemplo:
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

68

Obter uma amostra de 5% para a pesquisa da estatura de 90 alunos de uma escola:

Os nmeros obtidos foram:


24 11 49 68 52

Medindo as alturas dos alunos correspondentes aos nmeros sorteados, obteremos uma amostra das estaturas dos noventa alunos. 6.1.2 Amostragem sistemtica Quando os elementos da populao j se acham ordenados, no h necessidade de construir um sistema de referncia. So exemplos os pronturios mdicos de um hospital, dos prdios de uma rua, as linhas de produo e etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemtica. Assim, no caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produo diria. Neste caso estaramos fixando o tamanho da amostra em 10% da populao. Exemplo 1: Se a Motorola quisesse fazer uma pesquisa sobre seus 107 000 empregados, poderia partir de uma relao completa dos mesmos e selecionar cada 100 empregado, obtendo uma amostra de 1.070 elementos. Esse mtodo simples e utilizado com frequncia. Exemplo 2: Deseja-se retirar uma amostra de n = 10 unidades de observao de uma populao de tamanho N = 874. O intervalo de seleo , ento, 874/10 = 87,4 87(aproxima-se para menos, seno se ultrapassar a ordem da ltima unidade). Desse modo, vo-se contando as unidades de observao e escolhem-se aquelas que estiverem nas seguintes posies: 87, 174, 261, 348, 435, 522, 609, 696, 783 e 870. 6.1.3 Amostragem estratificada proporcional A amostragem estratificada proporcional recomendada quando existe uma diviso natural da populao em grupos com nmeros de elementos diversos.
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

69

Com a amostragem estratificada, subdividimos a populao em, no mnimo, duas subpopulaes (ou estratos) que compartilham das mesmas caractersticas (como sexo) e, em seguida, extramos uma amostra de cada estrato. Exemplo 1: Suponhamos que numa escola h 120 crianas na faixa de 7 anos de idade estejam distribudas em 5 turmas, com quantidades diferentes de alunos. Vamos supor que nossa amostra deva ter, no mnimo, 12 elementos. OBS: Os dados devero ser arredondados para o inteiro mais prximo, j que esses nmeros indicam a quantidade de crianas. Turma A B C D E Total Populao 20 15 35 30 20 120 Amostra

Na ltima coluna est representada a quantidade de elementos de cada estrato e o total da amostra. Atividades de estudo 13: 1. Pretende-se obter uma amostra dos alunos de uma universidade para estimar a proporo que tem trabalho remunerado. a) Qual a populao em estudo? b) Qual o parmetro que se quer estimar? c) Voc acha que se obteria uma boa amostra dos alunos no restaurante universitrio? No ponto de nibus mais prximo? Nas portas das salas de aula? Voc tem outra alternativa para obter a amostra?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

70

2. Em uma cidade, quer-se estudar o interesse despertado por um programa de TV entre os alunos de 7 anos de idade das escolas de ensino fundamental. Para isso, pretende-se levantar uma amostra de 300 crianas. A partir dos dados abaixo, estratifique a amostra. Encontre primeiro a porcentagem correspondente ao tamanho da amostra. (14, 8515%) Escola A B C D E Total Populao 400 300 350 450 520 Amostra

3. Em uma cidade com 30 000 habitantes deseja fazer uma pesquisa sobre a preferncia por tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertence. a) Qual a populao envolvida na pesquisa? b) Supondo que na cidade haja 5 500 mulheres e 6000 homens, com 20 anos, determine uma amostra com 1200 pessoas. (p:10, 4348%)

4. Uma populao encontra-se dividida em trs estratos, com tamanhos diferentes, respectivamente a: n1= 40, n2= 100, n3= 60. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, 9 elementos da amostra foram retirados do 3 estrato, determine o nmero total de elementos da amostra. (30 elementos)

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

71

5. Em uma empresa existem 250 funcionrios, sendo 35 na linha de produo A, 32 na linha de produo B, 30 na linha de produo C, 28 na linha D, 35 na linha E, 32 na linha F, 31 na rea administrativa e 27 na engenharia. Obtenha uma amostra de 40 funcionrios. R: p:16%, A= 6, B= 5, C= 5, D=4, E= 6, F= 5 Adm= 5, Eng=4

6. Uma empresa apresenta o seguinte quadro de funcionrios: N de funcionrios Setor Produo Engenharia Administrao Qualidade Total Masculino 80 11 13 4 Feminino 60 4 17 5

Obtenha uma amostra estratificada correspondente a 35 funcionrios. (N masculino e feminino em cada extrato)

(p:18,04%)

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

72

7. DISTRIBUIES AMOSTRAIS
A finalidade da amostragem obter uma indicao do valor de um ou mais parmetros de uma populao, tais como a mdia, o desvio-padro populacional, ou a proporo de itens que possuem determinadas caractersticas. As estatsticas amostrais que correspondem a esses parmetros populacionais so usadas para aproximar os valores conhecidos daqueles parmetros. Assim que a mdia amostral usada para estimar a mdia da populao, o desvio padro amostral usado para estimar o desvio padro populacional, e a proporo amostral serve para estimar a proporo da populao. Uma das realidades da amostragem aleatria que, quando se extraem repetidas amostras da mesma populao, h uma tendncia de a estatstica amostral variar de uma amostra para outra, e tambm em relao ao verdadeiro valor do parmetro, simplesmente em razo de fatores casuais relacionados com a amostragem. Essa tendncia conhecida como variabilidade amostral. (Por esta razo, quase sempre podemos estar certos de que determinada estatstica amostral no igual ao correspondente parmetro populacional). Obviamente, ento, qualquer tentativa para fazer inferncias sobre uma populao deve levar em conta a variabilidade amostral. De modo geral, pode parecer difcil lidar, de maneira racional, com a variabilidade amostral. No caso de amostragem aleatria, entretanto, demonstra-se matematicamente que a variabilidade amostral pode ser descrita por distribuies de probabilidades tais como a normal e a binomial. Quando as distribuies de probabilidade so usadas desta maneira, so conhecidas como distribuies amostrais. E como essas distribuies s podem ser utilizadas quando se trata de amostras aleatrias, essencial usar somente amostras aleatrias para fazer inferncia estatstica. 7.1 Distribuio amostral da mdia Uma distribuio da populao representa a distribuio de uma populao de valores, e uma distribuio da amostra representa a distribuio de uma amostra de valores coletados de uma populao. A distribuio amostral da mdia a distribuio de probabilidade para os possveis valores da mdia da amostra x baseados em um particular tamanho da amostra. Para qualquer tamanho dado n de amostra tomada de uma populao com mdia , o valor da mdia da amostra x ir variar de amostra para amostra. Esta variabilidade serve como base da distribuio amostral. A distribuio amostral da mdia descrita pela determinao do valor esperado E( x ) , ou mdia, da distribuio e do desvio padro da distribuio das mdias X . Uma vez que este desvio padro indica o quanto a mdia da amostra acurada, X usualmente chamado de erro padro da mdia. Em geral o valor esperado e o erro padro da mdia so definidos por E ( X ) = e

X =

Ao fazer amostras de uma populao finita, deve-se incluir o fator de correo finita (ou fator de correo para populao finita) na frmula do erro padro da mdia. (uma regra de bolso que a correo insignificante e pode ser omitida sempre que o tamanho da amostra for menor que 5% do tamanho da populao). A frmula para o erro padro da mdia quando se inclui o fator de correo finita : N n . X = n N 1

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

73

Se o desvio padro da populao for desconhecido, o erro padro da mdia pode ser estimado, usando-se o desvio padro da amostra como um estimador do desvio padro da populao. Para diferenciar este erro padro daquele baseado em um conhecido, denota-se o mesmo por s X . A frmula para o erro padro estimado da mdia :
sX = s n

A frmula para o erro padro estimado, da mdia quando se inclui o fator de correo finita : sX = s n . N n N 1

Exemplo 1: Um auditor toma uma amostra aleatria de tamanho n=16 de um conjunto de N=100 contas a receber. No se conhece o desvio padro dos valores das 100 contas a receber. Contudo, o desvio padro da amostra s = 57 reais. Determinamos o valor do erro padro da distribuio amostral da mdia da seguinte forma: sX = s n . N n 57,00 100 16 57 84 = . = = 14,25 0,8484 13,13 reais N 1 100 1 4 99 16

O erro padro da mdia fornece a base principal para a inferncia estatstica no que diz respeito a uma populao com mdia desconhecida, como ser visto posteriormente. Um teorema em Estatstica que conduz ao uso do erro padro da mdia o Teorema do Limite Central que diz: medida que se aumenta o tamanho da amostra, a distribuio amostral da mdia se aproxima da forma da distribuio normal, qualquer que seja a forma da distribuio da populao. Na prtica, a distribuio amostral da mdia pode ser considerada como aproximadamente normal sempre que o tamanho da amostra for n > 30. (Alguns autores consideram mais adequado trabalhar com a ideia de n > 40). Em se tratando de varivel z, a distribuio tem mdia zero e varincia um. Por conseguinte, poder ser usada a tabela de reas da normal padro para calcular probabilidades relacionadas com a mdia da amostra, aps a sua padronizao. Para distribuies padronizadas, temos:

Exemplo 2: Sabendo-se que a mdia de determinada populao 50 kg e o desvio padro 10 kg, qual a probabilidade de que a mdia de uma amostra de 36 observaes dessa populao desvie da mdia em mais de 5 kg?

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

74

Neste caso a mdia da amostra pode ser maior que 55 ou menor que 45. Calculamos um valor para x z=
55 50 10 36

z = 3. O valor tabelado para z corresponde a 0, 4987

Este valor de um lado s. A probabilidade de estar entre 45 e 55 99,74%, portanto, a probabilidade de que desvie mais do que 5 kg 1 0, 9974 = 0, 0026 ou 0,26%. 7.2 Distribuio amostral da proporo Que porcentagem de peas numa grande remessa apresenta defeito? Qual a probabilidade de um aluno do curso fundamental no ser vacinado? Essas perguntas e outras anlogas podem ser respondidas utilizando-se dados amostrais para estimar o parmetro populacional. A estimativa de propores populacionais muito semelhante de mdias populacionais. Por exemplo, intervalos de confiana para grandes amostras se baseiam numa distribuio amostral que aproximadamente normal, usando-se a estatstica amostral (neste caso a proporo amostral) como estimativa pontual do verdadeiro parmetro (proporo populacional). O valor esperado de uma proporo amostral sempre igual verdadeira proporo da populao. Usa-se, portanto, a proporo amostral como estimativa pontual da verdadeira proporo:

p =

x n

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

75

8 MTODOS INFERENCIAIS
Um dos objetivos da Estatstica o de conhecer populaes por meio das informaes amostrais. Como as populaes so caracterizadas por medidas numricas descritivas, denominados parmetros, a estatstica diz respeito realizao de inferncias sobre esses parmetros populacionais desconhecidos. Parmetros populacionais tpicos so a mdia e o desvio padro . Os mtodos para realizar inferncias a respeito dos parmetros referentes a uma pertencem a duas categorias: Estimao: determinao de estimativas dos parmetros populacionais. Teses de hipteses: tomada de deciso relativa ao valor de um parmetro populacional.

8.1 Estimao 8.1.1 Estimativa por ponto utilizada quando o interesse estimar o parmetro por meio de um nico valor amostral. Assim, o valor da mdia amostral x uma estimativa por ponto da mdia populacional . De maneira anloga, para o desvio padro. Exemplo: Uma amostra aleatria de 200 alunos de uma universidade de 20.000 estudantes revelou nota mdia amostral de 5,2. Logo: x = 5,2 uma estimativa pontual da verdadeira nota mdia dos 20.000 alunos. 8.1.2 Estimativa por intervalo utilizada quando temos um intervalo, representado por dois limites, mximo e mnimo, dentro do qual est contido o parmetro desconhecido com uma segurana (ou confiana) especificada. Geralmente usa-se (1 - ) %, que pode corresponder a 90%, ou 95%, ou 97,5%, etc. Se o comprimento do intervalo pequeno, temos um elevado grau de preciso da inferncia realizada. As estimativas dessa natureza so denominadas de intervalo de confiana. Exemplo: O intervalo [1,60 m; 1,64 m] contm a altura mdia dos moradores do municpio X, com nvel de confiana de 95%. 8.1.2.1 Intervalo de confiana para a mdia populacional Quando o desvio padro conhecido

Admitindo-se x como sendo uma varivel normalmente distribuda com mdia e desvio padro , pode-se estabelecer um limite inferior e um limite superior, definindo-se um
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

76

intervalo que contm certo percentual dos valores de x. Geralmente usam-se os percentuais 90%, 95% e 99% que so denominados nveis de confiana para a mdia da populao. Na distribuio normal padro, os valores de z que limitam os intervalos esto assim representados:

A varivel x reduzida varivel z atravs da frmula:

Para fixarmos um intervalo de confiana para a mdia, o valor de z correspondente a x obtida da amostra, dever estar compreendido entre os valores limites de z, conforme o nvel de confiana estabelecido. Sejam z e + z os valores limites do intervalo de confiana e z o valor correspondente a x , ento:

Isolando , para amostragem de uma populao infinita ou amostragem com reposio de uma populao finita, vem:

e no caso de amostragem sem reposio de uma populao finita de tamanho N, vem:

OBS: Podemos substituir por s para amostras consideradas grandes (n 30). Exemplo: Estabelecer o intervalo de confiana de 95% para , sabendo que uma amostra de tamanho 36 dessa populao forneceu x = 30 e = 4. 4 Limite inferior = 30 1,96 30 1,96 x 2/3 = 28,693 36 4 Limite superior = 30 + 1,96 30 + 1,96 x 2/3 = 31,307 36
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

77

Portanto, podemos presumir que a mdia dessa populao esteja entre 28,693 e 31, 307, com 95% de confiana. Neste intervalo a mdia amostral igual a 30 est includa. P (28,693 31,307) = 95%

Atividades de estudo 14: 1. A durao da vida de uma pea de equipamento tal que = 5 horas. Foram amostradas aleatoriamente 100 dessas peas, obtendo-se mdia de 500 horas. Construir um intervalo de confiana para a verdadeira durao mdia da pea com um nvel de 95% de confiana.

2. Uma amostra de 64 elementos de uma varivel normalmente distribuda forneceu x = 25,4 e = 5,2. Determinar os limites de confiana de 90% para a mdia.

Quando o desvio padro desconhecido

Quando temos pequenas amostras e no conhecemos o valor do desvio padro populacional, podemos construir intervalos de confiana apara a mdia. Para tanto, necessrio que a populao de onde foi extrada a amostra aleatria tenha distribuio normal. Neste caso, devemos empregar uma nova varivel. Esta varivel denominada t de Student.

O processo para se obter o intervalo de confiana semelhante ao mostrado no item anterior. Como no se conhece , preciso substitu-lo por s (desvio padro amostral) que, contrariamente a , uma varivel aleatria. A forma da distribuio t bastante parecida com a normal. A principal diferena entre as duas distribuies que a distribuio t tem maior rea nas caudas. A tabela t fornece os valores limites para os intervalos de confiana. A varivel t possui n 1 graus de liberdade.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

78

Quando desconhecido e n < 30, obtm-se o intervalo de confiana para a mdia substituindo-se z por t. Assim:

Exemplo: Qual o intervalo de confiana para a mdia, no nvel de 95%, sabendo que uma amostra de tamanho 10 forneceu x = 8,7 e s = 2? Limite inferior = 8,7 2,2622
2 10 2 Limite superior = 8,7 + 2,2622 10

7,27 10,13

P (7,27 10,13) = 95%, ou seja, o intervalo [7,27 ; 10,13] contm a verdadeira mdia com 95% de confiana.

Erro mximo de estimativa a expresso constitui o erro mximo da

Na frmula estimativa.

O erro igual diferena entre a mdia amostral e a verdadeira mdia da populao. Como o intervalo de confiana tem centro na mdia amostral, o erro mximo provvel igual metade da amplitude do intervalo. Assim, para diminuir o erro mximo de estimativa, dando a esta maior preciso, a nica alternativa de que dispomos o aumento do tamanho da amostra. Dessa forma, se fixarmos previamente o erro mximo de estimativa e o nvel de confiana podemos determinar o tamanho da amostra a ser tomada:

Exemplo 1: Desejando estimar, ao nvel de confiana de 95%, a mdia de uma populao de modo que ela no exceda a 2 unidades, sendo = 8, qual o tamanho da amostra a ser tomada?
1,96 * 8 Se e = 2 (no mximo), temos que: n= n = 61,4656 n 61 2 Portanto aproximadamente 61 elementos a serem investigados
2

8.1.2.2 Intervalo de confiana para a proporo populacional Que proporo de bolas em uma urna so vermelhas? Que proporo de eleitores aprova determinado projeto. Essas perguntas e outras anlogas podem ser respondidas utilizando-se dados amostrais para estimar o parmetro populacional. Tal como antes, as estimativas sero pontuais e intervalares.
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

79

Como vimos, o valor esperado de uma proporo amostral sempre igual verdadeira proporo da populao. Usa-se, portanto, a proporo amostral como estimativa pontual da verdadeira proporo: x p = n A estimativa intervalar do parmetro populacional (para grandes amostras) simtrica em relao proporo amostral, tal como ocorre com o intervalo para a mdia populacional em relao mdia amostral. A principal diferena entre a estimativa de mdias e a de propores est nos desvio padres das distribuies amostrais. O desvio padro de uma proporo se baseia na distribuio binomial. A estimativa de p dada abaixo:

pop =
Intervalo de confiana para p:
p z.

p . (1 p ) n

p . (1 p ) n

Exemplo 1: Determinar um intervalo de 98% de confiana para a verdadeira proporo populacional, se x = 50 e n = 200.

Exemplo 2: Uma amostra de 200 observaes acusou 20 baterias defeituosas numa remessa. Usando uma confiana de 99% determinar o erro de estimao.

Atividades de estudo 15: 1. Uma amostra de 36 crianas de uma escola de ensino fundamental/sries iniciais forneceu peso mdio 28,5 kg e desvio padro de 5,2 kg. Determinar no nvel de 99%: a) O intervalo de confiana para a mdia ; b) O tamanho da amostra para que o erro mximo seja igual a 1,2 kg;

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

80

2. Sendo x normalmente distribuda, uma amostra de 50 elementos forneceu uma mdia de 78,4 e desvio padro de 6,2. a) Estimar, ao nvel de 99%, a mdia da populao; b) Qual deveria ser o tamanho da amostra para o erro de estimativa ser 2?

8.2 Testes estatsticos Na avaliao de um parmetro populacional, sobre o qual no se possui nenhuma informao com respeito a seu valor, no resta outra alternativa a no ser estim-lo atravs do intervalo de confiana. No entanto, se tiver alguma informao com respeito ao valor do parmetro que se deseja avaliar, pode-se testar esta informao no sentido de aceit-la como verdadeira ou rejeit-la. Denomina-se de hiptese nula (H0), a informao a respeito do valor do parmetro que se quer avaliar. Chama-se de hiptese alternativa (H1), a afirmao a respeito do valor do parmetro que se aceita como verdadeiro caso a hiptese nula seja rejeitada. Ao aplicar um teste, aplicamos uma regra de deciso que permite aceitar ou rejeitar como verdadeira uma hiptese nula, com base na evidncia amostral. Isto significa que se utiliza uma amostra desta populao para verificar se a amostra confirma ou no o valor do parmetro informado pela hiptese nula. 8.2.1 Etapas bsicas em um teste de hiptese Em um teste de hiptese, comeamos com um valor suposto (hipottico) de um parmetro populacional. Depois de coletar uma amostra aleatria, comparamos a estatstica da amostra, tal como a mdia amostral x , com o parmetro suposto, tal como a mdia populacional hipottica . Ento, ou aceitamos ou rejeitamos o valor hipottico como sendo correto. O valor hipottico rejeitado somente se o resultado da amostra for claramente improvvel de ocorrer quando a hiptese for verdadeira. Etapa 1: Formular a hiptese nula e a hiptese alternativa. A hiptese nula uma afirmao sobre o valor de um parmetro populacional (como a mdia), deve conter a condio de igualdade e deve escrever-se como =, ou . (Ao fazermos efetivamente o teste, trabalhamos com a hiptese de que o parmetro igual a um valor especfico.) Para a mdia temos as trs formas possveis para a hiptese nula: H0 : = algum valor H0 : algum valor H0: algum valor Por exemplo, a hiptese nula correspondente suposio geral de que a temperatura mdia do corpo 98,6F se expressa como H0: = 98,6F. Testamos a hiptese nula diretamente no
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

81

sentido de que, supondo-a verdadeira, procuramos chegar a uma concluso que nos leve a rejeitar H0 ou no rejeitar H0. A hiptese alternativa a afirmao que deve ser verdadeira se a hiptese nula falsa. Note que H1 o oposto de H0. Por exemplo, se H0 dada como = 98,6F, ento a hiptese alternativa H1: 98,6F. Para a mdia, a hiptese alternativa comporta apenas uma das trs formas: H1: algum valor H1: > algum valor H1: < algum valor A hiptese nula verdadeira Erro Tipo I (rejeio de uma hiptese nula verdadeira) = nvel de significncia

A hiptese nula falsa

Decidimos rejeitar a hiptese nula Deciso No rejeitamos a hiptese nula

Deciso correta

Deciso correta

Erro Tipo II (no rejeio de uma hiptese nula falsa)

Exemplo 1: Um auditor deseja testar a hiptese de que o valor mdio de todas as contas a receber em uma dada empresa R$ 2.600,00, tomando para tanto uma amostra de n = 36 e calculando a mdia amostral. Ele deseja rejeitar o valor hipottico de R$ 2.600,00 somente se tal valor for claramente contraditado pela mdia da amostra, sendo que, desta maneira, dado ao valor suposto o benefcio da dvida. As hipteses nula e alternativa para este teste so H0: = 2600 e H1: 2600 Etapa 2: Especificar o nvel de significncia a ser utilizado O nvel de significncia o padro estabelecido especificado para rejeitar a hiptese nula. Se especificado um nvel de significncia de 5%, a hiptese nula rejeitada somente se o resultado da amostra to diferente do valor suposto que uma diferena igual ou maior ocorreria por acaso com uma probabilidade mxima de 0,05. Observamos que, se for utilizado um nvel de significncia de 5%, existe uma probabilidade de 0,05 de rejeitar a hiptese nula sendo a mesma verdadeira. Este o chamado Erro Tipo I. A probabilidade de Erro Tipo I sempre igual ao nvel de significncia utilizado como padro para rejeitar a hiptese nula; ele representado pela letra grega maiscula , sendo que , deste modo, representa o nvel de significncia. Os nveis de significncia mais frequentemente utilizados em testes de hiptese so os de 5% e 1%. Etapa 3: Selecionar a estatstica de teste. uma estatstica amostral, ou um valor baseado nos dados amostrais. Utiliza-se uma estatstica de teste para tomar uma deciso sobre a rejeio da hiptese nula.
Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

82

Teste de significncia para a mdia com 2 conhecido.

Neste teste H0: = c e o melhor estimador para x . A distribuio amostral das mdias normal, com x z=

Teste de significncia para a proporo p . A distribuio amostral das propores normal, com p z= (1 ) n

O melhor estimador de

Observao: Quando no se conhece o desvio padro populacional, deve-se estim-lo a partir dos dados amostrais usando o desvio padro amostral. Quando isto ocorrer (na maioria das situaes reais X desconhecido), a distribuio t a distribuio amostral mais adequada. Na prtica, entretanto, s se exige o uso da distribuio t quando o tamanho da amostra igual ou inferior a 30, pois, para maiores valores do tamanho da amostra, os valores de t e z so aproximadamente os mesmos. Etapa 4: Estabelecer o valor crtico ou valores crticos da estatstica do teste. Regio crtica o conjunto de todos os valores da estatstica de teste que levam rejeio da hiptese nula. O valor crtico o valor (ou valores) que separa(m) a regio crtica dos valores da estatstica de teste que no levam rejeio da hiptese nula. Os valores crticos dependem da natureza da hiptese nula, da distribuio amostral principal, e do nvel de significncia . Etapa 5: Tomar a deciso. O valor esperado da estatstica comparado com o valor crtico (ou valores) da estatstica de teste. A hiptese nula , ento, ou aceita ou rejeitada. Se a hiptese nula rejeitada, a hiptese alternativa aceita. Exemplo 2: Suponhamos que, sob determinada hiptese, a distribuio amostral de uma estatstica S acuse distribuio normal com mdia s e desvio padro s. Ento a distribuio da varivel padronizada Z = (S - s)/ s a distribuio da varivel padronizada (mdia 0, varincia 1) , conforme mostra a figura.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

83

Tal como indicado na figura, podemos ter 95% de confiana em que o escore z de uma estatstica amostral S esteja entre 1,96 e + 1,96. Todavia, se, na escolha de uma nica amostra aleatria, verificamos que o escore z est fora do intervalo de 1,96 e +1,96, poderemos concluir que o evento ocorreria com probabilidade de apenas 0,05 (rea total sombreada na figura) no caso de a hiptese formulada ser verdadeira. Diramos ento que o escore z difere significativamente do que seria de esperar sob a hiptese formulada e, assim, estaramos inclinados a rejeitar a hiptese. A rea sombreada, 0, 05, o nvel de significncia do teste. Representa a probabilidade de erro na rejeio de uma hiptese, isto , a probabilidade de um erro tipo I. Dizemos ento que a hiptese rejeitada ao nvel de significncia de 0,05, ou que o escore z da estatstica amostral significativo ao nvel de 0,05. O conjunto de valores dos escores z exteriores ao intervalo de 1,96 a 1,96 constitui o que se chama regio crtica, regio de rejeio da hiptese ou regio de significncia. O conjunto dos escores z interior ao intervalo de 1,96 a 1,96 poderia ento ser chamado de regio de aceitao da hiptese ou regio de no significncia. Exemplo 3: A vida mdia de uma amostra de 100 lmpadas fluorescentes fabricadas por determinada companhia de 1570 horas, com desvio padro de 120 horas. Se a vida mdia de todas as lmpadas fabricas pela companhia, teste a hiptese = 1600 horas contra a hiptese alternativa 1600 horas, utilizando um nvel de significncia de (a) 0,05 e (b) 0,01. Soluo: H0: = 1600 horas H1: 1600 horas Aplicando a frmula ao lado, calculamos o z. z = (1570 1600) 120/100 Obtemos z calculado = -2,5 (a) Ao nvel de 0, 05, o z tabelado compreende o intervalo de 1,96 a +1,96. Como o valor calculado est fora desse intervalo, rejeitamos H0 ao nvel de significncia de 0,05. (b) Ao nvel de 0, 01, o z tabelado compreende o intervalo de 2,58 a +2,58. Como o valor calculado est dentro desse intervalo, aceitamos H0 ao nvel de significncia de 0,01.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

84

Exemplo 4: Um auditor deseja testar a hiptese de que o valor mdio de todas as contas a receber em uma dada empresa R$ 2.600,00, tomando para tanto uma amostra de n = 36 e calculando a mdia amostral. Determinar os valores crticos da mdia da amostra para testar a hiptese a um nvel de significncia de 5%, dado que se conhece o desvio padro das contas a receber: = 430,00 reais. Portanto, para rejeitar a hiptese nula, a mdia da amostra deve ter um valor menor do que R$ 2.459,53 ou maior do que R$ 2.740,47. Ento, existem duas regies de rejeio no caso de um teste bilateral. Em lugar de estabelecer os valores crticos em termos de mdia da amostra como tal, os valores crticos nos testes de hipteses so tipicamente especificados em termos de valores z. Quando o valor da mdia da amostra estiver determinado, ele ser transformado para um valor z, de modo a poder ser comparado com os valores crticos de z.

Centro de Cincias Exatas e Tecnologia Prof. Daiane Scopel Boff, Ms.

85