Você está na página 1de 61
ESTATISTICA indutiva Teoria Exercicios Resolvidos Exercicios Propostos Tarefas Mirtes Vitoria Mariano Christiane Mazur Lauricella Alexandre Daliberto Frugoli INDICE 1 = INTRODUGAO. 1 1.4 - ESTATISTICA INDUTIVA 2 TAREFA 1 3 2~ AMOSTRAGEM. 5 2.1 ~ DEFINIQOES. § 2.2 - AMOSTRAGEM PROBABILISTICA 25. TEGNIGAS DE AMOSTHAGEM PROBABLISTICA $ 2.4 DADOS DE UMA AMOSTRA 2.5 — EXERCICIOS PROPOSTOS. —'o TAREFA 2 13 3 - CORRELAQAO LINEAR E REGRESSAO LINEAR. 18 3.1 - CORRELACAO LINEAR, 15, 3.2- REGRESSAO LINEAR 22 3.3 - EXERCICIOS RESOLVIDO: 27 3.4 - EXERCICIOS PROPOSTOS. 32 TAREFA 3 37 4 ESTIMATIVA DE PARAMETROS, 41 4.1 DEFINIQOES. a 4.2 - DISTRIBUIGAO AMOSTRAL 41 4.3 - TEOREMA DO LIMITE CENTRAL. 42 4.4 - ESTIMAGAO PONTUAL. 8 4.5 - ESTIMAGAO POR INTERVALOS. 4.8 - INTERVALOS DE CONFIANGA | AWEDIA, 44 4.7 - TAMANHO DA AMOSTRA, 413. INTERVALOS DE CONFIANGA PARA A NEDIA__—‘s 4.9 - INTERVALOS DE CONF. PARA A VARIANCIA EO DESVIO PADRAO__* 410 - EXERCICIOS RESOLVIDOS, 55, 4:11 - EXERCICIOS PROPOSTOS, 58 TAREFA 4 et 5 - TESTES DE HIPOTESES. 63 5.1 — INTRODUGAO_ £3 5.2 EXEMPLO DE APLIGAQKO 00 TESTE DE HIPOTESE. 5.9. TESTE DE HIPOTESE PARA MEDIA DE UMA POPUAGIOM GRANDES (GRANDES AMOSTRAS (N30), 5.4. TESTE DE HIPOTESE PARA UNIA POPULACKO NORMAL (N=30)__ “hs 5.5. TESTE DE HIPOTESE PARA MEDIAS DE DUAS POPULAGOES__—— 56 - EXERCICIOS PROPOSTOS. 28 TAREFA 5 89 9. TESTE DE QuLOUADRADOE TeSTER__os 6.1 - TESTE DE QUI-QUADRADO. 8.2. TESTE DE GUI QUADRADO ~ADERENGIA 3 6.3 - TESTE DE QUI-QUADRADO - INDEPENDENCIA_____96 6.4- TESTE F 700 6.5- EXERCIGIOS RESOLVIOOS, 102 6.8 - EXERCICIOS PROPOSTOS, 106 TAREFA 6. 109 T-ANALISE DE VARIANGIA tt 7.1- OBJETIVO. 413 7/2 - PRE-REQUISITOS PARA A APLICAGAO DA "ANALISE DE VARIANGIA 113 73> METODO DA ANALISE DE VARIANGIA__—— 113 7.4-EXERCICIORESOLVIDO§ 119 7'5 EXERCICIO PROPOSTO. 124 TAREFA 7, 127 1. Introducio, ‘A Estatistiea € uma subdivisio da Matemética que trata da coleta, ‘organizagdo, andlise e interpretagdo de dados com a finalidade de auxiiar na tomada de decisdes. Ela pode ser classificada em Estatistica Deseritiva, «que se ocupa da organizagio e descrigdo dos dados, e Estatistica Indutiva, que cuida da andlisee interpretagio de dados. Para estudarmos a Estatistica Indutiva, devemos primeiramente organizar (0 dados de uma amostra pelos conhecimentos obtides em Estatstica Descritiva. Outro fator importante é a amostragem, jé que muitos erros conclusies no satsfatrias ocorrem pela escolha de uma amostra indevida. No semestre anterior, tratamos de Estatistica Descritiva e Probabilidades. Neste texto, abordaremos os estudos da Amostragem e da Estatstica Indutiva, Indutiva Estatistica 1.1. Estatistica Indutiva. Definigao: Estatistica Indutiva é a parte da Estatist utiizados para a obtengio de conclusdes sobre uma populacio, segundo informagdes oriundas de uma amostra da populagao, que se ocupa dos métodos Geralmente, em uma pesquisa, no é possivel realizar o levantamento de todos elementos de uma populago, ent#o nos limitamos a analisar 0s dados de uma parte desta populagio, denominada amostra Para o desenvolvimento do assunto, necessitamos de dois conceitos que so de fundamental importancia: o de populago ¢ 0 de amostra, Populago € o conjunto completo de todos os elementos que constituem o sistema em estudo, Ou seja, 0 conceito de populagdo inclui a totalidade de medigdes, resultados, observagGes ou outros itens considerados em determinada andlise estatstica Amostra é um subconjunto de uma populacao. Exemplo: Podemos estar interessados em verificar a qualidade das pegas fabricadas por uma méquina. No entanto, como nio € possivel verificar todas as pegas, utilizamos apenas uma parte das pecas e fazemos a andlise desejada, No caso descrito acima, a populacio é toda a produgdo da méquina ¢ a amostra é constituida por apenas uma parte das pegas fabricadas. Mas ‘como sao escolhidas essas pegas? No proximo capitulo, mostraremos algumas técnicas para obtengio de uma amostra Tarefa 1: Introdugio. Nome: Naimero: Turma: Curs 1. Defina Estatistica. 2, Defina populagdo e amostra. 3. Diferencie Estatistica Indutiva de Estatistica Descrtiva, 4, Conforme foi visto em Estatstica Descritiva, escreva trés medidas de tendéncia central 5. Conforme foi visto em Estatistica Descritiva, escreva trés medidas de dispersio, 2. Amostragem, ‘Suponha que estivéssemos interessados em conhecer o grau de instrugo os habitantes do Estado de Sio Paulo. Assuma que os dados coletados fossem relativos a uma amostra de 400 moradores de regises com dificil acesso a uma escola ou a uma Universidade, Logicamente, esta amostra nio é representativa de toda populago do Estado de So Paulo. Assim, a média calculada com a amostra de 400 alunos ndo seria confidvel, podendo-se dizer que se trata de uma amostra tendenciosa, Uma amostra deve ser representativa, devendo apresentar as_mesmas caracteristicas da populago no que diz respeito ao que esté sendo analisado, Dependendo do critério usado ao selecionar-se os elementos que consttuirio a amostra, a pesquisa poders ser totalmente prejudicada e as conclusdes finaisestardo incorretas. 2.1. Definigies, Amostragem é uma técnica de selego de uma amostra que possibilita 0 estudo das caracteristicas de uma populagao. Erro Amostral € 0 erro que ocorre na utilizagZo de uma amostra. 2.2. Amostragem Probabilistica, ‘A amostragem probabilistica ¢ a técnica de selegdo de uma amostra na qual cada elemento da populagdo tem probabilidade conhecida, diferente de zero, de pertencer & amostra ‘A utilizagdo de uma amostragem probabilistica garante a representatividade dda amostra, 2.3, Técnicas de amostragem probabilistica. ‘© Amostragem Aleatoria Simples. Em uma amostragem aleat6ria simples, todos os elementos da populagdo tém a mesma probabilidade de serem selecionados. Para esta técnica, podemos utilizar © sorteio lotérico, uma tabela de riimeros a0 acaso, etc Exemplo: Suponha que desejéssemos obter uma amostra aleatria simples de 20 pessoas em um grupo formado de 200 pessoas. Podemos usar a seguinte téenica: escrever niimeros de 1 a 200, colocé-los em uma uma e pedir para alguém retirar 20 destes papéis da uma. Teremos assim uma amostra aleatéria simples, ‘+ Amostragem Estratificada. E uma técnica que utiliza a separagio da populagdo em estratos. Em cada estrato, deve haver menor variabilidade possivel ¢, entre os estratos, deve ocorrer uma grande variabilidade. Os elementos que constituirdo a amostra so retirados dos estratos, podendo ser retirada uma mesma quantidade de cada estrato ou uma ‘quantidade proporcional ao tamanho de cada estrato, ‘© Amostragem por Conglomerados. Quando a populagio apresenta uma subdivisio em pequenos grupos, chamados de conglomerados, € conveniente fazer uma amostragem pelo sorteio de um nimeto suficiente destes conglomerados, cujos elementos. consttuirlo a amostra, As unidades de amostragem, sobre as quais é feito 0 sorteio, passam a ser os conglomerados e no mais os elementos individuais da populagao. ‘* Amostragem Sistematica. A amostragem € denominada sistemética quando os elementos da populagio apresentam-se ordenados ¢ a retirada dos elementos da amostra é dada por um determinado perfodo, Exemplo: Em uma produgao diéria de pegas automotivas, podemos, a ‘cada 20 pegas produzidas, retirar uma para pertencer a uma amostra da produgio de um dia. 2.4. Dados de uma amostra. Para a descrigio de um conjunto de dados, retiramos uma amostra da populagio da qual temos interesse. ‘Vamos, a partir de agora, supor que todas as amostras foram retiradas por meio de técnicas probabilisticas ¢ por amostragem aleatéria simples. 44 vimos que, para o estudo da Estatistica Indutiva, primeiramente devemos corganizar e deserever os dados, segundo os conceitos da Estatistica Descritiva. Embora a média, a varidncia e o desvio-padrio j4 tenham sido cestudados anteriormente, vamos fazer uma breve recordago, lembrando ‘que agora teremos amostras. Média Amostral (x) Dados isolados Dados agrupados ‘Varidncia Amostral (s*) Dados isolados | — Dados agrupados Sex -¥? Yo, os) Desvio-Padrio Amostral (3) Dados isolados Dados agrupados So-8 Observacdo: Note que a varidncia e 0 desvio-padrio da amostra sio calculados dividindo-se a somatéria dos quadrados por n-1, pois usando lum valor menor no denominador, aumentamos 0 valor do quociente e obtemos uma estimativa mais préxima do valor verdadeiro. 8 Exemplo: Determinar a média € 0 desvio-padrio da amostra 5,10, 12, 15 18. a Se10412415018 5 2 ye (212) + (1512) +0 ot 2) (8 af _ 8 «(Bosse Exemplo: Determine a média e a variéncia para a amostra representada na tabela abaixo: x] is] 2 2 | 4 3 7 30 | 2 3 | 5 x fo] xt] aa)? | 00, 15 | 2 | 30 | (s-26"| 242 20 | 4 | 80 | 20-26)" | 144 25 | 7 | 175 |as-26"| 7 30 | 2 | 60 | ao-26*) 32 35 | 5 | 175 [(es-26| 405 total | 20) 520 330 Exemplo: Determine a média ¢ o desvio-padrio da amostra para a tabela ~ classes | freqiiéncias de dados agrupados em classes de freqiiéncias. eT 3 classes] freqiéncias eR 4 20-25 3 REA 6 25-30 3 TER 7 30-35 8 3E37 3 35-40 4 37a 3 ras 6 4550 4 Determine: 4) a média amostral; lasses | freqléncias | Ponto xh ) 0 desvio-padrio amostral médio Resposta: ¥=265em e s=79em Wr IS 3 25 112.5 | 781.25 230 3 m5 B25 | 168,75 2. A seguir, temos uma amostra dos salirios, em reais, de 8 funcionétios de 30F35 8 325 260 30 ‘uma empresa de seguros: 3540 4 375 150 5 600 [680 [700 [720750 800 [820 | 898 ar as 6 BS | 255 357.5 451-50 4 a5 190 05 Determine: ‘oral 30 1050 | 1987.5 8) a média amostral; a varidncia amostal Resposta: X=746 reais e s* =8568 reais? 2.5. Exercicios Propostos. 1, Em uma amostra de 30 medigdes do didmetro exteno de uma engrenagem, obtivemos a seguinte distribuigdo de valores, em cm: ‘Tarefa 2: Amostragem Nome: Niimero: Tura: Curso: ‘Turno: |, Defina Amostragem. 2. Quais sd0 0s tipos de amostragens probabi 3. Por que a amostra deve ser representativa da populagiio? classes | freqiéncias 4, Calcule a média e o desvio-padro da amostra: 12, 15, 16, 18, 20, 22, 24 e 25. Respostas: ¥=19 e $= 457 5. Uma amostra apresentou a seguinte distribuigdo de freqiéncias 2r6 6r10 E18 ‘1822 22% | 6 7 3 TOF 14 10 8 7 Calcule a média © variancia Respostas: ¥=195 € s? 32 jo Linear e Regressiio 341. Correlagio Linear. 0 “Novo Dicionério Basico da Lingua Portuguesa — Aurélio” apresenta as seguintes definigdes para a palavra corelagdo: 1, “Relago mitua entre dois termos.” Pe Pe ualidade de correlative.” “orrespondéncia.” Em Estatistica, a correlagio & um parimetro que indica 0 “grau de correspondéncia” entre duas varidveis. Ou seja, a correlagdo mostra a “imtensidade” com a qual dois conjuntos de dados esto relacionados ‘mutuamente. ‘Assim, a correlagdo indica 0 comportamento conjunto de duas variéveis. Podemos utilizar a correlagdo para responder questdes do tipo: ¥ O salério de um trabalhador esté relacionado com a escolaridade do mesmo, ou seja, em que grau a varidvel “salério médio de um trabalhador” esté “ligada” com a varidvel “escolaridade do trabalhador”? YA quantidade de livros que uma pessoa jé leu esté relacionada com sua escolaridade? ¥ Em que grau o peso de uma pessoa esté relacionado com sua altura? ¥ A cestatura de uma pessoa esté relacionada com sua alimentaglo? Podemos verificar 0 quanto duas varidveis estio relacionadas entre si seguindo uma fungo do 1° grau (relagdo linear), ou seja, podemos calcular lum pardmetro que indique a “correlagao linear” entre as duas variéveis. Is Inicialmente, estudaremos um caso de “correlacio linear perfita”, denominado de exemplo 1, que dificilmente serd observado em situagdes “experimentais". No entanto,€ interessante que o estudemos a fim de fixar 60s conceitos envolvides e praticar 0s cculos necesséios. Tabela 3.1: Exemplo 1 - “Correlagdo Linear Perfeita” x 0 T 2 3 a 3 0 3 6 9 2 15 A tabela 3.1 indica as correspondéncias: “x;=0 com yi=0", “xa ""xse4 com ys=12" e “xy=5 com yi53", 522 com ys=6", "Xe=3 com ye yerl5”, A tabela 3.2 mostra o procedimento preliminar para 0 célculo da correlaglo: listar os valores de x, yi, x? (x: elevado ao quadrado), yi? (yi elevado a0 quadrado), x.y; (produto de x; por y), Tx, (somatéria de x, ou seja, xy+xs4xs4XetXs+Xe para 0 exemplo em estudo), Sy (somatéria de y.), Ex? (somat6ria de x, elevado a0 quadrado), Sy? (somatéria de y, elevado a0 quadrado) e x,y, (somat6ria do produto de x, por 9). ‘Tabela 3.2: Procedimento para célculo da correlagio ~ exemplo 1 % % x ¥ i 0 0 Or=0 oO O.=0 1 3 aret [| GF=9 (1.3) =3 2 6 Qed P= | @.OG=12 3 9 OF=9 Oss | OO=7 4 2 | @i=16 | cars | @c2=48 5s | @r=25 | (5)"=225 | G).(15)=75 Ens 15 | En=45 | Ea7=55 495 | Ixy = 165 16 Lembrando que: Dry O14 3S Dy = 0434649412415 = 45 Tx = 0414449416425 = 55 Dy? = 049436+81+1444225 = 495 Ixy }+34+12427+48475 = 165 ‘A medida para 0 grau de correlagdo linear entre duas varidveis é 0 coeficiente de correlagio de Pearson (conhecido como coeficiente de ccorrelagiio linear), indicado por “r”, ealculado por: conde n representa o nimero de pares de dados em estudo (no caso do exemplo 1: n=6). Para o exemplo 1, temos: 5.145) 990-675 315 Yless—a5 6495-43) 330~225).2970—2025) Ji05.945 315 Quando o valor de + € 1, significa que as varidveis em estudo estio perfeitamente relacionadas, ou se, se fizermos um diagrama de dispersdo (epresentagio cartesiana de um conjunto de dados), a distribuigdo dos Pontos experimentas “Segue” exatamente uma reta, conforme ilustrado na figura 3.1. Diagrama de dleperséo -exemplo 1 Figura 3.1: Diagrama de dispersdo ~ exemplo | Os possiveis valores de corelagio linear variam de -1 a 1, ov seja-1SrS1 Podemos proceder & seguinte classificagdo: 00: correlagio negativa perfeita .75: correlagdo negativa forte. 50: correlagao negativa média, ),25: correlagio negativa fraca. ,00: correlagao linear inexistente, 25: comelasio postivafraca + r= 40,50: comelagio postiva média, + = 40,75: comelagio postiva forte. ++1,00: correlagao positiva perfeita, Na correlagio positiva, as varidveis em estudo alteram-se no mesmo sentido (se uma variével “aumenta”, a outra varidvel também “aumenta” ou se uma variével “dimin @ outra varidvel também “diminui”), Na correlagdo negativa, as varidveis em estudo alteram-se em sentidos opostos (se uma varigvel “aumenta”, a outra varidvel “s0 20 10 Observe que, neste caso, trata-se de uma correlagio linear negativa (0 coeficiente de correlagao linear é um mimero negat “quando a variével x aumenta, a varivel y diminui”). 34, Exercicios Propostos. 1. A tabela a seguir mostra os pesos (em kg) € as respectivas alturas (em cm) de uma amostra de 8 alunos da turma de calouros do curso de Fisioterapia de uma Universidade. Pedem-se: 8) 0 coeficiente de correlagio linear € a equagio da regressdo linear; ») o diagrama de dispersdo e grifico da equagéo de regressio linear. 2 ‘xz Peso (emkg) | yi Altura (em em) 35 163 38 167 60 167 5 172 06 173 70 174 7 175 74 177 Respostas: a) 0,98 & y*=0,69.x,+ 126,29) vide grfico eso a) 2. Um pediatra pesquisou uma amostra de 10 mies que frequentaram seu consultério no més passado, Tabulou as idades das 10 mies eas idades de seus filhos primogénitos, conforme apresentado a seguir. Pedem-se: 8) 0 coeficiente de correlagio linear & a equagio da regressfo linear; ') 0 diagrama de disperso eo grfico da equago de regresso linear. 3 7x7 Idade da mae (anos) | yr Idade do primogénito (anos) ig T 20 oy B 3B 7 30 3 35 % Respostas: 2) 0,94 & y*=0,49.x,-844 —_b) vide grafico ade do primogdnito (anes) ee a ae da mae (anos) 3. Um estudante de Engenharia realizou experimentos nos quais variava a forga resultante F (em N: “Newton” ~ unidade de forga) que atuava em um loco © verificava a aceleragdo a (em mis’) adquirida pelo mesmo, conforme apresentado na tabela a seguir. Pedem-se: 4 8) 0 coeficiente de correlaglo linear ea equagdo da regressao linear; 8) 0 coeficiente de correlagao linear e a equago da regressio linear; ») o diagrama de dispersio eo gréfico da equasio de regresso Tinea ') 0 diagrama de dispersio ¢ o grfico da equagao de regressio linear. : = 2 . . : . z¢ 0 fe *. fe i: i: e a dado (anos) 4. A tabela a seguir resume alguns dados de idade da pessoa e sua expectativa de vida, concluidos a partir de uma pesquisa realizada com certa comunidade, Pedem-se: 35 36 ‘Tarefa 3: Correlagio Linear e Regressio Linear. Nome: Turma: ‘Turno: 1. A tabela a seguir mostra os resultados de uma pesquisa que apreciou o peso de um veiculo (em ton) ¢ o mimero médio de pegas defeituosas que tiveram de ser repostas no primeiro ano de uso do automével. Pedem-se: 4) 0 coeficiente de correlagdo linear a equacao da regressio linear; 'b)o diagrama de dispersio e 0 grfico da equagao de regressio linear. Pi: Peso do vefculo (ton) [Nj Numero de pegas defeituosas 700 2 Tas 3 730 3 Ts 7 00 10 Tas TT 20 = Respostas: a) 098 © N¥ 00P,-614 _b) vide grafico 1" 6 2 10 e Ne pages detetuosas 0s eso do automével on) 37 2. A tabela a seguir mostra os resultados de uma pesquisa realizada durante ‘0 més de julho em um hospital pediétrico na qual foram apreciados: temperatura média do dia e nimero de atendimentos de casos de problemas respiratérios. Pedem-se: 4) 0 coeficiente de correlago linear a equagHo da regressio linear; ) 0 diagrama de dispersio ¢ 0 grfico da equagio de regressio linear. FT: Temperatura média °C)]__ Nj Casos de problemas respirat6rios 7 ry 7 26 7 2 5 D 17 @ 1s 16 wm ry 2 e 2 e Respostas: a) 0,94 & N* 73.7; +4609 b) vide eritico r #” > $s hs Eo 4 is 7 bo 5 a 6 Pa 2 Temperatura mia (©) Estimativa de parametros. 4 Definigies: Parimetro: Medida usada para deserever uma caracteristica numérica populacional, Exemplos de pardmetros populacionais: média (representada por 1), varidncia (representada por 0) ¢ desvio-padrio (representado por ©). Estatisticas da amostra: © estimador de um pardmetro populacional € ‘uma caracterfstica numérica determinada na amostra. Exemplos de parimetros amostrais: média amostral (representada por ), variéncia amostral(representada por s*) ¢ desvio-padtdo amostral (representado por 8), Se retirarmos aleatoriamente de uma populagio todas as possiveis amostras, cada uma de tamanho n, caleularmos a média de cada amost (x) €, em seguida, calcularmos a média das médias das amostras, esta seré igual 8 média da popwlagio (.). A média da amostra X 6, entio, uma estimativa ndo tendenciosa de w. 4.2. Distribuigio Amostral. © problema da Estatica Indutiva é 0 de fazer afirmagSes sobre os parimetros da populagio a partir de estatstcas obtidas de amostas da opulaso Os valores da média amostral © do desvio-padrdo amostal difclmente serio iguais a0s valores da. média populaconal © do. desvio-padrio populacional, respectivamente, a Quando selecionamos aleatoriamente vérias amostras de tamanho n da popullagio, os valores da média e do desvio-padrio calculados estaréo distrbuidos em tomo de valores verdadeiros para populagio, Selecionando aleatoriamente todas as amostras com mesmo tamanho n desta populagio e calevlando uma esttstica ¥ ov uma estatistica s para as amostras, podemos consinir uma distibuigdo de probabilidades da estatistica, Essa distribuigdo é chamada de Distribuigdo Amostral OBSERVACOES: 1A média das médias das amostras ¢ igual média da populagio, 1 = 2. © desvio-padrio das médias das amostras ¢ igual ao desvio-padrio populaciona vid pela iz quatraa den 0; = & © desvio-padriio da distribuigo amostral de mé denominado erro padrio da média, jas das amostras é 4.3, Teorema do Limite Central Quando sto retiradas amostras (com 30 ou mais elementos) de uma opulagio qualquer, a distribuigo amostral das médias das amostras teré ‘uma distribuigao aproximadamente normal, mesmo quando os dados da populacio nao forem normalmente distribuidos Devemos observar que quanto maior o tamanho da amostra, melhor seré a aproximagio. 2 4.4, Estimagio Pontual. ‘Uma estimativa pontual uma estimativa de um Gnico valor para um parimetro populacional. Por exemplo, a média amostral (x) € uma cstimativa pontual para « média populacional (1) 4. Estimagio por Intervalos. Definigbes: Estimativa Intervalar: é um intervalo usado para estimar um pardmetro populacional. Nivel_de_confianca: ¢ a probabilidade de que intervalo estimado contenha o parmetro populacional. Como jé foi mencionado, conforme o teorema do Limite Central, se n230, 4 distribuigdo amostral das médias 6 uma distibuigio normal. (© nivel de confianga ¢ € a érea sob a curva normal reduzida, entre 0s valores criticos ~2,¢ 2 4.6 Intervalos de confianga para a média (amostras grandes). Considerando um nfvel de confianga c, a margem de erro E € a maior distincia possivel entre a estimativa pontual ¢ o valor do parimetro a ser estimado, A formula usada para o céleulo desse erro é: E=2,-% Observacdo: Quando n230, 0 desvio-padrio amostral s pode ser usado no lugar do desvio-padrao populacional «. ‘Um intervalo de confianga c para a média populacional y € dado por: KE cpexsE Podemos dizer que a probabilidade de que 0 intervalo de confianga contenha a média populacional u 6c. Exemplo: Uma amostra aleat6ria de 36 elementos retirados de uma populagi0 aproximadamente normal formeceu média de X=1550 e desv padrio de 1,50, Constrir um intervalo de 95% de confianga para a média dessa populagao. Resolugdo 95% 04750 [Na tabela da distribuiga0 normal reduzida, encontramos 2,=1,96. (an 308 oaost am 0308 (ee 3a OamtS ease OKs asm 03501 oasst 03677 o3to0 arm oar ogre ear 03810 Damm ans daion Gate? O42 Ds O.cos oasis easzs Encontramos o erro maximo uatilizando a formula s 15 E196 = 049 E=2, 5, pois n290 e028 185-0491), AS propriedades da distribuigdo qui-quadrado so: LA listribuigdo qui-quadrado 6 uma familia de curvas, onde cada uma dessas curvas é determinada pelo niimero de graus de liberdade. Quando uusamos a distribuigo 2 para estimar a variéncia populacional, 0 iimero de graus de liberdade é igual ao tamanho da amostra menos 1 (g.=n-1). 2..A direa sob cada uma das curvas € igual a um. Para encontrarmoso interval de confianga para a varia, primeiramente devemos encontrar 0 valor de ,¢ x3,na tabela de distbuigdo qui quadrado. Calculamos @, ye e, conforme 0 grau de liberdade, encontramos 0 valor de 22,0 tbel ay Calculamos a, ="42 e, conforme o grau de liberdade, encontramos 0 valor de 2, na tabela, Exemplo: Encontrar x5,¢ x3, para gl = 15 com 90% de confianga. 1-090 _ 37005 14090 2 15,=24.996 3 ‘ops [ass [ons | oss0[ a [ oo [os [amas {ont [apo r ‘001 a008 Enos [Saat — [Sars [ets — [89 2 fama —[ of o0si— [aos ‘asf oor [7378 [92100307 3am fois foaie— assy 2s 7ais 19348 [11.5 [oan [9297 oase— [ont | hoe 7.79— [ose 1 ee [13277 | 8, Tos osse_osst ‘61d [9.2%6—P iam 1283[ 15.086 18750 [ast —fosn [2m 22s ings [125924405612 Tae 7 [ases [1239 2ais_[ 017 [ 1067 [soi [1847s iat [ts 273s [S490 inet [isa P7535 [ooo | 2.985 opis [ae Sms [46s st _[re919 [19.005 7.666 [23.99 To s6— [ssh 207 Iga Te hr 30.683 [2.209 25 i} 203 [5053 [5.56 ars [inns a19a0_[ ak 725 | 26787 1a [30n_[asn1_[ aor 18549_[ 21.006 [23357 [20217 | 2899 To] 3868-4107 [58 9si2_[ 23362 [24 736_[ 798809 1s [sons [3.09 Bites [23685 [6.119 Po.tat_31,09, 1s] 401 [5209 [e00 ‘an _[ 24996 | >| 90.578 [807 Te-[ Sia2—[sa12 [6908 {nis [2g295 pass | 000 3267 ir [ 597 aos_[ 7560 29 [7581 90.91 [309 [a8 718 Te_[6265 | 7015 [Rast 25959 | 2h | 5.8 [ 80s 7.186 To[eset [7933 [RT rai sted sess 601 ai rast[a260_[ 9.91 2kaid | 1A10 | 34,170 [ 37.366 HT 21s [397 toes Bais_[aon1 [354 | 389321 Or 2} set [9.542 rose ‘sosis [90 sor 23926210196 [1.689 Sao [s5172 | age aloe [ak 24] sane [1056 12401 3195 [seats 9. [2.980 [a8 555 2s_finsxo | 11s9e [13.00 Suse [37682 [ate [ease ae28 26h | Sse [was [signs [Be [8200 [Une [129 [tas Sra [aR 8 es ae [ast_ [1.565 13308 Sioie_[a1337 [61 So. 25 [ix tat 1457 | 16047 Seer [0557 [ag 236 S0_[ixrar [14954 16791 286 [43773 | 40979 | soa02 [rT [an 2.164 [24435 S1s08 | 5.958 9.4 [3.601 eT S| mga 907 [32.587 | shreH _| 37.69 [68 tL 7508 Test | 1950 OL SSSH | S7aRS | aL AIR] aoa99_[ 74397 [OR Bf g87 ToL skars_ as | 4814131709 | 9,399 [553790591 ooa2s_p 104215 ‘0[ 31 172_| 51540 s7.183-[ e301 | on [om =| 1079 1osea9_[ 11.309" 114, 21 5013519561756 6.6e7 [125 75291_[ tr ses [11845 [a6 3k t16 [1299 Too 67308] rhaes [razon 7929 [se Hee] ian 8s6r [8 a0T | WO Intervalo de confianga para variincia populacional o@ ms? ga (ons? ay wee Intervalo de confianga para o desvio-padrio populacionala [o=0s* .,. [n-ns % ea Exemplo: Uma amostra de 15 elementos, extrafda de uma populacdo com distribuigao normal, forneceu variancia s* = 705. Construir intervalos de confianga de 95% para a varidncia e para o desvio-padrao populacionas. Temos enio 1, 26,119 © 13,=5,629 Assim, 0 intervalo de 95% de confianga para a varianeia populacional é (15-1708 5 _(15-1)7.05 2619 5629 378<0? <1753 ( imtervalo de 95% de confianga para o desvio-padrio populacional é: [US=W705 [50.705 \ 26119 V 5629 {878 <0 < i753 194<0<419 4.10, Exercfelos Resolvidos. 1. Uma amostra de 40 elementos, extraida de uma populagdo normal, fomeceu média amostral X=9556 ¢ desvio-padrio amostral de 6=350 Construa um intervalo de confianga de 99% para a média populacional. Resolugio: 40 ss 0.4950 Na tabela, temos z, =2575 350 75.95 = 142 a0 O imtervalo de confianga de 99% para a média populacional é: 9556-142 << 9556+ 142 34,14 <1<3698 2. Com os dadios do exemplo anterior, determinar o tamanho requerido de uma amostra para assegurar que, com confianga de 95%, a média amostral esteja dentro do intervalo de 1,0 da média populacional ©=0.95 Es 196.35)" 5 47 1 J* 2, =196 s=35 3. Uma amostra extraida de uma populagéo normal fomeceu os seguintes 36 [59 [60 [63 a) Um intervalo de confianga de 90% para a média populacional. ) Um intervalo de confianga de 90% para a variancia populacional e para © desvio-padrio populacional. Resolugio: 56 Desvio-padrio amostral: 4) A amostra possui 8 elementos (n -127 190 1, = 1895 1895.0.46 E oat ve 559-031< <559+031 528 <<590 Portanto, com 90% de confianga, podemos dizer que a média populacional esté entre 5,28 e 5,90. 005 095 wy=14067 © 23-2167 Inlervalo de confianga de 90% para a varineia populacional é: (e=n.046* 74067 O11< 07 <0,68 0 intervalo de 90% de confianca para o desvio-padrio populacional & [ie=n.046 _, . (@-n048* \ 74067 Vo 167 Ott << /068 033 <6<083 37 4.11 Exereicios Propostos. 1, Uma amostra de 80 elementos, extrafda de uma populaga0 aproximadamente normal cujo desvio-padrio € =2,8, fomeceu _média populasio. Resposta: 452 be ‘Ap6s a definiglo das duas hipéteses, nulaealtemativa, devemos tragar uma estratégia que nos permita dizer qual das duas € a verdadeira, precisamos estar aptos a dizer se acatamos a hipétese nula ou se a rejeitamos em favor 4a hipotese altemativa De uma forma resumida a estratégia € a seguinte, escolhemos uma amostra aleatéria da populagdo e fazemos uma comparagio com a hipétese mula, se 0s dados da amostra forem consistentes com esta, néo rejeitamos a hipstese nula, c3s0 ndo sejam consistentes rejeitamos a hipétese nula e assumimos que a hipétese altemativa é verdadeira, 5.2. Exemplo de aplicagio do teste de hipétese. ‘Uma empresa fabrica sabonetes de massa 90g. Para verificar se a maquina ‘que os produz esté calibrada corretamente, uma amostra aleat6ria composta por 50 sabonetes foi retirada ao longo de um dia. As massas dos sabonetes da amostra esti na tabela a seguir. 6 ‘Tabela 5.1 ~ Massas dos 50 sabonetes (gramas) m7 91 94 90 85 90 38 94 90 90 90 7 95 87 2 85 86 [sa 89 v1 Ea 36 ol 31 89 37 ~~«*iSO 89 or a7 [37 92 3987 [93 9497 90 88 89 86 91 88 89 89 [ur 93 8 51 90 Os dados da amostra permitem concluir que & maquina que produz os sabonetes est descalibrada? Use os seguintes passos para responder: a) Escreva as duas hipoteses para o teste de hipétese. by Discuta a idéia bésica para realizar o teste de hipstese. ©) Obtenha um crtério preciso para decidir se reeitamos ou ndo a hipétese nla 4) Aplique o critério e faga a conclusao. Solugao: Seja ja média de todos os saquinhos sendo empacotados, 48) As duas hipéteses podem ser escritas como: ) Basicamente, a idéia de realizar um teste de hip6tese € a seguinte: Se a hipétese nula & verdadeira (Isto é, se jt = 90 g), entdo a média, x, da amostra de 50 sabonetes deve ser aproximadamente 90 gramas. & natural que a média da amostra no seja realmente igual & média da populaciio, algum erro deve ser esperado. Entretanto, se a média diferir ‘muito do valor 90 entdo estaremos inclinados a rejetar a hipétese nula ¢ cconcluir que a hip6tese alternativa ¢ verdadeira. Da tabela de valores, podemos calcular a média da amostra 9.428 Ze. A questdo é se a diferenga de 0,588 entre a média da amostra e a média hiporética da populagio de 90g pode ser atribuida a um erro de amostragem ou se a diferenga é grande 0 suficiente para indicar que a média da populagdo nio é 90g. ©) O ctitério adotado foi o seguinte: Se a média x, dos 50 sabonetes coletados estiver mais de dois desvios padtio distante da média da populagao (90g), entio rejeite @ hipStese nula, 4 = 90g, e conclua que a hipétese altemativa, # 90g, € verdadeira. Caso contréio, nio rejite a hipotese nula Usilizando © Teorema do Limite Central, que nos diz que se amostra € grande (n 2 30) entio a variével aleatria x € aproximadamente normal com média e desvio-padrio dados por: aH A figura 5.1 ilustra a distribuigdo das médias das amostras oa | Figura 5.1 ~Distribuigdo normal das médias das amostras Com base neste fato podemos dizer, por exemplo, que a probabilidade da ~ média x estar em um intervalo de dois desvios padrées da média da populagdo jt € de 0.9544, ou ainda, que a probabilidade da média da amostra estar fora deste intervalo é de apenas 0,0456 (1 - 0,954), como mostrado na figura 5.1. Podemos usar este fato como um critério para decidir se devemos ou ndo rejeitar a hipétese nula, Especificamente, se a ‘média da amostra retirada da populagao estiver dentro do intervalo entio ‘podemos atribuir a diferenca encontrada a um erro de amostragem e, assim, aceitar a hipétese nula. Por outro lado, se a média da amostra estiver distante mais de dois desvios padres da média da populacdo de 90g, entdo podemos concluir que a hipétese nula é verdadeira ¢ um evento extremamente improvavel ocorreu durante a coleta da amostra ou que @ hip6tese nula é falsa (o que é muito mais razodvel) e que a hipétese alternativa é verdadeira. Na figura 5.2, isto é mostrado graficamente através das regives de rejeigao © ndo rejeigdo. 6 Rejeite Hy Nao rjeite Figura 5.2 — Regides de rejeiga0 [A probabilidade de rejeitar Ho € de apenas 0,0456, como pode ser visto na figura acima. Esta probabilidade € denominada nivel de significincia do teste de hip6tese. 4) Finalmente, aplicando o critério adotado aos dados coletados da amostra, podemos colocar nossa conclusio, Assumiremos que desvio-padrio da populaglo seja conhecido ¢ igual a o = 2,7 gramas. Para aplicar © critério da pare (c) necessitamos determinar quantos desvios padroes a média da mostra se desvia da média da populagéo. Isto ¢ feito determinando-se 0 valor da varidvel aleat6ria padrio: Sabendo que 6 = 2,7 gramas, n = 50 e, da parte (b), que a média da amostra 6 89,42 gramas, podemos calcular 0 valor de 2. o Como média dos 50 sabonetes encontra-se a menos de 2 desvios-padrio «da média de 90 gramas, decidimos accitar a hip6tese nula e concluir que a hipotese alternativa, w # 90 gramas, ¢ falsa. Em outras palavras, os dados proporcionam evidéncia suficiente para concluir que a méquina esté trabalhando corretamente Esse procedimento de decisio pode levar a uma conclusto equivocada que pode ser de dois tipos. Uma ocorre quando rejeitamos a hipétese nula © aceitamos a hipétese altemativa, porém erroneamente, pois a hipétese nnula era verdadeira, esse tipo de erro é chamado de erro tipo I. Também & possivel ocorrer de aceitarmos a hipétese nula quando ela é falsa, esse erro & denominado erro tipo II Tabela 5.2 ~ Resultados possiveis de um teste de hipétese. — Sinuagio verdadeira 'Decisio baseada na_ +H, é verdadeira +H, é verdadeira’ amostra (H, € falso) Rejeite Hy Rejeigao errada de Hy Decisio correta — (Ero tipo D io rete H Decisio corrta ] Retengio emada de H, (Erro tipo I) Nivel de significdncia: Ao testar uma hipétese, a probabilidade maxima de ocorrer um erro tipo Té denominada nivel de significincia do teste. Essa probabilidade, representada freqiientemente por a, 6 geralmente especificada antes da 70 extragio de quaisquer amostras, de modo que os resultados obtidos nio influenciem a escotha. Na prética, é usual a adogio de um nivel de significdncia 0,05 ou 0,01, embora possam ser usados outros valores. Se usarmos um nivel de signficancia 0,05 ou $%, avers entio cerca de 5 probabilidades em 100, da hipdtese nula ser rejeitada, quando deveria ser aceita, isto é, hé uma confianga de 95% de que a decisio tomada foi acertada Tabela 5.3 - Alguns valores de a. aos [003s Joo 0-008 ons mans (am Yeo 164s 1,96 2.33 2.515 5.3. Teste de hipétese para média de uma populagio - grandes amostras (n 2 30). Descrevemos a seguir um procedimento para apicagio do teste de hip6tese pra a média de uma populacao. Condigéo: O tamanho da amostra ¢ grande (n 2 30) Passo I - Esereva as hip6teses nulae alterativa Passo 2 - Defina o nivel de significincia 0. asso 3 - Determine 0(s) valor(es eritico(s) a) Para test bilateral 6 290 ») Para teste unilateral & esquerda & -2a ) Para teste unilateral &direita é 25 n Use a tabela da distribuigdo normal padrio, Dowie Rejste — Rejete , Novee Nowe Rejte He s mw a, A, “ _K, stn 0 tan “m0 0% Biel ‘Uniaral eagerd asin ce Passo 4 ~ Calcule o valor da estatistica de teste Passo 5 ~ Se 0 valor da estatstica de teste cair na regitio de rejeigio, ento rejeite Ha; caso contrério ndo rejeite Hy. Passo 6 ~ Dé sua conclusio, Exercicio Resolvido: Uma empresa de coleta de informagées verificou ‘que em 2003, o prego médio das refeigdes em restaurantes da cidade de Sao Paulo era de RS 2844, Neste ano realizou-se uma pesquisa em 40 restaurantes, aleatoriamente escolhidos, e foram obtidos 0s valores da tabela 5.4. Os dados fornecidos proporcionam evidéncia suficiente para concluir que 0 prego médio deste ano dos restaurantes da cidade de Sio Paulo aumentou com relagio & média de RS 28,44 de 2003? Realize o teste apropriado com nivel de significancia de 1%. n Tabela 5.4 ~ Prego médio das refeigdes (por pessoa) nos restaurantes de ‘Sao Paulo neste ano. 3] 37] 3 | 2% | 30] 32 | 30] 39 2 > |e | | o> ps) 39 | 25 | 28 31 36 | 32 | 26 | 4 3) 2 | 3 | 2 | a | 36 | 4 | 7 we | 2 | 32 | 36 | 2 34 | 26 | 2 Solugio: Uma vez que o tamanho da amostra & grande (n 2 30), podemos aplicar 0 procedimento descrito acima. Passo I - Escreva as hipsteses nula e alternativa O teste em questio seré do tipo unilateral a direita. Hy Hy: 1 >28,44 (0 prego médio aumentou) 8,44 (0 prego médio no aumentou) Passo 2 - Defina o nivel de significancia a. O nivel de significancia pedido 6 de 1%%, Assim a= Passo 3 - Determine 0(8) valor(es) eritico(s). Para 0. = 0,01, 0 valor eritico sera 2901. Da tabela 5.3 obtemos Zao = 24 seguir. Portanto, 0 valor critico é 2,33, conforme mostrado na figura a n NiorejeiteH, | RejeiteH, 1 Area deo aS 0 233 Figura 5.3 ~ Valor eritico para a= 0,01 Passo 4 - Calcule o valor da estatstica de teste ‘Sabemos que jio = 28,44 e n = 40, Calculando a média e o desvio-padrio dda amostra encontramos 31,75 ¢ 7.35, respectivamente. Assim, o valor da estatistica de teste €: 3175-28,44 285 sivn 7.35/40 Este valor de z esté marcado na figura 5.4 com uma marca preta préxima do valor 2,33 Passo 5 ~ Se o valor da estatistica de teste cair na regitio de rejeiso, entdo rejeite H,; caso contrério, ndo rejeite H,, valor da estatistica de teste encontrado & de 2,85. Como pode ser visto na figura 5.3, esse valor cai na regio de rejeigo e, assim, nés devemos rejeitar H, "4 Passo 6 — Dé sua conclusio. (Os dados proporcionam evidéncia suficiente para concluir que © prego :médio dos restaurantes da cidade de Sio Paulo aumentou com relag0 30 prego médio de 2003 5.4, Teste de hipétese para uma populagdo normal (n < 30). ‘Analisamos, no item anterior, como realizar um teste de hip6tese para a ‘média de uma populacio, yt, quando trabalhamos com uma amostra grande (a 2 30), Entretanto, em muitos casos nao € possivel ou nao & econdmico coletar uma amostra grande. Agora estudaremos um método que nio requer amostras grandes, porém requer que @ populago sendo amostrada seja rnormalmente distribuida. Como na maioria dos problemas nio conhecemos «© desvio-padirio da populagio (6), wilizaremos para a realizagio do teste 0 desvio-padrdo da amostra estudada (). J vimos no capitulo anterior que, se tomarmos uma amostra de tamanho n de uma populagdo normalmente distribuida com média yi, a varidvel aleatéria “ sin tem uma distribuigZo t com n-I graus de liberdade. Em outras palavras, as probabilidades para aquela varidvel aleat6ria sfo iguais as areas sob a curva 1 com GL -1. Conseqiientemente, quando a populago sendo amostrada 6 normalmente distribufda, n6s podemos realizar um teste de hipéteses com ‘a hipétese nula H,: = Hy, empregando a variével aleatéria acima como 8 nossa estat tica de teste usando a tabela da distribuigdo t para obter 0 valor ertico (ou os valores eriticos). Procedimento para aplicaciio do Teste de hipéteses para a média de ‘uma populagdo com amostras de tamanho n < 30, Condigdo: Populagéo Normal Passo 1 - Escreva as hipéteses nula e altemativa, Passo 2 - Defina o nivel de significdncia a. Passo 3 - Determine o(s) valor(es)eritico(s) 4) Para teste bilateral 6 taa >) Para teste unilateral & esquerda € ty 6) Para teste unilateral & direita € ta com GL = n-I, Use a tabela da distribuigao Refine Norse Rejete — Refete Moot Norte Rejte a . HH x aM, AS, tO tae «0 0 Bier Unita equerda Unilarl e Passo 4 ~Calcule o valor da estatistica de teste % Passo 5 — Se o valor da estatistica de teste cair na regido de rejeigio, entdo rejeite Hy; caso contrrio ndo rejeite He Passo 6 ~ Dé sua conclusio. Exerefcio resolvido: Assume que # média de gasto com combustivel de todas as familias de uma certa regido seja de RS 1123,00 em um determinado ano. Neste mesmo ano, coletando-se uma amosta aleat6ria de 15 familias de classe média alta obteve-se os valores mostrados na tabela abaixo, arredondados para o inteiro mais préximo, Com um nivel de significincia de 5%, os dados indicam que familias da classe média alta ‘stam, em média, em combustivel mais do que a média da regio de RS 123,00? Assuma que a distribuigio de gasto com energia das familias da classe média ata seja normalmente distribuida, ‘Tabela 5.5 ~ Gastos com combustivel (R$) 1354 [1350] 127] 1154] 1790 Tis | 1521 | 908 | 1231 | 1368 Ti | 1293 1205 1351 a Soluga ‘Uma vez que a populagao em questo é normalmente distribuida, podemos aplicar 0 procedimento abaixo para realizar o teste de hipsteses. Passo 1 - Escreva as hip6teses nula e alternativa, ‘O teste em questi serd do tipo unilateral & direita, Haw Hy > 1123 (a média é maior que a média nacional) 123 (a média ndo é maior que a média nacional) n Passo 2 - Defina o nivel de significdncia a. O nivel de significdncia pedido & de 5%. Assim a= 0,05. Passo 3 - Determine o(s) valor(es)eritico(s). valor crtico para um teste unilateral & direita 6 ta, com GL. caso, n = 15 ¢ GL = 15- 1,761. Veja figura 5.4. 1. Neste 14, com 0,05. Da tabela obtemos toxs = NiorejeiteH | Rejeite H, Figura 5.4 ~ Valor eritico para o. Passo 4 ~ Calcule o valor da estatistica de teste svn 5. Além disso, a média e 0 desvio-padrio 112Ben= Sabemos que ft dos dados constantes na tabela acima so 134,27 e 231, respectivamente. Consegiientemente, o valor da estatistica de teste é: fem, 13497-1123 svn 21/5 4710 * Passo 5 ~ Se o valor da estatistica de teste cair na regio de rejeigdo, entdo rejete Hy caso contrtio no rete H, 0 valor encontrado € igual a 3,710 eeste valor cai dentro da regio de rejeigdo, Assim, n6s rejeitamos Ho Passo 6 — Dé sua conclusao. (Os dados proporcionam evideéncia suficiente para concluir que familias da classe média alta gastaram mais com combustivel do que a média nacional. 5.5. Teste de hipétese para mé de duas populagies. [Nesta seco, examinaremos métodos usados para fazer inferénciaestatstica sobre as médias de duas populagées, trabalhando com amostras grandes independentes. Entendemos que duas amostras so independentes se a mostra retirada de uma populagio no interfere na amostra retirada da ‘outra populagao. (© problema consiste em comparar as médias de duas populagdes para decidir se existe alguma diferenga entre elas. A logica para se fazer esta ccomparagio pode ser resumida como mostrado na figura 5.5. Uma amostra ‘grande (n 2 30) €retirada aleatoriamente de cada populagdo. As médias das amostras sio calculadas e comparadas, levando @ uma conclusio de que as médias no sfo iguais se houver uma diferenga significativa entre elas. ep ropa 2 i 53 ° : [oan ‘no? ] my 2 [cama maior Gime aia] © Congas andta a ted Te una io Figura 5.5 ~ Procedimento para comparar duas médias. © procedimento adotado para realizar um teste de hipéteses, para as médias de duas populagées, & similar ao adotado anteriormente para uma sinica populacdo. Os principais pontos do procedimento sao discutidos a seguir. 1, Nosso problema é que temos duas populagdes com médias ps € fa € desejamos saber se existe diferenca entre elas. A hipstese nula & Hi: Hy = fz (as médias coincidem) 2. Retiramos uma amostra de cada uma das populagies e calculamos as médias. A diferenga observada x,~s, 6, agora, a estatistica de teste (em vex de x da segio anterior). 80 3, Se retitissemos todos as possiveis amostras de tamanho n € n: das xe, ¥ Sex x? (5,991), a hipétese Hy é rejeitada, ou seja, @ variével “tumo de estudo dos alunos dos ensinos fundamental e médio” ¢ a variével “rendimento escolar ” io dependentes, 6.4, Teste F. © teste F € utilizado para verificar se duas populagdes apresentam vvariancias populacionais iguais, sendo: .: varidneia populacional da “populagdo 1”; cf: varidneia populacional da “populagio 2”. ara tanto, devem ser conhecidas as varidncias amostrais normais sf e $3 das duas populagdes em estudo. A varidvel do teste, denominada varidvel F, segue uma distribuigao amostral assimétrica, que assume apenas valores positivos. Este teste também € conhecido como “teste da razio entre varidveis", pois a varidvel F do teste é 0 quociente entre as duas variancias amostrais, Para determinado “grau de certeza”, F ¢ dada por: Fen onde gli € gl2 so os graus de liberdade referentes as populagdes 1 e 2, respectivamente, © grau de liberdade gl € calculado subtraindo 1 do _niimero de amostras. Para se realizar o teste F a fim de comparar duas varincias populacionais usando amostras de cada populagio, primeiramente devemos verificar se ‘as amostras so independentes e selecionadas aleatoriamente de populages normalmente distribuidas. Devemos entdo seguir os seguintes passos: © Identificar Hye Hy. © Determinar 0 “grau de certeza”. ‘© Determinar os graus de liberdade gll ¢ g2. © Observar o valor na tabela da distribuigdo F. # Se Festiverna area de rejeigo, rejeitamos Hy. 100 A tabela a seguir mostra valores de F para “grau de certeza de 99%", ‘tomando-se gll na horizontal e gl2 na vertical ¥ FERSERRYS| 5 Exemplo 4: Um engenheiro estéelaborando um novo sistema que poderia reduzit a variincia do tempo para a fabricago de pecas. No sistema anterior, uma amostra aleat6ria de 10 pegas, apresentava varidncia de 140. ‘Como novo sistema, uma amostraaleatGria de 25 pegas teria uma varidneia {de 100, Sendo o “grau de certeza de 99%", hé evidéneias suficientes que garantam que o “novo sistema” é melhor que 0 “antigo”? Sistema 1: s;°=140 ¢ gli=10-1=9 Sistema 2: s;3=100 © gl2=25- int Figs = Ba =e = 140 as 100 Hipéteses: Hy:o7 $03 € H,: of > 03 101 Utilizando a tabela da distribuigdo F, para 99%, temos: Fya. = 3,26, Uma vez que F no estd na regito de rejeigo, nfo é possivel rejeitar H., 6.5. Exercicios Resolvidos. 1, Em 40 langamentos de uma moeda, foram observados os seguintes resultados: 16 caras ¢ 24 coroas. A moeda em questo pode ser considerada hhonesta? Considere nivel de significdncia a=5% ‘Tabela 6.6: Etapas para se calcular x" (exercicio resolvido 1). ‘Tabela 6.7: Etapas para se calcular xy" (exercicio resolvido 2). Resulado | Resalado | Difewnga entre o | Diferenga | Quocienie ent ‘observado | experada [resultado observado e| ao quadrado | diferenga ao quadrado (moeda honesa) | resultado esperado eo resultado esperado Caras 3 | Cara 30 3205 Coroas 35 | Coroar 20 Bows Resultado | Resultado | Diferengaentwe 0] Diferenga | Quocienis envea observado | esperado | resultado observadoe | 20 | diferenga ao quadrado (oncedahonesa)| 0 resultado esperado | quadrado | eo resultado esperado Cara16 | Cara20 | 16-202-4 [C416] _1620=0800 [Coron 24 | Corea: 30 | 24=30=4 _/T=16 | 16720= 0,800 ‘A soma dos quocientes entre as diferengas ao quadrado e os resultados esperados fomece %'=0,800+0,800=1,600. A tabela 6.6 apresenta duas linhas com dados experimentas, logo] Na tabela 6.1, 0 parimetro 1x} correspondente a @=0,05 ¢ a gl=I € x,'= 3,841. Como xq (1,600) < x? (G.841), a hipotese Hy (ou sej, a probabilidade de sair cara 6 de 50%) nio é rejeitada, Assim, a moeda pode ser considerada honesta com certeza minima de 95%. 2. Em 40 langamentos de uma moeda, foram observados os seguintes resultados: 5 caras ¢ 35 coroas. A moeda em questo pode ser considerada hhonesta? Considere nivel de significdncia a=5%. 102 A soma dos quocientes entre as diferengas a0 quadrado e os resultados 1,250+11,250=22,500. A tabela 6.7 apresenta duas linhas com dados experimentais, logo gl =2-I=1. Na tabela 6.1, 0 parimetro x? correspondente a 0=0,05 ¢ a gl=I € x? = 3,841. Como x? (22,500) > x? (3,841), a hipétese Hy (ou seja, a probabilidade de sair cara é dle 0%) 6 rejeitada. Assim, a moeda no pode ser considerada honesta. esperados fornece x," 3. Realizou-se uma pesquisa com uma amostra de 400 frequentadores de ‘um clube esportivo, sendo 160 mulheres e 240 homens, a fim de classificé- los de acordo com a modalidade esportiva preferida: vélei, basquete ou ténis. Os dados coletados na pesquisa estdo descritos na tabela 6.8. Tabela 6.8: Género e modalidade esportiva preferida, Valet Bisque Ta) ‘Malberes 30 30 30 1 omens 40 140 00 Verifique se hi ou nfo dependéncia entre a variével “genero” e a varidvel ““modalidade esportiva preferida”. Considere que Ho serd rejeitada a 5%, 103 A hipétese Hy em teste afirma que a varidvel entre a varidvel “género” e a variével “modalidade esportiva preferida” slo independentes. A anilise a seguir destina-se a verificar se Ho serd ou nao serd rejeitada, ‘A tabela 6.8 apresenta, como dados experimentais, 2 linhas e 3 colunas. Logo, o mimero de graus de liberdade para o exercicio resolvido 3 &: gl = 2-)xG - 1, ouseja, gl= D2 = Da amostra de 160 mulheres que frequentam determinado clube esportivo, 80 preferem vélei, 30 preferem basquete e 50 preferem tenis. ‘Da amostra de 240 homens que freqitentam determinado clube esportivo, 40 preferem vélei, 140 preferem basquete e 60 preferem tenis. Da amostra de 400 frequentadores de determinado clube esportivo, 120 preferem vilei, 170 preferem basquete e 110 preferem t2nis, Observando-se @ amostra, 120/400=0,3000=30,00% dos frequentadores pesquisados preferem vélei. Caso esta proporgo fosse mantida, seriam esperadas 48 mulheres (produto de 0,3000 por 160) com preferén volei © 72 homens (produto de 0,3000 por 240) com preferéncia por lei Essa € a “lei teorica” extrafda da tabela 68. A tabela 6.9 apresenta os caleulos dos resultados esperados. por 104 ‘Tabela 6.9: Proporgdo: “Lei da Tabela” (exercicio resolvido 3). Resultado Proporgaio Resultado Observado (Lei da Tabela”) Esperado 80 120/400 = 0,300 10,3000x160 = 48 30 T70I400 = 04250 D.4250x160 = 68 30 110/400 = 02750 0,2750x160 = 44 w 17207400 = 0,300 10;3000x240 = 72 140 170/400 = 04250 (0,4250x240 = 102 0 110/400 = 02750 0,2750x240 = 66 A tabela 6.10 mostra as etapas para se calcular xq? para 0 exemplo em estudo (exercicio resolvido 3). ‘Tabela 6.10: Etapas para se calcular xq? (exereicio resolvido 3). Resuliado | Resultado | Diferengaentreo | Diferenga | Quociente ene = cbservado | esperado | resultado observadoe o | ao quadrado | diferenga ao resultado esperado quacrado eo resultado esperado 80 8 WWE Tana Rae =a SHES 30 8 30-6 aE Tad | TAB = BESS 30 a 30-#=6 6 T= ORR 40 R Toad | T0aana= 1422 140) 102 THO 102 = 38 Tae | TART = T1569 60 6 0-6=% % TOG = OE ‘A soma de todos os valores da ltima coluna da tabela 6.10 resulta em X°=72,311, O miimero de graus de liberdade €: gl = (2-1)x(3-I)=1x2=2. Na tabela 6.1, 0 pardmetro x? correspondente a ot = 0,05 (foi dado que Ho serd rejeitada a 5%) ¢ a gl=2 é x, = 5,991. Como xo? (72,311) > x2 (5,991), f hhipétese Ho ¢ rejeitada, ou seja, a varidvel “género” © a varidvel “modalidade esportva preferida” sio dependentes. 10s 6.6. Exercicios Propostos. 1. Em 60 langamentos de uma moeda, foram observados os seguintes resultados: 35 caras e 25 coroas, A moeda em questio pode ser considerada hhonesta, com nivel de significdncia de 59%? Resposta: Sim. 2. Em 70 langamentos de uma moeda, foram observados os seguintes resultados: 22 caras ¢ 48 coroas. A moeda em questo pode ser considerada honesta com nivel de significancia de 5%? Resposta: Nao, 3. Realizou-se uma pesquisa com uma amostra de $80 consumidores de chocolate ao leite ¢ de chocolate amargo, sendo 220 jovens e 360 idosos, obtendo-se os dados descritos na tabela 6.11. ‘Tabela 6.11: Faixa etéria dos consumidores e preferéncia por chocolates. Preferéncia: ~ Preferéncia: Chocolate ao eite | Chocolate amargo Tovens 160 0 Tdosos 80 280 Testar se a varivel “faixa etéria dos consumidores” e a varidvel “preferéncia por chocolates” so dependentes. Considerar nfvel de ignificancia a=5%. Resposta: Sim. 4, Um engenheiro esté elaborando um novo sistema que poderia reduzir a varidneia do tempo para a fabricagdo de pegas. No sistema anterior, uma amostra aleaéria de 12 pecas, apresentava varidneia de 150. Com o novo sistema, uma amostra aleat6ria de 28 pegas teria uma varidneia de 125, Sendo o “grau de certeza de 99%", hi evideneias suficientes que garantam que 0 “novo sistema’ é melhor que 0 “antigo”? Resposta: Nao. 107 Tarefa 6: Teste Qui-Quadrado. Nome: Némero: Turma: Curso: Turno: 1, Realizou-se uma pesquisa com uma amostra de 200 clientes de uma tradicional lanchonete, sendo 80 mulheres e 120 homens. Questionou-se a respeito da preferéncia dos clientes pelos seguintes tipos de sanduiches: “hamburguer”, “cheeseburguer” ou “hot-dog”. Obtiveram-se os dados descritos na tabela a seguir. Género do cliente de uma lanchonetee preferéncia por sandu‘ches. Preferéncia’ Preferéncia: Preferénciai “Hambirguer” | “Cheeseburguer” “Hot-dog” Mulheres 10 0 30 omens 35 5 @ Testar se a varidvel “género do cliente de uma lanchonete” € a variével “preferéncia por sanduiches” so dependentes. Considerar nivel de significdncia 2. Um pesquisador coletou as informagaes sinttizadas na tabela a seguir a fim de saber se cor influenciava nas vendas de toalhas de uma grande loja de departamentos. Cor da toalha e quantidades vendidas. Cor da toalha | Niimero de toalhas vendidas | no aitimo semestre | | Branca | 80 | ee Ross | 70 “Verde 70 Bege 0 Pode-se afirmar que a varidvel “cor da tolha” e a variével “nimero de toalhas vendidas” so dependentes? Considerar nivel de_significéncia 05% Resposta: Nao. 7. Anilise de Varidncia. 7.1. Objetivo. © objetivo da “Anslise de Varidncia” ¢ verificar se ts ou mais médias podem ser consideradas iguais, através de um método de comparacao. 7.2. Pré-requisitos para a aplicagdo da “Anélise de Varidncia”. A aplicago da “Anélise de Varidincia” requer que sejam cumpridas as seguintes condigbes: As amostras que serio analisadas devem ser independentes e aleatsris. ¥ As varidveis estudadas devem ter distribuigo normal ¢ varidncias iguais na populago de origem, 73. “Método da Andlise de Varidneia”. Oexemplo I descrito a seguir seré utilizado como elemento motivador para se explicar os procedimentos relatives ao “Método da Andlise de Variancia”. Exemplo J: Um grupo de 12 mulheres, da mesma faixa etéra, foi dividido aleatoriamente em 3 subgrupos (cada um composto por 4 mulheres), que foram sujeitos, durante duas semanas, @ dietas consumindo os seguintes cardépios: cardépio 1, cardépio 2 e cardépio 3. As “perdas de peso” (em kg) de cada subgrupo estio indicadas na tabela 7.1. M3 ‘Tabela 7.1; Cardépios para os subgrupos. CardipioT | Cardipio? | Cardipio’s Tie oe Oke Tie Tie she ae Ske Tig oe Ske The AS médias de perdas de peso para as amostras que seguiram os cardpios 1, 23 foram respectivamente: 5 -2eSe4e3 B, = 2252443 _ sy p= PEAY ag Baseses BHS455 «sy p= Se a 5p, VE=6,00 (ton’) Poderfamos tr feito: VT= £) Estimativas das varincias: Graus de liberdade das variéveis VT, VD e VE: tipos de fetlizantes)x(3 “produgdes") 3 “produgses por subgrupo ~ 1)x(3 subgrupos) = 2.3 = 6 al(VE) = G tipos de fenilizantes)~ 1 =3-1=2 133 Estimativas das varifineias: VE a(VE) .50ton? alVD) 6 2) A varidvel F observada (F,) & calculada por: F, Na tabela de distribuigdo F, a 99%, usando gll=gl(VE)=2 e gl2=el(VD)=6, temos que: F=10,92. Como Fj 3 3 T 70 o e 10 7 Determine: 4) as quantidades médias produzidas para cada tipo de miquina utilizada; ) a quantidade média geral produzida, independentemente da méquina; ) a variaglo total (VG); 6) variagio dentro dos subgrupos (VD); ©) variaglo entre os subgrupos (VE); £) as estimativas das varidncias; £2) as médias podem ser consideradas iguais, com 99% de certeza’? im Respostas: a) ML: 7 pegas M2: 8 pegas M3: 6 pegas b) 7 pecas 096 4) 86 ©) 10 )5,00e 7,17 g) Sim, 128

Você também pode gostar