Você está na página 1de 140
EDITORA EDGARD BLUCHER LTDA A Lei de Direito Autoral ei no 9.610 de 19/2/98) no Titulo VIL, Capitulo IT diz Das Sangées Civis: ‘Art102 Ociularcuja obra seja fraudolentamentsreprodurid.divulgada ou de qualquer forma uilizada, poderdrequercr a apreensio dos cxemplaresreproduzigos ov suspensio da divulgagio, som prajuzo da indenizagio cabivel ‘Art.103 Quem editar obra lterdra, antistica ou cientifica, sem autorizagio do tila, perdett para este os excrplares que se aproendersm c pagar-Ihe sabonetes de certa marca e tipo. peso liquido, ©) Populagdo: —_pecas produzidas por uma maquina. Vatiavel: didmetro extemo, 4) Populagao: _industias de uma cidade. Variavel: indice de liquidez. INTRCOUCAO — TIPOS DE VARUAVESS 7 RN Pelos exemplos apresentados, podemos perceber que os valores das varlaveis discretas séo obtidos mediante alguma forma de contagem, a0 passo que os valores das variaveis continuas resultam, em geral. de uma medigéo, sendo freqientemente dados em alguma unidade de medida. uta diferenca entre os dois tipos de variaveis quanticativas esta na interpretacio de seus valores. Assim, a interpretagao de um valor de uma varidvel discreta é dada exaramente por esse mesino valor. Quando dizemos que um casal tem dois filhes, isso significa que o casal tem exatamente dois filhos. A interpretagao de um valor de uma variavel continua, a0 contratio, ¢@ de que se trata de um valor aproximado. Isso decorte do fato de nao existirem instrumentos de medida capazes de oferecer preciso absoluta, ¢, mesmo que existissem, ndo haveria interesse nem sentido em se querer determinar uma grandeza continua com todas as suas casas decimals, Logo, se, ao executarmos a medido de algum valor de uma variavel continua, estamos sempre fazendo uma aproximacéo, resulta que qualquer valor apreseatado de uma variével continua deverd ser interpretado como uma aproximagao compativel como nivel de precisao e com o crtério utiizado a0 medir. Por exemplo, se o didmetro extemo de uma pega, medido em milimettos, for dado por 12,78 mm, deveremos considerar que ¢ valor exaro desse dldmetro seré algum valor entwe 12,775 ¢ 12,785 mm, que foi aproximado para 12,78 mm devido 20 fato de a precisio adotada na medida ser apenas de centésimos de milimetros. ‘Uma convengao ttl adotada no presente texto 6a de sera preciso da medida automa- ticamente indicada pelo niimero de casas decimais com que se escrevem os valores da va- sidvel. Assim, um valor 12,80 indica que a variavel em questdo foi medida com 2 precisio de centésimos, nao sendo exatamente © mesmo que 12,8, valor correspondente a uma Precisio de décimes. Notemos que, normalmente, a aproximacao implicita ao se considerar cada valor de uma varidvel continua seré de, no maximo, metade da precisio com que os dados sto medides. Assim, no exemplo precedente, supusemos que a preciséo da medida era de centésimtos de milimetros: segue se que os resultados apresentados com essa preciso serao, 1a verdade, valores aproximados, e essa aproximagao sera de, no maximo, cinco milésimos de milimetros para mais ou para menos.) Apés observar as diferengas mencionadas entre as variaveis quantitativas discretas e continvas, oletor podera fcar surpreso ao verificar que as técnicas da Estatistica Deseritiva sero praticamente idénticas em ambos os casos. Isso se deve, no entanto, ao fato de, formalmente, os dados referentes a variévels discretas ou continuas serem andlogos, pois ‘os valores da variavel continua sero sempre apresentados dentro de um certo grau de aproximagéo. Assim, apenes na interpretagao ¢ descrigao gréfica dos resultados € que haverd Alferengas a serem consideradas, conforme veremos. ‘A Estatistica Descrtiva pode descrever os dados através de grifices, distibuicées de reqiiéncia ou medias associadas a essas distibuigGes, conforme veremos a seguit. (ima excegio sea, por exerpl,o caso da vaiivel Hae, medida em ance completes, Um valor come 18 conesponderia ao inarvalo 18 }~ 19. 8 eSTATISNCA DESCRITIVA 2.2 TECNICAS DE DESCRICAO GRAFICA (© primeiro passo para se descrever graficamente urn conjunto de dados observados é verificar as frequéncias dos diversos valores existentes da variavel. Definimos 2 freqdéncia de um dado valor de uma variavel (qualitativa ou quantitati- vva} como 9 nimero de vezes que esse valor fol observade. Denotaremos a freqdéncia do ébsimo valor observado por f,. Sendo 7 0 nimero total de elementos observados, verifica- se imediatamente que Maina (2.4) onde & & 0 nimero de diferentes valores existentes da variavel. ‘A associagao das espectivas fregiéncias a todos os diferentes valores cbservados de fine a diseribuicdo de fregincias do conjunto de valores observados. alternativamente, poderemos usar as fregdénctas relacivas. Definimos 2 freqiéncia relat, ou proporgao de lum dado valor de uma variavel (qualitativa ou quantiativa), como o quociente Ge sua Freqiéncia pelo nimaro tora de elementos observades. Ou cia, denotando por a feglénca relativa ou proporcéo do iésimo elemento observads, tmos 2.2) claro que 23) 2.2.1 Descricao gréfica das variaveis qualitativas No caso de varavels qualtativas, a descricdo grifica € muito simples, bastando computar as freqliéncias ou freqiéncias relatives das diversas classiicacbes existentes, elaborando, a seguir um grafico conveniente. Esse grafico poderd ser um diagrama de barcas, um diagrama circalar ou out qualquer tipo de diagrama equivalence ‘Tomemos, como exemplo, um grupo de 135 candidatos a vagas em um curso de pés- graduacio, classificados segundo sua formacdo especifica de graduacdo, conforme a ‘ab. 24, As duas colunas referentes ao nimero de pessoas contsm, respecivamente, 25 a ‘Nomero de pessous Freghéncias | % ‘Engenheiros 38 281 Economisas x0 22 dminiswadoces 35 259 ontadores 15 m1 ours 7 27 “oul 138 | 1000 ‘TEONICAS DE DESCAIGAN GRAFICA 3 Figure 2.1. Disgrama 8 terres. Engenneinos Ezonemissas semiisradores Corsadores Olnros freqiéncias eas freqiacas elativas, dadas em porcencagers, em que aformacéo académica s distribu encre esses candidatos, A variével qualtativa considerada no presente exemplo ¢ dada por essa formagao, eas frequéncias relativas observadas definem a dstibuigdo de freqaéncias que essa variavelapresentou. Esses dados podem ser gralicamente representados de diversas formas. Assim. na Fig 2.1, eles estéo representados por melo de um dlagrama de bars e, na Fig. 2.2, por um diagrama circular. A vantagem da representacio grafica esta em possibiltar uma rapida impressio visual de como se distibuem as frequéncias ou as frequéncias relasivas no conjunto de elementos examinados. Entretanto ha a mencionar ainda a possibilidade de se considerarem distribuigdes segundo outros critérios que nao propriamente a frequéncia ou 2 frequéncia relative das ‘observagées. Como exemple, tomemos as superficies das cinco regides geogréficas que Figura 2.2 Diograma crcuier 10 STATISTICA DESOATTIVA compdem o Brasil, apresentadas na Tab. 2.2, conforme dados do I8GE (Instituto Brasileico de Geografia Estatistica).Calculando-se as porcentagens correspondentes, pede-se construir ° diagrama circular dado na Fig. 2.3. [rabela22 Regtcsstogdiasdobasl | Regio ‘Superficie (km?) None 3.869.657.9 cenaeroeste Leizorr2 Norte L617 sudese 212862 sa srraisa Teal S57 5951 Figura 2.9 Diagrama circular 2.2.2 Descriedo grafica das varidveis quantitativas discretas No caso das varliveis quantitatvas discretas, a representacio grafica seré também, nor malmente, feta por meio de um diagrama de barras. A diferenca em rela¢do ao caso ante rior esté em que, sendo a variével quantitatva, seus valores numéricos podem ser representa dos num eixo de abscissas, o que facta a representacao. Note-se que, aqui, existe uma enu- meragdo natural dos valores da varivel, o que nao havia no caso das variveis qualitativas. A construgéo do diagrama de barras ¢ feta semelhantemente 20 exemplo anterior, desde que se disponha da tabela de freqiéncias. Esta, por sua vez, pode ser faciimente construida se conhecemos todos os valores da variével no conjunto de dados. Como iremos marcar no eixo das abscissas os valores da variével, resulta que, nesse caso, as barras do lagrama serao verticais. ‘TEONICAS DE DESCRICAO GRAFICA a1 ——— ‘Vamos, 2 titulo de exemplo, representar graficamente 0 conjunte dado a segulr, cons- tituido hipoteticamente por vinte valores da variavel “ntimero de defeltos por unidade” ‘obtidos a partir de aparethos retirados de uma linha de montagem. Sejam os seguintes os valores obtidos: 2 2 1 2 3 ° 5 1 ° 1 2 ° 1 ° 1 2 Usando a letra x para designar os diferentes valores da variavel, podemos construlr @ distibuicdo de freqiéncias dada na Tab. 2.3, a partir da qual elaboramos o diagrama de bamras corespondente, dado pela Fig. 2.4. ‘Tabela 25 Disuibuigio de freqdencias x fi vi. ° 4 0.20 1 1 038 2 s 0.28 3 2 o.t0 4 1 0.08 5 1 0.05 20 1.00 O diagrama de bars, confoome jé mencionamos, mostra a distibuigdo das fegiéncias no conjunto de dados. Tratando-se de variéveis quantiiativas, uma outea forma de Tepresentacao gréfica é também possivel, tendo, as vezes, interesse, com base nas /regiléncias Figure 2.4 Ciegrema de 74 e+ s+ at s+ e+ a4 ot x 12 estatistica OESCRITWA zcumuladas. as quais denotaremos por FA freqiléncia acumulada, em qualquer ponto do eixo das abscissas, & definida como a soma das freqléncias de todos os valores menores ou ‘guals ao valor comrespondente a esse ponto. Analogamente, teiamos as freqiéncias elativas acumuladas. Tabela 2.4 Fregiénciase freqincias relativas acumuladas * Fr Fi ° 4 020 1 u 055 2 16 0,80 3 18 0.90 4 9 098 8 20 1.09 Voltando 20 exemplo, podemos facilmente verificar que as freqUéncias e as freqiéncias relativas acumuladas corcespondentes aos valores notaveis da variavel sao as dadas na Tab. 2.4. A partir dessa tabela, foi construldo c gréfico das regdéncias acumuladas, dado na Fig. 2.5. f Figure 2.5 Gréfico des freqdéncies ecumuisdas. 2.2.3 Descricao grafica das variéveis quantitativas continuas — classes de freqiiéncias No caso das variaveis quantitativas continuas, 0 procedimento até a obtengao da tabela de freqiéncias pode ser andlogo ao visto no caso anterior. Entretanto o diagrama de barras, no mals se presta a comrerarepresentacdo da distrbuigdo de freqUéncias, devido & nacureza coatinua da variével. Examinemos umn exemplo: tomeinos a amosica a segul, constitu ‘TEONICAS DE DESCAICRO GRAFICA 13 a por 25 valores da variavel “diémetro de pecas produzidas por uma maquina’, dados em milimetcos: 2s 214218245216 27-216 214212217 AS 245 Ta 25 219 216 213 215 jana’ 218 216 219218 Na Tab, 2.5 cemos esses mesmos dados organizados em termos de frequéncias e de frequéncias relativas, simples e acumuladas. ‘Tabela 2.5 Distribuigio das freqiéncias e das freqiéncias acumuladas zi Si Fi PE Pr 212 1 1 0,04 0.04 as 2 3 0,08 0.12 214 5 8 0,20 32 21s 7 15 0.28 | 0,60 216 4 9 ore | 0,76 217 3 22 o.12 0.88 218 1 23. 0.04 0,92 21.9 2 25 0.08 1,00 23 1,00 Ao passarmos a representacao gréfica, porém, devemos lembrar a correta interpreraco dos valores das variaveis continuas. Assim, por exemplo, sabemos que a freqiiéncia 5 associada ao valor 21.4 significa, na verdade, que vemos cinco valores compreendidos fentze 0s limites 21,35'e 21,45, que foram aproximados, no processo de medigao, para 21.4, Logo, uma representacdo grafica correta deverd associa a freqléncia ao incervalo 21,35—21,48. Isso se faz por meio de uma figura formada com retingulos cujas areas Tepresentam as freqiiéncias dos diversos intervalos existentes. Tal figura chama-se hisco- -grama. Na Fig. 2.6, temos o histograma comrespondente 2o presente exemplo. ‘Vemos que, no caso das variaveis continuas, as freqléncias serio, na verdade, associadas ‘a intervalos de variagéo da variavel e no a valores individuais. A tai intervalos chamaremos classes de freqiténcias. As classes de freqitacias sto comurmente representadas pelos seus Pontos médios, conforme vimos no presente exemple, ‘Uma outra representagdo grifica que, come o histograma, pode ser feita no caso de vatidveis continuas é dada pelo poligono defreguéncias, ue se obtém unindo-se os pontos médios dos patamares. Para completar a figura, consideram-se duas classes laterais com Feaiéncianula.2!Na Fig. 27, emes o poligono de freqhéncias comespondente ao hisograma visto, 0 qual éreprodzdo em inhas imerrompldas. Uma exreydo basune comum 2 esa regra aparece no caso de vanivels eendalmentepostivas ajo ini no val zr, pos rab aver senda om seconsierar um inva com valores negatives. 14 STATISTICA DESCRITIVA Figure 2.8 Histograma do exemplo apresentado no texto. oN 74 e+ s+ at s+ e+ ad o+ B12 21.3 214 215 216 217 218 218 Podemos ainda eonstrur 0 poligono de fregiéncias acumuladas. Este ¢ tragado sim- plesmente verficando-se as freqléncias acumuladas ao final de cada uma das classes. Pode ser construido em termos das freqdénclas ou freqhénciasrelatvas.O poligano de freqdéncias, relativas acumuladas correspondente ao presente exemplo & dado na Fig. 2.8, tendo sido btido a pari das freqiéncias relatvas acumuladas dadas na Tab. 2. No exemplo anterior vimos qué, no caso das variaveis continuas, a consideracéo de classes de freqiéncias & fundamental para a cometa representacao gréfica: Naquele exernplo, as classes consideradas uinham por pontes médias os préprios valores originals do conjunto de dados disponiveis. Ou seja, as classes surgiram naturalmente como decorréncia da interpretacdo dos valores da varidvel continua. Essas classes, no exemplo visto, foram suficientes para a obtengdo de uma representacio grafica satistatéra. Multas vezes, entretanto, uma tepresentagdo satisfatéria dos dados somente ¢ conseguida pelo seu agrupamento em classes de frequéncias que englobam diversos valores ft Figure 2.7 Pokgano de heauences. ‘EONICAS DE DESCAICIO GRARCA 15 Figura 2.8 Poligane de trequéncios relatives acumulades. DEAS 21.25 21.95 21.65 2155 21,65 2175 2188 21: da varidvel. A freqUéncia de cada classe serd, nesse caso, igual & soma das freqiéncias de todos os valores existentes dentro da classe.!91 © procedimento descrito coresponde a uma diminuido proposital da precisio com que 05 dados foram computados. Ou stia, propositalmente deixamos de lado uma parcela da informagao contida nos dados originais tendo em vista obter uma representagéo mais adequada © problema prético a resolver, em tals casos, & 0 de determinar qual o nimero de classes a constitu. qual o tamanho ou amplinude dessas classes e quais os seus limites. £ Claro que, por simplificacéo, recomenda-se, em muitos casos, a construszo de classes de mesma amplitude. Usaremos a seguinte notagao: 2, niimero total de dados dispor 4 niimero de classes; ‘A, amplizude das classes, quando supostas todas iguais. ‘A questdo do ntimero de classes éteoricamente controvenida. Diversos autores apre- sentam solugbes diferentes, Entretanto, com um pouco de bom-senso ¢ experiéncia, chega- se sem grande dificuldade a valotes satisfatorios para A, & para os limites das classes. A obtencdo de solugses simples é, em geral, desejavel, A Fig. 2.9 é um diagrama que pode sec usado’para a determinacao do nimero aproximado de classes, fomecendo resultados satisfatorios em muitos casos. Entretanto nao se recomenda o agrupamenta em classes quando o numero de valores € muito pequeno, digamos, menor que 25. 41 B1e 21.9 S14 218 818 O17 B18 21.9 221 5 esse procedimento também pode ser aplcado no caso de varaves Gscreas, afm de se ober uma represeniagdo mais convenient 16 srarismicA DescAmVvA 18 18 14] 12 ‘Nomero do classes © 3 1 2345 1 2 89 100 200 S00 1000 | Nimera de letures Figura 2.9 Diegrama para a detarminagso co nimere de classes de frequéncias. ‘vamos definir a amplizude do conjunto de datos como sendo a diferenga entre o maior ¢0 menor dos valores cbservados. Vamos designé-la por R. E claro que, uma ver fixado &, resulta he Entretanto é imporante notar que a amplitude das classes néo devera ser fracionatia em relacio A preciso com que os dades so apresentados, pois isso impossibiltaria uma corteta Subdivisdo em classes. ‘TEONICAS DE DESORIGKO GRAFICA 7 Noternos também que os limites das classes sdo, muitas vezes, apresentados sob formas {que no cortespondem ao significado real dos valores contidos na classe. Dizemos, entao, {que temos linites aparences. Em ais casos, pode ser conveniente a determinacao des lites reais das classes. Essa questao serd ilustrada no exemplo que damos a seguir. ‘Tomemos como exemplo o conjunto de valores que segue. que suporemos sejam cin- aqiienta deserminagées do tempo (em segundes) gasto por um funcionario para preencher uum certo tipo de formularo: 61 65 4305355 SL SBS 85H 52 53 62 «49681 53 56 48 «50 Ol 4445S SS 4800454574158: 53468 5546 57 SHB SBS 8ST & facil ver que a distibuigdo de frequéncias diretamente obtida a partir desses dados seria dada por uma tabela razoavelmente extensa. A representacao grafica dessa distribuicio, apresentada na Fig. 2.10, deixa de ser conveniente para esses dados. Figura 2.10 Histograms dos ados nao ‘sgrupaces em classes. s+ at at a a4 ° * a 45) 50 55 BOBS 70 ‘Vamos agora adotar um agrupamento com sete classes de amplitude & = 5. Na Tab. 2.6 ‘so dados os limites das classes ¢ as freqUéncias respectivas."I Nessa tabela,apresentamos 5 limites das classes dados de trés maneiras equivalentes. As duas primeitas so formas ‘usualmente empregadas e comespondem a limites aparentes. A terceira indica os lives reais dessas classes. Note-se que nao ha possibilidade de divida quanto a classe & qual ‘ada elemento pertence. FA mania mals simples de obter as reqitncas das classes a pai do conunio de dados€, a nosso ve, percontendo os dagos uma inc vere assinalando, para cada classe, os elemenios nea cones. 18 estarisica 02S0RmTva Jabela 26 Agrupamento em dastes de regéncas 1 Classes Ties apareies 2 rea note Segunda nowpio | Tess weds wa | seams | 3 ssh50 ws | soa | 8 sobs so | a95—545 | 16 55+ 60 ss—s | sas—sos | 12 ooh6s wa | ses—us | 7 ost70 0 | ois—oss | 5 roKTs nom | os—ms [3 130 (© istograma ¢ o poligono de fiegiiéncias correspondentes 20 agrupamento feito si0 dados na Fig. 2.11. Vernos que essa representaceo grafica € multo mais apropriada do que 2 anteriormente obtida f — Figura 2.11 Representagdo grafica dos dados agrupados. RS MS AS S45 505 O45 HS 145 no de freqléndas obddo sugere o uagado de uma curva concinua. Sm outas palavras. s¢ 0s dados provem de uma amostra eles esti sugerinde qual sea. apreximadamente. a istribuicdo da populacdo, para a qual poderiamos adotat algum modelo ideal de distabulgao. Um ned egientement sada ¢o de stile normal, estudada pelo Cele de Probabiidades¢ apresentada no AP. TEENICAS DE DESCRICAD GRAFICA 43 SE 2.2.4 Exercicios de aplicacso 4, 0s dados que seguem representam as idades, em anos completos, de todas as criangas atendidas em um cero dia por um posto de puericultura. Construa o histograma, © poligano de frequéncias e 0 poligono de freqdncias acumuladas para esses dados. Ia toe eae ae a a et DEI ac HOLES atte 1 EHS: 2. Durante o més de setemibro de certo ano, o nimero de acidentes por dia em certo trecho de rodovia apresentou a seguinte estatistica: 2 0 t 2 3 1 6 1 0 0 Teeattha Hereetes HOH ted tear tte atest oto Hata at ea tee tg Represente graficamente esses dados por meio de dois diagramas distintos. 3. Construa o poligono de freqUéncias relacivas acumuladas para os dados da Tab. 2.6 4, Temos a seguir as notas médias obtidas por oitenta candidates a um exame vestibular. ‘Agrupe convenientemente esses valores em classes de igual amplitude e construa 0s ‘comespondentes histograma, poligono de freqdncias e poligono de freqiéncias relativas ‘acumiladas. 4 73 44 10 45 SL S14 25 53 51 36 47 45 65 «79 «58 45 SE 73 2 38 42 49 19 49 65 52 35 11 87 25 39 2 40 22 5 60 44 5 8 3 6 50 38 9 8 2 9 SF 15 28 48 47 68 6 34 12 65 28 50 8 54 84 45 59 41 45 41 38 52 63 40 16 52 44 46 59 22 15 5. De uma analise de balango em cingUenta inddstrias, obtiveram-se os valores seguintes para seus coeficientes de liguidez. Agrupe os dadcs em: classes de igual amplitude e Conssrua o histograma, o poligono de freqiéncias eo poligono de ftequéncias relativas acumuladas. 29° 78 50 116 27 79 188 38 857 44 129 33 74 63 26 69 56 126 160 2,7 63 44 131 48 100 04 S55 162 25 98 45 106 52 87 90 39 92 84 08 46 156 71 178 45 105 53 118 25 24 75 20 ESTATISTICA DESCATTA, CS EE EEE nn nneanaelS 2.3 CARACTERISTICAS NUMERICAS DE UMA DISTRIBUIGAO DE FREQUENCIAS Além da desctigéo grifica, muitas vezes & necessario sumariar cemtas caracteristicas das distribuigbes de'freqdéncias por meio de cemas quantidades que iremos estudar a segult Tals quantidades s4o usualmente denominadas de medidas éa distibuigao de freqaéncias. por procurarem quantificar alguns de seus aspectos de interesse, ‘Temes, assim, as chamadas medidas de posicdo, de dispersda, de assimecria e de achacamento ou curtese. As medidas de posigao e de dispersao sao, sem divida, as mals importantes, tendo grande aplicacao em problemas de Estatistica Indutiva. Como vecemos, servem para localizar as distribuigbes e caracterizar sua variabilldade. As medidas de assimetria e de achatamento ajudam a caracterizat a forma éas distibuigdes. 2.3.1. Medias de posicao ‘AS medias de posicdo servem para localizar a distibuigdo de freqléncias sobre o eixo de ‘ariagdo da varidvel em questdo. Estudaremos tréstpos de medias de posi: a médla, a mediana e 2 moda. ‘A mécia e 2 mediana, como veremos, indicam, por ctérios diferentes, © centro da Aisucbuigao de freqliéncias. Por essa razdo, costuma-se dizer também que sao medidas de tendéncia centeal. A moda, pr sua vez indica a regido de maior concenwasao de feqUéncias na distbuigéo A média (aritmética) Podemos definir vatios tipos de média de um conjunto de dados. Neste texto, vamos nes preocupar exclusivamente com a média ariumética, de todas a mais usada, a qual denotaremos Por F, sendo x/05 valores da variével. (©) Sendo x; (/= 1, 2, ....n) 9 conjunto de dados, definimos sua média arismética ou, simplesmente, média, por (24) facil verifcar que, se os dados estiverem dispostos em uma tabela de freqléncias formada por linhas, poderemos obter ¥ por ye Ehatill 3h xp. 2s) "outros tpos de média sioa média geoméuica, per CARACTERISTICAS NUMERICAS DE UMA DISTRIBUICAO DE FREGLENCIAS 21 ——————— Por outro lado, considerando uma distribuigdo por classes de freqdéncias, podemos nde CCARACTERISTICAS NUMERICAS DE UMA DISTRISLIGAO DE FREGUENCIAS 31 ——————— 2.3.7 Medidas de achatamento ou curtose* Como o proprio nome indica, essas medidas procuram caracterizar a forma da distribuigao {quanto a seu achatamento, 0 terme médio de comparacao ¢ dado pela diseribuicde normal, modelo tefrica de distribuigdo esrudado pelo Célculo de Probabilidades!"). Assim. quanto a seu achatamento, a distibuigao normale dita mesocircica. As distnibulg6es mais achatadas ue a normal séo ditas placicurticas e as menos achatadas sao ditas leptoctirticas. Na Fig. 2.13 80 cepresentados os trés tipos de distribuigdo, por simplificagdo em termos de distribuigdes continuas ao invés de histogramas. Piaticirtica Mesocirtica Leptocorsce (armel) Figura 2.13. Diseribuizdes plavcirtica, mesacirtca e lepeocdreica. A caracterizagio do achatamento de uma disuibuigdo sé tem sentido, em teams préticos, se.a distribuigio for pelo menos aproximadamente simétrica, Entre as possivets medidas d= achatamento, mencionaremos apenas 0 cogficiente de curtose, obtido pelo quociente do momento centrado de quarta ordem pelo quadrado da varidncia, ou sea, cay i aed. (2.30) Esse coeficiente é adimensional, sendo menor que tés para as distibuigées platiciticas, igual a wés para uma distribuiglo mesocirtica e maior que trés para as distribuigses leptociiticas.1") Analogamente ao caso de as, 0 céleulo de ay pode ser feito utlizando-se os dados codlficados, sem que seu valor sea afetado. No Ap. 2, apresentamos o céloulo de my usando dados codificados, com resultado a4 = 2,21, revelando uma distribuicdo ligeiramente platicurica. 2.3.8 Exercicios de aplicacéo Calcule 0s coefcientes as ¢ a € @ indice de assimetria de Pearson para os exercicios 1, 4¢ 5 do item 2.2.4, e para os dados das Tabs, 2.5 « 2.5. Compare os resultados obtidos com as representacées graficas respectivas. No caso dos exerccics 4 ¢ 5 do item 2.2.4, use 05 agrupamentos em classes feitos 20 resolv-os, Tejas fot (pig disper uzarochamad copie de exces, defi come a5, de far o eto como reensa meson. 32 esratistica oescrITiva Se En EEE ee enn 2.4 EXERCICIOS COMPLEMENTARES 1. Uma esrasstiafeta nas quarentaJojas de ums cidade, tendo em vista um estudo sobre ‘o niimero de empregados no comércio, mostrou os seguintes nlmeros de er cexistentes em cada loja ee ee 5 8 0 4 2 3 2 5 2 00 202 5 5 7 112 2% 5 3 295 5 35 199 9 5 4 1 2 6 4 1 5 6 8 2 4 2 8 Constvaatabel de feguéncias, respective grfco eo grafic das fegincias acumu- 2. Represente graficamente o seguinte conjunto de dados: 22.6 25.8 27.9 289 284 344 41,7 248 234 24 269 264 27,9 235 23,1 26,5 29,5 204 294 318 248 23.9 29,5 461 23.9 235 33,9 361 278 26.6 22,7 283 259 52,1 27,5 27,8 23,8 25,0 27,0 25,6 25,6 288 25,7 224 25.0 24,0 261 355 359 223 31,7 3, Trinta embalagens plasticas de mel foram pesadas com precisio de decigramas. pesos, apse convenientemente agrupedos, Iomessiam @ segunte disouleio de freqiéncias (em gramas): x fi aS 1 32,5 5 335 i 345 8 385 3 365 2 CConstrua o poligono de Freqiéncias relativas acumuladas para os dados. 4. Dados os dez valores seguintes, calcule sua média, mediana, moda, varlancia, desvio- padro e coeficiente de variagao: Ww om 6 70 8 8 «72 «17 82 EXERCIOIOS COVPLEVENTARES 33 nen eee eamnemeened 5. Ensaios de uma amostra ao acaso de quarenta compos de prova de concreto fomneceram, as seguintes resistincies & ruptura: 64 61 654345 SST 30 100 91 75 78 68 80 69 m 27 4 9 9 9 78 72 59 78 495 «62 «42961005. a sf 78 «103 (880 ‘Agrupe os dados em classes de freqUéncias e construa © histograma, 0 poligono de frequéncias e o poligono de frequéncias acumuladas. 6, Caleule a média, 2 mediana, a moda ¢ 0 desvio-padrdo para os dados: a} do exerccio 1: ) do exercicio 2: ¢) do exercicio 4) do exercico 4; €) do exercicio 5. o 7. Agrupe convenientemente os datos a seguir em classes de freqUéncias e consirua o poligono de freqaéncias acumuladas. Com cs dados assim agrupados, calcule a méeia, S mediana, a moda e o desvio-padrdo. 170 182) 175 184 170 162 174 160 178 171 ies 155 169 176 «TL «172 «182 «177 «187 «178 176 187 179 163 180 159 170 188 166 168 176 169 172 179 «176 477 172 «175 181-172 164 173 173 165 164 172 166 184 167 181 ‘8. Os ndmeros seguintes representam as notas de Estatstica de trina alunes. Construa 0 hhistograma, 0 poligono de freqbéncias acumuladas e calcule a média ¢ 0 desvio-padrao dos dados. A varigvel € continua ou discreta? 55 30 40 45 7.0 65 38 45 30 75 45 00 48 55 45 70 90 60 40 50 80 98 458 45 45 25 20 50 60 45 34 esTarisnica DescArTMA 9. Medindo-se o diémetro externo de uma engrenagem, foram obtidos valores, em milimetros, de acordo com a seguiate distribuigao: Classes fi 100% — 1010 3 Toit — 1020 2 7021 28 1031 — 1040 82 Tos — 1050 74 1081 — 1060 30 sosteaere vo Calcule a média, 0 desvio-padide & 171 — 1080 a amediana desse fre de pega. 10. Um certo indice econdmico, necessariamente maior que 1, fol determinado para um Conjunto de n empresas analisadas. Os resultados so dados a seguir Calcule a média, a mediana ¢ 0 desvio-padrao desses dados. Determine também um valor para a moda usando a relacdo empirica vigente entre esta, a média e a mediana. Classes __Frequéncias, 1,00— 1,07 1 1071.14 2 Sasa T2128 3 128— 138 7 135—1A2 3 Raw 13156 T 4 1. Uma amostra apresentou a seguinte distibuicéo de freqt Classes Frequencias ~Ss-4 Ss 95 — 104 tt ios 4 3 iis — 124 zt “ioe 135 — 144 3 145 — 154 3s Calcule a média, a mediana, a moda € 155 — 164 3 0 desvio-padrio. A EXEACICIOS COMPLEMENTARES 35 a nen as 12, Dada a distribuigdo de frequéncias que segue, determine a mediana e a proporsio de elementos maiores que quatro, supondo: (a) varivel discreta e () variével continua. Sea Hae Sree Ae Ore cer fa 4 9 210 8 4 1 © coeficiente de variagdo sera o mesmo nos casos (a) ¢ (b)? 13, Os quarts Q;, Q2 €s de uma distribuigao de freqiéncias conrespondem & generelizacao da idéia de mediana e dividem as FreqUéncias em quatro pares iguals. Numa distribuigao com seis clasces de tamanho h cada uma, sendo x 0 limite inferior da primeira classe eas freqiiéncias das classes de, pela ordem, 2, 5,6, 4,2 € 1, determine Q,, 02 € Qs em fungao deta eA. 14. Dado o histograma da Fig. 2.14 e sabendo que todas as classes t8m igual amplitude caleule a moda, 2 mediana e o coeficiente de vatiacéo da distibuicao. 15, Mostre que 2 utllizagdo da expresso (2.7) do texto para o calculo da moda de uma distribuigso em classes de frequéncias equivale ao procedimento gréfico indicado na Fig. 2.15. 16, Uma amostra de chapas produzidas por uma méiquina fornecen as seguintes espessuras, ‘em milimetcos, para os itens examinados: 6,54 658 640 630 6,36 6,36 638 620 642 628 6,58 Hi razdes estatisticas para se afirmar que a distribulgdo das espessuras seja assiméuica? Figure 2.14 BOs So we SS Ss S55 36 estatismioa DesoRITIVa Figure 2.15 Ee 17. Uma amostra de oitenta pecas retiradas de um grande lote forneceu a seguinte distri- buigao de comprimentos: Classes ansctas simples wae i 70 3 70— 80 6 3090 5 99 — 100 25 160— 110 20 110= 120, 7 120— 150 3 A especificagdo pare esse tipo de material exige que o comprimento médio das pecas esteja compreendido entre $2 ¢ 96 mm, que 0 coeficiente de variacao seja inferior 2 20% e que a distribuisdo dos comprimentos seja simétrica. Quais dessas exigencias parecer nao estar satisfeitas no presente caso? 18, Uma distribuigao de freqiéncias é constituida por cinco classes de igual amplitude cujas ‘Frogbéncias relativas sao, respectivamente, 20%, 37.5%, 30%, 10% e 2,5%, Calcule ‘seu indice de assimetria de Pearson. 19. Caleule o coeficiente de assimettia, o indice de assimettia de Pearson € 0 coeficiente de ‘curtose para 0s dados: a) do exercicio 1; b) do exercicio 4; c) do exercicio 10; 4) do cexercicio 11; e) do exercicio 12. Amostragem — distribuicoes amostrais 3.1 INTRODUCAG Ja vimos que a Estatistica indutiva & a ciéncia que busca ret conclusées probabilisticas sobre as populagées, com base em resultados verificados em amostras reiradas dessas populagées. No Cap. 2 foram vistas as técnicas usuais para a descrigdo de um conjunto de dados. Em problemas de Estatistica Indutiva,tais conjuntos de dadcs seréo as amoscres retiradas das populagées de interesse. As maneitas pelas quais, a partic dessas amostras, tram-se conclusdes acerca de diversos aspectos das populagdes seréo examinadas nos capiculos subseqientes. Enaretanto nao basta que salbamos descrever convenientemente os dados da amostta ¢ que dominemos perfeitamente 2s técnicas estatisticas para que possamos executar, com éxito, um trabalho estatistico completo. Antes de tado, é preciso garantir ue a amostra ou “amostras que serao usadas sejam obtidas por processos adequades. Se erros palmares fore cometidos no momento de selecionar os elementos da amosira, 0 trabalho todo ficaré comprometido ¢ os resultados finais seréo provavelmente bastante incorretos. Devernos, portanto, tomar especial cuidado quanto aos critérios ue serio usados na selegdo da amostra, ‘© que é necessério garantis, em suma, é que a amostra sea representativa da populacdo, Isso significa que, a nio ser por pequenas discrepancias inerentes @ aleatoriedade sempre presente, em maior ou menor grau, no processo de amostragem, a amostra deve ter as ‘mesmas caracteristicas bisicas da populagdo, no que diz respeito a(s) variavel(is) que desejamos pesquisar. Annecessidade da representatividade da amostra ndo ¢, acreditamos, dificil de entender. (0 que talvez nao seja tao facil ¢ saber quando temos uma amostra representativa ou ndo. Veremos adiante algumas recomendagdes sobre como proceder para garantir, da melhor forma possivel, a representatividade da amostra, (Os problemas de amostragem podem ser mais ou menos complexos e sutis. dependendo das populagées e das variaveis que se deseja estudar. Na industria, onde amostras si0 Frequentemente retiradas para efeito de controle da qualidade dos produtos e materia, em 38 AMOSTRAGEM ~ OSTAIBUICOES AMOSTRANS ——— _getal os problemas de amostragem so mals simples de resolver. Por outro lado, em pesquisas sociais, econémicas ou de opiniao, a complexidade dos problemas de amostragem ¢ nor malmente bastante grande. Em tais casos, extreme cuidado deve ser tomado quanto & caracterizagao éa populago € 20 processo usado para selecionar a amostra, a fim de evitar que os elementos desta constituam um conjunto com caracteristicas fundamentalmente distintas das da populacéo. No caso de distribuicdo de questionérios, especial atensdo deve ser dada a sua elaborage, vsando evar pergutas cpciosas ou inibidoas, © que vita a dstorer os Em resumo, a odtencdo de solugdes adequadas para o problema de amostragem exige, ‘em geral, muito bom-senso e experiéncia. Além disso, ¢ muitas vezes conveniente que o trabalho do estatistico seja complementado pelo de um especialista no assunto em questo ‘No presente capitulo, vamos nos limita as recomendagbes bisicas referentes 20 problema de amostragem e & apresentagao das princigais técnicas de amostragem. Na pratica, os mais variados problemas adicionais poderdo surgic, devendo as respectivas solusdes ser pes quisadas em cada caso. 3.2 AMOSTRAGEM PROBABILISTICA Distinguiremos dois tipos de amostragem: a probabilistica e a néo-probabilistica. A amostiagem sera probabilistica se todos os elementos da populacdo tiverem probabilidade ‘ouhecida, e diferente de zero, de pertencer & amostre. Caso contraro, a amostragem sera do-probabilistica, Segundo essa definigao, a amostragem probabiistica implica um sorelo com regres bem eterinadas, cua realaagto 86 std pocsvel ea popuasio (or nite oalmente acessivel ‘Como veremos adiant, as técnicas da Estatstca Indutiva pressupdem que as amostras, utlizadas sejam probabllsticas, 0 que muitas vezes nao se pode conseguir. No entano © ‘bom-senso ir indicar quando o processo de amostragem, emibora nao sendo probabilstico, pode ser, para efelios priticos, considerado como tal Isso amplia consideravelmente as possibilidades de utlizacéo do método estatistco em geral. A.utilizagéo de uma amostragem probabilistca é a melhor recomendacéo que se deve fazer no sentido de se garantir a representatividade da amostra, pois 0 caso seré o tnico responsivel por eventuais discrepancias entre populagio e amostra, © que é levado em consideracdo pelos métodos de andlise da Estatistica Indutiva, Uma amostra que ndo seja tepresentativa da populacao & uma amestca viciada. 0 vicio ‘embucido nos dados provenientes dessa amostra é 0 vicio de amostragem. Sua utilizagio para efeito de inferéncia estatistica quanto a aspectos da populacio levard, por causa disso, 4 resultados que nao cortespondem a realidade. Nao ha outra forma de se evitar que isso ‘ocorra a nao ser procedendo & adequada coleta dos elementos que constituiréo a amostra, Além disso, alguma introspeccdo nos indicara que, a rigor, amostragem probabilistica 0 serd possivel em populagdes fnitas. Iso ndo nos impecira de suporaeeirada de amostas probabilisticas “de populacdo infintas”, pois estaremos pensando em populacSo sufcien- temente grandes para que Se comportem como ta amos a seguir algumas das principais técnicas de amostragem probabilistica. Outras poderdo também ser usadas, como combinagdo ou nao das descritas. AIVOSTRAGEM PROBABILISTCA 39 3.2.1 Amostragem casual simples Este tipo de amosttagem, também chamada de simples ao acaso, aleatéria, casual, simples, elemencar, randémica,"| etc, ¢ equivalente a um sore lotérica. Nela, todas os elementos dda populagao tém igual probabilidade de pertencer & amostra, ¢ todas as passiveis amostras ‘ém também igual probabilidade de ocorter. Sendo W/o nimero de elementos da populagdo ¢ 7m 0 nimero de elementes da amostra, «ada elemento da populacéo tem probabilidade n/N de pemtencer & amosta. A essa relacio Tilt denomina-se fracdo de amostrager. Por outro lado, sendo a amostragem feta sem reposigao, o que Suporertos em gera. exisiem (4) possivels amostras, todas igualmente provavels Na pratica, a amostragem simples ao acaso pode se realizada numerando-se a populagio de 1 aN, someando-se, a seguir, por melo de um dispositivo aleatSrio qualquer, n nimeros dessa segiiéncia, os guais coresponderio 20s elementos sorceados para @ amostra Na auséneia de algum programa de computador, um instrumento iit para se realizar 0 sorteio acima deserito €a cabela de numeras ao acaso. Ta tabela 6 simplesmente constituida Por inimeros digitos que foram obtidas por algum processo equivalente 2 um sorteio eghiprovavel (ver a Tab. 6.5). Hustremos sua uilizacZo com um exemplo. Sela uma populacto de 800 elementos, da qual desejamos tirar uma amostra casual simples de 50 elementos. Considerames a populagéo numerada de 001 2 800, sendo os ‘nimeros tomados sempre com trés algarismos. A seguit. soreamos um digito qualquer na nossa tabela, a partir do qual iremos considerar os grupos de és algarismos subseqlen- temente formados, os quais irdo indicar os elementos da amostra. Assim, se, a parti do onto sorteado para inicio do processo, os digitos cbservados forem 537418025856706.. 0s elementos sorteados para a amostra serdo os de ordem 537, 418, 023, 706, etc. Evidentemente, 0 grupo 856 fol desprezado, pois nao consta da populacao, como ‘seria também abandonado um grupo que jé tivesse aparecido (a ndo ser, € claro, que'se desejasse amostragem com reposicdo). Pt ‘0 processo, cbtém-se 0s 50 elementos desejades. Note-se que a decisdo de abandonar os grupos maiores que 800 ou repetides deve ser tomada antes de iniciado o processo, prevendo-se jétais ocomréncia, para evitar eventuais, Interferéncias do julgamento pessoal durante a reirada da amestra. Salvo mengao conta a venicas esatistcas que veremos nos capitulos subseqientes pressupdem a utlizagdo de uma amostragem casual simples ou algum processo que Ihe sea equivalents, Caso contro, devert ser tomados cuidades aconals, pare acoretaanllse dos dados. 3.2.2 Amostragem sistematica Quando os elementos da populacdo se apresentam ordenados ¢ a retirada dos elementos da aamostra € feita periodicamente, temos uma amestragem sistematica. Assim, por exemplo, em uma linha de produsdo, podemas, a cada dez itens produzdos, reticar um para pertenicet ‘uma amostra da producéo citria, 1 Dp ings random, it @ -acaso 3 A Ret 3 consti lima cbegatoa a ese respite 40 AMOSTRAGEM — DISTRIBUICOES AMOSTRAIS (Ou, entéo, voltando ao exemplo anterior om W = 800. n = 50 € a populacdo jé ordenada, poderiamos adotar o seguinte procedimento: sortear um niimero de 1 a 16 (note-se que ‘800/50 = 16), 0 qual indicatia o primeico elemento sorteado para a amostra; os demais, elementos setiam periodicamente cetirados de 16 em 16. Equivalentemente, poder-se-iam considerar os niimeros de 1 a 800 dispostos seqiencialmente em uma matriz com 50 linhas € 16 colunas. sorteando-se a seguir uma coluna, cujos nlimeros indicariam os elementos da amostra. Vemos que, nese caso, cada elemento da populagao ainda teria probabilidade S0/ 1800 de pertencer & amostra, porém existem agora apenas 16 possiveis amosiras. ‘A principal vantagem da amostragem sistemética esta na grande facllidade na deter minacao dos elementos da amostra. 0 perigo em adoti-la esté na possibilidade de existirern clclos de variagao da varlavel de interesse, especialmente se o periodo desses ciclos coincidic como periode de retireda dos elementos da amostra. Por outro lado se a ordem,dos elementos na populacéo néo tiver qualquer relacionamento com a varidvel de interesse, entio a amostragem sistematica tera efeitos equivalences & casual simples, podendo ser utlizada sem restrigbes. 3.2.3 Amostragem por canglomerados ‘Quando a populacio apresenta uma subdivisio em pequenes grupos, chamados congio- ‘erados, ¢possivel — e muitas vezes conveniente — fazer-se a amastragem por conslo- ‘merados, 2 qual consists em sorteat un nimero suficiente de conglomerados, cujos ele- rmentos constiuirdo @ amostra. Ou seja. as unidades de amostragem., sobre as quai € feito ‘9 soreio,passam a ser os congiomeradcs e ndo mals os elementos individuais da populac. Esse tipo de amostragem é as vezes adotado por motives de ordem priticae econémica, ou mesmo por razSes de viablidade. 3.2.4 Amostragem estratificada Muitas vezes, a populacéo se divide em subpopulagées ou escraras, sendo razoavel supor ue, de estrato para estrato, a variavel de interesse apresente um comportamento substan- cialmente diverso, tendo, entretanto, comportamento razoavelmente homogéneo dentro de cada estrato. Em tais casos, se 0 sorteio dos elementos da amestra for realizado sem se levar em consideracdo a existéncia dos estratos, pode acontecer que os diversos estratos no sejam convenientemente representados na amostra, a qual seria mais influenciada pelas caracreristicas da varlavel nos estratos mais favorecides pelo soreio. Evidentemente, a tendéncia a ocorréncia de tal fato sera tanto maior quanto menor o tamanho da amostra. Para evitar isso, pode-se adotar uma amostragem estratificada, cujo uso pode também se justificar para diminuir o tamanho da amostra sem perda da qualidade da informagao.. Deve-se notat, porém, que o uso da amostragem estratificada exige um cuidado adicional no calculo dos valores provenientes da armostra, como a média e a varincia (ver Ref. 3). Seria contraproducente, portanto, adoté-la quando a estratficacdo fosse apenas aparente, usa, no impicand difecentes comporamentes da varive de aeresse ois complicara desnecessariamente o processo. A amostragem estratificada consiste em especiicar quantos elementos da amostra sero retirados em cada estrato. E costume considerar tes tipos de amostragem estratificada: uniforme, proporcional e étima. Na amostragem estratiicada uniforme, sortela-se igual ‘namero de elementos em cada estato. Na preporcional, o nlmero de elementos sorteados em cada estrato ¢ proporcional ao nimero de elementos existentes no estato. AMOSTRAGEM PROBABLISTICA a ‘A amostragem estraificada 6tima, por sua vez, toma, em cada estrato, um niimero de elementos proporcional ao nimero de elementos do estrato e também a variacao da variavel de interesse no estrato, medida pelo seu desvio-padrao. Pretende-se assim oximizara obtencdo de informagses sobre a populacao, com base no principio de que. onde a variagao & menor, ‘menos elementos sao necessérios para bem caractetizar o comportamento da variavel. Dessa forma, com um menor nimero total de elementos na amostra, conseguir-se-ia uma quantidade de informacao equivalente a obtida nos demais casos. AS principals dificuldades para a utlizagdo desse tipo de amostragem residem nas complicacdes teéricas relacionadas com a analise dos dados ¢ em néo podermos, muitas vezes, avaliar de antemao 0 desvio-padro dda variavel nos diversos estratos. Exemplos em que uma amostragem estratficada parece ser recomendavel sao a estra~ tificagdo de uma cidade em bairros, quando se deseja investigar alguma variavel relacio- nada & tenda familiar; a estratificagao de uma populagéo humana em homeas ¢ mulheres, (ou por falxas etarias: a estratificagio de uma populagio de estudantes conforme suas especializagées, etc. 3.2.5 Amastragem miltipla Numa amaseragem miiipla, a amosta & retiada em diversas eapas sucessivas. Dependendo dos resultados observados, etapas suplementares podem ser dispensadas. Esse tipo de ‘amostagem €, muitas vezes, empregado na insperdo por amostragem,sendo paricularmente importante a amostragem dupia. Sua finalidade & diminuir © nimero médio de itens inspecionados a longo prazo, baixando assim 0 cusio da inspecao. Um caso extremo de amostragem multipla é a amostragem segiencial. A amostra vai sendo acrescida item por item, até se chegar a uma concluso no sentido de se aceitar ou rejeicar uma dada hipétese. Com a amostragem seqiencial, pretende-se tomar minim 0 nilmero médio de itens inspecionados a longo prazo. 3.3 AMOSTRAGEM NAG-PROBABILISTICA Amostras ndo-probabilisticas sio também, muitas vezes, empregadas em trabalhos ‘estatisticos, por simplicidade ou por impossibilidade de se obterem amostras probebilstcas, como seria desejével. Como em muitos casos os efeitos da utlizacdo de uma amostragem ‘ndo-probatilistica podem ser considerados equivalences acs de uma amostragem probs- bilistica, resulta que os processos ndo-probabilisticos de amostragem tm também sua importancia, Sua uilizagdo, entretanto, deve ser feita com reservas e com 2 convicgio de gue nao introduza vicio. Apresentamos a seguir alguns cascs de amostragem n&c- probabilistica 3.3.1 Inacessibilidade a toda a populagao Esta situagdo ocorre com muta ftegiéncia na praica. Somos entdo forcados a colher 2 amostra na parte da populagao que nos ¢ acessivel. Surge aqui, portanto, uma distingdo entre populagdo-objeto e populagdo amostrada. A populagao-objeto é aguela que temios em mente ao realizar o trabalho estatistico, Apenas uma part= dessa populacdo, porém, est acessivel para que dela retiremos a amostra. Essa pare € a populagio amostrada. Se as caracteristicas da varidvel de interesse forem as mesmas na populagdo-objeto € nna populago amostrada, entdo esse tipo de amostragem equivalera a uma amostragem probabilistca. 42 AMOSTRAGEM — OSTRIBUICOES AMOSTRAS ‘Uma siniagdo muito comumn em que ficamos diante da inacessbiidade a toda a populagdo 0 caso em que parte da populacdo nao tem existéncia real, ou seja, uma pare da populacao € ainda hipotética, Assim, por exemplo, seja a populacio que nos interessa constituida por todas as pecas produzidas por certa maquina, Ora, mesmo estando a maquina em funcio- rnamento normal, existe uma parte da populacao que é formada pelas pecas que ainda vio ser produzidas. Ou, entao, se nos interessar a populacdo de todos os portadores de febre ‘ifoide, estacemos diante de um caso semelhante. Deve-se notar que, em geral, estudos realizados com base nos elementos da populacdo amostrada terdo, na verdade, seu interes- se de aplicacdo volado para cs elementos restantes ¢a populagdo-objeto. Esse fato realca a imporéncia de se estar convencido de que as duas populastes podem ser consderadas como tendo as mesmas caracteristcas. ‘presente caso de amostragem nao-probabilsica pode ocorrer também quando, embora se tenha a possibilidade de atingir toda a populagdo, retiramos a amostra de uma parte que seja prontamente acessivel. Assim, se {Sssemos recolher uma amostra de um monte de mminério, poderiamos por simplificagao retirar a amostra de uma camada préxima da superficie do monte, pols 0 acesso as porcees interiores seria problematic, 3.3.2 Amostragem a esmo cu sem norma £ a amostragem em que o amostrador, para simpliicar 0 processo, procura ser aleatério sem, no encanto ealzar propriamente osorsio usando algun dispositive aleatério conBével. Por exemplo, se desejarmos retirar uma amostra de 100 parafusos de uma caixa contendo 10.000, evidentemente no faremos uma amostragem casual simples, pois seria extre- mamente trabalhosa, mas procederemos a retirada simplesmente a esmo.. 0s resultados da amosagem a esmo sio, em geral equivalents aos de uma amostragem probabilistica se a populacdo € homogénea ¢ se nao existe a possibilidade de o amostrador ser inconscientemente influenciado por alguma caracterstica dos elementos da populacao. 8.3.3 Populacdo formada por material continuo Nesse caso é impossivel realizar amostragem probabilistic devido a impraticabilidade de lum sortelo rigoroso. Se a populagdo for liquida ou gasosa. 0 que se costuma fazer, com resullado satistatério, & homogeneizé-la e retirar a amostra a eso. Tal procedimento pode as vezes, também, ser usado no caso de material solide, Outro procedimento que pode ser empregado nesses casos, especialmente quando a homogeneizagio nao ¢ praticavel, & a enquareagdo, a qual consiste em subdivic a populagio ‘em diversas partes (a origem do nome pressup6e a divisio em quatro partes), sorteando-se uma ou mais delas para consticuir a amostra ou para delas retrar a amostra, 3.3.4 Amostragens intencionais (no bom sentido) Enguadram-se aqui os diversos casos em que o amostrador deliberadamente escolhe certos elementos para pertencer & amostra, por julgar tais elementos bem representatives da populacéo. © perigo desse tipo de amostragem é obviamente grande, pols o amostrador pode faciimeate se equivecar em seu pré-julgamento. Apesar disso, 0 uso de amostragens intencionais, cu parcialmente intencicnais,é bastante freqiente, ccorendo em vats tpos DISTREIUCDES AMOSTAAS 43 de situagées reais, que poderiamos tentaridentificare classificar, Nao ofaremos, porém. por fugit & nossa fnalidade neste texto 3.3.5 Amostragem por voluntarios Cocorte, por exemplo, no caso da apicagso experimental de uma nova droge em pacientes, ‘quando a ética obriga que haja concordancia dos escolhidos. 3.4 DISTRIBUICOES AMOSTRAIS © pico que aborderemos agora é, de certa forma, uma ponte entre a Estatistica Descntiva a BstasticaIndutiva, Sua apresentag é fundamental para a bea compreensio de como se controem os métodos estatisticos de analise ¢ interpretacao dos dados, ou seja, os métodos a Estaistca Induiva. £ ag que o Calclo de Probeblidades vai se apresentar como a ferramentabasica de que se vale a EstatsicaIndutva para a elaborago de sua metodologia Suporemos, doravante, que as amostras sio representativas das populagSes, ou seja, ue foram obtidas por processos probabilisticos ou equivalentes e, salvo mengao em contrario, or amostragem casual simples. Ora, sendo a amostra aleasSria, todos os seus elementos fomecerdo valores aleatSrios da vatiavel de interesse. Ou seja, a amostra 6, para todos as, efeitos, constiruida por um conjunto de n valores aleatoriamente obtidos de alguma variavel. © conceito de distribuicdo de probabilidade de unta variével aleatria, fomecido pelo calcula de Probabilidades. sera agora utlizado para caracterizac a distribuigdo dos diversos valores de uma variével em uma populacéo. | comentamos que, quando pensamos em luma populagéo, em verdade nos interessamos pelo conjunto total de valores de alguma variavel de interesse. Esse conjunto total de valores encerra potencialmente uma variével aleatéria, cujos valores se manifestem a partir do instante em que passamos a sortear elementos dessa populacdo ¢ verificar os valores correspondentes de nossa variével. Logo. © conceit de discrbuic2o de probabilidade, muitas vezes apenas associado a idSia dinamica de varidvel aleatéria, pode ser estendido as populacées, ¢ efetivamente seré usado para descrevé-las ‘Ao retire uma amostra aleatéria de uma popillacdo, portato estarernos considerando cada valor da amostra como um valor de unia varidvel aleatéria cuja distribuigéo de Qropablidae ¢a mesma da opulagio no instant dareirada deste elemento ara aaiosza, claro que, sea amostragem for com reposigfo, todos os valores da amostaterdo a mesma distribuicdo de probabilldade ou, em outras palavras, serao igualmente distribuidos. 0s valores da amostra também serdofgualmente disuibuldos sea populacao fo infinia, pols, nesse caso, a retitada de alguns elementes nao modificard a distrbuigio de probabilidade da populagao. Na prética, em verdade, ndo encontraremos populagSes infinjtas que néo sejam hipotéticas, No entanto, podemos considerar como infinita uma populacao suficien- temente grande para que sua distibuigao de probabilidade se mantenha inalterada durante a retirada da amostra. Em conseqiiéacia do fato de os valores da amostra serem aleatérios, decorre que qualquer quanudade calclada em fungdo ds elements da amosra também seré uma varivel Chamaremos os valores calculados em fungao dos elementos da amostra de estaristicas. As estatisticas, sendo varidveis aleatérias,terdo alguma distibuigo de probabilidade, com uma média, uma variancia, etc. A distibuicdo de probabllidade de uma estatistica chama- se comumente distribuigdo amoscral ou distribuigdo por amoscragem: 44 ANOSTRAGEM — DISTRIBUIODES AMCSTRAS Outre mancira pela qual se pode interpretar a distribuicdo de probabilidade de uma estatistica € considerando a distribuigao da populacao de todos os valores que podem ser obtidos para essa esttistica, em funcdo de todas as amostras possiveis de Ser reiradas da populagao original.(*1 Convencionaremos, doravante, usar simbolos ndo-indexados para os pardmexros popula- cionais, 20 passo que os parametias corespondentes as distibuigbes amostais conterdo uma indicagdo quanto a estatisica a qual se referem. Assim, ir inicar a média de uma populacao, ou sea, da distrbuicao de probabllidades ¢a varavel de interesse na populacao, enquanto que wz, u(i),ou £(F) denotario a média da distabulpio amostral da estatstca Da mesma forma, o3 ou 0°(F) designam a variincia da distribuigdo amostral de £ ¢ 0°, a variéncia populacional, Note-se que ulizamos,proposialmente, simbolos diferentes para as medidas da amostra ¢ os pardmetres€a popuagdo, a fim de promover 3 Indspensavel caracieizagio de cada um. Veremes a seguir algumas distribuiges amostrais que teréo grande utllizagio nos capitulos seguintes. Outras seréo mencionadas e comentadas em outros pontos do texto, Sempre que necessért. 3.4.1. Distribuicao amostral de x Determinemos as principals carateristicas da distibuigdo amostral da estatistica F, média de uma amostra de elementos. Sendo a populacd infinita ou a amostagem fia com reposicéo, resulta que os diverse valores da amostra podem ser considerados valores de variavelsaleatérias independentes, com a mesma distibuigdo de probabilidade da populacdo, poreanto com a mesma média we ‘a mesma vatiancia 0? da popula¢éo. Do Calculo de Probabilidades, sabemos que:!" 2) uliplicando cs valores de uma vatiével aleatbria por uma constante, a médla fica muldplicada por essa constant; b) a média de uma soma de variéveisaleatorias € igual & soma das médias dessas variéves. Lembrando que 6) ¢ usando as propriedades, temos HB)= Lata) esdag)etala)= ernst adedmen, (62) 5 Usando um concelo matemdico fegerse, dada una populagio de valores, azavés de sua distibuigao e probabildade, e ura esatistica defnida em fungdo de uma amosta de ni elementos, cbtida por um rocesso de amestragem bem deinid,reremos uma dsuibuivao amoral gerade por essa popula ¢ por ‘sa enatsnca. Ser reso, sas para a kia ppsaciond, onmasano com a més aes Da mesma forma, o* designa a varlania populadal (¢ & © desvio-padrde), a0 passo que s* designa a varncia arostal (¢ 0 desve-padcio) a {5s quatro propriedades mencionadas em seguida sie ctadas no Ap.1.em A1.2.4¢A1.2.5.Aspropediades ‘zee ja fram wambém apresentadas no Cap. 2, em irmes de distbuigGes de frequéncias OISTRBUIGDES ANOSTRASS 45 ‘Vemos, portanto, que a média em tomo da qual deve varar os possiveis valores da estatisca ¥ € a propria médiay éa populacdo. Um resultado que nao deixa de serintuitivo. Esse resultado ¢ extensivo a0 caso de amostragem sem ceposicio de populagdesfinitas, pois 2 aplicagdo da propriedade (b) ndo exige a independéncia das variavels x; ¢ todas essas variaveis tem a mesma distribuigdo de probabilidade quando apriorisicamente consideradas em relagdo ao processo de amostragem. ‘Quanto 4 variincia, o Céleulo de Probabilidades nos ensina que: )__maultipticande os valores de uma varidvel aleatéria por uma constante, a verincia fica multipicada pelo quadrado dessa constante: 44) avariancia de uma soma de variaveis aleatérias independentes é igual a soma das vanancias. Logo. lembrando (3.1) e usando as propriedades, temos om): (leurs +0%(x,))=4 fot +02 +--+03) a) Pans oa) ee ‘Vermos, porranto, que a variancia com que se dispersam os possiveis valores da estatistica én vezes menor que a variancia da populacdo de onde ¢ retirada a amosta. Iso se deve 1 propria esséncia o processo aleatério. que faz com que haja, denuro da amostra, uma natural compensagio entre valores mais elevados e valores mais baixos, produzindo valores de ¥ que tendem a ser tanto mais préximos da média w da populagdo quanto maior 0 tamanko da amostra 7. Resulta imediatamente que oR=02 9 64) No caso de amostragem sem reposigao de populagées finitas, em que a independéncia ‘entre os valores x; no se verifica, demonstra-se que one onde WV € 0 ntimero de elementos da populagéo eo fator Nv. N-1 5) & chamado fator de populagdo finita. Note-se que esse fatartende a unidade quando 0 tamanko da populacéo tende ac infinito. Além disso, sendo esse fator menor gue 1, tem-se {ue o2(2) sera menor para populagdes fnitas que para populacdes supostasinfntaments grandes. Quanto & forma da distibuigdo amostal de Z, setemas também auxllados por dois lmportantes resultados do Calculo de Probabldades. Esses resultados sdo dados pelo “teorema das combinagées lineares (de varidveis normais inéependentes)”e pelo “teorema do limite fezntral", ambos enunciados no Ap. 1 (item A1.4.3) Assim, se a dstibuigio da populagio for normal, a disuibuigdo amostal de F sera também normal para qualquer tamanho de amostra, devido 20 primeito teorema, pois 46 AMOSTRAGEM — OSTAISUICOES AMOSTAAIS Figura 3.1 Disrrtuicdo smosral (de X — populecso nermal of = Distrbuigse emostral de £ Distribuigde de papuiecdo sera, entZo, uma combinaco linear de variéveis normais independentes {4 Na Fig. 3.1. Drocuramos representar um caso genérico envolvendo a distribuigao amostral de ¥ no caso de populacéo normal. Por outro lado, se a distibuiggo da populagio nao for normal, mas a amostra for suficientemente grande, resutaré, do teorerma do limite central, que, no caso de populacao infinta ou amostragem com reposieao, a distibuicdo amostal de F sera aproximadamente ‘normal, pois 0 valor de ¥ resulta de uma soma de um niimero grande de varaveis aleatorias independentes. Sendo aproximada, essa conclusio é extensivel ao caso de amostragem ‘sem reposigo de populagdes finitas, porém razoavelmente grandes. Na prética, uma amostra sufcientemente grande para que jé se.possa aproximar a Aistribuigdo de ¥ por uma normal no necessita ser muito grande, especialmente quanto mais simétrica ou prOxima da normalidade fora distibuicdo da populacdo. Em muitos casos, tama amostra de quatro ou cinco elementos jé € suficiente Na Fig. 3.2 temos uma distrbuicdo populacional ndo-normal e a correspondente distibuigao amostral de X para um tamanho de amostra suficientemente grande. Distrbuicso amostral de Z Diserbuicdo da popuiactio im ‘Note ge que considera normal a cstibuigo da populacao implica, a igor, admidr que a popalacio & infinka. Enetanto a aplcage dese resulado a populagdesEnitas€ vada, em terms PASCO, em Mos DISTRSILICOES AMOSTRAIS 47 ad 8.4.2 Distribuigdes amostrais de fe p’ Cconsideremos agora a freqQiéncia/ com que foi observada alguma caracteristica na amostra Essa caracteristica poderd ser uma das classificagdes de uma varlével qualltativa, um ou mais valores de uma varlavel quantitativa disereta, ou o fato de um valor de uma variavel guantitativa continua cair em um dado intervalo. A frequéncia /€ uma estatistica, pois ¢ determinada em fungao dos elementos da amostea. Evidentemente, podemos, para cada elemento da amostr,considerar a ocorréncia de tum sucesso, caso a caracteristica desojada se verifique, ede um fracasso, em caso contrac. Sela p a probabilidade de ocorréncia de sucesso para cada elemento da amostra. Se a populacéo € infinita ou a amostragem é feita com ceposicdo, p & constante para todos os elementos da amostra, ¢ os resultados observados para todos eles serao independentes. Nessas condigées, 0 Céleulo de Probabilidades nos ensina que a distribuigéo amostral de reqiéncia f seré uma distribuigdo binomial de pardmetros n e p, seguindo-se. pelas propriedadés da distribuigdo binomial, que w=. (3.6) OU) =nAl-P) 67 A freqdncia relativa p’, por sua vez, sendo simplesmente o quociente de fpelo amano da amostra n, terd média’e variincia que séo acilmente obtidas pela aplicacdo das propriedades (2) e (c), vistas em 3.4.1. Assim, temos wood anno L)= hot f= fpnm-2)- 2. 39) © tpo de distribuigao de p’ continua, para todos os efeitos, sendo uma distribuigao binomial, porém cujos possivels valores foram comprimidos entre 0 # 1 com intervalos de I/n, a0 invés de variarem de O an segundo os némeros naturas, 0 que ocorre na distribuigdo binomial propriamente dita. endo aamstrasucentmente grande, pdemossprenimar a diuises def 2" por distbuicSes normais de mesma media e mesmo desvio-padrdo. Em termos praticos, em ‘geral, podemes considerar que a amosira seré suficientemente grande, para efeito dessa aproximagao, se np 2 5en(1 =p) 25. w= ne= p. 68) 3.4.3 Graus de liberdade de uma estatistica Afiemamos em 2.3.3 que a variancia de uma amostra deve ser calculada por Ein -F (8.10) ” ‘por expressbes equivalente. A razSo pela qual se recomenda usar 1 20invés de ano denominador da expressio secd apresentada no Cap. 4. No entanto antecipamos que a necessidade dessa corresao est relacionada com o nimero de graus de liberdade dessa tstatistca, A questic dos graus de lberdade é, possivelmente, absrta, mas procuraremos Tusté-la melhor a seguie. Hn) 48 AMOSTRAGENM — DSTAISUIOUES AMOSTRASS ee ‘Tomemos, por exemplo, as estatisticas # = xn ¢ Eh (x)— p)2/n."" Essas estatis- ticas tém m graus de liberdade ¢ tl fato pode ser entendido como indicando aver n valores 4% livres que devem ser considerados para podermos calcular o valor da estatistica. Em otras palavras, se desconhecermos quaisquer dos valores x, da amostra, nao poderemos dererminar o valor da estatistica, pois todos os valores da amostra sio livres, podendo variaraleatoriamente. Ja a estatistica s*(x), conforme definida na expressio (5.10), por usar ¥ ao invés do parémetro populacional 4, tem um grau de liberdade a menos. Isso porque o calculo dessa ‘estatistica pressupde qué anterlormente ja se tenha calculado 2, para o que usamos ja uma vez todos os valores da amestra, 0s quaisestariam sendo usados pela segunda vez para 0 céleulo de 52.9 Ora, no momento de usarmos novamente os valores da amestra para 0 céloulo de 5%, esses valores tém apenas 1 ~ 1 graus de liberdade, pols, dados quaisquer = 1 deles, o valor restante estard perfetamente determinado, pelo fato de a conhecemos sua média artmética.¥, nao sendo, portanto, live. ‘Outra interpretacéo poderd ser dada geometricamente, se considerarmos os n valores de uma amostra como comespondendo a um poato num espago n-dimensional. O valor de uma estatistica qualquer definida em fungéo dos valotes dessa amostra pode ser considerado fFungzo do ponto correspondente nesse espaco. Se. para o calculo dessa estatistica, vamos -vetificar pela primeira vez 05 valores da amostra, teremos n graus de lberdade, ou seja, © ponto correspondente rem a possibilidade de se deslocar conforme as n dcecSes do espago. Se, porém, como no caso des, ja conhecernos Z, isso implica uma resticao Hear entze 03 valores, pois Ay tag tet ty an (Ora, essa éa expressio de um hiperplano no espaco n-dimensional, sigificande que o pono considerado deve estar sobre esse hiperplano, tendo. pols, um grau de liberdade a menos. A introdugao de cutras restrigbes levaria & perda de mais graus de lberdace. Por outto lado, torna-se claro que os valores da amostra podem ser usados para o célculo de estatistcas independentes no maximo n vezes, apés o que ndo haveria mais graus de iberdade e, poranto, qualquer consulta & amostr seria desnecessiria. Adotaremos. simbclo ¥ para denotar 0 nimero de graus de iberdade de uma estatistca 3.4.4. Distribui¢&o amostral de s*— distribuigdes y° JA sabemos que a variancia de uma amostra deve ser calculada por (3.10), y= Hal ‘ou por outras expressées equivalentes. A distribuicdo amostral da estatistica s(x), conforme definida em (3.10), esté telacionada com uma famifia de distribuigdes de probabilidades de grande importancia em diversos problemas de Estatistica Indutiva, que so as distribuigdes tipo 37. Devemos, esa enaistica sed comentada no capitulo segues "Na expresso ciada note, a necesidade de conhecemmos Fed evident, porém as deals| para cdleuo de 3, como (2.12) ea @.13) também contém 7, emiboraimpictamente, conform anterormente €: Pronuncia-se gui quadrado™ OSTASILICIES AMOSTAAIS 43 eR poranto, preliminarmente, apresentar ao leitor essa familia de disribuigGes,Diremos que a esatstica 2 (54) feats (B.11) onde x; sio valores aleatbris independentemente retirades de wma populacdo normal de meédia je desvio-padrao «, tem distibuicao 72 com v graus de liberéade. Tal denominacao deve-se a Karl Pearson. Os valores em (3.11) so 0s correspondentes valores da variavel normal reduzids. 0"! Podemes, poranio, considerar a distibuicdo da vanavel 7 com v jgraus de liberdade como a soma dos quadrados de v valores independentes da variével normal reduzida Do fato de que u(z%) = 1, (0 segue-se que HOR) = (Ef, 22) = mle) =v. (12) Poderse-a também mostar que oun 6.15) € que a moda da distribuigdo de 72 & v - 2, para v > 2. Além disso, como a variavel 7? resulta de uma soma de varidveis independentes e igualmente disribuidas, segue-se Go teorema do limite central que a familia de distribuigdes do tipo x? tende a distribuiéo nor- mal quando o niémero de graus de liberdade aumenta, COutra imporzantepropriedade das discibuigées tipo 7? é sua adiividade. Essa propriedade significa que a soma de duas variaveis independentes com distribuigées 7° com ¥ ¢ ¥2 ‘graus de liberdade terd também distribuicao 7 com v, + v2 graus de fberdade. Essa propriedade decorre imediatamente da definicdo da distibuicée 22, conforme expressa pela telagéo (6.11). A Fig. 3.3 mostra algumas distibuigGes da familia 42, Por outro lado, a Tab. A6.2 fornece valores das variéveis 74, para v = 1. 2, .., 30, em fungdo de valores notaveis da probabilidade comespondente & cauda a direita determinada na tespectiva distribuicéo.'7) {Assim, por exemplo, se entramos na ab, A6.2 coma P= 10% e Y= 3, lereoso valor ‘23 = 6,251. [sso sigrfca que a protablidade de um valor aleatério da vardvel 3 ser maior 0 que 6,251 & 10%. Para v > 30, os valores de 9 poderdo ser obtides pelo uso de aproximagées. Recomendamos a seguinte: 3 ) : 14) Bil vgja A144, no ap. 1 1A emenmnie des conse ra eet con (20, ue [eee 1 expresso anata das fangs densiade de pobablidade das disuse 7? € dada no Ap. 4. narmente com as dos disabustes ce F,defides a segs, : Bsa aproximardoé melhor que o auto metodo, propose anteormente por Fisher, que consists em st tomar x} 242+ 27-17, 50 ANOSTRAGEN. — DISTREUICES AVOSTRAIS ® 0 2 4 6 8 10 12 14 ‘onde 2 € o valor da varidvel normal reduzida que comesponde em probabilidade ao 22 Adesejado, isto é, tal que a probabilidade & dreita de z seja igual a probabilidade a direita d¢ 22. has respectivas distibuigbes, © conhecimento das distribuigbes 2? nos leva & determinagao da distabuigdo amostral a estatisticas*, conforme segue. Podé-se demonstrar que a estatistica nn {fia 6.15) abtida por substnigéo de u por F na expresséo (5:11), tem distrbuiggo do tipo 22 com rn i graus de Iberlade, Loge, demos tsrever, 2. Eat - FP ant Eh FF ened = RA Bale , 6.16) donde resulta e s. aah ean \Vemos, pois, que, a menos de uma constante,aestatisticas, variancia de uma amostra extrafda de populagdo nommalmente distibuida, se distribu conforme uma distibuiggo do tipo 7? com n~ 1 graus de liberdade. Examingndo a expressdo (3.17) ¢ lembrando o resultado obtido em (3.12), compro- ‘vamos que s*, conforme definido em (3.10), tem por média 6.18) OISTRBWUICDES AMOSTRAIS 51 Por outro lado, temos também, de (3.15) ¢ da propriedade expressa em (A1.40), que of 20 ae? G19) 22. peti 3.4.5 Distribuiedes ¢ de Student"! ‘Suponthamos que. a partir de uma amostra de n valores de média we desvio-padrao or fosse definida a estatistica itados de uma populagdo normal (3.20) Como a distcbuigio amestral de ¥ sera precisarente normal, com méiau ¢desv padrio an, segue-se que essa estatistica teria simplesmente dstsbuigdo normal reduzida, 5 que justifica ose do simbolo 2 em (3.20). Entretanto, se usarmos em (5.20) 0 desvio-padrao da amostra, obteremos uma estatistica ‘cuja distribuigao nao mais é normal. De fato. conforme mostrou Student. a estatistica SoH 6.21 ST ea distribui-se simetricamente, com média 0, porém no normaimente, E claro que, para amostras grandes, s, deve ser prOximo de o, € as correspondences distbuigdes ¢ deve estar proximas da nérmal ceduzida. Vemos. pois. que existe uma familia de disuribuigdes ¢ cuja forma tende a distribuigdo normal reduzida quando n eresce, Note-se que a estatistca efinida em (3.21) tem 1 graus de liberdade, o que jusificatia sua denotagao pot fy. A Fig. 3.4 procura llustrar comparativamente uma distribuigio ¢¢ a distibuigdo nor- mal reduzida 2. Vemos que uma distribuicao r genérica € mais alongada que a normal reduzida. Por outto lado, a Tab. A6.5 fornece valores de ¢ em fungao de diversos valores do niimero de graus de Iberdade ¥ de probablidades notaveis, comespondentes a cauda & Figure 3.4 Cistribuigsot e cistibuieso normal recuzi¢s. ATW. 5. Gesset, esasizo ings que publican seus wabalhos sob opseudénimo de Saude. 52 ANMOSTRAGEM — D'STABUICOES AVOSTRAS direita na respectiva distibuigao. Assim, por exemplo, entrando-se na tabela com a probabilidade P = 0,025 e = 50, lemos 0 valor ésp = 2,008. 18S significa, dada a simetia das distibuiges ¢, que Plcgo > 2,008) = Peay <-2,008) = 0.025, Nove-se que esse Valor de op € a muito préximo do correspondente Valor ¢. = 2 = 1,960. € importante notar que a expresséo (5.21) pode ser escrita, oh Sard. 6.22) Relembrando (5.17), temos, poranto, 6.23) ou, mats genesamente, woah 624 sg expresso nos mosraorelconamentoexstens en as dsibugbes¢ de Sar dence z 3.4.6 Distribuiodes F de Snedecor Suponhamos que duas amostras independentes reradas de populagdes nommais foregam variancias amostras s? es, e que desejemes conhecer a disibuicde amostal do quociente HSE isso sera possivel através do conhecimento das diswbuigses F de Snedecon* Define-se a variavel / com v, graus de liberdade no numterador¢ vs graus de liberdade no denominador, ou, simplesmente, Fy, ry. Pot am Fan Bie 3.28) onde, conforme a prépria notacao indica, 2 designa uma variével aeatéria com distribui- cdo x? com v;graus de liberdade. As dstribuigées 7° consideradas devem ser independentes. Evidentemente, a definigao geral precedente engloba uma familia de distbuigées de probabilidade para cada par de valores (v.72). Na Tab. A6.4, tems 0s valores da variavel F que determinama caudes & direita com probabilidades 0,5: 1:2,5: 5 ¢ 10%, fomecidos para diversos pares de valores de vse Vs. Assim, por exemplo, se entrarmos na Tab. A6.4 com P= 5%, v, = 5 ev, =20, leremos ‘valor F=2.71. ls quer dizer que, na distribuicde Fcom § graus de liberdade no numerador 20 graus de liberdade no denominador, a probabilidade de se obter um valor aleas6rio superior a 2,71 ¢ igual a 5%, conforme esquematizado na Fig. 3.5. 16 sGo mui dfundias, embém, tabelas em que aprobabldade de enwrada referee a Guas caudsssimé- ticas da dstbuigao, Recomendamos ao lehor algum euidado para evitarequivocesno.uso das tabelas de [8 Snedecor adaptou convenientementeescas dstibuiées, jf estudadas antes sob outa forma por Fshec Ele adotou a denotagao Fem homtenagem 20 grande estastco ings R.A. Fisher. que desanvelvea S=——————— 33 58 SH SESH 35 34 30 3736333580 a a S435 HS HSS ST a 33 52 4 SSS SOSH 3636 53 kkk 59 40 40 «4239584404040 | er 3940 41404023859 380 a) Uma amostra simples ao acaso de dez dispositivos foi cetirada da populacéo de em dispositives, com auxilio dos niimeros aleatérios da Tab. A6.5. 0 processo de utilizagio da tabela foi o usual, com inicio no digito situado na intersegdo da quinta linha com a oitava coluna da referida tabela. A seguir, oi calculada a resisténcia clétrica média da amostra de dez dispositivos. Que valor vocé acha que foi cbtido para essa média? ») Suponha agora que se pensasse em fazer ammostragem estaiicada. Em sua opiniéo, seria isso razcavel, no caso? Caso afrmative.indigue como voce procedetiay ainda uclizando os nimeros aeatérios. Suponha que © mimeo total de disposiivos a examinar na amostra continue sendo de2, ©) Suponha agora que tivesse sido utlizada amostragem estratificada uniforme, num ‘oval ainda de dez dispositivos examinados, e que tivessem sido abtidos, no primero © no segundo estratos, respectivamente, 2, = 33,8 @€; = 40,2, Em quanto voce estimaria a média da populagdo de cem dispositivos? 4) Suponha agora que, dos setenta dispositivos provenientes do fornecedor A, tenha sido colhida uma amostra sistematica de dez dispositves, sendo constante o periodo de retirada dos elementos para a amostra e sendo conhecido que o segundo dispositive a entrar no almoxarifado (cujo valor da resisténcia elétrica € 38) Pertencia a essa amostra. Calcule 2 média dos valores da resisténcia elétrica dbservades nessa amostra, 4 6. A média e a variéncia de uma populacdo eqiiprovavel, cujos possiveis valores so os inteiros 1, 2, 3¢ 4, slo u=2,5 € o? = 1,25. Considere a distribuigdo amostral de ? para amostras de'n = 2 elementos e determine sua média e variancia, suponéo: a) populagdo infinita: ) populacéo fnita formada por doze elementos ¢ amostragem com reposicio. Verifique a validade das express6es (5.2) ¢ (3.3) do texto, 56 AMOSTRAGEM — DISTRBUICOES AMOSTRAIS 7. Resolva o problema anterior supondo amostragem sem reposigao e populagéo fina formada par: a) doze elementos; by quatio elementos. \Verifique a validade das expressdes (3.2) e (3.5) do texto, em cada caso. ‘8. Para qualquer um dos casos (a) ou (b) do exerccio 6, conscrua a distribuigdo amostral de ¥ supondo agora n = 5. Faca o grafico dessa distribuicao e interprete sua forma, 9, Para a mesma situacéo descrita no exercicio 6, construa a distribuicéo amostral das amplitudes das amostras. 10, Uma populacdo equiprovavel de valores inteiros que podem variar de 0 a 99 tem médlia. = 49,5 e desvio-padrio o = 29. Usando a tabela de nimeros ao acaso para simular a obtencio de valores dessa populacéo, retire uma amostra de n = 25. Calcule sua média desvio-padrdo, Obtenha, por processo andlogo, mais cinco amostras aleatias dessa populagao ¢ calcule suas médias. Caleule o desvio-padrdo da amostra formada pelos s2is valores de obtidos e compare com o desvic-padrao da primeira amostra retiada. Como interpretar 0 resultado dessa comparacao? Estimactio de pardmetros 4.1 INTRODUCAO ‘Passamos, a partir de agora, a considerar problemas de Estatistca indutiva. Conforme vimos no Cap. 1, 0 objetivo da Estatistica Indutiva € tirar conclusées probabilistcas sobre aspectos das populagses, com base na observagao de amostras extraidas dessas populagées, visando 2 tomada de decisées. Para chegarmos ao ponto de poder abordar tais problemas, foi necessério que recoméssemos a diversos conceitos basices do Célculo de Probabilidades € vvissemos como tratar 05 conjuntos de dados através da Estatistica Descrtiva. Doravante, 98 conjuntos de dados disponiveis serdo considerados como amostras representativas retiradas das populagbes de interesse. Essas amostras servirdo de base para as inferéncias ue serdo feitas acerca das respectivas populagies. (0s problemas de Estatistica Indutiva podem ser considerados subdividides em dois grandes grupos: os problemas de estimacto eos de testes de hipéteses. Neste capitulo vamos nos ocupar dos primeitos apenas no que diz respeito & estimacdo de pardmetros de uma distibuigéo populacional. Outros tpes de problema de estimacdo serdo vistos, por exemplo, n0 Cap. 8, © calculo de Probabitidades nos fornece varios modelos de distibuicao tedrica,tais como binominal, hipergeomética, de Poisson, normal, etc"! Tais modelos representam, em verdade, familias de distibuigSes que dependem de um ou mais pardmetros basicos. Assim, por exemplo, uma distibulgio normal s6 ficaré perfeamente caracterizada se conhecermos, direta ou indiretamente, seus dois pardmetras bésicos, u e o, Ora, quando descrevemos uma populagao estatistca, fazemos isso por meio de algum modelo teorico de disuibulcdo de probabilidades, cujos parémetros, portanto, devem ser estimados da melhor forma possivel com base nos resultados amostras Devemos notar que o préptio fato de tentarmos descrever uma populacao de valores ‘por meio de um modelo teérico jd implice um procedimento de nacureaa semelhante ao da ‘estimagdo. Entretanto chamaremos a centativa de se caracterizar a forma da distribuicko da populagao de problema de especificacdo, erminclogia introduzia por Fisher Bi vero apt Isic. A. Fisher, estatsteo inglés. Ver nota 16 na pga $2. 58 ESTIMACAO DE PARAMETROS Assim, quando admitimos que a populagdo de todos os diametros das pecas produzidas for uma maquina é conveniencemente descita por um modelo normal (0 que nem sempre € verdade), estamos especificando a forma da distribuigao dos valores da variavel na populagéc. Estamos procedendo analogamente quando admitimos que o nimero de dfeitos por aparelho de celevisio produzido em certa linka de montagem € uma variavel que se ‘comporsa segundo um modelo de Poisson Evidentemente, a tarefa de especificasio da forma da distribuicdo da populacéo pode ser orientada pela corweniente representacéo grética dos dados da amostra disponivel. Por ‘outro lado, existem testes que permitem avaliar a representatividade do modelo teérico propasto para a populagao, os quas serdo estudados no Cap. 6. Entetanto o que nos preocupa por ora €0 problema da estimacdo des parametios do modelo adorado para a representacao da populagdo, modelo que suporemos, em varios casos, conhecido.© ‘Tomemos 0 seguinte exemplo: suponhamos que, em uma cidade com A’ habitantes, cexista uma proporeao p de aralfabetos. Se dessa cidade retirarmos uma amostra aleatéria den habitantes, saberemos, eoricamente, calcular a probabilidade de que haja entre eles.x analfabetos. 1ss0 seria feito pela aplicagdo do modelo hipergeométrico de distribuigao de probabilidade ou, com boa aproximacio, para n << N, pelo modelo binomial. Esse seria, tipicamente, um problema de Célculo de Probabilidade. Noce-se, porém, que, para resolver 6 problema, deveriamos conhecer o pardmetro populacional p problema real que muitas vezes enfrentamos, entetanto, surge quando desconhecemos © parammetro populacional, Devemos entio estima-io, usando, para tanto. a evidéncia ex- perimental. Assim, no exemplo citado, sea amostra det habitantes apresentou x analfebetos, Drecisemos saber'de que forma esse faio deverd ser usado no sentido de obtermos uma ‘estimativa para p, ou a determinacao de uma faixa de valores na qual p estaré contido com cera probabilidade. Esse problema pode ser resolvido com base fio conhecimento da istribuido de probabilidade da variével x. Em resumo, vamos, no presente capitulo, supor que os valores na populacio se distibuam segundo um dado modelo de distribuigao de probabilidade cujos parametros, ‘entretanto, sao desconhecidos e, portanto, necessitam ser estimados. ‘Varios distinguir dois casos de estimacdo de parametros: por ponto ¢ por intervalo. No primeiro caso, provederemos a estimativa do pardmetro populacional através de um nico ‘valor estimado, 20 passo que, no segundo, construiremos um intervalo, o qual deverd, com probatilidade conhecida, conter o pardmetro. Uma suposicdo fundamental é a de que as ‘amosizas sio probabilisticas. O processo de amostragem seré, salvo menigio em contrério, ‘suposto como sendo o de amostragem casual simples ou eguivalente. 4.2 ESTIMADOR E ESTIMATIVA ‘Chamamos de estimador a quantidade, calculada em fungdo dos elementos da amostra, que serd usada no processo de estimagdo do pardmetro desejado.O estimador 6. como veinos, uma estatstica.Seré, poranto, uma vatiavelaleatériacaracterizada por uma distibuigdo de probabilidade e seus respectives pacametros prdprios. Echamaremos de estimaciva cada particular valor assumido por um estimador. Usaremos a seguinte notacéo: '= parameto a ser estimado; 7= um estimador de 6; ¢ = uma dada estimativ ‘Basa posto ¢pausivel pois, em multos cases, podemosantecpar, com rzaivel preisto, um modele paraa disttbuieao da quer por mein de consderages eéicas, quer pea expeténcia peta. Os ‘exemple ckados no parbgra antenor so tpcos de dsurbugdes em geral confiadss pela praca. eSTIMADOR E ESTIMATIVA 59 Acestimago por ponto consistra simplesmente em, & falta de melhor informacéo, adotar 1 estimativa disponivel como sendo o valor do pardmetto. A idéia &, em sua esséncia, cextremamente simples, porém a qualidade dos resultados ira depender fandamentalmente da conveniente escolha do estimadot. Assim, dentre 08 varios estimadores razoaveis que poderemos imaginar para um determinado parimetro, deveremos ter a preocupacio de fscolher aquele que melhor satisfaga as proptiedades de umm bom estimador. As principals ‘enite essas propriedades serio vistas a segui. 4.2.1 Propriedades dos estimadores"*! Justeza ou ndo-tendenciosidade Diremos que um estimador 7 justo (ou néo-tendencioso, ou no-viciado, ov ndo-viesado} se sua média (ou expectancia) for o préprio paramerro que se pretende estimar, isto é, Mn=8 (aay Isso significa que 0s valores aleatéries de 7 ocorrerio ema tomo do valor do parémetro @, 0 que é, obviamente, desefavel A.adogio de um estimador que nao seja justo nos levard a incorrer no via de estimacao, ‘ou vies, De fato, se a média da distribuigdo amostral do estimador néo é igual ao valor do ppardimetro, esse estimador fomecerd estimativas em tome de outro valor que no o pardmetro, configurando estimativas viciadas, ou viesadas. Consisténcia Diremios que um estimador 7 € consistente se 1im,...| 7-6 |2«)=0 (42) para todo e > 0. Isso significa, em termos praticos, que, sendo o estimador consistent, ppode-se, com amostras suficientemente grandes, tomar o erto de estimagio tio pequeno ‘quanto Se queira. Por outro lado, se o estimador for justo, a condigao de consistEncia equi- vale a dizer que Sua vatiancia tende a zero quando 0 tamanho da amostra tende a infinito, isto é, lin,_.*(7)=0. 43) YVemes que, para estimadores justos € consistentes, podemos obter estimativas tdo préximas quanto desejamos do valor real do parimetro, desde que aumentemos sulicien- femente o tamanho da amostra. Nessas condigbes, suponde o caso-lmite de uma amostra infinitamente grande,( a estmativa cbtda ila colncidir exatamente com 0 parémeto estimade. (© ko defini essa propridades, exaremes pressupendo uma fungio de prda quadrtcaassodada ao eo de esimagéo. Para alors eslarecimentas, vel, por exemplo, a Ref. 15. {© Brames imaginando, claro, caso de uma populagéoininka, Sendo Brita a populago, uma estimaiva cexata seria teoncamente obtida apenas se falssemos a amosia se tomar gual & popalapio inte