Você está na página 1de 320
MANUAL DE ESTATISTICA PORTUGAL INSTITUTO NACIONAL DE ESTATISTICA MANUAL ESTATISTICA POR Amaro D. Guerreiro LrorNcrapo wt caSso14s weondutca E PMARUEIIAS b, arte, eeos. (OXFORD) 1947 TIPOGRAFIA MATEMATICA, LDA. LISBOA PREFACIO © aparecimonto do presente livro resulia da observagio de dois factos: 0 primeiro & @ pequena expansito que os estudos de ‘Estatietion tem no nosso Pais; o segundo 4 a existincia de uma escassa, bibléografia de Hstatistica em lingua portugnesa, Se 6 segundo facto € causa ou efeito, ov ainda causa ¢ afeito simul- taneemente, do primero, nao o sabe 4 aaior. Seja como for, aqueles dois factoe impiem-se e a Estatteiien, aa mesmo tenpo que é considerada por wis come @ arte de apre- sontar mitmeros e rificos destinadas a corraborarem az afirmasies feitas, quoisquer que elas agjam, é olhada por outros como wna ciencia quaxe fnacessirel ¢ para cuja aplicagdo xe requerem avan- gation conbecimentos de matemditica, Demonstrar que @ primeira opinito & errada ¢ a segunda é, dentro de vertox limites, exagerada, ¢ 0 primeiro objectivo deste Tiere, do qual se procuron afastar toda a consideragia de ordem tedrica que nito fosse absolutaments indispensdvel para a vos preensite do asmunto no seu aspecto de eplicagio prética. Koi exte Wtimo objective, com efeito, que se pretendeu atingir. Para isso, procuro-ae, para cada.caso ¢ ainda gue com risco de toraar o fivro valumoso ¢ mondtono, apresentar ¢ resolver em pormenor wrt exemplo pratico. Portonts, pela sua matureca, o presente Manual ndo pode nubstituir as lictes dadas pelos profestores de Estatistica, Quando muito, suplementa-as. Desténa-se, além disso, a todos agueles que, nunca tendo estudado Extatistica nas escalas por onde passaran, deagjem saber como se resolve determinado caso que se thes apre- wate, estendo, portanto, mais interessadoe na aplicagite da fér- mula propria de que na derivagio matematica da mesma Formula. E provivel que o Manual nfo vésse a luz do cha ge nito fosse 0 eneorajanento dato pelo Se. J. L. Nicholson encarregada de confe- réncias sobre Estatistica na Universidade de Oxford ¢ supervisor dos estudas do autor exquants trabalhou we mesma Universidade. Para ele, portanio, edocs primeiros agradecimentos do autor. Igual inente ae agradece ao Prof. & Fisher e aos editores das auas obras, Srs. Oliver &: Boyd, de Edinturgo, a permissie para eetrair do livro Statistical Methods for Research Workers a tdbua do 4° que constitu o Apéndice A; aos Dra, Dias Agudo e Almeida Rocha, a autorizagto pare usar wn dos ajustamentos de wma curve normal por eles feito, a wma série de medignes de alturas de rapazes do Liceu de Gi! Vicente v pubdicade no seu lévro Antropometria Escolar; 4 Direcgita da Ginitsio Clube Portugués, 0 consentimento dado para usar as fichas biométricas dox inseritas nas suas aulae de gindstica, Concordande com as razées ainds enunciadas como determinan- tex lo uparecimento do Manual, acedeu 0 Eng. A. Tovar de Lemos a propor a S. Ex. 6 Ministro das Finangas que o Inatitato Nacional de Eatatistica, de que ¢ Director, patroctnasse a edigao do volume, pelo que agut fiean canaignados o8 devtdos agradecimentos. Finalmente, agradece-se desde ja a todos quantos quiserem ter a bondade de comunicar quaisquer erros ou defeitos do Manual, dos quais o autor assume inteira ¢ exclusiva. reaponsabitidade. Lishoa, Ayoste de 1940. A, DG. SUMARIO Capitulo 1-Distampeigdes pe Fregcisonas. 6.0. » 2-Meprpas pe Posigho. ©. ee » 3-Moseyros © Mepivas pe Disrersio.... 37 ’ 4-Mepipas pe Assiwerria k bE Corrose. .. ub » B-Conntnaco Siuvces Reermivea 0.2 7B » 6-Ovrros Tiros py Correnagio Siueres. ©. 107 » T-Coxretagio Parcian. Corarenagio MUBTIPLAL Ce ee ee ee TID » 8-Newmros-ixprces 0. 13 « 9~ASALISE Das Skuies Croyonoaiuas. .... 165 10-Ascstamesto pe Curvas oe CAPITULO 1 DISTRIBUICOES DE FREQUENCIAS 1.1-Nogdes fundamentais. A Estatistica Iida eom qnanti- dades, com nimeros, agrupados ou nie, os quais apresentam entre si qualquer caracteristica comum. Ou exprimem os precos de una mereadoria mon mercado, ou as alturas de am grapa de individaos, pa as tomporaturas de ain local em certos dias, ete. Estas ontidudes —~pregas, altaras, temperaturas —que podem assumir diferentes valores representivels por uma unidade apro- priada, chamuam-se varkive’s, A sua representagio mmnerica se a nome de dados, Os grapos em que os dados se apresentan: podem s anaipres: on menores. Q estulo da Estatistien quase se limitava ac de universox onde se entende que a todos us valores pussiveis da variivel, Hoje presta-se grande atenglo As amostras onde se consideram representados simente parte dos valores possivels ds varlivel. Quer lidande com uuiversas quer com amosteas, desde que vs dados sejam numerasos, torna-se Incémoda spresenti-los todos, de cada vee que isso seja necessirio, A apresentagko total dos dados, dispustos por ardem erescente on deerescente da sua grandeza, di-se a designacio de fésta ow rol, Euibora perdendo em exactidiio o que se ganha em comodi- dade, os dados sio tratados de forma a simplificar a sua apre- sentaglo ¢ 9 seu manuseamento. Um processa consiste uo agrupamenta, isto 6, na apresentagin em conjunto de todos aque- les enja grandeza 6 igual. Quando os dados sto apresentados desta forma, estumos em presonga de um ro! de frequéecias. figuras 2 MANUAL DE BSTATISTICA No rol de frequdneias, eada dado exibe uma frequéncia, definida came o mfimero de veves que o mesmo dado se repete. Outra processo ainda mais sintético de apresentar os dados, consiste na sua classificagio, quer dizer, na sua reuniio em classes. A esta forma de apresentar os dados, di-se o nonte de distribuigio de frequéncias. © quadro no 1.1 apresenta exernplos de uma série de dados Jispostos em rol simplos @ em ral de frequéncias. O quadro n.® 1.3 apresenta o exomplo de ums distribuigho de frequéncias: Quadro n.? 1. Precos no produtor da erroba da batata nos 18 distritos do Continente em 1942 Origom : Anuirio Estatintioo de Portugal, 1942, pag. 645. Ret simples ot de fraqudncias Proves Froguteeine 10860 10840 1 misao 11340 1 11880 11880 2 11580 1120 1 41890 12810 2 12810 19830 8 12810 12870 1 12880 13500 1 12830 13810 1 12650 13530 1 32870 13860 1 13800 13870 1 1BKLO 14a50 1 13630 15820 1 13460 13470 14850 15820 1.2-Orgenizagao de uma distribuicso de frequéncias. Fornecida waa série de dados referentes a uma varidvel qual- quer, para com eles so organizar uma distribuiglo de frequéncias devem observar-se certas regras. Assim: 1} Ha que escolber as classes, Nestas, podem distinguir-se = o limite taferior © 0 linite superior, definides como os pantos DISTRIBUIGGES DE PREQUENCIAS minino e méxime dentro dos quais estio compreendidos todos os valores reunidos na classe; @ a amplitude ou intervalo de classe definido como a diferenga entre os limites superior o infe- rior da classe. Em virtude de variar, conforme a natureza da variével a maneira de escrever o limite superior das classes, 6 habitualmente tomade como intervalo de classe a dilerenca entre o8 limites inferiores de duas classes eonsecutivas. No quadro n.° 1.3, © intervalo do classe 6 2, ¢ os limites inferior @ superior da primeira clusse sio, respectivamente, 26 8,00. Da mesma forma, chama-se amplitude total on interrala total, a diferenga entre a maior ¢ o menor valores da distribnigia de frequdneias. No caso do quadre n° 1.3 a amplitude total & 16-=18—2. 2} Os intervalos das classes dovem ser, sempre que possivel, iguais, afim de que a comparabilidade entra as frequincias das diversas classes so torne ficil. 3) 12 importante indiear com preeisio os limites das classes, 2 evitar classificagdes como esta: O—10, 10-20, 20-30, ete. Neste caso, valores tais coma 10 6 20 podem pertencer a duas classes. Aa contririo, se se escrever: «mais de 0 @ menos de 10», amais de 10 ¢ menos de 20s, ete, 0 valor 10 ni pertence nem a uma nem a cutra das classes citadas. Ha muitas formas de apresentar as classes. JA se meneions- ram @ comentaram duas; ol mais de Oe menos de 10 1-20 mais de 10 @ menos de 20 26-30 snais de 20 e menos da 30 ete. ete, Uma terceira forma de apresentagio das classes ¢: O- 9 1-19 20-29 ote. 4 MANGAL DE ESTATISTICA equivalente a esta outra: 6 ate 10 (exclusive) 1G até 20 (exclasiv! 20 até 30 (exclusive) ete. Polas duag ultinas forimas de apresentaci entende-se que na segunda clnese estio compreendidos todos ox datos de valor aumérice igual ou superior « 1) @ inferior a 24. B de forma somethante pars ag restantes classes, Quando se trats de dacdos de uma vaniivel descontinua (hal tantes de um pais, fivros de am conjunte de biblletecas, ete.) & opinide uninime de que a pendttiny forma de apresentagho citada ea melbur. @Qoande se trata de dados referentes a uma vari re? rontinua {pesos, altures, ete.) ja, porém, surgem diverg@neias. Com efeito, supouhamos, para eseunplifiear, que aquela dis buicdo se rolere as alturas, expressas em centimetres, de deter- minada planta. Se os dados a classifica estiverem expresses na mesma unidade (eentimetras no exemple presente) que os lhnites da yibuigie, caise no caso de dades descontimos: mma planta de 19 centimetros, seri incluida na 2." elasse, por exem- plo, Porém, se os dados estiverem expresses em ailiimetros, nie so deve proceder a arredoniamentas para os ineluir nas classes respectivas. De avordo com agnela forma dle apresen- tagio das classes, ama medida de 188 mim. Hers incluida, na segunda classé poryue ho atinfe os 20em. Por poute medio de waa classe, entende-so o resultado de somni-soma dos valores que definem os limites inferiores da classe em questio e da classe seguinte. © ponto méilo representa a classe, Se quisermos clussificar escolas polas suas frequencias faremos por exemplo: BO—340), BH0—t49, ete. O. intervalo das classes @ 300 ¢ 0 ponte médio da primeira destas elas- 04250, ses 6: 200. Se qniseries clussificar os pregos, 3 expresses em eseudos, de wm certo produto, faremos por exem- plo: 10-19, 20-28, ete. © intervalo de classe é Weo DISTRIBUIGGES DE ®REQUENCTAS 5 . . we ponte médio da primeira destas classes 6: 12 pregos estiverem expressos em centavos, faremos por exemplo: 10501089, 1189011599, ote. O interyalo de classe ¢ 1400 LOS00— T1800, 1. © 0 ponte médio da primeira elasso ¢ Como exemple pratico da argan radio de ume distribuigie de frequineias, apresenti- inte: O Anwirio Estatistico de Portugal para o uno de 1941, apresenta, de pags. 210 a 229, quer dizer, ocupando 14 pdginas, as prodacgdes de trige por quintal mitrica semeade, ex 268 concelhos do Continenre. Relaneeaads os dados, vbservuu-se que us seus menor e maior 80 SP valores eram, respectivamente, 3,47 @ 16,63. Decidiu-se agrus par os dados em & ciusses de intervalo 2 ¢ a enmecar em 2. ‘Trata-se de uma variivel continua ¢ os dados apresentam-se exprossos era centésimos do duintal meétrico, tal como os limites escolliides para as classes du distribuighe a organizar, Purtanto. a inclusio dos dados do Awedrio ans respectivas classes mio apresenta dificuldades ¢ tndo se passa eviso so se tratasse ile ama variivel descontinga, ( ponte médin da primofra classe seri, de acordo com a definigio de ponte medio dada atras, 244 U trabalho prético foi feite como segue : numa folha de papel Insereverant-se os limites dus classes como cabegas ov titulos das colunas, Nestas colunas, eh medida que eles fam aparecendo no Anudrio, registaram-se os valores da varlivel. Como os dados, na pablicacdo citada, estio dispostos por regides egricolas, quando todos os relativos a unia certa regio se exeontravam ins- critos nas eolanas riseadas na tal folha de papel, proveden-se a uma conferéneia contando os dados inserites em todas as colunas © comparando o nimery assim ohtide com o fornecide pelo Anadrio, Esta conferéneia forse, puis, para cada regio agricala @ assim so obtere a certeza de que dado algun fleow por transerever, © quadro n." 1,2 mostra o trabalho feito para a primeira regio agrivola. a MANUAL DE ESTATISTICA © namero de dadns transeritos, om relagio i primeira regio agricola, fol, pols, de 8+448-41-42—28, que confere eom 0 mimera fornecide pelo Anudrio citado, ua pig. 216. Quadro n° 1.2 Produgde de trigo por quintel métrico semeado | Regio Agicole ‘kon a0 | 6,00-7.98 | 8,600.89 10,90-15,9955 9.81 ; tos | 12,00 | | ae i Depois dos 263 valores da varlavel terem sido registados. contaram-a0 08 inseritos, em cada coluna, e abteve-se a distri- ‘nieo de frequéncins constante do quadro no 1.3. 1.3-Distribuigdes de frequéncias. Representag3o grafics. Desenhados num plano dois cixos coordenados, perpendicula- res entre si, ascolbe-s¢ o eixo dos yy ou vertical para a repre- sentaciio das frequéneias e 9 dos wa ou horizontal para a dos jntervalos das classes. AAs esealas a usar podem sor ambas ariimétieas como no gra- fieo seguinte: pode uma delas ser aritnstic e a outra, em geral a das frequéncias, ser logarlimica, eo grifien diz-se semiloga- ritmieo: podem, finalmente, ambas as esealas ser logaritmi- eas ¢ @ grafico diz-so logaritmico. As escalas logaritmicas empregam-se quando os valores a representar grificamente apressntam grandes diferencas ¢ se torna portanto impossivel, a nio ser que se utilize em papel de enormes dimenstes, repre- sentar todos os valores dados, em scala aritmética. DISTRIBUICOES DE PREQGUENCIAS A representagio grifiea do wma distribuigio de frequéncias 6, em geral, foita usando : (i) um potigono de frequénctes, definido como uma linha quebrada que lige no plano os pontos represen- tatives dos pontos médios das classes : ou (i) um hisiayrama, definido como uma série de rectingulos paraielos, cada um deles de hase igual ao intorvato da classe e de area proporeional & frequéneia da classe respectiva; no casa particular de sorem iguais os intervalos de todas as classes, aa altnras dos rectin- gulos é que sio proporcionais iis frequéncias das classes Quadro n."1.3 Produgéo de trigo por quintal métrico semeado. Continente Origem: Anudrio Ketatintico de Portugal, WAL, pigs, 216 a 29 —~ Dados clasificados, 2010-11,99. | 33 12,00~ 13,99 20 1400-1599. 7 1600-1799... 2, a Votaé . . .- 205 A roprosentacio gréfica mais geralmente usada ¢ a que utiliza 98 poligonos de freqnénecias, os quais costumam ser deseshados directamente, sem o passo intermédio da constraciio do histograma, Muitas vezes aos poligonos de froguénclas di-se impropria- mente o nome de curvas de frequénelas, Esta ditima designacio implica a idéia da inexistencia dos angulos que as linhas poliga- uais apresentam. Estas sé se transformam naguclas, quando 0 interval de classe 6 tio pequeno que se pode cousidersr zero ; ou, © que 6 mesmo, quando o mimero de classes 6 tio grande que se pode considerar infinito, ANTAL PE ESTATISTICA ‘A forma do poligono Ge frequéueias, peressirinned > corres: ponde & forma como ax fremuepeins so Aspen na distetbuigio respectiva. Vé-se na guavbra te 1.3 que a classe euja freqnéncia ve amaiog é a terceira, prosiva por que o Wetugrama 0 poligono yespeetivas apresentant os seus pontes mals elevados também na tereoira classe, Um poligone (ow amt urea) come 0 Hate ppATien noe! qusrogmana & po\GOR® DE FuEguEnetA OMRESDONTENTES BO QUADRE NP LS a 8 por. digest esafindfrteo positive Ou exivierado tt esguerda, Sea Tnege conn ator freaeacis flewsse situada nay segunda metade she diseribuiedo, a enrva seria eestnidériea neyatirg on exriezata fh divest, So a distrifui¢lo de frequéncias apresentasse a Sua vouece central com a maior frequincia € s¢ as outras classes, de ata Indo du central, apresentassem, ags pares, irequéneias igaais, 2 curva seriasinétrica, hg curvas shadtricas nie eo valgares e aparecem com maicT froguéncia na represettiagio gréfieca dos fenbmenos violdgieos @ antropeligicas, do que na dos fendmencs acondmicos. DISTRIBUICGES DE PREQUENCIAS a beatice ‘THOS DE ORAS BE TaCpOENCIAS, puATE a sruzTeM INJAZ\ ‘curd Assia ETtaca DaseTIvA, cee siMeraa ‘CURE ASSIMETRICR BEDATNA Sompre que, como nos grificos auteriores, a curva apresente um s6 piew, designe-se por unimodal. Quando a curva apresenta mais do que um pico clama-se plurinodal. Muitas vezow as GRAFICO NOLS ‘TPO DE GuRNAS DE FURguENCIAS, BUABTO A KvaTOSES” 1 1+ comvA LEDTuCHRTICA 2 on MEsacdarita So PLATIOURTICA carves plurimodais resultam da representacho grifiea sinultanes de mais do que om fenémeno. So assim fir, imphoe-se a sua separacho, Além dos tipos de curvas indieados no grafico n° 1.2, ha outros mais. Assim: podem apresentar a forma da letra Ue designam-se por curvas em UY. Podem apresentar a forma | 6 0 MANUAL DE BSTATISTICA designam-se por curvas em jota, Podem ainda apresentur 2 forma Je designam-se por curvas em jota invertido. A desi- gnagie dos dois altimos tipos de curva nfo corresponde, eviden- tewente, & sua semelhanga com a letra jota. As curvas de frequéncia simétricas podem-se apresentar excep- cionalmente bicudas 6 designam-so por curves leptocirticas ¢ ou de topo achatado @ designam-se por curvas platicirtiens. As curvas intermédias, conbecidas por curcas mesocurticas (8m como tipo a curva normal adiante estudada. CAPITULO 2 MEDIDAS DE POSICAO 24-Definigéo. De posse de um conjunto de medidas {ou valores) de determinado fendmeno, ¢ cémodo sintetizé-las numa a6, representative de todo o conjunto. A. essas medidas-sintese da-se o name de medidas de posigdo ou medidas de tendéncia cenira’ porque, para grande parte das séries de medidas, elas ficam situadas na sua zona central. 2.2~Desvios, Antes de prosseguir no estudo das varias medidas de posigio, introduziremos « nogiw de desvie, que serd largamente utilizada dagui em diante. Dada uma série de valores X,.X,,---,X,. chama-se desviv 2 diferenea entre eada um deles e am qualquer valor indicado. Este valor indieado pode ser a média on outro quatquer. 2.3-Média aritmética simples. Dados nao classificados, Dadas N medidas: X,, X,,--., N,, da mesma grandeza X chame-se nédéa aritmética siuples, que so costuma representur por M, ou ainda por Y, & soma daquelas medidas dividida pelo seu numero, Entio: X44, SD N Como exemple, usemos os dados do quadro n.” 1.1, da pag. 2, os guais exprimem o preco por grosso da urroba de batatas uos 18 distritos do Continente em 1942: convertame-los em contos, que exprimirie, portanto, os precos oquivalentes, do milhar de re 2 ESTATISTICA arrobas, © prego médio simples do miliar de arrobas seré, por conseguinte + ye POETS. 10 2 80-8 1190-L 13,60 ne 18 Dg 121011 AO ES, TOL AZ TO oO 1s 13,80. 70) 12,05 cantos . is is 2.4 - Média aritmética pondersda. Dados nao clasificados. Frocesso fongo. Supeshanos qae dispomos dos nimerss que representan as freuiocias das N medidas X Xs que esses nloneres sa, cespectivamente, fA. ~ Chama-se widibia aritndtica ponderade ou pesada, i soma dos produtos das medidas pelas respectivas frequéncins, divi frequéncias, isto 6: Le da pela soma das Vsemas ainda » exomplo de quadeo no 1.1 da pag. 2 com a conversic operada na seegio anterior, O Anudrio Extatiseo de Portugal, 1 na, pag. 215, as quantidades de batatas produzidas por distritos do Continente, Estas quantidades, redu- vidas a milhares de arrebas, io as indicadas na coluna f do quadro no 2.4. A conversty para wilhares foi feita por come- didade, cow o fim de reduzir os nlimeros com que havia de se trabalhar. Entho, o prego médio no Contineute ¢ no prodator, do milhar de arrobas da datata produzida em Portagal, em 194: foi de 12.38 contes. Fide quadro u.* 2.1. Andlia aritnistien ponderada tradaz, melior de que x simples a realidade dos factos ¢ por a esealhide 2.5-Média aritmética ponderads. Dados nao classificados. Primeiro método ebreviado: desvios expressos na unidade dos dados. Se V for amite grande, se cada mimero represen- tative de cada medida ou de cada frequincia constar de muitos algarismos, ou se se verificarem simultaneamente estas duas cit- <0, senipre que possivel, dave sez MEDIDAS BE POSIgAg 13. eunstincias, o inétedo anterior 6 muito trabalhoso e por issa deve ser evitade. Segue-se, em voz dele, @ seguinte: 1) Colmnam-se as medidas abservadas & frente das quais. se registam as respeetivas frequancias, qne fieam, pois, nouiza colunia. Quadro n? 21 ariimética ponderada. Dados nic classificados. Processo fongo OMY, udder. G46 © O16. Céleule da mé Origam: Anuitrio Estatsatico de Portag, f i cvstaneesewnay, — E 684249 ADHSO 43.4 240015 27.458.6 13.458.8, 8788.8 8 4a142. 43.318.0 18.535.2 B1169,5 2820 5 20.4040 1093 245139 2.018 20.073,6, B80N 4 2) Esenthe-se uma qualquer medida para origem arbitraria, médin imagindria ow ponto de partida (1), © caleulam-se os desvios d entre as restantes @ esta medida. Na pritica, esco- Ibe-se para médis. imaginaria uma medida tanto quanta possivel eentral, Os desvios so expressos na mesma unidade de X. Sic, pois, nimeros coneretos. 14 MANUAL DB ESTATISTICA 2) Efectaam-se os produtos fd. 4) Calewla-se a média s partir da formals Sif) Vaamos os dados jA utilizades no guadro n° 2,1, mas agra pemios as {reguéncias respeitantes ao mesmo prego. A disposi- gio do cdleulo poe fazerso como segue! Quadro n’ 2.2 Chleula da média aritmatica ponderads. Dedos nao ciassificados. Primeiro método abreviado: desvios expressos ne unidade dos dados viggom: a indicada ne qoadro anterior. ~21) 13.8585 1s! UM, = 3 = 12,70 — 0,84 = 12,36 Como se vé, a média ponderada obtida por este proceso foi, no caso presente, igual a obtida na seccto anterior. Hste faetonem sem pre aconteca, A introdugio de desvies pode acarretar pequenos orros, @ us médias obtidas pelos dois métodos podem nio coincidi MBIMDAS DE POSICAG 1B 2.6 Média aritmética ponderada. Dados nao classifi- eados. Segunde método sbrevisdo: desvios expressos na ordem das. medidas. © processo esindade na secciio anterior 6 de natureza genérica. A sna aplicagio ¢ recomendavel quando as diferencas entre as medidas de X n&o sho uniformes. como Quadro n.° 2.3 Célculo de média aritmétics ponderade, Dados néo clessilicados. } Segundo método ebrevido: desvios expressos na ordem das medidas Classificegdes dos alunos do sexo masculine aprovades no exeme do 2." ciclo, nos Liceus de Lisboa, no anc lectivo de 1943-44 (ensina oficial, particular e maiores © emancipadas). x #lassitiengbos) 10 128 Ea “117 2 0 13 +108 iu + 9 15 + 84 16 + 80 Ww + 10 18 + 24 19 +7 + 18 20 i US f.dj= 4176 a My = 12,34 acontece no exemplo apresentado. Dado o caso de as distancias entre as medidas de X serem uniformes procede-se da saguinte manegira : 1) Colunam-se as medidas observadas & frente das quais se registam ss respectivas frequéneias, as quais, portanto, também ficam dispostas em coluna. i 16 MANUAL DE ESTATISTICA 2) Escolhe-se uma qnalquer medida para origem arbitraria, média imaginaria ou pouto de partida, Profere-se, na escolha, ou a medida ewja frequinela for mais clevada ou entio uma medida ventral, A contar desea média imagingria regista-se a ordem dda cada ume das restantes medidas. 3) Determina-se a magnitude ¢ da distineia entre duas medi- das consecutivas, 4) Efectuant-se os produto 5) Caleula-se a wédia a pa fd. rir da firmus (GF) © quadro n.° 2.3 Bustra amplamente este provesso sem neces- sidade de mais explicasoes. 2.7 Média oritmétice pondereda. Dados clessificados. Processo longo. Os sos anteriores ne sito priticos quando os dudos sio er grande nimere, Guando isto acontece, os dados ou modidas sho clasificados, quer dizer, reanidos em clisses, Ew processn x seguir no ctlealo da médin aritmétiea 6: 4) Reunem-se us dados em elasses que podem ser todas ou nila, do mesmo intervals 2) Caleula-se a pont médin, indivada nit sevgia m2 £2. 3) Efectuanese os pre pele seu ponto zatdio. ) Celeuts-se a media a partir da farmula: M, = 4 roee i. fle cada clusse, como fai utos f°. V (frequéncia de cada classe Como se ve, o proceso ea fSramla stia tdenticos aos de seegio 2.4 Ubllizemvs como ilustragio as dados do quadro a. 13 de pis, 7. Organizemos com eles o quadro n2 2.4, Este nttedo € de aplicacio muito trabalhosa @ tanto mais, quantos wnais slgarismas tiverem os uimeros com que se tiver de aperar. Poupa-so pur isso muita trabalho segniado qualquer dos ntodes das duas seeydes segaintes, MEMIDAS DE PUSICAO W 2.8-Média aritmética ponderada. Dados clasificados. Primeiro pracesso abreviado: desvios expressos na unidede dos dados. Pura o cdleula desta média por este processa, adopta-se a seguinte marcha + 1) Reunem-se os dados em classes que pudom ter intervals da mesma magnitade ou de magnitudes diferentes. 2) Colunam-se as frequéncias 7° das classes. Somam-se ¢ obrem-se S(f)= N° Quadro n° 2.4 Céiculo de média erilmétics ponderada, Dedos classificados. Processo longo. Elementos do quadro a." 1.3, 10,00 - 11.99 12K - 13,99 14,00-15,99 16,00 - 17,99 3) Caicnla-se a ponto médio XY de cada classe. 4) Eseothe-se um qualquer ponto médio para origem arbi- traria, média imaginéria ou ponto de partida Mj, © calculam-se 09 desvios d entre as restuntes pontos médios e este. Os desvios. ndmeros coneretos, siio expressos na mesma unidade dos dados. Na pratics, para facilitar os calculos, escolie-se um ponto médio no centre da série. &) Efectuam-se os produtos / produtos e obtem-se S{f.d). d, Tinhawlinha, Somam-se estes UAL DE ESPATISTICA 18 MA 6) Calenla-se « média a partir da formala Fheilmente se vi que este método se pode considerar uma combinagio dos das seegies 2.5 ¢ 2.7. Por esse motivo nko se apresenta exemplo algum. Este métods 6 recomendive! quanilo os intervalos das classes sho desiguais, So os intervalos das classes forem igaais, 6 pre- ferlvel a aplicagtio do métode deserite na seegiio seguinte. 2.9-Média aritmética ponderada. Dados classificedos. Segundo processo abreviado: desvios expresses em inter- valos de classe. Para a utilizagio deste métode, procede-s2 como segue: 1) Reunom-se os dados em classes de intervalo unifornie, 2) Colunam-se as frequencias # das clusses. Somam-se ¢ obtem-se S(f)=¥. 3) Caleuls-se 0 ponto médio X de eada classe. 4) Escolie-se um ponte tédio qualquer (preferindo-se, para facilitar os caleulos, um que esteja situado no centro da série) para média imaginaria M; e ealeulam-so ox desvios entre os restantes pontos médios e este. Naste caso, 08 desvios siio aimeros sbstractas e medem a distincia entre © ponto médio escollido para média imaginaria e cada um dos restantes, 4) Determina-se a magnitude ¢ do intervalo de classe, efec- tuando a diferenesa entre dois Pontos médios consecutivos. 5) Fazom-se os prodatos f.d, linha « linka, Somannse 6 obtem-se S(f.d}. , 6) Calcula-se a média a partir da formula: sew ah [RED], Va-se sem. dificuldade que este método pode ser olhado como ama combinagie dos deseritos nas secgdes 2.6 6 2.7, motive Por quo nfo se spresontard aqui exemplo algum, MEDIAS DE POSIGAO 9 2.10-Média geométrice simples. Dados néo clessificados. Dadas N medidas: X,, X,,---,Xq da mesma grandeza, chama-se média geomstricn M, & raiz de indice n do produto dessas medidas. Isto 6: M, = "VX, Para efvites de cileulo usam-se logaritmos © esta formula transforma-se pa seguinte: Jog X, + log Xf slog Sy Slog X) N N log Mf, = que 6 a média aritmétien dos logaritmos dos valores dados. Para caleular a média geométriea dos pregos dados ns see- sto 2.3, faremos: 1S HON TF SOT OTL BOT 90 Se 13,60< 13,10 10,605< 13,3021 W011 a0 Selb 20x 1 313, 703218, 70> donde: 28 -] low 504 2. tog: My ~— 1012900 19,004 1og 1,50-Hloye 12.00 log 13,10 log 10,60+-tog 19,80 + log 12,104 log 11,40 += ee 18 log 13,70-+1og 12,70-L1og 19,80-+10g 15,20 8 , 4, log] 80-+1og 12,10 _ 19,80916 18 is + =1,10031, donde, finalmente, IM, = 12,60 niimero inferior ao da média ari- tmética calceulada na secgio 22. Este facta verifiea-se sempre que os valores nao sejam todos iguais ¢ que nenhum deles seja zero. 20 MANUAL DE BSTAT! Quodro n? 25 Calculo do médie geométrice ponderade, Dados n8o clasificados, Elementes do quadro n.? 2.1 ‘L16137 2.08091 107188 | 107535 108279 1.05600 4,18672 | Srossa 2.5608 ess | rasan 24722 2 | 2.018 | 118184 2.885.0 ne} 4.908 | LOTIES SSLdt wa | Losses 8.407,9 ; } MEDIDAS DE POSICAG a 2.11-Média geométrica ponderads. Dados néo classifi- cados. No caso de dispormos, além'dos valores X,,X,,--, X., das frequéneias jf com que cada um deles se repete, a média geometries dos valores dados, obtem-se a partir da formula: 1 su} Exemplifiquemos com os mesmos dados da seccio anterior agrupados da forma apresentada no quadro n. 0 edleulo dispde-se como mostra a quadro ne 2.12-Média geométrica ponderade. Dados classificados. ‘Se o numero de dados for muito elevado, nao é comodo o métode anterior pelo grande mimero de logaritmas que obriga a caleular. Entlo, para facilitar os caleulos, reunem-se os dados em classes enjos intervalos podem, ow nio, ter magnitudes iguais. Pode ainda avontecer que seja pedido o edleulo da média geomdétriea de ama distribuigho de frequéncias. Néste altimo caso o métode anterior nio pode ser aplicade, © edlonlo da média geométrica de wma distribuigho de fre- quéncias fuz-se, dando ox seguintes passos: 1) Colunam-se as frequéncias f das classes. Somam-se * ebtém-se S(f) = 2) Caleula-se o ponto médio X de cada, classe. 3) Calcula-se o logaritmo de cada ponte médio: log X. 4) Fiectuam-se, linha a linha, os produtos f.log X. 5) Caleuln-se S (flog X)_ log Mf, 8) Calenia-se 0 némero cujo logaritmo tem aquele valor determinada em 5). Exemplifiquemos com os dedos do quadro n.° 1.3 ¢ doter- minemos a média geomdétrica das produgdes de irigo por quintal métrico semeado. 22 MANUAL DE ESTA Cd Comparand 0 resultado ubaixe obtide com o achado no quadro 2.” 2.4 para a média aritmétion das mesmas produgtes, vé-se gne, como & de rogra, a média goométrica 6 inferior a aritmética. Quedro n” 26 Caleulo da média geométrice ponderada. Dados classificados, Elementos do quadro n.° 1.3 jog 8 flog X Chasen OTT42 27, 95880 7 70,14830 8,0 939 54a T2,52824 30,00 - 14,99 1,041.39 3A,30087 22,00 ~ 15,941 4.11394 22,27880 14,00 - 15,99 8.28268 23,6913, S (flog X)=239,67011 289,67011 oo O,0LI29 LM, =: 8,18 2.13-Média harménice simples. Dados ngo clasificados. Dada uma série de N valores X,¥,,---,%,, chama-se média ao reeipreeo da média aritmética dos reetpracos dos valores dados. Isto é: 5H ‘Tomemos novamente para exemplo os pregos da batata nos 18 distritos do Continente, dados no quadro n 1.1, A sua média harmonica, como adiante se vd, 6 12,56. Recordemos que nas secgtes 2.3 e 2.10 foram achadas as wiédias aritmétion eeométrica, respectivamente, 12,65 6 12,60. i | { : MEDIDAS DE POSICAD 28 Agora obteve-se o valor 12,56 para inédia harméciea, Desde que os valores das séries nfio sejam todos iguais e jue nenbusr deles seja zero, verifica-so sempre que a média aritadtioa & maior Go que a geometeien © esta maior de que a harminica, © edlento da média harménica di, poi 1 . i + “TSO 7 TE oo * 73,00 ~ 14.50 i ao rao7 2.14-Média harmdnica ponderada. Dados néo classifi- cados. Se, além dos valores da variivel X,,X,,---, Xa, dispu- sermos das suas respectivas frequéneias f,, f,,-- yf» # média harmonica desses valores é dada por: A= Utilizemos, uma vez mais, os elementos que, nas seegdes 2. e 2.11 serviram para o cdleula das médias aritmética e geome- trica, © cilenlo dispte-se como mostra o quadro n.° 2.7, A simplicidade do quadra dispensa explicagdes quanto i marcha a seguir. Comparando os resultados das trés médias, obtemos: 12,36, 12,32 e 12,97, respectivamente, para as médias aritmética, zeométrica @ harménica, o que esti de acordo com 2 assercio feita ne final da seeeio anterior. | u or MANUAL DE ESTATISTICA Quadro a.” 2.7 Calcuio da média harménica pondereds. Dedos néo clasificados. Elementos do quedro n.° 2.1 ae | aan | 2390 | 1.993 | rey 2018 4.958 | 2.15- Média harménica ponderads. Dados clasificados. Quando N é muita elevado, o proceso anterior obriga a umitas @ luboriesas contas. Por issu, os dados sito reunidos em classes ¢ no célento da addix harménien segue-se a mar- cha adiante deserita, Esta mesma marcha é adoptada quando se deseja caleular a media harménicn de uma distribuigio de freqnéncias, 5 MEDIDAS DE POSICAU 2 1) Colunam-se as classes, eujos intervalos podem ter, ou nis, a2 mesina magnitude. 2) Caleula-se o ponto médio X de cada classe. 3) Colunam-se as frequencias, f, das classe: freyuéncias ¢ obtém-se S(f). OMAM-Se Bs¥As Quadro n° 28 Calculo da médie harmdnica ponderada. Dados classificedos. Elementos do quadro n.* 1.3 4) Linha a linha, dividem-se os valores a que se referem as fp alineas 3) ¢ 2}. Obtem-se uma coluna de valores 2 que se somam 5) Caleula-se a média harménica: My say Usemos, como exemplo, os elementos indicados no quadra 2.° 1.3, com os quais se organizoa o quadro n° 26 MANUAL DE ESTATISTICA Esta produgia média ja tinta sido obtida nas secedes 2.7 © 2.13. Os tts resultados obtidos foram: 8,54, 8,15 & 7,78, respeetivamente, usando a média aritmétiea, a goomé:rica ® a harménice, Aqui, também prova ser verdade o que se diz no fimal da seegin 2.13. 2.16-Mediana. Dados néo clasificados. Dados 1 valo- res X,,%,,---,\a, dispostos por ordem da sua grandezu, defi- ; 44 nese mediana: 2) coma o valor de ordom ~~ {valor central), se N for fmpar; 4) como a média aritmética dos valores de ordens > e@ c= +1 se N for par. Definindo mediana desta NN. 5 * © citadas, 6 um nimero forma, qualquer das fraegiies jateire, A modiana tem tantos valores superiores como infe- Tiores a ela. Lixemplifiquemos com o seguinte : Quadro n? 29 Caiculo da medians. Dados no classificados, Alunos inscritos em cade uma das escclas técnicas elementares do Continente e ilhas, no ano lective de 1941-42 . 158-9. ot 2h ane 1339 2058 oh BOL 8a 1505 8336, 78 U8 729. 1607 2722, 7 B20 it 1663, 108 93. Bee 1725, 219 372 88. 1795 wat 30) 1205, 1857 142 402 1253, 1083 ‘Totais: 51 esealas; 34,068 alunos Come N 6 impar a mediana sero valor de ordem: No-1 BLE == 26. Isto 6, seri: 465 alunos, » que corresponde & Escala Industrial de Passos Manuel, seguudo o mesmo Anudrio informa, 8 MEDIDAS DE POSICAO 2.17-Medians. Dados néo clasificados mes agrupados. Supenhamos que os valores X,,X,,---, Xq estio agrupados, oa, 0 que 60 mesmo, gue a eles esti adstritas frequencias fi, f.,-+-5 es respectivamente, em que S(f)=N'. A mediana define-se como na seceko anterior. Para ilustragio usemos o rol de frequéncias transcrito no quadro pn? Lt. Come V->18 © portante par, a mediana sera a média aritmétiva do termo de ordem Ni2+9(22,30) eo de ardem N+ 1-91-10 (também 12,30). Quer dizer, 30=12,30 19 36), a a mediana serd Quands, como neste exemplo, NV é pequeno, em vex de se adoptar 0 iétado desta seco, podem ordenar-se os dados 6 calcolar-se.a mediana come foi indicado ox sevgio anterior. 2.18- Medians. Dados classificedos. Processo numérico. Suponhamos que a série de dados 6 to grande que é mais cémedo classificd-los, isto 6, reuni-los em classes, do quo organizar uma nova série ordenada, Ou entio supouhamos que nos é fornecida ums distribuigio de frequéncias, da qual nos é pedida a mediana. Raramente aconterera que o termo modians seja lide directa- mente no quadro orgauizado ou fornecido, ¢ nio tenha quo ser ealeulado. Exomplifiquemos com o quadro n.” 2.10. Neste quadre née pode ver-se directamente qual ¢ a mediana. Com oleito, senda os concelhos em nimero de 203 (ndmero Yeh PO ae. impar), o concelho mediano sera o de ardem Ora, do quadro anterior, © maximo que se pode saber é gue o 132." concelho tem uma produgio de trige, por quintal métrico semeado, compreendida entre 8 8,99 quintais métrieos. ( valenio da mediana em casos como este, exige os seguintes passns : 1) Determina-se a urdem da mediana, tal como foi indicado na secgio 2.16, No nosso caso sera, como acima se diz, 132. 2) Determina-se a classe que contém a mediana para 0 que 8 utiliza a coluna das frequéncias acumuladas. No nosso caso Sa 4! classe. 28 MANUAL DE ESTATISTICA 3) Admite-se que os termos que comptem a classe iyue contém 4 mediana estig distribaides em progressiio aritmética, quer dizer, a intervales iguais. . 4) Paz-se a diferonca @ entre a ordem da mediana e a fre~ quéncia acumulada da classe anterior aquela que a contém. No nosso exemple é 132— 124-8. Quadro n° 2.30 Céleulo da medians, Dados clasificados. Elementas do quedro n.t 1.3, f fae. 1 40 88 © 263, 5) Culenla-se o valor mediano a partir da fécmula : Ald = bs d onde: Md 6a mediana: / 60 lite inferior da classe que a contém: a Ga diferenge acima culevlada em 4); J 64 frequineia da classe que contém a wediana ; i 60 intorvalo da mesma classe. 8 No case presente 6: Md = 84. = 5¢B oo 84 O21 821. 76 F. este (8,21 quintais}, 9 rendimente do convelio mediano, Hin virtude da suposigo feta acima em 3), frequentomente acontece que o valor da mediana obtido por esta firmula, 4 muito diferente do achade pelo proceso iadicado na sooo 2.16 se 4 que este proceso pode ser usada para conferaucia. MEDIDAS DE Posicdu 29 2.19-Medions. Dados classificados. Processo gréfico. A mediana pode ser obtida grificamente, quer a partir do dados elassifiendos, quer de dados nko classifieadas. Contado, se os dados nda estiverom classificudos &, mais rapido o sou edleulo pelos processos aritméticos deseritos uas seccbes 2.16 @2.17. Por isso, no que se segue, suporemos que pretendemos calenlar grifieamonte a mediana de uma distribuigko de frequéncias. Escolhemos ¢ seguinte caminho: 1) Obtim-se as froqutneias xeumuladas. 2} Desenba-se a curva dessas froquéncias acumuladas. 3) Determina-se x erdem do termo mediano como foi deserito epiticn ne 20 ‘DETEAMUnAglO GRAFIGA BA MEDINA E BUS IE 38 QuaRTit. ELEMENTOS Db ADEE M210 (993 + 19725) 200 160 (a2 ie) sey ME 80 a 4) Locsliza-so este ponto na escala vertical, onde estio mar- cadas as frequéncias acumuladas. 5) Por este ponto tira-se uma paralela ao eixo dos aw até encontrar a ewrrs das frequéneias acumuladas. 8) Polo ponto onde a paralela ac eixo dos aa oncontra « curva, titn-se uma perpendicular ao. mesmo aixo. O ponte em que osta perpendicular encontra a eixo dos aa indiea o valor do termo mediano. ca MANUAL DE ESTATISTICA Apliquemos 0 que acimia fica dito aos dados do quadro n.* 2.10 da secgio anterior. Tal como us frequéncias acumulnias estio dispostas, a sua intorpretagho deve ser feita como segue: 263 con- eelhos com um rendimento de 17,99 quintais ou menos; 260 conce- lhos com am rendimento de 15,99 qnintais an menos; e assim sucessivamente até 4 bitima elusse em que se diria: 1 coneelbo com um rendimento de 3,99 gnintais on menos. Noie-se que no grifica n 2.1, para facilidade, se arredon- daram os limites superiors das classes. quintis, sextis, decis, centis, etc. Dados néo clasificados. Cada série de dados, assim come tem uma modiana que a divide em 2 metudes, tem 3 quartis que a divide em 4 parts iguais, 4 qnintis que a divide em 5 partes iguais, fi sostis que a divide em 6 partes iguais, decis que a divide em 10 partes igaais, 9% centis que a divide em 100 partes iguais, ete. Para logalizar a mediana, vimos que foram considerados 2 casos: N (nimero total de observagtes) par e N impar. Para loculizar exactamente os quartis que sho, a seguir 4 mediana, as medidas desta naturoza mais usadas, temos que considerar 4 casos: 1) Ne4p. Neste caso, G,(primeire quart) = 4 fe,-fapea): A(segunido quart on medians) = 4 (ayy bry, ad ° quartil) -° > (#5 Pespy) - Tl) N=4p41. Neste caso, Q—+ 2 1 4 Rai Qh [oe byte Q, (tereeire » Neste caso, Q, « Nesta caso, Oe Ema dps Q=2ipsi 1 3B tip + ats a tet hy tee MEDIDAS DE Posicdo 3 Nes expresstes anteriores p 6 um numero inteira qualquer @ Zp» Spry ote. indicam ox termos da série, de ordem p, do ordem p+1, ote. Formulas idénticas mas ainda mais luboriosas, podiam ser obtidas para determinar, com exactidio, os valores dos quintis, sextis, decis, ete. Na praticn, o cilenlo dos qnartis, decis, ete. 6 feito a partir de um quadro de frequéneias xeamuladas. Entio, os quartis sho os valores que correspondem a 25%, ea 75% do total; os quintis, os valores que correspondem a 20°/,, 40%, GQ", @ 80%, do total; & assim suceasivamente para as restates: medidas da mesma natareza. Desta forma comete-se um erro que, por ser pequeno @ pela ponea importincia dos quartis, quintis, ete., se despreza, Por exemplo, na série apresentada no quadro n." 2.9, 0 pri- meire quartil ocupa a posigio dcotet! +. Como nfo ha valor algum que ocupe tal posicho, interpola-se tomando para valor de @, 0 niimero que capa 0 12.° lugar (195) xo rol, ao qual se adiciona 0,75 do intervaio entre os 12.° ¢ 13° valores do mesmo rol, isto 6: Q,=195-40,75><2=190-41,5 196, 2 © segundo quintil, por exemplo, ocupa a posigio = dy ¥. 5 Na série do quadto n° 2.0, o segundo quintil sera o termo de 2 2 = + - orden = ><51 12? . 20,4 que também nio existe, Nesto 5 3 caso, ao terme de ordem 20.° (830) adicionamos 0,4 da diferenca entre ole © 0 seguinte e obtemas : 320-40,4<3—9204-1,2—321,2.. 2.21~Quartis, decis, ete. Dados classificedos. Proceso numérico. Também aqui temos que admitir, como ao caleutar a mediana, que dentro da classe que contém o valor do quartil, decil, ete., os dados se distribuem a intorvalos iguais. 86 assim 6 vélido 0 método de interpolagio linear empregado. 32 MANUAL DE ESTAT ISTIC, Para 0 cilculo de gusiquer destas medidas de posigio (¢ exem- plificands com o do 1.° quartil da distribuigio de frequéneias que consta do quadra n.* 2.10) procede-se como segue: 1) Determina-se a posigiio do termo cujo valor Ag 4 2) Verifiea-se qual a classe que a contém, para o que se utiliza a coluna das frequéncias acurmuladas, No nosso caso éa 3° classe, 3) Foz-se a diferenca ¢ entre o nitnere que representa a ordem ou posigio do terme cujo valor se pretende caleular, e a frequen- cia acumulada da classe anterior dquela yuo 0 contém. No nosso caso 6 65,7h 41 24,75. 4) Caleula-se o valor procurado usando a formula: se pretende caleular. No nosso case fs a, ; onde: ¢ & 6 limite inferior da classe que o contém : 2 é a diferenga catealada em 3}, acima: Jf 6 a frequéncia da classe que contém valor procurado ; é & 0 intervala da mesma classe, No nosso ess a aplicagio da formula dé: ste caso, também, em virtude da hipotese da rectilinearidade da distribuigio des valores dentro de eada classe, o valor eneon- trado pode ser diferente do obtido pelo método referido na seegio anterior, quando este possa ser empregade para confarcneia, 2.22- Quariis, sextis, etc. Dados clasificados. Processo grafico. Estas medidas de posigio, & semetlianea da tmediana, também podem ser representadas grificamente. © procedimento ¢ absolatamente andlogo ag estudado na sec- cho 2.19, sé com a diferenga de que se pretende determinar 0 valor de gnertil, on de ontra medida de posigio, om vez de se determinar o da medians. MEDIDAS DE POSIGAO No grafico n.’ 2.1 esti felta a dotorminagio grifiea de (2, ¢ de @, (primeiro 6 terceira quartis), 2.23-Mods. Dados nao classificsdos. Dada ama série de valores X,, 5, » chama-se moda ou norma? aquele valor que na série apareeo nis vezes ropetide. Daqui resulta que mauitas vezes a moda é de Impossivel determinagio, como acontece na quadron.°2.9 onde nenbnma das frequéncias aparcee repotida. © mesmo jd no acontece com os precos do quadra n. 2.11, onde o de 4860, que apsrece 11 vezes repotido, eoustitni witida- mente x moda. Quadro n° 2.1 Prego do quilagrama de agacar refinado branco nas capitels dos distritos do Centinente, em 15 de Janeiro de 1941 Origen: Auwinér Estatistieo de Portugal, W941, pd. 568. regan requdnae © poligono de frequéncias do uma série mostra imedintamento sé 4 mesma apresenta moda ou nia, @ no caso afirmative, qual o valor que Ihe eorrespoude. A moda corresponderd ao maior pico do poligono do froquéncias. Aeonteca que este polieno, POF vezes, apresenta varius picos, pelo que a série se diz plert- nodal (com a partienlaridade de se chamar bimodal a série cujo poligone apresente dais picas). Neste caso, se se tratar de am ral de frequéneias, devem estas ser agrapadas em elassos conve- nientomonte pscolhidas até qne a série se apragente com uma s6 moda (para o ge se segue processs idantico ao do quadre a." 2.12) que, em seguida, se calenla por qualquer dos processos estudados na seeeio seguinte. 2.24—Mode. Dados clasificados. Numa distribuigho do frequéncizs nunca se pode ler directamente o valor da moda, mas simplesmente qual a classe modal, isto 6, a classe que contém a moda, 3 MANUAL DE RSTATISTICA Se a distribuigéo de frequéneias apresentar uma classe nitida- mente modal, a mada pode ser determinada pela seguinte formula: Me onde: AM, é a moda; / © limite inferior da classe modal ; i 6 o intervalo da mesma classe ; , 6 0 midulo, isto & 0 valor absolute da diferonga entre a frequéncia da classe modal ¢ a da classe imediatamente anterior. 4, 6 6 médulo da difereaga entre a frequéneia da, classe modal a da classe soguiute, Propoe-se tambére, em vex da formula anterior, a seguinte : oude: My. 1 © § tam os significados indieados para a formula anterior ; JF, 6» fequeneia da classe que anteced a moilal : Fi: 6a froquéncia da classe que se segue & modal. Na distribuigio que consta do quadro n.° 24 a classe modal 6 2 tereeira © 2 moda sori: usando a primeies das formulas meucionadas, BE: eg. i8 4076 AL, “2S tuilizando a segunda férmuls acinia indicada. Os valores eneon- trados nto diferem grandemente entre si, Se a disttibaigto de freyuéneias nic presentar uma classe nitidamente modal, o proceso seguinte indiea a forma de a obter. Cora os dados originalmente agrupados em classes de i=3, as froguonelns (coluna 2) distribuem-se auina série plarimodal, Além MEDIDAS DE POSIgAG % da moda principal (78) podem distinguir-se modas secundirias (70, 46 © 42). Agrupando as freqnéncias originals em classes de intervalo igual a 6, obtém-se duas novas séries (colunas 3 6 4), ambas sinda plarimodais. Continuando a alargar o intorralo das Quadro n° 212 Determinagéo da classe modal de ume distribuigSo de [requéncias plurimodal. Presséo arlerial maxima (X), depois de esforgo, de 327 rapazes n3o desportistes da Mocidade Portuguesa SL 118 1s 116 Ty 218 1240~ 423 125 ~ 125 126 ~ 198 | classes ¢ agrupando agora as frequéneias originais em de intorvale igual a 9, obtam-se 3 novas séries (colunas 5, 6 ¢ 7), 86 uma das quais (a da coluna 6) 6 plurimedal. E assim se obtivoram séries mnimodais, © agrapamente em classes de inter- valo igual a 12 6 apresoutado uo quadro n,” 2.12 meramente a titulo ilustrstivo. Obtida a classe modal, a moda determina-se por meio de uma das duas formulas anteriores. Ma. i DE ESTATISTICA Vé-se assim que o trabalho exigide parn a determinagio da moda pode ser avultado. Pode evitar-se este rabalho e obter-se o valor da mods {ow de um valor aproximade da moda) dos valores de uma série por meio da formuta: My m Me BEM, Me} onde: M, & a moda; AL, 6 a média aritmétiea: Aid é 4 medians. Para a uplicagio desta frmula é necessirio que se conhecam ou se possum calenlar a média aritmétien e a mediana ¢ que a distribuigdo seja simgtriea ow moderudunente assimétrien. ‘APITULO 3 MOMENTOS E MEDIDAS DE DISPERSAO 3.1-Momentos. Dados no clasificados. Utilizegio de uma média imaginaria. Designam-se por prizaciro, sogundo, ote momentes-voafieiontes ou simplosmente momentasas médias aritmcti- eas das primeiras, segundas, ete., poténcias dos desvios dos valores de uma série, om relagio h média aritmética dos mesmos valores. Para evitar 9 cilealo prévie da média aritumétiea, 6 mais eSmodo calcular os momentos em relagio a um valor qualquer da série, o qual ke toma para média imagindria, depois, a por- tir destes, caleular 08 momentos em relagio & média. Exemplitiquemos com os dados de quadro n° 3.1, Para 0 edleulo dos momentos procede-se como segue: 1) exeolhe-se um valor da série para médix imesinaria, prefe- rindo-xe, para facilitar og eileulos, wn valor central, isto é&, unt valor que figue, pouco muis ou menos, tho afastade do primeire cumo do ditimo termo da série. A partir dessa inédia imagind- ria (no nosso cago 12,70) caleulum-se os desvios d dos valores da série, desvios que se exprimem na unidade da série (no nosso casey escudos) ; 2) efectuam-se e colunam-se as segunda, tereeira ¢ quarts poténcias daqueles desvios : 3) Somam-se as diferentes calunas ¢ obttm-se S{u), SW"), SO) e SW); 4) Calculam-se os momentos a partir das seguintes formulas: S@. « Sa? 1° momento: m,—- 2. 9° momento: mw, = 2 am 2 wo yt S . 32 momento: m= SY, 4» momentos m,— 2. N x 38 MANCAL DE ESTATISTICA Quedro n? 3.1 Céiculo dos 4 primeiros momentos. Dados no classificados. Utilizagdo de uma média imaginéria. Elementos do quadro n. 1.1 1.40 41,80 11.80 14) 22,0 42,0000 10,4976, 3.2- Momentos. Dados néo classificedos. Utilizagao da média exacta. Os momentos podem, evidentemente, ser eal- eulados @ partir da médis exacts. No quadro 1. 5.2. mostra-se © cileulo dus mesmos momentos di mesma série usada no quadro a! 3.1, Vaellmente se vé que a stilizagin da média imagindria permits poupar trabalho, motive per que 0 método geralmente seguido. MOMENTOS E MEDIDAS DE DISPERSAG a9 Para calealar os momentos utilizando a média aritmética exacte, procede-se como segue : i) Caleula-se a média aritmeétiva da série dada. No caso pre- Quadro a.” 3.2 Céicuia dos 4 primeiros momentos. Dados ndo clasificados. Utilizegdo da média aritmétics exacis, Elementos do quedro n.° 1.1 42025) 1,625) 0,725} 0,725 2.5635 11,80 11,90 11,90 1210 12.10 0,54 640 625 0,09 140 625 0,09 150 625 0,01 100 62 0.01 0 625 0,01 500 625, 0,049,878! + 0,000.125; 0,08:000 625 + 0.042.875) 0.01 500 625, 4 0.04100 625 274.625, 0,17 850 6: + 0,857,375) + 187.635, 4 6,931.625) 378 42,28 250 2 12,607.000 § (2°) = 77,86 14 250 a= 0, 7032 sonte, ela encontra-se caloulada aa secgio 2.8 ¢ 6 12,85 escudos. Fazem-se as difereagas au desvios d entre eadu valor da série © a média aritmética, 3) Calewlam-so as segunda, tereefra ¢ quarta poténcias dos desvios d. Colunam-se essas poténciss. MANUAL DE ESTATISTICA 4) Somam-se as diferentes eolunas 0 obtémse: S(f), Sia’), Sot) 6 Sid). 5) Calculam-se os momento sem relugio A uiédia exacta, por mein das formulas 1° momento: 7, = ; 2° momento: =, BO moiwents sm, = 42 momento: © primeira momento em relagio A média exacts deve ser sempre igual a zero, em virtude de uma propriedade de que a media aritméticn goza e quo se pode camuciar asain: a soma dos desvios dos valores de uma séric tomados em relastia 4 média aritiética dos mesmos valores, ¢ zero. Dos momentos caleulados em relasio a uma média imagi- néria pode sempre passar-se para os momentos =, ew relagio A média exacta, por meio das relagbes seguintes, que no easy presente N28 —(-- 6,00" 1,1003 Buri mp Bu «20,5245 —3 (0,03) Se 1 1W88 2 ( 0,057" 0, 7033 fan, m, + Gin? my — Brats 4 2070— 4 (0,00 ><0,5245 26 (0,08 )'5¢1,1928—3 (0,05)! 4.8807. Comparando os momentes assim obtides com os ealeulades directamente do quadro a." 3.2, verifiea-se que os valores encen- trados sio praticamente os mesmo: 3.3-Momentos. Dados clasificados. As formulas que nas duas seeghas anteriores nos serviram para caleular os momentos, sofvem uma ligeira modificaria no casa de os dados se apre- sentarem classifieudos, istu 6, frequencias. Neste caso, procede-se como segue, utilizande os dados do quadro 12 1.3: i) Organiza-se um quad, cujas duas primeiras eolunas sho as classes o as frequéacias respectivas, de distribuigio dada. postos numa distribuigho de MOMENTUS Eo MEDIUDAS DE DISPERS AO 4 calhe-se, de preferéneia, um valor central para média imaginaria a partir da qual se contam os desvios @, expressos em iitervalos de elasse. 3) Efectuam-se os produtos das frequéneias pelas primeira, terceira e quarta paténcias dos desvios, de mode a segunda, Quadro n° 3.3 Caleulo dos 4 primeiras momentos. Dados classificados. Elementos do quadro n.” 1.3 2.065 - i 81 400 320, 40 83 5.00 oi 0 10.00 - 31,99 | 7 + 38 33 320 obter dof, PF, df, af. Somam-se estas colunas e obtimse S@.f), SALA), S@LP, SUL). 4) Obtém-se os primeira, segundo, terceiva, ¢ quarte momen- tos em relacio & média imagindria escolhida, por meio das frsoulas : mw SI) Sf) SOD 3 hy = onde m,, my, m, © m, estio expressos em intervalos de classe. 42 MANUAL DE ESTAISTICA 5) A obtengio das momentos om rolagio A média exacta faz-se por meio dus relagdos ja atras meneionadas : = myn aig Bi mi Bait ong ban, m5, AT Bint 6 =, cstilo referidos a intervalos de classe. em que =, Para os expritirmos na mesms mnidade da série, multipliea-s o), m, por fe a, por i! =, por @ {onde fo intervalo da ¢ Ja se disse que» reuniio dos dados ent classes fas perder em exactidiy o que se ganla eu comodidade. No caso dos momen- tos, os vulores eneontrados para dados classilieadus sio rectifi- cados por meio das eorrecgtios de Sheppard. As firmulas dos momentos depois de corrigidas sio: 240 Aqui, o§ momentos estio referidos a intervalos de classe, As formulas dos seguade © quarto snomenins, expressos na mesma unidade da série, so: ty = Typ aa" onde ¢éa grandexa do intervale de classe. As correcgiies de Sheppard nem sempre se podem aplicer. tm geral, 0 seu enip 4 legitimo se: 1) A cnrva que tradux a distrituigko de frequencias for assin- tétien ao eixo dos aw em ambus as direegdes, quer dizer, se a curva se prolongar para ambos os lados da normal, de modo a sproximar-se do eixo dos wa, xem coutudo o tocar. PEO S MOMENTOS #OMEDIDAS DE LISPERSAG 43 2) Os intervals de classe nfio excederem cerca de 1/12 do intervalo total, 3) A varidvel for continua. Na pratiea, mesmo que a varidvel seja descontinua, aplicam- as eorreegdes do Sheppard, desde que a unidade de medicaa seja muito pequena ent relagio ao intervalo total anencionado acima em 2}. 3.4-Dispersio. Definigg0. Por disporstio eatende-se 0 facto de os valores de uma série diferirem was dos outros, A disper- sto sera, pois, maior ou menor, confurmo essa diferenga for do maior ou menor amplitude. Existem modidas de dispersio absolutas e relativ seriio estudadas algumas de cada categor' e Adiante MEDIDAS DE DISPERSAO ABSOLUTA 3.5-O intervalo total. Dada uma série de valores XX), --,Xy, chama-se intervalo total 4 diferengn Xy—, Na série da seegiio 1.1 o intervalo total 6: 15820 -~ 10560 = 4860 O intervalo total tem a seu favor a simplicidade com que ¢ obtido. Ne entanto, sb deve ser usade se: 1) Os dois valores extromos utilizados para o seu cileulo {ou mesmo 86 um deles), no furem de ocorréneia invulgar. Por exemplo se numa série de medigies de altaras de homens portu- gueses, aparecer uma de 2 metros, o intervalo total niio de ser usado como medida de dispersio da série. 2} No caso de comparagio de daas séries, estas tiverem frequéncias totais (N’) iguais, ou, pelo menos, nde muito diferente: 3.6-O intervato 10-90 centis. Para obviar av primeirs dos inconvenientes apontados na seceio anterior ao intervalo toiel, usa-se smente o intervalo entre os 10.° e 90.° centis. ou, © que é 9 mesmo, entre os 1° e 9° deeis, AL DE ESTATISTICA 44 3,7—0 intervelo quartil. Esta é wma das medidas de dis- persio mais usadas, pois apresenta a particularidade de sbran- ger metade dos valores da série. ‘Acha-se ealenlande os 1° @ 3.* quurtis e f diferenga = ene & sua = 4,-— Q, Vimos no eapitaly anterior (seectes 2.16 6 2.20) que amediana dividia 1 série ao meio @ cada uma destas metades resultantes por sua vez, dividida ao moi por Qo Wy. Abaixo de Q, existem, pois, 29°, dos valores da série, 0 mesmo acontecenda nian de Q,. Batre Q, ¢ Q, ficam, portanto, situados os 50", eontrais des valores da séris. © que agui se diz 96 & vilido se a distribuigio for simétrica ou toderadamente assimeétrica, Se nie, na regiio central nite fica compreendida motade dus vulores da série. 3.8-O intervalo semi-quartil. Esta medida de dispersio é também de uso bastante corvente. Como o seu none indica obtan-se nebando metade do intervalo gaartil, ,- @, Como agontece com o intervato quartil, o iatervalo semi-quartit sé so dove usar pare distribuighes simétrieas ou maderadamente assimétricas. 3.9-O desvio médio celculado a partir da mediana. Dadu uma série de valores X,,X,,---, My, acka-se o sea des- vio auédio, ealenlando a sua mediana Md, fazendo us diferangas ii, X,— Md... Xy— Ald de cujos sinais nao se faz case ©, fingimento, caicnlando # média aritméticn destas diferengas. Esxomplifiquemes com os dados do quadro n.° 3.4. Sendo N-=18 faimero par), a medians acha-se fazendo 9 média aritméties entre o terme de ordem == 9 (48810) ¢ 0 de ordem x . > 10 (também 4460), Portanto, o valor da mediana é também £560, MOMENTOS E MEDIDAS DE DISPERS ie 45 Os valores absolutes dos desvios [d| em relagio & mediana acham-so na coluna respectiva. A sua soma é 5 © desvin médio &: DM - ste desvio m6ilio, sujeito a todas os lependendo do caleule prévia de medians, neonvenientes ¢ limitagtes apresentadas Quedre 1.” 3.4 Calculo do desvio médio, @ parlir da mediana, dos precos de acicer refinado branco, por quiiogrema, nas cepifeis dos distrites do Continente, em Janeiro de 1941 Origem: Anuirio Batatistion de Portugal, UAL, pag. 58. di x i 510 4860 00 10 2400 300 305, +6ci) 500 305, 430 500 300 4560 500 30 4560 200 500 4405, 08 #00 4865 800 43T5 530 au ostudar esta medida de posigaa, Por mais ge parte dos casos, mais pritica, usa-se o seguitit 3.10-O desvio médio calculedo a partir da média ariimé- fica. Dados nao classificados. Por este proceso, idéntico uo anterior, ag derengas (também em valor absoluto) sto tomutdas em relacio 4 média aritmética. Exemplifiyremes com os dados do qnadro a.” 3.5. Procede-se como segue: 1) Calcula-se a média aritmética dos valores da série, SQ) & na maior 4607). 46 MANUAL DE ESTATISTICA 2} Galeulan-se os médutos dos desvios [dj entre os valores da série ea da média aritmética : jal= Somam-se estes desvios abtendo-so Sd]. 3) Calewia-se 0 desvio médio Sid} DM = §03(222). Quadro a 3.5 Céleulo do desvio médio, a partir de média arilmétics, dos precos por quilagrama, do agdcar refinado brenco, nas capilais dos distritos do Continente, em Janeiro de 1941 Origem: a indicada no quadre 2.° 34, x ial ia 4550 BOHT; 4800 50003) 4850 Bugz} 4800 80063) 4855 ANH} 4860 00/3) 4855 SOUT 4860 4860 003) 4860 4860 403) 4360 4560 200i) 4885 4360 s00;3) 4805 4860) Bw) Ag 1510 S808) A186. Voerifiewse, puis, que o desvio médio euleulado a partir da mediana é menor do que o calculado a partir da média aritmé- ties, Isto 6 consequéncia de waa proprisdade da mediana que iz que » soma dos médulos dos desvios tomados em relagho A medians ¢ um minine. Quando as distritmigtes sho simctrieas, ou quase, como acon- tece nu excaplo utilizade ue cileuto do desvio médio, os valores eacontrados para este, n¥o se afastam muito um do outro. Este facta 4 consequéneia de wna propriedade das distribui- gdes simstricas qne consiste na coincidéncia dos valores da média e da mediana. MOMENTOS E MEDIDAS DE DISPERSAO aT Se a distribuigio for simétrica, 57,5 por cento dos sous valo- res ficam situados dentro do intervalo Jf (rh 28: ; «dy 4) Caleulam-se os produtos f.d multiplicanlo, linha a linha, cada desvio d pela frequéncia da respectiva classe. Somam-se estes produtos e obtéu-se S(f. d) 5) Calculam-se os produtos 7.d° multiplicando, linka a linha, cada produto f.d pele deavio correspondente, Somanise estes prodatos e obtemse S(f.d?). 6} Determina-se « intervalo de classe { fazendo a diferenca entre ox limites inferiores de duas classes consecutiyas, 7) Caleula-se o desvio pudrio por meio da formula: a8 MANUAL DE BSTAPISTICA a qual se transforma er: a Vv Sp . se repesentarmes “I~ pow C Foeste o métede asualente empragado oo cdlenta de desvi padriio de dados clasificados. 3.19-A diferenge média. Dados nao clasificados. As snodi- das até aqui apresgntadas estudam a dispersiio en: relagko a uma medida central, em geral a média aritinétiea, Nenlama delas toma em conta as difecongas entre as valores da série, como 6 fax a diferenca média g. sta medida de dispersia pode . eat Beak . N{N—L pois, sor detinida como a méstia aritnetion dus SN} aiseren- gas d@ que se podem formar, de todas as maneiras passives com os NV elementos de uma série estativtica. Para calenlar a diferenca anédia pode usar-se o seguinte método, willizende como exempla os dados do quadre n2 1.1: Quadro n° 3.13 Calculo da diferenca média, Dados nfo clasificados. Elementos do quadre n.° 1.1 13.80) vi | 13.00 12.70 12,30 1817 HE MOMENTUS E MEDIDAS DE DISPERSAG ag 1) Dispiem-se os dados X por ordem decresceate, Divide-se © mimero total de dados por duas 2 eolunas: na primeira coluna ficam metade dos dados, dispostos por ordem decres- conte de cima para baixo, Na segunda coluna fica a outra metade, disposta por ordem decrescente, mas de baixo para cima. Se as dados forem em nimero par, como acontece no exemple dado, sproveitam-se todes. So forem em numero impar, despreza-se © termo central, qualquer que ele sejit. 2} Colunam-se as diferencas d entre os pares de dadas de rada linha. 3) Colunam-se os multiplieadores: 3f=N—1,N—3, N- om que N 6 0 ninero total de dados. 4) Bfectuam-so os produtus P=d. Jf, multiplicundo, tisha a linha, as diferengas mencionadas em 2} pelos multiptieadores citados em 3), Somam-se estes produtos @ ohtémese S(P) 5) Caleula-se a diferenga média por meio da frmula: V(X, Xp oe ON or 3.20-A diferenca média. Dados classificados. Dada uma distribui¢io de frequoncias, para calenlar a sua diferenca média pracede-se como segue (quadro n° 3.14}: 1) Colunam-se as classes da distribuigio de frequéncias, 2) Calenlam-se 6 registam-se os pontas inddios X; das niesntas classes. 3) Registam-se as frequancias fi das classes. Somanvse & obtémse S(fJ=N. No nosso caso, 263. 4) Efeetuam-se, linha a linha, os produtos f).X) multipli- cando cada ponto midio pela frequincia da classe respec Somam-se os produtos encontradas ¢ obtémse S8(f).Xa. No nosso aso: 2.247. 5) Caleulam-se, liuha a Jinla, S(j)), subtraindo aX’ as a frequéncias du classe om quostio © de todas as anteriores. Quadro n? 314 Caleulo da diferenge média, Dados classificedos. Elementos do quedre ni, O18 8 FOMSLLRLSH FEV INE MOMENTOS E MEDIDAS DE DISPERSAO bt NTE, &} Fazem-se os produtos 2 S (7) multiplicando, Jinha linha, i os valores obtides coms foi indieado na alinea anterior por 2. 7) Bfectuam-se as somas 2 8 (A441 adicionando, linha a ia linha, aos produtos obtidos como foi indicado na alinea anterior, a frequancia da elasse respectiva acreseida de uma unidade, isto 6, fazendo: col, (6)--eol. (3)41- 8} Calculam-se os produtos inseritos na eol. (8), multigli- cando, linha a linba, os valores inserites nas cols. (4) ¢ ( Soman-se estes produtos 8 obtém-se A, no nosso caso: 496.586. 9) Culeula-se a diferenga média por meio da fiirmula : que, no caso presente, ili: 2 4-1} >< 2.247 BHD 3.21~Relag&es entre as medidas de dispersio absoluta. Algumas das medidas estudadas podem ser comparadas entre sie mesmo ealculadas umas a partir das outras, mediante as seguintes relagies : Note-se que estas relagées s6 sic validas no caso da distri- buigho sor simétrica. 6 MANUAL DE BST. MEDIDAS DE DISPERSAO RELATIVA 3.22-Generalidades. ‘Todas o medidas de dispersio até agui estadadas Gio mimeros eoneretas expressos nas ESN unidades das séries forneeidas + eseudes, quintais, ete. Servem para estudar cada série de per i, mas podem mio servir para compurac as disperses de dias ow mais séries. Se ambas as séries estho expressas nas mosmas unidades ¢ as guas médias aritwéticas ¢ medianas sig as mesmas on aproxi- vnadamente as mesmas, ax medidas de disperstio absolata podem cor utilizadas, Assim se por exemple compararmos a série de pre~ gus coustantes do qaadro n° 3.8 er que ¥ SOO) fom outta série do pregos de média writmétiea ignal ou aprosimada ede a= 1A00, pode imediatameate dizer-se que u dispersiio dos valores da soguuda série 6 superior & dos da primeira. Pordm, se as médias sio muito J iferentes (sendo ss unidades ding duay séties xs miesmas) oa se as unidades « gue ae duas ries ost referidas sio diferentes, mio se podem empregar ns medidas de dispersiio absolata. Para comparaghes das dis- persiies de duas séries, pastes casos, sho usadas as medidas de dispersio relativa, que dio nimeres abstractos @ que comparam uma medida de dispersio com wna medida de posigao. As mais vulgares sia pa pat, MM. Me la 3.23-Coeficiente de variagao. A ultima relagho ¢ a mais Gmpertante das tis. E expressa em pereentagem, designa-se por coeticiente de variagtio ¢ tem a forma ~ 2300. ui ‘A titulo Hustrative, comparemos duns séries do altaras do rapazes da Mucidade Portuguese. A primeira, que carresponde a rapazes desportistas, tem: Mi, = 168em 6 o =5,9em. MOMENTOS BOMEDIDAS LE DISPERSAQ 3 -A segunda. que diz respeite a rapazes nio desportistas, tem : Ji = i6hem e g=tlom. Para podermos afirmar gnal delas apresenta maior dispersio, caleulemos, para a primeira : eG Ws © para a segunda: 2 6-210. 2 ae Wi ‘lunde se eonelui que a segunda série presenta maior disper- sho do que a primeira, Utilizemos agora duas séries reforidas a unidados diferentes. Compazemos a série do alturas de um grapo de rapazes despor- tistas da Mocidade Portuguesa, do di-=18em ¢ 3m cout a série dos pesos do mesmo grape, ile Qs # para a segunda: donde se conelui que a série dos pesos apresonta muito maior aispersio do que a das alturas, © que esta de harmonia com a observagio. CAPITULO 4 MEDIDAS DE ASSIMETRIA E DE CURTOSE 4.1-QOs coeficientes beta. Nas secgies 3.1 a 3.3 travames couhecimento com os momentos 6 aprendemos a ealculé-ios. Relacionando alguas momentos obtém-se ox chamados eoefi- cisntes beta, utilizados nas seegtes seguintes. Estes cocficientes she mimoros abstractos. As expressdes dos dois primeiros couli- cientes beta sia: ®, quando as correegies de Sheppard furem de aplivar (rite seocko 3.3): conforme sto impares on pares og indievs de beta, Utilizemos, como exemplo, os dades veferentes i producie média da trigo por quintal méirico semeada nos esncelhas do Continente. No guadro n." 3.3 foram calculados os momentos a partir de uma origem arbitriria, Obtevo-se 0,228; m= 1,810; m, "a, OBIS; m= 9475. Usando as expressies citadas na seegho 3.2 obtlm-se os momen- tos a partir da média exacta, Assim: 1,810 —(—0,228)-- 1,810 —0, 6 MANUAL DE ESTATISTICA expresso em intervalus de classe; 6 LThBe<2* expresso na unidade da série. 228)<1 8104-2 —0,0225) 1,174 L714 > Se 14182 expressa na unidade da série. Finalmente, BR) ac 0,48. (0, 228)>< aD ATD 0.5004. 0,505 ~ 0,008 = 10,532 expresso em intervulos de els 10,51 sop 8 >< Pa 68, G12 expresso mu unkdade da série, Os dois primeiros coeficieates beta serio pois + 204.30 OLN 0,580 3a7,43 AGE SL 4.2~Medidas de assimeiria absolute. a) Atendendo a qne numa série (classifienda on pao) simé- triea e no poligono ou eurva gue a representam grificamente, 4a média e a moda {além da mediana) eoincidem, e que qaanto piaior for a aasimetria, maior } o afastamento entre a média € a nioda, A M, ¢ ows medida da assimetria absoluta, Esta medida tem o incon- veniente de aio tomar em conta e dispersio da série, sendo, por isso, de aconselhar sbmente quando se comparam duas sérios com a mesma dispersio, o que Taramente acontece. ‘A média e a moda da série utilizads como exemplo na seegio anterior, calewladas so capitulo 2 sto, respectivaments, M,=8.54 e M=1,12. Entio: AE, — M, = 8,54 —7,72 = 0,82. MEDIDAS DE ASSIMETRIA EB DE CURTOSE 87 4) Recordando que nume série (classifieada ow n%o) sing triea, Q, © Q, (o primeiro eo terceire quartis) estiio sitados a igual disténcia da mediana, (Q,— Ma} — (Md ~ Q,) = @,-4 @,— 2.4K 6 igualmente uma medida de assimetria ubsoluta. So a distri- buigio for assinétriea positiva, Q, estd mais proximo da mediana do yno Q,. Sea assimetria for negativa, @, esti mais alastado da mediana do que @,. Se a série for simétriea, é zero o valor fornecido pela expressio acima. Esta medida de assimetria também apresenta os Inconvenientes: apontades para a anterior, Além disso, todos os valores sitaados entre o limite inferior da série e @,, © entre Q, e 6 limite superior da série, contribnem meramente com a san ordeni para océleule de @, ede G,, tanto fazendo que oles so dis poram large interrale como se aproximom nun pequeno iutervata. Tanto a mediana eomo os quartis da série asada anterine- niente para exeuplo, esto caleulados no capflalo 2, @ she, res peetivamente: @,=6,00, Md=8.20 ¢ Q.=0,93. Entio: Q, + G,—2 Md = 6,60 + 9,93 — 16,40 = 0,13 ¢) Para evitar o dltine inconveniente apontado & medida de assimetria anterior, utiliza-se outra, mais sensivel: (Cg — Md) — (Aid ~ 0.) = Og + Cg — 2 Mid utilizendo o 10.9 e o 94° centis. Contudo, embora atenuads, ainda subsiste o inconveniente atrés apontudo para a compara- so de duas séries de disperstes desiguais. A partir do quadro n.2 2.10 ealeulam-se ficilimente: Cp = 527 0 C, Cy Ogg — 2 Md = 12,37 $ 5,27 — 16,40 = 1,24 4} O terceiro momento em relagio & média aritmétiea =, fo ¥, 8e corrigide) é também uma medida do assimetria absolata : Sa") ="¥ sande @ so os desvios dos valores da série ou dos pontos inéddios eTseL Entiio, es MANUAL DE ESTATISTICA das classes da distribuigko dos mesos valores, em relagho & média aritmétiea da série, Como @ste método de céleulo de *, & muito laborieso, utilizas® para o efeito esta ontra relagho, Bo BQ: ja indieada na sec: a, =m, — Bm, m, + 2m onde os m siio as momentos caleuledos em relagiio a uma origem arbitraria, A pig. 66 vimos que o teresire momento da série até aqui utilizada 6: == 14,19 4.3-Medidas de assimetria relative. Qualjuer dos medidas indieadas na secgho anterior fornece valores expresses na wai dade dos dados originais. Quands se pretende comparar 4 assi- metria de duas on mais séries surgem difieuldades quo tornam, por veres, inpassivel a sta aplicagio. Por isso, revorre-se as medidas de assimetria relativa que relacionam usa medida de assimetria abgoluta com uma medida de disperse ¢ fornecem valores abstractos. a) Una delas 6 2 que relaeiona a medida meneionada na alinea a) da vecgho anterior com o desvio padrao : a No eapitule 3 ealealou-se o desvie padrio da série usada como . Entio: ¢ Atendondo, porém, a que a mada mio pode Jogalizada para muitas distribuiedes de frequancius, 0 que Bao acouteee i modiana, a medida de assimctria relativa selma citada frequentements, substitaida por esta outra: BUL— Ald) a Para a série até aqui usada como exemple, sera: B(-Ve) BISA 8.20) 1,02 e 2,65 2,05 = Oy MEDIDAS DE ASSIMETRIA EB DE 60 TOSE co Qualquer destas daas oxpresstes dé um resultado positive aa negative, conforme a distribai¢io for positive ow negativaraente assimétrien. O sxemplo usado confirma esta afirmacio. Os resultados da apticacio da segunda das expressdes men- cionadas, devem variar dentro do intervato +3 sendo a simotria tanto maior quants menor, em valor absolute, for esse resultade. 8) Ontra modida de assimotria relativa 6 a que relaciona a uuodida da assimetria zbsolute estudada na alinea 0) da seegie Aplicando estas exprosstes i para a primeira: 0. “ 18 _ ors Os valores fornecidos pela primeira série variam entre os limites £2 ¢ os dados pela segunda, entre os Timites 21, ©} Outra medida de assimetria relativa 6 a que relaciona a medida indicada na alinea c) da seegio anterior, com o inter- valo 10-90 cantis: (Che M) — (Mat €,.3 Com Oo a qual fornece valores variando entre £1. 0 MANUAL DE ESTATISTICA O valor desta medida para a série até agui usada como exemple é: 124g aes tt _ ois. 71 d) Ainda ontra meilida do assimetria relative 6 a que relaciona 6 tercoiro momento ein relagio i meédia, com @ desvio padrio, isto 6: atendendo a yne, como dissemos na seegtio 3.12, c=, ‘Panto x, como ¢ da série usada até aqui como exemplo, ja estiie citados atras, Entho: 119 19 05" 18,61 0,762, 2m vox desta, usa-so também, como medida de assimetria relativa, 0 covficiente 2, atris estudade na seccho 4.1 e que, aplicado ao exemple até aqui utilizado, dé, como so vin na mesina seco 4.1, 0,080, Be a distrilan io for simétriea, a @ $, sho iguais a zero. o, pode ser positive on negativa, mas ¢, deve ser sempre positive. ‘Nia ha jisnites definidos para a, ow G,, mas valores de a, pré: mos de £2 ede 5, prosimos de 4, indicam assimetria pronmnciada, ¢) Finahente, outra medida de assimetria relativa é a devida a K, Pearson @ olitida pela expressiio : AMendenda a que os 23 necessdrios foram caleulados na sec- cio 4.1, @ valor desta medida para a série até aqui sempre usada &: VOBS0 3,257 -+3) Or PBs IT UK OSH ~ FIG; AUR ATOR 28,805 7,610 Avesta medida 6 dadu o sinal de s,. Nao se Ihe podem esti- polar limites, MEDIDAS DE ASSIMETRIA E DE CuRTOSE a 4.4—Medidas de curtose: absoluta e relativa. Da curtoso, referida na secgio 1.3, também se pode apresentar uma medida absoluta 6 ume relativa. ‘A primeira Go quarte momento em relagio & média aritmd. tiea =, (ow g, se currigido), isto é: =~ St Como se vin na seegio 3.2 6 mais eomodo caleular m, a par er dos momentos m ealeulndos a partir de uma média imazi- niria e da expresso: Fy maybe, iyGni ma, — Bra. A medida de eurtose relativa é a que relaciona aquela medida de curtose absoluta com o desvio padrio. Eo cosficieate 6, estudado na secgio 4.1, isto &: conforme as correegtes de Sheppard forem ou nko de apliewr © atendendo a que, como vimos na seegio 3.12, (ow o=V/a). eacurva for mesocirtica, 6, = 8. Se for leptocurtien, 23. Se for platicartica <3. Portanto, a enrtose ¢ medida pela diferenga : 4-3 _ que sera positiva ou negativa conforime « curva for leptovirties ou platicértica, Utilizemos, a titulo ilustrativo, os dados do quadro o.° 2.11 cuja distribuigho de frequencias é aproximadamento simétrica. 2 quo, & primeira impressio, deixa a suspeita do sor fortemente leptocértiea, pois a irequéncia central (11) aprosenta sensivels diferengas em relagioe 4s imediatamente adjacentes. Pelo métedo deserite na seecho 3.3, caleularam-s primeiros momentos desta distribuigiie obtndo-se : ,=0,0002 5 m,=-0,020.500; =, —0,000.274.591 y= 0,000,021, 801,202 os qnatro 72 MANUAL DE ESTATISTICA Airectamente, uma vex que se utilizow a média exacta (4,597) da série & so determinatam os desvios em relagio a esta média exacta. Rastas condigdes : A curtose &, portanto: 5,1424--8= 2, 1424 o que confirma a suspeita ida ¢ indienda acina de quo esta distribuicko de frequéncias 4 fortemente leptoctrtica. CAPITULO 5 CORRELACAO SIMPLES RECTILINEA 5.1-Nogdes pretiminares. No capitulo 1 apresentimos as distribuigbes de frequoneias de waa variivel e nos soguintes fize- mos o seu esindo. No capitulo presente consideraremos duss variaveis © ostudaremos a assoriagito (neste caso a eurrelagto) entre elas. As varidveis que entram no estudo podem ser ambas continnas, ambas descontinnas, ou ainda wna continua e outra descontinua, No caso de das varliveis, também se pnde fazer a sua repre sentagio grafica, Para isse, utilizam-se wés eixos coordenados € a figura charoa-se um astereograma, 5.2-O diagrama de dispersdo. A tébua de correlagio. Fornecidas duas séries de valores @ pedido 0 estado da corvela- cho (simples, por se tratar sO de duas varidveis) entre clas, 0 primeiro passo a dar eonsiste na elavoragho de um diagrame de disperato, se as séries forem cartas, isto & se os dados forem poueo numerosos, ou de uma tabua de correlagdo no case de o aimere de dados ser elovado. Comecemos por considerar o caso de as séries serem cartas, exemplificundo com os dados do quadro n° 5.1. Protende-se calcutar a correlactio entre o indice do pregos de retalho e 0 fadiee ponderado do easto da alimentagio ¢ de outros produtos de consumo doméstica em Lisboa, para os anus do 1944 © 1945. A construgio do diagrama de dispersiio efectaa-se dando os segaintes passos : 1) Designa-se uma variivel por X ¢ outra por ¥. So bem que a relagio descrita pelo método da correlagzo nia seja uma 7a MANUAL DE EsTAaTiSTICa Quadro n° 3.1 Indice de precos de retalho em Lisboa (X) 2 indice ponderado do custo da atimentscéo e de outros produtos de consumo doméstico em Lisbow (Y}. Origem: Leletine Mencais de Instituto Nacional de Estatistiea, de Janeiro de 1945, pag. 8 e Dezembro de 1945, pig. 565, x Yr 1944 Jamie 166, Fevrrsire oe ee 168 Margo ee 168 i 168 Maiow ee 176 duuhe oe ee 35 cutie. V2 eos 1 Setmbro ee 115 @utudeo ee Ws Noveatro. os . 178 Desembror oe 179 1945 12185 163188 Wid 187 wi 188 Maw 188487 Gonlio eee 168 187 1660 BBL 168 184 Setembro. 6. 87 SL Ciatubto se ATL 188 Novembro. ee TB Dezembet ce AT CORRELACAO SIMPLES REOTILL BA relagiio causal, na escola das variéveis towa-se para ¥ vel independente, ajuela que pode ser snspeitada como causa @ para Y (varidvel dependent?) aquela que pode ser suxpoitade eumo efeito. O casa presente é um exemplo tipico em que uma GOAFICO HP 5-1 og HUE BC Duegs pe aLTALaG Ghote DnDeRApE, wranauwa ne HET Pye 3 fires ponoeRane 16t 30 40 170 180 150 180 Inpece YE Dacgos DE DETALED variivel nfio é causa da outra, Tomaremas o indice de pregos de retalho para Xe » ponderado para F. 2) Num plano, tragam-se dois eixos coordenades que servers para a representactia dos valores das duas variaveis. 3) Divide-se o intervalo total de enda série num certo admers de intervalos parciais, nio sendo indispensivel que as duas séries we MANUAL DE ESTATISTICA sojam divididas uo mesmo mimero de intervales pareiais ¢ gue estos tenham em ambas, a mesma szagnitade. 4) Marcunse os Timites desses intervalos nos respoetivos efxos coordenados e recticula-se o plano poles pontos marcados 5) Toma-se o pritaeiro par de valores das variiveis 6 marca-se no plane 0 ponto que representa as distineias aos eixes eoorde- nados, dos valores tomados. No gnifico n.¢ 5A estio desenhadas a linha tracejada as per pendivalares aos dois eisos, a interseegiio das quais warea a Jocadizagio do pouto (191; 168) eurrespoadents aa primeira par de valores das variiveis agora em estudo, Para os outros ppontos nig se desentiaram essas perpendiculares. Habitualmente mio se desenha genlmma. Note-se que oo quadro n.° 3.1 hi dois pares de valores (152; 178), dais pares cle valores (108; IS4) @ dois pares de valo- res (168; 187), Q grafico n.° 3.1 apresenta cada um dos pontos correspondentes « estes pares Ge valores, mais volumosos do que os restantes. Contando cada um dostes pontos mais volu- mosos coio representando dois pares de valores cada, vé-s0 que os 21 pontos do plano representam os 24 pares de valo-~ res do quadre no B.A. Quanto menor fur a correlagio entre os dais fenbmenos em estulo, mais og puntos se apresentamn dispersos no plano. Lis porquo a este grifieo se chama diagrama en gnifico de dis- persio. Se n covreiagio for elevada, os pontos fiear’ Gos aproximadamente em Lheha, io coloca- No easo de us aries serem muito longas, do é pratico o provesss deserito, du marcar nam plane tantos pontos quantos os pares de valores. Organiza-se entio oma tébua de correlagio, para o que se procede como segue: 1) Desigua-se uma das variiveis por Xe a outra por T, tendo em atengo o dito a este respeito, quando atras se estudou a olaboragio do grafico de dispersiv. 2) Agrapam-se os dados de cada variivel em classes, consi- derands cada wma delas como uma distribuigio de frequéncias. © nitnero de classes que as duas séries upresentam pode ou nto CORRELAGAO SIMPLES BRECTILINEA W Quadro n° 5.2 Alturas (variével X} e pesos (vasibvel Y) de 384 rapazes nBo desporlistes da Mocidade Portuguese } 40459 | 183 | e155} 87-159 163-462 25) kee sor ean 7H? | TBAB | 81-183) T + ror a ri i ih a poy | i 1a | dt | 1 PE a Pie] TS TSC CR A A a ce he ed eC ee | oa tt ! BTA Te [ett het Ear 1 Hii UE | Md OB i | | | sta i roe | iia | sero mes. A magnitude do interealo das classes de cada série pode igualmente ser @ mesina on diferente. 3) Risea-se num plano, wm quadro a duas entradas, Nena Hina, na parte superior do quadro, indiram-se os limites das classes da variavel XY, comecande da esuerda para a direite, Numa coluna, & esyuerda do quadro, indicam-se os limites das classes da variavel ¥, comepando de baixo para cima. Tirando perpendieulares, recticula-se o quadro. 8 MANUAL DE ESTATISTICA 4) Toma-se o primeiro par de valores das veriivels © 1a quadricula conresyondente & intorsecgio da eolea @ da Haha ume esse par de valores pertene 6 wn pequeno traco. Para a eluborneio do qnadro 9.* 4.2 foram-nos fornecidos og 884 pares de valores falturas & pesos) correspundentes aos 484 rapaves, Coma havin um ragaz caja altura estava com preendida entre 145,0em ¢ 147.0 ent w eujo peso estava cwmpreen- fide entre 41,0ke @ 43.0kg, 0 peyueno trago foi mareado na terceira quadriewla, 2 contar de buixe, da primeira colana, Para facilitar a contagem © a conferdncia, em vez do se marcar eu cada qualticula o 5, 0 10.", 0 152, ete, tragos, pade fazer-se nm trago horizontal on ent diagonal sotre os 4 tragos anteriores. Acontece, porém, gue no todo, este provesse é@ de dificil coufersneia, Por issa, recomenda-sa a adopgiio deste outro: a) cada par de valores ¢ waready punt cartio: &) 0 mimero total de curtdes ¢ distribuidy om tantes grupos quanta as elas- ses de uma das variaveis, digninos, no nosso caso, em 13 grupos correspondentes As Xi elusses da variével X; ¢) cads grupo destes 6 dividido em tantos suhgrupos quantas as classes em que a onira varidvel apresenta valores. No nossa caso, 0 pri- meiro grupe seria dividide em 2 subgrupos, o segunda grupo or 2 subgeupos, ete.: @) contam-se os eartdes de cada sub- gvupo e insereve-se @ vivnero aelado na quadrienla respectiva, ‘A conferénela, 6 Bell @ faz-se do modo seguinte: @) toma-se normnonie o namero total de carties que se dividem em tantos grupos quantas as classes da outra variivel, No nosso caso, ent Lf grupos eorrespondentes as 14 classes da varidvel ¥5 4) divide-se cada grupo em tantos subgrapos, quautas as classes O easO, 0 primeiro grupo {yrimeira classe da varitvel T) seria arcanjado em dois subgrapos (tantos, quantus as classes da variével X que tem valoros inseritos na primeira classe da variavel F), 0 segendo grupo em 3 sub-grupos, etc.; c) contam-se os cartbes de cada subgrapo e verifiea-se que os sous winuers siio iguais sos obtidos anteriormente. }} Qualquer des processos mencionados em 4) conduz 2 um quailro semethante ao quadro n.° 5.2 86 com a diferenga de que em que a ouira variavel apresenta valores. No nos CORRELAGAO SIMPLES RECTILINEA cc as guadriculas, em vez de conterem trages, contém os nimeros resultantes da contagem desses trago: Se este quadro upresentar os nimeros muito espallados no plano, a correlagio entre as variiveis niio 6 elevada, Se, ao vontratio, a valores baixos de uma yarlavel corresponderem valores baixos da ontra ¢ se a valores sucessivamente mais altos de uma das variiveis corresponderem valores suc IED mais altos da outra varidvel, a forma como esse erescimento se efectua, ou, 0 que é 0 mesmo, a forma como as frequéneias dus quadriculas se distribuem no plano, diz qual o tipo de correlagio de que estamos em presenga. Pode a proporgie de variagio ser igual, ou pouco dosigual nas duas variavels : entio, as froquin- clas distribuem-se erm Jintia recta ou aproximadamente em finha recta, como os pontos do grafico n.° 5.1, e a correlacio diz-se disso, a propargiia de variacio dis reetilinea, Pode, em ve valores das duas varliveis ser desigual e as frequdncias distyi- buirem-se wama links curva definida, cau em gue a correlacdo se diz curvilinea. No primeiro caso, estuds-se a correlacho recti- linea pelos processos usados no presente capitulo. No segundo caso, estada-se a correlacio carvilinea pele processo mencionade no capitulo seguinte. Pode, finalinente, a proporgho de varia ser desigual ¢ as froquéncias disporem-ss sem ser segundo uma Haha definida. Neste case, caicalam-xe as duas eorrelaghes: & rectilinea @ a curvilimea @ em soguida aprécia-se 0 afastamento da rectilinearidade. 5.3-Q coeficiente de correlacio rectilinea, Definicao. Se a distribuigio dos pontos ow das frequéncias, no plano, nie se fizer marcadamente segundo uma linha eurva, procede-se a0 estado da correlucio reetilinea, Comegaremos pelo eileulo do cueficiente de correlagito rectilines de formala geral: Six) em gue p Nez," a2, ¥ S fang} r @ onde: + é a letra ompregada para designar este coeficiente : vol X ent relagio representa os desvins doe valores da vari Asua média aritmética; 80 MANUAL DE ESTATISTICA y representa os desvios dos valores da. variaivel ¥ em relagio & outa média aritmétien; NV 6 0 primero de pares do valores das varidvels ; ae 6 2y Sho os dewvios padrtes das deas séries de valores. Recordando 0 que na altura propria (seogdes 3.1 e seg.) diese- mos acerca de momentos, verificames que a formula anterior euAricn no 5-2 ACTiTueS & pacssies. atrseéRicas EM ALGUMAS ESTagbes MENEOUCLEGIONS 98 CONTINEITE TiAGRAME BE DISPEREiD MatssBes aTMOSFERICAS = WHS 208 U0 sb Sua Set TaD Od 900 LeMt Let M200 1300 LAN ATTEN apresents win momento-produio—neme por que & conhecide este mitode. © valor ds x futma entre +1e —1. Quando for r=0 isso significa completa independineia entre os dois fendmenos em estudo. r= 1 indica que os fendimenos em estado sie per- foita © positivamen’> correlacionades. r==—1 indiea que 08 fendmenos sio perfeita © negativamente correlacionados. Nestes dois dltimoes casos, os valores das variaveis crescem propurcionalnente. CORRELACAO SIMPLES RECTILINEA aL Se r=+1, 6 crescimento é directamente proporcional, isto &, a pequenos valores de X correspondem pequenes valores do ¥ @ 2 grandes valores do X eorrespondem grandes valores do Y. Se r——1, a peyuenos valores de X corresponilem grandes valores de ¥, ¢ «grandes valores de X correspondem pequenos valores de Y. Os valores de r sio niimeras abstractos Nos exemplos até aqui considerados, os fendmenos om estado sho positivamente correlacionados. visto que a valores ereseentes do X correspondem valores ereseentes do Y, Neste caso, no diagrama de dispersio ou na tibua de correlagiio, os pontes ou os valores agrapam-se numa linha imaginaria lengada em diagonal de baixo para cima ¢ da esquerda para 4 diretta, No grifico m5 as pontos distribuer-se 4 volta do ume links haagindvia langada da esquorda para a direita e de cima para haixe, Os fonimenca em guestio silo negutivamente correlacienades, pois a valores erescentes de X correspondem valores decrescentes de T" 5.40 coeficiente de correlac3o rectilines. Dados nao clasificados. Primeiro processo de calculo, Se V for tho poveo elevado que nao meregs a pena organizar uma distribui Ghe de feequéneias, pode adoptar-se 0 métoda seguinte para o edlenlo do coeticiente de correlagio : 1) Colunam-se os valores das duas variaveiy Xo Y. Somam-se as duas colunas e obttun-se S(X) eS (1). 2) Efectuam-se, linha a finha, os quadrados do X, 08 quadea- dos de Ye os produtos XY, Somam-se ostas tes colunas € obtemse S{X*}, S(F*} ¢ S(XY). 8) Caloulu-se o coeficiente de correla io por meio da formula: que se demonstra ser equivalente & Sirmula goral indicada na Ro anterior © 6 de mais cil aplieactio. No caso presente Sra +0,983. Quando os valores das variéveis sia nimeros altos ¢ tedos constituides por algarismos significatives {isto é, diferentes do zero}, 0 céleulo das toe (itimas colunas do quadre no 5.3 6 ‘ gee IAL DE ESTATISTICA Quadro n." 5.3 Céleulo do cosficiente de correlagio rectilinea entre o ndmero de alunos que fizeram, com aproveitamento, o exame de 4.* classe do ensino primario (variavel X) ¢ 0 ndmero de alunos que requereram exame de admisséo eos liceus {variével Y) nos distritos do Continente 2 no ano de 1944 ‘atatistica da Enoagiia, V43-UMA, quadros a. re | 5,837.05! 145.084 1.128.963 85.264 ESE 400! 161.004 5L.uTe 73.984 $ 206918} E.Ag8.998 1.800. 96s | 43.2645 j garg) o84gne) = g.7430Bd) 8 x05 | 883.600 | | 183.300 L4G) 40,886,025 | 2.005.068 3 8.998.680 408) S.aIT.8ut 106.404 958.392 M1 2OL9.248 | 20.045 242.991, 2 6, 20.164 142.568 2.007.889 88.025 276.515 BB. 685 | 300.304 4087. Se of = 8.481.900} = AM, = 470 CORRETACAO SIMPLES RECTILINEA 83 muito laborioso. Por isso, pode empregar-se 0 método da seecho seguinte, Utilizar-sed o mesmo exeniple para que o leitor possa coiparar o trabalho exigido pelos dois métodes. 5.5-O coeficiente de correlacéo rectilinea, Dados no clasificados. Segundo processo de célculo: desvios con- tados de médias imaginarias. Adopta-se a marcha seguintes 1) Colunam-se os valores das duas variaveis X e YL Para cada séria verifican-se quais os valures extrenmios @ toma-se como média imaginiria para a contagem dos desvios, a semi- -soma desses valores extremos. No caso presente os valores extremes da varldvel X sio (40 6 S276 @ a sua somi-soma 9404 (tomada para X) 6 249 R276 or == 4608; os valores extremes de Y sio 142 ¢ 2178 a sua semi-soma (escothida para Y.) € 1160, 2 Efectuam-se os deavias e=N—X, ¢ y= ¥— ¥, entre cada vulor da variivel X es saa media imaginaria, e entre cada valor da variivel Fe a sia média imagindria, tendo em conta, para todos us desvios, os respeetivos sinais. Colunam-se eases dos- vius. Somam-se ¢ obitm-se Siz) e S(y}. 3) Para eada Kiehe, enlonlam-se os quadrados de x. os dey @ 08 produtes oy. Somam-se estas trés colunas @ obtém-se S(o"), SUP) e Siwy). St 4} Caleulam-so: Cos 5) Caleulaun-so os desvios padrtes, para o que se utiliza o método doverito na seecio 3.15: @)_ ps (Sena «« 6} Caleula-se p a partir da frmula: pa SD N 7) Finalmente, calcula-se 0 coeficiente de correlagio 7 pela P formula jA conhecida : 84 MANUAL DE ES TAT! Quadra n° 5.4 Céleulo do coeficiente de correlacSc rectilines entre as variaveis X e Y do quadro n. Desvios conlados a partir de médias imaginarias, + 3.225.040 + 2.518.994 +8.109.232 0.68 758) C601 MY : 734.084 a0) 190 i TA 601 Bad} 3.539.620 Casi ALG! 3.052.009] 4 447.232 Quo! 408! 5.108.081 1.698.768 aaet| amt} 10.156.949 +3181. re 12.988 814 4+ 5.068872 17} 195] ‘ 10182.481 31.225 4-B.079.315 Lats] O48 $1,072.59 CORRELACAO SIMPLES RECTILINT A 30 gne fornece resultados inferiores aos da seecke anterior, eonse- quonela, certamenie, de se ferem tomado de A escolha do método para eulenlar o coefigiente de correlacia, deve ser precedida de obsorvacio poaderada, O método desta sregio fol apresentado coma vantajosy sobre o da seegio ante- rier por aearretar « realizagto de operagties menos laboriosas Afinal, verificou-se que aquilo yue 6 verdade em geral, provow nao ser verdade no caso presente, por os quudrados dos dos- ving serem tanto on mais dificeis de caleular do que os qua- drados dos valores originals, culeuludos na sacgio anterior. E gue a forma de escolher as médias imagindrias indieadas acima ev) 1) niio é sconselhavel no caso presente em gae hi an par de valores (0 correspondente ao distrito de Listioa) excep- cionalments acima de tados os outros. Por tal motivo, as médias imaginarias so mnite clevadas, 0 que da lugar ao aparecimento de dosvivs também muito elevados. O método seguinte também 6 baseada no edleulo do desvies. Mas porque no céleule da média a partir da qnal os desvias sio contades, se entra com todos os valores da série @ no sim- plesmente com os seus valores extremos, as magnitudes dos desvios so inferiores, Por tal motive, as operagies a fazer sho menos laboriosss @ ¢ método recomenda-se (pelo menos noste exemplo) em vex do da presente secgio. 5.6-O coeficiente de correlagio rectilines. Dados no classificados. Terceiro processo de célculo: desvios conte- dos das médias aritméticas, Usomos ainda o mesino osemplo. Procede-se come sezne: 2) Colunam-se os talores das duas varidveis Xe ¥. Soman-se esses valores © obtinese S(z)e Siy). 2) Caleulam-se as médias aritméticas suuples dos valores das dues variiveis, a partir das formulas : s(x) ~ £20, TOs. Colanam-se 3) Calculam-se os des estes desvios, 4) Linha a limba, calculam-se os quadrados de x, 08 de y 88 MANUAL DE ESTATISTICA Quadro n® 5.5 Chleulo do coeficiente de correiegao rectilines entre as variaveis X e ¥ do quadro n.” 5.3. Desvios contadas das médias aritmétices exactes ay 2 4 19.624 1430) ~ 178) g 201.140 6a 18.564 eel 13N76 288.164 = 188) . 3 | = AILOTS 2074 84 8.096 1.084} 220) Bs) 19 ai suai eel 30) 38} 294 8 Baath! — Baap as tors) CORRELAGAO SIMPLES RECTILIN 8t 6 os produtos ay. Somam-se as colunas destes trés valores e obiturse S(a*}, SG) © Say). 5) Calenlam-se os desvios padrdes das duas séries pelas fér- imulus indicadas na secgio 8) Caleula-se p a partir da foraula: Sm) N 7) Finalmente, calenla-se 0 cocficiente de correlagio pala P formala > S23, 5.7-O coeficiente de correlecae rectilines, Dedos no classificados. Quarto processo de céleulo, 0 método seguinte apresonta sobre os dois anteriores « apreciivel vantagem de disponsar o edleulo dos desvios padries. Para ilustragio asemos ainda o mesmo exemple e como o quadre n.® 5.5 contém tndos 0s elementos necessaries, n&o se elaboraré nove quadro. A mar- cha a adoptar 6 a soguinte: 1) Colunam-se os valores de cadu uma das variévels, Somate-se as colunas ¢ obttmse SCX} @ SUF 2) Caleulam-se as médias arite strio por meio das férmulas: as dos valores de cada Ne y-¥—¥. Colunam-se 3) Caleulam-se os deevios « ostes desvios. 4) Linba a linba, caleulam-se os quadrados de a, os de ye os produtos vy. Somam-se estas trés calunas ¢ obtém-se S{z*), SG) & S(ey). 5) Calcula-se 0 coeficieute de correlagio a partir da formula: S (ay) 8S MANUAL DE ESTATISPICA que se prava ser equivalento & formula geral citada na seegho 5. Ne cash presente obtome 0,983, resultado igual ao ebtido pelo primeire processa deserito na seeeio 54. 5.8-O coeficiente de carrelagéo rectilinea. Dados nbo classificados. Quinto processo de calculo, Oi métade seguinte, que ttiliza a mesma formula do anterior, 6 contudo, de mais | aplisscho. (semos como exemplo os dudos relatives as altitudes © pressdes atmosféricas em algumas estagbes meteore- Hégieas do Continente, os quais serviram de base & elaboragiio do grafico n° 5.2. ‘Trata-se de uma correlagho negativa, A mar- cha a cuir & 4) Colunam-se og valores das varliveis Xe Y. Somam-se estos valores ¢ ohttmse S(X) @ SU). 2) Linha a linba, efvetuam-se os quadrados de X, os de F e os produtos de XY por ¥. Somam-se os valores assim cal- eulados e obttmse S(X*}, 8M} e SEXY). 3) Calenlam-sé as médias aritmétieus dos valores de eada variivel, Obtim-se : que mo caso presente dA: Sf) = 6.280.758 — 485,00 >< 7.761 — 2.595.202,34. G) Cylenlase S{y') a partir da relacko Sf) = S(¥*)—F.S(Y) CORRELAGAO SIMPLES RECTILINE. gus no caso presente da: S(gP) = 14.824.477 — 961,56 >< 15.385 7) Caleula-so 0 coeficiente de correla SOBA, Obiém-se, pois, para x am valor negative e muito alto como o gvatico n.° 5.2 fazia prover. Quedro n2 56 Altitudes e pressdes atmosféricas em 16 Estagdes mateoroldgicas do Continente wn: Resumes Anuai das Observagies Meieoretéiginee publieada polo Pepe | 0) “2 oy Entegtoe ey x ss Avelto 2 2. 7 101s, 49, 1.080.295, 7105 Cabo Carvoviro . | Hy 1018) 1156 1.026.109) 34.442 Serra do Pilar. «| 100) 1.004) 10.000, 100.400 Sintra... 145) 1.001) 2.028 : Guimaries. | te} gas] Bz ata : Brego da Murta zen 99048400 980,100, Caria Maior . = 885: 82.544 Evora... 5.) S8tl 979, ORNL Moucorve - 4135} om 2 943.841 Vila Beal . $25 967) 180 934089 410075 5398 Pedvas Salgadas 13! sé 875.789 Braganga . 740) 933 532.900) Caramalo. 2. ais! 925) 649.124 Montslegre . . | 1.007 901) 1.054.729) Guarda...) 1.039) 899) 1.079.522 Penhas Douradas| 1 386) 865] 1.920.996, SE p= Gr T7681) 715.385] “6.28075 BHATT 7183 168 90 5.9-O coelficiente de correlacao rectilinea. Dados clas- sificedos. Supeahamos agora que A é demasindunento elovado © que, portanto, é muito trebalhoso o cdleulo de eveficieate de correlagio por qualjuer dos processos estudades nas seegtes anterivres, Latin, procede-se camo segue, exemplificando com © quadro n.® 5.7. 1) Organiza-se uma tibua de correlagio como fol descrito na scogio 22. A esta tibna da-se a seguinte disposigio: a) uma linha e nia coluna para a inserigio dos limites das classes de cada variavel; 4) uma linha e wna colina para frequéucias f: soma dow nimeros inscritos (ow dos trecos dados) em eada linha @ em cada colina; a some das frequéngias inseritas em linha deve ser igual & das inseritas em coluna, no ease presente, 3845 ¢) uma Tinlia @ maa colana para desvios @ 6 y, contados, res- pectivamente, « partir de ama cola e de nma linha, ambas gscollidas arbitririaments. Como regra, eseolher-se s coluna ea Jinba cujas frequincias totais sojam maiores, No nosso exomplo, oscalleram-se a 8° coluna ¢ 8 7." linha eomo satisfa- genio aos proecites cnunciados; @} uma linha @ uma coluna jw 0 fy, respectivannente, para os produtes des dasvios pelas frequén- eins. As somas alztbrieas destos produtos dio S(f.e) e S(fi}s uo caso presente, respectivaimente, 123 e 175; e) ume linha e ana colana, fio e fy, respectivamente, para os produtos dos desyios por fore f.y. Para obiter, pols, os diferentes valores f.a* multiplicam-se, para & mesma coluna, os valores de x 6 de fiw situados am por chua do outro. Para obter os diferentes valores fey, multiplicain-se, linka a Hola, os valores de yy ede fy situa- dos ao lado um do outro, Somam-se os valores assim obtidos @ obtém-se S(fa*) 6 S(fy)}, no exemplo presente, 1.651 « 2.045, respeetivamente. 2) Dentro da quadricula que contém cada frequéncia, ins* ereve-so o nimmero que resulta da multiplicagio dessa frequencia pelo desvio & da respectiva coluna 6 pelo desvio y da linha onde essa Treuencia esti situals, Os nimeros assia obtidos 8 qne no guadro n° 5.7 ram em tipo menos earregads, ernecom S(/.2.y). No exemplo presente é S(f.a.y) Bt. CORRELACAO SIMPLES RECTILINE 4 aL 3} Caleulam-se 4) Caleulam-so os desvios padries a partir das formulas indieadas na seeeo $18 qe dio os desvivs padroes expresses em intervalos de classe. 5) Calcula-se p pela formulas De CC, 6) Finalmeate, ealeula-se o coeficiente de correlagdo : rah, 3 Oy 5.10-As equagdes e os coeficientes de regressdo. Gene. ralidades, Vimos que o eoeficicute de eorrelagdo 6 uma medida do gran de ussociagio entre duas variéveis, Estudamos a forma deo caleular, Estudemos agora as equates de regeeesta que descrevem as relagties funcionals entrs as duas variivels, No presento capitulo estamos 2 ocupar-nos da eorrelacko simples rectilinea eujo edlealo, como diasemos na soecio 5.3, se tents sempre que a distribuigho dos pontos ou das frequen. cias no plana, niio se faga marcadaments segando uma linha curva, Nestas eondigties procede-se ao ajustemento de uma linha reeta, ou melhor, de duas linhas rectas, ehamadas inhas de regressda, 208 pontos on as frequéneias no plang. O método usualmente segnido para isso ¢ 0 dos ménénos ou menores quadrades pela qual a soma dos quadrados das distincias dus puntos (ou fro- quéncias) no plano, as Inhas, deve ser minima. Ha duas linkas de regressiio: a dos Y¥ sobre os AX ea dos XX sobre os ¥¥. Na primeira, X 6 a variivel hdepen- dente © Ve variavel dependente. Nn segunda, ¥ é a varidvel independente e XY s varisvel dependente, Come linhas rectus quo siio, as suas equagies stio da forma: Veatsx X= a+ HX, 92 MANUAL DE ESTATISTICA As linhas de reyresaio cruzam-se na ponte onde eoimeidem amédia geral dos Y¥ com a dos XX o us suas equaghes refori- das a esse ponto podem eserover-so : ¥ onde g € @ stio os desvios cantados para as linbas de regressio, 5, 8 3, 880 os desvios padries de cada varidvel e r 6 9 coati- ciente de correlagio. Se so quiser exprimir aynelas equaghes nas asidades originals, quer dizer, nas unidades das variaveis, nie temos mais do que substituir y e & pelos seus valores, respectivamente : # Yi #-N—-X¥ Logo, as equacies das Tinhas de regrossiio referidas aos eixos dos XX e dos YF, as origens destes eixos a as unidados das variaveis so: os valores chaman-se eveficientes de regreasda e os seus valores sia os das tangentes dos dngulos que as duas linhas fazem, respectivamente, com o exo dos XY @ com o eixo dos YY. Se r= as cquagtes atrés cltadas, transformam-se nos seguintes ou Estas equagties representam duas rectas paralelas, respactiva- mente, a0 eso des AX # ao eixo dos YY, ambas passando através da média geral de todos os valores do quadro e, por consequéncia, perpendiculares uma & outra. Isto significa que as variiveis silo independentes, qua nao hi assoviagie, e con- firma © que se disse ne seegiho 5.3. CORRELACAQ SIMPLES RECTILINEA 98 Se r=1, um coeficiente de regressio é igual ao iaverso do outro, as duns linhas coincidem © a associagho & perfoita, Se o Coeficiente de correlagio estiver compreendido ontre 0 0 1, quanto maior ele for em valor absolute, maiur & a associngko entre os fendmenas em estado, @ menor 9 fngula quo as dans linhas de regre: formmm entre si, Se r 6 positive, anibas as linhes sobem da esquerda para a direita; se 7 6 negativo, ambas deseo da esquerda para a direita, 5.11-As equacées de regressio. Dados néo classificedos, Primeiro processa de célculo. Utitizemos ainda o exemple que nos serviu, nas seeedes St a 5.7, para ealcular o coeficiente de correlagio de dados nio classifieados. Para ealeular as eguagtes de regressio, procede-se come secus : 1) O quadro n.° 5.3 farnece elementos gue permitem ealeular : 220.000 = VSRLIB / 150. RG RRP DAF Ve ae) 1.800,1, © mesmo quadro tanbém fornees r= 0,983. 2) Na seegin 5.4 nio foram utilizados desvios, Ey vez disso, usaranise todos os yalores fornevidos. Entio, as equactes de regress serao da forma acima cituda: an? r(x X); X~ Kar Ey M MANUAL DE ESTATISTICA Substituindo valores nestas equagtes, encontramos + 499, ¥— 470 0,083 © a LBOU,L ag 1B 0,988 a (X— 2.193) (Y— 470) ou ¥ = 470 = 0,053 >< 0,264 67 — 2.198) Xi 2.103 = 0,088 8,788 (¥— 470) Y- 470 0,460 X —~ 570 X~ 2.1903 = 3,722 9 1.749 e fiaalmente ¥=0260.0— 100 Xe on ainds, Estus sti as equagdos das rectas de regressio. O grafico 2. 5.3 apreseata as linhas de regressiio referentes a estos dados. GRAFICO He 5-8 LUSHAE BE RCGRESSEO, HADI 20 PUABRE NP S-9. (rata-200) ie = & = 8 vues fur tegecaenan Gans aC anessiO ath een ene tne oed Fou tate (ane WHE FeRAM ue Ba as ante CORRELAGAD SIMPLES RECTILE Ea 95. A construgio deste grifieo é ficil visto tratar-se de linkas rectas € para a constragiio de uma linla recta bastarem dois pontos. Entio, se na eguagio Y=0,260.%— 100 fizermos X= 1.000 @ X= 8.000, obtemos resp amenta: F< 160 @ F¥=1.980, Margnemos 20 plano os pontos (iudicadas na gvitieo), (1.0005 160) © (8.000; 1.980), Dnamos ostes pontns por wit segments de recta ¢ prolonguemo-lo. Temos a reets de regres- sio dos F¥ sobre os XX. Por outro lado, se na equagho X--8,722Y 4444 fizermos e} 0 obtemes, respectivaments, | Marquemos no plano os pontos (indicados também, no grifico), (444; Oe Ki0}. Caamos estes pontos por um segmento de recta ¢ prolonguemo-lo. Temos a linka de regressiio dos YY sobre os YY, As duas linhas eruzam-se no ponto (2.193; 47 cujas eoordenadas stio as médias das valores das duas raridveis. 5.12-As equacdes de regressio. Dados néo classifica- dos. Segundo processa de calculo. Cousideremos ainda o mesmo exeaiply, mas © coeficiente de correlagke ealenlado eon © auxilio de desvios como foi exemplificady na seecio 5.5. () quadro n." 5.4 fornece todos os elementos dus equaghes de regressio, que neste caso tomam a forma: Efectuando as substituigées necessérias, obtemes : 499,6 y= 0,990 2288 1.894, y= 0,980 20,2604 «: y= 250.2; Nestas eqaagtes, ye a reprosentam desvins e no as unidades & que as varidveis estio referidas. Para assim as exprimirmos, temos que calcular a média aritmética de cada expressies = 1.160 — 690 = 470 98 MANUAL DE ESTATISTICA valores iguais aos utilizados na secgin antovior para médias. “Agora jf possufmos todos os elementos necessiries para o cileulo dus equagdes: y-3 iy—X); Substituindo as letras pelos valores que elas representam, teremos : 4919.65 1,894,8 1,894,9 he Y= 470 = 0,980 (X ~ 2.103); X— 2.193 = 0,080 (v-4705 ¥ = 470 = 0,259 (N— 2.198); 193 = 8,717 (F — 470); 0,259 X — 98,0; BaLTY 4 446: equagies que sé ligeiramente diferem das encontradas aa seccio anterior. Na construgia grifica das linkns de regressia, seguese o processo eitado na secgio anterior e ao qual nada fii.a acreseentar. A primeira duyuolus equagies de regressio diz-nos que wma varlagio de wa alano aprovade, seri acompanhiada, em média, pe acho de 0.20 reqnerentes ao exame da admisstio. A segunda diz-nos que uma variugio de um requerente a0 exane de admissio 6 aevmpaphada, em média, por wma eorres- pontlente variagio de 3,717 aprovados na 4. classe. ama va Isto que aqui i a dite quanto & 2.2 equagiio 6 puramente tedviee © vem a propdsite para acentuarmos que a correlagio nko pretenle medi relacdes de causa ¢ eleito, eausais ou de causaliilade, mas s mplosments covariagio, CORRELAGAO SIMPLES RECTILINEA oT 5.13-As equacdes de regressia, Dados classificados. Para o cdleulo das equagies de rogressio neste casu, procede-se como segue, utilizando o mesmo exemplo da sce: 3) Calewlam-se as verdadeiras médias arity se faz: % XX cas para a que Gta: Fa T Lb Op onde: PS oe Xe Freprosentam verdadeiras tuddias aritmétions das varid- veis Xe F, respoctivamente ; ; as médias arbitrariamente escolthidas das mesmas variaveis, no nosso cuss, respectivawente, 167,5 ¢ 54,5; €, & G,, 08 valores culculados no guadro n.° 5.7, expresses em intervalos de classe, respeetiramente, 0,320 ¢ 0,50; % @ #,, respectivamente, os intervalos das classes das distri- Duigdes das frequéucias das duas variivels, om ambas, de tres unidades. 2) Calculam-se 5, ¢ 6, expresses, nio vm intervalus de clesse como os do quadro n.? 5.7, mas nas unidades das respectivas variaveis, para o que s¢ multiplica cada wn dagueles polo res- pectivo intervalo de classe: Ge Opie; Oy = ay rcdy. No caso presente seré: oy = 2,080 > 3 6,105 2 < 4,D + 134, = 165,75 © que quer dizer que os estudantes com 54,5 kg. de peso, apresentam uma altura média de 163,75 em. Note-se que se diz altura média. Este niimero nfo pode ser exacte por, no 100 MANUAL DE ESTATISTICA quadro n.° 5.7, a8 frequincias nao se disporem tedas numa Ynba, @ em vex disso, aprosentarem uma certa dispersiio no plano. Esta dispersio pode eyuiparar-se & dispersio de uma série cde valores em relugio & sua media aritmética, Na altura propria, vinios gue a medida gerahnente empregada para mcdir a dispersio em relagio & méllia aritmétion ern o des- vio padric, @ definimo-lo como 2 ruiz quadrada da inddia ari- hastiea dos quadrades dos desvios tomados em relagio a média aritmética, No caso presente, existe também uma medida, a quo se di o name ie erro padrfio de regressiio, ¢ quo se define, de forma idention xo desvio padrio, como a raiz quadrada da média ari- ica dos quadrados dos dosvios. dus valores reais tomados em relagio aos valores caleulados por meio da equagio de derando a eqnacio Y=aX-+4, chamanda ¥ acs valores reais © ¥, aos calewlados por esta eqnagio, a expressiia do erro padrio de regressie 6: (3) O77 Vor Voy Como adiante se acentuard, 0 métode da correlagio simples reetilinea s6 6 vatide quando aplicado a distribuigdes normais (sinelivices) ou moderadamente assimétricas. Neste caso, a inter- pretagha dos resultados obtides pelo erro padriio, é exactamente a mesitia que a dos ebtidos pelo desvio padrlio, isto d: 68,27", dos valores estiio ineluidos no intervalo ¥,+S); 95,45"), dos lores estio ineluidos wo intervalo ¥.+2.8,; 99,73", dos valores esti incluidos no intervalo ¥,+3 8. © valor de S, pode ainda ser eateulado a partiv da expressio: do grande simplicidade, desde que se tenha chegado ao edleulo dag eguacses de regressio mediante cdleulo prévio de a, e 7. Para mais, hé tabuas que apresentam, j4 caleulados, os valores de VIF para sneessives valores de r. Evidontomente que, no caso de se considerar a linha de regros- CORRELAGAO SIMPLES RECTILINEA 101 sto dos XX sobre os FY, as exprossdes que div o valor do S, serio: “y f oi 5.15-Calculo do erro padréo de regressio, Na pritica, a formula acim indicada, por muito ‘aboriasa, nie se enprega. Simente a titalo de exewplificugia 0 quadro n.2 5.8 mostra, aplicnda aes dados do quadre n.° 5.1, 0 seu uso que apresenta a seguinte marcha, com vista sbmente & equacio de regressio dos ¥¥ sobre os XX: 1) Golamam-se os valores de X ede ¥, que se somam, obtendo-se S(X) e S[F). 2) Caleulam-se as médias aritmeticus Ne ¥ das séries dadas. 3) Livha a linha, caloulam-se os quadrados dos valores de X e dos do ¥, 0 08 prodatos 2 s colunas de valores assim calealados e obttmss S(X*), S¢¥*) @ S(XY). 4} Para o caleulo da equagio de regressio dos YY sobre os XX, necessitamos do eoefleients de repressio b,, 0 qual, adoptundo 0 métode estudado na s .3 para © coeficiente do correlagiv, 6 dado por: © eneficiente de regressiio 2,, necossirio para a cdleulo da equagio de regressio dos YX sobre os YY, teria a forma se fosse adoptade 0 mesmo método de eéleulo. Ora, como vimos na secgfio 5.8, SH )=8(P)— gue, no caso presente, dé: S(g) =780.204— 180,1 >< 4.822 = LBELS; Sry) S(XT)—F s(x) 102 MANUAL DE BSTATISTICA Quadro n° 5.8 Céiculo do erro pedro de regresséo do indice ponderado (Y) sobre o indice de preos de retatho (X} xe r AY LY, (ary = 7 ST Ie = 22.801 a 25.068] 172) 6 236 23.104 25.232) 173) 7 49 25.408 ee7o4) ita] 6 36 22.801) : 25.908, 172; 4 6 28.104 (600) 178) +2 4 23.104 173, 0 0 22.104) 17s} 1 1 23.105 a5] 0 24.530) ay =2 4 18) ~3 8 473) 1 i x | 1m) 0 ° 34.095) 181) 4 16 3.06 | 18 4 168 B4.9¢9 183} 44 16 3h.8M4 183) +5 25 34.989, 186] +1 1 34.969 186} +1 1 38.858 1840 ° 33.854) 1H 0 ° 33.856) | 185) —1 1 30.4 189) 1 1 a) 38.809) 190) 47 49 82041) 38.309) 195) +2 4 XH— |S a2 WEP) = 62.2901 — 780.204 = 286 29 3,860 Sty) _. $822 = 180,1 “yp = 1008; Y-AE FSS ome - YoV oy (288 _ yan giee = e345 CORRELAGAO SIMPLES BECTILINEA 108 que, no caso presente, di: 8 (ay) = 696.700 — 180,1 ><3.960~1514,9. Substituindo estes valores na expressio de 6, acima, tem-se: 1.5140 = 0,836. isis 5) A equagio da recta de regressio dos FY sobre os AX referida & origem dos eixos 6, come ji sabemos: y-¥=a(x—X) ¢, substituindo valores: ¥—180,1 ~ 0,836 (X— 160,8) donde, finalmente: ¥=0,886N4-45,7. 6) Sabstituindo nesta equaciio X pelo primeize valor da série respectiva, obtém-se: Ye 0,886 > 25 ¥i=172. 45,7 Procsdendo identicamente para os restantes valores da série, obtém-se os inscritos na coluna 6 do quadro n.° 5.8. 7) Linha a linha, fazem-se as diferencas entre as colunas 2 ¢ 6 obtendo-se os valores inseritos na coluna 7 da mesmo quadre ne 58 8) Elevam-se os valores assim obtidos so quadrade ¢ somam-se. Obtem-se S(O F4. 9) Substitui-se este valor na formula Say/ = do erro padriio de regressio 6 obtém-se o sou valor: +3,45, 10) © grafico n° 5,5 auxilia a interprotar o significado dos erros padroes de regressio. Nole ostio mareados os pontos referentes nos pares da valores do quadro n.° 5.1, Esti também desenbada, a traco mais cheio, a linha de regressio dos YY 108 MANUAL DE ESTATISTIOA sobre os XY, cujo erro padriio se yiu acima ser de S,—+38,45. Para cada iado da linha de regressio e paralelamente a ela, desenuaram-se trés linhas as disténcias de, respectivamente: by = 2S,-246,00; +38, —410,99. pasion ne 5-5 Lina BE RECEESSHe Bs inter sowaetane (1) stene (hates ‘DE FREERS Bz LETALHO(K), 20M DISPOSE 200 inpige ponpeRase ise ae ae Ase be a0 instce pe PRECeS DE UETALUG Segando o que se disse na seegdo 5.14, dentro do espago compreendido entre as duas linhas mareadas 1, devem estar sitnades 68,27 por conto da totalidade dos pontos, isto 6: BRIT B4 “Fay iSt+ Dentro do ospago eomproendida entre as CORRELAGIO SIMPLES RECTILINEA 105 dnas linhas marcadas 2 devem fiear sitmados 95,45 por eente , 95452024 da totalidade dos pontos, isto é, 22,9. Finalmente, 100 dentra 2o espaco eompreendido entre as duas lintas mareadus 3 devem ficar situados 99,73 por centu da tetalidade dos pontos, isto 6: Q8O7B>c2t-- 24.04. A observagio do grafico mostra que, na realidade, dentro dos espagos mencionaidos existem, respectivamente: 15, cerca de 23 @ 24 pontos, o gue nic se afasta muite dos valeres teéricos, donde se conclui que distribuigfo n&o se afasta muita da nor- malidade. 5.16-Resumo do capitulo e limitagdes ao uso do coefi- ciente de correlagdo rectilinea. Dadas duas séries de valores, para proceder ao estude da correlagho existente entre elas, o primeiro passo a dur consiste em desenbar um diageamua de dis- perso ou em construir uma tibua de correlagio, ewnforme os dados nie sio ou sie em grande mimero. Quer o diagrara, quer a talua decidiria do tipo de correlagde de quo se trata. Se os poutos do diagrania ou as frequéncias (nunen esqnecendo: que as frequéncias stio simplesmento os pesos dos valores médios das classes em que foram agrupados os valores das varifveis) da thbua se distribuirem marcadamente segando uma linha recta, trata-se de uma correlugo rectilines. Entio, estuda-se a cor- relagio pelos métodos indicados no presente capltale. Se os pontos on as frequéneias se distribuirem marcadamente seguade ums linba curva trata-se de uma correlagio curvilinea. Neste caso, estida-se a correlagis polo método indieade no eapitule seguinte. Se os pontos ou as froqaéneias so apresentam disper sos no plano e niio dispostos segunda qualquer linba, nao so pode, por simples inspecgio do diagrama on da tibua, dizer qual © tipo de correlagia de que se trata. Neste caso, procede-se ao estado da correlagio reetilinea e ne da correlacho eurvilinea 6 determina-so em segnida o afastsmento que os valores das variiveis apresentam da rectilinearidade. Nas seegtes 5.3 @ seguintes, fizemos o estado da correlagiio rectilinea pele métode do momento-produto, Hm priueiro lagar, 108 MANUAL DE ESTATISTICA SI) onde: yy roprosonta a médin ponderada de cada coluna; mm, representa a media ponderada de cada lina; M, representa a wédia ponderaila de todos os valores do quadro, o ¢ igual, portanto, a aM, Say Tepresenta o desvio padrio da média ponderada dos valores das colunas do quadro ; Sex represents o desvio padrio da média ponderada dos valo~ res das Hinhes; @ o8 restantes stmbolas rapresentam valores ja conbecidos. Portanto, os coeficientes de correlacio curvilines sio ignais 4 relagio do desvio padrio da média ponderads das filas (colu- nus no primeira case © linhes no segundo) de valores de uma variével, para o desvio padrio de todos os valores da mesina varidvel. Este cooficionte fornece indicagtes tteis shmente no easo de © niimero de observacdes ser suficiontemente grande para que 86 possa formar uma tibua de correlagio. No cxso de o nimero ae valores sor pequeno, este método é inaplicavel, ou, se apli- caio, as conelusées tirndas a partir dele nfo merecem confianga. 6.3-Céiculo do coeficiente de correlagio curvilinea. Para ilustrar a forma de cileulo, usaremos os dados referentes a pesos © alturas de 384 rapazes nfo desportistas da Mocidade Portuguesa, j4 utilizades no eupltulo anterior. Procede-se como segne: 1) © primeira passo a dar consiste na elaboragio de um quadro de corretacia idéntico ao quadro n.° 5.7 onde as linhas 6 as calunas sejam at mesmas, mas onde nio existam, por des necessiirixs, nas diferentes quadriculas do qnadro, as valores {fxg} que, somados, dio, no quedo n.! 5.7, S(f.e.g). Por- tanto, a ttnica diferenga estt em qua nas quadricnlas 86 figaram os mimeros respeitantes As frequéncias, improsses no quadro n° 5.7 8 tipo mate earregado. OUTROS TIPOS GE CORRELAGAQ SIMPL. 109 2) Caleulemos yay em primoiro Inger, Entio + a) Caleula-se Cy como esti indicado no quadro n° 8.7, se escolbida para origem as Asegnir calcula-s If, Como a el arbitraria da variivel X foi a de 1 ponte médio, vem: AG = Me Cpt 2) Caletla-se o desvia padrio expresso om intervalos de classe ( 8 = 6,108. Quadro n.? 6.1 Céleulo das médias ponderadas dos valores de X existentes nas trés primeiras linhas do quedro n.” 5.7 eT Poot medi | i | Prequtactas |” dacatons } Valores do ena) PORE : _ 468 | 138 te | 1 i aK = TS | So 2 . (SS : t | teas * 1) Ts 71 | | = | 16 = 10 MANUAL DE ESTATISTICA ©} Colanam-se os valores tipos de eada linha do quadra n.° 5.7. Como valores tipos tomam-se os potitos médios de cada classo da variével ¥. Quadro n° 6.2 Céleulo de a, ALY 1.026,75 108.26, 1.828,00 489,04 456,30 80,28 Bui 22021 | | Sr “hey = lies = d} Culculam-so ae médias pondersdas m, dos valores da varigvel X existentes em cada linha. Colunam-se essas médias. No quadro n° 6.1 exemplifies-se 0 edleulo das médias corres- pondentos as tres primeiras linkas, ¢) Evectuam-se as ditevengas m,—M., entre a média dos valores de A oxistontes em eada linka e a média geral dos X. Colunam-se essas diferoncas. GUTROS TIPOS DE CORRELAGAO SIMPLES am f) Blevam-so 20 quadrado as diferengas obtidas na alinoa anterior. Colanamese estes quadrados. g) Registam-se as somas das freqnéncias dos valores de X existentes em cada linha, quer dizer, oa valores f inscritos em coluna no quadro a. 5.7. Semam-se estas frequéncias, obtendo-se SUPJ=N. A) Bfretaam-se, linha a linha, os produtos destas frequencias pelos quadrados obtidor na alinea f)- Colunam-se ¢ somam-se, obtendo-se S( fom, MY} « #) Calenla-se: One ve Fe 5 j) Catenla-se: hey 3) Para o ciloulo de vy, seguo-se caminho idéntico: 4) Caleula-se C, como esti indieado po quadro mJ Depois calcnla-se M, fazendo : o pa JM, == M+ Gy hate ts iq ne Pre) ‘A expressfia goral dos cocficientes de correlugia parcial seemndirios, é: Tonk Cada um destes caeficiontes, It-se r, um, dois, porto, tres, quatro, ete. Os indices destos coeficientas apresentam dois grupos de algarismos separados por um ponto. A esqnerda do ponto estio os indices primdrios, & direita os indices aecundd- CORRELACAO PARCIAL, CORRELAGAO MELTIPLA 121 rios. Como se trata de uma correlagiio rectilinea, cada um destes cooficientes expressa o grat do associacio rectilinen entre ag duns varidveis (a guo se referem os indices primarios), de cada uma das quais foi climinada, pelo método dos menores quadrados, a inflatneia da varlavel ou variiveis a que se referem os indices secundarios. Quedre no 7.1 Calculo dos coeficientes de correlagdo parcial Trés varidveis: alturas, pesos e perimetros toraxicas médios de 409 ginastas de Ginésio Clube Portugués Origem: Fichas biométricas respectivas. Coofieloutes a to prinécios : ero yates . : secerates Taaices | valores vwaeedor aor | aor | Vinee | mi | 33 | 03060 | 0.952.032 | 6.416.036 | 0.110.056 22 | OAsS1 | 0.872.788 | 6.260.834 0.227.206 23 | 08528 ae #00 | 0.149.859 | 0,703.041 Coafielences da corelagho socualiclus momdor gee | aL 0,497.868 | 08585 | 0889-723 6,456.37 | oan | oow.srs 0.830.922 | ose: oe As tabuas de Miner fornecem os valores de (i—r'y° consti- tuindo, por isso, um precioso anxiliar, Se as pudermes utilizar dispomos o céleulo como mostra o qaadro n.° 7.1. Na segunda coluna deste quadro estio inseritos os valores relativos nos coeficientes cujos indices so inserevem na primeira coluna. Estes valores foram caleulados como acima em 1) se diz. 12 MANUAL DE ESTATISTICA Na coluna 8 estio inseritos os valores que a tibua de Miner fornece para (1—r*)"", dado o valor de vr. Ne coluna 4 estio jnscritos os valores dos produtos dos conficientes primarios, dois a dois, Para o caso de mgs 08 casticientes primérias a multi- plicar sio, como mostra a respectiva forraula acima, 713 @ reas ‘A coluns D obtém-se fazendo a diferenga indicada no nome- rador do coeficiente secundirio respectivo. Ainda no caso de rao resultado mostra re—rigrs. A coluna 6 mostra o resul- tado do produto, dois a dois, dos valores indieados na férmula do coeficiente secundério respective © inseritos na colana 8. A coluaa & mostra os valores dos coeficientes secundizios cajos indices se indieam na coluna 7. Estes valores ebtem-se, dividieds, Jinha a linha, os valores da coluna 3 pelos da eoluna 1. Se rio se pnderem utilizar as citadas tabuas de Miner, para evitar grandes multiplieagies e divistes (mais dificeis ainda se niko se dispazer de maquinas de calexlar), utilizam-se logaritmos. Na pritica, o quadre a orgunizar 6 quase igual aon." 7-1, Sé difore na coluna 3 onde, em vez dos valores de (i—r°)'? se inscre- yem os de log. (Lr). Este qaadro confirma o que se disse na secgio 7.1, Com efeito, os valores dos caeficientes totais: m2 @ ms @ dos eoefi- clentes parciais rie. © Tus. Rho sig muito diferentes, o que prova que a influéncia da variavel Xs subre a correlagio entre as variiveis X; e Xy @ a influéngia da variével X, sobre a corre- lagho eutre as vartivwis Xue Ny, ndo sio apreciaveis. Pele con- trazio, og cueficientes 1 ¢ ris.» apresentam valores sensivelmente diferentes, de onde se conelui que a varlavel Xz exerce uma influéneia tio grande sobre a correlagio entre as varidveis X 0 Xs que abriga 0 respective coeficiente de correlagiio até a mudar de inal. Pode, no entanto, acoatecer que haja ainda inflaéneias de oatras Variiveis a climinar ¢ que tal eliminagio fuga surgir valo- res que tornem proviséria a andlise anterior. Como este pro- blema 6 levado mais longe na seegko seguinte com a introdugio do mma quarta variavel, 14 se fara entio uma andlise definitiva dos resultados, CORRELAGAG PARCIAL, CORRELAGAO MULTIPLA 128 4) Para caleular as eyuacdes de regrossio, procisamos em primeiro lugar, dos valores dos desvios padries de ordem supe- rior. Estes valores obtém-se por mato das formulas: 4,9 = 91 (1— rhe)!" (8 ~ rip, 2)? = oy (L— rig)! (1 — te a" 6g (1— rhe)! (1 rh)! = a (Lr)? CL ria. = 04 (Lf) (L— ys = 9a (1 — 7 hs a) Bea 53.1 A expressio geral destes desvios padrées 6: 1.28.00 = Se (L— ray (Ll rhs. bras) (Lines ge Para cada desvio padriio sic acina indieadas duas formulas. Desta forma, podem vonterir-so gor meio de uma deias os resul- tados abtides com a eutra. Substiminde nas expresstes acima indicadas para os desvies padrdes, as letras pelos valores rospectivos atras indieados na alinea 1} @ ao quadro n° 7.1, obtém-se: 788 x 0,970.47 o. BA x 08" 31.95 O82 3< 0,889,723 = 6,444 >< 0,952 9,188 »< G,872 sof’ 5) Os cooficientes de regressiio parcial necessirios, em niimero: de seis, sio obtidos por meio das formulas seguintes : S129 a.m doe = 71 ; =r; ees} tae Teas oa. Sats bas == tas Oa = Mae F312 That A expressiio geral destes cveficientes 6: 1 MANUAL DE ESTATISTICA Substitaindo nas expresses acima os simbolos pelos sens valores anteriormente obtides, tem-se: 5 Abs bios = 0,465 >< = 0,5830; far OR = uy = 0.8461 x 6) JA podemos, pois, escrever as equacdes de regressiio, de formulas: ay = dyy.5 2b is,2s 5 bets ae bes..35 Day yay + Dag. ta - A expressiio geral destas equagdes 4 = Dyes nity $b Bisa Be an. ‘Os indices destes coeficientes 5 tom as mesma designagdes dos dos coeficientes de correlagiio parcial. Em cada} o primeiro indive ‘prieuirio rofere-so & varidvel dependenta @ o segundo A variivel de que } 4 cooficiento, Pos isso, a ordem dos ‘fadices primarios niio indiferente, comu acontece com a dos indices seeundarios que silo colocados por ordem numérica Vestas equagdes, os az representam desvios ¢ nio se referem As unidades om yue as séries fornecidas ostio expressas, Substituinds nas expresses das equaghes de regressio, os coeficientes de regressio polos seus valores obtidos em 5), femese: ay == 0,583 ay — 0,426 2053 ty = O,858 ay + 11 Lays wy = — 0,137 a + 0,612 ae. CORRELACAG PARCIAL., CORRELACGAO MULTIPLA 195 7) Be quisermos as equages de rogrossiio referidas As uni. dudes das séries, ealeuiamos, por meio das formulas seguintes, os termos indepondentes de cada equagio: A126 = iy — bs Mi — bisa de dosa = Ah, — bas dM, — baa My saz My — bs. MG — bass Me 4 expressio geral destes termos independentes 6: y= Mi — by 94 ne ~ bin. 24 on Ms — a Pini.) Ma Substituindo nas expresstes acima, os simbolos pelos seus valores indieades nas almeas 1) @ 5), obtém-se: 4,95 = 159,5 — 0,083 >< 64,5 — (— 0,426 86,7) = 168,850 G2a3 = O45 — 0,858 >< 100,5 — 1,171 x 86 — 87,707 iy,1y = 88,7 — (— 0,137 >< 16,5) ~- 0,612 >< 64,5 = 70,448 8) Entrando com estes valores nas equagdes de regressio Indicadas ne alines #), estas assumem a forma: Xi ars + bs Vet bisa Xy odessa $ ba, ate + bse M1 + bye Ma om que as ineégnitas j4 esto roferidas dis mesmas unidades das sérips de valores fornceidos. A expresso geral destas equngdes de rogressiio ¢ da forma: Ai ai93..u Biz.9t.n Net bas.as. ob btn. 28, tot) Xa Extas equagsos descrovem as relagies entro a variivel depen- dente (a simada & esquerda do sinal de ignal) @ a soma ponde- rada das yariaveis independentes situadas 4 direita do sinal de igualdade. Os posos siio os coeficientes de rograssio parcial, caleutados pelo método dos menores quadrados de forma tal que a soma dos quadradas das diferongas entre 9s valores reais ¢ 08 valores dados pela equagio para cada variavel dependente, soja um minimo. 120, MANUAL DE ESTATISTICA As equagies de regressiio dip-nos a variagho trazida para a varlivel dopendente por uma varingio do uma unidade em cada ama das veriiveis Independentes. Tntreduzinds nas expressdes nameéricas das equagtes de rosrassiio obtidas em 6), 08 valores des termos independentes dadas por 7}, obtim-se as expressbes numéricas das equagdes de regressio referidas As mosmas unidades das séries = X= 108,680 + 0,583 Ny — 0,426.%5 — 97,107 + 0,358 N, + 1 1TL Ay 70,448 — 0,137 X, + 0,612 Xp {) Caleulain-so os coeficientes do correlagio swiltipla A. Este coeficiente serve para medir a associagdo existente entre uma variével (Jependente) e 0 conjunto das restantes (inde- pondentes}. ia tantas coeficiontes do eorrelagin miltipla quantes as vari- cis ¢ as oypactes de rogressio. Os sens valores podem ser calonlados 9 partir dos eoeficientes de correlacko pareial @ por mein das expressies: 1 Rien = (2 — ri) — rise) 1— Rios = (1 — eh} ~ ths) 1 Riu) — (1 — Fa. — rh) ‘A expressiin geral do coeficiente de correlagio miltipla é da forma: 1 Reason, = rh tetas) 0 teas cen) valor de # flutua entre Go 1 e 6 numéricamente igual ou superior a cada um dos cveficientes de correlacio (total ow par- cial) que entra no sen céleule. R nfo tem sinal visto qae a associagiy pode ser positiva com umes varlivels independentes © negative com outras. H==1 signifiea que a varidvel depen- dente 6, de fucto, uma iungio rectitinea das vuriaveis indepen- dentes. Qaunte menor for ovalor de # mais fraca é aassociagio que existe entre « varidvel dependento © as variéveis indepen- dentes. CORRELAQAO PARCIAL. CORRELACAG MCLYIPLA 191 Utilizande as tibuss de Miner ou as de Paarson que forne- com, para cada valor der, 0 de (Lr), obtearse: O,761.758 >< 0,941,893 = 0,717 441 O,761 TSS >< O,284,115 ~ 0.216.427 0,008,364 ~ OY 0.282.530 on Pe Bigg =Q188.5T3 ow Rasy Rigg = O,72488 ou Baga = O.262 Tendo presente 0 que acim se diz, conelui-se (1) que a assacingin niais elevada 6 a que existe entre X) eumo variivel dependents © X; Xs como varidveis independentes; o (47) que a tente entre Xy cotso varlivel dependente ¢ Vy e Xz como variiveis independentes, sogue de perto a associagia anterior, Contude, tal como se diz acima (paz. 122}, esta andlise aio se deve considerar definitiva stendenda a quo na secgiia seninte se introduz nova variivel. 7.3-Resoluc3o de um problema de correlacéo @ quatro variéveis. Consideremos agora, além das t's variavels: altura 9) = 0,582 0,889 CX), peso (%}, perimetro toréxieo médio (¥) que eutraram no problema anterior, muis uma quarta: eapacidude vital (Y,), dos mestnas 400 ginastas do Gindsio Clube Portugues. Suponhamos que queremos caleular a correlucso existente entre enda par dostus varidvels, depois de eliminaila (ow tornada constanto} a influéacia das duas restantes. A marcha a seguir é: 1) Considerando de cada vez duas varidveis, estuda-se a eorre- lagao simples, total ou primaria, existente entre elas, nin fazendo vaso da influGneia das variiveis restamtes, No cuso presente alculam-se seis ecoficientes de correlacao simples ou primiirios : Te, Tia, Mus Ti, ME Tu, Para G que se utilizam os raétodos estudados no capitulo 5. Nio se publicam os quadros que serviram para o céleulo daqueles coeficientes de eorrolagio, por tais quadros serem em tado semelhantes 20 quadro a.° 5.7. Obtiveram-se og seguintes resultados : r= 0,48815 7, rig=0,8524; ry 08,3060; ng = 0.5034: 04879; m= 0,3844. 128 MANUAL DE ESTATISTICA 2) Subsidiariamente, os vélenlos dos eoeficiantes do correlagio pronarios fornerea-nos os valores das médias aritméticns © dos flewvios padraes das quatro séries de valores : 248 em <3 My, -=109,5em; ¢ My = G45 ke: My=8hJem; a =2,0%emxS Uy = 38,00; ay = 1688dlxc4 == 6,676 dl. 3) Caleulam-se os coeficientes de correlagio pareisl socun- Garios, om mimeo de doze @ partir das formulas: (dria) (ri) far . oa Pog Pease . Sn (1—rigy* 759)" Tum Testes Tsetse mee yy “Arey ay? Para obter estes coeficientes, 6 de grande ventagem dispor © eflowlo da fornia apresentada no guadre a.* 7.2, onde os valores de Vir foram tirados das thbuas de Miner. Os valo- res dos cocficientes eujos indices sto indieados na coluoa 7 Sio rogistades na coluna 8. A expliengio deste quadro 6 a mesma que demos do quadro n° 7.1, Os valores inseritos na colina 9 destiuam-so a ser utilizados mais tarde. ‘A gnalisg desta cuadre revela alguns factos de interesse. Por exemplo, eomparande os valores de rs: (0,3060) com os de riao2{—O,2412) © de ris.43(0,1048) constata-se que a inflnéneia Ga variavel Xz sobre a correlagie entro as variaveis X, e Xs & Quadro n2 7.2 Céleulo dos coeficientes de correlac8o parcial secundarios. Quatro voridveis: alturas, pesos, perimetros toréxicos médios e capecidades vitais de 400 ginastas do Gindsio Clube Portugués 0,110,008 o70RONT 0,875.128 O97 ASS o2n0 | 0.1018 | OF OA48.261 0.228.108 OTT. O57 ASLASO 0,208,800) ig. 30 0581.07, 0.829. DALOINT | OASE7E OOHLTM | 0470001 enn A EN PORE EERE PEEPTS P PUCILTIN OF SVTANNOG “IFION¥d OF SVTELIOD 1 6a) 130 MANUAL DE ESTATISTICA muito mais forts do que a influéneie da variével X,. Com efeito, embora a eliminacio de armbas {uma de cada vez) tivesse feito haixar o valor do cooficiente de correlagio primario, a elimina- gio da inflntneia de Xz provocou uma baixa maior, tho grande gue fez aquele coeficiente de correlacio total mudar de sinal. Se nao se puderem usar tibuas, para se obterem os valores de (1—s")"", 6 melhor usar logaritmos. Neste caso, o quadron.? 7.2 pode ser utilizado com a ligeira modifieagio de YI—7 em log. VI=?*. 4) Caleulam-se 08 cvoficientes de correlagtio parcial toreidrios, em mimero de 6, por meio das formulas : ripgy EST saga = et — Goria? Gries)” ors J rs, 13.2 Ti4.2 P48 M1347 18.4 F284 T1398 oe Q~rhs) rh) rina) Pig.gg 5S (rise) 1a) r, Vea. Tee aa nat = fiom je dA" d Pea — Tn Pas 13.8 78 Pe643 (hm rd.) rhea) Ta Pos Peat Mis 2 Puts (Lr) rhs)? (I~ rise)? ria)? A indieagio de das SSrmulas diferentes para cada coeficiente, permite eonferir por meio de uma delas os valores obtidos com aoutra, Para eomodidade de céleulo, costuma dar-se aos eooft- cientes de correlagio parcial seeundarios, a disposigio cons- tante do quadro n.° 7,3 onde os valores de VT— > foram dados polas tabuas, Se nio se dispusesse de tibuas, era convenionte usar logaritmes. Por serem necessarios mais adiante, foram também tirados os valores da ultima coluna. 5) Facamos no quadro n.° 7.4 a comparagio entre os valores dos coeficientes de correlagio totais ou primérios com os dos (1 vias) Tan, = seer eee en A PA YIN SPEER SE BG UT Quedro n° 7.3 CBlculo dos coe} de correlagao parcial tereiérios. Quatro variaveis: as do quadro n.° 7.2 Coaictentes da corrleqto secundAvicn ‘Cooientn do corrolagio torsision correagto ncn ag prota eng ennes Se svelte fost 3 indieos | Valores rameter | NmMeCr | aitvadon [indices | Valnres 7 ar) ar ter | veer ir T ¥ z 7 124 | OBL 434 | 0,1088 284 | OsMs 0.128.633 0,011 468, 0.055.858 889.723 0,086.876 40.80 | 005.716 18.498 19 0,999,687 0,907.38 0.868.119 3 g g ‘eB $ * 5 8 & = § & = = 2 2 S$ a S 3 5 3 g 0,986.204 Ter 132 MANUAL DE ESTATISTICA coeficientes de correlagio parcial tercidrios. Estes ultimos derivam dos primarios pela eliminagio da influéncia das duas vuridveis restantes, Quer dizer, por esemplo, que o coeficiente terciétio entre altura e perimetra toraxico médio esti liberto dus influéneias do peso ¢ da capacidade vital. ‘A andlise dos valores dados por esto quadro revela pontos de interesse. Assin a) Todos os evefieientes de eorrelagio tercidrios so apresen- tam mais baixos (chegando alguns a mudar de sinal) do que os Quadro n? 7.4 Comparacéo dos coeficientes de corretacéo primérios com os terciérios, fcooftsioutes do eurrolagao Vuriévets _ eatin | sersiivion Minra © peso (Ye %4) 2.) 0488 | 0807 Altors ¢ perimetro terdsieo médie (X, eX). . «| aaee | —og8a Altura v capacidade vital (XyeX) 0... 2.) G53 | O05 Peso © porimetre torixivo médio (Ny %4). - . .| O85 | 0838 Peso e capacidade vital (XN, 6 X,) . 0.438 | 0.025 Pevimetvo tordsivo medio veapacidade vital (X,¢ X,)| ogst | 0,tes respectivos cosficientes primarios, prova de que os valores ddostes eram, em parte, devidos a influéneias estranhas aos dois fendmenos a que eada um deles respeita. 4) Sao falsos os valores positives dos cooficientes de corre- Jago primfrios entre as variiveis X, ¢ X; ¢ as variiveis ye Xi, pois eliminands, para o priweiro par, as influéncias das varid- veis Xy © My, e para o segundo par, as influéneias das varidveis Xo Xj, obtem-se evofleientes de eorrelagho tereidrios negativos. Estes resultados parecem lgicas. Com efeito, nota-se que sin as variéveis X, 6 4; que encobrem o verdadeiro valor da. correlagie entre as variiveis Xz @ X, ¢, como seria de esperar, viee-versa. Levemos mais longe, com o auxitio dos coeficientes de eet one a is ee ee are CORRELACAO PARCIAL, CORRELAGAO MCLTIPLA 188 correlagio secundirios a andlise das relagbes entre as varié- vois My e Xa: raz —O2412 @ reg = OTS Comparando 03 valores destes conficiontes vom o de coefiviente primério (0,800) vase que a eliminagio de cade una das varié- yeis por sua ver, faz deseor o valor do coeficiente primario, dovdg se conelui que quer X. gue: Xy contribmem para 2 obtengio de um covficiente primirio com aquele valor. Ve-se mais que a descida provoecada pela eliminagto da variavel Xy é maior de que 0 provocada pala ofiminugio da variivel Xy, donde se conclui que a vuridvel Y_ coutribui mais fortemeote do que a X, para o aparecknento de um coeficiente primdrio coin aquele valor. ce) F peguena a influgneia das variiveis Xy e Ny sobre a correlagio oxistente entre as varlaveis X_e My, pois os coofi- clientes: - frente wy = OABB oe Pag, = OAOT nko diferem grandemonte entre si. O mesmo se pode dizer da influénein das varléveis X, e X, sobre a correlache exisiente eotre as varidveis X,e Ay. E ainda, ombora em wenor grau, da influtncia das varitveis X, e X4 sobre a correlagio oxis- tente entre as variéveis Xe Xe. ) Caleulam-se os desvios padrdes ter quatra, por meio das formulas : rat (1 — vie)? ria Lata) = 5, (Lr) ris dl rd) o2(L =r)! ria rhaas)! (tri? Irina) * rey? Lard Leas) (Erk) (fra (rhe yea (Lamha) (dr? hte)” maj (1—ria)*(1— ris)? (hte)! ios, em mimero de Saase Para cada desvio padrio sio indicadas duas formulas, pro- cesso de verificar os resultados obtidus. 138 MANUAL DE ESTATISTICA No caso presente e fazendo a8 substituigtes necessarias, abtém-se = ses] OH XO872.T88>%0,970.475><0,863.119 sae 6,444><0,804,908><0,994.493><0,913 428 of 9,188><0.87 9,1882<0,809.0245<0,568.299><0,918.428 — sss | 6,087 ><0,952,032><0,533.024><0,986,294— 4) 6,087 ><0,023.167><0,068.298>0,997.329-= 8,05 cases { 6,676><0,804.908><0,977 486><0,988,204 5,18 1 6,6762<0,923.167 x0,973.567><0,868.119 =5,18 7} Os cveficiontes de regressio parcial neceswarios, om ndmero do 12, obtém-se a partir das soguintes formulas : Size F334 Bross tsar) Oe = Ta Fak F3Aek Frou | Fee bree = ress 5 Dae = Mead Fa.8 3.596 hb Sah p Fa88 ans == Tie das = "3419 1288 T4123 3.194 3.134 baron = Mase 5 Besa = Pasa Shes Ft b Sah p Cat 4.42 = Teg 5 41.23 = M483 a8 Gis F438 Saas Bors Maas 3 basa = Pu 3.396 S584 Substitnindo nestas equagdes, os simbolos pelos seus valores. atris obtidos, tem-se: Frogs = 0,407 21 0,449; base = — 6,289 427 3 non te71 427 Press = 0,305 FSS a OAD; Pena = 1808555 =1173 42r 427 Baiag = 0,407 4 = 0,369; Boasn —— 0,025 ay =— 0,021 8 CORRELAGAO PARCIAL, CORRELAQAO MELTIPLA 135 3,05 . 3,05 bongs =~ 0,280 22 0,187; beaas = 0838552 = 0, 124 in 7, bean Say 7 0809 3 0,18 easy = 0,165 222 0,007; bas = 0,000 22 6,050 sa STS pies va ee 518 . B18 Breas = —0,085 2 = — 000005 ase 0,168 em 0280 8) J possuimos tudes os elementos para escrever as equaghes de regrosstiot nasi ay + Discests + bra 29 ay bays ty + Bessa ts + bors te ay = Dorse 1 + Posasite + Bosse ats 4 = Basa ts + Barasate + Dags2 ts nas quais as incdgnitas so roferem » desvios. Substituindo naquelas expresstes, os simbolos pelos respec- tives valores atras indicados, tem-se: 0,49 ary —~ 0,745 ary 4 0,459 oy 0,369.2, 4- L173 ars ~ 0,021 a = — O18 ay + O90 + 0,097 ay ag == 0,550 ary — 0,030 ary + 0,280 ay 2) Se quisermos as equagties de regrossiio referidas as uni- dades das sdries originais, caleulamos os termos independentes que uelas devem figurar, por meio das formulas: Ayan = My — bros Me — Bassi Ma~ bass Sf Mz ~ basay My Base Ms ~ bossa Me As59¢= As—byr21 My — bras Me bots Mi My bas 2s Mh — bees Me Basaz Ms Substituindo nestas expressiies, os simbolos pelos seus valores atris calenlados, tem-se : 194 169,5 —0,449><64, «38,9 05 34 64,5-—0,360><169,5— — {+ 0,021 38,9) = —-98,9 19 TAD BG, T) —O,458>< 188 MANUAL DE ESTATISTICA — 0,097 38.0 — 0055 >¢ 168,5 —{—0,030>< 64,5) — 0,2809< <8, wld. 1) As equacdes de regress%io, com es incdgnitas referidas as unitades das séries originais, assumem agora a forma: baa Ne + bases Na + dtien Xe Nao Gras Morse Nib hess Xa + Posas My Ni bye 14 Na 4 baste Xe op Paes Xi bipas Xe + basae Xa Nim @sate tb bsp Nya ay Substituinde uestas expressbes, os stmbolos pelos seus valo- ras obtides, tem-s6 + = 18 7B + 0449 X, — OF ~ O360 4, 2 11% = 75,008 — 0,187 Mp=-7ipids 0,459 X, 4 0,021 Xy 10 Xp 40,007 X, 555 Ny — 0,030 X54. 0, vem as relagbes existentes entre cada ef dependente @ a soma poaderada dos variiveis indepen- deutes situadas & dizeita do sinal de igualdade, e mostram a » inédia produzida em cade variével dependente pela edo unae upidade em cada variivel independente. 11) Caleulam-se os eneticiontes de correlacio multipla & em magro de quatro. Estes coeticientes podem ser obtidos a portic das formulas : BG Xs Estas equacdes descr 1 Riey = (1 oh) = rad — rhe) 1 Bhonay = (1 — rly). — ra) — rhaas) 1 (rh — Paso) 1 Rigen = (= A) — rad (1 — rhea Qari © fernecem « medida da associagio entre cada varidvel dependents © 0 vonjuato das restantes varlaveis (indepondentes). CORRELACRO PARCIAL, CORRELSCAQ MULTIPLA 137 Substituindo nestas expresstes, os paréntesis pelos res dados pelas tibuas de Miner ou de Pearsan, obtem-s is Valoe 1 — Biss = 0,701,758 0,041,893 <0, 74.975 1 — Riasy = 0,751.798%<0,284,115 <0 1 Rbjay = 0,006.804 0,284,115 >< 1 — Byes == 0.048.876 50,955,479 900,97) HBL 4TH, donde : Bijosa = O46 Flqsy = 0,783,708 ow Rarsiy == 0.885 Bag > 0,749,499 on Fiz) = 0.396.892 ou Rages = O00, P24 on Ryo Atendendo ao que acima so disse @ a que Rayn=0,889 6 0 niaior valor apreseutado pelos divs vientes de corre- lagio méltipla, conelni-se quo a assoviagio mais elevada é a que cxiste entre a varidvel dependents XY, © as variivels indepen- dentes X,,X, @ Ny. Conclui-se mais que o valor da assvcia- cio existente entre Xy como variavel depoudentee Ny, Xy 0 Xy como variiveis independentes, segue de porto o valor de &= U,885 achna citado, Estes resultados eonfirmam o que atras ( se disse. 808 ene! CAPITULO 8 NUMEROS- INDICES 8.1-Generalidades. Na sue acepeio mais ample, um ntimeron -indice, ou simplesmente um indice 6 wm utimere que exprime a relagio entre as expresstes quantitativas de um fendmeno. © fenémeno em questio pode ser relacionada em dpocas diferentes ou em lugares diferentes. Daqui, os indices serem empregados em comparagdes no tempo ou no espago, embora as primeiras sejam mais vulgares ¢ menos cheias de riscos. O nso de indices, na maior parte dus casos, representa uma comodidade, pois, frequentemente, o fenémeno a comparar pode ser observado directa embora dificilmente. Par outro Indo, pode acontecer que o fendmena em questio nio possa ser obveryado directamente, mas possa ser relacio- nado quantitativamente com outro directanente observavel. Neste caso, o uso de nimeros-indices representa uma necessidade. Os wimeros-indices abrangem ania enorme multiplicidade de fenomenos. Embora os mais numerosos (e cronolagieamente os primeiros) sejam os de pregos, abandam oa referentes a quantidades produzidas, vendidas ow transportadas, a valores, a fenémenos finaneeires, ete. No edilenlo de wn nimero-indice, qualquer que ele seja, entram Sempre os seguintes elementos: & a expressio yaantitativa do fondmeno em estudo no periode que serve para terme de com- paragiio ¢ a que, por isso, se chama pertado-base, ou simplesmente base; v 2 expression quautitativa do mesmo fonémeno no periedo cajo indice se pretende determinar ; uma poténcia de 16, em geral 106 ou 1.000, destinada a dar forma inteira a nimeros 40 MANUAL DE ‘ATISTICA em geral com 4 de decimals. a sna forma mais simples wm indice apresenta-se come segue : mnais ou, pelo menos, a reduz’ r= 2.100. db Para exemplificar, snponhamos que queromos comparat a popue Jaci de Portugal Continental no ano de 1940 com a de 1890. Quadro n& 8.1 Populasée de Portugel Continental Nimeros shgoiutos — Niimeraseindleas 1890) 4.660.095 100 1940) FAR6 LAS td Essa vomparagio pode ser feita, evidentemente, usando os némoros absolutos, mas estes, pela sua grandeza, diffeultam-na. I;, pois, por comodidade que se reduzem os nimeros absalatos pressiio anterior da, no caso presente > 10 = Bd > 100 = 154 4,060,002 © qae siguifien que a populagio de Portugal Continental em 1940 comparada com a de 1800 aumentara 54 por cento, on, fo qne 6 @ mesmo, representava 154 por conto da de 1890. B.2-Tipos de indices. Conforme 0 eritério sob que o# nimerds indicas sio encarados, assim se distinguem varios tipas de indice 1) Vina primeira classificacio des indices ¢ a gue toma em couta o nitmero 8. natareza dos fenémenos observados, Assim, poder distingnir-se: Ludices simples os que exprimem a variagho Ge um so fendueno; tadices compostos ow séatéticos os que exprimem a variagio de um conjunto de fendmenos da mesma natureza; indices complewos os que exprimom a variagio de um copjunty de fenimenos de natureze diversa. EROS - INDICES 14 Quadro nm.” 8.2 Pregat madios de legumes, no Conlinente, e respectivas produgdes. 9x8 suedion | Praduxtes | Pravos matey | Produ Loguaies oF uuistal | ean quatais parma, | ot at 287.196 ans BOLTS 139.308 W184 | 108,781 3 “haat | Prego aes par uciast | ain atiwens j Prego modios Leegumes for quineal MLAS | ) 84.939 286301 Como exemplo de um indies simple do feijto com base no ano de 1858. acs precos deste produty nos anos de leads odo prego Chamando p,. P, , LO @ 1: Po = 129,8 2.100 = 181.3 12 MANUAL DE ESTATISTICA Como exemplo de um indice composte caleulemos o referonte aa proc dos legames nos auos de 1940 © 1942, com base no de 198, Chamemos ainda p,, p, & p, 208 progos em 1938, 1940 @ 1942, dos Jegnmes. As formulas acima, para cdlento dios fndiees simples, apresentam-se, no caso de indices compostos, sob a forma: Sip) Sip) 7, = P2.100; = Shh). 100 1 5a) Sip) onde S(p,). por exemple, representa a soma dos pregos de todos oa Tegumos, em 1940, No caso presente, aquelas expressies dio: 712876 1219; = LEB. 100 = 188,4 FUT BREE ~ 100 © qnadro n.° 8.2 no forneco elementos que permitam, so por si, o calculo de um indice compleso. Um exemplo tipico destes indiees ¢ 0 indice da actividade econdmica de um pais, no qual, nocessiriamente, tem de ontrar elementos de natureza varia, O Banco de Partugal calenlou em tempos um indice que em seu parecer, canstituln uma tentagiva para o estabelecimento de um indice da actividade econémica portuguesa, Os sous componentes cram: a) Coméreio interno: desconto de letras; B) Exportagio: vinuios comuns, vinhos do Porto, consorvas de sardinha, cortiga; c) Tmportagio: earvio, gasolina, petréleo, outros lees minerals, slgodio, sementes oleaginosas, metais ; & Caniinhos de farre : tonelagem das mereadorias transportadas ; e} Diversos: consumo de energin elécirica nas cidades de Lisboa e Porto, eimento (produeido ¢ importado), pesca, tonelagem de uavios entrados, vidraria. 2} Sob outro ponte de vista, os indieos podem classifiear-se em indices na tempo © indices no espago ou em indices crowa- Liyicas @ indices regionaix. Os primeizos estudam a varingko de um fendmeno ou de wm conjunto de fendmenos, através do tenrpo, com base num certo perlodo. Os segundos estudam variagio de um fendmeno on grapo de fonomenos de pais para pais ou de regio para regizo, tomando uma delas para base ou termo de comparagio, NUMEROS-INDICES 143 Os indices atras calculados so indices cronolégicos, Um indice regional seria, por exemplo, o que caleuiasse 0 prego do phoem varias cidades de Portugal, ow nus capitais de alguns paises, tomande o prego numa delas para base ou termo de comparacio. Se, aa analisar os resultados de um indice cronolégico, é pre- ciso haver muita cautela, esta tem de ser redobrada quando se trata de indices regionais. Com efvito, se (exemplificande ainda com 9 pio) é provavel que, com 0 andar dos tempos, a compo- siggo do pio tenba variado ¢ o produto de que se pretende medir a variagio de prego seja o mesme apenas no nome, ainda mais provivelmente isto aconteceré para comparagies que, embora se refiram ao mesmo anv, respeitem a capitais de diversos pai a diferenca entre o produto pao quo se comia, mesmo em 1045, en Lisboa © em Londres era considerayel. 3) Ainda sob outro ponto de vista, os indices podem elassifi- car-se em indices ponderados 0 indices nto ponderados. Os indi- ces dos legumes acima calculados sio indices niio ponderados. Se entrarmos em cada caso com a producto de cada legume, atri- buimos a cada prego, uma certa iportincia, varidvel conforme © peso (também chantado coeficiente de ponderagéa) com que cada preco figura ne indice. Num indice nfo ponderads, usualmente, cada prego, qnalquer gue soja a importncia do pro- duto a que so rofere, figura com o mesmo pasa, com o peso 1. © uso de indices ponderados traz consigo uma dificuldade : a escola dos eceficientes de ponderagao. Ha varias praticas, acada uma correspondendo uma formula. Assim : (i) Podem usar-se como pesos as quantidades do periodo-base. Chamando como anteriormente : Pos Pis Ph Pos Pis Pe Pr Pi Be aos pregos dos varios produtos (ou qualidades de produtos} diferenciados pelo némero de plicas, nos trés anos (0, 1 e 2pe Gs Gs a Ge Hy a Gr hy % at MANUAL DE ESTATISTICA as quantidades produzidas, vendidas on consamidas dos mesmos produtos nos mesmos anos, temos quer PBT Pe Stra) 100 SCs) dario, aplicadas ap exemplo do quadra n2 8.2, os indices (com- postas) do progo dos leguines, respeetivamente, nos anos de 1940 @ 1942, com base uos pregos do ano de 1988, usande como pesos us quantidades do legumes produzios ao ano base. Substitaindo, nas formulas acima, os simbolos pelos valores por eles representudos, tirados do quadro n.€ 8.2, vem: As formulas deste tipo ttm largo uso no edleulo de indices compoxtos ponderadas, Designam-se por formulas de Laspeyres. fii) Podem usar-se como pesos as quantidades do periodo actual, isto é, do period para que se doseja calenlar o indiee. Usando og mesmos simbolos de h4 pouco, temos que: PG PRA PEO soy ee SEW) 0 Stag) Slee | (Pe) fornecerio, aplicadas ao exemplo do quadro n.° 8.2, os indices (compostos} do prega dos legumes, respectivamente, nos anos NUMBROS- INDICES 145 de 1940 © 1942, com base nos pregos do ano de 1938 e usando coma coeficientes de ponderagio as quantidades de legumes produzidas nos anos para os quais so pretende calealar o indice. Substituindo nas férmalas acima, os simbolos pelos valores por eles representados, tirados do quadro x." 8.2, vom: Ie HESS 28 p00 = 123,8 $F 108820 =< 204.073 Formulas coma as ltimas indicadas sio conhocidas por for- mulas do Paasche. Nio @m tio large emprego como as de Laspeyres, porque nem sempre ¢ possivel conhecer as quantida- des (u usar como pesos) nos anos para os quais se pretoade caleular os indices, (iii) Podem utilizar-se como pesos as somas das quantidades dy periodo-base © do periodo para quo se pretonde caleular 9 fnilice, Usando 0 mesmo exemple que até aqui, a formula para o ano de 1942, com base nos progos de 1938, seria: Identicamente, a formula para o indice referente ao ano de 1940, com base nos pregus do ano de 1938, seria: Stpiliet+ aol Jy Pee) 100, Spe ge 4) Tal como o método anterior, o que use estas formnlas entra com quantidades referentes ao ano para gue se pretende caleular 10 146 MANUAL DE ESTATISTICA © indice, Como estas quantidades varium de ano para ano, segue-se que todos os anos hé que modificar os calculos. Esta formula 6 conhecida por formula de Marshall-Edgeworth. fiv) Pedem usar-se como pesos as quantidades do ano base edo anc pera que se pretende caleular o indice, combinando os métodos (i) ¢ {if}. Esta combinagie faz-se, efectuando a média dos indices a Laspeyres @ do Paasche acima estudados. Esta raédia pode ser aritmética © a formula 6: 3 [eek +S S(pi a abs |. 100 Steed ~ Seg. ou geométrica, de formula : see wo) 302) 109, Stpeg) SC. 9) O uso de qualquer destas duss iltimes formulas exige o conhe- cbnento das quantidades (a usar como coeficientes de pondoragiio) referentes ao ano para que se pretende caleular o indice, além das relativas ao avo base. Pertanto, em cada ano e tal como se disse para algumas das férmulas anteriores, hd que substituir coeficientes de ponderagh, ¢ que constitoi am obsticulo de ordem material ao uso destas formulas. A dltima das formulas citadas 6 conhecida por formula deal de Fisher. OQ economista americano Irving Fisher numa obra fuzdamental sobre niimeros-indices, eita muitas formulas para © sen cAlenlo, Apliea-thes um certo niimero de eritérios daquolas quo satisfazem a esses critérios, a mais simples é a tiltima menvionada. Eis 4 razio da designagio de ideal. De entre os critérios aplicados, os dois fandamentais so os dosignados por: reveredbilédade no tempo 6 reversibilidade das factores Entende-se que ha reversibilidade no tempo quando o indice do ano 1 com base no ano 0 é 0 inverso do indice do ano 0 com base no ano 1. Vejamos se a formula de Laspeyres fornece mia indice rever- sivel no tempo. Exemplifiquemos com os dados do quadro NUMEROS - INDICES WT n. 8.2. Vimos atras que o indice dos progus dos legumes no ano de 1940, com base nos pregos de 1938, 6: Sp.) 20 hom Begs 100 = 1208 0 indice dos pregas dos mesmos produtos no ano de 1938, com base nos de 1940, sera: a= eee. 100 = 80,8. Fazendo 0 produto: Z,o>< 80,8 = 97,7 portanto, diferente do 100, ou, se as formulas niio estivessem multiplieadas por 100, diferente de 1. Logo, a firmula de Las- peyres, nto fornece indices reversiveis no tempo. ‘Apliquemos © imesmo critério a indices dados pela formula de Passcho. J& atris se vin que © indice du prego dos legumes em 1940, com base nos pregos de 1038, &: SI) 199 = Sta) © indice dos progos dos mesmos produtos em 1938, com base nos pregos do 1940, sera: cree 3,8. Tog = S220) 100 S{p. 4) Neste caso, também, Fo>< Toa = 122,3 >< 81,7 = 100 conclui que a firmula ideal satisfaz ao critério da dade no tempo. Antes de entrar no estudo da reversibilidade dos factores, dediquemos algumas palavras, ainda que ripidas, aos indices de quantidades ou de volume, Disse-se no comego da seegho 8.1 que podin haver indices de precos e indices de quantidades, além de um grande némero de indices de outra natareza. 0 exemplo escolhido tem até aqui servido para estudar indices de pregos. ‘Mas ¢ mesmo exemplo pode igualmente servir para o estado de indices de volume. Tudo quanto atris se disse acerca de tipos de indices aplica-se a todos os indices, qualquer que seja a sua natureza 6, partanto, também aos indices de quantidados. Faz exeopeio o que se disse a respeito dos coeficientes de ponderagko dos indices de progos. Vimos que estes coeficientes eram constituides por quantidades. Evidentemente gue os cooficientes de ponderagio, nos indices de quantidades, nfo sio yuantidades, mus sim, em geral, precos. Vejamos entio o critério de reversibilidade dos factores. Diase que um tadiee de pregos satisfaz 4 este critério quando toultiplicendo-o pela indice de quantidades, que se ubtém substi- tuindo ua sua formula os pp por gg e os gg por pp, so obtém wn indice de valores que, como se sabe, iio siio mais do que produtos de precos por quantidades. Porque o exemplo namérico requer contas laboriosas, nao © daremnos, No que se refere & formula de Laspeyres, multipli- cande o indice de pregos pelo de quantidades : Sipoad S(t) Stead ~ Sep) @ produto nfo 4 ignsl ao indice de valores: StP a (Pet) NUMEROS~ INDICES 149 pelo quo se conelai que esta firmala nio satisiaz so eritério da reversibilidade dos factores. © mesmo se couclui da for- mula de Paasche, efeetuando : Sg) . Slap), Baa) ~ Sap) No que se refere & formula ideal, fazendo : SOG) (Pah xy Suey Sa) RB) St PS S(PeGy a} Bash) Stow) cheza-se a conclusio contrazia & anterior, isto é, esta {rmula, que ja sstisfazin ao eritério da reversibilidude no tanpo, tambéus satisfaz ao eritério da reversibilidsde dos factares. 4) Ainda sob outro ponto de vista podem-se distinguir: @) médias de indies © 4) indices agrogativos. Exemplifiquemos ainda com os dados do meswo quadro n.° 8. a) Médias de indices. Neste caso, para a obteugio do indice composto : (i) Calcula-se um indice simples para cada artigo, Considere- mos no quadro n° 8.2 os snos de 1938 ¢ 1940, Fomemos 0 primeiro como base. Qs tadices simples, nio poderados, dos trés leguuves slo; 189541 145887 IT1s94, Mt 139889 >< 100 = 108,7, > 100 = 129,38; 112 10a 100 = E assim se obteve a seguinte série de indices: 1298; 123,8; 1087. {ii} Catcula-se o indica compusto, fazendo a média dos indicas simples : © 2 1206. 150 MANUAL DE ESTATISTICA onde p, © py sio os precos dos diversos artigos no ano base © ho ano para que se deseja calcular o indice e N é © némero de artigos dv qua se caleularam indices simples. 4) Indice agregative. Consiste em: (1) Detormixar para o pertodo-base e para 0 periodo para o gual se protende caleular a indice, os totais dos progos de todos os artigos, Usando ainda o mesmo exemplo e os mesmas anos ne cateriormento, vé-se que os precos totalizam 473866 ¢ 388855, rospectivamente, nos anos de 1940 e de 1939. (i) Dividir os dois totais assim obtidos, usando eomo divisor © do periodo base © maltiplicando o quociente por 100. No easo presente seri : £13806 100 = 192,0. 388855 Esie indice tam a formula geral, no caso de se tratar de um Indice de pregos : ‘ pee 84P.) 100 S(p.) onde p, & p, 830 08 pregos dos varios artigos no perfodo-base © no perfode pare a qual se pretende calcular o indice. Estes tipos de indices (médias de indiees e indices agregati- vos) podem combinar-se com os anteriores. Assim 6 que eles podem ser simples, compostos e complexos; eronolégicos e regionais; ponderados e nia ponderados. Neste dltimo caso, ag formulas niio sio as atras apontadas, mas sim as que delas resultam pela introdugio de pesos. A média ponderada de indices tem por expressio geral : ; 8 (2.2.25) S(rg 2 PE 0 on A 100 S(p.4) S(P.g.) conforme so usam como pesns, valores do ano base ou pregos do ano base multiplicados pelas quantidades do ano para que se pretende calcular 0 indies. A primeira expressia 6 equire- lente 4 formula de Laspeyres; a segunda, corrosponde & fér- mula de Paasele. NUMEROS -iNDICES 1st © Indice agregative ponderado tom por expressdes gerais as férmulas indicadas na pag. 144 quando se procedan av estndo das possiveis formas de ponderagio. 8.3-Problemas relacionados com a elaboracio de um ndmero-indice. De entre os problemas que surgen a0 pretea- der elaborar um nimero-indice destacam-se, por essenciais, os seguintes : (i) Determinagio do objective do indice; {i} Escola do niinero e da natureza dos artigos que nele hio-de figurar ; (iii) Escolha da base da indice ; {iv} Eseolha do tipo do indice @ da respective formula. Estes problemas que née sto, em geral, independentes uns dos autres, referem-se 4 elaboragio, entendendo-se como tal a montagem do indice. Mais tarde, no calenio periddicamente feito do indice, outras dificuldades surgem, as quails tm de ser resolridas mais pela aplicagio de uma grande dose de hom-senso a par do conhecimento perfaito do indice em si e do fendmeno que o mesmo pretende medir do que polo uso de regras fixas @ predeterminadas. (i) Na elaboraco de um indice é necessario tex Lem presente © seu objective. Evidentemeate que am indice cuja fim seja medir as variagdes do custe da vida, ha-de necessiriamente ser diferente de outro que pretenda medir as do volume do coméreio externo, por exemplo. Esta diferenca roflote-se no 86 nos artigos que no indice hio-de figurar como também nos coati- cientes de ponderagio 6 ainda, possivelmente, em outra qualquer cargeteristica. Kis por que acima se diz que os problewas que surgem 20 montar wn indice e que se enumeram atras, nilo sho, em geral, independentes. (i) Os artigos escolhides para figurarem num indice devem obedecer a certas condigtes. Assim: a) Devem ser bem definides, de forma a nie garem origem a ambiguidades. Nio basta, num indica de pregas de retalho, introdazir 9 artigo pao, quando se sabe haver virias qualidades de pio. Em vez de pao dove especificar-se, por exemple, pio de tiga de 1°. ig MANUAL DE ESTATISTICA 4) As unidades a que os mesmos artigos se referem devem sor igualmente bem definidas, Constitei um vicio de origem fazer entrar num indiee de pregos de retalha o artigo sardinka refe- rido & unidade disia. Come se sabe, a variagho do prego da abizia de sardinlisas dependo, entre outras causae, do tamanhe das vardinhas. Outro exemplo é o do artigo rahos referido A unidude mo. Como se sabe, nao sé é variivel o niimero de nabos que entram ei enda m&o como © tamanho dos nabos em més de ignal niimero, pode ser diferente. Tudo isto, por- lunto, slo factores que facem variar os pregos dos respectivos artigos, embora us mesmos s@ mantenhar (medidos por padroes hem dofinidos) iguais. ©) Os artigos dovem ser tais que o decorrer do tempo no prejudique a sua comparubilidade. Isto refere-se principalmente a alteragtes na qualidade dos artigos. Como se sabe, nam iudice de pregos por grosso, entram matérias primas a par de pro- dutos fabricados. Enquanto aquelas nio variam sensivelmente de qualidade, os produtos acabados, dovide & moda ou aos pro- gressos da técnica (um antomével de 1946 6 muito diferente, nio s6 16 aspecto mas também nos produtos quo entram na sua cons- fngde, de outro antomével de 1910) podem apresentar, com o decorrer do tempo modifieagtes mais ou menos profundas. Quando nio puder deixar de se incluir nam fodice, artigos euja qualidade se prasuma vir a ser slterada, devem-se tomar medi- das para que ecomparabilidade soja sempre possivel. Coma se sabe, 0 chamade pao de trig de 1° de 1946 6 de composigio diferente do, em 1938 também chamado pao de trigo de 1.* Comparar, pois, os proces do pdo de triga de 1." nas duas épocas 6 cometer um erro, que so evitaria se se tomassem as matérins primas que nas dues épecas entram na composicho do pio @ se fizesse uma média ponderada (os pesos seriam as quan- tidades das diferentes watérias primas existentes om ura quilo- grama do produto scabado) des pregos das mesmas matérias primas, 2) Os artigos devem ser em nimero suficiente para mostra- Tem as variagées do fendmeno que se pretende obsorvar, sem coutudo serem em nimoro tio clevade que difieultem desneces- NUMEROS - INDICES 158 siriemente os célcnlos. A primeira vista pode pansar-se que a melhor solugio consiste em incluir no indice tadae os artigos possivels. Se so preiende, por exemplo, um indice de precos de retalbo pode pensar-se que a melhor solugio consiste em nele ineluir todos os precos de retalho. Mas neste caso, eome em mites outros, por impossibidade ow por ecomodidade, nao 8 fax « inelusiio de pregus de todos os artigos. Ha, pois, que tomur wna parte do todo, on, como se diz em Jinguazem téenica, uma amostra do universo. Este trabalho & muito delicade @ exige, a par de conbecimentos de amostragem (que nde cabem no émbito deste volume} bastaste bom-senso. Ao tomar uma amostra on se conhece on niin se contece © tode. No caso, por exemplo, de um indice do eomércio de importagio, conhece-se 6 todo, isto é sabom-se quais foram todas as mereaderias importadas, qual o seu valor e quais as suas quantidades. O uso de uma amostra, neste enso, representa wna comodidade, Mas no caso de um indiee de pregos de retalho de produtos alimentares, estes apresentam una variedade enorme @ nio existe, compilada e & mo, uma lista de todos eles, como oxiste uma lista dos produtos impertades. O uso de mma amostra Tepresenta, assim, umn caso de necessidade absoluta. A teoria da amostragem diz como, em certas condiedes, pode ser determinado 0 tamarhe da amostra de wm certo universo. Além disso, ensina a usar certs eritérios para alerir do grau de aceitabilidade dos resultados obtidos com doterminada amos- tra. Como se disse atras, a teuria da aniostragem esta fora do dimbito deste livro. Mas pode-se lanear mio de outros meios. Ha que, acima de tndo, conkecer muito bem o objective do indice, bem como 0 materia? usado para a sua elaboragio. Se o universo for conkecido pode, por exempla, incluir-so no indice, todo 9 artigo que atingir uma certa percentageri do con- Junto. Assim, num indice da produgio agricola, podem incluir-se somente os produtos cujo valor atinja ou esteja acima de oma certa percentagem do valor total da mesma producia: os res- tantes prodatos desprezam-se pela sua pequena importancia. Em vez deste, pode ainda usar-se 0 seguinte critério: inelair 154 MANUAL DE ESTATISTICA no indice os produtos que atinjam um certo quantitative, em nimeros absclutes. Foi este o critério seguido para os indices do comércio externo ealeulados pelo Instituto Nacional de Eatutistiea), Feitos estudes a este respeito acerca dos qaan- titativos a cousiderar, decidin-se incluir no indice do volume da importagio 28. mercadorins caja impertagiio exceden 3.000 tone- Jadas; no indice do volume da exportagao, as mercadorias enja exportacio exceden 2.000 toneladas; ne fndice de pregos da importagio, as moreaderias importadas cujo valor exeaden 5,000 contos; e a0 indice de pregos da exportagiio, as merca- dorias exportadas eujo valor exceden 4.000 contos. Como se conheeiam os totais, viu-se que as mereadorias que excediam os quantitativos indicades representavam, respectivamente, as per- contagens de 95,8, 96,5, 82,2 @ 86,7 dos totais da tonelagem importada, da tonelagem exportada, dos valores importados, e dos valores exportados. As percentagens citadas, foram cousideradas satisfatérias. Mas nem sempre se conhece, como se conhece nos exemplos unteriores, 9 todo. Assim, a0 caso de um indice de pregos de retatho de prodatos alimeatares, nio sé sabe o nimero desses produtos, nem o prego de cada um deles. Ha, pois, que adoptar outro méfodo. Assim, se o indice se destinar a medir a varia- gio dos pregos dos produtos alimentares usados na alimentagio humana, pode-se, por meio de um inyuérite efeetuado junto de um certo niimero de familias, determinader quais sie os produtos consumidgs na sun alimentacio. Serio estes, pots, as prodn- tos que entrario uo indice. Com outros indices, de diversa natureza, o caminho a seguir 4 mesmo: a partir do conhecimento perteito do indice quo se pretende © por um método indirecto, procarar obter os artigos que devem figurar no indice. {ili) A bass, definida na secgio 8.1, procara ser localizada sum perfodo em quo as condigtes de fonémeno om estudo sejam, tanto quanto possivel, normai () indices do Coméreie Eitterno por A. Tovar ¢ F. Maia ie Loureiro, Lisboa, Instituto Navional de Estatistica, 1942. NUMEROS- INDICES 155 Ha indices eujo perfodo-base ¢ simplesmente de um mts. Aten- dende & que o fendmono em questiio pode apresentar flutuagtes de més para més, dentro do ano, a base de am més 34, é coutra- -indicada, Por esse motivo usa-se o uno como perfodo-bese, Destu forma, torneis-se a dificuldade da existéncia de flutuacdes, chamadas estacionais, dentro do mesmo ano. Mas pode neontecer que o ano escolhide para base, seja am ano pouco normal, isto 6, excep- clonalmente eleyvado ou exeepelonalmente baixo. Como veremos no capitulo seguinte, além das flatuagies estacionais dentro de cada ano, existem outras Gutuagées de ano para ano, dentro de um periodo maior, a gue se chama ciclo. E por asta raziio que se preconiza o uso do cicla como base, ou, s¢ a duragio deste nilo for conhecida exactamente, o uso de um nimera de anos tal que s# suponka englobar um ciclo. Por vezes usa-so 10 anos, periode aconselhado pelo Instituto Interna- cional de Estatistica, -As bases a que até aqui nos temos referido, sito as chumadas bases ficas e os indices que as usam tomam o nome do indices de base fia, Mas & medida que o tempo passa 6 que a base se distancia, o indice pode perder grande parte de, se nao tudo, sen significado inicial. Com efeito, um indice da custo da vida com base, por exemplo, em 1914 nfo traduz cartamente a reulidade de 1946, por nos tempos correntes existirem despesas que nfo figuram na base © por os coeficientes de ponderngio para as despesas comuns a 1944 © 1946, se terem, certarsente, modificado. Para obviar a este inconveniente preconiza-se que, periddica- mente, se mude de indica, isto 6, se proceda A actualizacho, nio sé ds base, mas também de ontros elementos como, por exemple, dos coeficientes de ponderacho. Neste caso, o novo indice pio tem ligaco algama com o antigo. Contudo, ¢ ainda no caso de se tratar de um indice de base fixa, pode acontecer que s reconhega que a actualizagio da base # suficientes. Entdo, procede-se ao que se costama designar por mudanca de base. Este problema sera estudado adiante, em conjunto com os indices de base mével. 156, MANUAL DE ESTATISTICA Mas, como atria se disse, quando a natareza dos dados for tal que ao elaborar o indice se suponla, fundadamente, qne a sua composicio inicial no se possa manter por muito tempo, procede-se 4 construgio de wm indice de base mével. O mesmo acontece quando so admite, também com boas razbes, que embora podendo-se manter a composic%o inicial do indice, os coeficientes de ponderagio dos artigos que nele entram, hio-de, forgosamente, variar passado algum tempo, Enquanta no indice de base fixa, os artigos que nele figuram s80 sempre os mesmos, no indies de base mével, esses artigos podem variar ¢ em geral variam. 0 indice de base mével 6, portanto, mais maleavel do que 0 de base fixa, Permite a inclusio de artigos novos, justifieada pela sua grande importincia; ou, ao contrario, o ahandono de artigos até af incluidos, motivado pola pequena importincia que eles passaram a ter. Seja o caso de indices do coméreio de importacia. Como se sabe, os artizes importados num ano podem deixar deo ser, passadus um certo mimero deles. E, ao contrario, podem passar a ser importadas outras mercadorias, Para a constracio de um indice de base mével ha. que, inici- almente, decidir qual a primeira base a utilizar e, além disso, a periodicidade com que a base serd mudada, Em geral, nos indices anuais, 0 periodo-base 6 0 ano antorior. Desta forma obtém-se comparagdes directas entre um ano eo que o antecede, Mas isto nie significa gue nio possa ser outro qualquer anc. © Instituto Nacional de Estatistica publica indi- ces anuuis do coméreio externo nos guais a base pode estar situada, em relagio ao ano para que se calenla v indice: um ow dois anos @ frente e um, dois, trés ou quatro anos atris. Nos indices nfo anuais, 2 lecalizagio do periodo-base pode também variar, Assim, o Instituto Nacional de Estatistica publica indices trimestrais do comércio externo, bageados em idé@ntico trimestre do ano anterior, de dois anos atrés e de trés anos atris, Soja qual for o periodo-hase eseclhido, o fundamental deste tipo de indices 6 que a base 6 mudada de cada vez que o indice 4 caleulado. NOME ROS -INDICES 157 Os indices de base movel podem ser ligades am cadeirs. Para os ligarmos om endeia, se designarmos por Iiq,Je4, ha. 08 indices (de base movel} de cadz ano, com base no ano anterior, fazemos : Tra= he Fro hex Los Fs tye baa baa = Tho << Tas. Consideremos ainda o exemplo do quadro n2 8.2. Chamomos Pys Pro Pas © Py, a08 precos dos legnmes nos anos de 1938, 1940, 1942 @ 1944, respoctivamenta, © ys Gis Ger © Gus 48 Quanti- dades dos mesmos legumes produzidas nos mesmos anos, Com base no ano de 1938, culeulomos os indices agregativo: nko ponderados, dos precos dos legumes nos outros tes anos: 33 se 10 = 478856 > 100 = 121,9 Usando o mesmo tipo de indice, caleulomos agura: 1) Com base no ano de 1940, 0 indice do prego dus legumes ne ano de 1942; 2) Com base no ano de 1942, o indice do prego dos legumes no ano de 1944: Sr) S(p) Pars cada ano considerado, tomos assim calenladus os indicos com base fixa no ano de 1938 ¢ com bese mével no ano antorior. 100 = 178.0. 158 MANUAL DE ESTATISTICA Para calenlar os indices em eadeia, faz-se, como atras se disse: Tia = Kha = 121,9 Tox< 150,5 100 100 Tig = 1884 Kyerlaa choo _ 129% 150.5 178.9 _ 94 9 Tho = Resumindo, pois, temos: Quadro n.* 8.3 Comparacao de indices de base fixe, de base mével salculados por meio de ume [Srmula do tipe egregstive nfo ponderado. Jaton em eatoia erlor) so ‘ae de 1988 veriodon | jadives de tata Axa | indices de base mivel Periods bats (Portes t 1938 | 1000 100.0 100.0 1940 11,8 i248 134,9 1942 1854 1505 1834 1944 8210 1750 324,0 Observa-se, pois, que s@ so usar uma formula do tipo agre- gativo nao ponderado, o& indices em cadeia reproduzem os indices de base fixa (coluna 4 = coluna 2). Sempre que isto se dé, uma mndanga da base do indice pode fazer-se por simples proporgio, O mesmo, porém, niio acontece com o Indice do tipo agrega- tivo ponderado. Exemplifiquemos eom o conhecide por Las- peyres. Neste casa, teremos : SCP. gah A 7 100 = 120,9 Cpa) Sp eel x 100 = 17,3 (Pa 4) NUMEROS- INDICES 159 — S40. 09 Toa = Sp F100 = 809.4 a Sig) = 14 Tag Sea 100 = 1451 = SP. a) ~195 ho= Sep gi 7 100 = 115.0 9 = 120,9 __ 120,9 < W a , 120,9 >< 143,1 >< 175,0 100" Elaboremos um quadro como o anterior. Bo = = 301.0. Quadro n° 8.4 Comparacdo de indices de base fixe, de bese mavel e em cadeia, caleviedos por meio de uma [érmula do tipo egregativo ponderado. Indices ont eadesa tom bast no map de 15 Perfades mi | "tected arent 1958 1000 1000 100 1840 120.9 109 1209 1942 134 2070 Por ele se ve que, de facto, os indices em eadeia nia repro- duzem os indicos de base fixa, se se usarem indiees do tipo agregative ponderado, No exemple seguido usou-s¢ a formula tipo Laspeyres, mas chegar-se-ia i mesma conclasin s¢ 86 wsasse ontra qualquer férmula do tipo agregativo ponderado. Sempre que isto se verifique, ama mudanca de hase do indice Bio pode ser fsita, como ja acontoceu no caso anterior, por simples proporcao. Se se tratar de um indies do tipo média de indices, chegn-se a conclusio andloga & do caso anterior. MANUAL DE ESTATISTICA 140, Exemplifiquemos ainda com os dades do mesmo quadro ) = 1206 ni 82. Seri: s(h x 100 fos 314,3 Elaboremes ainda um quadro idéntice aes anteriores : Quadro n? 8.5 Comparacée de indices de bese fixe, de base mével ¢ em cadeia, caiculades por meio de ums média de indices nfo ponderados. ea weer bese 338 Indices 4o hase move) (@erlede anterior) Jugieer do kase five (i838) NUMERBOS - INDICES 161 De faeto, tembém neste caso, os indices em eadsia (coluna 4) nko roproduzem os indices de base fixa (coluia 2). Portanto, neste caso também uma mudanga de base nio pode ser efec. tuada por simples proporgio. No exemplo seguido, usaram-se progos nao ponderados, Se se tivessem usado progos ponderados, as conclusses seriam as mesmas. Exemplifiquemos agora com um indice de médin zeométriea. Usemos ainda os dados do quadro 2,° 8.2. Designando por IL, Bi, @ produto dos indices simplos (tantos quantss as wnidades do indice do radical) seri: fof (Bx 100) = 120,3 P, fof 0 (Px 100) = 180,1 ow \ fil @ cd 100) = 312,6 ae) = 149,7 a =/ 1 (Bo 100) == 173,5 Ps Eg = 120,8 3 7 Tay = 2208197 90 4 100 Iyyw LOS™ UYTMBA grog Tou" Os resultados obtidos sio apresentados no quadro n.° 8.6 no qual se vé que, & semelhanga do que acontecia com os indi- ces agregativos nio ponderados, os indices em cadeia (caluna 4} Teproduzem os indices de base fixa e de médie geométrica (colana 2). Quer dizer, estes dois tipos de indices nio pondo- tados {agregativos e de média geométrica), gozam da proprie- dade da trangferibilidade. 162 MANUAL DE ESTATISTICA Quadro n° 8.6 Comparacio de indices de base fixe, de base mével e em cadeia, calculados por meio de médie geomélrice de indices néo ponderedos. indives om cadela fem base jriotos | indices do peer thea | Iudleos do hase mévol Povioa (ass {Perlods aateries) 1988 10,0 106.0 | 1000 1930 1208 1208 1208 4943 1801 1497 1804 i944 22.6 1p 3126 fiv) Acerca do tipo de indice a empregar, também tém que se tomar decisdes, as qnais, muitas vezes, slo facilitadas pelo conhecimento exacto do objective do indieo © da natureza do fendmeno que com ele se pretende medir. Assim, é natural que seja fécil a decisio sobre se o indice deve ser um indice simples, um indice composto ou um indice com- plexo. Igualmente fiell 4 decidir se o indice deve ser um indice eronologico ou um indice regional. Contudo, para decidir se o indice deve ser ponderado ou n&o ponderads, alguma coisa mais é necossario saber além do que acima se menciona. Na seecio anterior disse-se, a este respeita, que os indices ponderados apresentam, sobre os nio ponderados, vantagens apreciiveis e, por isso, é natural que a decisio se incline para um indice ponderado. Pura que tal decisio possa ser posta em pratica 6, evidentomente, necessdrio que se pos- suum ou se possam determinar os respectives coeficientes de ponderagio, Pelo qne se viu na sergko anterior, conclui-se que se pode considerar iimitado o nfimero de formulas de possivel emprego no ecdleula de wm mimero-indice, se bem que o nimero de fér- mulas de caracteristicas diferenciadas seja restrito. Pode optar-se por uma média de indices ou, em vez disso, por um indice agregative. Embora o primeiro tipo apresente a yantagem de mostrar as variagies de cada artigo de per si, NUMEROS - INDICES 168 0 sen omprego niio esti tio ganerslizado como o segundo, talvex dovido av maior mémero de contas que 6 necessério efectuar. Em geral, pois, ¢ entre os indices do tipo agroyativo que se escolbe a formula a empregar. E aqui, mais do yne as virtudes totricas de cada formula, pesam as possibilidades priticas do seu emprego. Vin-se ua seegio anterior que grimde ninero de formulas (@ das mais importantes} exigia o conhecimento de pesos respeitantes ao uno para que so caleula o indice, Ora iste diffell para grande parte dos indices. Para muitos indisos, o8 pesos on coeficientes de ponderaciio siio determinadus a partir de um inguérito, muitas vezes trabalhoso 6 dispendiaso e que, por isso, niio 6 facihmente repstivel, Daf o terem que se usar, durante alguns anos, sempre os mosmos cacficientes de pande- ragio, 0 que leva, imediatamente, a climinar a possibilidade de emprego de bastantes formulas. E claro que, no caso do se poderem determinar, eom factli- dade, os eveficientes de ponderacio relatives ao ano para que se deseja ealenlar o indice, a escola da férmula é mais lata, CAPITULO 9 ANALISE DAS SERIES CRONOLOGICAS 9.1-Generalidedes. Entende-so por acries cronaiégieas aque- las em que os dados se reforem a uma sucessio do datas, distri- baindo-se por wm certo period de tempo. Estas séries podem roferir-se a assuntos varios e, por conse quéncia, interessarem a vérios ramos da cidneia. Foram os astronomos que primeiramente delas se ocuparam, mas fisicos @ secidlagos tdm-se também, ¢ Jargamente, ocupado da seu esiudo. A facilidade deste varia com a natureza dos dados ¢ as influéneies a que estio sujeitas as variagdes da sua grandeza, Por exemplo, os astrénomos foram particularmente felizes pelo facto da influéncia de Sol se fuxer sentir de ta forma que faci- litou 0 estude de muitos dos fendmenos astrondmicos. Os economistas e suciéloges, em goral, estio interessados na andlise das séries cronoldgicas. Os métodos usados ainda nko sio porfaitos @ a interprotacéo dos resultados obtidos continua & nZo se apresontar facil. A causa reside no grande mimaro de influéncias que simattineamente afectam os feniimenos sociais, Muitas dolas dispares ¢ algumas contraditorias. Por isto, na andlise de uma série cronoldgica, mais dificil do que « aplicagke do um determinado método, se apresenta a judiciosa eseolha desse método ¢ a cuidadosa interpretacto dos resultados sbtidos. Os exemplos apreseatados no presents capitulo referem-se 4 fenémenos econdmicos. 9.2-Movimentos presentes numa série cronoldgice. As séries cronolégicas podem apresentar a) movimentos sistematicos, ¢ 6) movimentos casuais on irregulares. Na primeira categoria estiio inclaidos os movimentos adiante mencionados sab 1), 2) 166 MANUAL DE ESTATISTICA © 3) 0 estudados mais desonvolvidamente nas secgtes seguintes. © estado dos da segunda categoria, que requer um desenvolvi- mento metemitico fora do ambito deste Hvro, no serio, por isso, nele estudados pormenorizadamente. 4) © gréfico n.° 91 mostra, em primeiro lugar, que existe um movimento largo, suave, a quel tanto pode ser ascendente como deseendente, @ a gue se dé o nome de tendéncia geral da série ou movimento de longa duragao. A tendéncia geral da série pode ser devida a muitos factores, em geral diferentes dos qua motivam os outros movimentos da série. No presente caso, pode atribuir-se o aumento dos valores da série, eatre outros factores, aos seguintes: introdugio gra- dual de mais moderns processos de pesca; aumento da popu- lagio e, portanto, de consumidores; melhoramente de comuni- cagdes entre a costa @ 9 interior do pais, o que permite que © poixe la chegue em boas condigtes de prego, de sanidade e de frescura. 2) Observa-se ainda que, dentro de eada ano, o valor da pesca oscila, apresentando um maximo ¢ um minimo. Estas osci- lagdes periédicas sio influenciadasy pelas estagdes do ano e sio, por isso, chamadas oscitagdes ou flutuagdes ou ainda variagtes estacionais. As causas quo as motivam sio varias: condigtes climaticas — bem tempo on tempestades, chavas, nove ou gelo, sol, humidade, ete, tuda isto, afectando as produgdes naturais © a actividade em certas indistrias exercidas ao ar livre como a agricultura, a pesca, a construgio civil, ete; convengtes sociais gue alteram a procura de certos artigos pelo Natal, pela Pascoa ou por ontras datas festivas, ou sinda em certas estagdes do ano, ete. 3) Verifica-se ainda outro movimento oscilatério, regular aa natureze, embora irregular nos seus perfodos. Trata-se dos movimentos ciclicos. Muitas vezes, a andlise das séries cronolégicas de caracter econdmieo tem come objective o estude dos movimentos ciclicos. Os ciclos econdmicos tém sido objecto de muitos estudos e existem varias teorias que procuram explieé-los. Cada teoria atribai os ciclos a determinados factores. Desde as teorias que os atribuem epdtien 129-1 VAQOUES OURO DA ESCA DESEMBADCADA NO COMTINENTE £ IAS «1896-1037 DADDS MENSAIS er ee ee ee ee) ANALISE DAS SERIES CRONOLOGGICAS 167 4 influéneia do Sol ou do planeta Vénus até as que os consideram motivados por raztes psivolégicas conducentes a certas reagdes de caricter eeondmico, encontra-se, nos escritores da especia- Hdade, uma longa série de explicagbes. Dada a dependéneia crescente que se tem verificado entre as economias dos diferentes paises, observa-se, cada vex mais, uma simultaneidade de movimentas ciclicos em todos os paises, em relagio a um mesino fendmeno ou grapo de fendmenos eco- némieos, No grafico n.°9.1 podem notar-se alguns desses movi- mentos oscilatérios. Assim, o perlodo de 1915 a 1921 pode eonsiderar-se um ciclo e o de 1922 a 1932 outro. Os periodos de minimo, 1921 ¢ 1932, constituem reflexos de graves crises econdmicas internacionais geradas fora de Portugal. 4) Finalmente, hii outras oscilagies, esporddicas, acidentais on irregulares, devidas a factores ocasionais: guerras, revolugdes, greves, abalos de terra, ete. Por vezes, estes movimentos irre- glares originam, outras vezes acentuam, a existincia de movi- mentos ciclicos. Cada um destes movimentos ser objecto de estudo mais pormenorizado, Evidentemente que pode haver séries que nio apresentem todos estes movimentos, ou porque eles ua verdado niko existem, cu porque estic escondides. Por exemplo, uma série de dados angais, nao apresentard, certamente, flutuagies estacionais, embora elas existam e fussem visiveis se os dadow estivessem referidos a meses ou a semanas. 9.3-Orientegdo a seguir no estudo de ume série crono- légics, © método geral de estudo de uma série cronoligica varia: 1) conforme o fim em vista 6 2) conforme os dados se apresentam. © esindo da tendéncia geral da série varia conforme o objec- tive em vista 6 o de analisar os movimentos efclicos ou o de extrapolar valores da série, isto 6, fazer previsdes. Por outro lado, se os dados forem anuais, niv se pedem estudar as flataagdes estacionais. Também acontece que umas vezes se pretende estadar a ten- déncia geral da série ¢ considerar os valores fornecidos por tal estado como os normais ou representatives da série, isto 6, 168 MANUAL DE ESTAYISTICA considerar aquela tend@ncia como a tinica caracteristica perma- nente da série e olhar todas as outras como mais ou monos acidentais. Outras vezes adopta-se o mesmo procedimento em relagio a0 grupo constitaide pela tendéncia geral ¢ pelas flutuagtes osta- cionais, Os valores fornecidos por esis grupo sho entia consi- derados como agueles que, logicamente, a série deve fornecer, pois englobam uma caractoristiea permanente @ wma que, perid- dicamente, se repete. As restantes caracteristicas sio entio olhadas como mais ou menos acidentais. Outras vexes, porém, o estudo da tendéncia geral da série ou do grupo constituido por ola ¢ pelas varisgbes estacionais nio se faz com o fim de conhecer os sons valores para os considerar representatives da série, mas justamente 0 contrério, com o fim de os eliminar e de proceder 20 estudo dos valores restantes, atribuiveis aos movimentos ciclicos @ irregulares de muito diffeil separagio. Pode ainda acoutecer que, em doterminada série, as flutaages estacionais sejam de importineia tio grande que no seja visivel a tendéncia geral nem quaisquer dos ontros movimentos. Numa tal série pode querer proceder-se somente ao estndo das flutua- ees estacionais, quer para as considerar em separado, quor para as eliminur e considerar o que resta depois da sua eliminagio. Do que antecede, conelui-se que os valores originais da série podem cnnsiderar-se contituidos pelos valores da tendéneia geral, das flutuagdes estacionais, das oscilagbes ciclicas das variagdes ieregulares, isto 6 eg Gay Em geral, porém, Z, € J sio expresses como pereentagens, enguanto 7 6 expresso em némeros absolutos. Entho, os valores originais sio iguais a: TXEXexTI. 9.4-Preparacao dos dados, Qualquer que seja o objective em vista e a forma como os dados se apresentam, devem os mesmos ser preparados antes de se iniciar 0 estudo da série. A este respeito também se deve proceder a uma escolha judi- ANALISE DAS SERIES CRONOLOGICAS 19 ciosa do tratamento preliminar a adoptar, se é que se deve adoptar algum. Indicam-se a seguir alguns tratamentos prelimi- nares dos dados : J) Suponhamos que determinada série exibe o mimero de bilhetes vendides nos cinemas de uma certa cidade, nom deter- iminado perfodo, @ que esse namero 6 francamenie ascendente, Daqui nio se deve concluir imediatamente que os habitantes da cidade em questic alteraram os seus habits e que passaram = ir cada vez mais ao cinema. O anmento verificade pode, em vez disso, ser muito simplesmente devido ao erescente nimero de habitantes da cidade. Para eliminar este factor perturbador, em vez da série original, caleula-se outra, dividindo os valores daquela pelo namero de habitantes da cidade nos diferentes anos ou, melhor eind, polo nimero de habitantes em idade de frequentar o cinema. Este tratamento ¢ aplicado a algumas séries econémicas prin- cipalmente referentes a paises onde se verifiea um rapido aumento da populagio. 2) Supoahamos que possuimos uma série apresentando valo- res de mercadorias vendidas, da produgio de determinada artigo, etc, As variagtes dos valores da série, digamos, dos valores do produto a quo a série se rofere, podem ser devidas ou a fiutuagdes das quantidades produzidas on aos precos w térios da mesmo produto. Por isso, as flntuagtes dos valores da série original podem no dizer muito. Pode mesme aconte- cer (e acontece, certamente, nos casos em que a loi da oferta da proeura funciona) que um doterminado movimento descon- sional das quantidades produzidas acarrete um movimento ascensional no prego unitério, de modo a conservar sproxima- damente constante o nivel dos valores. Pode também acontecer (@ acontece, certamente, em paises de moeda instavel e irregular como o nosso} que a principal influéncia nos valores soja devida & instabilidade monetaria. Em qualquer destes casos, so se deseja eliminar o factor prego ou, pelo menos, referi-lo a um padriio estivel, eostuma-so divi- dir os valores originais da série por um indice apropriado. Este procedimento esta muito generalizndo. Da-se-lhe o nome 170 MANUAL DE ESTATISTICA de deflagto. Por vezes acontece que a deflagio é erradamente aplicada, por o indice empregado nio ser o proprio. Assim, se se quiser estabilizar uma série de valores de salirios neminais, deve empregar-se um indice do enste da vida on, em saa substi- tuigio, um indice de pregos de retalho; se se tratar de um indice de valores dos prédios construidos, deve atilizar-se um indice om que entrem os principais (se niio todos) materiais utili- vados na construgis civil; ete. Os valores representados pelo grafico n° 9.1 nfo sho os ori- ginais. Foram obtidos destes tendo em conta, para cada més, 2 agio do ouro tomado em relacio & paridade de 1911. Sio, pois, valures ouro, muito mais estiveis do que os valores papel. O grafico n° 9.2 apresenta as dass séries. 3) Supomhamos quo 4 série original se refero as quantidades mensais da determiinade produto fabricado por certa empresa. Além des quatro tipos de movimentos mencionados na secgdo 9. no presente caso existe outra causa de variagio: o nimero dife- rente de dias de cada és. Com efeito, as quantidades fabricadas em cada més variam com o nimero de dias de trabalho ¢ este é fangio do numero total de dias do més 6 do nimero de dias (domingos e feriados} em que a empresa niio produzin. Por isso, © primeiro passo consiste em determinar o numero de dias de trabalho de cada més da série e depois aplicar a fUrmula seguinte: N ux 12 M, = Mp x cade + ‘M, 6 0 dado mensal original ; WN 60 niimero de dias do ano em questio; n 60 némero de dias de trabalho em cada més ; M, 6 0 valor mensal corrigido. Se se tratar de uma indistria de Iaboragio continua (electri- cidade, por exemplo}, 7 é igual ao nimero total de dias de cada més; sé nfo, n 6 igual a esse mimero deduzido do udmero de dias ¢ feriados. RTBU MCN i T i __i tb esensi NE HT HH ETS ANALISE DAS SERIES CRONOLOGICAS wm ESTUDO DA TENDENCIA GERAL. 9.5-Tipos de tendéncia geral. Sua escolha: Na secgin 9.3 Ja se disse alguma coisa acorea do tipo de tendéncia geral a adoptar. Fundamentalments, esto tipo varia cenforme os dados se apresentam ¢ 0 objective em vista. Em geral, para evitar contas muito laboriosas, ao estadar a teudéneia geral trabalha-sa com dados anuais. Estes podem referir-se ao total do ane (produgio anual, ete.) ou a médias mensais (a duodécima parte do total do ano}. O trabalhar com dados anuais (um por sno) eqnivale a considerar rectilinea, dentro de cade ano, a links de tendéncia geral, o que pada introduzir waa verta suargem de erro. Quando se verifiear que esta margem ¢ elovada por a linha de tendéncia geral se mostrar inuite curva, 6 mais correcta trabalhar com dados mensais (am para cada més, doze em cada ano). Depois de efectuadas todas as operagtes indieadas anterior- mente (nesta secciio @ nas precedentes), para proceder ao estudo da linha gue define a tendéneia geral da série, temos quo, antes do mais, considerar os objectivos em vista, Com efeito, pode pretender-se (i) estudar 2 série apresentada com vista a prever os seus futuras movimentos, isto ¢, com vista a proceder a extrapolagbes ; ou (ii) estudar a série em si, quer dizer, com vista a determinar a sua linha de tendéncia geral (que dissemos ser entio considerada como fornecendo os valores normais ou caracteristieos da série) quer para comparar essa linha com a de ontras séries, quer para medir a influéneia dos outros movi- mentos sobre o de tendéncia goral, quer ainda para estudar os ciclos econémicos para o quo o estudo da tendéncia goral tem de ser seguido do dos ontros movimentos, de modo a, finalmente, deixar 8b os movimentos ciclicos. Qualquer que seja o objective em vista, o primeiro passo a dar consiste na oscolha da linha de tendéncia geral que melior se ajuste avs dados fornecidos. Para que esta escola possa ser feita, comega-se por representar os dadus graficamente. Para isso, utilizam-se quatro tipos de papel: a) ambas as escalas 12 MANUAL DE ESTATISTICA {des Y¥ que, invariavelmeate, mostra os valores dos dados e dos XX onde sempre se marca o tempo) aritméticas; 6 a mais vulgar; 5) os valores Y em escala logaritmica e o tempo X em escala aritmética. Quer dizer, em vex de uo papel se marcarem os valores ¥ dos dados, maream-se os logaritmos desses dados, Utilizando papel especial, evita-se o trabalho de calcular os logaritmos dos valores, pois tal papel jé esti tracejado a dis- tancias logaritmicas; c) Y em escala aritmética e X em escala logaritmica; d) Ye X em esealas logaritmiens. Marcados entio os dados nos papéis e desenhados os histari- gramas, para o que os valores referentes a anus sucessivos aio ligados por uma linha continua, procede-se ao estuda dos histo- rigremas com o fim de descobrir posstvois relaghes entre Ye X. Se por qualquer dos motivos indieados nas secgties 9.12 e 9.13 se protender emprogar o método grifico on o dus médias moveis, isto 6, se no valer a pena pesquizar o melhor método, ‘asta desenhar as bistorigramas em papel aritmético para ambas ag escalas (chamado duplo papel aritmétics). Quer o trabalho de desenhar os quatro graficos acima referidos, quer 0 que se segue, se refere 2 pesquiza do melhor méwdo. O segundo passo consiste na organizagio de um quadro de diferencas finitas para os valores da série. O quadro n." 9.1 apresenta um exemple de como se constroi tal quadro, A dife- reuca entre dois valores seguidos de uma coluna, coloca-se na coluna seguinte, entre os valores que se subiraem. Entio: (i) Se o grafico desenhado em dupla eseula aritmética apre- sentar uma linka reeta (ou uproximadamente) escolhe-se a linka recta (ver secgko 9.6) para linha de tendéncia geral. As pri- meires diferengas finitas devem ser constantes (ou quase). {ii) Se os valores de X crescerem em progressio aritnética e os de ¥ em progrossio geométrica; on se 0 grifico deso- nhado da forma 5) acima mencionada (¥ em escala logaritmica e X em escala aritmétiea) apresentar uma linha recta (ou guase reeta), escolhe-so uma curva expononcial (ver secgio 9.9) para definir a linha de tendéncia geral. (iit) Se, quer X, quer Y crescerem em progressio geomé- tries, ou se o grafico desenhado em dupla escala logaritmica ANALISE DAS SERIES CRONOLOGICAS 173 (forma d) acima mencionada) apresentar uma linha recta (on qnase recta} escolho-se uma curva parabdtica definida por uma equagio da forma Fax para representar a tendéncia geral (ver seegao 9.11). Quadro n° 9.1 Diferancas finites Dados hipotéticos. ; ‘ Ag At & | y | Patmatras | segundos | vorceras | Quarter 2 Aivarenges | diteraucas | diteronges | alferengns (iv) Be X croscer em progressio aritmética e as segundas diferengas de Y forem constantes, escolhe-so uma curva do sogundo grau (ver secgho 9,7) cuja equago da forma Y= a+ ba + co {v) Se X erescer em progressio aritmdética e as enésimas (de ordem n) diferengas finitas de Y forem constantes, esco- Ihe-se uma oquagio da forma A = at ba $ ea” + oe 4 gat que define uma curva de gran n. (i) Se X crescor om progressio aritmétiea © as primeiras 14 MANUAL DE ESTATISTICA diferengas de Y se distribuirem normalmente, escolhe-se a cha- mada curva logistica (ver sacgio 9.10). Pode acontecer que nenhum dos tipos de curva atras des- critos se ajuste exactamente aos valores da sé ‘te caso, se no se prescindir de um método matematico, mas 32 pho se exigir grande rigor, podew-se tentar varias das curvas citadas © escolher a que A vista parecer adaptar-se melhor. Se se quiser ser rigoroso, podem usar-se varias medidas que permi- tem ver até gue ponto os valores calculados por meio da equa- g&o escolhida, se afastam dos valores observados. Por outras palavras, ha varias medidas que permitem ver o grau de ajus- tamento do tipo de curva escollida, & série de valores dada. Uma primeira medida é: S(t) = SVT] para caleular a qual se faz a diferenca entre cada valor dado © 0 correspondente valor calculado por meio da equagiie da eurva escolhida, se elevam essas diferengas ao quadrado e se somam. Feita esta prova para cada tipo de curva experimentado, esco- The-so aquele para o qual S(d*) for menor. Ontra medida, esta verdadeiramente rigorosa, 6 0 dado no capitulo 10. Note-se ainda que pode acontecer que da representagho gra- fica preliroinar da série dada, se conclua que o melhor proce- dimento a seguir consiste na escolha de mais do que uma curva das indicadas atras para definir a linha de tendéncia geral. Este caso corresponds na pratica ac ajustamento de varias eurvas (ineluindo a Hinha recta) a varias partes da série. Se nos for dado escolher quantos en0s devemos incluir no estudo da tendéneia geral, devemos ter presente que quanto maior for o nimero de anos, mais bem definida fica a linba de tendéneia geral da série. No entanto, pode grosseiramente esta- belecer-se como limite minimo o de 10 anos. Suponhamos ontio fornecida uma série de valores quaisquer, correspondentes a uma série de anos, Os valores originais da série estio preparados pela aplicagio de um ow mais dos processos indicados na secgio 94. Com eles, desenham-se estu- ANALISE DAS SERIES CRONCLGGICAS 175 os quatre graficos atras mencionados @ constroi-se, com os valores de Y, uma tabua de diferencas fimitas. Com base nos grifieos e na thbua de diferencas, escolhe-se um dos tipos de tendéncia gera! atrés mencionados @ que nas socgbes seguintes serdo estudados mais pormenorizadamente. 9.6-Linha recta. O nosso problema consiste agora ero ajus- tar uma linha recta aos valores da série. A recta a ajustar, qualquer que seje 0 método seguido, é representada por uma equagio da forma: Ye=athx em que: ae b sho as incdgnitas que se pretendem determinar, também chamadas parémetros da equagio ou ainda constantes, porque uma vez determinadas nie muda: X representa os valores da varidvel tempo; Y, os valores da série calculados a partir da equacio. Escreve-se Y, para os distinguir de ¥, valores da série dada. Em vez de atribuir « X og valores da varifivel tempo, dio-se- he, em geral, os dos desvins contados 2 partir de uze dos anos gue se chama a origem. Ao pardmetro a dé-se o nome de valor de Y. na origem, por sor o que advém para ¥, quando X=0; a 6 dé-se o nome de coeficiente angular da recta, a qual pode ser positive ow nega- tive e representa o gran de inclinagio da recta em relagho ao eixo dos XX. Se na equagko geral da linha recta acima mencionada, depois de calcuiades ae}, dermos a X dois valores (dos da série) guaisqaer, mas de proferéacia razotvelmente distanciados, abte~ mos para Y; dois valores quo, unidos, definem a recta. Para o ajustamento da recta pode adoptar-se o seguinte método: divide-se 0 nimero total de dados em duas partes ignais 6 para cada metade caleula-se uma média aritmética. As duas médias assim obtidas constituem os dois valores através dos qunie se faz passar a linba recta que define a tendéncia geral. A diferengs entre as duas médias fornece a variagio (aumento ou diminuigio) total durante os anos que entre olas medeiam. 176 MANUAL DE ESTATISTICA Quadro n.* 9.2 Ajustemento de ume linha recta. Bacalhau verde pescado pela frots becalhoeire ¢ desembarcado no Continente portugués. Origem: Anuirias Estatistico de Portugal. “oot | Toncladas | Mééion — |'TondBrein wernt rset | 3.668 2.9024 1932 ATAAS 1933 | 64985 1984 RUBY | 82487 1985 10.0009 1986 1. T53,1 1987 13.505,3 1938 WIS 1989 17.008,7 1940 18761,9 i941 205140 | 20.514,0 1942 22.206,3 1948 24.0185, 194 25.770,7 Aumento total durante 7 anos: 20.514,0 — 8.248,7 = 12.265,8. 12,265,3 7 Aumento anal: = 1.7592 O quociente daquela difsrenga por este nimero de anos for- nece a variagio anual. © quadro n.° 9,2 apresenta um exemplo de como se procede na pratica. Entio a equagio da recta pode escrever-se: ¥, = 8248,7 4 1,752,2X com origem em 1934, Os valores da tendéncia geral obt#m-se, a partir de 1934, sucessivamente, fazendo naguela equacio, X=1, X=2,.--,X=10. Os valores roferentes a 1933, 1932 © 1981 obtém-se, igualmente, a partir daquela equagio, fazendo ANALISE DAS SERTES CRONOLOGICAS Wi nola X=—1, X=—2 e X=—3. Assim, aquela mesma equacio pode-se eserever sob a forma: Yi = 2.992,1 + 1.752,2 5 com origem em 1931. Este método, porém, fornece sdmente valores aproximadas e, por isso, se lio profere o dos menores ou minimos quadrados, que se passa a descrever. Nas seegbes 5.11 n 5.18 caleulimos, utilizando o método dos menores quadrados, equagtes de linkas rectas. B isso que Jremos fazer agora, seguindo no entanto outro caminho, o qual, com proprisdade podia ter sido ompregade nas seegdes men- cionadas. Nio o foi porque ontio atilizamos o coeficiente de correlagin como um passo intermédio para o cileulo das equa- goes de regrossiio. Porque wo dispomos agora, come entio dispinhawes, do coeficiente de correlagio, nite podemos seguir o caminko li indicado. Tremos considerar duas formas de proceder, ligeiramente diferentes uma da outra. 1) Numero impar de anos, O quadzo n.° 9.3 mostra coma os caleulos silo efectuados. 1) Colenam-se os anos X © os valores F da série dada. Somam-se estes. Obtem-se S(Y). 2) Escolhe-se para orlgem o ano central da série, a0 qual se a4, por consequéncia, o valor zero, Avs outros anos atri- buem-se os valores dos desvios a contados para o ano central. 3) Caleula-so, linha a linha, a* e a¥, que se somam. Obtém-se S(@) e S(@¥). 4) A partir das equagdes normais da recta: I S(¥)—Na=0 IE S(e¥)—dS@*)=0 obtém-se ox valores dos parémetros a ¢ &: a S1¥) 21044 593 068 N 41 178 MANUAL DE ESTATISTICA 5) A equacio da recta j4 podo ser escrits : ¥,-a--be—518,3 4 te com origem em 1917, ano em que Y, 5183. O valor de b representa o aumento anual a adicionar ou subtrair, suees- sivamente, ao valor encontrado para o ano origem, 1917. Com efeito, o valor de 1918 6 igual aa valor de 1917 (513, mais 6 aumento anual (valor de 6, isto 4, 9,7), Entio o valor de Y, para 1918 6 523,0. Oa ent&o, o valor de ¥, para 1918 pode ser obtido substituindo na equacgio acima, a pelo seu valor correspondente a 1918, isto é, 1. Portanto, para 1918, f2523,3-4-9,7--623,0. O valor de ¥, currespondente a qual- quer outro ano obtém-se de forma andloga; todos os valores de ¥, foram calenlados e inseritus na coluna respectiva do quadro n° 9.3. II) Numero par de anes. Em geral, @ sempre que nada se diga em contraria, considera-se que o valor dado para cada eno corresponde ao meio do ano, Portanto, se o mimero total de anos for par, 0 centro da série nao coincidiré com nenbum dos valores dados. Em ver disso, ficara situado no ponto que divide ‘1s dois anos centrais (comego de um ¢ fim do anterior). ‘A titulo Hustrativo, 0 quadro n.? 94 apresenta ox dados do quadro n° 9.2, Como o mémero de anos é par, o centro da adrie corresponderd ao fim de 1937 © comego de 1938. A distancia deste ponto central a cada um dos pontos médios de cada ano 6 de seis meses, ou de meio ano. A fim de evitar trubalhar com fraegSes usa-se como unidade, na contagem dos desvios dos anos, meio ano em vez de um ano, como no quadro n? 9.3. A coluna dos zz do quadro n.° 9.4 mostra como esta contagem 6 feita, Os valores des parimetros a. } siio obtides como no exemplo antorior. Com eles, pode escrever-se a equagio da recta: Y, 14.381 + 8372 com origem entre 1937 6 1938 © em que os desvios esti oxpres- sos em semestres, O valor de qualquer ano é obtide, como no Quadro a? 9.3 Calcuto e eliminagéo da tendéncia geral. Ajuslamenio @ uma recle. Pesca desembarcade no Continente e thas. Valores ouro (contos). Médias anuais de dados mansais Origem : Estatistioa das Peseas Muritimas, Acos | meats | deewos | . x ¥ © # ef ve = ToT ci | | i Wis 44962 1045.0 9.960 1.1163 2, 793 54 £50 i 22 492) — 6 84 $25) 5 338 os | 3 cs = 1380 0 a6} — 2 — 1058 | a a = 586 & 0 0 k 1 932 2 2.024 3 Lot 4 1.092 a 2 6 3.282 i 5a0T 8 6.312 9 7.092 10 0 i 12 ‘3. 13 65, 4 tet 15 228.3 a2] 16 | 2265 413) a7 j 265.2 70.3310 a7] 8 2609 88.058,8 418} 19 2736 , 783762 407 | 90 sus] 4250 | 903801 j rary p= 1346.3141 ANALISE DAS SERIES CRONOLGGICAS 178 Quedro n2 9.4 Calculo da tendéncia geral. Ajustemento o ums recia. Dades do quadro n.* 9.2, Avos | Tonotadas | Zewvive . Teaniorka x Yr = ™ 3668) 18 tea = 3.500 4587 | 11 wif — suse} 5174 1675 | = 9 a) 5.848 aa) 7 a) S5ee 9.872 -& 23 _ 10.196, UTi4 -38 | a — 35.522 L870 2415 { 4 apo 13.44 Wee | aT a] + F218 W825 +3 9 + 16.892 ba +5 2 102.705, 18.566 sore | +7 49] + 146o15 | 90.940 aod] 4 8 si] 4189126) ead sess} ait wat | +250833 23.588 e679 | 418 169 | +3u0ge7 | 85.262 3 @tyasi0 | 8 or S(Y) _ 201.339 ~ TE = 14.3814 exemplo anterior, substituindo na equacdo da recta, a pelo seu valor correspoudente a esse ano e registado na colnna dos ex do guadro n.* 9.4. %.7-Curva do segundo grav. A curva do segundo grau em X definida pela equagio Ye=a4bXieX" chama-s# uma parébola. Enquanto a curva do primeiro grau, de equacko ¥,=a4+)X 6 uma linka recta como vimos ua acegho anterior, a curva do segundo grau apresenta uma curvatura. Tal como na secgio anterior, a a, e ¢ di-se o nome de pardmetros da equacio. « representa o valor de Y. na origem, 190 MANUAL DE ESTATISTICA isto 6, 0 valor de Y, quando X=0. 6 representa o dngulo que a curva faz com o eixo dos XX ne ponto Y.=a. Conforme o sinal de & for positive ou nogativo, assim nesse ponte a curva sera ascendente ou descendente. ¢ representa a inclinagio unita- ria da curva, isto 6, a inclinagiio da curva por cada unidade de X. © quadro n.° 9.5 mostra a forma de calenlar a tendéncia geral definida por uma curva do segundo grau, Neste caso, como temos trés pardimetros precisainos de trés equaghes normais. Soe, como 6 mais vulgar e mais modo, tomarmos o ano contral da série para origem dn contagem dos desvios 2 as equagdes normais redazem-se & forma: 1 8(Yj_Na+e Sie") Ik S(w¥)=bS(e") Tl S(#¥)~aS@)+eS¢') © quadro n.? 9.5 fornece directamente SF) © S(z") pelo que 0 cileulo de b no oferece dificuldades: 142 = B,1408 5514? owt 740 Para calcular @ © © tem que se resolver o sistema: S(Y)= Na+ 9a") Sw) —aS(e) + Sa"). Substituinds nolo os valores fornecidos pelo quadro 2. 9.5, obtémse? p94 O44 dha 15.1406 { 2.918.498 = 5.740 a+ 1445.882 ¢. © seguinto 6 um dos métodos de resolugio do sistema: os cooficientas do @ naa duas equagdes sio 41 6 5.740. Dividindo fo maior polo menor, obtém-so 5,740-+41 = 140. Multiplicando a eqnagio em que o cooficiente de a é menor (a primeira equagio) por 140 obiém-se o sistema : 2,946,160 = 5.740 a +- 803.600 ¢ (osisas =5.740.a + 1.445.332 6 . ANALISE DAS SERIES ORONOLOGICAS 181 Subtraindo estas eyragdes ume da outra obtém-se : 641.732 ¢ == — 627.732 donde iacilmente se tira o valor de e: c= —0,9782. Substituindo este valor de ¢ na primeira das equagdes do iiltimo sistema acima, obtém-se + 2.946.160 — 5.740 a — 785.081,52 732.241,52 a= B.782.241,52 = 650,216. 5.740 donde se tira: E assim so obtiveram os valores das incégnitas ow pardme- tros a, 6 © ¢ com os quais se pode construir a equagio da curva : ¥, = 650,216 + 9,71La2 —0,9782". Os valores de ¥, provenientes da substituigio, nesta equacio, de # pelos seus valores (coluna 3 do quadro n.° 9.5) estio ins- critos na coluna do mesmo guadro n." 9.5, 9.8-Curve do terceiro greu, A equacio geral de uma curva do teresiro grau om X 6 da forma: Fe=a4+bX+eX*+aX* onde a, b, ced sio as incdgnitas ou parimetros da equagio. © quadre n.° 9.6 mostra como ¢e calenlam aqueles parime- tros para a mesma série até aqui utilizada. No caso de uma curva do 3.° grau, as equagdes normais, (se, como é usual por mais cdmodo, se tomar o ano central pura origem da contagem dos desvios a) sto da forma: I S(¥)=Na+eS(e") IL S(¥)=5S(e*) +d S(2') TH S(e'¥)=aS(0')+¢S(e') IV S(a¥)=8 S(a") +d S(a’). 182 MANUAL DE ESTATISTICA Este sistema pode dividir-se om dois, respectivamente, para a resoluglo das incdgnitas aec,e bed: S{Y) = Na + ¢S(x2) { S(aPY) = a S(a*) 4 0 S(t) S(@¥} = b Se) +a 8 (wt) [iors ese neste). Substituindo nostas equagdes, os somatérios pelos valores for- necidos pelo quadro n.° 9.6, obtém-se: 21.044 = dha + 5.7400 {osts.408 =D. 40a + 1.445.332 & 5D.742 = 5.740 + 1.445.332 d frowir.sot =e 2b + 482.518.1140. O primeiro sistema est4 resolvido a pigina anterior e fornece 26 e@ e=—0,9782 Na resolugio do segundo sistema pode adoptar-se 0 seguinte método, chamado de substituigio. Da primeira equagio tira-se o valor de 5: 9 ab que se substitui ne segunda equagio, obtendo-se: 100.647.9091 = 1.445.332 x O 439518114 393.669.384.136 d =— 19.446.228.004 19.446,228.004 303.669.384.136 Substitaindo agora este valor de d na exprossio do valor de b, encontra-se: Calentados os 4 parimetros da equagio da curva, esta pode escrever-s@: Y, = 650,216 + 22,150 2 — 0,9782 2* — 0,0404 2%. Quadro n? 95 [Ajustsmento 8 uma parsbole do 2.° grav. lores ouro (contos), Médias anusis de dados menseis Chiculo & Pesca desembercade 0 Continents # lihas. bepranires 00 105818 | | | Be | A=. 1h. 392 ANALISE DAS SERIES CRONOLOGICAS 183 Os valores de ¥_ resultantes da substituigio, nesta equagie, de a pelos seus valores (coluna 3 do quadre n.° 9.6) acbam-se inseritos na coluna 10 do mesmo guadro. © grafico n.° 9.3 apresenta o historigrama construido a partir dos vulores originais da série. Sobrepostas, encontram-se dese- nhadas as linhas de tendéneia até esta altura calculadas a partir das equagdes da linba recta, da curva do segundo gran o da curva do terceiro grau. Vé-se que, enquanto a equagio do primeira gran dofine uma nha recta, a do segunda grau define uma linha com uma cur- yatura ¢ a do terceiro gran define ama linha com duas curva- turas. Por enda constante ou pardmetro adicisnado & equacko, introduz-se uma eurvatura na linha, tornando-se esta mais prd- aima dos valores originais, Se o némero de constantes for ignal a0 de valores da série, a linha passurd por todos eles. Ao caleular os parametros da eqaagiie do terceiro grau, vimo- -nos na necessidade de calcular poténeias de # até & sexta o que origina uma grande dose de trabalho. Por este motivo e ainda porque as extrupolagtes baseadus em equagties do ter- ceiro grin © de graus euperiores sio sempre perigosas por Inspirarem poucs confianga, em regra, no se calcularm tendén- cias geruis por meio delas. 9.9-Curva exponencial, Esta curva, também. chamada curva dw jaro composto, é definida pela equagio geral: ¥,= alk. A variagiio dos valores fornecidos por esta equacio depende do 5, Assim, se } for positive @ maior do que a unidade, os valores fornecidos pola equagio crescem, de ano para ano, de ial forma que as diferencas entre dois anos canserutivos silo suces- sivamente maiores em valor absoluto, embora se conservem constantes em valor relativo; quer dizer, a percentagem de aumento, tomada em relagio ao ane anterior, 6 coustante. Se 6 for positive mas menor do que a unidade, os valores farne- eidos por aquela equacio decrescem, de ano para ano, por wma percentagem constante e tendem assim para zero. 184 MANUAL DE ESTATISTICA Aplicando logaritmos Aquela equagio, obtém-se: log Y.=loga + X logs que niio é mais do que a equagio de uma. linha recia. Portanto, © ajustamento de uma curva exponencial a uma série de valores transforma-se, por meio do uso de logaritmos, no ajustamento de uma linha reeta, estudado na seecio 9.6. Neste caso, as equagtes normais sio da forma: I S(log Y)=Nloge IL S(@log ¥)=logd. S(@"). Para obter a equagio na sua forma exponencial, uma vez de poste de loga 6 de loge, calenla-se a eb, Conhocidos estes, a eqnagio pode escrever-set Yewab?. Os valores de F, so calculados a partir da equagho sob a forma logaritmica: log ¥.—loga + X log’ substitaindo nela, X pelos seus valores. Obtides desta forma ‘os valores de log ¥. para os unos sucossivos, culculam-se os respectivos ¥.. 9:10-Curva logistica. Conforme o que se disse em (vi) da seccio 9,5, a curva logistica 6 aplicivel se as primeiras diferen- gas dus valores da série dada se dispuzeron grificamente segundo uma curva normal, ‘A curva logistica ajusta-se bem a dados de natureza biologica ¢ populacionais 0, além disso, a dados rolativos & produgko de indastrias novas e enjo creseimento estd, em geral, relacionado com o da populagis. ‘A carva logistien pode ser definida por uma equagio da forma: Y “Tipe 0 que quer dizer que esta equayio pode assumir outras formas, todas semelhantes. Naquela equagio: =2,11828, 6 a base dos logaritmos neturais ow neperianos ; Quadro a." 96 1 grav. Fescs desembarcade no Continente e Ithes ‘dado mensais yenlo s uma parébole do Origom: Estatiation das Pessat Meritinas. ‘avoe | sistas | Doeies x oY |e = gory S816 | =I asst | 1) — 19200 | La 3) = oie oa | 433 a8 Ersrr Mohan | 2 vans SBOE : fa] ANALISE DAS SERIES CRONOLOGICAS 185 a a, b © k séo incdgnitas a doterminar a partir das oxpressdes : a= 2,802,585 log © he 1 9 309.585 low ELM). OP 802.585 Jog Bs onde: Yor ty © Ya ShO as populacdes existentes em 3 anos wo, 2162s que se escolhom para por eles fazer passar a logistica; & n 6 a mimero de anos que vio de wy a a on de oy a x2, visto ay—ag= 2_e—ay A equagio da logistica atris indieada 6 prépria para aplicagao a populagies jovens, ou melhor, a populagdes eujo ciclo evalu- tive tenha tido inicio num némere de habitantes muito pequeno. A populagio portuguesa 6 uma populagio velha 6 0 son actual cielo evalutivo teve inicio, certamente, numa data em que a popu- lagio portuguesa se compunha ja de um certo nimero de habi- tantes. Nestes casos, a formula anterior 6 substituida pela seguinte: ke g- Ata onde A reprosenta a grandeza da populacio na data do inicio do ciclo logistica. Com froquencia a data do infeio do ciclo logistica, n&o 6 facil ée determinar, baseando-se essa determinagio, por vezes, em hipéteses. Outras vezos, depois de se assentar na escolha da data do inicio do ciclo, niio so possuem dados estatistices de confianga, referentes 4 populagio existonte nessa data. Nao so, por exemplo, uninimes as opinides no que se refere 4 data do inicio do actual ciclo logistico da populagio porta- guesa, o que torna a aplicagio de uma logistica sujeita a elevada dose de subjectivismo. O dificil, no ajustamento de uma logis- tica, nao 6 prépriamente a marcha do calcule, mas a escolha da data do infeio do ciclo logistico. 186 MANUAL DE ESTATISTICA 9.11-Dupla escala togaritmica, A distribuiggo de Pareto. Dissemos na seccio 9.5 (ili), as condigdes que se deviam veri- ficar para se escolher am ajustamento por meio de uma curva Ae equagio ¥,= aN, Ha um fendimeno econémico, que por estar aproximadamente nas condigées requerides, é usualmente ajustade a uma curva desta natareza, Trata-se da distribuigio dos rendimentos indi- viduais numa sociedade (pais, cidade, etc.) A curva empregada, sob a forma yoaX onde a © sio constantes ou parimetros a doterminar e y repre- senta ¢ mimero de individuos recebedores do rendimento Y ou superior, é habitualmente designada por curva de Pareto, por jer sido apresentada por este econamista. Pareto estedou a distribuigio das rendimentos individuais num grande numero de sociedades ¢ num grande nimero de épocas, verificando que o valor de a andava, em cada caso, & volta de 1,5. Pretendou, por isso, generalizar este valor assim empiricamente determinado, a todas as épocas, passadas, presontes @ faturas, ¢ a todas as sociedades. A chamada lei de Pareto tem sido larga e vigorosamonte atacada. A davida sabre a sua validade resalta, sobretudo, das distribuigdes de que Pareto fox aso. Com efsito, mesmo nos dias de hoje, ew que os métodos de determinagio estatisticn dos rendimentos indivi- dunis sio muito mais perfeitos do que nas épocas para as quais Pareto fez os seus céleulos, pode dizer-so que no ha, em todo o mundo, uma distribuigho de rendimentos que corresponda is exigéneias da formula e aos postulades da lei. Estas distribuigties de rendimentos existem, em geral, naqueles paises onde também existem estimativas do rendimento nacional basendas em elementos fiscais. Daqui se pode ver que nko se encontram tais distribuigdes, relativas a Portugal. Utilizamos, por isso, dados referentes aos Estados Unidos da América, obtidos do livro de Harold Davis: The Analysis af’ Economic Time Series pig. 401. ANALISE DAS SERIES CRONOLGGICAS 187 No qnadro n.° 9.7 as colunas 1 e 2 devem ser lidas da forma seguinte: com 500 dilares e mais de rendimonto, exis- tem 35,541,000 individuos; com 1.000 e muis délares de rendi- mento, existem 23.010.000 individuos, ete.; com rendimentes iguais @ snperiores a 200,000 délares existem 2.000 individnos. Comparando estas colunas 1 @ 2, vé-se que & medida que os valores de uma erescom, os da ovtra deerescem. Isto significa gue os valores das duas séries sio negativamonte correlacio- nados, isto 6, que a linba de regressio sera inclinada de cima para baixo, @ da esquerda para a direita. A solugio da equacio da curva é mais facil so lhe aplicar- zaos Jogaritmos. Entio ela toma a forma: log ¥=loga—alog X que é a eqnagio do uma recta. As equagdes normais necessi- Fias para o céleulo dos seus pardmetras ska : I Nloga— aS (log X) ~ S(log ¥) IL S(log X.loga) — a S [flog ayf}-- 8 Qog X. log Y). Substituindo nestas equagiies, os valores fornecidos pelo qua- dro 2. 7, obtém-se: I loga — 42,73012 4 = 29,59601 T5012 log a — 173,56464 « = 102, Resolvende este sistema, obtém-se, sucessivamente: 42,75012 O12 loga-—173, 56464 ELIS ¢— 29,50001 = 102,42873 __ 157, 98082 81,0828 Ir | loga 1 Quadro n2 9.7 Calculo da tendéncis gerai, Ajustemento da curve de Pareto a ums distribui¢so de rendimentos dos cidadaos americanos Origem: The Analysis of Time Series por Harold Davia, pag. 401. aon | ; : a log X | log ¥ | logX.tog¥ | (log X)* | 1,09672 jog X 1g goog x x, g | | _ g z = a z 7 é 3 5 500) 5.541 485073 | 12,98908 7pgat4| 457940 azo = [oom 1.000 28.010 430192 | 13,08576 9,000 args [15.618 1.500) 10512 gosto | 1277835 | 1008755 sees | tans 2.000) 5.290 372346 | 1229125 | 10,8080 aess0 =| san 3000, 2225 3a7ss | 1n.s3907 | 13,09086 agsigo | 24g 5.000, 8i2 goosst | 10,2008 | 13,68238 3050 | to 10.000} 254} 4.00000 | 240483} 961932] 18,0000 240774. 35 OS 25.000, oa | 4.a9va4 | 17030} 788282] 19,24188 182255 66 50.000; a1 | aaao7 | tase | — Gatsor | 22,0802 131178 a 100,000} 7 | 5.00000} Opas10 | 4.98550 | 25,0000 0,80102 8 200000} 2 | 5.80103 | 30108 | i,o0577_|_28,10002 0.29026 2 Totais, . . .| 43,7001 | 99,5900 | 102,49872 | 173,50406 ANALISE DAS SERIES CRONOLGGICAS 189 Substituindo © valor de log a na exprossio de x, obtém-se: a AL >< 9,2846189 — 20,59601 — 72,53481 Seen ae EE. 169672 42,75012 42,75012 como se vé, niio meito afastado de 1,5. A equagio da curva, escrita sob a forma logaritmiea, 6: log ¥ = 9,28462 — 1,69672 log X GRATED 19-4 ASUSTAMENEO DE UMA CURYA DE PARETO A. RENDIMENTOS BE HMDIVIDUOS MORTEAMERICANES ‘0.000 ~~ VALORES OBSERVADOS —— so FaLeuLapas. 1.000 NUMERD ACUMULADD BE RENDIMENTOS wooed «00 wo_nON Loan RERUIMCRTUS EM DULABES As trés iiltimas colunas do quadro n.° 9.7, mostram a forma de calcular ¥, © o grifico n° 9-4 apresenta o aspecte de um ajustamento deste génere. Os doscritos nio eagotam o mimero de métodos matemiticos utilizaveis, HA outros ainda, mais complicados ow merecedores 1) MANUAL DE ESTATISTICA de menor confianga. Dos estndados, os mais comummente empre- gados na previsio de valores siio os das secgtes 9.6, 9.9, @ 9.10, os dois primeiros baseados em liuhas rectas ¢ o terceiro baseado numa eurva gue a experiéneia tem demonstrado ajnstar-se muito bem a certas fenbmenos. 9.12-Método gréfico, Este método consiste em ajustar a0 historigrama, tragado em dupla eseula aritnétiea, uma eurva desenhada livremente. Se o historigrama aprosestar, eomo em. geral aprosenta, oscilagdes, proeura-se pelo método grafico desenhar uma curva (que pode ser uma linha recta) que corte essay oseilagies de modo a deixar areas iguais entre o histori- grama é a curva desenliada, acima @ abaixo desta ultima curva. O metodo grafico € altamente subjectivo e, por isso, sujeito a todos os erras de que tais métodos enfermam. Exige, portanto, suits cantela, muita ponderagio @ fornece valores, em geral, de pouca confianca. O mesmo se pode dizer das extrapolagdes con- seguidas a partir da curva. Nos métodos matemtieos atris estudados havia uma equacko por meio da qual se ealeulavam os valores a extrapolar, No método grifice qualquer extrapo- Jagio pode dizer-se feita sem bases. Portanto a finalizande, Tepete-se que apesar de todos os cuidados que se tenham no desente da curva, devem ovitar-se as extrapolagtes (isto é, as previsiies) baseacdas neste método. 9.13- Médias méveis. A aplicacio deste métoda, que o qua- dro n.° 9.8 iustra, consiste em calcular médias de grapos de dados da série original, O primeiro grupo é composto pelos n primeiros dados origiaais. O segundo contém os dados do grupo anterior menos o primeiro ¢ contém a mais o dado de ordem n+. 0 terceiro grupo contém todos os dados do segunda, menos 0 primero dado deste grupo @ mais o dado de ordem n-+2. E assim sucessivamente: cada grupo contém todos os dados do grapo anterior menos o primeiro @ mais o dads seguinte ao ‘dltimo contido nesse grupo anterior. Do trabalho preliminar deserito na socgio 9.4 86 & necessa- rio deseuhar, em dnpla eseala aritmética, o historigrama corres- pondente aos dados originais. Este grafico indicar-nos-A : (i) so © historigrama apresenta ou nio flutuacdes regulares; (ii) se a ANALISE DAS SERIES CRONOLOGICAS it tendéncia goral da série é rectilmea ou curvilines. Conforme as indicagbes do grafico, assim o caminho a seguir @ os reatl- tados abtidos. Se o historigrama apresentar flntuacdes ciclicas regulares, dove escolher-se para entrarem nox grupos acina eitades, um nimero de anos igual ao coherto por am desses ciclos ou, 0 que d& os mesmos resultados, um miltiplo do mimero de anos de um cielo, If a dnica forma de evitar que a linha de tendoncia geral reprodaza as flutuagdes da série original. Qualquer outro nimero de anos simplesmente redaz as flutuacdes som as elimi. nar, isto 6, 2 linha de tendéncia geral obtida utililizande qual- quer outro niimero de anos, nio estara isenta de flutuagdes cielicas ¢, pelo contrario, apresontaré flutuagdes devidas 4 exis- tincia de ciclos. Se, como acontecs mais geralmente, as flutuagtes forem irre- gulates, quer na sua joralizacio dentro da série, quer na sua direegiio, quer ainda na sua durag%o, quanto maior for ¢ numero de anos tomado para cada grapo, mais essas flutuagdes serio reduzidas, sem nunea, porém, serem completamente eliminadas. Se o historigrama xe apresentar coma uma linha recta, por. os valores de Y erescere:n em progressio aritattica, isto 4, por haver sempre a mesma diferenga entre cada dois valores consecutivos da série, os dados originais podem eonsiderar-se como constituindo a linha de tendéneia geral, pois qualquer que seja o nimero de anos tomado para entrar nos grupos, a8 médias obtidas fornecerio sempre uma linha de tendéncia geral rectilinea a qual se sobrepde & dos valores originnis. Se o historigrama se apresentar sem oscilagdes, mas curvi- Ineo, o wso das médias mdveis forneee outra links menos curva do que a original. Se o historigrama original for convexo para o eixo dos XX, a curva fornecida polas médias méveis fica situada acima da curva original; se esta for concava para eixo dos XX, a curva obtida fica situada abaixo da curva original. © grafico n.* 9.1, apesar de apresentar valores mensais, j& deiza ver que as flutuagtes cielicas no sio regulares na sua duragio. Ao aplicar, pois, 0 método das médias méveis, surge 192 MANUAL DE ESTATISTICA a dificuldade da escolha do nimero de anos a incluir em cada grupo. O quadro n.° 9.8 apresenta varias tentativas. De todas, a mais satisfutéria foi aquela em que, em cada grupo, entram 11 anos. Foi esta, por esse motivo, a adoptads. © grafico n° 9.3 aprosenta, além da linha correspondente nos valores da série original, os abtidos pelos diversos ajusta- mentos: linha recta, curva do 2.° grau, curva do 3.° gran, médias méveis. Qual dos ajustamentos é o melhor? As alti- mas colunas dos quadros n.* 9.3, 9.5, 9.6 ¢ 9.8 indieam, para cada ajustamento, o valor de S(d*)=S((¥—ViF]. Recapita- Jemo-los + linha recta: S(d*)-= 1.346.314; partbola do 2° grau: S(d*) = 732.117; parabola do 8° grau: S(d*) = 563.509; médias méveis: S(d*) ~ 662.415. Em face destes resultados, deve eoncluir-se que 6 a parabola do 32 graa que oferece melhor ajustamento. Deve por-se aqui @ restrigio de que as médias méveis nio abrangem o mesmo nimero de anos quo os outros ajustamentos. Por esse motivo, nao 6 estrictamente comparével o resultado fornecido pelo ajustamento as médias méveis com os obtidos pelos restantos ajustamentos. 9.14- Valores mensais da linha de tendéncia geral. Todos os estudos da tendéacia geral de uma série cronolégica foram, nas seccdes anteriores, baseados em um dado para cada ane. Estes dados, como se disse na secgho 9.5, podem referir-se ao total anual oa 2 média mensal do ano {a duodécima parte do valor total anual). No exemplo dos valores da pesca foram utilizadas médias dos doze valores mensais de cada ano, Recor- demos que na seccio 9.6 se obteve, para célealo dos valores da linka de tendéneia geral, a equagio ¥, = 513,268 4 9,712 com origem em 1917 (meio do ano, isto é, fim de Junho). Se quisermos obter os valoros quo a tendéncia geral apre- senta em cada més, temos em primeiro lugar que atender a que Quadro n. 9.8 Célculo da tendéncis ger Médies méveis, Valores cuto da pesca desembarcads no Continente @ Ilhas eeragrerrnny Vidette ratte ANALISE DAS SERIES CRONOLGGICAS 193 os valores mensais se fazem corresponder ao meio do més, unifermomente tomado como o dia 1. Para caleular, pois, 08 valores mensais, temos que dividir o ineremento anual 9,711 de Y por 12, obtendo-se 0,809 para incremento mensal. Além disso, 513,268 refere-se ao fim de Junho e protende-se o valor para o meio do més. Se 0,808 6 o incremento mensal, 0,405 & o incremento correspondente a meio més. Portanto, 263 —0,405—512,868 6 0 valor correspondents an meio de Junho de 1917, E a equagio anterior epresenta-se agora sob a forma. ¥, = 512,863 + 0,803. com origem no meio de Junbo de 1917. O valor referente a Julho (weio do més) de 1917, a um més de distineia de Junho do mesmo ana, obtém-se daquela equagio fazendo 1. De forma sndloga se obtém o valor do gualqaer més: determi- na-s¢ o mimero de meses que medeiam entre ele e Junho de 1917 tomado eomo origem ¢ snbstitu-se na equagio acima, a por esse mimnero de meses. A divisio por 12 acima efectuada, faz-se sempre que o iners- mento dado pela eqaagio original é anual, @ que, recordando o dito na seceio $8, acontece seo niimero de anos for impar. Se o niimero de anos for pur, o ineremwento é semestral. Logo, para calcular og valores mensais da linha de tendéncia, a téenica acina 6 valida, eom a diferenga de que a diviste do incremento (coeficiente de a na equagio original) em vez de ser feita por 12, 6 feita por 6. As vezes, porém, os valores annals usados no edlculo da equagio original que define a Hnba de tendéncia, nio sio a duodéeima parte do valor total anual, mas sim este valor tota) anual. Neste caso: (i) so a oquagic Y.-a+X fol obtida a partir de um némero impar de anos, para que Y, se refira a meses 6 necessiria dividir o valor de a por 12 ¢ 0 de & por 144; (ii) se a equacio F=a+bX foi obtida com base em un niimera par de anos, torna-se necessério, para obter os valores mensais du Hnha de tendéneis, dividir a por 12 @ & por 72. Quer (i) quer (ii) fornecem @ valor mensal referide ao fim do més de Junho do ano a gue a eyuagio Y,~a+b4 expressa em 2B 194 MANUAL DE ESTATISTICA dados anuais, se refeze como origem, Por isso, hi qne ter om conta mais um ujustamento de meio més para o que hasta divi- dir por 2 6 novo valor dividide de 4, e subtrair esta metade de 3 assim obtida ao vove valor de a. E assim se mudou a origem da equagio para 15 da Junho do mesmo ano. Samarizando: so Y.-a+5X representa a equagio obtida com base em médias mensais (a duodécima parte do valor total anual) © num nimero impar de anos, Yiwa tox fornece valores mensais com a mesma origem de Y; (fim de Junhe); 6 fornece valores monsais com a origem em 15 de Junho. Seo mimero de anos du série for par, as equagées res- pectivas sio: So ¥.=@+hX representa a equagio obtida com base nos valores totais de cada ano © una numero fmpar de anos, . é Kiaa'4bX=S 4 x ~ ia 6 a equacio que fornece valores mensais com a mesma origem de ¥, (fim do més); e 1" 1 ¥o=(e@—Ly\sux (3) € 8 equagio gue fornece valores mensais com a origem recuada de meio més, GRATION ne 9-3 VALODES QUDD DA PESCA DESEMBADCADA NO COMTINENTE £ I1das 1897-1937 - _— rT TT no f i —t | "AT TESE isa od Thee “SHA GOK BEE BAT 108 Te Ta TAN IaH WAI —aIS Ta) Tid ID TaeO Wel Wee Wah ea aed eo THT ed WN WO Litt TTT Lt | HWE GS ON 1S 196 7 ANALISE DAS SERIES CRONOLOGICAS 195 Se o némero de anos da série for par, as equagdes atrés sio : O que nosta secgic fica até aqui dito refere-se ao caso da tendéneia geral ter sido calculada por uma linha recta. A seguir estuda-se a determinaggo dos valores mensais du tendéncia geral valeulada pelo métode das médias méveis. Vimos na seegio anterior como se calenlavam os valores da tondéncia geral pelo método das médias méveis. Para cada ano obteve-so um valor. Suponhames que, utilizando ainda 0 exemplo da pesca, protendemos determinar os valores mensais da tendéncia geral no intervalo que vai de meados de 1922 a meados do 1024. OQ guadro n.° 9.9 mostra a técnica deste céleulo. No quadro nw 9.8 vé-so que os valores anuals da linha de tendéncia geral para os anos de 1922, 1923 e 1924 siio, respectivamente, 731, 735 e724, Cada um destes valores corresponderd a9 momento que separa os meses de Junho dos de Julho de cada ano, e os valo- res mensais que se pretendem caleular, devem corresponder a0 meio de cada més, uniformemente tomade como o dia 15, © primeiro passa a dar, consiste no ediculo do incremento anual de 1922 para 1923 e de 1925 para 1924, respectivamente, +4 —IL1 contos. Este valor negativo significa que houve um decréseimo de 1923 para 1924. O segundo passo consiste em caleular os inerementes mensais respectivos, para a que se dividem os incrementos anuais acina citados por 12. Obteve-se: 40,333 e —O,917 contos, res- pectivamente. © terceiro passo coasiste em calenlar o valor correspondents. a 15 de Julho de 1922, distante meio més do valor correspon- dente ao ano de 1922. Para isso, acha-so motade do primeira ineremento mensal acima citado, abtendo-se : 0,8: JT = 09,1665 contos. 196 MANUAL DE ESTATISTICA Quadro no 9.9 Determinagéo dos valores mensais de linha de tendéncia geral caiculads pelo método des médias méveis. Dados do quadro n.* 9.8 7 Volores anusia Anos © moses Modes” WYatoros mensais ats tondocta | “eatentagoe erat 1922——-Junho. 2 2. 73t Inthe Agosto... . Setembro, Outubro. Novembro . Decembro - 1923 —Janeivo, - Fevereira Margo Abril. Maio. . Junko . Julho. Agoste. Sutembra. 2. Outubro Novembea . . . Dezembro... 35 ANALISE DAS SERIES CRONOLGGICAS 197 Este valor, adicionado an correspondente ao fim de Junho, da 6 de Jetho: 781 + 0,165 ‘31,187 contos. Os valores correspondentes aos meses seguintes obtém-se adicionando, sucessivamente, ao més anterior, uv incremento mensal 0,333, Assim, 0 correspondente a Agosto de 1922, sera: TB1,167 + 0,333 = 731,500. Utilizaado sempre o mesmo incremento mensal chega-se no valor 734,830 correspondente a 15 de Junho de 1928. O valor relative ao fim de Junho, disiante melo més de valor referents 2 15 de Junho, obtéra-se, adicionando metude do increments mensal, isto 6, 0,107 a0 valor do moio de Junho, Esse valor sera pois: 4,830 + 0167 = 34,997. Come se vé no quadro n.° 9.8 0 valor do fim de Junho é T35 do qual aquele valor 734,097 muito se aproxima e ao qual se igualaria se niio fossem os arredondamentos das somas sucessivas. A técnica a usar para os 12 meses do periodo seguinte & absolutamente a mesina. Simplesmente, no exemplo dado, em vez de adigdes, tom de fazer-se subtracgies sucessivas. 9.15-Eliminag3o da influéncie da tendéncia geral. Nas seeches anteriores estudimos varios métodos de ealeulo dos valores da tendéneia geral da série, Estes valores calculados slo considerados os valores normais ou representatives da série, se esta nfio apresentar flutuagdes estacionais. Neste caso, os valores da tend®ncia geral da série, calculados pelo apropriade métode estudado nas secgdes anteriores, podem ser empregados: (i) para extrapolar, isto 6, para prever a evelugio futura do fenémeno em estudo; (ii) para comparagies, numéricas @ gra- ficas, com as tendéncias gerais de outras séries. Eliminando a tendéncia geral, o residuo, numérico 4 grafico, serve para o estudo dos movimentos ciclicos da sdrie, admi- tinda, é claro, que a série nfo apresenta oscilagdes estacionais ou que a tendéncia geral foi calenlada a partir de um dado para cada ano. 198 MANUAL DE ESTATISTICA Na eliminagio da influéncia da tendéncia geral podem seguir-se varios processos : (i) Consisto em dividir, ano a ano, os valores observados polos caleulados por meio da equagio que define a tendéncia geral, multiplicande os resultados por 10), Por outras palavras, consiste em exprimir os valores observados em percentagem dos valores calculados : 2100. (ii) Consiste em subtrair, ano a ano, os valores caleulados por meio da equacdo que define a tendéncia geral, dos valores observados : y-Y, (ii) Consiste om subtrair, ano a ano, aos quocientes obtidos pelo processe (i), cem por conto: Fo* 5 100. GRATICR 199-5 vaLouts 0020 Ba DESCA DESCMBAUCADA ME CONTINENTE E ILWAS, 1897-1937 ELIMINATA A TENBENGIA GEDAL S880 385° 87 19001905 gOS GROSS Isto 6, supondo « linha de tendéncia geral representada por 100, os valores forneeidos por este processo (iii), mostram as flutua- ¢8es dos valores da série agima e ebaixo da linha de tendancia. Foi este o proceseo preferide na eliminagio da tendéncia geral feita na coluna 8 do quadro n.° 9.3, aa coluna 10 do quadro n? 9.5 @ na coluna 13 do quadro n° 9.6, O grifica n.° 9.5 ANALISE DAS SERIES CRONOLOGICAS 199 apresenta a eliminagio da tendéneia geral caleulada no quadro ne 9.6, usando 0 ajustamonto & paribola do terceire grau que (vide pag. 192) proven ser o melhor. Os valores usados siio anuais e, portanto, nin apresentar flutuaghes estacionais. A influOneia da tendéncia geral foi elimi- nata. Logo, 0 grifico n. 9.5 apresenta, de uma forma clara, os residaas (valores elelico-esporadieos) e serve de base ao estado dos movimentos cielicos da sér ESTUDO DAS FLUTUACOES ESTACIONAIS. 9.16-Tipos de flutuagées estacionais. Sua escolha. Na scegio 9.2 travémos conbecimento com este movimento apre- sentado pelas séries cronologicas. © facto da série aprosentar ammalmente um on sais pontos de maximo @ um oa mais pontos de minino, nio significa que, através dos anos, o mimero desses pontos seja o mesmo, nem tamponco, que os pontos coincidam sempre nos mesmos moses. Com efeito, as condigtes sociuis de uma comunidaie, sempre em evelugio, podem alterar lenta ou rapidamente por exemplo, as coudighes de veuda ou de produgio de determinado artiga— alteragho que necessiria- mente so manifesta sempre na representagie grafiea de ama série eroneldgiea de valores, yendidos ov produzidos, desse artigo. O estudo das flutuagdes estacionais pode fazer-se tendo em Vista a obtengio dos valores atribuiveis a tals fntuaghes, on com o fim do as etiminar o do lbertar a série eronoligiea da sua influéneia. No primoiro ease, o estuda das Mutnagies esta- cionais faz-se com o fim de obter os valores noxmais ou repre- sentatives da série que, como dissemos, sio constituides pelos valores da tondéneia geral o das flutuagdes estacionais, quando ambos os movimentos estio presenies na série, ou sé por um deies, quando sé um deles esta presente na série. No segundo caso, protendem-se estudar os movimentos cielicos © inrogu- lares, quer dizer, aqueles valores que ficam da série, depois de dela terem sido eliminadas us flutuagdes estacionais ¢ a ten- deneia geral. 200 MANUAL DE ESTALISTICA No estndo das flutuagbes estacionais que, evidentemente, 86 se ofectna ge a série as apresentar, usam-se os dados depois de proviamente preparados, como s0 indicou na seccko 9.4, so alguma dessas operacdes preliminares for julgada conveniente. © métode de estudo das flutnagtes estacionais varia conforme © sou tipo, quer dizer, conforme as diversas fases do movimento oscilatérie se repetem ou nilo através dos anos, sempre nos mesmos meses @ até com a mesma amplitude. No ostudo que se segue sf serio considerados dados mensais, fem como as stas flutnagies dentro do ano. Nie nes interes- sario dados semnanais © as suas flutuagies dentro do més, nem dados diaries ¢ as suas flntuagdes dentro da semana ou do més, para jé nao falar de dados horaries e as suas fintuagbes no deeorrer do dia. 9.17 - Médias mensais, No estuda dus flutuagies pode empragar-se 0 seguinte processo para ilustrar o qual, uti yaremos os valores ouro mensais da pesca desembarcada no Continente © ilhas, referentes ao periodo de 1923-1930 que, como se vi no grafico n° $1, apresenta flutuagies estacionais sensivelmente do mesmo tipo e uma tendéncia geral aproxima- damente rectilinea. No quadro n.* 9.10 estes dados mensais sic somados vertical @ horizontalmente. Ean seguida, calenla-se uma média geral, inserita ua celana Totaia e uma média dos valores de cada ecoluna. Para os meses de Janeiro, a média ser: soma dos valores de Janoiro mamero de meses de Janeiro Para os restantes meses procede-se de forma idéotica. Para obter a média goral, divide-so o total geral, 58.959, pelo nimero total de mesas, 72. Obtém-se 819. Em seguida, determinam-se, ‘em relacio A média geral, as porcentagens de cada uma das amédias mensais. Assim é gue a relatica a Janciro 6: >< 100 = 79,8 819 Quadro n° 9.10 Célculo dos indices das flutuaées estacionais. Método des médias mensais. Valores oure da pesce desembarcada no Continenle ¢ Ilhss, no periodo de 1925-1930 Origom: Estatistica dex Peseas Maritinas, cent V verve! I pews Port | sasco | aunt | atnio | Junto | Jutho | Agosto 1n-| Dozen: | si re! eat} 9.467 789 983) 9.450 788 i 1995. . | 655} GBL 1926, oat | 478 sea] 752] 86) 787] 935 770 108 603 | 543 ana swag | BT 1998 703! 593 493 | 739 10.208 858, 1929) 720) 449 598) 728 9.668 806 198) 815 | G04 asi) 810 ogi | 820 4086 wat | Si | 896 | 997 Votais . .| 8.897 | 3.251 650 4B 12,2 | 1049 SVHOVIOSOND STINTS SVC ISMIYNE foe, 202 MANUAL DE ESLATISTICA E desta forma se obtém wma série de 12 indices das flutua- gbes estacionais. Em vez do processo deserito pade empregar-se o seguinte quo da resultados mais exactos: 1) Utilizemos novamente os dados da quadro n.° 9.10 soma- dos vertical @ borizontalmente ¢ com as médias meusais e a geral caleuladas. 2) Constroi-se o quadro n.° 11 em que cada valor mensal 6 uma percentagem caleulada dividindo ¢ valor do mesmo més, inserito no qnadro n.° 9.10, pela média aritmétien dos vatores correspondentes acs 12 meses do ano a que perience o més considerado. Assim, o valor de Janeiro do 1 Para 08 restantes meses procede-se de forma idéntica. 8) Estas pereentagens monsais siio somadas vertical e bori- zontalmente. Para cada coluna, calcula-se a média aritmética das percentagens. Estas médias constituem os indices das flu- taagbes estacionais. 4) Em vez de escolber as médias aritmétieas para indices, podem escother-se as medianas. Q quadro n.’ 9.11 apresenta as 12 medianas correspondentes As 12 colunas. Como o mimero de elementos em cada coluna é par, a mediana dos valores do eada coluna ealcala-se achando a média dos dois valores centrais da série, depois de ordenadas. Para os meses de Janeiro sera: Sd 88 | 1682 = 81,6 e de forma idéntica para as restantes colunas. 5) Somam-se as medianas e obtém-se: 1.206,4, diferente de 1.200. Cada indice mensal é entlio: 1,200 1.206,4 Ad >< O do més de Janeiro 6 Quadro n? 9.11 Céleulo dos indices des [luluacdes estacionals. Método das médies menseis (percentagens destas médias). Mesinos dados que no quadro n,° 9.10 | eee Ferm | ware | Abit | Malo | Josbo | Jemho } Agosto |Setemtre] Outubro bee rele 1925. , .| 83,0] 86,7 745 | 953 | 1080 | 934 | 1185 | 198,7 | 1988 | 381 | Tas | L198 1926. | 818 | 60,7 680 | 977 | 995 | 138 | r0,8 | 1155 | 146,7 | toa | sitt | L199. 84 | 1053 | 1040 | 1136 | M69 | Li7d | t4e5 | 1270 | 780 | Lage 57,5 | 86,1 | 908 | 1147 | 1160 | 1184 | 145,9 | 1269 | 1837 | 1200.2 742] 897 | 997 | wore | 1 1435 | 191,2 | 104,7 | 1181 | 11984 58.2 | 981 | 1207 | 1125 | 197.2 | 1285 | 138,6 | 1208 | 101,9 | 1.2004 wor. .| TLE | oat 1988... | 81,8 | oa, roaa. . | 89 | 55,7 1980... | 69,6 | 61,0 Totais . .| 46,8 | 3078 4158 | 8722 | 615,7 | 6554 | 7A0,7 | 747,0 | 890.2 | 797.0 | 6288 | 71983. Médias. .j 794] 689) aa | 95 | 12,6 | 1098 | 12,8 | reds | 1384 | 212 | 1047 Modianas | 81,6 Tt 1018 | 13,2 | 117,7 | 1211 | 1493 | 123,9 | 100,5 | 1.2064 indices. .| 81,2 707 1019 | 1126 | a7 | 1205 | 1,5 | 1232 | 108.9 GTONOUD SHINES SVE TSITFNV SFOU 803 204, MANUAL DE ESTATISTICA e de forma id@ntica para os resiantes. Este método das médias mensais 54 deve ser empregado quando a tendéneia geral da série for rectilinea. Se a série apresentar uma tendéncia goral ascendente ou deseendente, o indice de flutaagtes estacionais terA igualmente uma tendéncia no mesmo sentido. Se a tendéneia geral for aseondente, cada Dezembro seri superior a0 Janeiro precedente, independente- mente da flutuagio estacional, 9.18~Percentagens da tendéncia geral, 0 métado seguinte esti isento dos incorivenientes apontados no final da secgko anterior. Exemplifiquemos ainda com os valores onro da pesca, mas utilizemos, a titalo ilustrativo, shmente © trogo 1025-1930 da série, cujos valores constam do quadre n.° 9.40, A marcha é a seguinte: 1) Como necessitamos dos valores mensais da tendéncia geral bo mesmo troga, atilizemos, para os caleular, 2 equacio ¥, = 512,863 + 0,809.2, Por meio desta equagio obtiveram-se, Quadro n° 9.12 Valores mensais da tendéncia geral calculedos por meio da equacdo Y, = 512,863 + 0,809 x com ofigem no meio de Junho de 1917 Esstatistica das Peavas Maritimas, Origen 595) 595 604} 605 610) 611} 612) 612 614) 615 620) 620) 621) 622, 624) 635 629° G30) G31) 632 a3] 634 ese) Get 64] G41 pois, os dados qne constam do quadro n° 9.12. 2) Para cada més, caleula-se a relgio, expressa em percen- tagem, dos valores observados constantes do quadro n.° 9.10 ANALISE DAS SERUES CRONOLOGICAS 205. para os da tondéncia geral insertos no quadro n.° 8.12, Assim, para Janeiro do 1925, tem-so: ¥ 659, = 111,85 Os valeres respeitantes aos meses restantes, calculam-se de Jor idéntica e ske apresentados no quadro a, 9.13. Quadro 12 9.13 Percentagens de tendéncia geral: valores do quadro n.* 9.10 em percantagem dos do quadro n.° 9.12 1925 AN26 1337 99.5 89, 1988. [114.1] 96, 4988. /115.21 71,7] 161.8) 7/160,2) 102, 1638 201,0174, 1883 3950.) 98) 792 as 5532130.7 otiaaas {108.7 8 SUIT SHGL edinvanig “nonce, 6 122,5/258,5° 1 3) Dotermina-se a modiana de cada coluna de percentagens ¢ somam-se as 12 medianas, obtendo-se 1,603,1, diferente de 1.200. Por isso, o indice das flutuasdes estacionais no €, em cada més, igual & mediana respectiva. Para o obter, fazse: 208 MANUAL DE ESTATISTICA Os indices referentos aos meses restantes obtém-se de forma idéntica. Este método tem, sobre os descritos na seestio anterior, a van- tagem de que nao 6 limitado a dados em que a tendéneia geral 6 reetilinea, 9.19- Médias méveis. Outro métode de determinagio de indices das futuagSes estacionais, 6 ¢ seguinte: Uma ver que as flutuagdes estacionais se repetem annalmente, uma média mavel quo abranja 12 valores mensais, deve permi- tir calenlar os indices das flutuagies estacionais. O fundamento do provedimento 6 0 deserito na secghe 9.13 em que se aplicoa médias mévels ao caleulo dos valores da tendéneia geral, pre- conizendo-so a eseolha de um periodo de daragio igual ao do ciclo. Usilizemos, para ilustrar a aplicagio deste método, os dados do quadro n.? 9.10, Construamos o quadro n.? 9.14, que apresenta os valores obtidos, caleulando sobre os dadus do quadro n.° 9.10, médias méveis do 12 meses, pelo processo indicado na secgic 9.13, Quadro n° 9.14 Médias méveis centradas de 12 meses, obtides # partir dos dados do quedro n.° 9.10 Note-se gue, no caso presente, 6 par o niimero de valores que entra om cada grupo usado para calenlar as médias méveis. Por isso, 0 procedimento estudado na seegio 9.13 madifica-se ligetramente, O quadro n.° 9.15 mostra um pormenor do cileulo ANALISE DAS SERIES CRONOLOGICAS 207 das médias méveis apresentadas no quadro n.° 9.14. Este pro- cosso deve set empregado sempre que for par o némero de observagbes em cada, grupo. Quadro a.* 9.15 Calculo das médias méveis de 12 meses, centrades ah abe Feel MOL | otias mcwoin Periodos Fito | Reyes Sate 1926 | Jancies |B | as Fevereiro... | a8 18.671 778 9.303. Maro... 0. | ea 18.640 178 | 9287 Abril. . : 536 | 18.618 776 9.381 Maio... 0 | 18.535 trey / | gabe Sumbe. tat | 18.604 i | s45c Joho. ant ote 18.882 786 Agosto. 2... 870 gare 18.889 787 Ex Setembro os. s10 ose 18.915 788 Cumbre... 1.156 | 0s 19.046 794 9 Novembro... cone 19.338 806 73 © quadro n° 9.16 epresenta, para cada més, 0 quociento <-109 obtido, dividindo, més 2 més, os valores da série origi- hal (guadro n.° 9.10) pelos caleulades por meio du média movel {quadro n.° 9,14), isto 6, di os valores observados em percen- tagem dos da tendéncia geral. Daqui a designagia do método. 208 MANUAL DE ESTATISTICA Quadro n 9.16 Calculo dos indices das flutuagdes estacionais. Mélode das médias méveis, Valores do quadro n.* 9.10 aur. | age. set | Out Nov. | Der ane \ | i ap aot 1 " 5 1825 . | 802) 848) tal TSA) 43,8 107.3) 93,4.120,0)126,3 1907 141.2) B14 1825. .| BA) UE} MUL) 695) 987 Ho 2114.1 110,5 115.5 1458 207 1/1133 1927 | |} TA aL 69.6, 85.5 403,5)2,71115.9 115,5126,2 150.0 1208, 808 1oea | _| 86.31 72.7) 622] 60.3) £025) 93,0,114,6 110,5 1200847, 1340 1029. ea) 530) 57.6. 70.0, 86,0) 91,8 108,0)143,5 144 8 122.7 106,3)117,8 1939. .| 70,0, 6 \ 58.) so niaspeasaais aa Hate suaiaves.) 81,5 63.5, 66.9 coe! 95.8 1 0 x18 18282 G2 12T 1123 lntices.ass} gq.9) 62.5) 65,81 68,5) 94,3100.4 111.2 116,41 jtasain8.5 121.2 143 stuages Wm seguida ealeulam-se as modianas des valores de enda uma das 12 coluas do quadro x.° 9.15. Somam-se as medianas ¢ constatu-se que a sia soma (1.219,5) ¢ diferente de 1.200, Entio, os indices das {lutuaedes estacionais acham-se, para eada coluna, caleulando : 80,2. EB de forma idéntica so obtém os 11 restantes. 9.20-Indices em cadeia mensais. Em voz dos anteriores, pode usar-se o método seguinte, Exemplifiquemos ainda com os valores da pesca desembarcada no Continente ¢ bas. Utilizemos valores mensais, A marcha a soguir é: 1) Divide-se o valor de cada més pelo do més anterior ¢ mal- fiplica-se 0 quociente por 100. Se, no principio da série, nllo se conhecer o valor correspondente ao més anterior nho se pode, evidentemente, apresentar a percontagem do primeiro mas da série. ANALISE DAS SERIES CRONOLOGICAS 209 ‘A percentagem correspondente, por exemplo, ao mis de Jancire de 1935 sera obtida da soguinte forma : valor correspondonto a Janeiro de 1995 yo Yalor correspondents « Dezembro de 1934 2) Caleula-se a mediana dos valoros inseritos em cada coluns © carrespondentes a cada més. Este método foi aplicado & todos os valores monsais da série, dese Jquoire de 1897 a Dezembro de 1937. Nao se apresenta qnadro algum exomplificativo dos passes deseritos em 1) © 2} jor isso se julgar desnecesairio. 3) Consideremos a primeira mediana (a dos valores dos meses) igual a 100 6 vamos ealcular og valores das medianas soguintes com base em Janeiro. 0 quadro n.” 9.17 apresenta os valores obtides, A pereentazem de Fevereiro om relagio a Taneiro (100) 6 84,1. A percentagem do Margo em relagio 2 Janeiro obtém-se, maltiplieando a mediana de Margo (107,4) pela porcentagem de de Fevereiro em relagio a Janeiro (81,7). Obtém-se 87,7. A per- centage de Abril em relacio a Janeiro ealeula-se, wultiplicando a mediana de Abril (105,2) pela percentagem de Marco em rolagio a Janeiro (87,7). Obtém-se 92,3, E assim sucessiva- mente, até quo a pereentagem de Dezembro emi relugio a Janeiro se obtém, multiplicando a mediana de Dezembro (87,3) pela percentagem de Novembro em relagio a Janeiro (136,1). Tem-se 118,8. ‘sta iiltima pereentagow multiplicada pela mediana de Janeiro (5,08, daria 100 se, além do movimento estacional, « série apresentasse uma tendéncia geral rectilines. No caso prosente tal nko acontece, pois 118,8 >< 95,9 = Isto quer dizer quo 4 série apresenta uma tendancia geral aseendente que convém eliminar. D) Para isso usa-so # expressio 113,9 = 100(1 + 4)" 3,9. em qua @ ¢ 0 erro inicial devido & existénela de uma tendéncia M 210 MANUAL DE ESTATISTICA Quadro n.? 9.17 Céleulo dos indices des flutuagSes estacionais pelo mélodo dos indices em cadeia mensais. Valores curo da pesca desembarcada no Continente @ Ihes, 1897-1937 statietion das Pesoas Maritinas, Parconsegoor Parcentagons. | =m risen Stoatanas | moéient de Taso Irae, cortigidas| Iden, tom. ‘da teadbasta. | Porenntagons secular da media. Janeiro. 889 Fovereica. 3 Margo... 768 Abril 95 Maio... 1045 Junio. 1069 Swho. 2. 1226 Agosto... 113;8 Setembro. . 113 Outubro 16,7 Novembro. « 108,58 Dezembro... . 98,7 geral ascendenta, erro que se vai acumulando até transformar a porcentagem iniciad 100 em 113,9. Resolvendo, vem: log 113,9 ~ log 100 + 12 log (1 + 6) Jog 113,9~log100 _ 0,638.58 _ g 6o4 219 2 2 1-6 =1,0109 = 0,0109. log(L +9) = 6) Para corrigir as percentagons da coluna 3 do efeito da tendéneia geral ascendente, divide-se a percontagem de Fevereiro por 142=1,0109, a de Margo por (1+-6)'=1,0108", @ assim sucessivamente até que a de Dezembro ¢ dividida por {1-+5)"= =1,0100". Gs valores corrigidos estio inscritos na coluna 4 ANALISE DAS SERIES CRONOLUGICAS 21 do quaéro n.° 9.17, Somam-se estes valores @ divide-ne a sua soma por 12. Obtém-se para sua média 112,D. 7} Exprimem-se os valores corrigidos inseritns na coluna 4 em pereentagem da sua média aritmética. Assim, para Janeiro, seri: ‘ 100.0 2 500 = 88,9. 25 Para os restantes meses procede-se de forma idéntica, Os resul- tados obtidos estio inseritos na eoluna 5 do qusdro n° 9.17. Estes resultados constituem os indices das flutnagies estacionais. Todos os métodos apresentados nas secghes anteriores foram aplieados a uma série em que o tipo das flutuagbes estacionais se mantinha constaote através dos anos, isto é, a uma série em que, através dos anos, os pontos de miximo © de minimo calam sempre nos mesmos meses. Além dos métodos apresentados, ha outros aplicaveis a séries em que os puntos de maximo e do minimo niio exiem, através dos anos, nos mesmos meses, Se o leitor se vir em presenga do uma tal série, apliea-lhe um dos métodos anteriormente esta- dados, talvez o das médias méveis, preferide por muitos autores. Todos os métodos omitidos aqui, exigem, para serem aplicados, estatisticos de sdlida preparagio matematica e de treino aturado. Para estos, contudo, nio se destine o presente Livro, 9.21-Eliminagéo da influéncia das flutuagdes estacionais, $e dividirmos os valores originais da série, més a més, pelo indice mensal das flatuagdes estacionais, caleulado nas secgies anteriores, obtemos autra série de valores isentos da influéncia das flutuagies estacionais, mas exibindo—se os tiver —os restantes movimentos. ‘Admitindo que a série apresenta os quatro movimentos men- cionados na seecio 9.2, os seus valores sio coustituidos pelo produto dos quatro movimentos, isto 6, valores originais = Tx Ex OT. Entio o quoeiente : TxExCxTI E =DxCxt ata MANUAL DE ESTATISTICA apresenta os dados originais libertos da influéncia das flotuagdes estacionais mas com a presenca dos trés movimentos restantes. Se 0 nosso objective for pesquizar os valores normais da série @ se esta mostrar 7 (tendéncia geral) além de # (Zlu- toagdes estacionais), consideram-se como valores normals om Tepresentativos, os resultantes do produto Tx<#. Se a série apresentar uma tendéncia geral horizontal (7'= valores origi- nais), os valores normais da série serio os obtidos dividinde 08 valores originais pelo indico das flutuacdes estacionais. O quadro n.° 9.18 apresenta, em conjante, de forma a per- * Quadro n° 9.18 Comperegio dos indices das flutuagées estacionai Foreevta | Poresst® | daaieae | indices stoves | MO |g cies Stn) Mewes [EINNS| anal [Ttocusals | ca gor | sie i daneiro . . ag 802 824 | 889 Feveruiro . « 628 25 | GOs | 18 Margo . 857 asa! atl we Abr. oo. 107 a5 | Re] 195 Maio... 5! 96,0 v4 | 978 | 1045 Junko 7+] wis 1004 | 1002 | 106.9 Sulho 1126 112 | MOT | 1226 Agosto... i nat | 164 | 179 | 1198 Setembro +) daa | 1205 qaig | 183 | 1113 Outubro... . | 1388 | MIS 1430 | 1350 | 116,7 Novembro... | 12L2 | 1932 | 1985 | 4252 | dad | 1085 Dezembro... .| 2049 | 1089 | 105.2 | 1105 | 1081 | 937 Meétias . .| 2000 | 2000 | 1000 | 100.0 | 1000 | 100.0 mitir ama comparagio facil, os indices de flutuactes estacionais ohtidos pelos diferentes métodos descritos nas secges ante- riores. ‘As duas Gitimas colunas apresentam indices calculados pelo método dos indices em cadeia mezsais, com a diferenca de que os da peniltime coluna se referem ao periodo 1925-30 © os da iiltima ao periodo 1807-1937 abrangendo, portante, todas as ANALISE DAS SERIES CRONGLOGICAS m3 observagdes feitas. Nota-se que os indices das cineo primeiras colunas baseados em dados referentes ao periodo 1925-30, nko diferem grandemente entre si, mas que hé nitida diferonga entre todos eles ¢ os da tltima coluna., Pelo facto destos wlt- mos terem sido obtidos com base em todos os dados da série, sio eles os escolhides para aplicagio no quadro n.° G10. ESTUDO DAS FLUTUACOES CICLICAS. 9.22~ Método dos residuos. Do entre os diversos métodos conheridos para o estado das flutusches cfelieas, acupar-nos- -emos sdmente do dos residues. Dos restantes, uns exigem conbecimentos avancados de niatemitica e a outros & inerente a aplicagho de clevada dose de subjeetivismo. Como o sen nome indica, © métode dos residuos toma em conta o resto ou residuo que fica, depois dos valores da série terem sido libertades da influéacia da tendéncia geral ¢ das flutuagtes estacionais. Ia tres procossos para chogar a esses residaos : (3) Comeca-se por eliminar dos dados originais da série, divi- @indo-os pelos indices das Mutuagdes estacionais, a influéneia destas dltimas: TEx Oxi E =TxCxI Obtém-se assim uma série de valores absolutes que se divi- dem pelos valores da tendéneia geral, também nimeros abso~ Tntes: Text > obtendo-se finalmente uma série do valores que se multiplicam por 100 para os exprimir como percentagons. (i) Comega-se por eliminar dos dados originais, a influéneia da tendéneia geral, para o que 86 dividem, més 9 més, as duas séries exprossas om valores absolutos : TxExCxt Tr = Ox =ExCxt aid MANUAL DE ESTATISTICA Obtém-se assim uma série de valores, cada um dos quais s¢ muu!- tiptica por 100 para os exprimir come percentagens. Estas divider-se em seguida pelos indices das flutuagdes estacionais também expressos em percentagens : Exe! osey ficando-se finalmente com uma série de valores, cada um dos quais se multiplica por 100 para os exprimir como percentagens. Comega-se por muitiplieur, més a més, o3 valores da ten- déneia geral expressos em nimeros absolutos, pelos indices das flutuages estacionais expressos em percentagens. Obtém-se T>cE expresso em valores absolutos, a que se di o nome de valores normais ou representatives da série. Quadro a 9.19 Céleulo dos movimentos ciclicos e irregulares. Valores ouro de pesca desembarcada no Continente e lihas, 1930 Origem; Estatistiea das Peseas Mavitimas. () viniors | ao talntites | Ysore | Maite veonoe | ARS | LEME oo gout af Setaneltos | gal panacea |{perreutagons) | - oeeenincens) zo 28. x00 Janeiro. | at ago 638 101d Fevereiro .| 504 8 639 109.9 Margo, . «| 58 763 640, 1070 Abril...) 481 13,5 641 re Maio...) 810 1045 642 120,7 Junko...) 997 106,9 643 15,1 Julbo... 923, 122,6 643 AT? Agosto...) 1051 1138 644 1368 Setembro .| 1.062 m3 645 179 Outubro, «| 1.145 1167 646 1819 Novembro.| 908 108.5 ea7 142.2 Dezombro.| AZ 95,7 648 138,7 ANALISE DAS SERIES CRONOLGGICAS B15 @) . Varoros | Bertomtageut | Indice _ | MeYimentor vaueroa | gaitacancia | 60 | da ftamanter | y imurel ar meeces | ordetnais | SERCH hoaapetn gral] “ctartnai | pote sea [maxcar |S Peso a eee | Seay Janeiro. .| 535 28.9 Fevereiza | B04 Tt Marco. 2. 523 { TS Abril...) 48h i 795 Maio... 810 B42 | 104 Janko. 5 907 os | | 108.9 Julho...) 988 63 1226 Agosta . .| 1051 bat | | nes Setembro .| 1.008 os | | nis Gutabrs. | L145 646 | | 186,7 Novemiro.| 908 az 1085 Dezembro Bae 648 98,7 t / Intis | | Movimerioe wes | onignts | #¥tondlocte | QiSeoonie’ | neonate | yaa) PeEXat Pn fegereemagens)) aren PS Eg | seek bjxt00 aT See ee Janeiro - ots 638 go | so7tee | 101d Fevereiro oot eg | 8. 468,802 409.5 Margo... 523 64 5 HS 488,520 1071 Abril...) 481 eA 195 | 50,595 Maio...) 810 42 1045 | cregun | 1207 Juha, . 6] 997 643 106.9 at) 1450 Julho... 988 613, ya | T8848 | 1179 Agorte 1051 644, 11938 | 768292 | 1368 Seterabs 1.062 643 11g | T1788 | 1479 Outubro, .) 1.148 646 167 | 753882 | 1519 Novembro.) 998 oar wuss | 701985 | 14at Devembro./ 842 | 648 97 | eoTyTe | 138.7 EE 216 MANUAL DE ESTATISTICA Em seguida, os valores originais da série axpressos om némeros absolutos, sio divididos pelos valores normuis também expressos emt mimeros absolutes : Obtém-se, desta forma, uma série de valores que se multiplicam por 100 para os exprimir como percentagens. O quadro a.” 9.19 apresenta os tras métodos uplieados aos dados do ano de 1930. Como se vé, os resultados de Cxt a gue s0 chegeu pelos trés processos, stio, como nko podia deixar de ser, iguais, salvo num ou noutro decimal, como resultada das contas. ‘A escolha do método a aplicar depende do objective a atinjir. Se se pretende chegar simplesmente ao estedo das fiutuagies ciclico-irregulares, 0 terceiro método deve ser o preferide. Se, porém, se pretendem também estudar os dados originais libertas da influéncia das flutuagdes estacionais, 9 primeiro metodo 6 o indicado. On, se se pretendem também estudar og dados originals libertos da influéneia da tendéncia geral, o segundo métode deve ser o escalhido. 9.23-Comparacgao de movimentos ciclicos. Disse-se atras que, muitas vezes, se empreonde a anilise das séries cronolé- gieas com o objective final de estudar as suas variagtes efclicas 6 de as comparar com as de outra série. Ao comparar duas séries eronolégicas (ambas libertas da influéacia da tendéncia geral e das flutuagdes estacionais) acon- tece om regra que uma das séries apresenta oseilagdes de ampli- tude maior do que a outra. Este facto torna dificil a comparagiio dos movimentos das duas séries, motive por que se torna neces- irio reduzir ambas a termos compardveis, Para isso, 6 habito dividir os residuos a que se chegou na secg%o anterior pelo desvio padréo de cada série, pritica a que, no entanto, se tim levantado sérias objecgdes de natureza taérica. O quadro n.° 9.20 mostra a forma como se obtém os elementos necessitios para 2 doterminagio do desvio padrio. Este qnadro apresenta, a ANALISE DAS SERIES CRONOLOGICAS 217 titulo ilustrativo, somente o ano de 1930. A férmula seguiate : fornece o valor do desvio padrio. A ilfima coluas do quadro ne 9.20 apresenta os desvios expressos em fungio do desvio padrio. Quadro n.” 9.20 Céleulo dos desvios dos valores ciclico-esporadicos. Valores ouro ds pesca desembarceda no Continente ¢ Hihas, 1930 Origem: Ketatistion des Pesear Maritimes Poreetexott | Ditersugae Desvios Mesos Gos moviniwos | pura 28 x? em relacho ae € Inegutar x | ent 859 Janeiro qo 196 | 0073 Fevereiro. . 9801) 0518 2249 | 0,298 428,49 2.025,00 320,01 18H,88 2.29441 2.608.681. | 5041 | O37 1.780.841 | O caminho indicado, a titulo exemplificativ, so para um ano, 6 seguido para as duas séries a comparar. Desta forma, pois, 80 obtém os desvios das duas séries em fang2o dos respectivos desvios padroes. Siio estes valores (numéricos © grificos, para o que se constrol, & partir dos valores numéricos, um grifico mostrando os desvios 218 MANUAL DE ESTATISTICA das séries om fungi dos respectivos os} que, em goral, se utili: zam para o estudo dos movimentos ciclicos, considerando-se como um cielo toda uma oseilagio de pico a pico, abrangendo por consequencia, as yuatre fases: doprossio, ponte de minimo, reenperagio, ¢ ponto de maxime. Apesar de em cada ciclo as diferentes fases se apresentarem sempre numa sucessio ordenada, niio existe regularidade no movimento ondulatério. Com efeito, pode acontecer que na mesma série wm cielo dure 3 anos, ontro 5, outro 8, ete. Pode. ainda acontecer que um poato de maximo seja duns vezes mais alto do que outro, ou ainda que um ciclo apresente uma subida ripida e uma descida suave, @ outro, possivelmente a seguir, uma subida sudve e uma descida rapida. Esta falta de unifor- midade no quo respeita, quer ao comprimento, quer 4 amplitude, quer ainda 4 forma das flutuagdes ciclicas do uma série erono- légica de uatareza econdmica, impede a aplieagio, com resal- tados satisfatérios, dos métodos matemiaticos que to tteis sio no estude dos movimentos vibratérios, em Fisica. CORRELAGAO DE SERIES CRONOLOGICAS. 9.24—Generalidades. Na andlise que até aqui tem sido feita das séries eronolégicas, temo-nes ocupade do estndo de cada série em particular ©, principalmente, do estudo dos dife- rentes movimentos existentes nessas séries. Se quisermos estudar a correlagio entre duas séries eronold- gicas, surgem novos problemas que impossibilitam @ uplicagio, pura o simples, aos dados das séries originais, dos métodos de eorrelagio estudados nos eapitulos 5 a 7. Com efeito, além das causas especificas do fendmeno, podem a tendéncia geral, ag flatuagtes estacionais, as oseilagses cfclieas @ quaisquer movimentos esporddicos, ocasionar variagdes nos valores do fendmeno. Estas causas estranhas podem viciar os resultados da correlagio, levando a tirar conclasdes falsas. © estudo da correlagie de duas séries eronolégicas pode fazer-se por dois processos : (i) expurgam-se os dados originals ANALISE DAS SERIES CRONOLGGICAS 218 da influéneia da tendéneia geral e, se os dados forem mensais, da influéneia das flutaagdes estacionais. Quer dizer, utilizam-se conto dados para cada série, os valores residuais ciclico-espori- dicos depois de devidamente expressos em fungiio do desvio padriio respective, A técnica da obtengho destes dados foi estudada nas seegies antoriores. Em seguida, aos dados assim obtidos, aplica-se a téeniea da correlagio simples, estudada nos capitulos 5 6 6. (ii} Considera-se © tempo como una variivel, iransformando, desta forma, 9 problema de correlagio simples num de correlagiie multipla, pois passa a haver tres variveis. Neste caso, os dados nie precisa de qualquer preparacio prévia, isto 6, utilizam-se os dados originalmente fornecidos, apenas depois de soierem qualquer das preparagtes indieadas na seegio $4 A tévnica deste caso (ii) que é a das correlagies miltiples @ pareiais, foi estudada no rapitulo 7. 9.25-Correlac3o simples, Simente a titulo recapitulative, descraveremos agui a marcha a seguir na resolagio de um problema de correlagio entre duas séries eronolégieas pelo procosso (i) indicado na secgio anterior. Suponlumos que nos siio dadas duas séries eronoligieas: X e Y. Em gerai, nestes problemas, traballia-se com dados anusis, motivo por que nas consideragtes que se seguem, so Jari refe- réncia sdmente & tendéncia geral. No entanto, se os dados se referirem a perfodos menores do que o ano, bi que eontar com as flutnagties estucionais, Neste enso, onde nas consideragies que so seguem, so faz referéneia & tendéncia geral, deve ler-se também flutuagies estacionais. Entio : 1) Preparam-se os dados, se for caso disso, como foi indieado ha seegia 9.4, 2) Estuda-se a tendéneia geral dos valores resaltantes. A escolha da forma de obtengio dos valores da tendéncia geral deve ser feita com o maior cuidado, mas em geral intro- duz no problema um elemento subjectivo que nao deve ser esquecido ao analisar os resultados. Contudo, aplicando os métedos de eseolha atras estudados (seecio 9.5) chega-se a conseguir um tipo satisfatério, Desta forma se obtém og valo- ves dados polas tendéncias gerais das duas séries: X, e Y,. 220 MANUAL DE ESTATISTICA 3) Procede-se & oliminagio da tendéncia geral por qualquer dos métodos indicados na seecio 9.15, fazendo, por exemplo: X—X. xX Assim se obtiveram, eliminada a influéneia da tendéncia geral {e uma vez que se usam dados annais} os valores (em percen- tagem) dos movimentos clelico-esporadicos, isto é, valores da mosma natureza, embora obtides por processo diferente, dos inserios na coluna 2 do quadro n.° 9.20, © resto do caleulo sogne como neste quadro a.° 9.20: 4) Calculam-se, para cada série, us diferengas a’ e y' entre os valores obtidos na alinea anterior 6 100: Somam-se estas dife- rongas @ obtém-se S(e"} ¢ S(y'): 5) Blevam-se xo quadrado os valores assim calculados. Somam-se e obtim-so Six") e S(y"*}s 6) Caleutan-se os desvins padrdos de cada série por meio das formulas: am +100 e@ y= 1) Dividem-so os valores a’ ¢ y obtidos na alines 4), rospec- tivamento, por a, @ oy. Designemos = por a" e 2 por y". Colunam-se estes quocientes 2” e y" tal como se fox aa ultima coluna do quadro n.? 9.20. 8) Colunsm-s os produtos, ano a ano, de a! por gy". Semam-se estes produtos e obtém-se 8 (2"' y"). 9) Caleula-se 0 coeficionte de correlagio Sex? Em geral, og coeficientes de correlagio sio baseados em medidas tomadas a partir da média aritmética. Nas séries erono- Jogicas, como vimos, as medidas sio tomadas a partir da linhs de tendéneia geral que, sendo obtida matematicamente pelo método dos menores quadrados, apresenta uma soma dos desvios ANALISE DAS SERIES CRONOLOGICAS at contados a partir dela, que 6 minima (@ que pode ser zero no caso do ajustamento ser bom). Por iss, nas férmalas acima substituiram-se os desvios contados a partir da média aritmétioa pelos contados a partir da linha de tendéncia eral. Temos até aqui cousiderado o caso da tendéncia geral ter sido determinada pelo método dos minimos quadrados. No caso do método empregado na determinacio da tendéacia geral ter sido o das médias méveis (que nio usa o métode dos menores quadrados) a marcha na resolugio de um problema de corre- lngéo 6 Tigeivamente diferente da anterior. Assim : 1} Preparam-se os dados, se for caso disso, como so indicou ba secgio 14. 2) Com os valores resultantes, X ¢ ¥, © pelo processo das médias méveis, determinum-se duas séries de valores X, e ¥,. Deve haver 9 maior cuidado na escalha do perioda nsado na determinacio das médias méveis, mas emi tndo o caso, uma grande dose de sobjectivisme 6 introduzida, a qual ten de ser lovada em conta ao analisar os resultados. 3) Elimina-se a influénein da tendéncia geral por qualquer dos métodgs indieados na socgio 9.15, fazondo, por oxemplo: ¥, Colunam-so os valores we y assim obtidos. Somam-s do-4e Sf) e S(y). 4) Calculam-se as médias aritmétieas : S@) , 7-8) N v onde @ @ y sio 08 valores obtidos como foi indieade na alineu 3). 5) Ano a ano 6 para cada série, fazom-se as diferengas : gaa 0 ¥ay—y Somam-so estas diferengas © obtém-se S(z') ¢ S(y'). 6} Elevam-se 20 quadrado os valores assim obtidos, colu- nam-se os quadrados, somam-se e obtém-se: S{z"*) @ Si’). 222 MANUAL DE ESTATISTICA 7) Caleulam-se os desvios padrtes de cada série por meio das formmlas : Vs ey PSeyy [2S {yf eo 4, pf) y_ ~ (Sey VW 8) Dividem-se os valores 2 ¢ 7 obtides como foi indieado na alinea 5), por 9, € 6,, respectiramento, obtendo-se uns valores que designamos por a @ y' © qué calunamos. 9) Ano a ano, efectuam-se os produtes de a por y". Colu- nam-se estes produtos, somam-se @ obténi-se S(x” 2"). 10) Caleula-se 0 eoeficiente de correlagio S(a'y") © calenlo de r, tal como tem sido feito nesta secgio, esti. sujeito sérias Hmitagdes. Em primeira lugar, r sé deve ser calenlado se uma comparaciio grafiea das duas séries que se pretenem correlacionar {valores obtides na alfmea 3) acima) no reyelar que elus aprescntum movimentes eiclicos desencon- trados. Em segundo lugar, é necessiria que o perlodo usade para o céleulo de + seja o mesmo que foi atilizado no caleulo das tendéneias gerais das duas séries. 9.26~Correlag3o parcial. O problema do estudo da corre- Jacho entre duas séries cronolégicas pode ser atacade de outra forme: considerando o tempo come wma variivel, transforma-se o estudo de uma correlagio simples, num de correlagde parcial. © trabalho talvez seja menor visto que a correlacha pode ser estudada imediatamente depois dos dades proviamente prepa- rados como foi indieado na seegio 0.4, Nido ha, como houve na seecho anterior, necessidade de determinar os res{duas efclica- -esporddicos a partir dos quais se calculou a correlacho. A téenica da resolugio de um problema de correlago entre duas séries cronolégicas por este método, que corresponde afinal, & resvlugio de um problema de correlagio parcial a trés varid- veis, niio difere da estadads no capitulo 7 e, por isso, ao seré aqui repetida. ANALISE DAS SERIES CRONOLOGICAS 233 9.27-Medi¢so do atrezo de uma série em relacao 3 outra, Nas trés seegtes anteriorés estudémos o grau em qne os ciclos de uma série dependem de, ou refletom, os da outra, suponde, por consequéncia, qualquer relagia funeional entre elas. Mas o estudo da correlagio entra os ciclos ecandémicos das séries dadas pode ter outro objective: supondo que as duns séries apresentam eciclos definidos, é interessante determinar se os ciclos de ambas coinvidem no tempu, ou se 08 ciclos de ama precedem on seguem os da otra, Este problema consiste, pois, na medigio de uma relagio meramente temporal entre as duas série. Este método, esta aplieacio do cacficiente de correlacko so estudo da desfazagem entre duas séries é muito itil, mas deve haver o maior cuidada ao interpretar os seus resultados. Os cooficientes de correlagio sio ealenlades como foi indi- eado na seerio 9.25, tendo em atem se os valores da tendén- cia geral sie, on ao, cbtidos por meio de um processa que use © método dos menores qaadrados. 0 primsiro cocficients de eorvelagia a caicalar utiliza N pares de valores: todos os valores da variivel X, de Ny a Xy 6 todos os valores da varidvel F, de Y; a Fy, O segunds coeficiente a caleular utiliza N—1 pares de valores: de Xia Xy4 con- jugados com os de Vz a Yy. O terceiro eneficionte utiliza N-~-2 pares de valores: de a Ny conjugades com os de Yy a Fy. EB assim sucessivamente, Com um valor a menos do cada série, de cada vez, caleulam-se ao todo, tantos coeficientos de correlagio, quantos os anos x que insream © eiele econd- mieo. Desta forma, obt@m-se 2 coeficientes de correlacio de magnitude diferente, caja inspecgio {que pode ser facilitada pela representacio grifica) permite tirar conclustes acerca do problema em estudo: quantos anos ou meses, conforme os dados indicarom, uma série precede, em média, a outra. B evidente que a cada cooficiente de correlagho corresponde wo destes nimeros de anos ou meses. De entre eles deve escolher-se aguele cujo coeficiente de corrolagio for mais ele- vade, © valor maximo de r indica, pois, a verdadeira dosfa- 222 MANUAL DE ESTATISTICA 1) Caleulam-se os desvios padrdes de cada série por meio das formnlas : 8) Dividem-se os valores x‘ © y' obtidos como fai indicado na allnea 5), por 9,6 9,, respectivamente, obtendo-se uns valoros que designamos por z" 6 ye que colunamos. 9) Ano a ano, efectuam-so os produtes de a” por #'. Colu- nam-se estes produtos, somam-se e obtém-se S(x" y". 10) Caleula-se o coeficiente de correlagio ZY) O cdlenlo de 7, tal coma tem sido feito nesta secgilo, estd sujeito a sérius limitagdes. Em primeiro lugar, + sé deve ser ealealado se uma comparagio grifiea das duas séries que se Pretendem correlacionar (valores obtidos na alinea 3) acima) nio reveler que elas apresentam movimentus ciclicos desoneon- trates. Eu, segundo lugar, 6 neeessiric que 0 perfodo usado para o caleulo de r seja o mesmo que foi utilizado no calealo das teadéneias gerais das duas séries, 9.26 -Correlacdo parcial. © problema do estudo da corre- jagio entre duas séries cronolégicas pode ser atacado de outra forma: considerando 0 tempa como uma variivel, transforma-se © estudo de uma correlagio simples, num de correlacio parcial. © trabalho talvez seja menor visto que a correlacio pode ser estudada imediatamente depois dos dados préviamente prepa- rados como foi indieado na secgio 9.4. Nao ha, como houve na seegio anterior, necessidade de determinar os residuns ¢fclica- -esporidicos a partir dos quais se caleulou a correlagio. A técnica da resolugio de um problema de correlagio entre duas séries cronoldgicas por este método, que correspande afinal, 4 resolugiio de um problema de correlagio parcial a ts vari veis, nfio difere da estudada no capitulo 7 e, por isso, nio seré aqui repetida. ANALISE DAS SERIES CRONOLOGICAS 233 9.27-Medic3o do atrazo de uma série em relagdo 8 oulre, Nas trés secgtes anteriores estadimos o grau em que os ciclos de uma série dependem de, ou refletem, os da owtra, supondo, por couseyuéncia, qualquer relucio funcional entre elas, Mas o estudo da correlagio entre os ciclos econémicos das séries dadas pode ter outro objective: supondo que as duas séries apresentam ciclos definidos, é interessante determinar se os ciclos de ambas coincidem na tempy, ou se os ciclos de uma precederm ou seguem os da outra. Este problema consiste, pais, na medigio do uma relagio meramente temporal entre as duas aéries. Este método, esta aplicagiio do cooficiente de carrelagio a0 estudo da desfazagem entre duas séries 6 muito util, mas deve haver o maior cuidade av interpretar os seus resultados. Qs eoeficientes de correlagio sic calculados como foi indi. cado na secede 9.25, tendo em atengio se os valores da tendén- cia geral sio, ou nfo, obtidos por meio de um precesso que use 0 método dos menores quadrados. O priweiro eveficiente de correlagio a caleular utiliza NV’ pares do valores: todos os valores da variivel X, de Xy a Ay e todos os valores da variivel ¥, de Fi a ¥y. O segundo cooficiente a caleular utiliza N—1 pares de valores: de X, a Xaa com- jugados com os de ¥; a Yy. O tereeiro coeficiente utiliza N—-2 pares de valores: de X a Nye conjugados com os de Ys a ¥y. E assim sucessivamente. Com um valor a menos de cada série, de cada vez, calculam-se ao todo, tantos coeficientes de correlagio, quantos os anos m que maream o ciclo econd- mico, Desta forms, obtém-se nr cooficiontes de eorrelagio de magnitude diferente, caja inspeceio (que pode ser facilitada pola representagio grifica) permite trar conclasdes acerca do problema em estudo: quantos anos ou meses, conforme os dados indicarem, uma série precede, em média, a outra, E evidente que a cada cocficiente de correlagio corresponde um destes nimeres de anos ou meses, De entre eles deve escolker-se aquele cajo coeficiente de correlagie for mais ele- vado. O valor miximo de r indica, pois, a verdadeira desfa- Bek MANUAL DE ESTATISTICA zagem de uma série para com a outra, dentro do periodo estu- dado. Esta restrigzo ¢ mito importante, pois pode acontecer que dentro de um periodo diferente do usado para o ciiculo dos coeficientes de correlagio, haja variaghe na sequéncia das séries, quer dizer, pode a série que precede durante un certo periodo, ser a que segue noutro period, ou pode ainds haver coineidéncia das duas séries noutro perfodo. CAPITULO 10 AJUSTAMENTO DE CURVAS 10.1-Nogéo de probabilidade. Se um acontecimento se pode dar den formas, das quais f sfo favoriveis e d=u—j so desfuvoriveis ao son aparecimento, a probabilidade p de ¢ ucon- tecimento aparecer uma vez, &: Isto 6, a probabilidade de um acontecimenta & igual ao quo- cionte do nimero de casos favoraveis pelo nitmero total de easos em que ele se pode dar, supondo estes filtimos todos igualmente possiveis. A probabilidade contrdria qner dizer, a probubilidade de o acontecimento nio se dar uma vez, 6: gett Quase toda a gente conheco o jogo do loto. Para o jogar ha um certo nimero, miltiplo de 10, de bolas, todas nume- radas com niimeros. que, forgosamente, hio-de ter uma das terminagies 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Suponkamos as bolas dentro, aio de um saquinbo, mas de unia eaixa rigida fechada, tal que, sendo agitada, a mistura das bolas nio seja de forma alguma impedida. Suponhamos que, depois de agitada a caixa, extraimos, sem ver nem apalpar, uma bola, Atendendo a que-—é bom nis esquect-Jo—o mimero de bolas 6 miltiplo do 10, a bole extraida pode ter qualquer uma das terminagies cima citadss. 1% 226 MANUAL DE ESTATISTICA E, pois, n=10. Consideremos uma das terminaghes, por exemplo, o 3, Uma vez gue bd uma 86 extraccio, 0 nimero de casos favordveis ao aparecimento do 3 (como, de resto, a qualquer outra terminagio) ¢, evidentemonte, i, Entio a probabilidade de que, numa extraccio de uma bola, saia o 3, 6: A soma dos casos fayoraveis com os desfaroraveis 6 igual ao mimero de casos possivels : feden 14+9= 10, A soma da probahilidade do um acoatecimento com a proba- dilidade contriria ao mesmo, é igual & unidado: peq=l ou Fiala, ar No caso presente: 1,9 =4+5=1 107 10 A probabilidade de gue, na extracgio de uma Bola saia a terminagio 3 ow a 4, 6: i 10 visto ser a probabilidade de cada uma das formas por que o acontecimento (aparecimento da terminagio 3 ou da terminagio 4) se pode dar. Ha, nesta caso, um conceito de incompatibi- lidade eatre as duas formas do acontecimento. Trata-se de uma probabilidade total. AIUSTAMENTO DE CURVAS eT ‘A probabilidade de que, em duas extracgbes seguidas de wma bala de eada voz, saia a terminaglo 3 soguida da 4, + 1 1 ae 10°10 ‘Trata-se de um acentecimento composto de dois acontecimentos independentes am do ontro, De facto, 9 aparecimente da termi- nugio 3 n&o influancia de forma alguma o aparecimento da 4 na extraccio seguinte, Estamos em fuce de uma probabilidade composta, - Estudemos agora a extracgia simultinea de 2 bstas. Consi- deramos como sucesso 9 0 aparecimento de um senor {termina- ches 0, 1, 2, 8, 4) e como insucesso ¢ ¢ aparecimento de um maior (terminagtes 5, 6, 7, 8, 9}. Na sequéncia das duas extracgdes pode aparecer um sucesso seguido de outro sucesso, um sucesso seguido de um insucesso, um insneasso seguide de um sucesso, on um insucesso seguido de outro insucesso, isto 6+ sa stots it Ora, a probabiiidade do aparesimento de um sneesso, isto 6, da terminagio 0 on da termiangio 1 ow da terminagio 2 ow da terminagie 8 ow da terminagio 4 6, visto tratar-se de uma proba- bilidade total: 1o1,1,1,1 et ity hl P=T5T io” i" 107 10 Pela mesma razko, a probabilidade de um inswcesso 6, também : 1,i,4,3,1 5.1 on Por outro lado, a probabilidads do que, em duas extracgies seguidas saia um sucesso seguido de outre sucesso 6, visto tratar-se de uma probabilidade composta: 1a 1 PRPR SX 238 MANUAL DE ESTALISTICA Pela mesma razio, a probabilidade de que saia um menor s seguide de um maior i 6: a de que saia um maior ¢ seguido do um menor s é: 1 (xP=OXZR 7 ea do que saia um maior ¢ seguide de outro maior ¢ 6: _it a_i T 2 . aay die onde a expressto anterior tomar a forma (Cas 2) » Mas sto desenvolvimento aplica-se a quaisquor valores de p © de g. Suponhamos, por exemplo, que eonsiderivamos como sucess * > aparecimento das terminagses 0 ov 1 om 2, © como ipsa cessa i © aparecimento das terminagdes Bou 4 on D an & ou 7 ow 8 o« 9. Quer no caso do sucesso quer no do insn- cass, estamos em face de probabilidades totais, em que a probabilidade de cada parcela 6 = Loge, a probabilidade de se dar um sucesso 5 6: 230 MANUAL DE ESTATISTICA ea dese dar i é: g-i-3.! # wo io ou, obtida de outra forma: pedo hi ty d db at Jyh iit. O10 107 17 Wo 1 10 Neste caso, a formula acirea tomaria a forma: a T\" STN (i in) As probabilidades a que até agora nos temas referido 20 coubecidas de antemio om face dos dados do problema. Sie prubabitidades a priori, Com efvito, antes de extrair ama bola j& se sabe que a probabilidade de que suia deter- - 1 . a muiuada terminagio €2—. Mas hi casos em qe « probabilidade do avontecimento niio é conhecida a priori. Nao se pode, por exemplo, saber a priori qual a probabilidade de haver num certo ano @ numa certa regiio semanas com sete dias de chuva. Em casos como este langa-se mio da chamada proba- bitidade estatistica ou probabilidade a posteriori, quer dizer, determinn-se a probabilidade do acontecimento depuis de se saber guantas vezes ele se den. Isto no quer dizer que nio se use tambum a probabili dade estatistica quando se conhece a probabilidade a priori. © uso da probabilidade tedrica ou a prior? serve para veri- ficar os resultados obtides por meio da probabilidade observada a posteriovi, Na pratica constata-se que, quanto maior for o mimoro de provas, mais a probabilidade estatistica, também chamada frequéncia relativa, se aproxima da probabilidade tos- rica. Dagui o dizer-se que & medida que 0 mimero de provas aumenta, a frequincia tende para a probabilidade, enanciado a que se di o nome de let dos grandes nitmeros on tet empirica de acaso. AJUSTAMENTO DE CURVAS 231 10.2-A distribuico binomial. O ajustsmento de curvas. Como se viu na secgko anterior, o desenvolvimento da expres- sio N(p +g)" da, por ordem, as froquéneias proviveis de n sucessos, n — 1 sncessos © 1 insucesso, n — 2 sucessos @ 2 insu- cesses, otc. No caso geral, o desenvolvimento daquela expres- sio da: N [ph np rig MD ) n(a—1)(n—2 ir PA gan bg. Ao polfgono que liga entre si os valores das frequéncias dadas polo desenvolvimento do bindmio, di-se « nome de psli- gona binomial ow, mais frequentomente, de cura binomial. Esta curva é simétrica so pg = z, Se p#q 4 assimétrica. Se p>g é assimétrica positiva, Se p Fesxtdog;, ony /extxiuysutau. © grafico n.° 101 apresenta o poligono das frequéneias tedrieas © 0 histograma das froquéneias reais na experiéncia feita, Vé-se que o segundo é um poueo envieznda & direita, AJUSTAMENT@G DE CURVAS 233 Isto mostra que a experitacia feita com o jogo do loto deu frequéncias algum tanto desviadas das tedricas, ou porque as condigdes em que a experigncia foi reslizada nio foram boas, GRAEICO Ne 10-1 DISTRIBUIGKO DUS "MAIONES” SRIDOS 2M 256 EXTAACHES BE @“BOLAS” DE Lito, DOLIGOMO DAS EREQUENCIAS TEDRICAS C RISTOGRAMA DAS FREQUENCIAS REM oem EXPERIMENTAL mL > — TEARICO NUMERO DE extnacies a ow s 3 wo S 8 7 6 &§ 4 3 2 ££ 0 NUMERO DE MAIORES on entio porque o jogo do loto, pela configuragio das suas bolas nio 6 um jogo de acaso on de azar. No exemplo anterior nao fizemos mais do que ajustar uma curva binomial a wma distribuigio de frequéncias. O ajusta- mento de curvas a distribuigbes de frequencius fornecidas pode 234 MANUAL DE ESTAVISTICA favor-se com objectives varios. Assim, pode ser: (i) para fazer desapareeer as irrgularidades do poligono do frequéncias obser- vadas, substituindo-o por uma eurva regular; ou (ii) para encontrar wna formula ligando as duas variaveis (X © Y) da distribaigtio dada, de forma tal que se possa calenler qualquer valor de Y correspondente a qualquer valor de X. Este tipo de distribuigio binomial é bom para a ele se ajus- tarem dados de variiveis descontinuas. Exemplifiquenos com o mimore do dias de ehuva por semana em Ponta Delgada, nos anos de 1940 a 1942. Quadro n.” 10.2 Dias de chuve, por semana, em Ponte Delgada, nos anos de i940 01942 Céiculo da méd tice ede x Origem : Anais do Oiseroatirin Central Meteoroldgiee da Infante D. Luis, Il Parte: Observagies das FstaySes Meteorolégicas, 1940, 1941 e 1942. x f Nimore da | Néimero : ins de chuva de fx por wea t . (fsa foi} Gant |e z 4 98 a | ta6 390 [ 301,00 | 22,6 5 2 | 1a — 82) 07,84 20 4 ar | 1s —18j1 | 827,64 1B 3 28 Bt — 89] 79,91 2a 2 23. 26 1 10 10 162| 2244 | 110 0 O camivhe a seguir para fazer o ajustamento 6: 1) Caleula-se a média aritmética dos valores fornecides, No caso preseate ¢ ¥=8,8516. HB este o mimero de casos favord- AJUSTAMENTO DE CURVAS — 235 veis. O miimero de casos possiveis é 7. Logo, a probahilidade de que haja 1 dia de chuva por semana, é: 88916 _ o.sp02 =p; g =1—p = O4498. 2) Procede-se a0 desenvolvimente ds binomial Nip tay que, no caso presente, da: 156 (0,5502 + 0.4498)’ = 155 (0,9002"+. 7 >< 0,502 >< >< 04498 ++ 21 >< 0,5502" >< 0.4408" 4. BB >< 0,85028 > >< 0.4498". 85 >< 0,5502" >< 0,498" 4 21 >< 05802" >< >< 0,4498'-4. T>< 0,5502 < 0,4498"+ 0,44987) © cileulo deste paréntesis faz-se vantajosumente, organizando um quadro come o Quadro n° 16.3 Cdlculo dos termos do di 155 (0,5502 j vols > aaue® | Coeftsien | peck 45¢ | ool. aad. we | Rane oanse 236 | ons | 15,66 e212 | 33,90 e205 | 45,08 eps | 35,89 ene | 1828 ooae2 499 6,0087 Opt No caleulo das diversas poténcias de 0,5502 © de 04498" usou-se a miquina de caleular. Se isso nko tivesse acontecido, utilizar-se-iam loguritmos o que no modificaria substancial- mente o quadro. Apenas haveria quo o tornar maior, pois as colunzs 2 © 4 niio seriam obtidas diroctamente. 236 MANUAL DE ESTATISTICA ‘A altima coluna do guadro n.° 10.3 da o desenvolvimento da expressio (0,5502 + 6,498). O chamado triingulo de Paseal fornece um rétodo pritico para a doterminagtio dos coeficiontes de pg no desenvolvimento de formula do biadmnio (os mencionados na culuna 5 do que- @ro n.? 10.3). Assim: 1 eoeficientes de desonvelvimento de (p + 9) 1 6 idem de (p + 9) 2 idem de (p + 9° 1 idem de (p+ 9 i idem de {p -+ g)' 1 idem de (p+ q 16 idem de (p+ qi 17 2 idem de (p-+ 9) O triingulo de Pascal pode ser continuads indefenidamente. ‘A sua formagio 6 simples. Os nimeros dos vértices, bem como todos ox de dois lados do tridngulo, sio sempre 1. Os da segunda Yinha também sio 1. Cada wm dos nitmeros restantes acha-s6 sorando os dois mimeros da linha imediatamente superior entre os quais fica situado. Para valores muito altos de n seria incémode constrnir um enorme triéngulo. Neste caso, qualquer coeficiente “C, 6 dado pela expressiio: nt pita—p}! em que x! se Je factorial de ” @ é igual a0 prodato dos x pri- ameiras mimeros inteiros. Qualquer que seja o bindmio, tem-se, no seu desenvolvimento, os soguistes cooficientes : "O21 he Oss No caso conereto anterior, o eveficiente do terceiro termo, por exemplo, seria "Cs (visto 0 do primeiro termo ser "Cs): “6, pps "Ena = 3 “Ce ix6xix4x3><2x1 =a (2x1) (5 49<3 x 2>< 1) . AJUSTAMENTO DE CURVAS 27 Tal come fot eserita : (pq), 2 expressio binomial da, por ordem decresconte, as frequineias provaveis da sequtncia do nimero de sucessos, @ por ordem crescenta, as frequéncias proviveis da sequineia do mimero de insucessos. So tivesse sido escrita (q-+p) (@ podia ter side), daria, por ordem eres- conte, as frequéacias proviveis dos sucessos e por ordem decrescente, as frequéncias provaveis dos insucexsos. © grafico n.° 10.2 compara as frequéncias dadas pola expe- riéncia com as teérieas. 3) Caleula-se uma modida do gran do ajustamento, semelhante Avaridneia. Chama-se qui-guadrado ¢ tom a seguinte exprossio : - [ite] Para o sou cileulo, faz-s 2) No quadro a." 10.2, efectuam-sa, linha a linha, as dife- rengas entre as fraqnéncias experimentais (eotuna 2) @ as calculadas f, (coluna4). Colunar-se ossas diferencas. Somam-se. A sua soma deve ser zero, Sobre o {° tam grande influtneia as diferengas entre pequenas froquineias. Por isso, se existirom pequenas freqa’ncias nas extremidades das distribuigdes, sio as mesmas combinadas de forma que cada grupo contenba wma freyuéneia caleulada, superior a 5. No quadro n.° 10.2 mos- tra-se como s6 procede. Como o primeira grupo tom uma frequéncia inferior a 5, fol a mesma agregada & do segundo grapo. Pela mesma razio, agregaram-se as frequéncias dos trés dltimos grapos da distribaigio. 4) Linha a linha, elevam-se essas diferengas ao quadrado, e) Linha a linka, divide-se (f—f}' por f,. Somam-se estes quocientes e obtém-se o valor de 4°, no nosso caso: 45. @) O grau de ajustamento é indicado no Aptndice A pela leitura do valor ds x! combinado com o nimero v, nin, de graus de liberdade. © nimero de graus de iberdade ¢ igual ae mimero de valores, classes ow desvios (conforme os casos), menos o nimero de constantas que foram caleuladas 6 utili- zadas no ajustamento. 238 MANUAL DE ESTATISTICA GRAFICO No 19-2 DISTRIBUIGTD DO HUMEAG DE BIAS DE CHUVA EM ISS SEMANAS EM PUNTA DELGADA. DOLIGONO DAS FREQUENCHAS TEGRICAS E WISTOGRAMA DAS FREQUENCIAS REAIS, EXPERIMENTAL weno TEGRiCe 40 we s 20 HGMCRO DE SEMANAS 7 6 5 4 3 2 4 0 MOMERG Df DIAS OE CHUWA po SEMANA No case presente, o némero final do classes no quadro n” 10.2 4 de 5, O niimero de graus de liberdade perdido foi de 2, pois Ne p, calculados s partir da distribnigho dada, foram utilizados para o ajustamento da curva. Lago, sogne-se que y~-5—2 No Apeadico A, na linha corres- AFUSTAMENTO DE UCURVAS 259 pondente a y= procura-se Y=45. Vé-se que o valor mais elerado nela inserito é 11,341 correspondente a P=0,01. No quadro nio esta inscrito, na linha de »=3, 0 valor do £=45, © se o ostivesse, ele corresponderia a um valor do P que soria muito pequeno. Dagui pode concluir-se que a binomial utilizada constitui um mau ajustamento A distribuigio dada o que, até certo panto, JA podia ser coneluido a partir do grafico n.° 10.2. Para um dado nimero de graus de liberdade, quanto maior for 7%, on, 0 que 6 0 mesmo, quanto menor for P, pier 60 ajustamento obtide. Quando o valor de P for ignal ou supe- rior a 0,05 pode dizer-se que o ajustamento ¢ satisfatirin. Quando P for inferior a 0,05 pode dizer-se quo o ajustamenta 6 mau, Esta regra, que pecs pela sua inflexihilidade, toma como pouto divisério o de 5 por cento. Quer dizer no ease presente que, se a distribaigdo dada segnisse realmente a bino- mial, haveria uma probabilidade de 5 por cento de que o valor de 2 encontrado (45) fosse igual ou exeedesse o valor de 7 dade no Apendive A ua coluna e linha respectivas (7,815). Os exemplos até aqui dudes referem-se a yariivels deseontl- nuas, Nio se devem ajustar distribnigaes de variivels coutinmas 4 curvas binomiais, 0 que nio significa que: (i) as eurvas bino- minis se adaptem todas as distribuigdes de frequéncias de variaveis descontinaas ; 0 (ii) as séries descontinuas niio possam ser ajustadas a outros tipos de curvas. 10.3-A distribuiggo normal. A curva normal do erro. ‘Nas secgdes anteriores vimos que dados » acontecimentos inde- pendentes, nos quais a probabilidade de um sucesso é dada por p @ ade um insucesso por g=1—p, as freyuincias provaveis da sequéncia do nimera de sueessos, sio dadas pelo desenvolyi- mento da expressi . (p+ a. Também caloulémos as frequéncias tedricas no caso de page= x e de n=8, , desenhimos {grafico a.° 10.1) a curva Binomial respectiva. Obsorvamos que os seus 8 lados formam ume figura simétrica em relagie « uma ordenada central maxima. 240 MANUAL DE ESTATISTICA Se naquela expresso n tender para infinito, no grafico res- pectiva o nuimero de lados do poligono binomiat tonde para infinitamente grande e partanto o tamanho dos mesmes, para infinitamente pequeno. Entio, o poligono transformar-se-4 numa curva coatinua, sem éngulos. A expressiio desta eurva podo ser: onde: y= Ree y 6 0 valor de oma ordenada & distincia « da média aritmética 5 y, 60 valor da ordenada central maxima: WN &o numero de abservaches (ou de valores da variavel) ; é 8 0 intervalo de classe; & 60 desvio padrio da série dada: x 6a constante 3,1416 e 6 @ constante 2,71828 base do sistema de logaritmos nepe- rianas ; x 6 qaalquer desvio contado da média aritmética, ‘A esta curva chama-se curva normal de probabilidade, curva normal do erro, curva de Gauss, ou sitplesmente curva normal. De que atris dissemos conelui-se que os resultados do expe- riéneias de langamentos de dados, de moedas, etc., podem tarm- bém ser ajustados a uma curva normal. A curva normal & ainda muito empregada para a ela ajustar distribuigdes de varia- yeis tais como: algumas variiveis biolégicas, algumas varidveis antropométrieas, eres de observagio em trabalhos experimen- tais, algumas variiveis sociais de caracter relativamente esta- cionario, ete. ‘A curva normal 6, porém, impropria para a ela ajustar a maior parte das séries econtimicas, algamas séries bioldgicas, ete., que, pelas suas distribuigbes essimétricas sio mals exactamente ajustsdas a outros tipos de curvas adiante estudados. sta eurva tem, porém, uma grande importincia, pois 6 sobre ela que se funda a teoria dos erros, considerando como tal, os desvics dos diferentes valores da série em relaglo 4 média AJUSTAMENTO DE CURVAS at aritmética dos mesmmos valores. Por meio dela, pode caleular-se a importineia de um erro comparado com outro, bem como a probabilidade de que um erro caia dentro de certos limites. Pare NV suficientemente grande, esta curva tem a forma eam- panular, simnétrica, © a area compreendida entre 2 curva 6 0 eixe dos XN deve ser igual a V. O Apéndice B, coluna 2, fornece o valor das ordenadas y calenladas em funcio da ordenada maxima (média ou moda} y por meio da formula atras indicada @ para os valores dos desvios dados na coluna 1. A colunn 3 do mesmo Apindice da valo- ros das Areas da cnrva compreendidos entra dados valores dos desvios, Areas obtidas integrande entre esses mesmos valores a formula atrés dada. Em ainbos os casos os desvios usados sio desvios reduzidos, quer dizer, em vez de se tomarem ox desvios x (diferenga entre os valores dados @ a média aritnd. tiea), tomam-se essas desvios divididos por 2. Se @ fur igual a 6 (desvio padrio da distribuigho dos V} 1. Neste caso, a colina 3 do Apéndice B diz-nos que a area da curva compreeadida entre a ordenady central ¢ um desvio reduzide igual u 1 ¢ 0,343. Se considerarmos £0, vém dois desvios reduzidos iguais a +1 ¢ a 1. Entio, a columa 4 do Apéndice 1 diz-nos que a Area da curva compreendida entre +1 e —o 6 0,0826. Atendondo a que a area total da curva é N, 9 Groa desta parte sera 0,6826> para cada lado da ordenada central, a area da curva compreendida entre essas duas distin- cias sera (coluna 4 do Apéndice B) 0,9973002. Isto significa que entre —-8s ¢ —3e esto compreendides 99,73002 fo dos casos ou, pritieamente, todos 03 casos (ou valores, ov ainda observagées). Este facto permite conferir o valor do desvio padrio de uma distribuigio normal am que N é suficientemente grande: o dove ser aprosimadamente igual a z do intervalo total. Finalmente, quando = =0,6745, este valor nas se encontra na coluna 1 do Apéndice Bo, portanto, a dren eorrespondente também no se encontra na coluna 3. Esta area (0,2500) obtém-se por interpolacio entre os nimeros 0,2486 © 0,2518 inscritos na coluna 3 do Apéndice B, como aroas correspondentes aos des- vios reduzides = —0,b7 © = 0,68, inseritos na coluna 1 do mesmo Apéndice. Atendendo a que os mimeros da coluna 4 sio o dobro dos da colana 8, conelui-se que entre duas orde- nadas levantadas is distincias +0,6745 e —0,6748 da orde- nada central, ficam situados 50%, de todas ag observagdes (casos ou valores). Esta medida tem um nome especial, erro provavel @ ficilmente se vé que ¢ igual ao intervalo quartil {secgio 3.7}. 10.4-O ajustamento & curva normal, © ajustamento de uma distribuicho de frequéncias dada, a um determinado tipo de curva tedrica, pode fazer-se, ou 2 partir das ordenadas levan- tadas a certas distincias da ordenada maxime, on a partir das reas da curva, compreendidas entre a ordenada mixima e outras ordenadas ievantadas a certas distincias dela. AJUSTAMENTO DE CURVAS MB Nao 4 indiferente a utilizagio de um ou outro método, Assim: a) Se se tratar de ume distribui¢io de frequéncias, 54 se deve empregar o segundo método (o das reas), Empregando-se o primeira, tomar-se-4 como valor representative da classe o seu ponte médio no qual se levanta a ordenada cujo valor xe deter- mina. Pode acontecer, porém, que o ponte media nia seja bem representative da classe (sé o seré se nele estiverem concentea- das as maiores frequéncias), 0 que coudaz a um ercu, b) Se se tratar de uma série de dados niio clasificados, pole empregar-se qualquer dos métodos (ordenadas ou areas) que os resoltadas nio devem diferir sensivelmente, sends, porém, mais exactos os furneeidus pelo segundo. Estudemos o casy especial do ajustamento a uma eurva por mal. Atendendo as limitacdes impostas na seccia anterior ao uso da eurva normal, fornecida uma distribuigie de frequéncias ou unia série de dados por elassifiear com 0 fim de se lhes ajustar uma curva, 0 primeiro passe a dar ¢ verifiear qual é o tipo de carva que melhor se Ihes ajusta. Estudemos um caso concreto. Do five -intropometria Escolar du autoria dos Drs. Dias Agudo 6 Almeida Rocha, capiimos os elementos que constam do quadro n." 10.4. A marcha a seguir aa escolha do tipo de curva do sistema de Pearson, &: 1) Caleuluu-se os 4 primeiros momentos da distribuigho dada, com foi indicado na seegio 3.3. Escolbendo para média arbitraria o ponto médio da classe 166-168em, os autores citados obtiveram para valores dos 4 primeiros momentos en relagio & mesma média arbitraria: mm=0,1006 y= 29135 1g =9,5216 my 283,684 2) calealam-se os momentos em relagho & média aritmdtica exacta, atilizando as relagtes indicadas na mesma seccho 3.3. Desta forma foram obtidos : m= 94271 = 0,106 y= 278, 3605 24 MANUAL DE ESTATISTICA 3) O qnadro n.° 10.4 permite coneluir que a distribuicio de frequéneias esti nas condigdes indieadas na secgio 3.8 para que aos momentos calculados em 2) ae apliquem as correcgdes de Sheppard. No entanto, os autores parece niio as terem aplicado. Quadro a2 10.4 Alturas de 1.572 estudantes do Liceu de Gil Vicente, de 17 anos de idade Origem: Antropometria Escolar, por A. de Almeida Rocha ¢ F. Dias Aguds, pag. 400. Aturas Progadactes Wa-dh 8 We-148.0.000-0- «21 148-150... OB 150-182. 6 1nd 154 . W Wd 1S 30 W618 WSO. WO-12 THO 162-164 ee MTR W486 AE 166-168 216 WEI 1m 470-172 we TL 172-174, ee TM 174-176 2 BB 178-178 2. oa 61 178 - 180 cee BB 180-282 ae 382-184. . WA-W5 4) Caleulam-se £, © @ cujas expresses foram dadas na socgdo 4.1, Segundo os autores citados : ,=0,000; 2,—3,182 5) Caleala-se o valor: Gok 3¥ que, de harmonia com os autores, 60. AIUSTAMENTO DE CURVAS 245, © quadro n.° 10.5 diz-nos qual © tipo de curva a escolher. No caso presente, em que @, e & sio aulos e « valor de 6, pouco exeede 3, escolhen-sa o tipo normal para proceder 20 ujustamento, Poderia tateez ter-se escollido, sem despropésito, © tipo VIL, pois, de facto, 4,3: mas excede-o por the pouca gue se optou pela curva normal. No mesmo quadro vase que a eyuagio da curva normal 6: HO thy OF Exealhido o tipo de curva, 9 segundo passo consists em pro- ceder ao ajustamento do tipo eseolhide nos valores da distri- Duigdie dada. ‘A titlo exemplificative soguiremos os dois adiodos referides no comego desta seegio. a) Método das ordenadas: A marcha a soguir 1) Caleala-se a média aritmética da distribuigio dada, que, segundo os autores citados, 6: ¥=-166,7; 2) Caleula-se o desvio padriio du mesma distribu qnéneias » de fre- segundo 4 mesma fonte de infurmagio. 4) Organiza-se um quadro como on," 1, na_ primeira coluna do qual se inserevem os valores X que no nosso case sio os pontos médios das classes. Se nfo se tratar de ama distri- buigio de fregnéneias, X represonta os valores da série. 5) Facem-se as diferengas x—X~X, © columam-se ossas diferengas. 8) Divide-se cada uma das diferongas obtidas como foi indi- cado na alinea anterior por +, Colanam-se estes quocientes (esvios reduzidos). i MANUAL DE ESTATISTICA 7) Ne eoluna 2 do Apéndice B ifem-se os valores propor- cionais da ordenada maxima (on central), correspendentes aos diferentes valores dos desvios reduzidos. Inserevem-se esses valores na cola < do quadro n.* 10.6, Quadro n.? 10.6 Caleulo das ordenades de curva normal ojustade és eltures de 1.572 estudantes de 17 anos do Liceu de Gi! Vicente Pontos midion five ctaes x 00017 Od 3g : 12 2.88 } 32 2.86 03775 We 223 0,08820 17,0 191 oreiat 33,8 1,88 O2sT0e 586 1.25 934 0,05 1324 00 1 1704 0,28 HEL 5 208,7 | 1905 159.7 103 | 1200 156 30,9 169 et) 202 265 aM 13,2 267 58 8,00 oolitt 238 8) Multiplicam-se os valores obtidos como foi indicado ne alinea snterior pelo valor da ordenada central. Desta forma se obtém os valores das ordenadas x levantar nos sncessivos valo- res de X (abeissas}. Quedro n.” 10.5 Sistema de curves de Pearson Origema: Frequency Carver ani Correlation por W Prineipate I Iv Mata Comozo da Fim da curva Mem =D, one yoo, da curva Média forma de, Cato especi AIUSTAMENTO DE CURVAS 27 © grafico n.° 10.3 apresenta, além do histograma referente aos valores abservados, a eurva tedrica obtida por este método. 3) Método das érous: Procede-se como seguo, exemplificando cum ox mesmos dados, com 8 guais se organiza o quadro n.* 10.7. 1) Calenlam-se a média aritmética e 0 desvio padrio ds dis- tribuigio como foi in@icado para o wétodo a} (das ordenadas). GRAFICO 10-3 SASTOGRAMA E CVBVA NORMAL AVUSTADA AS ALTURAS DE (1522 ESTEBANTES BO LICGY BE Gli WCcATE a8 POMERO We ESTUOANTES 145 is Ter 7 18 ALTURLY EM ceNToMETROS 2) Determina-se a classe que contém a média aritmétiea. Na primeira coluna do quadro n.° 10,7 inserevem-se os limites inferiores da classe que coutém a média e de todas as classes inferiores a essa. Na segunda eohina, inserevem-se os limites superiores da classe que contém a média e de todas as classes superiores a essa. 3) Em cada linha inscrovem-so os desvios @, entre o limite da classe inserito nessa linha e a média atitmética. Atendendo a que nas colunas 1 ¢ 2 se insereveram, em duas linkas dife- 248, MANUAL DE ESTATISTIOA Quadro n° 10.7 Célculo, pelo método das Sreas, das frequéncias tedricas de cada classe da distribuicdo das slturas de 1.572 estudentes de 17 anos do Liceu de Gil Vicente Cinsites das classes | tsermmncas | | Peseostagem, _Jentio owiteaos | elt | ou gn worn | domto asada | LOTS Taterioray [saporiores ‘hasse wa | M6 | 148 | 150 | 2 | id | 156 | 158 160 162, 16d 186 l Fentos, os dois limites (superior e inferior) da classe que contém a média, segue-se que o nimero de desvios da coluna 3 é igual a0 namero de classes mais um. 4) Calculam-se os desvios reduzidos dividindo cada desvio ¢ pelo desvio padrao da distribuigio do frequdncias. 5) Lé-se na coluna 3} do Apendice B a area da curva corres- pondento a cada desvio reduzido, Inserevem-se os valores AIUSTAMENTO DE CURVAS 249 encontrados, depois de expressos em percentayem. na eoluna 5 de quadro n.? 10.7. 8) Cada valor desta coluna 5 representa a airea entre a média aritedticn (ordenada central) e uma ordenada levantada no ponto que tem come abcissa o respectivo desvig redazido. Entho, fazendo a subtraegio de cada valor para o imediato, actam-se as areas comproendidas entre as ordenadas lovantadas em dois desvios reduzidas coasecutivos, isto ¢ entre dus slasses con- secutivas. A éren du classe yne contém a média, acha-se somando as duas areas corespondentes as diferongas entre a inédia © os 2 dois valores de —, um de cada lado da média. Os valores assim encontrados siio inseritos na coluna 6. 7) Multiplicando, linha a linha, os valores inseritos na coluna 6 pelo mimnere total de alunos (1.572) deteriainam-se as frequéncias teérica: Finalmente, o dltimo passo consisie na determinagdo do gran de ajustamenta do tipo de curva eseolbide i distribaigho de Srequéncias do exemple. © quadro n.° 10.8 apresenta este eélenlo, a mareba de qual foi deserita na seegio 10.2. Usuram-se os valures tadricos dados pelo uiétods das drens, @ obtere-se 7! © nimoro de graus de liherdade ¢ de 15, Com efeito, o nimoro final de classes 6 de 18 (coluna 4), depois de se terem feita, nos dois extremos da distribuigio, os agrapamentos tmencionados na secciio 10.2. Por outro Indo, 0 mimero de graus de liberdade perdidos foi de 3, pais, come se vin, NX e ¢ da distribai dada, foram usados pera o céleulo da curva a ajustar, Portanto, 0 niimero final de graus da liberdade é de 18 —3= U5. No Apéndiee A procura-se na primeira coluna »-15. Na linha deste, procura-se y°=28,472. Nio se encontra e para o obter seria necessirio interpolar. Mas encontra-se 7°=28,259, a que corresponde a probabilidade de 2 por cento. Logo, a proba- dilidade correspondente a y’—28,472 seria menor do que 2, isto 6, a probabilidade de encontrar na tabux, um valor de 7 igual ow superior a 23,472 4 de menos de 2 par canto, Trata-se de uma probabilidude baixa, « indicar um mau ajustameato. 250 MANUAL DE ESTATISTICA Quadro n° 10.8 Céleuio do greu de ajustamenio de curve normal 4s alturas de 1.572 estudantes de 17 anos do. Licew I Vicente fr fregutsclas | trequtuctas onsorwades | “Galtuladas atin 424,36 160 ~ 182 110 515,29 | 168-164 13, 1089 | 14 ~ 168, it | | 165 - 168 ab | 168-470 ist i 270-172 il 12-14 sa 14-176 8B 176-178 tH 178 ~ 180 aa j 180-182 we; | 182-184 eB | i 184 ~ 186, 4 | Points Late i L serene ee 10.5-O ajustamento a curva tipo I do sistema de Pear- son, Disse-so atris yue a curva normal era apenas um dos tipos de curva ao qual se podiam sjustar distribuiges de fro qnéncias. Além disso, indicou-se 6 proceso que permitia, eon- Jugado com © quadre n° 10.8, escolker qual o tipo de curva a ajustar, de entre os pertencentes ac sistema de Pearson, Ha outros sistemas de curvas, propostos por outros autores, mas dada a sua aplicagio mais genoralizada, mencionaremos agui sbmente o de Pearson. AIUSTAMENTO DE CORVA 21 Estudaremos, nesta secoio, 0 ajustamento a una curva do tipo I de Pearson. Para isso atilizaremos dados que ja nos serviram no: capitulo 7, @ que constain de Quadro n.? 10.9 Pesos de 400 ginastas do Ginésio Clube Portugués Origem: Fichas biométricas respectivas Ramere Pesos an 47 a 48-51 a a ay 49 65 5 fa 38 26 Ble nnas Total 4 A razio da escola do tipo T para ajustar os dudes do qua- dro anterior, esti nos valores de &,. $e & que so encontraram, Com efeito, tomands 0 ponto médio da classe 60.63 kg. para média imagindria, obtiveram-se os seguintes momentos : mie = 0,625 ray = 5A my = 16,210 ng = 118,015 expressos em intervalos de classe, Usando as relagbes indicadas na secghe 8.3 para caleular ox momentos em relagho & média exacta com base nos momentos todos expressos tan:bém em intervalos de classe. 252 MANUAL DE ESTATISTICA No se caleularai os momentos p, quer dizer, no se apli- varam as correccbes de Sheppurd aos momentos z, em virtade de a distribuigho de freqaeneias © o histograme respectivo, pare- cer nio apresentarom, numa das direegbes, contacto prolongado com o eixo dos XY, ou, por outras palavras, parecer uiio aerem, numa das direcyies, assintiticos ao eixo dos XX. Usando as formulas indicadas na secetio 4.1 caleulou-se: &, 2482 Por meio da froma indieada na seecio anterior, obteve-se — 0,6582 G2705 @ Gy k Observando o yuadro n° 10.5 nota-se que dos tipos de curva mais vulgares, aquele que aprosenta a earacteristiea de ter k negative 60 tipo L. Eis, pois, a razio da escolha desto tipo. Do mesmo quadro, vé-se que a equacio desta curva, 6: mG bE 2) y Esta curva ¢ hubitaalmente assimétrica positiva, mas se, na sna equagiio, m; @ my forem «proximadamente iguais, a curva é quase simétrica. Se m, @ mz no forem pequenos, a curva apre- senta contacto prolongade com o eixo dos XX om ambas as direecées. Ao contritlo, se im, @ me forem pequenas, a curva apresenta subidas iagremes em ambos os lados. Se m, for negative, a enrva apresenta a forma jota, comegande nama ordenada infinita ¢ caindo rapidamente até wn certo ponto. Se vy @ my forem ambos negatives, a curva tem a forma de U cormecando © aeabando por ordenadas infinitas @ apresentands gia anticmoda em vez de uma moda. Nas curvas em forma jota ede U, embora haja ordenadas infinitas, as érous sio finitas., Como a curva ¢ nsnalmente assimétrica, uio se podem utili- zar no cilealo, quer das ordenadas, quer das areas, os valores ja tabelados no Apéndice B, os quais sé servem para a curva normal. Nu prities, e por conduzir a resultados mais rigorosos, fariamos o célenlo das frequéncias teérieas pelo método das freas. A titulo exemplificativo apresentaremos na presente AIUSTAMENTU DE CURVAS 268 seegio também o wileulo de ordonades para uma enrva assi- métrica. A mareba a seguir no ajustaments & pais: a) Método das ordenadas Caleula-se a ordenada max cree onde: yo $0 ordenada maxima : N60 numero totul do observagiies, valores on easos, No nosso caso é: = 400: ba, +a,, 6 calenlado por meio da oxpressio 1 SEI b= sve, x VES ra) r Foe onde #, ¢ 5, JA foram ealealados er ¢ obtido a partir da expressio: 66 ree ee 3 onde 4, © &, sio valores ja calenladys ; Mm, @ m, Sao Tespectivemente igauis a: Estes valores ny e my nko devem ser conftmdidos com © primeira e « segundo momentos coutados a partir da média imagindria © para os quais atrés se asaram os mes- mos simbolos. T sio as chamadas fangdes complotas de gama. © Apéndice C fornece os valores de logl'{p) para valores de 1,000.2 p.21,999 om yue p 6 ou (am +1) o1 (ay +1) on (Omy+my+2) ou, enfim, qualquer valor do arguments. Quando 0 argamento @ for z<¥ ou a>1,999 procura-se redazi-lo a qualquer valor tabelado no Apéndice C. Se a>1.999 usa-ne « formula geral de reducio P(@)=T (p+n)=(p+n-1)(piu-2)(prn-B)-- (p+). p-T(p) ad MANUAL DE ESTATISTICA Se a1 usa-se a expresiio: ria) = Tet) onde (2+1) é um das valores de p tabelados no Apéndice C. Calenlemos entiio as valores necessarios. M144; 60,2763; 4, —3,2402 foram ji calculados. Portanto, 7 & facil de obter : 6 B.246: 32<0,2760 Isc) Estamos, desta forma, ji na posse de tados os elementos para substituir na equagio de b. Fazendo-o, vem: Jee xe VEGF ETHGTT OOS SPS OS OORT ET) — B73 30,08 we @ mz, aterdendo a que o valor de V3, Ja foi calealado acita, sto: + 33,0584 + 29.0862) donde: 55,1446 = 21,5723 = 54861. 10,9722 oo AIUSTAMENTO DE CURVAS 255, No presente caso, vista 2 ser positive, i; 6 também posi- tivo. Isto 6, my toma sempre o sinal de my. Entiio : Pivq=1) = PG AR) P (m:-1) > 1 (28,5723) V (nyderie 4 A titulo ilustrativo mostraramos come se obtém o valor de Tim+): Pay) = P6480 A480 x 4 ABE >< 8,480 > PULA85 4-5) = A865 50 1486 2 PL A88) ©, aplicando logaritmos : Jog 5,488 log 4,486 J log 2.486 Jog ly log P (488) = 1,04 Portante : log P (6,486) = 2448894, Andlogamente, obter-se-ia : log F (28,572) = 28,8628604 Jog P (35,058) = 38,5598801 . E assim estamos na posse de todos os valores necessarios para o caleulo de y,. Substituindo na sua equagio os simbo- Jos pelos valores ealculados, obtéin-se : _ 400 BABEL OAS ~-BO,O18L 38,058. 0 25 MANUAL DE ESTATISTICA Para o eileulo de y, 6 conveniente usar logaritmos, podendo adoptar-se a disposi¢ho seguinte : log N = 2,6020600 tog nis my log m, ~ 5 ABOL < 0,7) = 4,0550746 log ny = log mig 10g mg log I (ne jog. do numerador logs = log Log (nis-}-mis) = log 83, (ony + ins} log (ogg) log TP (mm, +2) = log P (6 log T (mg--1) = log P log. de denominador 4 = 1,5192818 0584 > 1, GTO2818 diferenga entre log. nam. e log. den, = lox a, he Os dnicos valores yue entrain na eyuagio da curva 6 ainda nao caleulados sho a @ ay. Os seus valores obtim-se por meio da expressio : p a a 4 my Hig My Ly No caso presente seré : wb my Dna maxh Substituindo entio todos os elementos calenlados, na equagae da curva, vem: AIUSTAMENTO DE CURVAS 257 ande © representa os desrios tomados am relagio & origem que, segundo 0 qusdra n.° 10.5 6, para as curvas do tipo I, a moda, sta, obtém-se por mia da expressio : Ra ry Ay = X onde m: © 5 estio expresses, nio em iutervalos ile classe, mas nas unidades da série. No casa presente di: BOM 4 B70 My = 64,5 — 1 yg CGM | 870584 OE 7926 . Para o cdlculo do valor dus diferentes ordenadas, bA que Hecidir onde (isto €, em que pontos do cixo das abcissas} as ordenadas hio-de ser levantadas. Habitualmente, levantam-se as ordenadas nos pontos médios das classes sucassivas. © quadro n° 10.10, yue aio oferece diffemldades, mostra como se dispde o célenlo. A eoluna 2 d4 os desvios em rela- gla A mods, isto 6 ax diferengas entre os sncessivos pontos médios das classes © a moda. Os valores de ay 0 wy utilizados nas colunas 3 e 4, respectivamente, sio os valores acina encon- trados (5,8043 ¢ 29.6241), multiplieados pelo intervalo de classe. Sko, pois, respectivamente: ay —5,8043><4=254872 © a, 20,6241 ocd 1184064, A coluna 10 do quadro n.° 16.10 apresenta, ealculados desta forma, os valores das ordenudas a levanter nos poutos médios de cada classe. }) Método das areas : Como atrés se disse, nko bd tabelados, valores das areas desta eurva, como 98 ha das areas da curva normal. Por esse motivo ha gue calculi-los. Para isso, utiliza-se, em geral, a regra de Sitopson, que da ¢ valor de qualquer area a partir da exprossio: ‘ L,. Area == phe + Bay) + 2G, EE AD + + SEH A Ht Pay) onde 2p representa o niimero de partes em que se divide a ” Quadro n.° 10.10 Céileulo das ordenadas da curve fipo I, ejustads 80s pesos de 400 ginastes do Ginasio Club Portugués lurdenadar mm xool. . 30m yer tOR Ye | SATIRE Real. aad | sow aot 8 | tog eet. 4 Tos Coe fear ope MG | 15,7996 0.05458 149958 i a0 | 11,7926 004120 113598 Bk | = 17926 0.02768 0,76320 58 — 3.7926 0.0168 oa | + 0.0004 1,99926 66 | + 42074 O3ett0 2074 74 | 412.2074 18970 | 7g | 416,207 0.8632 23841 | 32 | 4.20,2074 0.8295, 3,76168 86 | +24,2074 1.68808 Booms | w | + 28,2074 1.87466 Aea509 | o $32,2074 2,00186 420199 | 98 | +86,2074 azieos | 5.5982 1.69735 898, VOISTLFLSA 20 VON AJUSTAMENTO DE CURV4S 259 base da area da carva © & representa o comprimento de cada uma dossas partes, expresso como uma fracgiin de coniprimento total da base. No nosso caso hi que ealeular 14 dreas correspondentes As 14 classes da distribuigio duda, cada uma dels limitada por 2 ordenadas consecutivas, a porcie do eixo dos XX e a poreho da curva entre elas compreendidas, HA pois que aplicar 14 vezes a regra de Simpson. © qnadro 2." 10.2] mosita como se caleulam os valores dus ordenadas a levantar nas duas primciras ‘reas parciais. Como vemos no quadro 2.° 10.9, a distribuicke de frequéncins tem infeio em 44 kg. Por seu lado, viu-se atrés que a eurra ajus- tada pelo método das ordenailas tem infeio em: AM, — tay = 61,7926 — 4 25,8943 = 38,2104 Portanto, a primeira area a ser culculada é a compreendida entre a curva, uma ordenada Jevantada no ponto 48 do exo das abeissus © um eomprimento du eixo das abelssas igual 2 48—38,2 Para facilidade de eéleulo, dividamos a base desta area em 4 partes, DISH) 440i © valor da area fornecido pela regra de Simpson yerd tanto mais aproximado, ynento maior for o niimero de partes em que se divide a base da area a ealeulur. Por outro lado, quanto maior for esse nimero, mais complicades serko os calenlos, Isto quer dizer que teremos que culcular o valor de cinco ordenadas nos primeiros cinco pontos indiendos ua colina 1 do qaadro n.° 10,11. O edlenlo destas ordenadas é em tudo idéa- tico ao feito no quadro anterior. Desta forma se obtiveram os cinco primeiros valores de y,, indicados ne colwna 10 do qua- dro n.° 10.11. Entrando com eles na expressio da regra de Simpson, que, para 2p—-4 toma a formu : ; a dy. : Aven = ( <4) ary) +2 at Alar an) Quadro n° 10,11 Caleulo das ordenadss 6 levanter nas duss primeiras breas parcisis da curva lipo I ajustada aos pesos de 400 ginastas m xfoweal. 108 te 3821540 0,000 Se 40,66156 0,1038 Bain? 4810770 0.2075 785430 45,55885 O,3t13 0,00466 48,0000 0.4150 | 10104 107124 49,0000 sia | 1,1080 1.21204 50,0000 0.4998 | 1,0995 41,8317 81,0000 Opa2a | 10911 Bosi58 1,43807 58,0000 opsrt | 1,0826 272185 151937 FORMSILYLSH da iWasrn AIUSTAMENTO DE CURVAS 261 vem: cays i 97846 Area ~ <5 10+ 11,7825) + 2><0,7150 +. +4 (0,0260 4. 4,0281) A Grea compreendida entre as ordenadas levantadas nos Pontos 48 © 52, a porgia do eixo dos XX © a predic da curva compreendidas entre aquelas duas ordenadas é obtida de forma ‘Wdéntica i anterior. Para isso, divide-se a base da Area em quatro partes @ caleulai-se os valores das ordenadas a levantar Hos pontos eneontrados, As cine ordenadas serio, pois, levan- tadas nos pontos 43, 40, 99, 51 52 do eixo das abcissas. Os valo- res dessas ordonadas estie indieados na coluna 10 do quadro w.?10.11, A ordenada a levantar no ponto 48 do elxo dos YN, ao mosme tempa gue éa primeira ordenada da segunda area a calcular, 6 a quinta ordenada da primeiza frea. Por isso, sb se calcula uma vex, Este facto repete-so para todas as Areas pareiais da curva, excepto para a wltims, Entrando com os valores obtidos na expressio da regra de Simpson, vem: Df 33,064) + 2 > 214575 + % A068) = 2, x) = ho. ZT desta expressiio, 0 numerador representa o intervalo de classe (52—48 4) eo donominador o numero de partes em gue se dividia a fires parcial considerada. As restuntes doze reas foram caleuladas de forma i acabada de descraver para a segunda aren. Para se ser rigoroso, devis-se ter procedido a um. caleulo especial da Sltima areu, tal como se procedea quanto & primeira area. Com efeito, a altima area é compresndida entre: uma ordenada levantada no porto 96 do eixe dos XX; mm com- primento do eixo dos XX igual A diferenca entre o ponto onde @ curva toca esse eixo: M, + api 61,7926 + 118.4904 -- 180.2800 62 MANUAL DE ESTATISTICA 6 © ponte 96, isto 6, 180,289—-96 = 84,989; e a porgdo da curva entre a ordenada Jevantada no ponto 96 ¢ 0 eixo dos XX. Contado, um exame do grafico n.° 10.4 mostra que a drea da curva além do ponte 100 do eixo dos XX 4 desprezivel, por a curva ja nesse ponto ester muito préxima do mesmo eixo. Por esta razio 6 para evitar o caleule de um grande mimero de ordenadas, todas muito pequenas, nio se desceu a tal rigor. © que se ganhava em aproximagie nie eompensaca o que se gastava om célculos laboriosos. Calculados 08 valores das 14 dreas, comparemo-las no quadro soguinte Quedro n. 10.12 Ordenadas e éreas parciais de curve tipo I ajuslede eos pesos de 400 ginastas Chasse urdonsdas | Srvax Abd 53 ou 48-5E | ao 218 BB-55 | 452 449 56-59 Bat 03.6 60-68 3 63,9 4-67 | B00 | 65,7 68-71 501 50,1 2-75 BAT | 8 6-79 mas 217 80-83. 132} 12.3 83-87 6,3 64 88 a1 30 380 92-95 . 5 - 981 05 05 (0 Tara © cdlento deste Svea fol neado p intorvato 36,264 n 48. com os das ordenadas atras calenlados. O grafico n.° 10.4 apresents o histograma ¢ a carva de fre- quéncias ajustada a distribuigio dada. ATUSTAMENTO DE CURVAS m3. Por dltimo, determina-se o grau de ajustamentc da curva escolhids ans dados da distribuigio de frequéncias fornecida. Para isso, usa-se a prava do 72. © quadro n.° 10.13 apresenta este célenlo, no qual se usaram os valores tedricus dados pela método das iireas. Obteve-se .708. O mimero do graus de liberdade 6 de 6. Com efsito, GRATICO NO10-4 ISTOGQAMA E CURYA T1001 AJUSTADA ADS DLSOS DE 400 GIMASTAS a BInASIO CLUB DoRTUGUES 50 5 AGMERO DE GiMASTAS, 3 to 70 30 3M Tes ‘DESOS EM QUFLCERAMAS depois de se ter feito num dos extremos da distribuicko o agra- pamente de frequéncias mencionade au seccio 10.2, 0 nimero final de classes & de 11 (coluna 4). O nimero de graus de Uberdade perdidos ao pfectuar o caleulo de curva foi ded, pois foram usados 5 valores obtidos a partir da distribuigia de fre- quéneias dada, a saber: W,p,,y,,,; M.- No Apéndice A procura-se y—6 nu primeira coluna. Na linha correspondente Procura-se 72--5,208 © no se encontra. Vé-se mais, que o valor procurado esti situady entre os de 6.948 ¢ 7,231 cor- 264 MANUAL DE ESTATISTICA respondentes, respectivamento, As probabilidades de 0. © 03. Caleulando, por interpolagio rectilines, a probabitidade corres- pondente av valor de 2--5,708 obtém-se P=0,46, 0 que indica um ajustamento que, sem ser exeepeional. se pode. contudo, considerar bom. Quadro n.” 10.13 Caiculo do greu de ajustamento de curve tipo I aos pesos de 400 ginestas Feequtactas oiawrrades | enlzutudas wena ce RRESESAR Como se ve, dos dois exemplos dados, a resolugio completa de um problema de ajustamento a uma curva de Pearson, & bastante trabalhoso. Por sta raziio 6 por se julgar que ox exemplos aprosentados habilitaram o leitor a ficar de posse da técnica necessiria para proceder ao ajustamento de qualquer tipo de curva do sistema de Pearson a distribuigtes dadas, aio se apresentard mais exemplo algum. APENDICE A Apéndice A Valores de 3° De acordo com as grous de liberdade (v} © @ probabilidade (P) 8,000628 0.0089; 0404 0,103 0,352 OTL 4145 1.508 10417 . | 10,851 i i 2s | 8897 11581 : 17,482 22 | 9,542 oioaas | 48.101 23 | 10,196 von | 19,021 24 | 10.856 | 13,848 19,043, 2 | 11s24 14,881 z 2,807 26 [12,198 15879 | 17298 21792 27 | 12.879 ietol | Agni 24719 28 | 13,565 | 16,928 | 18,939 23,647 29 414.256 17,708 | 24,577 1 90 | 44,953 18,498 | 10841 12 | 14,340 13) 12,840 ia] 13,39 1 | 14,839 WW | 18,338 | 16,838 18) 17,838 19] 18.838 20) 19.337 at | 20337 22] 21,837 BSESS H 7.231 8,382, set 10,656 i181 12,899 14013 15,118 165,292 17,322 18.418 i811 20,601 21,689 22,775 2858 24,939 31,391 32,461 APENDICE A (Continvegéo) PG20 | P10 | P 1.0642 | B29 A642 5.989 7.288 8,558 9,803 12,980 12.242 15.442. 14,081 15.812 16,985, 13,151 W3u 21,795 52,912 34,027 | 85,139 2,208 4,605 6,251 aI79 9,258 10,845 12,017 18,362 14,684 15,987 17275 18,549 19,812 21,064 22,307 23,542 24,769 26,980 27,204 28,412 29,615 BORIR a3,007 | 33.196 34,882 35,563 36,745 37,916 39,087 40,256, =0,05, 45,007 16.018 18,307 39,875 21,026 22,362, 28,685 24,996. 28,296 27,587 28,860 BO LdE a0 saert 33,924 3572 36419 87,852 38,885 0113 41337 42,557 43,778 Pat, 02 Bala 7,824 9837 11,668 13,883 15,083 16,622 18,168 19,679 21,164 22,618 24,054 25,472 28,873 28,259 29,683 80,995 32,546 6,835, 9,210 11,361 13,977 $5,086 16,812 18,475 20,090 21,666 24,795 26,217 27,688 25,141 BOB 32,000 33,409 34,805 36,191 37,566 39,982 40,289 44,314 45,64 46,968 48,278 49,588 50,892 Transcrito de aStatisticsl Methods for Research Workers» por amdvel permissio do Autor, Prof. B, A. Fisher ¢ editores, Oliver @& Boyd, Ltd. de Edimburgo. APENDICE i 267 Apéndice B Ordenades e breas de curve normal em funcio das abcissas (desvios contados pers a média aritmétice divididos pelo desvio padréo} Abelsse vie ‘np envn orfonaa on ove anna mixin wa jevacieda { tovmatadae ontonada 7 i ' | 1.00000 0,000 0.99995 0,040 0,080 20120 i 6.0169 i 00100 09,0289 0,0279 : 0,0319 : Ouse 99501 0.0398, i; 0,09396 0438, 0.99883 Cr 4.99158 0.0587 0.99085 0.0557 One | 0.98881 O16 | 0,38728 O17 o.98565 O18 | 0.98398 | 0.19 ogaat1 1: 0.20 98080 | O21 097819, : 0,22 oT609 : 0.28 esis | : 0,24 ogie; i 0,25 0.96823, | 026 | o.968675 | ogT 0.96420 028 0.96156 0.39 0.95882 Atcisse ca dosric 0463 APENDICE fh Ontonnda, 0.99812, ogg39 0.91558 oeti69 GOTTA agesz1 89961 0.89543 Ogo1is u.s8688 OS88250 0.37805 osa9ee, 0.85488 0.85006 aging (85060 ogane7 088628 og2at4 0.89010 81381 (Continuagéo} | Aces onsre o ontenaie | masiong # a lereaaca, enits atone 2138. 0.2137 0.2190 0,224 0.2987 0.2291 0.3804 0.2357 6.2389 roa sntre as ortonadtsn Devautadas om. 0,2338 0,284 0.2510 0.2586 0,2662 0.9738 0.2812 0.3108 optge 0.8256, 0.8398 0.3400 ogat2 Badd Os618 0.8688 0.3758 oseso 0.3900 3970) 04038 04108 ore 0.4246 04314 04380 0/4448 04514 11,4582 04648 Qari 0778 og9 osoase osnse9 9,786 0.79854 0.78817 0.78270 Or7721 Or7ie7 o7eoue 0.78058 Oris orden 2.09081 6.69087 0.6849 0.87896 0.67208 O,p608y 0.60097 OSS Ges891 059987 O68 0.68077 osente 0.81865 001259 APENDICE ft {Continuacéo) O28 0.2549 0.2881 02910 02030 0.3108 0.8133, 031 Ogad 6,2908 0AOTB usT62 18820 6.3878 ren opstug 0.6156 pate 0.6318 0372 0ss24 06476 0.6528 86578 ,66550 0.6680 06730 06r78 270 APENDICE & (Continue¢8o) ot dave oedovsatn pene ieeastaan om 1,00 80608 | LOL 60037 | 1,02 ogasd0 1,03 D588, | 1,04 | 1,05 OST623, 1,08 osi0i7 107 6a 1,08 | 055810 | 1,08 40,55209 4,10 ogaeo7 aut O40 112 | Ogado9 ai | 52812 i La | Qg22i4 ‘ i 1s | G 51620 ; | 116 | 0.81087 | Wi | 50487 J 118 | GAS648 iis asso 120 88675 421 0.48082 1p2 ost | 198 oasass | 14 oa 125 OA5TRS, 42600 aaa 1at v.ad6e4 198 0.54078 129048516 130 | 0d2456 a1 0.42509 i ae O85 138 os1294 1.34 0.40737 i i APENDICE B (Continuacso} Ateissn, Ares ontre a ete eu dosrly srdsuat mixin @ a fovaalace A4AUR02 OU 4.39808 | o413t 0.39238 OstT 038569 | 04162 { 6.2858, : OaTT i | oane2 | 4207 O.23aL4 O4319 0.4382 O45 0.20018 i O.29158 | g2sT2 i 0.28951, i Od452 | 04468 044i4 0.2485 o2naa9 04495 0.25634 8.25915 187 O24707 1,68 O28 1,69 ees iran entre as erdonedas Verantadas ein 0.8280 0.8262 Osan 08824 0.8854 0888s 0844 O8s4 Osa72 0.8502 0.8530 0.8558 0.8584 Ogee 01.8638 9.8664 48,8890 og7u4 @8740 og76a 90,8788 8812 11,8836 10,8860 0.8882 0.8904 0.3926 ogois 0.8970 0.8990 0.9010 0.9030 0,056 06,9070 0,9080 33 APENDICE B (Continuacao) nog ontte 5 ordasaita | Area atte ay ondonadas mixioa 8 alevaatada | levautaday om 2 a a 0,454 0.9108 564 128 573 146 582 164, | 591 182 ! 99 198 | 808 i 218 ae 232 | 8 250 | 633, : 266 | ot 282 ; Gio 298 858 312 864 328 i ATL B42 678 356 | 586 t 372 487 O.t740t 688 388 188 0.17081 388 188) 16762 ios 412 Le | Qns44s as 498 191 016187 : ! 438, ig2 | i : 452 193 | | Abt 134 : i a6 495 | | 488 Le | BO 500 i i 758 | At6 198 | 1 1408 762 | pad 199} ataso8 wr Ba 2,00 | O13534 | 113 { 546, 201 0.13265 778 556 202 013000 783 566 2,03, nga740, | 788 BI6 2.04 Q18488 | 793. 588 APENDICE Bt 2738 (Continuesse? vein Area ones a oreaaes | is cndousan atta erate cata = on 2 £ i 1 - 2,05 0.22230 o.a7992 2.06 0.11981 8030 2,07 0.14787 8077 2,08 0.11296 8124 209 oa1389 8169 210 o1025 824 211 10795 8257 212 040570 8300 213. ,n0adT 8B 34 oor 8382 245 o,0g814 8422 | 246 uos702 | sia | QT | 0094195 ; 8500 i 218 ec9290 ann7 219 6.09080 amt 2,20 08892. 8610 t as (08608, 8645 | 2,92 0,08507 8679 | 223 | 4.08820 8713 224 0.08136 sun 295 | O0TI56 8778 7556 228 oor778 8309 7618 227 07604 8840 7680 2,98 07483 8870 7740 2.29 07265 8899 7790 2,80 2.07100 8928 7856 281 6.06888 son | i912 232 0.06780 3083 | T1966 2,38 0,08824 eof 8020 234 0.06871 9086 | 8072 2.85 0.06321 9061 | 8122 2,36 06174 9086 a172 2,37 0.06029 out gang 2,88 6.05888 suse 8268 239 0.05750 9158 8316 8 Bre Auetera on desvie 2,50 261 2.52 2.53 254 2.55 258 2.57 2,58 2,59 2,60 261 262 2.68 268 2,85 287 268 2,69 2,70 att 278 273 274 APENDICE BR (Continuagéo} Grdasade 005614 5481, 5350 4222 8973 A784 4618 3817 3232 3148, 2986 B37 2612 eid 2408 Arva cates a ordsaada, misuse © 2 levatedt a 0.491803, et 2350 2481 2856 2857 3053 e319 e4at 8533, 6836, 6736 Area eatre as ordonsdas Jovauindas oma 0.988606 84480 84902 85312 S5T1t 86106 86862 87226 87580 87926 88254 e534 e814 89228 89532 89830 90120 90673, 90946 91208 g1482 ot7ae 91850 22186 92a 92638, 92854. 93972 B47 APENDICE B 275, (Cortinuesé0) Anos outro a ordenada {acon ocdianio ordousda andzima.o whovanrata 2.75 0,08280 0,4970202: G.940404 276 28 71098 42198 277 2157 72972 45944 278 2088 7282 45642 2,79 2040 73646 41292 2,80 1984 7444s 2.81 38290 T5228 2.82 1B 75988 2.83 e280 | 76726. 2.84 we | Tiss 2.85 wes | 78140 2.86 4674 78818 2.87 1637 | TMT 2,88 1581 80116 2,89 1538 80733 1476 2.90 142 Bide 62684 2.91 4449 g1928 63858 2.98 1408 82498 64996 2,93 1367 83052 6104 2,94 1398 83585 o7178 2,95 1288 ealit eana2 2.96 1252 84813 69236 at 1215 Bot 70220 298 | 2179 i 85588 T1176 2.99 1145 86051 7208 3,00 nt 86501 | ja008 301 1918 S688 13876 3,08 1016 87361 14128 3,08 1015, 8772 | 75544 3,04 0085 eit: e842 3.05 0055 se558 | amie 3,06 0926. seo88 | ‘T7866 307 0898 senoT 738504 3,08 0871 89650. | 79300 309 | 085 soos Ta984 339 340 B81 34a a4 31054 38851 27878 26988 Arowentra 2 ondonade | J é terantacs 6752 ‘7091 92752 93010 98262 93738 93984 94182 APENDICE B ost B52 08198 07885 0760 (Continvacéo} imdzlma 9 a Tevantads, 04997197 7299 7398, 7493 7586 16i4 7750 7342 7922 7999 8074, B16 815 8282 8347 8469 8507 8583, 8637 8689 873g 8787 a7 3922 8084 9043, M16 9150 84 9216 9247 zea entre a ordenads | 4 ar7 0,99094394 4598 AT9E 4986. #170 5848 5518 BM 648 6292, 564 818, 6938, 1054 7166 274 7378 478 T5t4 7668, T7538 7844 7928 8160 see B42 B4a4 278 APENDICE B (Continuegao} Abciess Arve eatre 2 ordauads | dows outro as ontenndas eudesvis IMixiga o wievazinds | levaatadas em a = “ate 3.80 04999977 0.999864 Bet 05 8610 aga aa 8668 Bas 359 8718 abe 385 8770 385 | 409 8818, 386 | 488 8866 387 | 456 8912 3,88 478 8056 3,89 499 8998 390 519. 9038 391 339 078 398 BOT orey 398 ais 150 3.94 595 3186 3.95 4003 60g 9218 595 | 39382 825 9250 3 | 3779 oar 9262 398 | 3632 655 9310 B99 | OL 60 9340. 4000 | 3858 685 9366 401 3228 696 9392 402 3095 709 9118 403 | 2072 72 4 508 | 2857 188 9466. 405 2742 744 9188 406 | 2634 165 9510 407 2528 65 9530 488 2498 75 9550 409 2331 184 9568 410 2238 198 9586 an | 2148 802 ‘9604 412 | 060 B11 9622 448 1917 B19 3688 4 1897 B26 9652 APENDICE B 279 (Continuecéo) Ancisss | Avon entre & ondannds | Ares entree ondorada onlaesie onieonca tsizime © avovactada teraveadas es = m2 4k 3 3 3 As o,punsi9 ,a9998a4 0,9909668 AN6 rar | BAL 682 447 teva 848 896 418 1806 | 854 708 429 1541 861 722 400 uz | 867 734 4a 1416 72 744, 42 3358 878 798 428 1800 883 766 424 1248 776 425 4185 786 426 1145 796 427 1087 804 438 1052 Bl4 4,29 1007 822, 4,30 0965 | 830 431 | 092s. i 36 4320 | 0887 ' at 433 | 0859 | 850 aga 0812 | 858 4350 | ovi7 864 436 ord aro 430 ont 876 438 0681 882 439 | 0654 886 aso | 0624 | 92 44 | 0599 | 896 442 0871 08 448 0546 | 906 rere 0523 1! 210 AA 0501, i ota 446 oa 8 447 0n68 | 922 448 0438 { 926 449 os18 928 APENDICE B (Continuacao) Ordeanas 849899 19526 305298 201675 278638 BOei45 254193, 248753 2a1808 221097 211303, 201712 192538 183762 175363 167341 159666 152329 145513 138606 182196 126070 120217 114622 1ose78 104872 vegea4 oess37 090188, 085939 oanaas, Area ontre a ordexada 8 levamiada om = @ 0,4999966028 87086 69080 70508 T1873, TT 74423 ‘75614 T6751 ‘7838 TBST5 79887 80813 81717 82580 83405, 84190 ads 85656 86340 80992 aT614 88208 68774 80314 ‘89829 30820 80789 91235 91662 92087 92453 92822 93173 Aitoa entre as ordenades Vevaniadss om 0,9999932046. 35172 38160 £1016 43746 M6354 48848 51228 58502 55876 87760 59734 61626 65160 69880, 71312 72680 73084 T5228 78416 T1548 78628 79658 80640 81578 82470 83322 84184 STO1E APENDICE 2: 2281 (Continuegéo) Abelses oudesvio Area entre @ erdenads | ines eoira ss ardenndas ‘fésiaa © as levantads | levatiadas arm St O4990993827 O,999987604 AlSL 88262 4420 Baby 4696 89892 4958 BING 5208 4dG 675 5889 609 60000078011 743s 485 | age | 48t | 488 | 4g | 4,90 491 i 492 | 403 | aa | 495 | 496 | Av | 408 | 499 500 5.0L 5,02 58s 5,04 56 50% 507 508 599 510 At sae | 5A3 bad 53 Bae 5,17 5.18 519 282 APENDICE B (Continues80) Ase ‘iron one ordannca | betes onaeanan | mantma'e a tevuumeds | 520 gonins3437 | Bat 19756 056 ane 522 22108 05 210 525 i492 12 304 baa | 10906 197 8305 525 | 037 240 8480 536 | 9818 280 8560 ar | oss | B18 8636 i 8685 364 8708 ogag2 388 8776 | O7S48 421 8842 i 7537 452 8004 | Oras 481 soz | ost77 509 9018 | 06324 585 90270 i soa 560 9120 i a5772 564 9168 \ 5471 606 gata i 5186 628 9256 t 01912 O48 9296 Osta 807 9834 oun 685, 9370 i O78 m2 | 9404 ! 02957 me 9486 | 03747 Bt | 9468 5A | 8549 ms) 9496 BAG 03361 782 9524 BA 3183 TH 9550 58 3012 787 9574 53 02852 799 9598 5,50 02699 s10 9620 Bat nse st 9642 552 02418 831 9682 553 02388 810 9630 554 ones Bie 9698 APENDICE It 283 {Continuagée} Abeissa oudewio | yntwanda T 385 | gn000002052 OsvoevesssT | O,egneageTI4 556 i 1937 855 730 aot | 1882 7a | 746 558 Ba 830 760 5,59 1639 ‘886 2 5,60 1549 803 786 561 1466 899 798 3,62 1386 905 810 5,88 1308 no 820 54 1238 a5 830 585 1170 840 5.86 1105 B48 587 45 i 858 568 0987 i 866 6.69 gs | 872 5,70 oso | sao | BRO 5,73 og82 | a4 Bes OTb4 saz | 900 i ora 950 894 | oro 953 | 806 ow ons | so 0624 68} 936 a 089 960. 920 578 0556 963, 9126 578 6526 965 330 5,80 0196 967 84 gt oss | 969 988 582 out | 91 rye) 5,83 wae a2 4 5,84 ~ 0898 vis 548 585 0870 95 960 586 | 0848, a7 954 587 0828 v8 956 5,88 0320 gig 958 589 9293 981 62 284 Abetssa cu dorrio = 5,90 691 5,92 5,88 54 5% 5,96 598 6,00 APENDICE B (Continuacdo) Urdeasaa 182 a0 162 152 Azon outro @ ordenads mixima ea lovaktada, odgessoqag 83 84 85 86 8 8 88 89 % 90 { town ante ne ordooadae leveniadas 6m a 3° 1,003 1,007 1,028 1,029 4,080 1081 L032 1,083, 1,034 ton Thor 7,999, 9999. 9.7497 8.5001 9. 2512 $0830 8.7856 8.5087 8.2607 8.0173 27TT 7.5887 7.9855 7.0430 6.8011 6.5600 6, 3198 6. 0788 5. 8408 5.6085 5.3688 s.1a79 4.8m 4. Goi 4.4212 4.1810 3.9585, 81M 3, A886 3.2572 8, @285 2.7984 2. 5671 2. 3384 2.1104 1. 8851 -ENDICE © Apéndice C A fungéo P los Pia) | 7,991. 6564 | 1.070 91.4305 | 1.071 aL2052 | 1,072 90.9806 |} L018 “90.7687 |] 1,074 90.5834] 1,075 90.3108 || 1,076 90.0889 1.077 89.8677 | 1,078 89.6471 | 1,079 | sages | 1080 89.2080 |) 1,061 88.9895 |) 1.082 ase |) 1088 | 88.5544 | 1,084 | 1,035 87. 2861 87,0585, 86. 81065, 6. 6208 86.4188 86. 2089 85, 9995 85. 7910 28h f | 7,984. 1455, 83, 9428 83. T407 83. 5392 83. 3384 88, 1382 82, 98187 82. 7398 82. SAL 82. 3439 82. 1469 81. 9508 81 To 81. 6599 81. 3655 81.1717 80, 9785 80. 7860) | 80.5041 80. 4029 80. 2128, i 80. 0223, 79. 8329 79. 644 79. 456 79, 2686 79.0818 L 78.8056 ' 78.7100 78. 5250 78, 3407 | 78.1570 } TT 9738 77.7914 77. 609% 286 APENDICE © (Continuasdo) P tog Sed F re top Ft) L971. 4689 |) 4175 | 1966. 2344 Tao |) 1176 6.0952 71.1805) 1477 5.9566 70,9922 | 4.178 5. 8185 70,8345 | 4179 5. 6810 6.5313 ro.o77s | 1,190 5. Badd 6, 8538 70.5209 |) 1181 5.4076 6.1788 70.3650 | 1182 5. I1B 6. 0005 70,2006 | 5.1366 5, 848 7. 0549 5.0019 5. 6497 69, 9007 4.8677 5.4758. 69. 74TL 4.7341 5. 3014 69. 5941 4.6011 5.1281 63,4517 4.4687 4.9855 69, 2898, 4, 3368 4, 7834 69. 1385, 4.2054 4.6120 68. 9879 4.0746 4.44tt 68. 8378 4.2708 68. 6883 4.1083 68, 3395 3, 9838 68. 3910 3.5570 7638 68. 24682 3.4290 3.5960 68. 0960 8.3016 3, 4288 67, 9408 ‘3.1747 3.2692 67. 8033, 3.0483 3.0962 87, 678 2.0285, 2, 9308 67.5189 | 4; 2.7973 2.7659 67, 3086 |) 2.6725, 2. 6017 67.248 || 2, B84 2.4381, | 67.0816 |, 2. 48 2.0051 66.9300 || 1,905 2. 8017 2.1126, 66.7969 || 1.206 2.1792 1. 9508 66.6008 | 1,207 2.0573 4.7896 a6. m145 |) 1,208 1, 9388 1. 6289 66.3742 || 4,200 1.8150 APENDICE © 287 (Continvegso) » bos FO be Pi ‘1961. 6946 1,954, 6891 61.5748 4, 5059 61. 4556 4, 43382, fi. 3869, 4.3410 61. 2188 4.2593 61. 1632 4.41782 60. 9841 4.0978 60. 8875 4.0173, 80. TH 376 80. 6361 70, 5212 60. 4068 60. 1756. 60, 0668 6 3. 2938 BIBL 3, B49 8, 1682 9 3.0946 59, 4015, 3.02083 59. 2525 2. gaze 59. 1840 2, 8743 39. 0760 2.8021 58, 9685 2.7305 58. 8616 2. 6590, 38, TA83 2. 5883 5A. 648 2.5180 58. Bat 2. 4482 58. 4393. 2.3789 2, 3100 22417 ino I. 21739 | 1278 4.7510 || 1,818 2.1065 [| 1.279 aera | isi | 2.0896 288 APENDICE © (Conlinvacdc} Joa Bp) I 1aa0 | 1,949. 9515 4865 9.2617 ie fb 9, 2194 1peT 8. ATTG 1868 9.1362 1,369 9, 0968 F187) 9.0549 ast | 9.0149 4si2 | g.9TE 1313 | 8, 9368 1375 8, 8595 1,376 8.8218 AsiT 8. 7846, 1,378 a 7418 1378 8, 7115 1374 | 8.8977 i | | 1880 8.6756 1881 8.6402 1,882 8, 6052 4,383 8.5707 1384 8.5366 3,433 144 1,435 1,436, 1437 1438 3,439 1440 Adi 1442 443 iad 1,445 1,446 1447 1448 1449 1450 1451 4,468 1453 1,454 A783, 3076 307k BATE 3a82 3207 3125 343 2976 2008 Dede B78 278 2677 2587 2549 2514 { APENDICE © (Continuecso} 1,455 1,456. 1457 | 1.458 | 1,459 | 1,460 146% 1,462 1,463 1$64 1465, 1466 1,467 1,468 1,469 1470 Lave 1472 4473 atk 1405 1476 1477 1478 1,479 1.480" 1481 1,482 | 1483, 1484 1,485 1,486 1487 1,488 1,480 joe Tih 1947. 2484 259 2437 aig 2406 2397 2893 2892 2398 289 low T 40) 1,947. 4058, 7.4188 7. A812 7. 440 7.4572 4708 7 ABAR 7.4992, i Ota 79226 7.9607 7 B12 8.0161 ons APENDICEH © 200 (Continvac8o) ee tog PW) soe PO) i | F048, 0671 | 60 | i949, 2159 7,950. 8830 g.0832 | 1,561 49, 2587 50. 8880 s.1i96 |} 1502 49,2938 |) 1,597 50. 9395, 1,828 g.t4e5 | 103 40, 3344 50. 9933 1529 8.1738 | Ae 49, 3183 31.0475 4530 | 8.2015 | 2,65 48.4160 1.1020 1s3t} 8 2285 | 1,566 49.4583 BL. 1569 12 8.2580 || 1,567 49.5004 51. 2122 1933 8.2868 | 1,588 49, 5429 51. 2678 184 | BBLOL | 1,509 49, 5857 51. 3240 1,635 | 8.3457 i 1,570 49, 6289 | SL. 3804 1.536 83758 | LaTi 49.6735 | 544372 1.537 8.4062 |; 1,872 49.7165 || 44 51.4943, 4.538 8.4370 || 1873 49,7609 || 1,608 61, 5589 1,539 8.4082 : 1,814 49. 8056 | 1900 51. 6098, 440) 8.4908 || 1575 49.8508 |) 1,610 BI 6680 11 | 8.58 | 1976 49 8963 |) 1,611 BL, 7267 2 85882 | 1STT 49.9492 |) 1,612 BL. 1887 L8 8.5970, | 49.9885 | 7,613 Bi. B45 4546 8.6n02 | L879 50 0351 | 1044 51. 9048, 1515 8.6638 |) 1,580 50,0822} 1,615 51. 9649, 1556 gen | 1,581 50.1296 | 1,616 52.0854 147 g.73aL | i582 SOA | 1,817 52,0863, 18 8.7608 || 1583 BO, 2255 | 1918 58.1475, 1549 $8019 | 1,554 60, 2741 i 1,619 52.2091 1,550 Basz4 |) 1,585 50, 3230 4,620 52.9710 1,581 g.gtas | 1,86 oG 8723 || 1.621 52, 8333 1552 8.9096 |] 1,587 50.4920 || 1,682 1,053 8.9463 | 188 50.4720 || 1.623 1Bie 8.9836 | 1,580 50.5225 | 1,624 1.886 9.0208 | 1,990 90.5788 | 1,685 1.556 9.0587 |) 1,591 50.6245 | 1,66 LAT 9.0969 || 4,592 50 6760, | 1,687 18 9.1355 || 1.593 50.7280 | 1,688 1,559 9.1745 |) 1,594 50,7803 | 41,629 toe Fe 1,982. 9107 2.9766, 3.0480 | 8.2087 3.1767 Baga 3.3120 3. 8801 3.4486 3.5178 5.5867 8. 66 3. 8628, 3. 9888, 4.0097 4 0818 4.1536 4, 2260 4.2989 4.3721 4 A456 4.5195 4. 5988 4, 6084 47a 4.8987 4. 8944 4.9704 5.0408 5.1288 5.2007 5, 2782 5. 3560 APENDICE C sContinuacso} P lox DOr) 1955. 4342 5, 5197 5. 5016 5.6708 5, 7504 5.8303 | 5.9005 | 9705 58. 73 58. B84 88, 9409 59. 0037 89, 1268 58. 208, #9. 3141 39. 408% 60,0771 60.1740 60. 2719. 60, 3688. 60, 4607 60.5850 80.6636 6, 7635 60, 8618 60, 9814 Gt. 0613 61, 16168 G1, 2622, 61, 3632 G1. 4045 61, 5861 1. 6681 202 APENDICE © (Continuagéo} Pe tor BO) e > | | i 961, 7704 | 1,770 | 7,965, 5606 | 1,805 | 1,969 7515 1.8730 6.6749 | 1,806 69 870 1.9760 1772 678m || 1,807 70, 0029 2.0793 1773 5.9043 || 1,808 70, 1298 21830 || 1,774 6.0195 |} 1,809 70, 2858 2.2889 || 1,775 6.1380 || 1810} 70,9898 aang | 17% e250 |] tei | to. sous sag5a 1,777 6.8078 |} 1 g12 70, 6369 26009 | 1,778 6.4836 | 1.813 70, 7646. 2.7089 || 1.779 coo | 1,814 70. 8987 2.88 || 1,780 67176 | 1816 71.0811 aer7s | 4,781 6.8351 | 1,816 74, 1488 30a | 1,782 6.9599 || 1g17 71. 2788 . 1,783 7.0710 |) 1,818 71. 4082 1,784, 7.1895 || 1,819 71, 5878 1,785 7.3082 |) 1,820 71. 6678 1,786 ragia | ea | Tost 507 || 4,787 7S |} 1,822 Th. 928 3.6690 | 1,788 7.8608 | 1,823 | 72, 0506 R776 || 1789 7.7806 | 1824 72, 1908 8.8808 |} 1,790 7.9010 | 1,895 72,3004, 39958 | 1,791 8.0277 | 1,826 72, 4542 4.1055 |} 4,792 8.1488 | 1837 12, 5864 a.orss || 4798 savor | i828 72. 7189 4.8058 || 1,794 aso | 2ae) | Ta.8at7 4.4354 || 1,795 acs | 1880 72, aB18 4.5403 |] 1,796 aesoL | 1881 | 78aIBe 4.06586 | 1,797 g.7oss |) 4,g32 | 73,2590 4.7708 | 1,798 8.8818 | 1885 | 73,3880 4, 8821 i 1,799 3, 0081, | 1834 | 78, 0204 4.0044 |) 1,800 aigs7 || 1,835 | 3, 6551 8.107) | 1,801 aang’ 1 1,836 | 73, 7900 5.2199 |) 1,802 v.aws || aas7 | 78,9258 5.3381 |) 1,808 9.501 || 1,838 | 74 O610 B.AMF |) 1,804 9.6263 | 4889 | 741969 1,974, a1 4.4697 4. 6065 4.7487 4.8812 5.0190 5.1574 APENDICE © (Continuacéo} toa Pe 1,979, 2900 T9, 4433 79. 5908 79, 7389 78, 8871 80. 0356 50 1844 80-8335 80 4830, 80, 6327 80. 7827 80,9381 81, 837 81. 2846 81.38 81, 6374 81. 6893 81. 8414 81.9939, 82. 1465 82, 2996, 82. 4530 82. 6006 82, 7608, 82, 9148 83, 0693 88. 2040 83 8793 83 6348 83, 6905 83, 8465, 84. 0028 84. 1595, 84. 3164 84, 4738 | # joa Tee) 190 | 7,984, 6301 ist 84, 7890 1a At O47L a3 85, 1055 ad 85, 2642 Lats 85 4232 La16 85, 5885 1.517 85 7421, 18 | img | 1,990 | . Loot 86. 3834 1922 86, 5445, 1,823 86. 7058 1.984 86, 8675 87.0294 87.3436 88 OTS 88 1713 88, 3556 88, 5002, $8: 6654 88, 8302 88.9957 89. 1614 89.3975 84, 4938 89 6605 89. 8974 89, 9946 90. 1621 Ba APENDICE © (Continuagéo} > sor PO jog Pe ion EO) 1,945 | 1,990. 3299 7,993. 7464 - 1,997, 2774 1,946, 90, 4980 | 3.9202 |) iss 7.4569 1987 90, 6608 4.003 |) 1,987 7, 6368 1,948 90. 8550 4, 2688 1,988 7.8169 1,949 91. 030 4.4435 | 1.989 7.9972 1,950 91, 1782 sais | 1.900 1g5t 91, 3497 4.7937 | 1,991 1,952. sn 5125 1972 4.9603 || 1,092 1953 a1. 6826 |} 1,973 3a5t 1,993, 1,954, 91.8530 | 1,974 5.3213. |) 1,994 1,955, 99,0257 | 1s | 5.4977 |) 1,095 1,956 92.1947 |} 1,976 5.6744 |) 1,996 1957 92 3089 || 1,977 5.8513 || 1,997 1,958 92 5378 | 1,978 6.0286 | 1,998 1,059 g2.7003 | 1,979 6.2002 | 1,999 1,960 92.9815 | 1,980 6. 3840 1,961 93.0539 | 198 | 6.6821 1962 98 2968 | 1.982 | 6 7405 | 1,963 98.3995 jf 1,088 6.9192 1,984 98, 5728 | 1,984 7.0982 ES ERRATA Além de alguns pequenos erros ® que n&o se fox releréncis especial, citem-se, como importantes, os seguintes; Fé. Links Onde s0 18 Dave ler-se 1 15 Estatisce Rstatistion 8 abrevido abroviada a7 12,30 12550 7 8B 12,30 12820 aw 9 12,30 12830 7 10 12,30 42530 Be 8 85,7541 24,75, 5,741 924,75 3 Ti 91,412.50 17,952.412.50 9 ae y= 18 18 v5 48507 ABGRCD DM DM Bs 23 ae ° My, Mf, m6 forem on ao ne forem ou forem 8 89 S(e) e Sy) S(X) 0 8(v) 9 kT fits fe 12006 secunddrios é: és: 124 Fa beeston aT betteamtet Obie sate h Chad no Fete te Bh tty Be Foe btess, Sip. q) ua 6 fu= PE 100] 8 uns (Po Gs) , S (Poa. 8 iq ps) Sipeted .. 8 lay me) ua og {Fo gi) 8 (ay pa) arated z S (peed ~ Sige rh 8 (Doge) (Gu Pad 1009 1989 1938 wee caiieira cadeia OB ding domingos Pag. a 192 200 225. p25, 227 282 255 Linke 6 10 uw i ” Onde se le equagées normaie da recta: os abtides {a dos valores dos meses) roctilioes uma ven 6: uma ver a extraccio simultines de 2 botox direita F (6486 Deve terse equagies normai as obtidas (a das valores dos meses de Janeiro) horizontal & & en conjunto, a extracyho de 2 dolae esquerda ¥ (6488) INDICE DOS GRAFICOS 1.4-Histograma © poligona de frequincias correspendontes ao quadro nL... , Lee . 41.2~Tipos de curvas de trequénciag, quanto 4 simetria 1.3-Tipos de curvas de frequéncias, quanto 4 curtose . 2.1-Determinasio gritiea da mediana © dos 1° «3° qnartis, Ble montos do quadron? 210... . 5.1 ~ Indieo de pregos de retalho ¢ indice ponderado, Diagrama de dispersfo. see . Done 5.2~ Altitudes ¢ presses atmosfixiens em algumas estagies metoo- rolégieas do Continente. Diagrama de disperefia . . 5.3—Linhas de rogressio, Dados do qualro nt $3... 5.4—Linhas de regrossiio. Dados do quadron? 37... 5.5—Linhas de regrosetio do indice ponderade {1°} sobre o indice de prevos de retalho (X}, @ zonas de dispersio .. 2... 8.1—Valores oure da pesca desembareada no Continente © Mas, WOB-19BT. Dados mensais. 9.2 Pesea desembarcada na Continente © Uhas, 186-1937. wiensais. (Valores em our ¢ em moella eorrente) . . 4.3-Valoros ouro da pesea desembarcada no Continents » Ilhas, 1897-1987. (Liinhas de tendéneia geral obtidas par yeio de ajustamento: de wea linha recta, de uma pardinia do 2° grau, ce uma pardbola do 8. grau, de medias méveis). .. . 9.4 Ajustamente de uma curva de Pareto a rendimentos de indivi- duos norte-amerieanos . oe See . 9.5-Valores ouro da pesea descrnbareada no Continents ¢ Whas, 1897-1937, eliminada a tend®ncia geal... Lea 10.1—Distribuigdo dos mavores saidos em 255 extracctes do 8 bolas de foto, Poligona de frequéncias todrieas ¢ histograma de fre quincias reais. 2.) Pee Dados Pays, 8 9 9 29 cy 80 cy 99 178 189 198 233, 298 INDICE DOS GRAFICOS Page. 10.2 - Distribuigdo do nimero de dias de chuva em 155 semanas em Vonta Delgada, Peligone das frequancias tedricas e histoprama das frequineias reais. 238 10.3 - Histograma ¢ curva normal ajustada as alturas de 1.572 esta- dantes do Licen de Gil Vieente. 2... 247 10.4 Histograms e curva tipo I ajastada aos pesos de 400 ginastas do Gindsio Clube Portugués... - 6B INDICE DOS QUADROS 1.1-Proye ne produtor da arroba de batatas nos 18 distritos do ContinenteemiM2.. 2, : 1.2-Produsio de trig por quintal métrico someado {1 Regitio Agreoig) : 1.3-Produpo do trige por quintal mstrico semeado (Contiacnte) 2.1-Cileulo da média aritsudtiea ponderada. Dados nko classifi- cados. Provesso longo... 2... Sees 2.2—Calealo da média aritmética ponderada. Dades nao classifi- cados, Primeiro métode abreviado: desvios expressos na uni- Gade dosdadoss 2.3- Cileulo da média aritmétiea ponderads. Dados nZo classiti- cados. Segundo método abreviads: desvies expresson na ozdem das medidas. Classiticaydes de alunos do sexo masculine aprovadlos no exame da 2.* cielo, nos Liceus de Lisboa no ano lectivo de 1943-44 (ensino oficial, particular ¢ maiores ¢ emaneipades} Pee eee ee 2.4-Cileulo da média aritmétion ponderada, Dados elassifieados. Processo longo. Elementos do quadie 2 13... . 2.5~Caleulo de média geométrics ponderada. Dados nfo classi- ficados. Elementos do quadron 2.1... . see 2.6~Caleulo da midia geométrica ponderada. Dados classitieados, Elementos do quadtont1.3. 0.0.0.0. ....00~ 2.7-Ciileulo da nédia harménica ponderads. Dadus ndo claseifi- tados, Elementos do quadron’2.1. 0. .....2.~, 2.8—Céleulo da média harméniea ponderada. Dados classificados, Elementos do quadro n° 1.3. . See 2.9-Ciilenio da medians. Dados nfo classificados, Alunos inseri- tog em cada uma das eseolas tenicas elementares do Conti- nente ¢ IIhas no ano lective de 1941-42... , Page. 13 4 1 1 20 22 300 INDICE DOS QUADROS 2.10-Caleulo da mediana. Dados classificados. Elementos do quadro net wee 2.11 -Pragos do quilogramaa de agtiear refinado brance nas eapitais dos distrites do Continente em 15 de Janciro de 1941 (Céleulo damoda). betes 2.12-Determinagio da classe modal de uma distribwigha de fre quéncias plarimodal. Presslio arterial maxima, depois do e3- forso, de 327 rapazes nZo desportistas da Movidade Portagaesa 4.1-Ciliculo dos quatro primeiros momentos, Dados aio elassifi- cados. Utilizayle de ama média imagindria, Elementos do gquadremt$4 3.2 Céleulo dos quatro primeiros momentos, Dados ndo classifi- cados, Utitizagie da média aritmcties exacts. Elementos do gvadrone 1d... bee 8.3~ Cileuto dos quatro primeiros momentos. Dados classiticados. Elementos do quadro te LS... 8.4-Cilonlo da desvio médio a partir da modiana, dos preges do acioar rofinado brance, por quilograma, nas capitais dos dis- writes do Continente, om Janeiro de IM... 3.5 Caleulo do desvie médio, a partic da métia aritmética, dos pregos, por quilograma, do apdear refinade branco nas eapi- tais dos distritos de Continente, em Janeizo de 141... $.6-Citewlo do desvie media, a partir da média aritmetiea das alturas de 384 rapazes nio desportistas da Mocidade Porta- guesa, Dados classifiesdos ©. 8.7-Célonto do dervie padeio. Dados aio classilieados, Desvios contados @ partir da média aritmética, Elementos do quadrats. ee 3.8-Cilealo do desvio padrio, Dados nic elassificades, tos doquadomtd... ee tae 3.4 Cilloulo do desvio padedio, Dados nioclassifieados. Desvios contados a partir de nma média imaginiria. Elementos de gradromett ee 3.40-Ciloulo do desvie pairio. Dados classiticadas. Blemontos do guadron? 4.3. : 3.11 ~ Couto do desvio pairio. Dados classiticades. Desvios eon tados a partir da média aritmética, Blementos do qua- drone13. . 3.12—Caleulo do desvio parrdo, Dados classificados. Desvios contados de uma média imagindria, lementas do qua- ana. ee Pigs, 28 BL INDICE DOS QUADROS 301 Phes. 8.13-Cileulo da diferenga médis. Dades nic classifieados. Ele- mentos do quadone tt... 58 3.14-Caloulo da diferenga média, Dados classificadas. Elementos do quadro mn? 1B. 60. 8.1- Indice de precas de zetatho em Lishoa ¢ indies ponderade do custo da alimentayo © de outros produtes de eonsumo damds- tieoem Lisboa se. tea 5.2 Alturas ¢ pesos de 384 rapazes no desportistas da Moridade Portugness, (fabua de correlayZo).. W 5.3~Céteule do cevticiente de correlacho reetilinen entre o mimero do alunos que fizeram, com aproveitamesto, 9 cxame da 4 classe do ensino primdrie. Eo mimero de alunos que reqne- reram exami de admissio aos liceus nos distrites do Conti- nentoeno anode I a 5.4-Caleulo de eovticiente de corrclacie rectitinea entre as vat vela X ¢ ¥ do quadro n° 8.3, Desvios eontados a partir de médias imaginivias, 5.5 -Cilealo do coefigiente de correlagtio rectilinea entre as varid- veis Ne F do quadro v.* 5.3. Desvios gontados das médias aritméticas exactas . . cae en) 5.6~ Altitudes © pressdes atmostézicas em 16 estagus meteorold- gieas do Continents. . See 88 5.7-Cileulo do eoeficiente de correlac3o rectilinea entre alturas ¢ pesos de 384 rapazes nile desportistay da Mocidade Portuguesa. Dados classiticados . . . . . Fee 5.8 - Cstouls do erro padrdo de regress¥e do iudiee ponderado sobre © indice de preyos de retalbe. 2... . f02 6.1-Célenio das médias ponderadas doe valores de X existentes nas trés primeiras linhas do quadra ne 8.7... 0... 108 6.2~Caleulo de yy. bees 110 6.3-Cileuto das médias ponderadas dos valores de Y oxistentes nas duas priawiras colunas do quadro n.° 5.7 ne 64-Cilowo de qe. ee ce ND 8.5-Ciileuto do coeficiente de correlagio ordinal. Campeovatos Nacienais de Fatcbol de 1040-4£ ¢ HM1-42: lubes classifi- endos nus T primeitos lugares... 2 ee see Hb 7.1-Célouto dos cavficieates de correlagio parcial secundirios. ‘ros varidveis: alturas, pesos e perimetros toriixices médiog de 400 ginastss do Gindsio Clube Portugués... 2... iat 302 INDICE DOS QUARROS 7.2—Cileulo dos cooficientes de correlapo parcial sccundirios, Quatro variiveis: alturas, pesos, perlmetros tozdxicos médios © capacidades vitais de 400 ginastas do Gindsio Clube Por. fugues, 7.8-Cileulo dos ceeficientes do correlagio parcial terciétios, Quatro varidveis: as do quadro n2 7.2. a 74 -Comparacao dos eveticientes de correlagia priaitios com os tercidtios. © 2. , . Fee 8.1 - Populacio do Portugal Continental, 1800 ¢ 1940, 8.2-Presos midios das legumes, no Continents, © respectivas produgbes oe rn 8-5 - Comparayo de indices de base fia, de base mv» om eadeia, sateuiados por meio de uma térmala da tipe agregativo nie ponderado 5-4~ Comparagao de fndioes de base tiva, de base mével ¢ am eadela, calculades por meio de uma Zérmula do tipo agregativo ponderado 5.8 ~ Comparagio de indices de base fixa, de base mével e em eadeia, caleulados por meio de uma média de indices nZo ponderados 8-6 Comparayiio de incdives do baso fixa, de hase msvel v ome eadeia, calenlades por meie da midia geométriea de indices nie ponderados. _ rn %A-Diforonyas finitas. bee -2-Ajustamento de uma linha recta, Bacalhan verde pescado pela frota baeathosira © desembareado no Coutinente porta gues. See, 9-5— Cilculo e eliminagdo da tendéncia geral. Ajustamento a uma roota, Pevea desemvarcada no Centinente © Mhas. Valoros euro (contos}. Medias anuais de dados mensais tae 9-4 Caleulo da teadéncia gral. Ajustamento a uma recta, Dados Ho quatro ne 9.8. 9.5~ Caloulo e eliminayfio da tondéncia geral. Ajustamento a uma pardbola do 2° gran. Pesea desembareada io Continente ¢ Mhas. Valores ouro (contos), Médias anuais de datos mensais 9.6~ Calcul ¢ eliminagio da tendtnein gerai. Ajustamento a uma pardbola do 3 grau. Pesca desembareada no Coutinante ¢ Hhas. Valores oure (contos}. Médias anuais de dados menaais 4.7-Célealo da tendincia geral. Ajustamento da earva do Pareto a uma distribuisfo de rendimentos dos eidadios amaricavos Pigs. 126 131 182 140 141, 158 159 160 178 17a 132 184 188 INDICE DOS QUADROS 9.8-Cileulo da tendoncia geral. Médias méveis. Yalores ouro da posea desembarcada no Continente ¢ Ihas. . . . 9.9—_Determinagio dos vatores mensais da linha de tendéncia geral calenlada peta método das médias méveis, Dados do qua- aro n° 9.8. 8:10-Ciateula doe indices das utuacies estarionais, Método das nuddias mensais. Valores ouro da pesca desembareada no Continente e Thas, no periedo 1925-30. . 9.AL~Clowlo dos indices das flutnagées estacionais. Mitodo das médias monsais (pereentagens destas médias). Mesimos dados quo no quatro B0 2. Lee 9.12-Valores mensais da tendéncia geral calewlados por meio da oquagio ¥ =512,863+ 0,809: com ozigem no meio de Junho ae 117 _ 9.18~ Pereentagens da tendineia geral: valores do quadro 2° em pereentager das do quadre n.° 9,22 9.14—Médias méseis centradas de 12 meses, obtidas a partir dos dads do quadra ne 9.20 : 9.15 ~ Caleulo das méiiias indveis, do 12 meses, eonteadas 9.16 -Cilenlo dos indices das sImtuagdes estarionais, Método das médias méveis, Valores de quadre ne 9.10 10 9.17-Ciileulo dos indines das flutages estacionais pelo método dos fadiecs em carieia mensais. Valores gure da pesea desem- bareada a9 Coutinente ¢ thas, 1897-1987 . 9.18 - Comparagiie dos indices de flutuacSes estacionats 9.19-Céloulo dot movimestos eivlicos ¢ irregulares. Valores oura da pesea descubareads no Continente ¢ Whas, 1980... . , $.20-Cileulo dos deevios dos valores ciclieo-esporddicos. Valores ouro da pesea desembarcada no Contineate © has, 1930 10.1 -Distribuigo de maiores saidos em 256 oxtaoyies de 8 tetas de lot 10.2-Dias de chuvs, por semana, om Ponta Delgada, nos anos de 1940 2 1942. Céleuto da média aritmética v de 7? 10.3-Céleulo dos temos do desenvolvimento da expresso 155 (0/5508 + OMB 10.4 ~ Alturar de 1.572 estudantes do Lieon de Gi! Vieente, de17 anos deidade see 10.5- Sistema de curvas de Pearson 10.6-Ciéioulo das ordenadas da curva normal ajustada as alturas de 1.572 estudantes de 17 anos do Licen de Gil Vieente 303, Pigs. 192 194% 201 203 206 207 20 22. 214-5 217 232 2B 235, 244 248 BOL INDICE DOS QUADROS 10.7~Culeulo, pelo métode das dreas, das froquéncias tedricas de cada classe da distribuigto das alturas de 1.572 estudantes do 17 anos de Liewu de Gil Viento... : 10.8-Céleulo do grau de ajustamento da curva normal As alturas dv 1572 estudantes de 17 anos do Licen de Gil Vicente 10.9- Pesos de 400 ginastas do (indsio Clube Partagnds. . 10.10~Citeulo das ordenaidas da carva tipo I, ajustada aos pesos de 400 ginastas do Gindsio Clube Partugués oe ‘ilenlo das ordenadas a levantar nas daas primeiras dreas parciais da eurva tipo J, ajustada aos. pesos de 400 ginastas 10.12—Ordenadas ¢ dreas pareiais da curva tipo I ajustada aos pesos de A00 ginastas. . tee 10.15 Célealo de gran de ajustamento da eurve tipa T ave pesos de 400 ginastas. . . en 10.14 Pigs. 248, 251 28 260 262 INDICE SISTEMATICO DAS MATERIAS CAPITULO 1 Distribuicies de trequéncias 1.1 -Nogdes fundamentais : 1.2- Organisagfo de uma distribuigio de érequéncias 1.8~Distribuipdes de frequéncias. Representarle gréfica CAPITULO 2 Medidas de Posicao 2.1 -Detinigio 2.2—Desvios 2.3-Média aritustiea simples. Dados ufo clasificados . 2.4-Midia aritmétics poudorads, Dados no classificados. Pro- cesso longo - . a 2.5~Media aritinstiva ponderada. Dados ado clasificados. Pri meiro método abzeviado: desvios expressoe aa unidade dos fades. : 2.6-Média aritmétion ponderads, Dados aio lacstivados. Se- gundo métoda abreviado: desvios expresso: na ordem das medidas. : . 2.7-Média aritméticn Doane Dados clasifieaden. Prycesso longa. : 2.8-Média avitaéticn pooderaia. Dados clasificados. Primcira Processo abroviado: desvios expressos na unidade dos dados 2.9-Média aritmética ponderads. Dados classiticados. Segnndo processo abreviado: desvies expressos em intervales de classe crs ut tt aw 1 16 iT 18 306 INDICE SISTEMATICO DAS MATERIAS 2.10- Média geométriea simples. Dados nao classificados . : 2.11 - Média geométriea ponderada. Dados no clsssificados. . . 2.12- Média geométrica ponderada. Dades classificados. 2.13~ Média barménica simples, Dados nia classifieados. . . . %-14- Média harménica ponierada. Dados no classifieadas 2.15-Média harmdnica ponderada. Dados classifieatos 2.16-Mediana, Dados fio classificados. ©... 2.17- Medians. Dados ufo classifiesdos inas agrupados. . 2.18-Mediana, Dados elassifieados. Processo numérico, 2.19~Mediana, Dados clasificados. Processo grafico. : 2.90- Quartis, quintis, sent, desis, cents, ete, Dados nfo classitic cados. 2.21 - Quartis, deeis, ete. Dados clatsiticados. Processo numérico. 2.22~ Quartis, sextis, ete. Dados classificados. Processa gritico. 2.25- Moda. Dados no classificados . 2.24 -Moda. Dados classificados CAPITULO 3. Momentos ¢ Medidas de Dispersio 3.1- Momentos. Dados niio clasificados. Lelia de uma mé- dia imagindria 3.8-Momontos, Dados nfo clasificados, Uilizagdo da wéfa oxacta 3.3-Momentos, Dados elassificados . 5.4-Disporsiio. Detinigao. . . Medidas de Dispersiio Absoiutu. 3.5~0 intervaio total 3.60 intervalo 10-90 rentis 3.7 ~0 intervalo quartil 4.8-0 intorvale semi-quartii . . . 5.80 desvio inédio ealoulado u partir da mediaza . 3.10-0 desvio smédio eateulado a partir da média aritmétics. Dados nfo clasificados. ©. 3.11-O desvio médio caiculado a partir da rnédin aritemética. Dados elassificados. oe ce B.AB-O descio padrio. Definigio « propriedades. Pigs. Beees8 a7 Bae & PRESS Bay INDICE SISTEMATICU DAS MATERIAS 3.18~( desvio padziio. Datos no classifieados, Desvies contados a partir da média aritmétiea rn 3-140 desvio padriio. Dados aio classitieados. 3.15~0 desvio padre. Dados nifo claseificados, Desvios tomados a partir de uma média imaginavia 3.16 ~ 0 desvio padrio, Dados classificados Sk 3.17-O desvio padzie. Dadios classificados. Desvios contadus a partir da média aritmétiea Fee 318-0 deavio padrie. Dados elassiticados. Desvies cuntadus de uma média imagindria . : 3.19 A diferenga médis. Dados nde classticados -20- A diferengs média, Dados clasificados 3.21 - Rolagties entre as medidas de dispersiio absoluta Medidas de Drigpersito Relativa. 3.22~ Generalidades . - . 3.23 ~ Coeficiente de variagio . CAPITULO 4 Modides de Assimetria 2 do Curtose 4.1 ~ Os covficientas beta . 4.2—Medidas de assimetria absoluts 4.3~ Medidas de assimetria relative 4.4—Medidas de eurtase absoluta ¢ relativa os CAPITULO & Corralacdo Simples Rectilinea 5.1—Nogies preliminares .. : 5.20 diagrama da dispersio. 4 tba de eormulayge 3.3-0 eoeficiente de correlapie reetilines. Delinigia 5.4~0 cocficionts de correlagiia rectilinia, Dados ni elassitiendos Primeiro prazssso de edleulo . . Fee 5.5~0 cocficiente de correlarSo reetilinca. Uados nfo elassiliea- os, Segundo processo de cdloulo: deevies contados de médias imagindriag, Se . 307 Pigs. iB 9 81 308 INDICE SISTEMATICO DAS MATERIAS 5.6-0 coeficiente de corzelagio reetilines. Dados niio classities- dos, ‘Terceiro. processo de cdleulo: desvioe contades das mé- dias aritmétions 2... = 0 eosticiente de cosrlapte rectilinen, Dasdos nia clacsiiiendos. Quarto processo de eileulo . 5.8~Q cocficiente de correlagio rectilinea. Dales io clasificados. Quinto processe de edieulo 5.9-0 cvoficiente de eorrelasdo rectiinca. Dados elassificalen . . 5.10 Ae equagtes @ os cocfieientes de regres, Generalidades . . 5.11 - As equates de regressiia. “Dados niio classificades. Primeiro procesto de cdleulo. 5.12 As equagdes do rogressio, Datlos nio clasificados, Seranto pracesso de céleale. ce 5.13~ As equagdes de regreasis, Dados classiticados 5.14- 0 erro padrio de regreseiio. Generalidades . 5.15 - Céleulo do erro padrio de regressio. 4.16 Resumo do capitulo e limitagdes a0 uso do costiciente de cor rolago reetilinga ee CAPITULO 6 Outros Tipos de Correlagio Simplos 6.1-Corretaglo curvilinea, Generalidades 6.2—0 eveliciente de correlagiie currilinea 6.3 ~ Céloalo do couficiente de correlagio curvitines 6.4~ Rolagdes entre re 5 8.4 -Limitayées a0 uso de », 6.4~0 cocficionte de eorrelapso ordinal CAPITULO 7 Correlacdo Parcial. Correlacdo Multipla 1- Generalidades . . 2 Resoluglo de um prablema do eorselaydo a tris variaveis 5 Resolugiio de um problema de correlagio a quatro varidveis Piss. 5 a or 105 307 107 108 3 td 13 119. ng 127 INDICE SISTEMATICO DAS MATERIAS 308 CAPITULG & Némeros-indicos Pigs, 8.4 - Genoralidades . . ce 139 8.2~Tipos de indices : : L240 8.8~ Problemas relacionados com a elaboragae de em aémero-indiee 151 CAPITULO 9 Andlise das Séries Cronolégicas 9.1. Genevalidades. - fee 165 9.2 Movimentos presentes auma série eronolégics.. 165 9,8~ Orientagho a seguir ne estudo de uma série erenolégiea 167 9.4—Preparacio dos dados os , . - 168 Eshide da iendtweia geval. 9.5-Tipes de tendéneia geral. Sua escelha cee 17 9.6-Linba recta . 175 9.7 -Curva do segunde grav 179 9.8—Curva do toreeiro grau. eo 181 9.9-Curva exponencial . . . . : 188 9.10- Curva logisties . 184 8.11 Dupla escata logaritmica. A distribuigdo de Proto 186 9.12 Método grifico Lae 190 9.18 - Médias moveia. . - . . 190 @.14- Valores mensais do linka de tendéncia geval. . 192 Eliminago da influéncia da tendoncia geral . . 197 Estndo das flatwagten estavionais. Tipos de flutuagies estacionais. Sua excolha . 199 9.17 - Medias mensais 200, 9.18~ Percentagens da tondincia gecal. : 204 9.19- Médias méveis Be 206 9.20~ indices em cadvia mensais. 208 9.21 - Eliminagdo da influéneia das tutuagses estacionais a1 310 INDICE SISTEMATICO AS MATERIAS Estudo das flutuagies cicticas. 9.22 Método dos residues . 9.23 - Comparacio de movimentos siclieos Correlagiio de eevies cronalégicas, #.24~ Generatidades Fee $.25 -Corrslagio simples , 9.26 - CorrelagSe parcial . 9.97 - Medigde do atrazo de uma sésie em relayko a outea CAPITULO 10 Ajustamento de Curvas J0.1-Neyflo de probabilidade. an 10.2-A disteibuigto binomial. 0 ajustameow do eurvas 10.3-A distribuigio normal A curva normal do erro, . . 10.4~ 0 ajustamento A curva normal. . W.5~O ajustamento & curva tipo I do sistema de Pearson Errata... Be eee indice dos griticos . indice dos quadros =... Page. 23 216 218 21g 228 22288888