2 - Apostila Estatistica - UERJ

Universidade do Estado do Rio de Janeiro - UERJ Faculdade de Formao de Professores - FFP Departamento de Matemtica
Material de apoio ao aprendizado das disciplinas de Estatstica e Bioestatstica
Professora: Viviane Ctia
!ler
"o #onalo-RJ
Introduo
A Estatstica encontra-se presente em todas as reas do conhecimento humano: cincias sociais, cincias humanas, cincias exatas, etc. Isso ocorre porque cresce cada vez mais a utiliza !o de suas "erramentas com a "inalidade de encontrar respostas a per#untas do tipo: $ual o consumo m%dio mensal de com&ustvel de uma determinada re#i!o do Estado' $ual o ndice de pre os ao consumidor do ms de dezem&ro' $ual a propor !o de pe as de"eituosas da linha de produ !o de uma empresa (' )er que o ndice de reprova !o "oi reduzido com a introdu !o de novas t%cnicas de ensino' $ue porcenta#em de determinado elemento qumico est presente numa amostra de de*etos da empresa (' $ual dever ser o possvel valor m%dio de retorno "inanceiro de um determinado evento' $ual a pre"erncia do eleitorado em rela !o aos candidatos + ,residncia da -ep.&lica'
O que Estatstica?
/e acordo com o dicionrio Aur%lio, Estatstica pode ser de"inida como: parte da matemtica em que se investigam os processos de obteno, organizao e anlise de dados sobre uma populao ou sobre uma coleo de seres quaisquer, e os mtodos de tirar concluses ou predies com base nesses dados. 0 termo estatsticas, no plural, tem o si#ni"icado de dados num%ricos representativos de uma varivel analisada, enquanto estatstica, no sin#ular, % o mtodo utilizado na manipulao de dados, isto , o mtodo de coleta, de elaborao, de anlise e de interpretao dos dados numricos. Apesar de sua simplicidade, essas de"ini 1es nos permitem enxer#ar os vastos campos de a !o da Estatstica. ,odemos dizer que n!o h praticamente nenhum ramo do conhecimento humano em que ela n!o tenha utiliza !o. Estatstica % uma "erramenta que nos ensina procedimentos l2#icos de o&serva !o e de anlise, necessrios para aproveitar ao mximo os conhecimentos de outras cincias. 3om &ase nos conceitos de Estatstica apresentados anteriormente, daremos, a se#uir, a de"ini !o que ser adotada como &ase para o seu aprendizado. A Estatstica consiste em um con*unto de m%todos e processos quantitativos que nos auxiliam a coletar, analisar e interpretar dados de acontecimentos coletivos e tirar conclus1es em situa 1es em que a varia !o e a incerteza est!o presentes.
Dados
5m tra&alho estatstico envolve um levantamento e uma anlise de dados. 0 que s!o dados' /ados s!o in"orma 1es o&tidas atrav%s de o&serva 1es, conta#ens ou respostas "ornecidas por pessoas. Exemplos: 6 478 dos eleitores da cidade do -io de 9aneiro votar!o no candidato do partido (:. Isso si#ni"ica que, atrav%s de uma per#unta "eita a eleitores da cidade do -io de 9aneiro, o&teve-se a resposta de que 478 do total votaria no candidato do partido (:. 6 Apenas 118 dos consumidores pre"erem consumir um produto de marca ou empresa que possui propa#anda mais chamativa e envolvente. ;Fonte !nstituto "# $ata, %ul&o de '(()< ,ode-se dizer que, a partir de um levantamento da opini!o dos consumidores que "oram entrevistados pelo Instituto E= /ata, apenas 118 pre"erem adquirir um produto de marca ou empresa que possui propa#anda mais chamativa. /epois que os dados s!o coletados, devem passar por al#um tratamento. Esse tratamento permite orden-los, por exemplo, em ordem crescente, tornando-os mais "ceis de serem tra&alhados. 0s dados que n!o so"rem qualquer tratamento s!o denominados dados brutos. /ados &rutos s!o in"orma 1es o&tidas atrav%s de o&serva 1es, conta#ens ou respostas "ornecidas por pessoas, mas que n!o so"reram nenhum tratamento estatstico. Exemplos: 6 )er realizada uma pesquisa eleitoral com 4.>?? eleitores da cidade de )!o @on alo. 0s dados &rutos s!o as respostas da pre"erncia dos eleitores sem nenhum tratamento estatstico, ou se*a, os dados de respostas n!o est!o em ordem crescente nem or#anizados de acordo com as respostas dadas pelos entrevistados. Isto %, o que se tem s!o apenas as respostas dos eleitores entrevistados, mas n!o h nenhuma in"orma !o tratada so&re eles. A!o se sa&e quantos votar!o no candidato ( ou no candidato:. 6 Boi realizado um levantamento das idades de 1.??? estudantes do ensino m%dio em Aiter2i. A!o "oi determinado o n.mero de alunos em cada idade. Cem-se apenas um n.mero de alunos e valores re"erentes +s idades, por%m sem nenhum tratamento estatstico mais detalhado, ou se*a, somente o resultado de uma conta#em.
Etapas da Estatstica
0 estudo da Estatstica pode ser conduzido dividindo-se todo o conte.do em > etapas: determina !o do o&*etivo, coleta de dados, anlise dos dados e conclus1es e in"erncias.
/etermina !o do o&*etivo
A determina !o do o&*etivo % a etapa inicial de um tra&alho estatstico. ,ode-se dizer que % D
uma das etapas mais importantes da Estatstica, pois nela est concentrado todo o "ormato que a pesquisa dever tomar. )e o o&*etivo da pesquisa estatstica n!o estiver &em de"inido, de "orma &em clara e detalhada, os dados coletados poder!o n!o indicar as verdadeiras caractersticas daquilo que ser analisado. Aesse caso, a coleta de dados estar comprometida, assim como o processo de anlise de dados e, conseqEentemente, as conclus1es que ser!o utilizadas para se "azer in"erncias. A coleta de dados, etapa se#uinte no processo estatstico, pode demandar muito tempo e, conseqEentemente, alto custo, caso o o&*etivo n!o tenha sido pr%-de"inido. Essa coleta pode n!o ser .til ou ser insu"iciente, por exemplo quando a determina !o dos o&*etivos leva + de"ini !o de outros dados que devem ser coletados. 0 ideal % que se "a a um levantamento de todos os "atores que poder!o in"luenciar o tra&alho de pesquisa para que este possa ser executado rapidamente e com o menor custo possvel. 0s principais o&*etivos s!o, em #eral, voltados para o desenvolvimento de novos produtos, investi#a !o de pro&lemas que porventura este*am atrapalhando o processo de produ !o de uma empresa, inspe !o para a #arantia da qualidade de um produto, avalia !o do relacionamento existente entre al#uns itens e melhoria dos resultados de um processo. Exemplos: 0&*etivos de uma pesquisa eleitoral - determinar a re#i!o em que o candidato tem maior aceita !o, a "aixa de renda dos eleitores, &em como idade, nvel de escolaridade, etc. Ap2s a determina !o dos o&*etivos, poderemos "azer o levantamento de dados re"erentes a nvel de escolaridade, taxa de renda, idade, etc. 0&*etivos de uma pesquisa de aceita !o de um produto no mercado - determinar a "aixa de renda do consumidor, re#i!o onde mora, ponto de venda do produto, o que o consumidor mais #osta e o que menos #osta no produto etc. Ap2s a de"ini !o dos o&*etivos, "icam mais "ceis a ela&ora !o do questionrio e a de"ini !o de quem ser!o os entrevistados. @anha-se tempo para a coleta de in"orma 1es. /epois de de"inirmos os o&*etivos, passamos + etapa se#uinte, que % a de coleta de dados.
3oleta de dados
Ap2s a determina !o do o&*etivo da pesquisa estatstica, devem-se coletar os dados ou in"orma 1es que ser!o necessrias para a anlise. ,ara que os dados possam realmente representar o o&*etivo especi"icado, deve-se escolher o m%todo de apresenta !o mais adequado, de "orma que as conclus1es o&tidas possam apresentar um alto #rau de con"ia&ilidade. 0 levantamento de dados pode ser realizado com todo o material coletado ou apenas com uma parte representativa dele. O conjunto de todos os dados chamado de populao e a parte que o representa chamada de amostra. ,opula !o % o con*unto de todos os dados so&re os quais dese*amos o&ter in"orma 1es. F o con*unto de todos os itens produzidos, todas as pessoas de uma localidade, todas as pe as analisadas, en"im, de tudo o que % o&*eto de uma pesquisa estatstica. ,ode tam&%m ser de"inida como o con*unto de elementos com determinadas caractersticas em comum. 0&serve que popula !o n!o % necessariamente "ormada por moradores de uma cidade e que a popula !o em um pro&lema depende da in"orma !o que queremos o&ter.
>
)e o o&*etivo de uma pesquisa % conhecer o nvel social de cada um dos moradores de uma cidade do interior de =inas @erais, ent!o a coleta de dados ser o levantamento dos rendimentos de todos os moradores da cidade. Essa coleta pode ser realizada atrav%s de questionrios entre#ues + popula !o, por tele"one ;o que tornaria o custo da pesquisa muito alto< ou atrav%s de pesquisadores que entrevistariam todos os moradores de casa em casa. A popula !o de dados dessa pesquisa seria a renda de todos os moradores, isto %, o con*unto de todos os dados da pesquisa. )e o o&*etivo de uma pesquisa % determinar quantas pe as produzidas por uma pequena empresa, em um dia, apresentaram de"eito, a popula !o ser toda a produ !o de pe as daquele dia. ,or exemplo, se a empresa produz 7.??? pe as, por dia, ent!o a popula !o % de 7.??? pe as. )e o o&*etivo de uma pesquisa % determinar quantos autom2veis a cidade ( possui circulando em suas vias, a popula !o % constituda de todos os autom2veis da cidade ( que est!o em circula !o. 3enso % a conta#em de todos os elementos de uma popula !o. 0 censo n!o se re"ere somente ao 3enso realizado pelo IG@E, mas tam&%m a qualquer levantamento de todas as in"orma 1es de uma popula !o de dados. ,or isso, o censo proporciona in"orma 1es mais detalhadas so&re a popula !o, mas, na maioria das vezes, % caro e di"cil de ser realizado. A popula !o pode ser considerada "inita e in"inita. Hamos ver a di"eren a. ,opula !o "inita: quando todos os itens de uma popula !o s!o conhecidos e "ixos, isto %, permanecem inalterados.
0 3enso da popula !o &rasileira % realizado periodicamente pelo IG@E I Instituto Grasileiro de @eo#ra"ia e Estatstica. 0s censos produzem in"orma 1es imprescindveis para a de"ini !o de polticas p.&licas estaduais e municipais e para a tomada de decis1es de investimento, se*am eles provenientes da iniciativa privada ou de qualquer 2r#!o do #overno. Exemplos: 60 n.mero de pe as de plstico de um autom2vel da marca (. 65ma sala de aula com 7? alunos. 6 5m hotel da rede (:J, que apresenta 1?? unidades ha&itacionais. Exemplos: 6 As &olas de uma urna utilizada para sorteios. )e elas s!o retiradas e repostas repetitivamente ap2s cada sorteio, ent!o as &olas podem ser retiradas in initas vezes. 6 Codas as pe as possveis de serem manu"aturadas. Aesse caso, tem-se uma popula !o de pe as que ser!o manu"aturadas, mas % impossvel o&ter 7
a lista de todas elas, pois a produ !o n!o tem "im. 6 Codas as visitas possveis de clientes a uma lo*a. F impossvel conta&ilizar a popula !o de clientes, pois n!o se sa&e quantos ir!o visitar tal lo*a. E!E"#$#IO% Ela&orar um exemplo de pesquisa em que se descreve seu o&*etivo e se indique quais seriam os dados coletados.
&mostra
Aa maior parte das situa 1es, a popula !o, mesmo "inita, % #rande demais para que se*a prtico levantar todos os dados. ,or isso, utilizamos uma parte que represente a popula !o. Essa parte % chamada de amostra. &mostra% % uma parte representativa da popula !o. ,ode tam&%m ser de"inida como um su&con*unto de uma popula !o por meio do qual se esta&elecem ou se estimam as propriedades e caractersticas dessa popula !o. A amostra % utilizada quando necessitamos de uma resposta mais rpida so&re a popula !o ou quando a realiza !o do levantamento de dados de uma popula !o % muito dispendiosa. ,or exemplo, % pre"ervel pesquisar as respostas de uma parte representativa dos eleitores de uma cidade a ter que "azer o levantamento das respostas de todos os seus eleitores. 3om isso, #anha-se tempo nos resultados o&tidos e conse#ue-se um custo de pesquisa muito in"erior ao que seria #asto com toda a popula !o. Exemplos: 6 5ma "&rica possui 1.???.??? de pe as em estoque. )e estamos interessados em analisar a espessura das pe as, podemos, por exemplo, tomar uma amostra de apenas 7?? pe as. A op !o pela escolha da anlise de uma amostra % melhor neste caso, pois #anha-se em tempo e em custo da pesquisa. 6 5ma amostra da opini!o de 4.??? moradores de uma cidade so&re a economia do pas. 0&serve a express!o Kparte representativa da popula !oL na de"ini !o de amostra. 0 que quer dizer' $uer dizer que, se tomarmos uma parte muito pequena da popula !o, o levantamento de dados pode ser muito di"erente da popula !o como um todo. ,or exemplo, "azer uma pesquisa eleitoral com apenas 1? eleitores em uma cidade com 1.???.??? de eleitores n!o % representativo. =as qual n.mero ou percentual da popula !o total % representativo' Essa % uma quest!o um pouco mais complexa. 5ma anlise detalhada n!o consta dos o&*etivos desta disciplina. 0s m%todos e t%cnicas utilizados para se realizar uma amostra#em ser!o analisados com maiores detalhes em C%cnicas de Amostra#em. A op !o por tra&alhar com toda a popula !o ocorre em virtude de se dese*ar o&ter in"orma 1es so&re todo o universo o&*eto de pesquisa, que % o caso do censo demo#r"ico, ou M
quando a popula !o % pequena ;a popula !o pode ser considerada pequena quando os custos e o tempo de anlise das in"orma 1es n!o s!o empecilho para tal realiza !o<. E!E"#$#IO 1< /e"inir amostra. 4< /ar exemplos de amostra. D< Em que situa 1es % pre"ervel tra&alhar com uma amostra ao inv%s de com a popula !o' >< /eterminar uma amostra para cada uma das popula 1es mencionadas a se#uir: a< 47.??? % o total de pe as produzidas pela empresa (N &< duas toneladas da su&stOncia (:J est!o in"ectando o solo de um lix!oN c< todos os consumidores de cereais do pasN d< os salrios de todos os 1.??? "uncionrios de uma empresa. 7< /adas as senten as a&aixo, indicar "also ;B< ou verdadeiro ;H<. ; < A amostra % um su&con*unto da popula !o. ; < A popula !o % uma parte representativa da amostra. ; < A amostra % a melhor op !o quando a anlise de todos os dados da popula !o toma muito tempo e % considerada de alto custo. ; < A anlise de todas as pe as produzidas por uma pessoa, durante um dia, pode ser considerada uma amostra.
&nlise dos Dados

Ap2s determinar o m%todo de levantamento de dados mais adequado, % necessrio "azer uma anlise dos dados, colhendo in"orma 1es relativas ao o&*etivo especi"icado. ,ara uma melhor anlise dos dados, % usual or#aniz-los so& a "orma de ta&elas e #r"icos e, ent!o, sintetiz-los atrav%s de medidas. Essa or#aniza !o e resumo das in"orma 1es em medidas % chamada Estatstica /escritiva. Estatstica /escritiva: % a parte da Estatstica que utiliza m%todos #r"icos e num%ricos para or#anizar, resumir e simpli"icar as in"orma 1es para que possam ser interpretadas e utilizadas com maior "acilidade. Estudaremos, nas pr2ximas aulas, al#umas "erramentas utilizadas pela Estatstica /escritiva, tais como: 6 -epresenta 1es #r"icas e ta&ulares da /istri&ui !o de BreqEnciaN 6 =edidas de ,osi !oN 6 =edidas de /ispers!oN 6 =edidas de Assimetria. Exemplos: 6 A m%dia de idade dos alunos que est!o matriculados na disciplina de Estatstica % de D> anos. 6 A m%dia % uma das medidas de posi !o mais utilizadas para representa !o dos dados. P
6 D?8 dos estados &rasileiros est!o sem ver&as para educa !o e sa.de. A representa !o percentual % uma "orma &astante utilizada para descrever os dados estatsticos. 6 0 desvio padr!o das aplica 1es "inanceiras analisadas % muito alto. 0 desvio padr!o % uma medida de dispers!o muito utilizada para descrever a varia !o dos dados estatsticos. 6 0 coe"iciente de assimetria para a distri&ui !o de "reqEncia dos pesos de uma pe a % muito pequeno. 0 coe"iciente de assimetria % uma medida que nos in"orma so&re o "ormato, sim%trico ou n!o, das curvas representativas de uma distri&ui !o de "reqEncias.
#onclus'es e In er(ncias
Essa % a parte "inal do processamento estatstico, em que os resultados o&tidos nas anlises s!o dispostos e avaliados com rela !o ao o&*etivo proposto no incio da pesquisa. Essa parte da Estatstica % chamada Estatstica Indutiva ou In"erencial. Estatstica Induti)a ou In erencial% % a parte da Estatstica que interpreta os dados amostrais e "az #eneraliza 1es so&re um experimento em estudo. Ela vai determinar, tam&%m, a precis!o e a con"ia&ilidade dos resultados o&tidos. 0s resultados de uma estatstica in"erencial s!o indu 1es ou estimativas so&re as variveis o&tidas da amostra. Elas podem ser conclusivas e podem levar o pesquisador a uma tomada de decis!o so&re toda a popula !o. ,or exemplo, com &ase em uma amostra de 4.??? eleitores, o instituto de pesquisa pode #eneralizar o resultado o&tido para todos os eleitores, isto %, se um candidato o&teve D48 de escolha entre os 4.??? eleitores, pode-se dizer que D48 de todos os eleitores da cidade pesquisada votariam nesse candidato. =as, como o resultado % &aseado em uma amostra, a estimativa do resultado vem acompanhada de uma mar#em de erro. A mar#em de erro ocorre porque a pesquisa n!o "oi realizada com todos os eleitores. 0 clculo exato da mar#em de erro % um assunto matematicamente complexo e "o#e dos o&*etivos deste curso. A "erramenta &sica no estudo da Estatstica In"erencial % a pro&a&ilidade, pois lida com a incerteza.
*ari)eis +uantitati)as
0s principais tipos de variveis e as s%ries estatsticas utilizadas na representa !o de dados estatsticos. As variveis s!o classi"icadas em quantitativas e qualitativas, e as s%ries estatsticas s!o representa 1es #r"icas de acordo com o tipo de varivel utilizada. Hariveis $uantitativas: como a pr2pria palavra diz, s!o variveis que indicam uma quantidade. )!o o resultado de uma conta#em de itens, dados ou in"orma 1es so&re o o&*eto em quest!o.
As variveis quantitativas se dividem em dois su&#rupos: discretas e contnuas. Hariveis $uantitativas /iscretas: quando seus valores s!o, em #eral, uma conta#em do n.mero de itens de uma determinada caracterstica, isto %, assumem valores inteiros. Exemplos: 6 47 "uncionrios tra&alham no setor de compras de uma empresa. 6 A inspe !o da produ !o acusou que apenas 1? pe as apresentaram al#um de"eito. 6 >? alunos "izeram matrcula em @eo#ra"ia no semestre passado. 6 1.4?? pessoas "izeram inscri !o para o concurso p.&lico. Em todos os exemplos apresentados tem-se apenas o resultado de uma conta#em, ou se*a, valores inteiros. Hariveis $uantitativas 3ontnuas: quando seus valores podem assumir qualquer valor real dentro de um intervalo contnuo. Isto %, assumem todos os valores intermedirios entre dois valores reais ou entre dois limites. As variveis contnuas est!o associadas a: altura, peso, comprimento, espessura, temperatura, press!o san#unea, velocidade, tempo, etc. As variveis contnuas tam&%m podem ser consideradas como aquelas cu*o valor somente poder pertencer a um intervalo. Exemplos: 6 A temperatura prevista para a cidade de Gelo Rorizonte, durante um certo dia, variou de 47S 3 a 4QS 3. 6 0 paciente pesava entre 14? e 1>? quilos. 6 As pe as inspecionadas na revis!o tm espessuras que variam de 4 a 7 milmetros. 6 A velocidade do autom2vel utilizado na via#em de Gelo Rorizonte ao -io de 9aneiro variou de 1? a 11? quilTmetros por hora. 6 As pessoas presentes em um seminrio tm alturas que variam de 1,M? metros a 1,U4 metros 6 A idade das pessoas presentes em um evento variou entre >? e >7 anos. A di"eren a entre variveis quantitativas discretas e as contnuas % que numa varivel discreta, todo valor % exato, enquanto a varivel contnua assume um valor dentro de um intervalo contnuo, isto %, todo valor % aproximado. Exemplos da di"eren a entre varivel contnua e discreta:
1< /iscreta: 1? pessoas com 47 anos. 3ontnua: o peso das 1? pessoas. 4< /iscreta: 1?? pe as na cor preta. 3ontnua: as espessuras de 1?? pe as variam de 1,7 a D,? milmetros. D< /iscreta: 47 moradores de uma localidade. 3ontnua: cor de pele dos moradores. >< /iscreta: 4?? tu&ula 1es de ,H3. 3ontnua: os diOmetros das tu&ula 1es compradas pela empresa ( variam de 1,7 a 1? pole#adas.
*ari)eis +ualitati)as
Himos que variveis quantitativas expressam quantidades. Ao entanto, muitas vezes precisamos expressar atri&utos ou qualidades. Hariveis $ualitativas: variveis que indicam uma classi"ica !o, consistindo em atri&utos ou re#istros n!o-num%ricos. As variveis qualitativas se dividem em dois su&#rupos: ordinais e nominais. Hariveis $ualitativas 0rdinais: variveis que est!o classi"icadas por uma ordem. Exemplos: 6 0s "ilmes listados a se#uir est!o classi"icados por ordem de pre"erncia do p.&lico. 1S I Han Relsin# 4S I Cr2ia DS I /irio de uma motocicleta A varivel % a ordem de pre"erncia. 6 A equipe ( terminou o campeonato em >S lu#ar. 6 0 1S colocado do concurso. A varivel % a ordem de che#ada. 6 0s cinco primeiros colocados no campeonato de "ute&ol estar!o classi"icados para a pr2xima "ase. A coloca !o % a varivel. 0s exemplos ilustram &em a ordem em que as variveis analisadas est!o dispostas. Bica &em claro que a )ari)el ordinal tem a principal caracterstica de indicar uma ordem ou seq,(ncia. Hariveis $ualitativas Aominais: variveis que indicam uma classi"ica !o. 0s dados podem ser classi"icados em cate#orias, #rupos ou marcas.
1?
Exemplos: 6 3ores dos autom2veis de certo modelo. 6 =arcas de re"ri#erante: 3oca-3ola, )prite, Banta, =ate-3ouro, etc. 6 ,artidos polticos: ,=/G, ,)/G, ,C, ,H, ,)C5, etc. 6 3lassi"ica !o dos itens de um estoque: A, G, 3, /, etc. Estes exemplos mostram que os dados podem ser classi"icados sem a necessidade de um n.mero, ou se*a, podem simplesmente ser mencionados de acordo com uma classe ou cate#oria a que pertencem. Atividades 1< /ados os exemplos a se#uir, determinar a classi"ica !o de cada um deles de acordo com o tipo de varivel quantitativa ;discreta ou contnua< ou qualitativa ;nominal ou ordinal<. a< 3onsumo dos re"ri#erantes da marca 3oca-3ola e ,epsiN &< 17?? eleitoresN c< 3amisas tamanho ,N d< /escri !o das classi"ica 1es dos tenistas pelo ranVin# da AC,: 1S - -o#erio Bederer 4S - @uilhermo @audio DS - Andre A#assi e< Cemperatura em )!o @on alo para ho*e: mnima de 4QS 3 e mxima de D7S 3N "< 4.??? pessoas inscritas para as provas do concurso. 4< Ela&orar al#uns exemplos de variveis quantitativas discretas e contnuas. D< Ela&orar al#uns exemplos de variveis qualitativas nominais e ordinais.
-lanejamento de um estudo Estatstico

,ara o plane*amento de um estudo estatstico, % de extrema importOncia considerar os se#uintes itens: 1 - 0G9ECIH0 F de #rande importOncia a de"ini !o clara do o&*etivo para um levantamento estatstico, pois "acilitar a anlise dos resultados o&tidos. 4 - ,0,5WAXY0 F o todo para e"eito de anliseN % o universo de dados que ser analisado. A popula !o dever ser especi"icada claramente pelo pesquisador. $uanto maior a quantidade de in"orma 1es conhecidas so&re a popula !o, mais "cil ser o processo de amostra#em.
11
D - A 30WECA /0) /A/0) /eve-se evitar a inclus!o de dados desnecessrios no processo de amostra#em. Essa inclus!o poder atrapalhar a anlise dos dados, o tempo #asto ser maior e o resultado o&tido n!o ter "inalidade. 0s dados ou in"orma 1es coletadas "azem parte do que % chamado banco de dados, que % composto por caractersticas num%ricas Z as variveis. 5m &anco de dados de um levantamento estatstico ter, em #eral, vrias ta&elas com m.ltiplas variveis. Ganco de dados % uma cole !o or#anizada e inter-relacionada de dados persistentes. F o re#istro de conceitos e in"orma 1es or#anizado.,ro#ramas de computador s!o utilizados para #erenciar um &anco de dados.
> - @-A5 /E ,-E3I)Y0 Ao iniciar o processo de amostra#em, deve-se especi"icar o #rau de precis!o dese*ado nos resultados. /eve-se considerar que elevar a precis!o da pesquisa implica aumentar o tamanho da amostra, o que aumenta tam&%m o tempo e o custo. $uanto maior a amostra, maior a precis!o do resultado, isto %, menor a mar#em de erro. ,or exemplo, uma pesquisa realizada com 1?.??? eleitores para determinar a pre"erncia eleitoral em uma cidade apresenta resultado mais preciso do que outra realizada com apenas 1.??? eleitores. 7 - AA[WI)E /0) /A/0) A anlise dos dados % realizada atrav%s de medidas estatsticas que descrevem o comportamento dos dados. F usual or#aniz-los, primeiramente, em #r"icos e ta&elas. M - 30A3W5)Y0 A conclus!o % a "ase "inal do processo estatstico, em que os resultados s!o dispostos e avaliados com rela !o ao o&*etivo proposto. 0s resultados s!o interpretados de acordo com o o&*etivo da pesquisa, e decis1es s!o tomadas acerca das popula 1es, utilizando-se a in"erncia estatstica.
.cnicas de amostra/em
0 #rande pro&lema encontrado para a escolha dos elementos da amostra dentro da popula !o est em determinar qual t%cnica de amostra#em dever ser utilizada. Isto %, qual t%cnica ou m%todo ser utilizado para se escolher quais elementos dentro da popula !o ser!o selecionados para a amostra. Existem dois m%todos para a sele !o da amostra: m%todos pro&a&ilsticos ou aleat2rios e m%todos n!o-pro&a&ilsticos. 0s m%todos pro&a&ilsticos s!o aqueles nos quais todos os itens da popula !o tm a mesma pro&a&ilidade de ser includos na amostra, independentemente da pessoa que realiza a pesquisa. 14
9 os m%todos n!o-pro&a&ilsticos s!o aqueles em que todos os itens da popula !o tm uma oportunidade conhecida de ser includos na amostra#em. Esses m%todos s!o muito utilizados quer pela sua simplicidade, quer pela impossi&ilidade de se usar os m%todos pro&a&ilsticos. )!o tam&%m conhecidos como amostra#em su&*etiva ou amostra#em por *ul#amento. )e o tamanho da amostra % &em pequeno, com menos de 1? itens, por exemplo, a amostra#em pro&a&ilstica pode n!o dar resultados representativos da popula !o, ao passo que uma pessoa com conhecimento mais pro"undo da popula !o pode especi"icar os elementos que melhor representariam a popula !o. Exemplo: 0 proprietrio de uma rede de 1? postos de #asolina dese*a implementar um novo servi o de pa#amento, com cart!o "idelidade para a sua rede de postos. ,ro&lemas de custo podem "azer com que essa implementa !o se*a experimentada em apenas D postos, talvez por apresentarem maior n.mero de consumidores, melhor localiza !o e maior "aturamento. Em vez de utilizarmos uma t%cnica estatstica para a escolha dos postos usados como teste para a implementa !o do servi o de pa#amento, % melhor con"iar no *ul#amento e conhecimento do proprietrio para "azer a escolha. /iante de situa 1es como essa, a n"ase ser dada aos tipos de amostra#ens pro&a&ilsticas, pois tem-se o conhecimento da pro&a&ilidade de todas as com&ina 1es possveis e % possvel "azer uma estimativa do erro da amostra. 0s m%todos pro&a&ilsticos podem ser com reposi !o ou sem reposi !o. Amostra#em com reposi !o: cada elemento da popula !o pode ser escolhido mais de uma vez na amostra. Exemplos: - Amostra#em dos eleitores de uma cidade. - Amostra#em dos consumidores de um determinado produto. - Amostra#em dos moradores de um &airro. Em todos esses exemplos de amostra#em, as pessoas poder!o ser entrevistadas novamente, ou se*a, todos tm a mesma pro&a&ilidade de ser escolhidos novamente. Amostra#em sem reposi !o: cada elemento da popula !o pode ser escolhido apenas uma vez na amostra. Exemplos: - Cestes de &alstica. F um teste muito utilizado pela polcia. F um teste destrutivo. - Cestes de resistncia de um equipamento eletrTnico. - Heri"ica !o da resistncia de um copo de vidro. - Heri"ica !o da qualidade de um pra-&risa &lindado. 0s itens destrutveis podem ser escolhidos apenas uma vez, pois torna-se impossvel a sua reposi !o. F importante destacar que, em estudos estatsticos, em que o processo de amostra#em apresenta um custo elevado, % aconselhvel evitar o exame repetido dos elementos.
1D
$uatro t%cnicas de amostra#em pro&a&ilstica ser!o a&ordadas: a< amostra#em aleat2ria simplesN &< amostra#em estrati"icadaN c< amostra#em por con#lomeradoN d< amostra#em sistemtica. Essas t%cnicas se di"erenciam pela maneira como a amostra % escolhida dentro da popula !o.
&mostra/em &leat0ria 1imples

Esta % a t%cnica mais comumente utilizada para a sele !o de amostras. 0s processos de amostra#em aleat2ria podem ser realizados pela utiliza !o de Ca&elas de A.meros Aleat2rios ou por sorteio. Ca&ela de A.meros Aleat2rios % uma ta&ela que cont%m todos os al#arismos de ? a U dispostos isoladamente ou em #ruposN podem ser lidos de cima para &aixo, na mesma coluna, ou da esquerda para a direita. A principal caracterstica da ta&ela % que os al#arismos est!o dispostos aleatoriamente, isto %, n!o tm uma ordem ou seqEncia de apari !o. ,ara a o&ten !o de amostras aleat2rias utilizando as Ca&elas de A.meros Aleat2rios ;CAA<4 adota-se a se#uinte seqEncia: a< Enumeram-se os itens da popula !o de 1 a A. &< )eleciona-se aleatoriamente um ponto onde iniciar a linha e a coluna da ta&ela de n.meros aleat2rios com o mesmo n.mero de al#arismos quantos "orem os de A. c< Escolhe-se uma dire !o, por exemplo, na mesma coluna, de cima para &aixo, ou na mesma linha, da esquerda para a direita, e anotam-se os n.meros o&tidos, descontando os n.meros maiores do que A. ,rosse#ue-se na dire !o escolhida at% que se complete a amostra. d< )e a amostra#em "or com reposi !o, re#istram-se as repeti 1esN se "or sem reposi !o, a&andonam-se as repeti 1es. 0 exemplo a se#uir ilustra a sele !o de uma amostra utilizando uma ta&ela de n.meros aleat2rios. Exemplo: R 7?? pessoas participando de um seminrio so&re Administra !o de Ae#2cios. 5ma amostra de 4? participantes dever ser selecionada para responder a al#umas quest1es. )olu !o: - /e acordo com a seqEncia acima, devem-se enumerar todos os participantes do seminrio de 1 a 7??, o que pode ser "eito atrav%s da distri&ui !o de senhas para cada um. - /eve-se, a#ora, escolher aleatoriamente um ponto na Ca&ela de A.meros Aleat2rios onde iniciar a conta#em dos 4? n.meros que "ar!o parte da amostra. - 0 pr2ximo passo % anotar os n.meros de trs al#arismos ;porque o maior n.mero de 1>
participantes % 7??, isto %, apresenta trs al#arismos< que "orem menores do que 7??. A leitura dos n.meros deve ser realizada de cima para &aixo, da esquerda para a direita. - A amostra#em n!o ser com reposi !o, pois a mesma pessoa n!o poder responder ao mesmo questionrio mais de uma vez. ,ortanto, os n.meros que "orem repetidos dever!o ser descartados, assim como os n.meros maiores do que 7??. )uponha que o lu#ar escolhido aleatoriamente na ta&ela tenha sido a linha D, coluna 1. 0 n.mero o&tido "oi o 7Q4. 3omo n!o existe uma pessoa com a senha 7Q4, esse n.mero %, ent!o, descartado e passa-se ao pr2ximo, na linha imediatamente a&aixo. 0 n.mero M>4 tam&%m n!o existe, nem 7PD .... 0 primeiro n.mero escolhido % o D>P, o se#undo % o 1UM. 0 processo dever continuar at% que todos os 4? participantes se*am selecionados. Acompanhe a escolha dos 4? n.meros na ta&ela de A.meros Aleat2rios a&aixo: QUD U>? 7Q4 M>4 7PD UM4 234 567 U1> 386 833 93: 923 U?> PQ? QP1 937 7QQ D>P UMM MQ? 257 Q1Q 942 PMQ UM> UQD ?4U PQQ QDU D41 ?U> 7>D Q7Q D7Q >U1 77Q ?7? 117 4MP QQP QU? ?47 D7U 4PQ ?DD Q44 1>D U4M 7?> U>P M4Q ?44 PQP 7MU >71 MP4 D?P PMM ?7U ?M1 P>D 4?? ?UP >DD UQ4 ?P> >>> P47 4P> 44D 74? QDU P7Q PDD DMU UUQ 1D4 D>P >1D Q?P >D> 1?D 7Q1 ?11 1Q1 DM? P1D UM7 4?M 741 U4U ?>1 D1P M17 MM> 1PP U?M DMM MPQ >Q4 7?> ?7U 1UP ?7D U?D 74M UQ? 1?M QDM M17 1PU 4DQ D17 ?DQ 4DU QU7 PPM 1>U 7UM 7UM QPD ?MP D77 7D1 7QP ?QD 1UD D?M D>7 7PD M>Q 4>D DQM >?7 DP4 7QM ?DU P7D 7MQ 4?U 1P> PQ7 PUM >1> >MU 7MP 4PM QD1 ?4> Q7M 4U7 QPM >MM ?1Q D?7 >Q> >UM D?? 71M 74> 4P? 7M4 17? DQ? 144 >?7 P?> QDQ P4P PP? Q?1 M>Q ?7U M7D 7UU 7DQ Q4U ?71 P7P 4MU QQ? U7Q 7QP 174 QQ> MQ4 71? DQ7 41? 4>P QUU MUD 4?Q 14Q UPM DDM MPM ?QP >QU M1P >41 M?? 71> UUQ 1?4 U7? QD7 >U? >Q> PM4 4D> 1D> 7UD 111 PQ? >UP 4DD 7>7 >?M UQ1 MM7 UM1 44P 14? 17
3;; 524 3:: 96; M7M 8;8 254 58; 7UP 5:5 959 998 842 PQM PQM
4D1 U77 D>4 >Q1 ?U> 77> D>P M?U ?DU UDQ 7>1 M?7 7QP 7QP QPU
4D4 4D7 ?1P 7P4 MQ1 DQD 47? ?U> UQ? MQ? 717 DDD U74 U74 >41
1DM M7U P1Q ?QQ M>P 74? 7UP M4P 11> PM1 MU> 177 4M1 4M1 M4D
7>4 P74 U7P MD1 1M1 4QP 14P DP? UQU >1M 4Q1 Q4> 4PD 4PD 41P
P4D QM> UMQ 7M4 ?7? M41 74D 44Q U?P P44 QPD >QM >P? >P? 1?Q
U7> UQM M71 U?U 11D U>Q >7Q 7PQ >7M DDM UDM 7>1 4PM 4PM ?PD
4U? PP> P>D >7M UPP D4P P1P M?? 77? D>Q M41 DUD ?4M ?4M >1>
U4U 7D? PU1 >DM PUP UU4 >47 PM4 PMP MU> U11 D7M >QU >QU P?P
Cem-se uma amostra de 4? participantes com os se#uintes n.meros: D>PN 1UMN >4UN 4>>N ?>QN ?D>N ?>MN D1MN ?PDN >77N 1DPN >QQN ?U7N 474N D1PN 147N 1Q1N ?1?N ??4 e 4PD. -epare que o n.mero D>P aparece duas vezes e, na se#unda vez, % descartado, pois * havia sido escolhido, e o processo de escolha n!o permite que o entrevistado responda ao mesmo questionrio mais de uma vez. E!E"#$#IO 1< 5ma empresa possui 47? "uncionrios. Escolher uma amostra aleat2ria simples composta de D? pessoas para "azer um levantamento e descrever os passos que ser!o adotados. 4< /escrever os passos para a escolha aleat2ria simples de 4? estudantes dentro de uma "aculdade com 1.??? alunos.
&mostra/em &leat0ria por sorteio

0utra maneira de realizar uma amostra#em simples % por sorteio. Exemplo: /ese*a-se "azer uma pesquisa de opini!o com os eleitores de )alvador. Eles ser!o su&metidos a um questionrio so&re as propostas dos novos candidatos ao #overno. Corna-se impraticvel entrevistar todos os eleitores de um &airro de )alvador so&re as propostas dos novos candidatos ao #overno, pois a anlise tomaria muito tempo e o custo dessa pesquisa seria altssimo. Ent!o, utiliza-se uma amostra#em aleat2ria. )er!o escolhidos, aleatoriamente, 7?? eleitores para a pesquisa. )e o n.mero de moradores do &airro % conhecido e todos podem ser listados, ent!o, a escolha desses eleitores pode ser realizada por sorteio.
1M
A amostra#em aleat2ria por sorteio % mais simples. Codos os elementos da popula !o dever!o estar enumerados ou listados. ,ode-se utilizar uma urna que contenha todos os n.meros dos elementos e, ent!o, iniciar o sorteio. Esse sorteio % realizado de "orma semelhante + "orma como s!o sorteados os n.meros de *o#os da Woteria Bederal. /a mesma "orma que o exemplo anterior, os moradores que * "oram entrevistados n!o dever!o participar novamente da pesquisa. Assim, diz-se que o processo "oi realizado sem reposi !o, ou se*a, todos os itens * escolhidos numa primeira amostra#em ser!o descartados quando aparecerem pela se#unda vez. Essa % &astante simples, n!o % mesmo'
&mostra/em Estrati icada

Esta t%cnica de amostra#em % utilizada quando % necessrio que ha*a um representante de cada se#mento da popula !o includo na amostra. ,or exemplo, para coletar uma amostra dos moradores de uma cidade, podem-se dividir as residncias por nveis socioeconTmicos e depois escolher, aleatoriamente, uma amostra dos moradores. F importante que uma caracterstica comum se*a escolhida para a coleta das in"orma 1es amostrais. Ao caso do exemplo, a caracterstica % o nvel socioeconTmico. /ependendo do o&*etivo da pesquisa, os elementos da popula !o podem ser divididos em su&#rupos maiores com caractersticas similares, como idade, peso, nvel social, localiza !o #eo#r"ica, ra a, etc. ,ortanto, uma amostra#em estrati"icada % o&tida separando-se a popula !o em su&#rupos com caractersticas homo#neas ou similares e selecionando-se, independentemente, uma amostra aleat2ria simples em cada um desses su&#rupos. Existem dois tipos de amostra#em estrati"icada: a< as que tm o mesmo tamanhoN &< as proporcionais. Aa amostra#em estrati"icada de mesmo tamanho sorteia-se um n.mero i#ual de elementos em cada su&#rupo. Esse processo % utilizado quando o n.mero de elementos por su&#rupo "or i#ual ou aproximadamente o mesmo. $uando cada su&#rupo apresenta n.meros di"erentes de elementos utiliza-se, ent!o, a amostra#em estrati"icada proporcional, em que o n.mero de elementos que devem ser escolhidos em cada #rupo % proporcional ao n.mero de elementos do #rupo. 0 processo de amostra#em % realizado da se#uinte maneira: ) - % o n.mero de su&#ruposN Ai - % o n.mero de elementos de amostra#em no su&#rupo iN A - % o n.mero de elementos da popula !oN n - % o n.mero de elementos da amostra.
1P
3ada su&#rupo possui caractersticas similares. 3om isso, tm: A \ A1 ] A4 ] AD ] ... ] A) /etermina-se a rao de amostra/em * dada por: * =
n +
Bra !o de amostra#em % a raz!o entre o n.mero de elementos da amostra e o n.mero total de elementos da popula !o. 0 n.mero de elementos sorteados em cada su&#rupo % de"inido pelo produto deste "ator e do n.mero de elementos de amostra#em em cada su&#rupo: A1.*, A4.*, ... A).* Exemplo: /ese*a-se o&ter uma amostra de 4? participantes de um seminrio, para aplica !o de um questionrio so&re o tema a&ordado nas palestras da s%rie K,iol-ncia nas .randes /idadesL. )a&ese que a in"orma !o que as pessoas prestam est relacionada + re#i!o onde moram. 0 seminrio possui participantes de > Estados &rasileiros, sendo assim compostos: 7? do -io de 9aneiroN 1?? de )!o ,auloN D? de =inas @erais e 4? da Gahia. 3omo dever ser realizada a amostra#em para se escolher os participantes do seminrio' )olu !o: /eve-se utilizar a t%cnica de amostra#em estrati"icada, pois % importante que se tenham representantes de todos os > Estados em n.mero proporcional ao n.mero de representantes de cada Estado. 0 primeiro passo % separar os participantes em su&#rupos de Estados. /epois, deve-se "azer a amostra#em dentro de cada su&#rupo. A popula !o do seminrio em quest!o % de 4?? participantes. 1Q
0s su&#rupos ser!o: -io de 9aneiro: )!o ,aulo: =inas @erais: Gahia: 0 tamanho da popula !o %: A \ A1 ] A4 ] AD ] A> A \ 7? ] 1?? ] D? ] 4? \ 4?? participantes A "ra !o de amostra#em ser: * = n 4? = = ?,1? + 4?? A1 A4 AD A> 7? participantes 1?? participantes D? participantes 4? participantes.
0 n.mero de elementos sorteados em cada su&#rupo ser de"inido pelo produto desse "ator de amostra#em pelo n.mero de elementos de amostra#em em cada su&#rupo. A1 . " \ 7? . ?,1? \ 7 participantes escolhidos aleatoriamente no su&#rupo 1. A4 . " \ 1?? . ?,1? \ 1? participantes escolhidos aleatoriamente no su&#rupo 4. AD . " \ D? . ?,1? \ D participantes escolhidos aleatoriamente no su&#rupo D. A> . " \ 4? . ?,1? \ 4 participantes escolhidos aleatoriamente no su&#rupo >. 0 total de participantes escolhidos por amostra#em estrati"icada "oi de 4?, sendo 7 do -io de 9aneiro, 1? de )!o ,aulo, D de =inas @erais e 4 da Gahia. Exemplos: /ese*a-se realizar uma amostra de 1.??? moradores de uma certa cidade para a aplica !o de um questionrio so&re consumo. F necessrio que se*am entrevistadas pessoas com rendas &aixa, m%dia e alta. A cidade possui 4 milh1es de ha&itantes divididos da se#uinte maneira: -enda &aixa: -enda m%dia: -enda alta: 1??.??? ha&itantes 1.>??.?? 7??.??? ha&itantes ha&itantes
3omo dever ser o plano de amostra#em para esta pesquisa' )olu !o: /eve-se utilizar a t%cnica de amostra#em estrati"icada, pois % importante que se o&tenham respostas dos trs nveis de renda. 3omo o n.mero de pessoas em cada nvel de renda % di"erente, utiliza-se a amostra#em estrati"icada proporcional. 0 primeiro passo % separar as pessoas em su&#rupos de nvel de renda e, ent!o, "azer a amostra#em dentro de cada su&#rupo. A popula !o do cidade % de 4.???.??? de pessoas. 0 su&#rupos s!o divididos da se#uinte "orma: -enda &aixa: A1 \ 1.>??.??? pessoas -enda m%dia: A4 \ 7??.??? pessoas -enda alta: AD \ 1??.??? pessoas
1U
0 tamanho da popula !o: A \ A1 ] A4 ] AD A \ 1.>??.??? ] 7??.??? ] 1??.??? \ 4.???.??? pessoas A "ra !o de amostra#em ser: * = n 1.??? = = ?,???7 + 4.???.???
0 n.mero de elementos sorteados em cada su&#rupo ser de"inido pelo produto do "ator de amostra#em pelo n.mero de elementos de amostra#em em cada su&#rupo. Cem-se: A1 . " \ 1.>??.??? . ?,???7 \ P?? pessoas devem ser escolhidas, aleatoriamente, no su&#rupo de &aixa renda. A4 . " \ 7??.??? . ?,???7 \ 47? pessoas devem ser escolhidas, aleatoriamente, no su&#rupo de renda m%dia. AD . " \ 1??.??? . ?,???7 \ 7? pessoas devem ser escolhidas, aleatoriamente, no su&#rupo de renda alta. 0 total de pessoas escolhidas nesta amostra#em estrati"icada % de 1.???, sendo P?? de &aixa renda, 47? de renda m%dia e apenas 7? de renda alta. Hiu que n!o % di"cil entender essa hist2ria de amostra#em estrati"icada proporcional' A#ora % s2 usar sempre que voc precisar.
&mostra/em por con/lomerado

A amostra#em por con#lomerado % uma amostra aleat2ria simples em que cada unidade de amostra#em % um sub/rupo com caractersticas hetero/(neas, ou um con#lomerado de elementos representativos da popula !o. )!o minipopula 1es. @eralmente s!o #rupos que se acham li#ados por um pequeno contato "sico. Ex.: casas, quarteir1es, &airros, etc. ,rimeiramente, devem-se especi"icar adequadamente os con#lomerados. 0 n.mero de elementos num con#lomerado dever ser pequeno em rela !o ao tamanho da popula !o, e o n.mero de con#lomerados dever ser razoavelmente #rande. Aeste tipo de amostra#em, a popula !o % dividida em su&#rupos com caractersticas hetero#neas, e s!o selecionadas amostras aleat2rias simples de su&#rupos. 3om isso, todos os elementos dos su&#rupos ;con#lomerados< selecionados "ar!o parte da amostra. A amostra#em por con#lomerado pode ser utilizada quando n!o se tem uma lista com todos os elementos da popula !o ou quando a o&ten !o dessa lista#em % uma tare"a muito lon#a e cara. Exemplo 1: /ese*a-se "azer uma pesquisa com os moradores de um &airro da cidade. 0 o&*etivo % sa&er a opini!o deles so&re a constru !o de um #rande centro de compras. 3omo o &airro % #rande e n!o se tem a lista#em completa de todos os moradores e sua o&ten !o tornaria a pesquisa muito cara e demorada, utiliza-se uma amostra#em por con#lomerados. ,ara a realiza !o da amostra#em por con#lomerados, deve-se separar o &airro em su&#rupos de caractersticas hetero#neas, como, por exemplo, quarteir1es. Aos quarteir1es tem-se uma representa !o da popula !o de moradores do &airro. 0 quarteir!o pode ser considerado uma mini popula !o, pois os moradores de cada quarteir!o tm as mesmas caractersticas dos moradores do &airro.
4?
<rea do bairro
?1
?4
?D
?>
?7
?M
?P
?Q
?U
1?
11
14
1D
1>
17
Essa ima#em mostra a rea do &airro, composta por 17 quarteir1es. ,ara a escolha dos quarteir1es, utiliza-se uma amostra#em aleat2ria, e todos os moradores selecionados s!o entrevistados. 5ma amostra#em de > quarteir1es pode ser realizada por sorteio. 3olocam-se todos os n.meros correspondentes a cada quarteir!o dentro de uma urna, de onde ser!o tirados apenas >. )uponha que tenham sido escolhidos os quarteir1es D, P, U e 17. A todos os moradores desses quarteir1es ser!o aplicados os questionrios so&re a constru !o do centro de compras. Exemplo 4: 0 pre"eito de uma cidade dese*a realizar uma pesquisa so&re as despesas "amiliares de seus ha&itantes. 5ma "orma de extrair uma amostra nesta situa !o consiste em dividir a rea total da cidade em diversas reas menores, como quarteir1es ou &airros. )elecionam-se, ent!o, aleatoriamente, al#uns desses quarteir1es, com a amostra "inal constituda de todas as "amlias residentes em al#uns deles. Aesse tipo de amostra#em, torna-se muito menos dispendioso, em termos de custo e tempo, tra&alhar com uma amostra em que as "amlias est!o mais pr2ximas, em con#lomerados, do que com "amlias selecionadas aleatoriamente so&re toda a rea de uma cidade. )e a amostra aleat2ria "osse realizada em toda a cidade, o custo e o tempo de anlise das respostas seriam muito maiores, pois os pesquisadores teriam que rodar distOncias mais lon#as para realizar as entrevistas com as "amlias. /iante dos conceitos e caractersticas apresentados so&re amostra#em por con#lomerados, % a sua vez de colocar em prtica o que aprendeu. E(E-3^3I0 1< )uponha que uma pesquisa se*a realizada na cidade de ,etr2polis--9. 0 o&*etivo % determinar as principais marcas de pre"erncia de consumo de determinado produto pelos moradores de cada &airro. Ela&orar um plano de amostra#em dos moradores dos &airros por con#lomerados.
41
&mostra/em sistemtica
A amostra#em sistemtica consiste em escolher os elementos da popula !o de "orma peri2dica, isto %, os elementos da popula !o ser!o escolhidos em inter)alos re/ulares. Esses intervalos ser!o determinados pela "2rmula que de"iniremos a se#uir. F utilizado um sistema de sele !o semelhante ao da amostra#em aleat2ria simples. A di"eren a entre a amostra#em aleat2ria simples e a amostra#em sistemtica % que esta .ltima utiliza um "ator peri2dico para a escolha dos elementos, enquanto a aleat2ria simples n!o utiliza crit%rio al#um. A!o % aconselhvel a utiliza !o deste m%todo nos casos em que os itens est!o a#rupados ou listados em carter peri2dico, pois a amostra poder apresentar caractersticas tendenciosas, contendo apenas elementos com caractersticas semelhantes. ,ara o&ter uma amostra#em sistemtica % necessrio: 1< o&ter uma lista da popula !o e numer-la de 1 a AN + , onde = % o tamanho da popula !o e n % o tamanho da amostra. 0 > % n chamado de passo da escolhaN 4< calcular 0 = D< dividir a popula !o em #rupos de > elementosN >< escolher aleatoriamente um n.mero na CAA para determinar onde come ar. 0s elementos se#uintes ser!o escolhidos somando-se ou su&traindo-se V ao n.mero anterior. Exemplo 1: A ta&ela a se#uir apresenta os lucros lquidos, em reais, o&tidos por uma empresa de eventos na realiza !o de D? apresenta 1es de uma mesma &anda. $ueremos o&ter uma amostra sistemtica de 7 valores de lucros lquidos, em reais. ?1 ?4 ?D ?> ?7 ?M ?P ?Q ?U 1?
4?.??? 1P.7?? 14.??? 1?.??? Q.??? 14.7?? 11.??? 1>.??? 1Q.??? 17.4?? 55 58 52 53 5; 57 54 5: 56 89
1M.4?? 17.??? 11.??? 1U.??? 4Q.??? 1M.Q?? 1P.??? 11.4?? 1U.M?? 1>.Q?? 85 )olu !o: 6 A lista de todos os lucros o&tidos na realiza !o dos D? eventos * est na ta&ela exi&ida. 6 /eve-se escolher o passo que ser utilizado para a escolha dos valores de lucro. 0 "ator passo ser: 0= + D? = =M n 7 88 82 83 8; 87 84 8: 86 29
1?.??? 17.??? 1>.??? 1?.??? U.??? 11.7?? 1>.??? 1D.??? 17.??? 1U.4??
6 Ent!o, devem ser escolhidos os lucros com passos de M em M. 6 Escolher, na CAA, um n.mero aleat2rio de apenas um al#arismo. 6 )uponha que o n.mero escolhido tenha sido o DN ent!o, o primeiro elemento da amostra de lucro 44
lquido % o D. )omando-se V \ M a esse n.mero o&tido na ta&ela, tem-se uma amostra de 7 itens. DS ] M \ US ] M \ 17S ] M \ 41S ] M \ 4PS ?1 ?4 ?D ?> ?7 ?M ?P ?Q ?U 1?
4?.??? 1P.7?? 14.??? 1?.??? Q.??? 14.7?? 11.??? 1>.??? 1Q.??? 17.4?? 55 58 52 53 5; 57 54 5: 56 89
1M.4?? 17.??? 11.??? 1U.??? 4Q.??? 1M.Q?? 1P.??? 11.4?? 1U.M?? 1>.Q?? 85 88 82 83 8; 87 84 8: 86 29
1?.??? 17.??? 1>.??? 1?.??? U.??? 11.7?? 1>.??? 1D.??? 17.??? 1U.4?? Ent!o, os valores de lucro escolhidos pela amostra#em sistemtica s!o: 14.???N 1Q.???N 4Q.???N 1?.??? e 1>.??? E(E-3^3I0: /ese*a-se selecionar uma amostra sistemtica de 1? aparelhos, de um total de 4??, que est!o #uardados no estoque. $ual seria o plano de amostra#em adotado'
#asos em que uma &mostra/em no se justi ica

Existem trs ocasi1es em que % pre"ervel analisar todos os itens de uma popula !o. 1 - $uando a popula !o % muito pequena. 5ma popula !o pode ser considerada pequena quando o custo e o tempo de anlise dos dados s!o pouco maiores do que seriam para a realiza !o de uma amostra. Exemplo: A anlise dos dados dos 1? "uncionrios de uma empresa. Aeste caso, como a popula !o % pequena, torna-se desnecessria a aplica !o de uma t%cnica de amostra#em. A anlise dos dados o&tidos de 1? "uncionrios toma muito pouco tempo e tem &aixo custo. 4 - $uando h uma #rande varia !o entre as respostas o&tidas. A amostra dever ser muito #rande para ser representativa da popula !oN uma amostra#em pequena pode levar a erros de interpreta !o dos resultados. Exemplo: )e as respostas dadas a um questionrio aplicado a 4.??? moradores de um &airro "orem muito di"erentes umas das outras, % essencial que se tra&alhe com uma amostra#em muito alta. Essa amostra#em pode estar pr2xima do tamanho da popula !o. Aesse caso, opta-se por tra&alhar com toda a popula !o, pois o&t%m-se um resultado mais con"ivel. D - $uando % necessria uma precis!o muito alta. Aesse caso, a anlise da popula !o % a op !o mais adequada. Exemplo: 3enso demo#r"ico
4D
E(E-3^3I0 1< /ar exemplos de amostra#em aleat2ria simples e de amostra#em sistemtica. 4< $uais s!o as di"eren as que voc pode notar entre as amostra#ens aleat2ria simples e a sistemtica' D< Em que situa 1es % pre"ervel adotar o levantamento e a anlise de toda a popula !o, ao inv%s de utilizar uma t%cnica de amostra#em' >< 5ma empresa possui >?? "uncionrios. /eterminar um plano de amostra#em aleat2ria para a escolha de >? "uncionrios. 7< Hoc % responsvel por determinar a opini!o dos pro"issionais #raduados em Administra !o de Empresas e que atuam no mercado de tra&alho de uma determinada cidade, so&re a produ !o industrial. Identi"icar a t%cnica de amostra#em que dever ser utilizada para cada uma das amostras representadas nos itens a, b e c, a se#uir. a< )elecionar aleatoriamente uma empresa e aplicar o questionrio aos administradores que nela tra&alham. &< /ividir a popula !o de administradores em rela !o ao ramo de atividade da empresa, realizar uma amostra aleat2ria dos pro"issionais e "azer per#untas a al#uns administradores de cada ramo. c< Wistar o nome de todos os pro"issionais e escolher, aleatoriamente, um certo n.mero deles. 0s administradores escolhidos ser!o entrevistados no que diz respeito + produ !o industrial.
1ries Estatsticas
A!o % conveniente apresentar os dados para uma anlise exatamente da "orma como s!o coletados. 5m dos o&*etivos da Estatstica % resumir os dados de "orma clara para se ter uma vis!o #lo&al das caractersticas das variveis. 0 principal o&*etivo desta nossa aula % mostrar as "ormas de apresenta !o de dados mais utilizadas, de acordo com a varivel de interesse. Ap2s a coleta dos dados, torna-se necessria a disposi !o deles em ta&elas ou #r"icos, para que ha*a um melhor entendimento. Aa maioria das vezes, eles se encontram na "orma &ruta, isto %, sem qualquer ordena !o ou classi"ica !o. ,ortanto, % necessrio coloc-los em ordem crescente ou decrescente, ou at% mesmo classi"ic-los de acordo com as variveis que os representam. Exemplo: 5ma amostra da altura de 144 pessoas presentes em um evento. 0s valores re"erentes +s alturas podem ser colocados em ordem crescente e estar associados a um #rupo de pessoas que apresentam a mesma altura. Isto %, os valores de alturas estar!o posicionados em ordem crescente, como apresentado na ta&ela a&aixo. &lturas, em centmetros =? de pessoas 17? _`` 1M? 7 1M? _`` 1P? 47 1P? _`` 1Q? >Q 1Q? _`` 1U? D4 1U? _`` 4?? 1? 4?? _`` 41? 4 1otal 144 4>
A "orma como essa ta&ela % construda ser estudada com maiores detalhes em /istri&ui !o de BreqEncia. A disposi !o dos dados em ta&elas evita uma anlise errTnea, principalmente se os dados e in"orma 1es coletados "orem muito extensos.
3om a utiliza !o de ta&elas e #r"icos, % possvel "ornecer in"orma 1es rpidas so&re as variveis em estudo. A ta&ela % uma apresenta !o num%rica de dados coletados e ordenados de "orma &em claraN o #r"ico % uma apresenta !o #eom%trica mais rpida e mais clara de ser visualizada. He*a o exemplo de representa !o #r"ica da ta&ela das alturas, mostrada anteriormente. 0&serve que toda representa !o ta&ular usa um dos D "atores se#uintes: 6 @ator cronol0/ico ou temporal - determina a %poca ou o perodo do tempo em que ocorre. 6 @ator espacial ou /eo/r ico - determina o local onde ocorre. 6 @ator Especi icati)o ou a espcie do ato - tem somente a esp%cie do "ato ou a cate#oria. /e maneira #eral, as representa 1es ta&ulares s!o chamadas )%ries Estatsticas. A )%rie Estatstica % um a#rupamento dos dados re"erentes a uma mesma ordem de classi"ica !o. Assim, as s%ries estatsticas podem ser classi"icadas em: - )%rie Cemporal - )%rie @eo#r"ica - )%rie Espec"ica Hamos aos exemplos de cada um desses D tipos de s%rie. 5A 1rie .emporal Apresenta somente o ator cronol0/ico ou temporal como varivel de anlise.
47
Exemplo: Produo Brasileira de Motos 1996-1998 Ano Produo (unidades) 1996 288.073 1997 426.547 1998 476.655 Fonte: Revista ISTO no1546
Apresentao do tempo: Toda srie temporal consecutiva deve ser apresentada, em uma tabela, por seus perodos inicial e final ligados por um hfen (-). Exemplos: 1991 1995 apresenta dados numricos para os anos de 1991, 1992, 1993, 1994, 1995; Out 1991 Mar 1992 apresenta dados numricos para os meses de outubro, novembro e dezembro de 1991 e janeiro, fevereiro e maro de 1992. Toda srie temporal no consecutiva deve ser apresentada, em uma tabela, por seus perodos inicial e final ligados por barra (/). Ex: 1991/1995 apresenta dados para os anos entre 1991 e 1995, deixando de apresentar dados numricos para algum (ns) dos anos desta srie. Srie Geogrfica: usada para apresentar dados de diferentes regies geogrficas, em determinado tempo. Exemplo: Vacinao contra a Poliomielite 1993 Regies Quantidade Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro-Oeste 185.823 Fonte: Ministrio da Sade
26
Srie Categrica: usada para apresentar dados que se distribuem em diferentes categorias, em determinado tempo e local. Exemplo: Avicultura Brasileira 1992 Espcies Nmero (1.000 cabeas) Galinhas 204.160 Galos, frangos, frangas e pintos 435.465 Codornas 2.488 Fonte: IBGE Sries Mistas ou Conjugadas (tabela de dupla entrada): quando so feitas combinaes de duas ou mais sries. Exemplo: Exportao Brasileira 1985/1995 1985 1990 13,0 13,4 28,2 26,3 33,9 35,2 10,9 17,7 14,0 8,8
Importadores Amrica Latina EUA e Canad Europa sia e Oceania frica e Oriente Mdio Fontes: MIC e SECEX Nota: Valores em percentagem
1995 25,6 22,2 20,7 15,4 5,5
REPRESENTAO GRFICA DAS SRIES ESTATSTICAS

Os grficos produzem uma viso mais rpida e viva do fenmeno em estudo, ajudando a visualizar as tendncias e a interpretar os valores representativos deste fenmeno. Requisitos Fundamentais na Representao Grfica: O grfico deve ser simples, claro e deve expressar a verdade sobre o fenmeno em estudo; Todo grfico deve ter ttulo e escala, para que possa ser interpretado sem que haja necessidade de esclarecimentos adicionais no texto; O ttulo do grfico pode ser escrito acima ou abaixo do grfico. O IBGE escreve o ttulo acima do grfico;
27
As variveis devem ser claramente identificadas; A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados so muito altos, deve ser feita uma interrupo no eixo, com indicao clara da posio do zero; O sistema de eixos cartesianos e as linhas auxiliares devem ter traado mais leve do que a parte do grfico que se pretende evidenciar; Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o grfico feito dentro de um retngulo. Principais Tipos de Grficos: Diagramas Cartogramas Pictogramas Cartogramas: So representaes atravs de mapas (cartas geogrficas). Este grfico empregado quando o objetivo o de relacionar os dados estatsticos diretamente com reas geogrficas ou polticas. Pictogramas: a representao grfica atravs de figuras. Por se tratar de uma apresentao atraente, um grfico que desperta muito a ateno do leitor. Diagramas: So grficos geomtricos construdos, em geral, no sistema cartesiano. Principais Diagramas: Grfico em Linha, Grfico em Colunas, Grfico em Barras, Grfico em Colunas ou em Barras Mltiplas e Grfico em Setores. Grfico em Linha: Usado para apresentar as sries temporais. Representado num sistema de coordenadas cartesianas, cada par de valores da srie corresponde a um ponto. Estes pontos so unidos por segmentos de reta. Exemplo: Tabela 1
PRODUO BRASILEIRA DE CAF 1991-1995 ANOS PRODUO (1.000 t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 FONTE: IBGE
28
PRODUO BRASILEIRA DE CAF 1991-1995
4.000 PRODUO (1.000t) 3.500 3.000 2.500 2.000 1.500 1.000 500 0 1991 1992 1993 ANOS 1994 1995
Regras para a elaborao de um grfico em linhas: Fixe a largura (l) do grfico; Determine a altura mxima e a altura mnima de acordo com as normas a seguir: hmn = 60% da largura e hmx = 80% da largura Determine os limites da escala, dividindo o maior valor a representar pela altura mxima e pela altura mnima; Determine a escala, escolhendo um valor, de preferncia inteiro, entre os valores encontrados para limites; Trace um sistema de coordenadas cartesianas; Determine, graficamente, todos os pontos da srie; Ligue esses pontos, dois a dois, por segmentos de reta; Identifique, claramente, as variveis nos dois eixos; Acrescente o Ttulo, a Fonte e a Legenda (quando necessria). Grfico em Colunas: Usado para representar as sries cronolgicas, geogrficas e categricas. Representado por meio de retngulos de mesma base, dispostos verticalmente (em colunas). Exemplo:
29
Tabela 1
PRODUO BRASILEIRA DE CAF 1991-1995 ANOS PRODUO (1.000 t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 FONTE: IBGE
PRODUO BRASILEIRA DE CAF 1991-1995

4.000 3.500 PRODUO (1.000t) 3.000 2.500 2.000 1.500 1.000 500 0 1991 1992 1993 ANOS 1994 1995
Grfico em Barras: Usado para representar as sries geogrficas e categricas. Representado por meio de retngulos dispostos horizontalmente (em barras). Exemplo:
30
Tabela 2
EXPORTAES BRASILEIRAS MARO 1995 ESTADOS VALOR (US$ milhes) So Paulo 1.344 Minas Gerais 542 Rio Grande do Sul 332 Esprito Santo 285 Paran 250 Santa Catarina 202 FONTE: SECEX
E X P O R T A E S B R A S IL E IR A S M A R O - 1995
S a n t a C a t a r in a P a ra n E s p r it o S a n t o R io G r a n d e d o S u l M in a s G e r a is S o P a u lo 0 500 1 .0 0 0 1 .5 0 0
V a lo r ( U S $ m ilh e s )
OBSERVAES: 1) O procedimento para a construo de um grfico em colunas (ou barras) anlogo ao do grfico em linhas, observando que no grfico em barras deve-se fazer a inverso nos eixos cartesianos (o eixo x corresponde a altura e o eixo y corresponde a largura). 2) Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferncia ao grfico em barras (sries geogrficas e especficas). Grfico em Colunas ou em Barras Mltiplas: Usado para representar as sries conjugadas. Exemplo:
31
Tabela 3 ESPECIFICAES Exportao (FOB) Importao

BALANA COMERCIAL DO BRASIL 1989 1993 VALOR (US$ 1.000.000)
1989 34.383 18.263
1990 31.414 20.661
1991 31.620 21.041
1992 35.793 20.554
1993 38.783 25.711
FONTE: Ministrio da Fazenda
BALANA COMERCIAL DO BRASIL 1989-1993

45.000 40.000 Valor (us$ 1.000.000) 35.000 30.000 25.000 20.000 15.000 10.000 5.000 0 1989 Exportao (FOB) 1990 1991 Importao 1992 1993
Grfico em Setores: Construdo com base em um crculo, este grfico usado para comparar propores. Exemplo:
32
Tabela 4
REBANHO SUINO DO SUDESTE DO BRASIL 1992 QUANTIDADE (mil cabeas) ESTADOS Minas Gerais 3.363,7 Esprito Santo 430,4 Rio de Janeiro 308,5 So Paulo 2.035,9 Total 6.138,5 FONTE: IBGE
REBANHO SUNO DO SUDESTE DO BRASIL 1992
33% 55%
5% 7%
Minas Gerais
Esprito Santo
Rio de Janeiro
So Paulo
Regras para a elaborao de um grfico em setores: Trace uma circunferncia. A rea do crculo representa o total, isto , 100%, devendo ser dividida em tantos setores quantas sejam as partes. Lembre-se de que uma circunferncia tem 360. Ento, se ao total correspondem 360, a cada parte corresponder um setor cujo ngulo x dado por: x =
PARTE 360 TOTAL
Marque os valores dos ngulos calculados na circunferncia e trace os raios, separando os setores. Para facilitar a distino, faa um tracejado diferente em cada setor. Coloque ttulo e legenda no grfico. OBS.: Para clareza dos dados, deve-se usar no mximo sete setores.
33
DISTRIBUIO DE FREQUNCIAS
Freqentemente, ao coletar dados, o pesquisador se depara com uma grande massa de valores numricos, que se repetem algumas vezes, dificultando sua anlise e interpretao. Surge ento a necessidade de organizar esses dados em uma tabela onde os valores observados se apresentam associados individualmente ou em classes com os nmeros de suas repeties, isto , com suas respectivas freqncias. Esta tabela recebe o nome de Distribuio de Freqncias. De acordo com a disposio dos dados tm-se dois tipos de distribuio:
Distribuio de Freqncias Simples (dados no agrupados ou no

tabulados em classes de valores) uma tabela onde os valores da varivel analisada aparecem individualmente correlacionados com os nmeros de suas repeties (freqncias). Esse tipo de distribuio normalmente usado para representar variveis discretas. Exemplo: Tabela 1
Nmero de Acidentes Registrados na ponte Rio-Niteroi em Janeiro de 2009
N de Acidentes
0 1 2 3 4 5 Total
FONTE: Dados Hipotticos
N de Dias
18 5 2 2 3 1 31
Distribuio de Freqncias por Classes (dados agrupados ou

tabulados em classes de valores) Quando a varivel analisada apresenta um grande nmero de valores torna-se mais vantajoso o agrupamento destes em classes de freqncia, evitando assim grande extenso da tabela e facilitando a visualizao do fenmeno como um todo.
34
A distribuio de freqncias por classes uma tabela onde os valores observados so agrupados em classes, isto , em intervalos de variaes da varivel em questo. Esse tipo de distribuio normalmente usado para representar variveis contnuas. utilizada tambm para representar variveis discretas em um grande nmero de valores observados. Exemplo: Tabela 2 Salrios dos funcionrios da UERJ Salrios (R$) N de funcionrios 1000 1200 2 1200 1400 6 1400 1600 10 1600 1800 5 1800 2000 2 Total 25
A seguir so apresentados alguns conceitos fundamentais para a compreenso dessas sries. Dados Brutos a apresentao dos dados observados na seqncia em que foram coletados, isto , sem nenhuma ordenao numrica. Exemplo: O nmero de peas defeituosas obtidas da produo de uma mquina durante vinte dias foi: 24212310510112013 01 2 Rol a organizao dos dados brutos em ordem crescente ou decrescente. Exemplo: O rol do exemplo anterior : 00001111111222223345
35
Amplitude Total (AT) a diferena entre o maior valor e o menor valor da seqncia dos dados observados. AT = valor mximo valor mnimo Exemplo: A amplitude total do rol apresentado : AT = 5 0 = 5
Freqncia Absoluta Simples (ou simplesmente freqncia) Denotada por Fi, a freqncia indica o nmero de ocorrncias de cada valor ou o nmero de valores pertencentes a uma classe. Na Tabela 1: F6 = F(5) = 1 Na Tabela 2: F2 = 6
Regras para a elaborao de uma Distribuio de Freqncias Simples

a) Escreve-se, ordenadamente, os dados observados na coluna indicadora. b) Obtm-se as freqncias absolutas simples dos dados (Fi). Essas freqncias constituem o corpo da tabela. Exemplo: Sejam os dados abaixo representativos de uma pesquisa sobre o nmero de irmos de 20 alunos da Turma Biologia/Geografia. Dados Brutos: 13052110014310122131 Rol: 00001111111122233345 A distribuio de freqncias do rol apresentado :
36
Tabela 3 Nmero de Irmos de 20 alunos da Turma Geo/Bio i Nmero de Irmos (xi) Repeties (Fi) 1 0 4 2 1 8 3 2 3 4 3 3 5 4 1 6 5 1 Total Fi = 20 1 Coluna (i) nmero de ordem dos valores distintos da varivel nmero de irmos. 2 Coluna (xi) valores distintos da varivel nmero de irmos. 3 Coluna (Fi) nmero de repeties dos valores distintos da varivel nmero de irmos.
k
Nota:
i =1
Fi = n , onde n igual ao nmero de dados observados (n = 20)
Observa-se que neste tipo de tabela no h perda de informao, podendo os dados originais serem reconstitudos a partir da distribuio elaborada.
1.6.4 Tipos de Freqncias

Para a interpretao dos resultados de uma pesquisa, conforme os tipos de informaes requeridas utilizam-se diversos tipos de freqncias de dados. A seguir sero apresentados os tipos de freqncias, derivados da distribuio de freqncias absolutas, bastante teis na interpretao de dados.
Freqncia Total
a soma de todas as freqncias absolutas simples em uma tabela.
k
Fi = n
i =1
37
A freqncia total de uma distribuio de freqncias igual ao nmero total de observaes (n). Exemplo: Na Tabela 3, temos:
6
Fi = F1 + F2 + F3 + F4 + F5 + F6
i =1
4 + 8 + 3 + 3 +1+1 =
20
Freqncia Relativa Simples, ou simplesmente, Freqncia Relativa

Simbolizada por fi, a freqncia relativa simples fornece a proporo de cada valor ou de casos ocorridos em cada classe, em relao ao nmero total de observaes. Portanto, um nmero relativo. Para calcular a freqncia relativa, basta dividir a freqncia absoluta da ordem em questo pelo nmero de observaes.
fi = Fi n
As comparaes expressas atravs de porcentagem so mais usuais. Para obter a porcentagem de cada valor ou de casos ocorridos em cada classe, multiplica-se o quociente obtido por 100, ou seja: F f i = i 100 n
k
Nota:
i =1
f i = 1 ou 100%
Exemplo: Na Tabela 3, temos:

f1 = f2 = f3 = F1 4 = = 0,20 100 = 20 % 20 20 F2 8 = = 0,40 100 = 40% 20 20 F3 3 = = 0,15 100 = 15 % 20 20
38
f4 = f5 = f6 =
F4 3 = = 0,15 100 = 15 % 20 20 F5 1 = = 0,05 100 = 5 % 20 20 F6 1 = = 0,05 100 = 5 % 20 20
Freqncia Absoluta Acumulada

Denotada por Faci, a freqncia absoluta acumulada fornece a informao de quantos elementos se situam at determinado valor. A freqncia acumulada do isimo valor ou i-sima classe (freqncia acumulada de ordem i) obtida somando-se a freqncia desse valor ou classe com as freqncias anteriores, ou seja, a soma de todas as freqncias de ordens menores ou igual a da ordem em questo. Exemplo:
3
Fac3 =
i =1 4
Fi = F1 + F2 + F3
Fac4 =
i =1
Fi = F1 + F2 + F3 + F4
Exemplo: Na tabela 3, temos: Fac1 = F1 = 4 Fac2 = F1 + F2 = 4 + 8 = 12 Fac3 = F1 + F2 + F3 = 12 + 3 = 15 Fac4 = F1 + F2 + F3 + F4 = 15 + 3 = 18 Fac5 = F1 + F2 + F3 + F4 + F5 = 18 + 1 = 19 Fac6 = F1 + F2 + F3 + F4 + F5 + F6 = 19 + 1 = 20
Freqncia Acumulada Relativa

Denotada por faci, fornece a proporo de elementos situados at determinado valor. Consiste na soma da freqncia relativa de cada valor ou classe com as freqncias relativas dos valores ou classes anteriores, ou seja, a soma das freqncias simples relativas de ordens menores ou iguais a da ordem em questo. .
39
Exemplo:
3
fac3 =
i =1
fi = f1 + f2 + f3
Exemplo: Na tabela 3, temos: fac1 = f1 = 0,20 = 20% fac2 = f1 + f2 = 0,20 + 0,40 = 0,60 = 60% fac3 = f1 + f2 + f3 = 0,60 + 0,15 = 0,75 = 75% fac4 = f1 + f2 + f3 + f4 = 0,75 + 0,15 = 0,90 = 90% fac5 = f1 + f2 + f3 + f4 + f5 = 0,90 + 0,05 = 0,95 = 95% fac6 = f1 + f2 + f3 + f4 + f5 + f6 = 0,95 + 0,05 = 1 = 100% A freqncia relativa acumulada de ordem i pode ser tambm calculada atravs do quociente: = Exemplo: fac3 = 15 = 0,75 = 75 % 20
Com relao Tabela 3, utilizando todos os tipos de freqncias definidas anteriormente, podemos construir a seguinte distribuio de freqncias:
Tabela 4
i 1 2 3 4 5 6
Nmero de Irmos de 20 alunos da Turma Geo/Bio xi Fi fi fi (%) Faci faci faci(%) 0 4 0,20 20 4 0,20 20 1 8 0,40 40 12 0,40 40 2 3 0,15 15 15 0,75 75 3 3 0,15 15 15 0,90 90 4 1 0,05 5 5 0,95 95 5 1 0,05 5 5 1,00 100 Total 20 1,00 100
FONTE: Dados Fictcios
40
Interpretao: f3 = 0,15; 15% dos alunos responderam que tm 2 irmos. F2 = 8; 8 alunos responderam que tm 1 irmo; fac3 = 0,75; 75% dos alunos responderam que tm entre 0 e 2 irmos.
Representao Grfica de uma Distribuio de Freqncias Simples

A distribuio de Freqncias Simples representada graficamente por um Grfico em Hastes, um diagrama onde as freqncias so representadas por segmentos de retas perpendiculares ao eixo das abcissas. Cada segmento determinado pelos pontos (xi,Fi) e (xi,0). Exemplo: Representao grfica da Tabela 3.
Fi 8
4 3 1 0 1 2 3 4 5 xi (numero de irmos)
EXERCCIOS COMPLEMENTARES
1. Considere a seguinte distribuio de freqncias correspondente aos diferentes preos de um determinado produto pesquisados em 20 lojas. i 1 2 3 4 5
Preos do Produto A Preo (R$) Nmero de Lojas 50 2 51 5 52 6 53 6 54 1 Total 20
41
a) Quantas lojas apresentam preos de R$ 52,00? b) Determine as freqncias relativas simples e as freqncias absolutas acumuladas. c) Quantas lojas apresentaram um preo de at R$ 52,00 (inclusive)? d) Qual a percentagem de lojas com preos de at R$ 53,00 (inclusive)? 2. A distribuio de freqncias a seguir apresenta o nmero de acidentes por dia, durante 40 dias, em determinado cruzamento. i 1 2 3 4 5
Nmero de Acidentes no Cruzamento X Nmero de Dias N de Acidentes por dia (Fi) (xi) 0 30 1 5 2 3 3 1 4 1 Total 40
a) Determine as freqncias absolutas acumuladas, as freqncias simples relativas e as freqncias acumuladas relativas. b) Aps ter determinado as freqncias acima, interprete todos os resultados da 3 linha da distribuio de freqncias. 3. Em uma amostra de 30 milheiros de telhas recebidas pela Construtora ABC Ltda, constatou-se os seguintes nmeros de unidades defeituosas por milheiro: 5 20 10 5 40 30 20 5 10 15 10 30 40 10 50 10 30 15 20 40 10 20 20 50 10 40 30 20 0 30 a) b) c) d) e) f) Agrupar estes dados em uma distribuio de freqncias simples. Represent-la atravs de um grfico conveniente. Calcular todos os tipos de freqncias conhecidos. Qual a percentagem de milheiros com mais de 30 telhas defeituosas? Quantos milheiros tiveram menos de 10 telhas defeituosas? Qual a proporo de milheiros com menos de 20 telhas defeituosas?
42
4. Dada a distribuio de freqncias:
Indstria de Equipamentos Eletrnicos IEE Nmero de Falhas em Componentes durante o perodo de garantia Janeiro de 2009 i N de Falhas Nmero de Equipamentos (xi) (Fi) 1 0 148 2 1 52 3 2 34 4 3 26 5 4 13 6 5 7 Total 280
a) Determinar as freqncias relativas percentuais, as freqncias acumuladas e as freqncias relativas acumuladas percentuais. b) Atravs das freqncias calculadas, responder qual a porcentagem de: b.1) equipamentos que no apresentaram falha em seus componentes; b.2) equipamentos que apresentaram pelo menos uma falha em seus componentes; b.3) equipamentos trocados, sabendo-se que a indstria se compromete a trocar o equipamento que apresente 4 ou mais falhas em seus componentes. 5. Considere os seguintes nmeros. 1 0 8 8 3 1 6 11 5 2 5 6 7 3 4 4 9 4 3 2 2 5 2 1 4 6 1 3 6 7 0 5 8 8 10 7 10 9 15 9 15 9 20 11 20 8 25 25 7 12
a) Construa a distribuio de freqncias simples. b) Represent-la atravs de um grfico conveniente. c) Calcular todos os tipos de freqncias conhecidos.
43
Intervalo de Classe ou Classe

Classes so intervalos de variaes da varivel, ou seja, cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da varivel. Uma determinada classe pode ser identificada por seus extremos ou pela ordem em que ela se encontra na tabela (valor do ndice i) O nmero de classes de uma distribuio de freqncias ser denotado por k. A notao indica intervalo fechado esquerda. Assim, na Tabela 2, um funcionrio que apresentou salrio de R$ 1400,00 pertence classe 1400 1600, ou terceira classe (i = 3). Existem diversas maneiras de expressar as classes: a) a b compreende todos os valores entre a e b, incluindo a e b b) a b compreende todos os valores entre a e b, excluindo a c) a b compreende todos os valores entre a e b, excluindo b d) a b compreende todos os valores entre a e b, excluindo a e b Em nosso curso usaremos a forma expressa em c).
Limites de Classe
So os valores extremos de cada classe. O menor valor denomina-se limite inferior da classe i (li) e o maior, limite superior da classe i (Li). Assim, na quarta classe da Tabela 2 tem-se l4 = 1600 e L4 = 1800.
Amplitude do Intervalo de Classe (h)

A amplitude do intervalo de classe o comprimento da classe, sendo definida como a diferena entre o limite superior e o limite inferior da classe. hi = Li li Exemplo: Na Tabela 2, temos: h1 = 1200 1000 = 200 h2 = 1400 1200 = 200
44
Em geral h1 = h2 = h3 = ... = h fazendo:
= h, e determina-se a amplitude do intervalo h= AT k
Exemplo: Dados: AT = 64 e k = 7. Temos: h =
64 = 9,14 10 7
Nota: Sugere-se sempre aproximar o valor encontrado para o inteiro superior.
Nmero de Classes (k)

No existe uma regra fixa que fornea o nmero de classes. No entanto, como o objetivo da distribuio de freqncias facilitar a compreenso dos dados, importante que a distribuio contenha um nmero adequado de classes. Se este nmero for escasso, os dados originais ficaro to comprimidos que pouca informao poder ser extrada da tabela. Se por outro lado forem utilizadas vrias classes, haver algumas com freqncias nulas ou muito pequenas e o resultado ser uma distribuio irregular e prejudicial interpretao do fenmeno como um todo. Na prtica esse nmero no deve ser superior a 20 nem inferior a 5. Se a quantidade de dados for pequena no se justifica a construo de uma tabela, e se for grande, mais de 20 classes dificulta a anlise. Em funo do total de observaes existem vrios mtodos que orientam a escolha de um nmero de classes conveniente. Seguem-se os dois mais utilizados:
a) Regra da Raiz Quadrada

k=5 para n 25 k = n para n > 25, onde n o nmero de observaes. Exemplo: Para n = 30, o nmero de classes ser 30 = 5,48 5.
b) Regra de Sturges
k = 1 + 3,3 log n, onde: n = nmero de observaes. Exemplo: Para n = 30, tem-se: k = 1 + 3,3 log 30 6.
45
Para n = 30 os resultados obtidos pelos dois critrios so bastante prximos. O mesmo no acontece para valores grandes de n onde a regra de Sturges tem o inconveniente de prever um nmero relativamente pequeno de classes e o procedimento da raiz quadrada, um nmero relativamente grande. Neste caso deve prevalecer o bom senso do analista.
Ponto Mdio da Classe (xi)

Considerando que os valores de uma classe esto distribudos uniformemente, o ponto mdio ou valor mdio de uma classe o valor que melhor a representa para efeito de clculo de certas medidas. O ponto mdio de uma classe i definido por: x i = li + L i 2
Uma outra maneira de obter o ponto mdio adicionar a metade da amplitude ao limite inferior da classe. Na Tabela 2, o ponto mdio da classe 1200 x3 = 1400 :
1200 + 1400 200 = 1300 , ou x 3 = 1200 + = 1300 . 2 2
Regras para a elaborao de uma Distribuio de Freqncias por Classes

a) Determinar o rol (opcional). b) Determinar a amplitude total (AT) dos dados: AT = valor mximo valor mnimo c) Determinar o nmero conveniente de classes (k), de acordo com um dos critrios citados anteriormente. d) Determinar a amplitude de cada classe (h) dividindo a amplitude total pelo nmero de classes. AT h= k Muitas vezes ao efetuar esta diviso, pode-se chegar a um resultado no muito conveniente sob o aspecto de montagens das classes. Neste caso sugere-se que o
46
valor encontrado seja aproximado para o maior inteiro, caso contrrio algum dado excederia o limite superior da ltima classe prevista. e) Determinar os limites das classes, escolhendo-se, preferencialmente, nmeros inteiros. O limite inferior da primeira classe e o limite superior da ltima, no precisam, necessariamente, pertencer ao conjunto. f) Construir a tabela de freqncias, contando o nmero de ocorrncia de cada classe. Exemplo: Os dados a seguir representam as notas de 50 alunos. 33 50 61 69 80 35 52 64 71 81 35 53 65 73 84 39 54 65 73 85 41 55 65 74 85 41 55 66 74 88 42 57 66 76 89 45 59 66 77 91 47 60 67 77 94 48 60 68 78 97
Vamos agrupar estes elementos em uma distribuio de freqncias por classes a) Amplitude Total: AT = 97 33 = 64
b) Nmero de Classes: k =
50 7 ou k = 1 + 3,3 log 50 = 1 + 3,3 x 1,7 7 A T 64 = = 9,14 10 (aproximar para o maior k 7
c) Amplitude das Classes (h): h = inteiro) d) Limites das Classes

30 40 50 60 70 80 90 40 50 60 70 80 90 100
Ponto inicial = 30 (o ponto inicial deve ser sempre menor ou igual ao menor valor observado)
Ponto final = 100 (o ponto final deve ser sempre maior que o maior valor observado)
e) Distribuio de Freqncias por Classes
47
Notas de 50 alunos
Classes 1 2 3 4 5 6 7 30 40 50 60 70 80 90 Notas |--40 |--50 |--60 |--70 |--80 |--90 |--- 100 Fi 4 6 8 13 9 7 3 50 fi fi(%) 0,08 8 0,12 12 0,16 16 0,26 26 0,18 18 0,14 14 0,06 6 1,00 100 Faci 4 10 18 31 40 47 50 faci faci(%) 0,08 8 0,20 20 0,36 36 0,62 62 0,80 80 0,94 94 1,00 100 xi 35 45 55 65 75 85 95
Total
Interpretao:
F3 = 8 8 alunos obtiveram nota igual ou superior a 50 e inferior a 60. f4 = 26% 26% dos alunos obtiveram notas entre 60 (inclusive) e 70 (exclusive). Fac6 = 47 47 alunos obtiveram notas inferiores a 90. fac5 = 80% 80% dos alunos obtiveram notas inferiores a 80.
Distribuio de Freqncias com Intervalos de Classes Desiguais

Existem casos em que mais adequado agrupar os dados em classes com larguras desiguais, como, por exemplo, as idades dos atletas de acordo com a categoria a que pertencem. Exemplo:
Tabela 5
Categoria de Atletas por Idade Fi Classes Idades 1 2 |--- 13 12 2 13 |--- 15 5 3 15 |--- 18 8 4 18 |--- 30 30 5 30 |--- 40 12 6 40 |--- 60 10 7 60 |--- 90 2 79 Total
48
Grficos de uma Distribuio de Freqncias por Classes

Histograma
um tipo de grfico apropriado para representar dados agrupados em classes. Consiste de colunas justapostas cujas bases representam as classes e as alturas correspondem s freqncias das classes.
Polgono de Freqncias
Trata-se da representao de uma distribuio de freqncias por classes, atravs de um polgono. O eixo das abcissas constitui a base do polgono. Os vrtices so os pontos (xi,Fi) onde xi o ponto mdio e Fi a freqncia da classe. O fechamento da poligonal com a base feito unindo o primeiro vrtice ao ponto mdio de uma classe anterior primeira, e o ltimo vrtice ao ponto mdio de uma classe posterior ltima. Esse grfico adequado tambm para a representao de freqncias relativas e percentuais.
Polgono de Freqncias Acumuladas ou Ogiva de Galton

Utilizado para representar as freqncias acumuladas. Os vrtices so os pontos (Li, Faci). Pode ser usado tambm para representar as freqncias acumuladas relativas percentuais. O fechamento feito unindo o primeiro vrtice ao limite inferior da primeira classe. Esse grfico ser til para a determinao das medidas separatrizes que sero tratadas posteriormente. Exemplo: Dada a distribuio de freqncias:
30 40 50 60 70 80 90
Notas dos alunos da turma PEST Fac Fi Fi Notas |--40 4 4 0,08 |--50 6 10 0,12 |--60 8 18 0,16 |--70 13 31 0,26 |--80 9 40 0,18 |--90 7 47 0,14 |--- 100 3 50 0,06 Total 50 1,00
xi 35 45 55 65 75 85 95
49
Os grficos representativos dessa distribuio so:

HISTOGRAMA E POLGONO DE FREQUNCIAS
Fi 13 Polgono de freqncia
9 8 7 6 4 3
30
40
50
60
70
80
90
100
classe
POLGONO DE FREQUNCIAS ACUMULADAS

Fac 50 47 40 31
18 10 4 30 40 50 60 70 80 90 100 classe
EXERCCIOS COMPLEMENTARES
1. Os dados a seguir referem-se s notas de 50 alunos:
60 71 80 71 94 85 35 61 55 98 33 81 41 78 66 52 50 91 48 66 65 35 55 69 73 77 64 73 85 42 84 74 59 67 65 65 47 53 39 94 74 54 77 60 88 57 68 45 76 89
50
Pede-se: a) A amplitude total da amostra. b) O nmero de classes. c) A amplitude das classes. d) As classes (valor inicial = 30). e) As freqncias absolutas das classes. f) As freqncias relativas. g) Os pontos mdios das classes. h) As freqncias acumuladas das classes. i) O histograma. j) O polgono de freqncias. k) O polgono de freqncias acumuladas. 2. A tabela abaixo apresenta os salrios de 90 funcionrios da UERJ
Salrios dos Funcionrios da UERJ

Classes
1 2 3 4 5
Salrios Mnimos
1 3 5 7 9 |--|--|--|--|--3 5 7 9 11
Fi 40 30 10 5 5 90
Total
a) Determine as freqncias simples relativas, as freqncias absolutas acumuladas e as freqncias relativas acumuladas. b) Quantos funcionrios ganham menos de 3 salrios mnimos? c) Quantos ganham mais de salrios mnimos? d) Qual a percentagem de operrios com salrio entre 5 e 7 salrios mnimos? e) Qual a percentagem de operrios com salrio inferior a 7 salrios mnimos? f) Construa o histograma e o polgono de freqncia. 3. Complete a tabela abaixo:
i 1 2 3 4 5 6 7 8 Classes 0 |--2 |--4 |--|--8 |--10 |--|--14 |--2 4 6 10 12 13 16 xi 1 5 7 Fi 4 8 27 15 10 Faci 30 72 83 93 fi 0,04 0,18 0,27 0,10 0,07
Total
51
4. A tabela abaixo apresenta uma distribuio de freqncia das reas de 400 lotes:
i 1 2 3 4 5 6 7 8 9 reas (m2) 300 |--400 400 |--500 500 |--600 600 |--700 700 |--800 800 |--900 900 |--- 1000 1000 |--- 1100 1100 |--- 1200 N de Lotes 14 46 58 76 68 62 48 22 6
Com referncia a essa tabela determine: a) A amplitude total. b) O limite superior da 5 classe. c) A freqncia acumulada da 4 classe. d) O nmero de lotes cuja rea no atinge 700 m2. e) O nmero de lotes cuja rea superior ou igual a 800 m2. f) A classe do 72 lote. 5. a) b) c) d) e) f) Responda as seguintes questes: O que freqncia simples absoluta de uma classe? O que freqncia simples relativa de uma classe? O que freqncia acumulada absoluta de uma classe? O que freqncia acumulada relativa de uma classe? O que limite inferior de uma classe? O que ponto mdio de uma classe?
6. Os pesos de 40 alunos esto relacionados a seguir: 69 65 60 67 57 76 81 68 72 60 71 53 54 49 67 53 93 74 63 65 68 59 64 58 72 66 53 80 58 83 73 60 64 70 81 63 62 45 50 53
a) Agrupar estes dados em classes de valores (Dado log 40 = 1,6). b) Determine as freqncias relativas, as freqncias acumuladas e as freqncias relativas acumuladas. c) Determine os pontos mdios das classes. d) Interprete todos os resultados da 3 linha da tabela. e) Construa o histograma, o polgono de freqncias e o polgono de freqncias acumuladas da distribuio.
52
7. Os dados abaixo referem-se ao consumo mensal de energia eltrica em kwh da conta n 001.161157-1 da Ligth Rio, no perodo de 1997 a 1999. 142 178 164 190 146 131 119 131 187 158 168 111 96 118 182 116 188 207 229 180 181 175 205 179 184 227 210 210 213 190 240 215 226 188 190 205 a) Sintetizar esses dados atravs de uma distribuio de freqncias por classes. b) Calcular todos os tipos de freqncias que voc conhece. c) Com base nas freqncias calculadas, apresentar os seguintes percentuais: c.1) de meses com consumo inferior a 150 kwh. c.2) de meses com consumo superior a 200 kwh. d) Representar a distribuio elaborada atravs de um histograma e de um polgono de freqncias. e) Representar a distribuio de freqncias acumuladas atravs de uma Ogiva. 8. Dada a amostra: 28 27 31 23 18 33 33 33 29 15 27 31 30 30 16 30 27 32 24 17 31 31 30 28 17 30 28 33 34 18 33 27 27 39 19 30 29 33 30 19 33 31 31 18 20 29 24 33 17 29
a) Agrupar os elementos em classes (inicie pelo 15 e use h = 5). b) Calcule as freqncias absolutas, as freqncias acumuladas e os pontos mdios das classes. c) Interprete todos os resultados da 4 linha da tabela. d) Construa o histograma, o polgono de freqncias e o polgono de freqncias acumuladas da distribuio. 9. Abaixo temos a distribuio dos aluguis de 65 casas.
Aluguel (centenas de $) 1,5 |-- 3,5
3,5 |-- 5,5 18
5,5 |-- 7,5 20
7,5 |-- 9,5 10
9,5 |-- 11,5 5
N de casas
12
Com referncia a essa tabela determine: a) A amplitude total. b) O limite superior da 5 classe. c) A freqncia acumulada da 4 classe. d) O nmero de aluguis cujo valor atinge, no mximo, R$ 550,00.
53
e) O nmero de aluguis cujo valor superior ou igual a R$ 750,00. f) A classe do 50 aluguel. 10.A distribuio de freqncia abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos.
Consumo por nota (R$) n de notas 0 |------ 50 10 50 |------ 100 28 100 |------ 150 12 150 |------ 200 2 200 |------ 250 1 250 |------ 300 1
a) Interprete todos os resultados da 4 linha da tabela. b) Construa o histograma e o polgono de freqncias.
54
MEDIDAS DE POSIO
As medidas de posio so valores que representam o conjunto de dados observados ou ento promovem uma partio sobre este conjunto. Entre as medidas de posio destacam-se as medidas de tendncia central e as separatrizes.
MEDIDAS DE TENDNCIA CENTRAL

A maneira mais simples de resumirmos as informaes contidas em um conjunto de dados observados estabelecer um ponto central em torno do qual os dados se distribuem. Tais medidas orientam quanto posio do conjunto no eixo dos nmeros reais e possibilitam comparaes de sries de dados entre si pelo confronto destes nmeros. So chamadas Medidas de Tendncia Central, pois representam os fenmenos pelos seus valores mdios em torno dos quais tendem a se concentrar os dados.
2.1.1 MDIA ARITMTICA ( x )

a) Mdia aritmtica para dados no agrupados
Sejam x1, x2, ..., xn, n valores da varivel X. A mdia aritmtica simples, denotada por x , definida por:
n
xi x=
i =1
onde n o nmero de valores observados da varivel X. Exemplo: Determinar a mdia aritmtica simples dos valores: 7,0; 3,0; 5,5; 6,5; 8,0.
5
xi x=
i =1
7,0 + 3,0 + 5,5 + 6,5 + 8,0 = 6,0 5
55
b) Mdia aritmtica para dados agrupados
Neste caso, usamos a mdia aritmtica dos valores x1, x2, ..., xk, ponderada pelas suas respectivas freqncias absolutas F1, F2, F3, ... , Fk. Desta forma, temos:
k
x i Fi x=
k i =1
onde n = F1 + F2 + ... + Fk =
i =1
Fi
Observao: Quando se tratar de uma distribuio de freqncia por classe, xi l + Li corresponde ao ponto mdio da classe, ou seja, x i = i . 2 Exemplos: 1. Determinar a mdia aritmtica da distribuio a seguir.
NMERO DE IRMOS DE ALUNOS DA TURMA BIO/GEO i xi Fi 1 0 4 2 1 8 3 2 3 4 3 3 5 4 1 6 5 1 TOTAL 20 Fonte: Dados Hipotticos
Soluo: Para determinar a mdia acrescentaremos a coluna com o clculo de xiFi

NMERO DE IRMOS DE 20 ALUNOS DA TURMA BIO/GEO i xi Fi XIFI 1 0 4 0 2 1 8 8 3 2 3 6 4 3 3 9 4 5 4 1 6 5 1 5
56
TOTAL Fonte: Dados Hipotticos

k 6
20
32
x i Fi x=
i =1
x i Fi =
i =1
20
32 = 1,6 20
2. Dada a distribuio:
Renda Familiar de 40 Famlias i Salrios (R$ Fi 1.000) 1 2 |--- 4 5 2 4 |--- 6 10 3 6 |--- 8 14 4 8 |--- 10 8 5 10 |--- 12 3 TOTAL 40 Fonte: Dados Hipotticos
Determinar a renda mdia familiar destas 40 famlias. Soluo: Acrescentamos as colunas com os clculos de xi e xiFi ,
Renda Familiar de 40 Famlias i Salrios Fi xi x i Fi (R$ 1.000) 1 2 |--4 5 3 15 2 4 |--6 10 5 50 3 6 |--8 14 7 98 4 8 |--- 10 8 9 72 5 10 |--- 12 3 11 33 TOTAL 40 268 Fonte: Dados Hipotticos
e utilizamos a frmula:
k 5
x i Fi x=
i =1
x i Fi =
i =1
40
268 40
6,7
Assim, cada famlia possui, mdia, uma renda de R$6.700,00. Assim, cada famlia possui, emem mdia, uma renda de R$6.700,00.
57
MEDIANA (Md)
A mediana, denotada por Md, o valor que divide o rol em duas partes contendo, cada uma, a mesma quantidade de elementos. Assim, a mediana o valor que ocupa a posio central de uma srie de dados. 50% Md 50%
a) Mediana para dados no agrupados

i) Se n mpar o rol admite apenas um termo central que ocupa a posio O valor do elemento que ocupa esta posio a mediana. n +1 . 2
Exemplo: Determinar a mediana da srie: 20; 12; 23; 20; 8; 12; 2.

Rol: 2; 8; 12; 12; 20; 20; 23. n = 7 (n mpar) O rol admite somente um termo central que ocupa a posio posio. Portanto Md = x4 = 12. 7 +1 , ou seja, a 4 2
Interpretao: 50% dos valores da srie so menores ou iguais a 12 e 50% dos valores so maiores ou iguais a 12. ii) Se n par neste caso o rol admite dois termos centrais que ocupam as n n posies e + 1 . 2 2 Neste caso a mediana definida como a mdia aritmtica destes dois termos centrais.
Exemplo: Determinar a mediana da srie: 7; 21; 13; 15; 10; 8; 9; 13.

Rol: 7; 8; 9; 10; 13; 13; 15; 21. n = 8 (n par) A srie admite dois termos centrais que ocupam as posies 4 posio e a 5 posio. Portanto, 8 8 e + 1 , ou seja, a 2 2
58
Md =
x 4 + x 5 10 + 13 = = 11,5 . 2 2
Interpretao: 50% dos valores do rol so menores ou iguais a 11,5 e 50% dos valores so maiores ou iguais a 11,5.
b) Mediana para dados agrupados sem intervalos de classes

O procedimento para o clculo da mediana para dados agrupados sem intervalos de classes o mesmo utilizado para dados no agrupados, ou seja: n +1 Se n for mpar, a mediana ser o termo central, isto , o termo de ordem . 2 Se n for par, a mediana ser a mdia aritmtica entre os elementos centrais, isto n n , os elementos de ordem e + 1 . 2 2 Exemplo 1: Determinar a mediana da distribuio abaixo. i 1 2 3 4 5 TOTAL n = 23 (n mpar) A distribuio admite apenas um termo central que ocupa a posio seja, a 12 posio. 23 + 1 , ou 2 xi 2 5 8 10 12 Fi 1 4 10 6 2 23 Faci 1 5 15 21 23
Atravs das freqncias acumuladas podemos observar que: o 1 elemento o 2; o 2, o 3, o 4 e o 5 elementos so iguais a 5; o 6, o 7, ... , o 15 elementos so iguais a 8; e assim sucessivamente. Portanto o 12 elemento o 8. Logo, Md = x12 = 8.
59
Exemplo 2: Determinar a mediana da distribuio i 1 2 3 4 5 TOTAL n = 32 (n par). A srie admite dois termos centrais que ocupam as posies o 16 e o 17 elementos. Observando as freqncias acumuladas, temos: O 1, o 2 e o 3 elementos so iguais a 0; O 4, o 5, o 6, o 7 e o 8 so iguais a 1; O 9, o 10, ... , o 16 so iguais a 2; O 17, o 18, ... , o 26 so iguais a 3; O 27, o 28, ..., o 32 so iguais a 5. Portanto o 16 termo igual a 2 e o 17 termo igual a 3. x + x17 2 + 3 Logo, Md = 16 = = 2,5 2 2 32 32 e + 1 , ou seja, 2 2 xi 0 1 2 3 5 Fi 3 5 8 10 6 32 Faci 3 8 16 26 32
c) Mediana para dados agrupados com intervalos de classes

Calcula-se n , independente de n ser par ou mpar; 2 Localiza-se, atravs das freqncias acumuladas, a classe mediana, ou seja, a n classe que contm o termo de ordem ; 2 Aplica-se a frmula: n Facant 2 Md = l Md + h, FMd onde: lMd = limite inferior da classe mediana; Facant = freqncia acumulada da classe anterior classe mediana; h = amplitude da classe mediana; FMd = freqncia absoluta da classe mediana.
60
Exemplo 1 Determinar a mediana da distribuio.

i 1 2 3 4 5 6 Altura(cm) 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 170 |--- 174 Fi 4 9 11 8 5 3 40 Faci 4 13 24 classe mediana 32 37 40
TOTAL
Calcula-se
n 40 = 20 2 2
Localiza-se a classe mediana (a classe que contm o termo de ordem Classe mediana = 3 classe n Facant 2 h Aplica-se a frmula: Md = l Md + FMd
n ) 2
lMd = 158
Facant= 13 h=4 FMd = 11 Md = 158 + 20 13 4 = 160,55 11
Interpretao: 50% das pessoas tm altura inferior a 160,55 cm. Exemplo 2 Consideremos a distribuio de freqncia por classes das notas dos 50 alunos da turma PEST e vamos calcular a sua mediana.
Notas de 50 alunos da turma PEST

Classes 1 2 3 4 5 6 7 Notas 30 40 50 60 70 80 90 |--|--|--|--|--|--|--40 50 60 70 80 90 100 Fi Faci 4 4 6 10 8 18 13 31 9 40 7 47 3 50 50 ---Fonte: Dados Hipotticos
classe mediana
Total
61
Calcula-se
n 50 = 25 2 2
Localiza-se a classe mediana (a classe que contm o termo de ordem Classe mediana = 4 classe n Facant 2 Aplica-se a frmula: Md = l Md + h FMd
n ) 2
lMd = 60
Facant= 18 h = 10 FMd = 13 Interpretao: 50% das notas foram inferiores a 65,38. Md = 60 + 25 18 10 = 65,38 13
EXERCCIOS COMPLEMENTARES:
1. Determinar a mdia e a mediana das sries: a) 2; 5; 8; 10; 12; 8; 5; 12 b) 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8 2. Determinar a mdia e a mediana das distribuies: a) xi 2 3 4 Fi 3 5 8 b) xi Fi c) Classes Fi d) Classes Fi 22 |-- 25 25 |-- 28 28 |-- 31 31 |-- 34 3 5 8 6 1 |-- 3 3 3 |-- 5 5 5 |-- 7 8 7 |-- 9 6 9 |-- 11 11 |-- 13 4 3 73 2 75 10 77 12 79 5 81 2
5 4
7 2
62
MODA (Mo)
A moda o valor mais freqente do conjunto de dados observados.
a) Moda para dados no agrupados

Para determinar a moda, basta identificar o(s) elemento(s) que mais se repete(m).
Exemplo: Determinar a moda dos conjuntos de dados abaixo:

a) 2; 8; 3; 5; 4; 5; 3; 5; 1 O elemento que mais se repete o 5. Portanto: Mo = 5 (seqncia unimodal). b) 6; 10; 5; 6; 10; 2 Neste conjunto de dados o elemento 6 e o elemento 10 se repetem mais vezes que os demais. Portanto: Mo1 = 6 e Mo2 = 10 (seqncia bimodal). c) 2; 2; 8; 8; 5; 5; 6; 6 No h nenhum elemento que se destaque por possuir maior freqncia. Portanto, a srie no possui moda e dita amodal.
Observao: A moda s considerada medida de tendncia central no caso unimodal. Nos demais casos uma medida estatstica de anlise. b) Moda para dados agrupados sem intervalos de classes
Neste caso, basta identificar o(s) elemento(s) de maior freqncia. Exemplo: Determinar a moda das distribuies: a)
i 1 2 3 4 5 Total
Mo = 3 (Distribuio Unimodal)
xi 0 2 3 4 5
Fi 2 5 8 3 1
63
b)
i 1 2 3 4 5 Total
xi 1 2 3 4 5
Fi 2 5 4 5 1
Mo1 = 2 e Mo2 = 4 (Distribuio Bimodal) c)
i 1 2 3 4 Total
No h moda (Distribuio Amodal)
xi 4 5 8 10
Fi 5 5 5 5
c) Moda para dados agrupados com intervalos de classes

Neste caso, h diversos processos para o clculo da moda.
i) Frmula de Czuber
Identifica-se a classe modal (a que possui maior freqncia); Aplica-se a frmula: 1 Mo = lMo + h, 1 + 2 onde: lMo = limite inferior da classe modal. 1 = diferena entre a freqncia absoluta da classe modal e a freqncia absoluta da classe anterior classe modal. 2 = diferena entre a freqncia absoluta da classe modal e a freqncia absoluta da classe posterior classe modal. h = amplitude da classe modal.
64
Exemplo 1
Determinar a moda da distribuio: i 1 2 3 4 5 classes 0 |--- 1 1 |--- 2 2 |--- 3 3 |--- 4 4 |--- 5 Fi 3 10 17 8 5 43
Classe Modal
TOTAL
Identifica-se a classe modal: 3 classe (maior freqncia = 17) Aplica-se a frmula: 1 Mo = lMo + h , 1 + 2 onde: lMo = 2; 1 = 17 10 = 7; 2 = 17 8 = 9; h=32=1 7 Logo: Mo = 2 + 1 = 2, 44 7+9
Exemplo 2 Considere a distribuio abaixo.

Classes 1 2 3 4 Total Salrios dos Empregados da Empresa PEST Salrios (classes) Fi (n funcionrios) 800 70 |- 1800 1800 |- 2500 140 2500 |- 3000 140 3000 |- 5000 60 410 Fonte: Dados Hipotticos
Como as amplitudes das classes no so iguais, vamos utilizar as densidades das F classes i para identificar a classe modal (aquela com a maior densidade) hi
65
Classes 1 2 3 4 Total
Salrios dos Empregados da Empresa PEST Salrios xi Fi Fi/hi (classes) (pto mdio) (n funcionrios) (densidade) 800 |- 1800 1300 70 0,07 1800 |- 2500 2150 140 0,20 2500 |- 3000 2750 140 0.28 3000 |- 5000 4000 60 0,03 410 Fonte: Dados Hipotticos
Identifica-se a classe modal: 3 classe (maior densidade = 0,28) Aplica-se a frmula: 1 Mo = lMo + h , 1 + 2 onde: lMo = 2500; 1 = 0,28 0,20 = 0,08; 2 = 0,28 0,03 = 0,25; h = 500 0,08 Logo: Mo = 2500 + 500 = 2500 + 0, 24 500 = 2621,21 0,08 + 0, 25 Assim, R$ 2621,21 o salrio mais freqente entre os 410 funcionrios dessa empresa.
ii) Frmula de Pearson
Mo 3Md 2x Na frmula de Pearson a moda aproximadamente igual a diferena entre o triplo da mediana e o dobro da mdia. Esta frmula d uma boa aproximao quando a distribuio apresenta razovel simetria em relao mdia.
Observao: Para calcular a moda de uma varivel, precisamos apenas da distribuio de freqncia. Para a mediana necessitamos minimamente ordenar os valores atribudos varivel. A mdia s pode ser calculada para variveis quantitativas. Assim, para as variveis nominais somente podemos trabalhar com a mediana, alm da moda.
66
1. Para cada distribuio, determine a mdia, a mediana e a moda:

a) xi Fi 72 8 75 18 78 28 80 38
b)
Classes Fi 7 |--- 10 6 10 |--- 13 10 13 |--- 16 15 16 |--- 19 10 19 |--- 22 5
MEDIDAS SEPARATRIZES
As medidas separatrizes so valores que dividem o conjunto de dados observados em um determinado nmero de partes, contendo cada uma a mesma quantidade de elementos. So elas: Mediana considerada tambm uma medida separatriz. Quartis So valores que dividem o rol em quatro partes iguais, cada uma com 25% dos elementos. Ao todo tem-se 3 quartis: Q1 (1 quartil), Q2 (2 quartil) e Q3 (3 quartil).
25% 25% Q1 25% Q2=Md 25% Q3
Observe que: o Abaixo do 1 quartil tem-se 25% dos elementos; o Abaixo do 2 quartil tem-se 50% dos elementos; o Abaixo do 3 quartil tem-se 75% dos elementos; Decis So valores que dividem o rol em dez partes iguais, cada uma com 10% dos elementos. Ao todo tem-se 9 decis: D1 (1 decil), D2 (2 decil), ... , D9 (9 decil).
67
10%
10%
D1
10%
D2
10%
D3 D4
10%
10%
D5
10%
D6
10%
D7
10%
D8
10%
D9
Observe que: Abaixo do 1 decil tem-se 10% dos elementos; Abaixo do 2 decil tem-se 20% dos elementos; Abaixo do 3 decil tem-se 30% dos elementos; e assim sucessivamente. Centis ou Percentis Dividem o rol em cem partes iguais, cada uma com 1% dos elementos. Ao todo tem-se 99 centis: P1 (1 centil), P2 (2 centil), ... , P99 (99 centil).
1% 1%
P1
1%
P2
1%
P3
...
P4
1%
P50
...
P51
1%
P80
...
P81
1%
P99
Observe que: Abaixo do 1 centil tem-se 1% dos elementos; Abaixo do 2 centil tem-se 2% dos elementos; Abaixo do 3 centil tem-se 3% dos elementos; Abaixo do 4 centil tem-se 4% dos elementos; e assim sucessivamente.
Clculo das medidas separatrizes: a) Separatrizes para dados no agrupados
Devemos ordenar os elementos, identificar a medida que queremos obter (quartil, decil ou centil), localizar a posio da medida desejada e identificar o elemento que ocupa esta posio, de acordo com o esquema a seguir: Quartil i: pos = in ,i = 1, 2,3 4
Decil i: pos =
in ,i = 1, 2,...,9 10 in ,i = 1,2,...,99 100
Centil i: pos =
68
Observe que: Se pos for um nmero inteiro, ento a medida procurada corresponde ao elemento do rol que ocupa esta posio. Se pos no for um nmero inteiro, ento a medida procurada um elemento intermedirio entre os elementos que ocupam as posies aproximadas por falta e por excesso do valor pos. Neste caso, a separatriz corresponde mdia aritmtica dos valores que ocupam estas posies.
Exemplos:
1. Calcule o primeiro quartil da seqncia: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15. Rol: 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15. pos = i n 1 12 = =3 4 4
Logo, Q1= x3 = 5.
2. Calcule o P60 da seqncia: 2; 8; 7,5; 6; 10; 12; 2; 9. Rol: 2; 2; 6; 7,5; 8; 9; 10; 12. i n 60 8 = = 4,8 100 100 Como este valor no inteiro, o P60 um valor situado entre o 4 e o 5 elemento x + x 5 7,5 + 8 da seqncia. Logo, P60 = 4 = = 7,75 2 2 pos =
b) Separatrizes para dados agrupados sem intervalos de classes
Neste caso, como os dados j esto ordenados, utilizamos a freqncia acumulada da srie para localizar o elemento que ocupa a posio da separatriz desejada, conforme citado no item anterior.
Exemplo:
Calcular o quarto decil da distribuio:
69
i 1 2 3 4 5 Total
2 4 5 7 10
xi
Fi 3 5 8 6 2 24
Faci 3 8 16 22 24
pos =
i n 4 24 = = 9,6 10 10
Como este valor no inteiro, o D4 um valor situado entre o 9 e o 10 elemento da distribuio. x + x10 5 + 5 Logo, D 4 = 9 = =5 2 2
c) Separatrizes para dados agrupados com intervalos de classes
Neste caso, aplica-se a frmula: Sep = l + onde: pos Facant h, F
Sep = medida separatriz a ser determinada (Mediana, Quartil, Decil ou Centil); l = limite inferior da classe separatriz (a classe que contm a separatriz a ser determinada); Facant = freqncia acumulada da classe anterior classe separatriz; F = freqncia absoluta simples da classe separatriz; h = amplitude da classe separatriz; pos = a posio da separatriz, sendo dada por: n Mediana: pos = 2 Quartil i: pos = Decil i: pos = Centil i: pos = in ,i = 1, 2,3 4
in ,i = 1, 2,...,9 10
in ,i = 1,2,...,99 100
70
Exemplo:
Calcular o 1 quartil, o 4 decil e o 70 centil da distribuio. i 1 2 3 4 5 6 Altura (cm) 150 |--154 154 |--158 158 |--162 162 |--166 166 |--170 170 |--174 TOTAL Fi 4 9 11 8 5 3 40 4 13 24 32 37 40 Faci classe que contm o 1 quartil classe que contm o 4 decil classe que contm o 70 centil
Clculo do 1 quartil:
Calcula-se pos =
n 40 = 10 4 4 Localiza-se a classe que contm o 10 termo (2 classe) pos Facant Aplica-se a frmula: Q1 = lQ + h FQ
1 1
l Q1 = 154
Facant= 4 h=4 FQ1 = 9
Q1 = 154 +
10 4 4 = 156,67 9
Interpretao: 25% das pessoas tm altura inferior a 156,67 cm.

Clculo do 4 decil:
4n 4 40 = 16 10 10 Localiza-se a classe que contm o 16 termo (3 classe) pos Facant Aplica-se a frmula: D 4 = l D + h FD Calcula-se pos =
4 4
l D = 158
4
Facant= 13 h = 4 e FD 4 = 11
D 4 = 158 +
16 13 4 = 159,09 11
71
Interpretao:
40% das pessoas tm altura inferior a 159,09 cm.
Clculo do 70 centil:
Calcula-se pos =
70 n 70 40 = 28 100 100 Localiza-se a classe que contm o 28 termo (4 classe) pos Facant Aplica-se a frmula: C70 = lC + h FC
70 70
lC = 162
70
Facant= 24 h=4 FC = 8
70
C70 = 162 +
28 24 4 = 164 8
Interpretao: 70% das pessoas tm altura inferior a 164 cm.

1. Para a distribuio: Classes Fi 4 |--- 6 4 6 |--- 8 11 8 |--- 10 15 10 |--- 12 5
Calcule Q1, D6 e P65. Interprete os resultados obtidos. 2. Para a distribuio abaixo calcule Q3, D2 e P45. Interprete os resultados obtidos. Classes Fi 20 |--- 30 30 |--- 40 40 |--- 50 3 8 18 50 |--- 60 60 |--- 70 22 24
3. O departamento de recursos humanos de uma empresa, tendo em vista o aumento de produtividade de seus vendedores, resolveu , premiar com um aumento de 5% no salrio, a metade e seus vendedores mais eficientes. Para isto, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela:
72
Vendas (R$) 0 |---- 10.000 10.000 |---- 20.000 20.000 |---- 30.000 30.000 |---- 40.000 40.000 |---- 50.000 Total
N DE VENDEDORES 1 12 27 31 10
A partir de qual volume de vendas o vendedor ser premiado? 4. Se, no problema anterior, o gerente resolver premiar somente os 25% dos vendedores mais eficientes, a partir de qual volume de vendas o vendedor ser premiado? 5. A distribuio de freqncia abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos. Consumo por nota fiscal N DE NOTAS (R$) 0 |---- 50 10 50 |---- 100 28 100 |---- 150 12 150 |---- 200 2 200 |---- 250 1 250 |---- 300 1 Total O gerente desta loja de departamentos decidiu premiar a nvel promocional com um brinde, 10% dos fregueses que mais consumirem, nos prximos 30 dias. A partir de qual valor de consumo da nota fiscal os clientes seriam premiados?
73
MEDIDAS DE DISPERSO, MEDIDAS DE ASSIMETRIA

E EMEDIDAS MEDIDASDE DECURTOSE CURTOSE
MEDIDAS DE DISPERSO
As medidas de disperso so medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou disperso, dos valores em torno da mdia. Servem para medir a representatividade da mdia. Essa avaliao necessria, pois quando se trata de interpretar dados estatsticos, mesmo aqueles j convenientemente simplificados, como a mdia aritmtica, deve-se ter uma idia retrospectiva de como se apresentavam esses mesmos dados nas tabelas. Assim, no o bastante dar uma medida de posio para caracterizar perfeitamente um conjunto de valores, devemos, tambm, medir a variabilidade do conjunto de valores em relao essa medida de posio. Se observarmos as seqncias X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10 Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13 Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13 concluiremos que todas possuem a mesma mdia 13. No entanto, so seqncias completamente distintas do ponto de vista da variabilidade de dados. Na seqncia Z no h variabilidade de dados. A mdia 13 representa bem qualquer valor da srie. Na seqncia Y, a mdia 13 representa bem a srie, mas existem elementos da srie levemente diferenciados da mdia 13. Na seqncia X existem muitos elementos bastante diferenciados da mdia 13. Conclumos que a mdia 13 representa otimamente a seqncia Z, representa bem a seqncia Y, mas no representa bem a seqncia X. Chamando de disperso, ou variabilidade, a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central tomado como ponto de comparao, podemos dizer que o conjunto Z apresenta disperso ou variabilidade nula e que o conjunto Y apresenta uma disperso ou variabilidade menor que o conjunto X.
74
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor disperso ou variabilidade entre esses valores e a sua medida de posio, a Estatstica recorre s medidas de disperso. Estudaremos as principais medidas de disperso absolutas que so: amplitude total, desvio mdio, varincia e desvio-padro e a principal medida de disperso relativa que o coeficiente de variao.
AMPLITUDE TOTAL (AT )

A amplitude total a diferena entre o maior valor e o menor valor da seqncia dos dados observados. AT = valor mximo valor mnimo
a) Amplitude total para dados no agrupados
Basta identificar o maior e o menor valor da seqncia e efetuar a diferena entre esses valores. Exemplo: Determine a amplitude total da seqncia: 11, 12, 9, 10, 10, 15. Soluo: O maior valor desta seqncia 15 e o menor valor 9. Portanto, AT = 15 9 = 6 unidades.
b) Amplitude total para dados agrupados sem intervalos de classes
Como os valores j se encontram ordenados, a amplitude total a diferena entre o ltimo e o primeiro elemento da srie. Exemplo: Determine a amplitude total da srie:
NMERO DE IRMOS DE 20 ALUNOS DA TURMA BIO/GEO i Xi Fi 1 0 4 2 1 8 3 2 3 4 3 3 5 4 2 TOTAL 20 Fonte: Dados Hipotticos
Soluo: O maior valor da srie 4 e o menor valor da srie 0.
75
Portanto, AT = 4 0 = 4.
c) Amplitude total para dados agrupados com intervalos de classes
Nesta situao, a amplitude total da srie a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. Exemplo: Dada a distribuio abaixo encontre sua amplitude total:
Renda Familiar de 40 Famlias i Salrios (R$ Fi 1.000) 1 2 |--- 4 5 2 4 |--- 6 10 3 6 |--- 8 14 4 8 |--- 10 8 5 10 |--- 12 3 TOTAL 40 Fonte: Dados Hipotticos
Soluo: Como o limite superior da ltima classe L5 = 12 e o limite inferior da primeira classe l1 = 2, a amplitude total : AT = 12 2 = 10. Quando dizemos que a amplitude total dos valores 10, estamos afirmando alguma coisa do grau de sua concentrao. evidente que, quanto maior a amplitude total, maior a disperso ou variabilidade dos valores da varivel. Apesar da facilidade de obteno da amplitude total, esta medida apresenta a inconvenincia de depender apenas de dois valores da srie. possvel modificar completamente a disperso ou a concentrao dos elementos em torno da mdia, sem alterar a amplitude total da srie. uma medida que tem pouca sensibilidade estatstica.
Observao: Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no controle de qualidade ou como uma medida de clculo rpido. Tambm a usamos quando a compreenso popular mais importante que a exatido e a estabilidade.
DESVIO MDIO (DM)

Desde que se deseja medir a disperso dos dados em relao mdia parece interessante fazermos a anlise dos desvios em torno da mdia: di = (xi x ).
76
Mas a soma de todos os desvios igual a zero, Isto :
di =
(x i x) = 0 .
Utilizando o conceito matemtico de distncia (mdulo de nmero real), encontramos uma maneira de trabalhar com os desvios sem que a soma d zero e, por isso, o conceito estatstico de desvio corresponde ao conceito matemtico de distncia.
a) Desvio Mdio para dados no agrupados
Calculamos inicialmente a mdia da seqncia. Em seguida, identificamos a distncia de cada elemento da seqncia para sua mdia. Finalmente, calculamos a mdia destas distncias. Dessa forma define-se desvio mdio como: di xi x DM = = n n Veja que os desvios foram considerados em mdulo, evitando-se assim que a soma fosse nula. Exemplo: Calcule o desvio mdio para a seqncia: 2, 8, 5, 6. Soluo: Determinamos inicialmente a mdia da srie x= xi n 2+8+5+6 = 5,25 . 4
Em seguida, determinamos as distncias de cada elemento da srie para a mdia da srie

x1 x = 2 5,25 = 3,25 x 2 x = 8 5, 25 = 2,75 x 3 x = 5 5, 25 = 0,25 x 4 x = 6 5, 25 = 0,25 O DM a mdia aritmtica simples destes valores: DM = 3, 25 + 2,75 + 0, 25 + 0,75 7 = = 1,75 . 4 4
77
Interpretao: Em mdia, cada elemento da seqncia est afastado do valor 5,25 por 1,75 unidades. b) Desvio Mdio para dados agrupados sem intervalos de classes
No caso da apresentao de uma varivel discreta, lembramos que a freqncia absoluta simples de cada elemento representa o nmero de vezes que este valor figura na srie. Conseqentemente, haver repeties de distncias iguais de cada elemento distinto da srie para a mdia da srie. Assim, a mdia indicada para estas distncias uma mdia aritmtica ponderada: d i Fi x i x Fi DM = = n n Exemplo: Determine o desvio mdio (DM) para a srie: i 1 2 3 4 TOTAL Soluo: A mdia da srie : x = xi 1 3 4 5 Fi 2 5 2 1 10 e o DM dado por D M = x i x Fi x iF i 2 15 8 5 30 x i x Fi n .
x i Fi n
Por isso, incluiremos as colunas xi Fi e clculos acima. xi 1 3 4 5 TOTAL Logo, a mdia 2 5 2 1 10 Fi
na tabela para efetuar os
x i x Fi 4 0 2 2 8
x= e o desvio mdio
x i Fi n
30 =3 10
78
DM =
x i x Fi n
8 = 0,8 . 10
Interpretao: Em mdia, cada elemento da srie est afastado do valor 3 por 0,8 unidades. c) Desvio Mdio para dados agrupados com intervalos de classes
Nesta situao, por desconhecer os valores individuais dos elementos componentes da srie, substituiremos estes valores xi , pelos pontos mdios das classes. Desta forma, o desvio mdio tem por clculo a frmula: DM = onde xi o ponto mdio da classe i. x i x Fi n ,
Exemplo: Determine o desvio mdio (DM ) para a srie: i 1 2 3 4 classes 2 |--- 4 4 |--- 6 6 |--- 8 8 |--- 10 Fi 5 10 4 1 20 x i x Fi na tabela para efetuarmos xi 3 5 7 9 x i Fi 15 50 28 9 102
TOTAL
Soluo: Incluiremos as colunas xi , xi Fi e os clculos desejados. i 1 2 3 4 classes 2 4 6 8 |--- 4 |--- 6 |--- 8 |--- 10 TOTAL x i Fi n Fi 5 10 4 1 20
x i x Fi 10,5 1,0 7,6 3,9 23,0
A mdia da srie : x =
102 = 5,1 . 20
79
O desvio mdio : D M =
x i x Fi n
23 = 1,15 . 20
Interpretao: Em mdia, cada elemento da srie est afastado de 5,1 por 1,15 unidades.
O desvio mdio depende de cada componente da srie. Se mudarmos o valor de um nico elemento da srie, mudamos tambm o DM. Portanto, o desvio mdio tem perfeita sensibilidade estatstica. A maior dificuldade desta medida envolver mdulos, cujas propriedades, em geral no so suficientemente conhecidas pelos alunos que normalmente desenvolvem estes clculos.
EXERCCIOS:
3. Determinar a amplitude total e o desvio mdio das sries: a) 2; 5; 8; 10; 12; 8; 5; 12 b) 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8 4. Determinar a amplitude total e o desvio mdio das distribuies: a) xi 2 3 4 5 7 Fi 3 5 8 4 2 b) xi Fi c) Classes Fi d) Classes Fi 22 |--- 25 3 25 |--- 28 5 28 |--- 31 8 31 |--- 34 6 1 |--- 3 3 3 |--- 5 5 5 |--- 7 7 |--- 9 8 6 9 |--- 11 4 11 |--- 13 3 73 2 75 10 77 12 79 5 81 2
80
2 VARINCIA (S ) e DESVIO PADRO (S)
Como vimos, a amplitude total instvel, por se deixar influenciar pelos valores extremos da srie, que so, na sua maioria, devidos ao acaso. Tambm observamos que a dificuldade em se operar com o desvio mdio se deve presena do mdulo, para que as diferenas xi x possam ser interpretadas como distncias. A varincia e o desvio padro so medidas que fogem a essas falhas, pois levam em considerao a totalidade dos valores da varivel em estudo, o que faz delas ndices de variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados. A varincia baseia-se nos desvios em torno da mdia aritmtica, porm, para conseguir que as diferenas xi x se tornem sempre positivas ou nulas vamos considerar o quadrado destas diferenas, isto (xi x )2. Se substituirmos, nas frmulas do desvio mdio a expresso x i x por (xi x )2, obteremos essa nova medida de disperso chamada varincia. O desvio padro a raiz quadrada positiva da varincia. Em particular, para estas medidas levaremos em considerao o fato de a seqncia de dados representar toda uma populao ou apenas uma amostra de uma populao. No final desta seo justificaremos esta necessidade. Quando a seqncia de dados representa uma populao a varincia ser denotada por 2 e o desvio padro correspondente por . Quando a seqncia de dados representa uma amostra, a varincia ser denotada por s2 e o desvio padro correspondente por s.
a) Varincia e desvio padro para dados no agrupados
Se a seqncia representa uma populao, a varincia calculada pela frmula:

2
=
e o desvio padro = 2 .
(x i x) 2 n
81
Se a seqncia representa uma amostra, a varincia calculada pela frmula:

s =
2
(x i x) 2 n 1
e o desvio padro s = s 2 .
Exemplo: Calcule a varincia e o desvio padro da seqncia: 4, 5, 8, 5. a) no caso em que esta seqncia representa uma populao; b) no caso em que esta seqncia representa uma amostra. Soluo: A mdia da seqncia : x =
2
xi
n Os quadrados das diferenas (xi x ) valem: (x1 x )2 = (4 5,5)2 = 2,25 (x2 x )2 = (5 5,5)2 = 0,25 (x3 x )2 = (8 5,5)2 = 6,25 (x4 x )2 = (5 5,5)2 = 0,25 Somando-se estes valores obtm-se:
22 = 5,5 4
(x i x) 2 = 9.
a) No caso em quem a seqncia representa uma populao substitumos esses valores na frmula da varincia populacional e obtemos:
2
=
Como o desvio padro = 2 = 2, 25 = 1,5 .
(x i x) 2 n a raiz
9 = 2,25. 4 positiva da varincia,
quadrada
b) Se a seqncia 4, 5, 8, 5, representar uma amostra, a nica diferena entre a frmula de 2 e s2 o denominador. Assim, (x i x) 2 9 2 s = = =3 n 1 3 e o desvio padro s = 3 = 1,73.
b) Varincia e desvio padro para dados agrupados sem intervalos de classes
82
Como h repeties de elementos na srie, definimos a varincia como sendo uma mdia aritmtica ponderada dos quadrados dos desvios dos elementos da srie para a mdia da srie.
Se a varivel discreta representativa de uma populao, ento a varincia dada por:

. n Se a varivel discreta representativa de uma amostra, ento a varincia dada por:
2
(x i x) 2 Fi
s =
(x i x) 2 Fi n 1
Como voc pode ter notado, as diferenas entre as frmulas so: para o caso da varincia populacional 2 , utiliza-se a mdia populacional tendo como denominador o tamanho da populao. Para o clculo da varincia amostral s2, utiliza-se a mdia amostral, tendo como denominador o tamanho da amostra menos um. Frmulas prticas para os clculos das varincias, obtidas por transformaes nas respectivas frmulas originais so:
2 =
1 n
x i 2 Fi ou
( (
x i Fi n
s2 =
1 n 1
x i 2 Fi
x i Fi n
Exemplo: Calcule a varincia e o desvio padro da srie abaixo, representativa de uma populao:
i 1 2 3 4 Total
xi 2 3 4 5
Fi 3 5 8 4 20
83
Soluo: Utilizando a frmula prtica para o clculo da varincia, calculamos xiFi e xi2 Fi.
i 1 2 3 4 Total
xi 2 3 4 5
Fi 3 5 8 4 20
xiFi 6 15 32 20 73
xi2Fi 12 45 128 100 285
Substituindo os valores na frmula da varincia, obtemos: 1 = n

2
x i Fi
x i Fi n
1 ( 73) 285 20 20
1 5329 1 285 = [ 285 266, 45] = 20 20 20 1 = [18,55] = 0,9275 20 e o desvio padro correspondente = 0,9275 = 0,963 .
Observe que se a varivel fosse representativa de uma amostra, a varincia seria indicada por s2 e calculada por: s2 = 1 n 1 x i 2 Fi
x i Fi n
1 [18,55] = 0,9763 19
e o desvio padro seria calculado por s =
0,9763 = 0,988.
c) Varincia e desvio padro para dados agrupados com intervalos de classes

Novamente, por desconhecer os particulares valores xi da srie, substituiremos nas frmulas anteriores estes valores pelos pontos mdios das classes. Exemplo: Determinar a varincia e o desvio padro da distribuio: i 1 2 3 4 Classes 0 |--- 4 4 |--- 8 8 |--- 12 12 |--- 16 TOTAL Fi 1 3 5 1 10
84
Soluo: Ampliaremos a tabela com o clculo de xi Fi e de xi2 Fi: i 1 2 3 4 Classes 0 |--- 4 4 |--- 8 8 |--- 12 12 |--- 16 Fi 1 3 5 1 10 xi 2 6 10 14 x iF i 2 18 50 14 84 xi2Fi 4 108 500 196 808
TOTAL
A varincia : 2 = 1 n x i 2 Fi
(
=
x i Fi n
1 842 808 10 10
1 7056 808 10 10
1 1 [808 705,6] = [102, 4] = 10,24 10 10
e o desvio padro: = 10,24 = 3,2 . No caso da distribuio representar uma amostra, a varincia seria: 1 1 s2 = [102,4] = [102,4] = 11,38 10 1 19 e o desvio padro correspondente s = 11,38 = 3,373 . Observe que no clculo da varincia, a unidade de medida da srie fica elevada ao quadrado. Portanto, a varincia dada sempre no quadrado da unidade de medida da srie. Em algumas situaes, a unidade de medida da varincia nem faz sentido. Portanto, o valor da varincia no pode ser comparado diretamente com os dados da srie, ou seja: varincia no tem interpretao. Exatamente para suprir esta deficincia da varincia que se define o desvio padro. Para justificar que o denominador da varincia amostral deve ser n 1 e no n, usaremos o seguinte argumento: O modelo matemtico que calcula a varincia de uma amostra no pode ser (x i x) 2 2 = , n pois, caso isto fosse verdadeiro, este modelo deveria determinar a varincia para qualquer tamanho de amostra, inclusive para uma amostra constituda de um nico elemento x1. Mas para uma amostra constituda de um nico elemento x1 o valor mdio da amostra tambm ser x1. Calculando a varincia pelo modelo acima, teremos: 2 (x x ) i i 2 = = 0. n
85
Seramos induzidos a afirmar que a disperso da populao de onde provm a amostra zero, isto , a populao constituda em sua totalidade por elementos idnticos. O que , em geral, uma afirmao falsa. Para corrigir o modelo matemtico, basta colocar no denominador o valor n 1. O modelo escrito ento por (x i x) 2 2 s = . n 1 Observe que agora o modelo coerente. Mesmo quando a amostra tiver apenas um elemento x1, o clculo de s2 leva-nos a uma indeterminao do tipo
0 . O que 0
significa que a varincia existe, mas no est determinada. Significa tambm que as amostras de apenas um elemento no nos fornecem informaes sobre a varincia da srie.
1. Para cada distribuio, determine a varincia e o desvio padro:
a) xi Fi 72 8 75 18 78 28 80 38
b)
Classes Fi 7 |--- 10 6 10 |--- 13 10 13 |--- 16 15 16 |--- 19 10 19 |--- 22 5
c)
Classes Fi 4 |--- 6 4 6 |--- 8 11 8 |--- 10 15 10 |--- 12 5
d)
Classes Fi 20 |--- 30 3 30 |--- 40 8 40 |--- 50 18 50 |--- 60 22 60 |--- 70 24
86
COEFICIENTE DE VARIAO (CV)

Trata-se de uma medida relativa de disperso til para a comparao em termos relativos do grau de concentrao em torno da mdia de sries distintas. O desvio padro por si s no nos diz muita coisa. Assim, se uma srie X apresenta x = 10 e ( x ) =2 e uma srie Y apresenta y = 100 e ( y) = 5, do ponto de vista da disperso absoluta, a srie Y apresenta maior disperso que a srie X. No entanto, se levarmos em considerao as mdias das sries, o desvio padro de Y que 5 em relao a 100 um valor menos significativo que o desvio padro de X que 2 em relao a 10. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio atravs do coeficiente de variao: 100 x que expresso em porcentagens. CV = ou s CV = .100 x
Diz-se que a distribuio possui pequena variabilidade (disperso) quando o coeficiente der at 10%; mdia disperso quando estiver acima de 10% at 20%; e grande disperso quando superar 20%. Alguns analistas consideram: Baixa disperso: CV 15% Mdia disperso: 15% < CV < 30% Alta disperso: CV 30% Exemplo: Numa empresa, o salrio mdio dos homens de R$ 4.000,00, com desvio padro de R$ 1.500,00, e o das mulheres em mdia de R$ 3.000,00 com desvio padro de R$1.200,00. Ento: 1.500 para os homens CV = 100 = 100 = 37,5% x 4.000 1.200 para as mulheres CV = 100 = 100 = 40% x 3.000 Logo, podemos concluir que os salrios das mulheres apresentam maior disperso relativa que os dos homens.
87
A distribuio abaixo possui desvio padro igual a 3,02. Determine o valor 1. do coeficiente de variao.
Classes Fi 0 |--- 4 2 4 |--- 8 3 8 |--- 12 2
2. Um fabricante de caixas de cartolina fabrica trs tipos de caixa. Testa-se a resistncia de cada caixa, tomando-se uma amostra de 100 caixas e determinandose a presso necessria para romper cada caixa. So os seguintes os resultados dos testes:
Tipos de caixas Presso mdia de ruptura (bria) Desvio padro das presses (bria)
A
150 40
B
200 50
C 300 60
a) que tipo de caixa apresenta a menor variao absoluta na presso de ruptura? b) que tipo de caixa apresenta a maior variao relativa na presso de ruptura? Em um exame final de Matemtica, o grau mdio de um grupo de 150 3. alunos foi 7,8 e o desvio padro 0,80. Em Estatstica, entretanto, o grau mdio final foi 7,3 e o desvio padro, 0,76. Em que disciplina foi maior a disperso?
88
MEDIDAS DE ASSIMETRIA (AS)

Para conceituar assimetria, obviamente precisamos conceituar simetria. Diremos que uma distribuio simtrica quando x = Md = Mo. Se isto de fato ocorrer, a curva de freqncia tem a seguinte caracterstica grfica:
eixo de simetria
x = Md = Mo
xi
Denomina-se assimetria o grau de afastamento de uma distribuio da unidade de simetria. Se uma distribuio no for simtrica, ser classificada como assimtrica. Existem duas alternativas para uma distribuio assimtrica. a)
Mo Md x
b)
x Md Mo No caso a) a distribuio classificada de assimtrica positiva. No caso b) a distribuio classificada de assimtrica negativa.
89
Existem vrias frmulas para o clculo do coeficiente de assimetria. Dentre elas temos o coeficiente de assimetria de Pearson dado por: x Mo x Mo AS = ou AS = s Se AS = 0 ento a distribuio simtrica. Se AS < 0 ento a distribuio assimtrica negativa. Se AS > 0 ento a distribuio assimtrica positiva.
MEDIDAS DE CURTOSE (C)

Denominamos curtose o grau de achatamento de uma distribuio em relao a uma distribuio padro, denominada curva normal (curva correspondente a uma distribuio terica de probabilidade). Uma distribuio nem chata, nem delgada, ou seja, normal, chama-se mesocrtica. Quando a distribuio delgada (mais aguda em sua parte superior), ela chamada de leptocrtica. E, quando a distribuio apresenta uma curva de freqncia mais aberta que a normal (ou mais achatada na sua parte superior), ela chamada platicrtica.
mesocrtica
xi
leptocrtica
xi
platicrtica
xi
Para medir o grau de curtose utilizaremos o coeficiente percentlico de curtose dado por: Q3 Q1 C= . 2(P90 P10 ) Relativamente curva normal, temos: Se C = 0,263, diz-se que a curva correspondente distribuio de freqncia mesocrtica.
90
Se C > 0,263, diz-se que a curva correspondente distribuio de freqncia platicrtica. Se C < 0,263, diz-se que a curva correspondente distribuio de freqncia leptocrtica. Exemplo: Sabendo-se que uma distribuio apresenta as seguintes medidas Q1 = 24,4 cm, temos que C= 41, 2 24, 4 16,8 = = 0, 2866 2(49,5 20, 2) 58,6 C = 0,287 . Q3 = 41,2 cm, P10 = 20,2 cm e P90 = 49,5 cm,
Como 0,287>0,263, conclumos que a distribuio platicrtica, em relao normal.
EXERCCIOS COMPLEMENTARES Calcular os coeficientes de assimetria e os coeficientes de curtose das listas de exerccios anteriores.
91
Material de apoio ao aprendizado de Estatstica

Professora: Viviane Khler
Probabilidade
1 . Introduo Chama-se experimento aleatrio quele cujo resultado imprevisvel, porm pertence necessariamente a um conjunto de resultados possveis denominado espao amostral. Qualquer subconjunto desse espao amostral denominado evento. Se este subconjunto possuir apenas um elemento, o denominamos evento elementar. Por exemplo, no lanamento de um dado, o nosso espao amostral seria: U = {1, 2, 3, 4, 5, 6}. Exemplos de eventos no espao amostral U: A: sair nmero maior do que 4: A = {5, 6} B: sair um nmero primo e par: B = {2} C: sair um nmero mpar: C = {1, 3, 5} Nota: O espao amostral tambm denominado espao de prova. Trataremos aqui dos espaos amostrais equiprovveis, ou seja, aqueles onde os eventos elementares possuem a mesma chance de ocorrerem. Por exemplo, no lanamento do dado acima, supe-se que sendo o dado perfeito, as chances de sair qualquer nmero de 1 a 6 so iguais. Temos ento um espao equiprovvel. Em oposio aos fenmenos aleatrios, existem os fenmenos determinsticos, que so aqueles cujos resultados so previsveis, ou seja, temos certeza dos resultados a serem obtidos. Normalmente existem diversas possibilidades possveis de ocorrncia de um fenmeno aleatrio, sendo a medida numrica da ocorrncia de cada uma dessas possibilidades, denominada Probabilidade. Consideremos uma urna que contenha 49 bolas azuis e 1 bola branca. Para uma retirada, teremos duas possibilidades: bola azul ou bola branca. Percebemos, entretanto que ser muito mais freqente obtermos numa retirada, uma bola azul, resultando da, podermos afirmar que o evento "sair bola azul" tem maior probabilidade de ocorrer, do que o evento "sair bola branca".
92
2. Conceito de Probabilidade Seja U um espao amostral finito e equiprovvel e A um determinado evento, ou seja, um subconjunto de U. A probabilidade p(A) de ocorrncia do evento A ser calculada pela frmula
n( A) n(U ) onde: n (A) = nmero de elementos de A e n (U) = nmero de elementos do espao de prova U. P( A) =
Vamos utilizar a frmula simples acima, para resolver os seguintes exerccios introdutrios: 2.1 - Considere o lanamento de um dado. Calcule a probabilidade de:
a) sair o nmero 3: Temos U = {1, 2, 3, 4, 5, 6} [n(U) = 6] e A = {3} [n(A) = 1]. Portanto, a probabilidade procurada ser igual a
P( A) = 1 6
b) sair um nmero par: agora o evento A = {2, 4, 6} com 3 elementos; logo a probabilidade procurada ser
P( A) = 3 1 = 6 2
c) sair um mltiplo de 3: agora o evento A = {3, 6} com 2 elementos; logo a probabilidade procurada ser
P( A) = 2 1 = 6 3
d) sair um nmero menor do que 3: agora, o evento A = {1, 2} com dois elementos. Portanto:
P( A) = 2 1 = 6 3
e) sair um quadrado perfeito: agora o evento A = {1,4} com dois elementos. Portanto:
P( A) = 2 1 = 6 3
93
2.2 - Considere o lanamento de dois dados. Calcule a probabilidade de:
a) Sair a soma 8 Observe que neste caso, o espao amostral U constitudo pelos pares ordenados (i, j), onde i = nmero no dado 1 e j = nmero no dado 2. evidente que teremos 36 pares ordenados possveis do tipo (i, j) onde i = 1, 2, 3, 4, 5, ou 6, o mesmo ocorrendo com j. As somas iguais a 8, ocorrero nos casos: (2,6), (3,5), (4,4), (5,3) e (6,2). Portanto, o evento "soma igual a 8" possui 5 elementos. Logo, a probabilidade procurada ser igual a:
P( A) = 5 36
b) Sair a soma 12 Neste caso, a nica possibilidade o par (6,6).Portanto, a probabilidade procurada ser igual a:
P( A) = 1 36
2.3 Uma urna possui 6 bolas azuis, 10 bolas vermelhas e 4 bolas amarelas. Tirandose uma bola com reposio, calcule as probabilidades seguintes:
a) sair bola azul

P( A) = 6 3 = = 0,30 = 30% 20 10 10 1 = = 0,50 = 50% 20 2 4 1 = = 0,20 = 20% 20 5
b) sair bola vermelha

P( A) =
c) sair bola amarela

P( A) =
Vemos no exemplo acima, que as probabilidades podem ser expressas como porcentagem. Esta forma conveniente, pois permite a estimativa do nmero de ocorrncias para um nmero elevado de experimentos. Por exemplo, se o experimento acima for repetido diversas vezes, podemos afirmar que em aproximadamente 30% dos casos, sair bola azul, 50% dos casos sair bola vermelha e 20% dos casos sair bola amarela. Quanto maior a quantidade de experimentos, tanto mais a distribuio do nmero de ocorrncias se aproximar dos percentuais indicados.
94
3. Propriedades
Com efeito, sendo o evento impossvel o conjunto vazio (), teremos: P() = n ()/n (U) = 0 /n (U) = 0 Por exemplo, se numa urna s existem bolas brancas, a probabilidade de se retirar uma bola verde (evento impossvel, neste caso) nula.
P1: A probabilidade do evento impossvel nula.
P2: A probabilidade do evento certo igual unidade.
Com efeito, P(A) = n(U)/n(U) = 1 Por exemplo, se numa urna s existem bolas vermelhas, a probabilidade de se retirar uma bola vermelha (evento certo, neste caso) igual a 1.
P3: A probabilidade de um evento qualquer um nmero real situado no intervalo real [0, 1].
Esta propriedade, decorre das propriedades 1 e 2 acima.
P4: A soma das probabilidades de um evento e do seu evento complementar igual a unidade.
Seja o evento A e o seu complementar A'. Sabemos que A U A' = U. n(A U A') = n(U) e, portanto, n(A) + n(A') = n(U). Dividindo ambos os membros por n(U), vem: n(A)/n(U) + n(A')/n(U) = n(U)/n(U), de onde se conclui: P(A) + P(A') = 1
Nota: esta propriedade simples, muito importante pois facilita a soluo de muitos problemas aparentemente complicados. Em muitos casos, mais fcil calcular a probabilidade do evento complementar e, pela propriedade acima, fica fcil determinar a probabilidade do evento.
P5: Sendo A e B dois eventos, podemos escrever: (Adio de Probabilidades)

P(A U B) = P(A) + P(B) P(A B) Observe que se AB= (ou seja, a interseo entre os conjuntos A e B o conjunto vazio), ento P(A U B) = P(A) + P(B).
Com efeito, j sabemos da Teoria dos Conjuntos que n(A U B) = n(A) + n(B) n(AB) Dividindo ambos os membros por n(U) e aplicando a definio de probabilidade, conclumos rapidamente a veracidade da frmula acima. Exemplo: Em uma certa comunidade existem dois jornais J e P. Sabe-se que 5000 pessoas so assinantes do jornal J, 4000 so assinantes de P, 1200 so assinantes de ambos e 800 no lem jornal. Qual a probabilidade de que uma pessoa escolhida ao acaso seja assinante de ambos os jornais?
95
SOLUO: Precisamos calcular o nmero de pessoas do conjunto universo, ou seja, nosso espao amostral. Teremos: n(U) = n(J U P) + N. de pessoas que no lem jornais. n(U) = n(J) + n(P) n(J P) + 800 n(U) = 5000 + 4000 1200 + 800 n(U) = 8600 Portanto, a probabilidade procurada ser igual a: P = 1200/8600 = 12/86 = 6/43. Logo, P = 6/43 = 0,1395 = 13,95%. A interpretao do resultado a seguinte: escolhendo-se ao acaso uma pessoa da comunidade, a probabilidade de que ela seja assinante de ambos os jornais de aproximadamente 14%.(contra 86% de probabilidade de no ser).
4. Probabilidade condicional
Considere que desejamos calcular a probabilidade da ocorrncia de um evento A, sabendo-se de antemo que ocorreu um certo evento B. Pela definio de probabilidade vista anteriormente, sabemos que a probabilidade de A dever ser calculada, dividindo-se o nmero de elementos de elementos de A que tambm pertencem a B, pelo nmero de elementos de B. A probabilidade de ocorrer A, sabendose que j ocorreu B, denominada Probabilidade condicional e indicada por P (A / B) probabilidade de ocorrer A sabendo-se que j ocorreu B da, o nome de probabilidade condicional. Teremos ento:
P(A/B) = n(AB)/n(B) onde AB = interseo dos conjuntos A e B.
ou seja: Se A e B so dois eventos de um espao amostral (U), com P(B) 0, ento a probabilidade condicional do evento A, tendo ocorrido B, indicada por P(A/B) definida pela relao P( A / B) = P( A B) , P( B) se P( B) 0
Esta frmula denominada Lei das Probabilidades Compostas. Esta importante frmula, permite calcular a probabilidade da ocorrncia simultnea dos eventos A e B, sabendo-se que j ocorreu o evento B.
96
1) Um dado foi jogado. Qual a probabilidade de ocorrer face 5, sabendo que ocorreu face com nmero mpar?
Evento B Probabilidade de ocorrer face impar = P( B) = 3 6 1 6
Evento A A Probabilidade de ocorrer face 5 = P( A B) = 1 P( A B) 1 P( A / B) = = 6 = = 0,3 = 33,33% 3 P( B) 3 6

5. Probabilidade Independente e a Regra do Produto
Se a ocorrncia do evento B, no mudar a probabilidade da ocorrncia do evento A, ento p(A/B) = p(A) ou p(B/A) = p(B) e, neste caso, os eventos so ditos independentes, e a frmula acima fica:
P(AB) = P(B) . P(A/B)
ou
P(AB) = P(A) . P(B/A)
Podemos ento afirmar, que a probabilidade de ocorrncia simultnea de eventos independentes, igual ao produto das probabilidades dos eventos considerados. Da vem a regra do produto que pode ser expressa da seguinte forma:
P(AB) = P(A) . P(B)
Ou seja, se A e B so eventos independentes, a probabilidade de ocorrer A e B dada pela probabilidade de ocorrer A, multiplicada pela probabilidade de ocorrer B. Exemplo: 1) Uma urna possui cinco bolas vermelhas e duas bolas brancas.Calcule as probabilidades de: a) em duas retiradas, sem reposio da primeira bola retirada, sair uma bola vermelha (V) e depois uma bola branca (B). P(V B) = P(V) . P(B/V) P(V) = 5/7 (5 bolas vermelhas de um total de 7). Supondo que saiu bola vermelha na primeira retirada, ficaram 6 bolas na urna. Logo: P(B/V) = 2/6 = 1/3 Da lei das probabilidades compostas, vem finalmente que: P(V B) = 5/7 . 1/3 = 5/21 = 0,2380 = 23,8% b) em duas retiradas, com reposio da primeira bola retirada, sair uma bola vermelha e depois uma bola branca. Com a reposio da primeira bola retirada, os eventos ficam independentes. Neste caso, a probabilidade buscada poder ser calculada como: P(V B) = P (V) . (B) = 5/7 . 2/7 = 10/49 = 0,2041 = 20,41%
97
EXERCCIOS
1. Um nmero escolhido entre 20 inteiros ao acaso, de 1 a 20. qual a probabilidade de o nmero escolhido: a) ser par? b) Ser mpar? c) Ser primo? d) Quadrado perfeito? R: a) 1/2 b) 1/2 c) 2/5 d) 1/5 2. Uma urna contm 20 bolas numeradas de 1 a 20. seja o experimento retirada de uma bola, e considere os eventos: A = { a bola retirada possui um mltiplo de 2} B = {a bola retirada possui um mltiplo de 5} Determine a probabilidade do evento AB R: 4/13 3. Dois dados, um verde e um vermelho, so lanados e observados os nmeros das faces de cima: a) Qual a probabilidade de ocorrerem nmeros iguais? b) Qual a probabilidde de ocorrerem nmeros diferentes? c) Qual a probabilidade de a soma dos nmeros ser 7? d) Qual a probabilidade de a soma dos nmeros ser 12? e) Qual a probabilidade de a soma dos nmeros ser menor ou igual a 12? f) Qual a probabilidade de aparecer um nmero 3 em ao menos um dado? R: a) 1/6 b) 5/6 c) 1/6 d) 1/36 e) 1 f) 11/36 4. Um dado lanado e o nmero da face de cima observado. a) se o resultado obtido for par, qual a probabilidade de ele ser maior ou igual a cinco? b) Se o nmero obtido for maior ou igual a cinco, qual a probabilidade de ele ser par? c) Se o resultado obtido for mpar, qual a probabilidade de ele ser menor que 3? d) Se o resultado for menor que 3, qual a probabilidade de ele ser mpar? R: a) 1/3 b) c) 1/3 d) 5. Um nmero escolhido aleatoriamente dentre os nmeros 1, 2, 3, 4, 5, . . . , 50. Qual a probabilidade de : a) O nmero ser divisvel por 5? b) O nmero terminar em 3? c) O nmero ser primo? d) O nmero ser divisvel por 6 ou por 8? R: a) 1/5 b) 1/10 c) 3/10 d) 6/25 6. Qual a probabilidade de sair um Rei ou uma carta de Copas, quando retiramos uma carta de um baralho? R: 4/13
98
7. Dois dados so lanados simultaneamente. Qual a probabilidade de: a) A soma ser menor que 4? b) A soma ser 9? c) O primeiro resultado ser maior do que o segundo? R: a) 1/12 b) 1/9 c) 5/12 8. Um lote formado por 10 peas boas, quatro com defeitos e duas com defeitos graves. Uma pea escolhida ao acaso. Calcule a probabilidade de que: a) Ela no tenha defeitos graves; b) Ela no tenha defeitos; c) Ela seja boa, ou tenha defeitos graves; R: a) 7/8 b) 5/8 c) 9. Considere o mesmo lote anterior. Retiram-se duas peas ao acaso. Qual a probabilidade de que; a) Ambas sejam perfeitas? b) Pelo menos uma seja perfeita? c) Nenhuma tenha defeito grave? d) Nenhuma seja perfeita? R: 3/8 b) 7/8 c) 91/120 d) 1/8 10. Uma urna contm cinco bolas brancas e seis pretas. Trs bolas so retiradas. Calcular a probabilidade de: a) Serem todas pretas; b) Ser exatamente uma branca; c) Ser ao menos uma preta. R: a)4/33 b) 5/11 c) 31/33 11. Um grupo de 50 moas classificado de acordo com a cor dos cabelos, e dos olhos de cada moa, segundo a tabela Olhos Cabelos azuis castanhos Loira 17 9 Morena 4 14 Ruiva 3 3 Se voc marca um encontro com uma dessas garotas, escolhida ao acaso, qual a probabilidade de ela ser: a) Loira? b) Morena de olhos azuis? c) Morena ou ter olhos azuis? d) Est chovendo quando voc encontra a garota. Seus cabelos esto completamente cobertos, mas voc percebe que ela tem olhos castanhos. Qual a probabilidade de que ela seja morena?
R: a)
13 25
b)
2 25
c)
19 25
d)
7 13
99
12. A probabilidade de trs jogadores marcarem um pnalti so respectivamente: 2 4 7 , e 3 5 10 Se cada um cobrar uma nica vez, qual a probabilidade de: a) Todos acertarem? b) Apenas uma acertar? c) Todos errarem? R: a) 28/75 b) 1/6 c) 1/50 13. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20 terminam empatadas. A e B concordam em jogar 3 partidas. Determinar a probabilidade de: a) A ganhar todas as trs; b) Duas partidas terminarem empatadas; c) A e B ganharem alternadamente. R: a) 1/8 b) 5/72 c) 5/36 14. A probabilidade de uma mulher estar viva daqui 30 anos de
3 . Calcular a probabilidade de: 5 a) Apenas o homem estar vivo; b) Somente a mulher estar viva; c) Ambos estarem vivos. a) 3/20 b) 3/10 c) 9/20 3 4
e de seu
marido,
R:
15. Num perodo de um ms, 100 pacientes sofrendo de determinada doena foram internados em um hospital. Informaes sobre o mtodo de tratamento aplicado em cada paciente e o resultado obtido esto abaixo, Tratamento A B Soma Resultado Cura total 24 16 40 Cura parcial 24 16 40 Morte 12 8 20 Soma 60 40 100 a) Sorteando aleatoriamente um desses pacientes, determinar a probabilidade de o paciente escolhido: a1) ter sido submetido ao tratamento A; a2) ter sido totalemente curado; a3) ter sido submetido ao tratamento A e ter sido parcialmente curado; a4) ter sido submetido ao tratamento A ou ter sido parcialmente curado. b) Os eventos mortee tratamento A so independentes? Justifique. c) Sorteando dois pacientes, qual a probabilidade de que: c1) tenham recebido tratamentos diferentes? c2) pelo menos um deles tenha sido curado totalmente?
R: a1) 0,6 a2) 0,4 a3) 0,24 a4) 0,76 c1) 0,48 c2) 0,64
100
16. Um casal heterozigoto com pigmentao normal teve como primeiro descendente uma criana Albina. Responda: a) Qual a probabilidade de que seus prximos dois filhos sejam albinos? b) Qual a probabilidade de que seus prximos dois filhos tenham pigmentao normal? c) Qual a probabilidade de, pelo menos, um de seus prximos dois filhos ser albino e menino? R: a) 6,2% b) 56% c) 21% 17. Num cruzamento Aa X Aa, sabemos que as condies AA, Aa, aA, aa so 1 igualmente provveis, cada uma com probabilidade . Sabemos tambm que 4 Aa e aA no podem ser distinguidas biologicamente. Qual a probabilidade de ocorrer Aa ou aA? 1 R: 2 18. Numa populao humana a probabilidade de ser mudo estimada em 0,005, a probabilidade de ser cego 0,0085 e a probabilidade de ser cego e mudo de 0,0006. Qual a probabilidade de um indivduo, tomado ao acaso, seja mudo ou cego? R: 0,0129 19. Joo e sua esposa Maria tm pigmentao normal. Joo filho de um homem normal e mulher Albina; Maria filha de uma mulher normal e pai albino. Qual a probabilidade de Joo e Maria terem uma criana Albina do sexo masculino? R: 12,5% 20. A Queratose (anomalia da pele) devida a um gene dominante Q. Uma mulher com queratose, cujo pai normal, casa-se com um homem com queratose, cuja a me era normal. Se esse casal tiver 2 filhos, qual a probabilidade de os dois apresentarem queratose?
101
BIBLIOGRAFIA
BEIGUELMAN, B. Curso Prtico de Bioestatstica. Editora FUNPEC, 5 edio, 2002. BUSSAB, W. O.;MORETTIN, P.A. Estatstica Aplicada. Editora Saraiva, 5 edio, 2002. DOWNING, D.; CLARK, J. Estatstica Aplicada. Editora Saraiva, 2 edio, 2002. LEVINE, D.D. M.; BERENSON, M.L.; STEPHAN, D. Estatstica, Teoria e aplicaes. Editora ABPDEA, 2000. MORETTIN, L.G. Estatstica Bsica-Probabilidade. Editora McGraw-Hill, 4 edio, 1992. V. 1 MORETTIN, L.G. Estatstica Bsica-Inferncia . Editora McGraw-Hill, 4 edio, 1992. V. 2 MARTINS, G.A. Estatstica Geral e Aplicada. Editora Atlas, 2 edio, 2002. MEYER, P. L. Probabilidade Aplicaes Estatstica. Livros Tcnicos e Cientficos Editora, 2 edio, 1983. NETO, P. L. O. Estatstica. Editora Edgard Blucher, 2 edio, 2002. VIEIRA, S. Introduo Bioestatstica. Editora Campus, 3 edio, 1980
102

2 - Apostila Estatistica - UERJ

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

2 - Apostila Estatistica - UERJ

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade do Estado do Rio de Janeiro - UERJ Faculdade de Formao de Professores - FFP Departamento de Matemtica

Material de apoio ao aprendizado das disciplinas de Estatstica e Bioestatstica

Professora: Viviane Ctia

&nlise dos Dados

-lanejamento de um estudo Estatstico

&mostra/em &leat0ria 1imples

&mostra/em &leat0ria por sorteio

&mostra/em Estrati icada

&mostra/em por con/lomerado

#asos em que uma &mostra/em no se justi ica

1995 25,6 22,2 20,7 15,4 5,5

REPRESENTAO GRFICA DAS SRIES ESTATSTICAS

PRODUO BRASILEIRA DE CAF 1991-1995

PRODUO BRASILEIRA DE CAF 1991-1995

Tabela 3 ESPECIFICAES Exportao (FOB) Importao

1989 34.383 18.263

1990 31.414 20.661

1991 31.620 21.041

1992 35.793 20.554

1993 38.783 25.711

FONTE: Ministrio da Fazenda

BALANA COMERCIAL DO BRASIL 1989-1993

REBANHO SUNO DO SUDESTE DO BRASIL 1992

Distribuio de Freqncias Simples (dados no agrupados ou no

Distribuio de Freqncias por Classes (dados agrupados ou

Regras para a elaborao de uma Distribuio de Freqncias Simples

Fi = n , onde n igual ao nmero de dados observados (n = 20)

1.6.4 Tipos de Freqncias

Freqncia Relativa Simples, ou simplesmente, Freqncia Relativa

Exemplo: Na Tabela 3, temos:

F4 3 = = 0,15 100 = 15 % 20 20 F5 1 = = 0,05 100 = 5 % 20 20 F6 1 = = 0,05 100 = 5 % 20 20

Freqncia Absoluta Acumulada

Exemplo: Na tabela 3, temos: Fac1 = F1 = 4 Fac2 = F1 + F2 = 4 + 8 = 12 Fac3 = F1 + F2 + F3 = 12 + 3 = 15 Fac4 = F1 + F2 + F3 + F4 = 15 + 3 = 18 Fac5 = F1 + F2 + F3 + F4 + F5 = 18 + 1 = 19 Fac6 = F1 + F2 + F3 + F4 + F5 + F6 = 19 + 1 = 20

Freqncia Acumulada Relativa

FONTE: Dados Fictcios

Representao Grfica de uma Distribuio de Freqncias Simples

Preos do Produto A Preo (R$) Nmero de Lojas 50 2 51 5 52 6 53 6 54 1 Total 20

FONTE: Dados Fictcios

FONTE: Dados Fictcios

4. Dada a distribuio de freqncias:

Intervalo de Classe ou Classe

Amplitude do Intervalo de Classe (h)

Em geral h1 = h2 = h3 = ... = h fazendo:

= h, e determina-se a amplitude do intervalo h= AT k

Exemplo: Dados: AT = 64 e k = 7. Temos: h =

Nota: Sugere-se sempre aproximar o valor encontrado para o inteiro superior.

Nmero de Classes (k)

a) Regra da Raiz Quadrada

Ponto Mdio da Classe (xi)

1200 + 1400 200 = 1300 , ou x 3 = 1200 + = 1300 . 2 2

Regras para a elaborao de uma Distribuio de Freqncias por Classes

50 7 ou k = 1 + 3,3 log 50 = 1 + 3,3 x 1,7 7 A T 64 = = 9,14 10 (aproximar para o maior k 7

c) Amplitude das Classes (h): h = inteiro) d) Limites das Classes

e) Distribuio de Freqncias por Classes

Distribuio de Freqncias com Intervalos de Classes Desiguais

Grficos de uma Distribuio de Freqncias por Classes

Polgono de Freqncias Acumuladas ou Ogiva de Galton

Os grficos representativos dessa distribuio so:

POLGONO DE FREQUNCIAS ACUMULADAS

Salrios dos Funcionrios da UERJ

6. Os pesos de 40 alunos esto relacionados a seguir: 69 65 60 67 57 76 81 68 72 60 71 53 54 49 67 53 93 74 63 65 68 59 64 58 72 66 53 80 58 83 73 60 64 70 81 63 62 45 50 53

3,5 |-- 5,5 18

5,5 |-- 7,5 20

7,5 |-- 9,5 10