Você está na página 1de 23
© 2007 by Editora Atlas S.A. 1. ed. 2007; 2. ed. 2008; 3. ed. 2011; 2. reimpressiio Capa: Leonardo Hermano Composigdo: Set-up Time Artes Gréficas Dados Internacionais de Catalogacaio na Publicagio (CIP) (Camara Brasileira do Livro, SP, Brasil) Bruni, Adriano Leal Estatistica aplicada a gestao empresarial / Adriano Leal Bruni, ~ 3. ed. ~ So Paulo: Atlas, 2011. Bibliografia, ISBN 978-85-224-6372-5 1. Administracdo de empresas 2. Estatisticas I. Titulo. 07-1579 CDD-519.5024658 indice para catélogo sistematico: 1. Estatistica aplicada & gestio empresarial: Estatistica matemética _ 519.5024658 ‘TODOS OS DIREITOS RESERVADOS - E proibida a reproducdo total ou parcial, de qualquer forma ou por qualquer meio. A violago dos direitos de autor (Lei n® 9.610/98) é crime estabelecido pelo artigo 184 do Cédigo Penal. Depésito legal na Biblioteca Nacional conforme Decreto n® 1.825, de 20 de dezembro de 1907. Impresso no Brasil/Printed in Brazil Editora Atlas S.A. Rua Conselheiro Nébias, 1384 (Campos Elisios) 01203-904 Sao Paulo (SP) Tel.: (011) 3357-9144 www. Editoraatlas.com.br Estatistica e andlise exploratoria de dados Objetivos do capitulo ‘A Estatistica representa o conjunto de téenicas que tem por objetivo primordial possbilitar a andlise € a interpretagao das informagdes contidas em dife rentes conjuntos de dados. © Capitulo 1 deste livro apresenta os conceitos bésicos associados 2 Estatistica, seus objetivos, utili- dades e funcdes. Posteriormente, traz as principais subdivisdes da Estatistica, como a estatistica descriti- va, a probabilidade e a estatistica inferencial © capitulo destaca que o propésito maior da Es tatistica consiste em analisar dados com o objetivo de Aeestatistica nada mais é do que o bom senso expresso em nuimeros. Pierre Simon, marqués de Laplace, matematico francés do século XVIII cextrair informagoes. Os dados, por sua vez, podem ser apresentados sob a forma de variveis e casos. A de- pender da classficagio das varidveis, diferentes sio os ptocedimentos sugeridos para a sintese dos dados em informagées. Varidveis classificadas como qualitativas costumam apresentar procedimentos simples de anali- se, geralmente envolvendo a construgio de tabelas de frequéncia. ‘Ao final do capitulo, sao apresentadas e discuti das as metodologias empregadas na organizacdo, ta bulagdo ¢ apresentacdo de dados, notadamente for- mados por varidveis qualitativas GRANDES NOMES E GRANDES HISTORIAS' +4 24 de setembro de 1501, em Milao, Italia | #21 de setembro de 1576, em Roma, ttalia Girolamo Cardano nasceu_em 1501, filho ilegitimo de Fazio Carda- no e Chiara Micheria. Fazio Cardano era advogado em Milao, porém com grande habilidade para a Matemati ca, a quem Leonardo da Vinci costu- mava consultar sobre questées rela- cionadas a geometria. ‘Ainda jovem, Cardano tornou-se assistente do pai, de quem apren- Girolamo Cardano deu os conhecimentos e herdou a habilidade para a Matemética. Gra- dualmente, tornou-se um importante académico, Com 0 falecimento do pai, Carda- no recebeu uma pequena heranca, que esbanjou rapidamente. Como forma de tentar recuperar as econo- mias perdidas, Cardano devotou-se 40s jogos de azar, especialmente da- dos e xadrez, que se tornaram suas fontes de renda. O seu conhecimento de probabilidades representou uma vantagem sobre seus oponentes, per- mitindo que seu ntimero de vitérias " Adaptado do The MacTutor history of mathematics archive. Disponivel em: . Acesso em: 3 dez. 2006, 2 esttitica aplicadn & gestio empresarial * Bruni superasse seu numero de derrotas. © jogo tornou-se um vicio, roubando de Cardano muitos anos de vida, dinheiro e reputacao, Suas maiores contribuicdes & ciéncia relacionaram-se probabilidade, 4 hidrodinamica, & mecanica @ 8 geologia. Seus estudos sobre os lances de dados séo considerados pioneiros no estudo da teoria de probabilidades. Definigdes e conceitos sobre Estatistica A Estatistica pode ser formalmente conceitua- da como a ciéncia que tem por objetivo a colecio, a andlise e a interpretagdo de dados qualitativos ou numéricos a respeito de fendmenos coletivos ou de massa, Também é propésito da Estatistica a indugao de leis a que fendmenos cabalmente obedecem, além da representacdo numérica e comparativa, em tabe- las ou graficos, dos resultados da anélise desses fe- noémenos.? Acredita-se que o termo estatistica tenha sido primeiramente empregado para designar 0 conjun- to de dados referentes a assuntos do Estado, geral- ‘mente com finalidade de controle fiscal ou de segu- ranga nacional. Por esse motivo, 0 uso da palavra, segundo estudiosos, teria a sua origem na expressao latina status, que significa Estado, podendo assumir diferentes significagées, dependendo de como é uti- lizado. Objeto de longas polémicas, 0 termo estatis- tica até hoje é controvertido. Existem diividas se ele deriva, de fato, de Estado, entidade politica, ou de estado, modo de ser. Os dados do Estado referiam-se, particularmen- te, a populagio, as transagdes comerciais internas ou com outros Estados, ao controle da mortalidade em geral ou provocada por uma epidemia, endemia ou doenga particular e aos problemas de taxagio de proporcionalidade de tarifas e impostos. Além de estudar as maneiras mais eficientes de organizar as informagées obtidas, tratava também do problema mais importante: de interpretagao de dados e da pos- sibilidade de realizar previsbes. A palavra estatistica’ teria sido cunhada, possi- velmente, por Gottfried Achenwall, académico ale- ‘mo, por volta da metade do século XVIII, sendo que seu verbete em inglés, statistics, apareceu na Enciclo- pédia Britdnica pela primeira vez em 1797. = Michaelis (1998). ® Costa (1992, p. 6). Porém, a origem das aplicagées das téenicas da Estatistica € bem mais antiga, sendo possivel forne- cer alguns exemplos.* a) _indicios encontrados sugerem a existéncia de censos* muito antigos, realizados por volta de 3000 a.C., na Babilénia, China e Bgito. A Biblia ilustra esta constatacao his- trica, O Livro Quarto (Nimeros) do Velho Testamento comega com uma Moisés: fazer um levantamento dos homens de Israel que estavam aptos para guerrear; strugo a 1b) outro fato estatistico biblico relevante ocor- eu na época do imperador romano César Augusto: um edito solicitou a realizagio de censo em todo o Império, Segundo a Bi- blia, por essa raziio Maria e José viajaram a0 Egito; ©) em 1085, Guilherme, 0 Conquistador, orde- nou a realizagao de um levantamento esta- tistico da Inglaterra, que deveria incluir in- formagdes sobre terras, proprietétios, uso da terra, animais e empregados. Este levan- tamento serviria de base para 0 célculo de impostos. O estudo originou um volume, conhecido como Domesday’ book; d) no século XVII, a Estatistica ganhou des- taque na Inglaterra a partir das tabuas de mortalidade, a aritmética politica, de John Graunt, que consistiu na andlise extensa de nascimentos e mortes. ‘Trés grandes etapas na hist6ria formal da estatis- tica poderiam ser apresentadas: a) 0 periodo mais antigo, caracterizado pela simples organizagao de informacées de in- teresse estatal, do qual € tipico 0 famoso + Costa (1992, p. 4). 5 A palavra censo deriva de censere, que, traduzido do la- tim, significa taxar. © Domesday, em portugués, pode ser traduzido como dia do juizo final. Domesday book, que se estende até meados do século XVII; b) 0 segundo periodo ocorre entre o meio do século XVII e principio do século XIX, ca- racterizado pelas intimeras tentativas de analisar as tabelas e 0s conjuntos de da- dos com a finalidade de obter conclusoes que pudessem interessar & organizagio do Estado ou ter aplicacdo especifica através de previsdes para o futuro. Sao particular- mente importantes nesse periodo os tra balhos de Conring, John Graunt, William Petty, Halley e dos intimeros matematicos que se dedicaram chamada aritméti politica, No século XVIII, a Universidade de Viena promoveu, pela primeira vez, um curso avancado de estatistica, Gottfried Achenwall, da Universidade de Gattingen, publicou uma série de estudos em que de- fine os objetos material e formal da esta- tistica, pouco depois do aparecimento do ttabalho de Siissmilch sobre as mutagdes no género humano, que da fei¢do cienti- fica aos problemas estatisticos. No século XIX, Adolphe Quételet realizou cuidadoso estudo estatistico dos fatos demograficos e sociais, imprimindo um tratamento domi- nantemente matematico; ©) oterceiro perfodo, iniciado com 0 Congres- so Internacional de Estatistica, reunido em 1853, que se estende aos nossos dias, carac- tetiza-se ndo somente pelos extraordinérios avancos e aperfeigoamentos tecnolégicos da Estatistica em si, como, prineipalmente, pe- Jas miiltiplas aplicages que ela vem tendo, particularmente no campo da investigacéo cientifica, Pode-se afirmar que o método es- tatistico constitui um dos mais seguros, efi- cientes e necessérios instrumentos da cién- cia moderna, De forma mais recente, a Estatistica sofreu im- portantes contribuigdes através do avanco da tecno- logia dos computadores, permitindo aplicac vez mais sofisticadas. Alguns autores’ argumentam que, atualmente, seria possivel distinguir duas con- cepgées para a palavra Estatistica: ss cada 7 “Toledo e Ovalle (1985). Estatisticae anise explortéria de dados 3 a) no plural, a palavra estatésticas indica qual- quer colecao consistente de dados numéri cos, reunidos com a finalidade de fornecer informagées acerca de um objetivo. Assim, por exemplo, as estatisticas demogréficas teferem-se aos dados numéricos sobre nas- cimentos, falecimentos, matriménios, des- quites ete. As estatisticas econémicas con- sistem em dados numéricos relacionados com emprego, producdo, prego, vendas e com outras atividades ligadas aos varios se- tores da vida econémic b) no singular, a expressio Estatistica indica a atividade humana especializada ou um cor- po de técnicas, ou, ainda, uma metodologia desenvolvida para a coleta, a classificagao, a apresentacdo, a andlise e a interpretagio de dados quantitativos e a utilizacio desses dados para a tomada de decisées. Atualmente, pode-se definir Estatistica como a ciéncia que se preocupa com a organizagao, des- crigao, andlise, e interpretagdo de dados.* Ou seja, por meio da andlise de dados brutos, a Estatistica preocupa-se com a extragéo de informagdes ~ que permitem o processo posterior de tomada de deci- Dados 4 » Brutos Informacées Figura 1.1 O objetivo da estatistica, Em linhas gerais, a Estatistica poderia ser dividi- da em trés grandes grupos: a) estatistica deseritiva: muitas vezes apre- sentada como Estatistica, simplesmente. Sua principal fungao consiste em resumir dados € informacées investigadas, expondo-os da maneira mais prética e simples possivel. Em muitos casos, hé um grande nimero de da- Costa Neto (2002), 4 Exeavisticaaplieade Ages empresatial + Bruni dos ¢ informagées coletados que poderiam atrapalhar o desenvolvimento das pesquisas e suas conclusdes. Para simplificar, os da- dos sio resumidos sob a forma de estatist cas. Ela esta presente em diversas situacées do nosso cotidiano, como, pot exemplo, as pesquisas eleitorais. Para 0s pesquisadores descreverem os resultados de suas pesqui- sas de campo, eles criam tabelas e gréficos, dispondo seus dados de forma que possam ser interpretados mais facilmente; b) estatistica das probabilidades: seu uso surgi com o intuito de planejar jogadas ou estratégia em jogos de azar. Posteriormen- te, suas aplicagées se ampliaram, alcangan- do pesquisas como as realizadas pelo Ins- tituto Brasileiro de Geografia e Estatistica € por outras organizacdes ¢ empresas. A probabilidade estuda o risco e 0 acaso em ‘eventos futuros e determina se & provavel ou nao seu acontecimento; ©) estatistica inferencial ow indutiva: repre- senta 0 estudo dos dados de amostras com 0 objetivo de entender 0 comportamento do universo, Em algumas ocasides, represen- ta o complemento da estatistica descritiva, visto que ela parte da interpretagéo de uma amostra para a caracterizagao de todo um grupo. Aeestatistica inferencial consiste em trabalho que pode ser dificil e exigir razodvel capacidade técnica dos pesquisadores. As conclusdes so trabalhadas em cima de incertezas por nao se obter todo o conjunto de informagdes necessarias. Existe a necessidade de fazer generalizagbes. Usa-se 0 método indutivo para generalizar e tornar a pesquisa mais acessivel a le tura, interpretacdo e compreensio dos dados. Nesta etapa, é comum calcular o erro tolerdvel e apresen- té-lo nas pesquisas. Na medicao e compreenso dos erros associados ao processo de generalizacées, con- ceitos e técnicas de probabilidades costumam ser em- pregados. Dados, casos, variveis e informagdes © objeto de trabalho da estatistica é formado pelo conjunto de dados que seréo analisados. Dados séio apresentados para diferentes casos, nos quais di- ferentes varidveis sio coletadas. 0s casos representam os elementos para os quis (8 valores expostos foram extraidos. Os casos so tam- ‘bém chamados de individuos e correspondem aos ob- jetos descritos por um conjunto de dados. Casos ou individuos podem ser pessoas, animais, objetos, ques- tiondrios ete. Convencionalmente, nas tabelas das ba- ses de dados os casos costumam ser apresentados em linhas. Por outro lado, as varidveis representam as ca- racteristicas dos individuos ou casos. Uma variavel pode assumir valores diferentes para individuos dis- tintos. Convencionalmente, costumam set expostas nas bases de dados em diferentes colunas. Veja ailus- tracdo da base ficticia exposta na Figura 1.2. Varidvel A ———— Cod.| Modelo | Ano Preco 2005) sa [zoo 35 carango | Fobica [Cathambeque |2005 [33 Figura 1.2. Base de dados de automéveis fcticia. A depender dos dados coletados, as varidveis podem ser classificadas de diferentes formas. Se a informacao contida refere-se a uma categoria, como sexo: masculino ou feminino, ou nome: Mar- cio, Juliana, Diogo e outros, diz-se que essa varia- vel é qualitativa. Varidveis qualitativas ndo podem ser operadas matematicamente ou comparadas. Nao é possivel responder, por exemplo, o que é maior, masculino ou feminino, ou qual é a média entre Mércio, Juliana e Diogo. As varidveis qualitativas podem ser subctassifica das em nominais — que nao permitem comparagdes — € ordinais - que permitem comparagdes. Como exem- plo de varidvel nominal pode-se apresentar 0 género do individuo ou o seu proprio nome. Nao é possivel estabelecer uma gradacao, definindo qual o priorita- rio ou mais importante: masculino ou feminino, Joao ou Maria, Varidvels qualitativas ordinais, por outro lado, permitem comparagées. Como exemplo de variéveis ordinais pode-se apresentar a atribuigao do status alto, médio ou baixo para um individuo, Embora ne- nhuma razio quantitativa possa ser estabelecida en- tte 0 individuo alto e 0 baixo, como, por exemplo, uantas vezes o alto é maior que o baixo ou 0 médio, comparagées de intensidade e ordenamento podem ser feitas, Outro exemplo de variaveis qualitativas ordinais costuma ser fornecido pelo uso de escalas de inten- sidade, conforme ilustrado na Figura 1.3. Para uma pergunta, 0 respondente poderia dar a intensidade na resposta. [5] Sempre [4] Quase sempre [3] As vezes [2] Quase ‘nunca [1} Nunca [5] Completamente [4] Quase completamente [3] Normalmente [2} Quase nunca (1] Nunca | 151 Muito satisfeito [4] Um pouco satisteto [3] Neutro [2] Um pouco insatsfeito [1] Muito insatisteito Figura 1.3 Exemplos de escalas de intensidade. ‘Um exemplo comum de escalas de intensidade & aptesentado por meio de escalas de Likert, em que, em resposta a determinada afirmacao, 0 responden- te deve dizer se concorda totalmente ou discorda to- Estatistca e anise exploraéria de dados. 5 talmente, possibilitando ainda o uso de alternativas intermedidrias, Varidveis quantitativas, como Idade, Renda e outras permitem comparacdes e operagées mate- maticas. Por exemplo, é possivel dizer que quem possuii 26 anos possui o dobro da idade de quem possuii 13 anos. Ou que a média da renda de quem ganha $ 10,00 e quem ganha $ 12,00 ¢ igual a $ 11,00. As varidveis quantitativas podem ser subclassifi- cadas em discretas ou continuas. Varidveis discretas sdo aquelas resultantes de contagens e apresentadas sob a forma de mimeros inteiros. Exemplos: ntime- 10 de filhos de um casal, quantidade de vos feitos por uma aeronave. Varidveis continuas so aquelas que podem assumir qualquer valor em determina- do intervalo. Exemplos: peso (pode ser represen- tado com a preciséo desejada, como 3 kg, 3,12 kg, 3,1215655663 kg), comprimento e outras. Note que ‘muitas variéveis continuas podem ser apresentadas sob a forma de mimero inteiros, como a idade de um individuo apresentada em anos. Porém, essa mes- ‘ma idade poderia ser exposta de forma fracionéria, como 12,4563 anos. Assim, nao poderia ser entendi: da como uma variavel discreta. a varidveis estudadas. VALORES EXTREMOS E VALORES AUSENTES ‘A analise de dados, na pratica, costuma ser marcada pela presenca de situagGes que trazem desafios 20 proceso de extracdo de informagbes. Alguns destes desafios dizem respeito a valores ausentes ~ atributos que ro foram ou nao puderam ser coletados para determinados casos e varidvels — e valores extremos - valores destoantes dos demais elementos analisados que interferem de forma negativa na obtenc3o de medidas sobre E importante destacar, também, que nem toda variével expressa sob a forma de ntimeros & uma variével quantitativa. Por exemplo, o mime- ro de matricula de um estudante em uma escola nada mais é do que a representacdo simplificada dos dados daquele aluno especifico no sistema da instituicdo. Assim, embora apresentada sob a for- ma de niimero, a matricula do aluno é uma varia- vel qualitativa Em outro exemplo, um pesquisador poderia atri- buir os eédigos numéricos 1 e 2 para respondentes homens e mulheres, respectivamente, Assim, embora ‘a base de dados para essa resposta fosse apresentada ‘com valores numéricos, esses niimeros estariam re- presentando atributos, que ndo poderiam sofrer ope- ragGes algébricas. Destaca-se que, em relagio a informagao conti da, esta aumenta na ditegio da variavel qualitativa nominal em relago a varidvel quantitativa. Variaveis ‘quantitativas so marcadas pela presenga de maior informacio. 6 statistics aplicada 8 gestio empresarial © Bruni Para ilustrar, imagine a situago de um pesquisa dor que deseja estudar 0 uso semanal da Internet por alunos de uma escola do ensino fundamental. Dife- rentes perguntas poderiam ser feitas aos alunos. Veja os exemplos apresentados a seguir. a) Vocé usa a Internet durante a semana? [1] sim [2] Nao b) Qual a sua intensidade de uso da Internet du- rante a semana? {1] Nenhuma [4] Grande [2] Pequena [3] Média © Quantas vezes vocé usa a Internet durante a semana? J vezes por semana 4) Por quantas horas vocé usa a Internet durante a semana? J horas por semana Figura 1.4. Diferentes perguntas. A primeira pergunta (a) & qualitativa nominal. ‘Apenas duas categorias de respostas seriam obtidas: se o entrevistado usa ou nao a Internet. A informagao contida nesta resposta seria muito baixa. A segunda pergunta (b) & qualitativa ordinal, Nesta situa, quatro categorias de respostas se- riam obtidas. O entrevistado deveria declarar sua intensidade de uso, que poderia ser nenhuma, pe- quena, média ou grande. Naturalmente, o entrevis- tado nesta situagio poderia ter diividas na inter- pretacio dos atributos. O que a intensidade média representa especificamente, por exemplo? Se eu uso x horas por semana, isso revela uma intensidade pe- quena, média ou grande? Porém, a informagao con- tida em uma varivel qualitativa ordinal seria maior que a contida em uma varidvel nominal. Agora, uma gradacio da intensidade do uso poderia ser estabe- lecida, A terceira pergunta (c) aborda o mimero de ve- zes que o entrevistado usa a Internet durante a sema- na, Nesta situago, é uma varidvel quantitativa dis creta. A informacao contida na varidvel sera maior que nas duas situacdes anteriores. Nao existirao dui- vidas de interpretagao de atributos, como no caso an- terior ‘A quarta pergunta (d) aborda quantas horas o entrevistado usa a Internet durante a semana. E ‘uma variével quantitativa continua. A informagéo contida seré maxima em relagao as quatro pergun- tas propostas. Qualitativas 2) nominal ») ordinal Quantitativas ©) discreta 4d) continua Figura 1.5. Classificagéo das variévels. Para ilustrar o uso de base de dados formada por diferentes variaveis, a tabela seguinte apresenta os dados da ficticia loja Estilo Modas. A base é forma- da por dados referentes a 25 casos que representam compras feitas na loja para cada uma das quais foram coletadas oito variaveis, {As oito variaveis apresentadas na base de dados so: Cédigo da compra: apresenta um valor numéri co que corresponde & compra feita na empresa, ‘Nome do cliente: apresenta o prenome do clien te que realizou a compra. Bairro onde mora: bairro onde o cliente reside, Género: apresenta o género do cliente que fez a ‘compra. Dois cédigos distintos sao utilizados: 1 para representar clientes de género Masculino ¢ 2 para Fe- minino. Idade em anos: apresenta a idade do cliente em anos inteiros completos no momento da compra. Renda em $: apresenta a renda mensal do clien- te em unidades monetérias. Niimero de itens comprados: apresenta a quan- tidade de itens comprados pelo cliente. ‘Valor da compra em $: corresponde ao valor da compra feita pelo cliente em unidades monetarias. statitea e andliseexploratria de dados 7 Ceatuods ome do| eaioonde | 4 Si, |xadeum| sendy | Suter | Yamer es per heer 1 Marcio Colina im 26 1.890,00, 3 41,00 3 Diogo | Bom Descanso 1 22 2.030,00 5 55,00 Se ea 13° Maria Colina 2 60 930,00, 1 14,00 ae een a ee 21 Paula Colina 2 18, 1,010,00 3 36,00 8 Fstatisticaaplicada a gest empresaral + Bruni A classificagio das oito varidveis apresentadas pode ser vista na tabela seguinte, Variavel Classificagao ] Qualitativa nominal. 0 cédigo numérico apresentado se refere a compra feita ‘digo da compra _| Logo, um atributo qualitativo, | Nome do | Qualitativa nominal. A varidvel apresenta cliente © atributo nome do cliente. Bairro onde | Qualitativa nominal. A varivel apresenta mora © atributo bairro onde o cliente reside. Qualitativa nominal. A variével apresenta © atributo género do cliente. Note que fo de informacGes de varidveis qualitativas costuma ser apresentado sob a forma de tabulacao ou constr ao de tabelas de frequéncias, em que as repetigdes dos cédigos e valores diferentes associados as varia- veis sdo apresentados. Por exemplo, na base de dados da Estilo Modas a variavel Bairro onde mora é qualitativa, Os 25 ca- sos apresentados poderiam ser sintetizados por meio de uma tabela de frequéncia, onde as repetigies de cada um dos bairros poderiam ser expostas. Assim, a seguinte tabela de frequéncia poderia ser: /decortem de contagens. Sao valores deitens | obrigatoriamente inteiros e a varidvel é comprados | giscreta Valor da | quantitatia continua. A varidvel permite pr_| y mensuracao com valores fracionérios ems Ordenando e contando os dados Varidveis qualitativas so caracterizadas pelo fato de nao poderem sofrer operagies algébricas. As- sim, 0 procedimento mais ustal empregado na extra- Género A Bairro onde mora F, (05 cédigos numéricos apresentados se referem aos atributos de género. | Bom Descanso 5 Quantitativa continua. Embora Centro 6 | Idadeem | apresentada em niimeros inteiros, a anos |varivel permitiria 2 mensuragéo com [Colina | valores fracionérios. = A Renda em § | Quantitatva continua. A varidvel permite a | ‘a mensuracdo com valores fracionarios a - | amero | Quantitativa discreta, Os ntimeros A construgao da tabela de frequéncias permitiu reduzir 0 volume de valores analisados. No lugar dos 25 valores originais, bastaria analisar as repeticées distribuidas por apenas quatro bairros. As contagens dos diferentes bairros sao expostas sob a forma de frequéncias simples, apresentadas por F, (frequéncia do elemento i). Geralmente, a tltima linha de uma tabela de frequéncias apresenta a soma dos dados analisados. A soma ou o somatério costu- ma ser representado pela letra grega sigma maitiscu: la, 2, Veja 0 quadro seguinte. AIMPORTANCIA DA NOTACAO SIGMA Anotacao sigma, 2, € muito comum em Estatistica. Se, por exemplo, fossem fornecidos os niimeros {2, 5, 7}, a soma destes niimeros poderia ser representada pela notacdo Dx. Assim, Lx =2+5+7=14. Por outro lado, a soma dos niimeros elevados ao quadrado poderia ser representada pela notacao Dix’ Assim, Lx? = 22 + 52+ 7? = 4425 + 49 = 78. levada a0 quadrado dos numeros, (Zx)’. Esta ultima pode ser apresentada como (Zx)’ = 14? = 196. Quando apenas uma parte dos ntimeros @ analisada, pode-se usar um indice para representar os inGimeros que serao processados. Geralmente, o indice é representado pela letra . Veja o exemplo da base Convém destacar que a soma dos numeros a0 quadrado, Dx’, é completamente diferente da soma | de dados exposta a seguir. | sttiticae anise exploratvia de dados 9 2 3 4 10 15 Soma 35 Assim, caso apenas 0s elementos de 1a 3 fossem somos, a representago dessa soma podera ser feita por meio da notacéo Yo) (0 valor da soma seria igual a Yen) notagao, Yura =(2+2)4+6+2)=4410=14 objetivo maior da construgio de tabelas de frequéncia envolve facilitar a extragao de informa- ‘GOes das diferentes bases de dados analisadas. Po- rém, como saber se uma frequéncia simples igual a oito unidades é significativa ou nao? Oito unidades extraidas de uma amostra formada por um milhdo de unidades é um nimero inexpressivo. Porém, oito unidades de um total igual a 25 unidades jé é consi- derdvel. Assim, em relagio as frequéncias apresentadas, pode-se auxiliar a interpretacao das informagées me- diante 0 fornecimento das frequéncias relativas sim- ples. As frequéncias relativas simples apresentam a relagio existente entre a frequéncia simples e a soma das frequéncias. Geralmente, costumam ser expostas em percentuais. Frequéncia Relativa Simples: ‘Assim, para a tabulagio de frequéncias da va- ridvel Bairro onde mora, uma terceira coluna pode- ria ser apresentada, com as frequéncias relativas sim- ples, expostas em forma percentual, D(x) = 2 +8 +10 = 20. Em outra Bairro onde mora F F% Bom Descanso. 5 5/25 = 20° Centro 6 6/25 = 24" Colina 6 6/25 = 24" Prainha 8 8/25 = 32* Soma (2) 25 | 25/25 = 100" * 0 simbolo % fol omitido com o objetivo de deixar a letra ‘da coluna mais facil. Os procedimentos aplicados para 0 processa- mento de varidveis qualitativas também podem ser aplicados em varidveis quantitativas com baixa dis- perso ~ isto é, varidveis que apresentam poucos va- lores diferentes. 0 objetivo da andlise exploratéria de dados con- siste em fornecer um primeito insight sobre os dados a serem analisados. Em um outro exemplo, sto apre- sentadas as notas de um grupo de estudantes, confor- me a tabela seguinte. 2A 7A 43 33 a7 69 64 52 58 78 1 95 24 85 53 2a 10 Estaveticaaplicads & gesto empresaral + Brunt Da forma como os dados esto apresentados, sem nenhuma ordenagio, fica dificil extrair alguma informagao. Buscando facilitar 0 entendimento dos dados, um primeiro passo poderia ser ordené-los. Em estatistica, esta etapa consiste na elaboracio do rol ‘ow conjunto ordenado de dados. Assim, a série de da- dos brutos exposta poderia ser melhor apresentada de forma ordenada, © rol da série seria: (1,1; 2,15 2,15 2,45 3,3; 4, 4,7; 5,23 5,3; 5,8; 6,1; 6,9; 7,1; 7,8; 8,5; 9,5). Além de faclitar a visualizagio ordenada dos da- dos, a construgio do rol permite evidenciar um dos ‘maiores problemas da Estatistica: a presenga de valo- res extremos ou outliers. Valores extremos distorcem a maior parte das medidas estatisticas obtidas e serao discutidos com maior profundidade mais adiante. Quando os valores apresentam-se repetidos di- versas vezes, podem-se agrupar os valores em tabe- las, de forma similar 8 tabulagdo de variveis qual tativas. Imagine, por exemplo, que as idades de um grupo de alunos pudessem ser representadas pelo se- ‘guinte rol: 17; 17; 17; 18; 18; 20; 21; 21 Note que os valores 17, 18, 20 e 21 aparecem de forma repetida 3, 2, 1 e 2 vezes, respectivamente. Sendo assim, uma forma mais facil de representar os dados seria através de uma tabela de frequéncia: dade F 7 3 18 2 20 1 2 2 Soma (2) 8 De forma similar ao processamento feito para a varidvel Bairro onde mora da Estilo Modas, uma for- ma, ainda mais facil, para analisar os dados poderia, ocorrer se, além das frequéncias simples, fossem for- necidas as frequencias relativas percentuais. Quando variaveis quantitativas so tabuladas, outras frequéncias podem ser fornecidas, a exemplo da frequéncia cumulativa simples, Fac, e da frequén- cia cumulativa relativa, FAC %. Usando a notagao sigma, a frequéncia cumulati- vva simples representa a soma de todas as frequéncias| simples até o elemento analisado. Algebricamente, pode ser representada por meio da seguinte equacio, Frequéncia Cumulativa Simples: Inserindo a coluna na tabela anterior, tem-se a nova coluna das frequéncias cumulativas simples. [owede [| Fm | Fae 7 3 [3s 3 18 2 2 | 342 20 1 pos | set 21 2 2 | +2 Soma (3) 8 100 Podem-se também representar as frequéncias cumulativas relativas, FAc%. Neste caso, & preciso encontrar para cada elemento i a sua frequéncia acu- mulada relativa. Frequéncia Cumulativa Relativa: FA, FAc,% = =—" 100% DA Inserindo uma nova coluna na tabela anterior, tem-se a nova coluna das frequéncias cumulativas re- lativas. Destaca-se que 0 simbolo % foi omitido em. F% e FAc% com o objetivo de deixar a leitura das colunas mais fécil. dade F, Fe | Idade | Ff, | F% | Fac, FAC % 7 3 375 7 | 3 | 375[ 3 37,5 18 2 25 we | 2 | 25| 5 | 37,5+25= 625 20 1 12.5 20 | 1 [125] 6 | 625+12,5=75 21 2 25 2 2 25| 8 100 Soma (2) a 100 soma(z)} 8 | 100 Esttisticae andiseexploratria de dados 11 Em relagio aos dados da Estilo Modas, a tabu- Ginero ] Jago da varidvel Ne de itens comprados permitiria | Bairro onde mora | construir a seguinte tabela de frequéncias: Masculing)|[Eercinuno) | Riot F, 3 2 5 ~ Bom —_|% linha 60 40 | 100 Ne de itens om comprados F% | Fac, | FAcg% Descanso | coluna 25 | 1538 | 20 1 24 6 24 96 total 2 a | 2 | 36 15 60 Fi 3 3 6 % linha 50 | 50 | 100 3 24 a 84 — 4 [8 23 2 % coluna 25 | 2308 | 24 5 a Sec r o0 [setotal 2 12 | 24 Soma (2) 100 a i 2 & col selinha | 66,67 | 3333 | 100 Naturalmente, quando miltiplas varidveis sio secoluna | 33,33 | 15,38 | 24 apresentadas em uma base de dados, tabulagdes eru- % total 16 a | 2 zadas de frequéncia podem ser empregadas no pro- F 5 iz F fo de i es, Tabulacoes cruza- cesso de geracao de informagGes. Tabulagd ee os ss 00 das representam a andlise conjunta de duas ou mais | prainha varidveis. sweotuna| 1667 | 4615 | 32 Em gelacdo aos dados da Estilo Modas, um ana- pastoral 8 24) 2 lista poderia desejar efetuar uma tabulagao cruzada F, 2 13 [2s entre as varives Barro ea varivel Genero. Veja 0 | % linha ag zm ro exemplo na tabela seguinte. ae Ta ea wt | 48 s2_| 100 Bairro onde Género | _mora | Mascutino | Feminino | Total A leitura do percentual da coluna permite obter a ‘Bom Descanso 3 2 5 distribuigdo por bairros nos diferentes géneros. A lei- a 5 3 $ tura da coluna do género feminino permite verificar que 15,38% das mulheres moram no bairro Colina colina 4 2 6 ; A leitura do percentual total 6 a mais simples. prahal Z J eo Revela a frequéncia relativa sobre o total da amostra. Soma 2 3 25 E possivel saber, por exemplo, que o percentual de Em tabulagées cruzadas, diferentes frequéncias relativas podem ser apresentadas. Pode-se calcular a frequéncia relativa em relagio ao total geral, em re- lacéo ao total da coluna ou em relagao ao total da linha. Assim, a leitura do percentual da linha permi- te obter a distribuico por géneros nos diferentes bairros. Por exemplo, em relacdo aos moradores do bairro Prainha, a leitura do percentual da linha per- mite verificar que 25% sao do género masculino, en- quanto 75% so do género feminino, Naturalmente, a soma dos percentuais para o bairro ¢ igual a 100%. clientes de género masculino e que moram no Centro é igual a 12%. Na pratica, procedimentos que envolvem tabu- lagGes simples ou cruzadas costumam ser feitos com, © auxilio de programas de computador, como o Excel ou 0 SPSS, também apresentados em outros livros da Série Métodos Quantitativos na Pratica, Agrupando em classes A laboragio de tabelas de frequéncia para dados quantitativos que apresentam grande disperséio pou- 12 _Eststicaaplicada & gestéo empresaral + Brunt co pode ajudar no processo de sintese dos dados. Por exemplo, em relagio & tabulagdo da varidvel Renda em $ da base de dados da Estilo Modas, o resultado da tabulagio das frequéncias pode ser visto a seguir. Renda em $ F, 910,00 2 920,00 1 930,00 1 940,00 2 950,00 2 960,00 1 1.010,00 1 1.040,00 1 1.090,00 1 1.120,00 1 1.615,00 1 1.640,00 1 1.690,00 1 1.890,00 1 1.940,00 1 1,955,00 1 1.980,00 1 2.030,00 1 2.045,00 1 2.155,00 1 2.175,00 1 2.235,00 1 Soma (2) 2 Os 25 casos originais foram agrupados em 22 categorias de rendas. A sintese resultante da tabula- ‘do de frequéncias foi minima, A redugio de 25 casos para 22 categorias é, de fato, muito pequena. Quando varidveis quantitativas com alta disper- so, marcadas pela presenca de muitos valores dife- rentes, sao analisadas, um melhor resultado pode ser obtido por meio do agrupamento em classes, isto é, a criacdo de classes de frequéncia, seguida da poste- rior tabulagio. Em outro exemplo, suponha que os pesos de ‘um grupo de estudantes possa ser dado pelo seguin- te rol: Rol: {36; 40; 49; 49; 49; 50; 50; 51; 52; 52; 525 52; 54; 59; 60; 60; 60; 60; 61; 61; 61; 61; 62; 62; 63; 64; 64; 65; 65; 65; 67; 68; 74; 77; 77; 81; 81; 83; 87; 90} Representando o rol em uma tabela de frequén- cias, seria possivel obter o seguinte resultado: Peso | Ff | Ft | Fac, | FAC 36 1 25 1 25 40 1 25 2 5,0 49 3 75 s | 15 50 2 5.0 7 [175 51 1 25 a | 200 52 4 | 100 12 | 300 54 1 25 13 | 325 59 1 25 14 | _35.0 60 4 | 100 1s | 45.0 a 4 | 100 22 | 55.0 a 2 24 | 60,0 6 1 2s | 625 oa 2 a7 | 675 65 3 30 | 75.0 7 1 31 68 1 32 | 800 4 1 33 | 825 7 2 35 | 875 at 2 5,0 37 | 925 8 1 25 3a | 950 87 1 25 39 | 975 30 1 25 40 | 100 soma(s) | 40 | 100 Note que a tabela de frequéncias pouco facilita no proceso de compreensio dos dados que se apre- sentam muito dispersos. Um resultado melhor pode- ria ser alcangado através do agrupamento dos dados, com a construgao de classes de frequéncia Embora a criacdo de classes de frequéncia seja muito mais uma questo de bom senso do que de matemiética, a estatistica apresenta uma série de pro- cedimentos sugeridos para a construgio de classes de frequéncia. Apés construido o rol, os passos para ela- borar classes de frequéncia consistem em: determi- nar o mimero de classes a serem criadas, estimar 0 intervalo (ou a amplitude de cada classe) e reagrupar 05 dados nestas classes. Naturalmente, as classes de frequéncia cons- truidas deverdo ser sempre mutuamente excludentes (um elemento poderé pertencer a apenas uma das classes criadas) e coletivamente exaustivas (todos os elementos estudados deverao ser representados nas classes de frequéncia criadas). Procedimento formal: alguns textos ¢ autores mais conservadores de Estatistica ainda sugerem pro- cedimentos formais para a construcao de classes de frequéncia. Nesta situago, a determinagao do ni- mero de classes, representado pela letra K, depende, fundamentalmente, do mimero de elementos estuda- dos, representado pela letra n. Os procedimentos formais envolvem: a) Sen = 25: devem ser criadas cinco classes de frequéncia; b) Sen > 25: o numero de classes de frequén- ‘ia pode ser obtido mediante dois procedi- Esttisticae andliseexploratéria de dads 13 mentos distintos: K = yn ouk = 1 + 3,32 login). Esta tltima férmula é apresentada ‘como férmula de Sturges. Os intervalos das classes, representados pela letra h, so consequéncias diretas da amplitude to- tal dos dados (isto é, da diferenca entre o maior dos dados e 0 menor, também denominada intervalo ou range) e do ntimero de classes que devem ser criadas. Expressando matematicamente: hh = (maior dos dados ~ menor dos dados) / (numero de classes que devem ser criadas) Maior ~ Menor h K ‘Com o ntimero de classes definido e o intervalo entre classes calculado, pode-se construir 0 agrupa- mento em classes de frequéncia. Partindo do menor valor, soma-se gradualmente o intervalo obtido para cada uma das classes até incluir o iltimo valor. Neste caso, é importante estabelecer a notacio dos limites envolvidos em cada uma das classes. ESTABELECENDO LIMITES PARA CADA CLASSE © proceso de construgao de classes de frequéncia demanda o estabelecimento de convencées que representem os limites de cada uma das classes construidas. Assim, por exemplo, se no agrupamento em classes de um grupo de idades o pesquisador resolver construir uma classe que compreenda as idades entre 10 ¢ 14 anos, ele precisaré estabelecer se os limites inferior e superior serao do tipo inclusive ou exclusive. Limites do tipo inclusive, como 0 préprio nome revela, incluem o valor representado. Limites do tipo exclusive ‘do incluem 0 valor representado. Uma das convencées mais usuais empregadas na representacdo dos limites de classes de frequéncia envolve a colocagao de barras verticais(simbolizadas por “|") e horizontais (simbolizadas por "~") na representacao dos limites. A barra horizontal representa o intervalo entre os limites. A presenga de uma barra vertical préxima a0 ‘nimero indica se tratar de um limite do tipo inclusive, A auséncia desta barra caracteriza limites do tipo exclusive. Alguns exemplos esto apresentados a seguir. Cs hea ‘omentario sobre os limites da classe Ce a 15 [-[21 | ABresenca de barras verticals préximas aos limite inferior e superior indica que ambos séo do tipo inclusive. Logo, os elementos 15 e 21 devem ser incluidos na classe representada, 14-18 | Abarra vertical esta presente apenas no limite inferior. Assim, 0 elemento 14 faz parte da classe. Porém, o limite 18 6 do tipo exclusive. O elemento 18 nao seré incluido nesta classe 7-9 | Aauséncia da barra em ambos os limites 0s caracteriza como do tipo exclusive. Nem o elemento 7 nem o elemento 9 sera incluidos nesta classe, 20-| 23 |Abarra vertical estd presente apenas no limite superior. Assim, 0 elemento 23 faz parte da classe, Porém, o limite inferior 20 & do tipo exclusive. 0 elemento 20 nao sera incluido nesta classe. 4 Estatisticaaplida & gest empresarial » Bruni ‘Além da representacdo com as barras vertical e horizontal, outras representagdes de classes podem ser empregadas. Veja os exemplos apresentados a seguit. Representacio ; mentério sobre os limites da classe Comentério sobs tes (0 colchete fechado sobre o limite inferior indica tratarse de um limite do tipo inclusive. Assim, | | trayret__ [limite 12" €do tipo inclusive. 0 elemento 12 ser incluido a classe O cochete no fechado 7 ‘no limite superior indica limite exclusive. Assim, o limite "16" € do tipo exclusive. O elemento 16 ndo ser incuido nesta classe. Nesta situagle, os dois mites sb0 do tipo exclusive. Nenhum dos dvs elementos deve ser 2:16 [icico na case nnn oe ms 12; 16) Hea thas, sd tes sb do io nce Os di lene vem erin © irculo sem estar preenchido indica um lite exclusive. O circu preenchido indica um limite 12.016 inclusive. Neste caso limite inferior 12 ¢ do tipo inclusive, enquanto o limite superior 16 & do tipo exclusive 120-016 _ | Nesta stuagio os dois mites s40 do tipo exclusive 12+-+ 16 | Nesta situagho os dos limites s40 do tipo inclusive Em relagio ao exemplo dos pesos do grupo de estudantes, os passos necessérios ao agrupamento poderiam ser apresentados da seguinte forma: Passo 1. Obter o valor de K (mimero de classes) Neste caso, o niimero de elementos analisados é igual a 40. Como n = 40, n > 25, assim o mimero de classes pode ser definido pela raiz.quadrada de n ou pela formula de Sturges. K = Raiz(N) = 6,32, ou aproximadamente 6 ou K = 1 + 3,32 . log(N) = 6,32, ou aproximada- mente 6 Naturalmente, o nimero de classes considerado sempre deverd ser igual a um ntimero inteiro. Passo 2. Calcular a amplitude de cada classe (h) Para isso, é preciso considerar o intervalo total ou range da amostra e o ntimero de classes a cons- truir. O intervalo total ¢ igual & diferenca existente entre 0 maior e o menor valor dos dados analisados. © maior peso é igual a 90 kg e o menor € igual 36 kg. Assim, o intervalo total da amostra ou range serd igual a 54 kg, Maior ~ Menor = 90 ~ 36 Range Como sero criadas 6 classes de frequéncia, a amplitude (h) de cada classe seré igual a 9 kg. Range +K=54+6=9 Neste exemplo, 0 valor obtido para h foi inteiro. Porém, em muitas outras situaces o valor obtido para hh podera ser um ntimero fraciondrio, Nestas situagées, recomenda-se evitar aproximagées muito expressivas do valor de h. Alguns autores costumam sugerir 0 uso de quatro casas decimais com o objetivo de amenizar 05 problemas decorrentes da aproximacéo. Passo 3. Montar as classes e tabular os dados. Como o menor valor é 36, devem-se construir as classes a partir do menor valor; a partir dai sto soma- das as amplitudes das classes. Obviamente, o limite superior da primeira classe deve ser o limite inferior da segunda classe. Para que no existam diividas quanto a classifi- cago do valor correspondent aos limites, é empre- gada a seguinte notacao: : limite inferior incluido na classe, limite supe- rior nao limite superior e inferior inclufdos na classe Como o iiltimo valor (limite superior da classe mais alta) deve estar incluido no tiltimo grupo, deve- -se tomar 0 cuidado de incluf-lo na tiima classe de frequéncias A tabela de frequéncias para 0s pesos poderia ser apresentada da seguinte forma: Estatiticae anise exploratéria de dados 15 © tamanho da amostra analisado ¢ igual a 25. Assim, 5 classes de frequéncia devem ser criadas. © maior valor é $ 2.235,00 e o menor é § 910,00. As- sim, 0 intervalo total é igual a $ 1.325,00. Como cin- co classes sero criadas, o intervalo de cada classe é igual a 1.325/5 ou $ 265,00. O resultado da construgio de classes formais e a tabulagao das frequéncias est apresentado a seguir. (0 reagrupamento dos dados nas classes deve se iniciar pelo limite inferior, a0 qual deve ser sucessi- ‘vamente adicionado o intervalo de cada classe até 0 limite superior das classes de frequéncia construfdas. Em algumas situagées, pesquisador pode optar por criar um agrupamento maior na primeira ou na tilti- ma classe, quando existirem valores baixos ou altos muito dispersos. Veja o exemplo apresentado a seguir, Idade (Anos) | F, | F% | Fac, | FAc% ‘Até 12 anos 3 él a3 6 E14 2 | 2 [15 | 30 14 |-16 2 | 4 | 35 | 70 16 |-18 a | tw | 43 | 86 18 |-20 5 | 10 [| a | 96 20 oumais anos | 2 4 | 50 | 100 [soma (=) 50 | 100 Na tabela, 0 pesquisador optou por fazer um agrupamento mais extenso dos valores mais baixos, criando a classe “Até 12 anos” ¢ outro agrupamento mais extenso dos valores mais altos, criando a classe “20 ou mais anos’. Em relagio aos dados da Estilo Modas, a varidvel Renda poderia ser agrupada em classes de frequén- cia, considerando 0 procedimento formal. Classe do peso |, | rm | rac, | masts Renda 7, | F% | Fac, | FAct% Saleen ale 5 sors | 13 | sz] 13 | 52 45 |-54 vo | 25 | 12 | 30] [11751-1400 | of 3 | 54 |- 63 2 | 30| 2 | 60 taao|-1705 | 3 | 12 | 16 | 64 an a | 2/32 | 80 1705|-1970| 3 | 12] 19 | 7 72 |-81 2 SY 38 |e. | 1970 |-| 2235] 6. 2a | 25 | 100 81 |-190 s | 125 | 40 | 100 soma) | 25 | 100 soma(s) | 40 | 100 - ! Procedimento informal: alguns textos auto- res mais contemporaneos de Estatistica desprezam 0s procedimentos sugeridos anterior mente. Recomen- dam, basicamente, 0 uso do bom senso, ingrediente sempre indispensavel nas analises feitas em Estatist- ca, ea criagdo de um ntimero de classes entre 3 € 20. A parciménia na criagio das classes ¢ essencial. Neste caso, alguns autores ainda sugerem a constru- «ho de classes com mesma amplitude. Em relagdo aos dados da Estilo Modas, a vari vel Renda poderia ser agrupada em classes de fre- ‘quéncia, considerando o procedimento informal. Po- deriam ser construidas classes com intervalos iguais a $ 500,00, iniciando com o valor $ 500,00. resultado da construgdo de classes informais e a tabulagdo das frequéncias sao apresentados a seguir. [Renda | Fre | Fac, | Facts 500 |- 1000 9] 36 o| 36 1000 |- 1500 | te] 3] 52 1500 |- 2000 7|28[ 2080 2000 |-| 2500 s| _20| 25] _100 Soma (8) 25] 100] Quando classes de frequéncia sao construidas € apresentadas, é comum a exposico em algumas 16 Estaisticaaplicads 8 gestio empresarial + Bruni tabelas do ponto médio da classe. O ponto médio representa a média do limite inferior e do limite su- perior. Ponto médio da classe te inferior) + 2 (imite superior + limi: Assim, a tabela anterior poderia ter os seus pon- tos médios apresentados. Veja a tabela seguinte Renda Mate, | F: | £% | Fae, |FAae ge s.00|-1.000 | 750 | 9| 36] 9| 36 1.000 |-1.500 | 1.250 | 4] 16| 13 52 1.500 |-2.000 | 1.750 | 7| 28| 20] 80 2.000 |-| 2.500] 2250 | 5| 20| 25| 100] soma (5) 28] 100 Analisando as informacées tabuladas ‘A extragio de informagées de tabelas de fre- quéncia é simples. As frequéncias apresentam as in- tensidades de concentragao de determinado atributo. A interpretagio das frequéncias revela os atributos mais presentes ¢ os de menor concentracao. Por exemplo, imagine que a tabela seguinte apresentasse a distribuicao de renda dos habitantes de uma cidade do Nordeste do pais. Note que, nesta situagdo, 0 pesquisador optow por criar uma classe de frequéncia mais ampla para os maiores valores, representados na classe “Mais que 9” Exercicios Renda em salarios- F% | Fac, | FAc% 0-3 sa | 725 | se | 725 3-6 to | 125 | 68 | 85 6I-9 7 | 375 | 75 | 93,75 Mais que 9 s | 625 | 80 | 100 Soma (5) 80 | 100 A andlise da distribuigéo das frequéncias seria simples: muitos ganham pouco e poucos ganham_ muito. Existe uma concentragao muito grande das frequéncias na menor classe, formada pelos indivi- duos que ganham entre 0 a 3 salarios-minimos. Esta classe apresentou uma frequéncia simples de 58 indi- viduos, ou 72,5% do total da amostra. Consequente- mente, é baixa a frequéncia das classes com valores mais altos. Por exemplo, apenas 6,25% da amostra possui renda superior a nove saldrios-minimos. Neste caso especifico, a alta concentragao de fre- quéncia na menor classe remete ao questionamento da possibilidade de um detalhamento mais especifico dos menores valores. Um pesquisador mais criterio- so poderia tentar analisar com maior profundidade a istribuigo dos valores na menor classe, criando in- tervalos menores para os valores mais baixos. ‘Sugestdo: Leia no Capitulo 15 como usar 0 Excel na andlise exploratoria de dados. 1. Em uma pesquisa com seres humanos, um cientista social pensou em fazer as perguntas relacionadas a se- ‘suit. Classifique as variaveis formadas a partir das respostas fornecidas &s perguntas em quantitativas (dis creta ou continua) ou qualitativas (nominal ou ordinal). 2) Qual o seu nome? b) Qual a sua idade em anos? ©) Qual o seu género? d) Qual o seu CPF? @) Em que cidade voce nasceu? 4) Quanto filhos vocé tem? 49) Qual a sua renda familiar em RS? T [iT Masculine ) [2] Feminino hy) Classifique a seguinte afirmagao: “O presidente da repiblica atual esta desempenhando bem as suas funcoes" [1] Concordo totalmente [2] Concordo parciaimente {3} Discordo totalmente Estusticae andliseexploratéria de dados 17 2, Construa o rol das seguintes séries e, posteriormente, tabule as frequéncias. Na construcio das tabelas de frequéncia, use duas casas decimais nas colunas onde os percentuais forem apresentados. a) Série A: (15 3; 15 55 15 45 45 25 2; 3} bb) Série B: (3,2; 3,2; 3,0; 1,1; 2,8; 0,3; 0,0; 8,5; 2,1; 0,73 7,43 3,4; 5,85 5,5; 3,2; 10,0; 7,6) 3. Considere os dados apresentados a seguir. Empregando a notacao sigma, calcule o que se pede: @ Lo; L(A dens @ Stony © [Stof-7 1 [ x, 1 3 2 2 3 5 4 1 5 6 6 0 7 7 8 4 . Soma 28 4, Ageréncia industrial da indiistria de cimentos Gruda Bem Ltda, coletou uma amostra formada por 64 sacos produzidos na semana passada. A quantidade de impurezas contidas em cada saco foi contada. Os valores obtidos variaram de 3 a 51 impurezas. Os resultados obtidos foram tabulados em classes de frequéncia, cons- truidas conforme os procedimentos formais da estatistica. Pede-se calcular: (a) 0 intervalo total da amostra; (b) 0 miimero de classes que foram criadas; (c) 0 intervalo de cada classe; (d) 0s limites da terceira classe A tabela seguinte representa os salarios pagos a um grupo de administradores de empresas em $ mil. Com base nos valores apresentados, encontre: (a) frequéncia simples da 5* classe; (b) soma das frequéncias; (c) © limite inferior da 6 classe; (4) o limite superior da 4" classe; (e) a amplitude ou o intervalo de cada clas- se; (f) a amplitude total; (g) 0 ponto médio da 3* classe; (h) o miimero de classes; (i) a frequéncia cumula- tiva simples até a 6* classe; (j) a porcentagem de valores iguais ou maiores que 3,20. Classe F, 2,75 |- 2,80 2 2,80 |= 2,85 3 2,85 | 2,90 10 2,90 |- 2,95 W 2,95 |- 3,00 24. 3,00 |- 3,05 14 3,05 |- 3,10 3,10 |-3,15. 3,15 |-3,20 3.20 [+1 3.25 ‘Soma (2) 90, 18 Estaistis ali 6 gestio empresarial + Bruni Complete as informagdes ausentes na tabela seguinte x, F, F% Fac, | FAc% 2 5 16 B w7 32 34 8 45 47 56 3 Soma (2) 50 100 ‘A tabela seguinte apresenta a tabulagéo cruzada de uma pesquisa feita na Universidade do Saber sobre o fato de o estudante possuir habilitagao ou no. Encontre o que se pede: (a) tamanho da amostra analisa- da; (b) nimero de alunos habilitados analisados; (c) mimero de alunos de enfermagem analisados; (4) 0 percentual de alunos habilitados do curso de direito; (e) percentual dos alunos néo habilitados que cursam engenharia; (£) 0 percentual dos alunos de enfermagem que possuem habilitacéo. Possui habi Curso Total sim F, 3 2 5 96 linha 60) 40] 100 Direito % coluna 30) 20 25) % total 15 10 25 F, 3 6 9 9% linha 33,33, 66,67| 100 Enfermagem % coluna 30| 60| 45 % total 15 30) 45 F, 4 2 6 %6 linha 66,67 33,33) 100 Engenharia % coluna 40 20| 30 % total 20 10 30 F 10 10 20] 9% linha 50! 50| 100] Soma 9% coluna 100 100| 100) 96 total 50 50] 100 Uma amostra de vendas didrias registradas no ano passado para o Supermercado Pague e Leve Ltda. esta apresentada na tabela seguinte, Construa o agrupamento em classes de frequéncia, empregando o procedi- ‘mento: (a) formal (calcule h com quatro casas decimais); (b) informal, comecando em $ 0,00 com inter- valos de classe iguais a $ 50,00. Use duas casas decimais nas colunas com percentuas. 9. Os comprimentos de u bela seguinte. Com base nos valores mento: (a) formal, usai staustica © anliseexploratéria de dados 19 40,00 69,98 109,85 141,39 122 72.91 110,41 146,09 42,91 74,02 111,04 149,56 45,53 75,95 11247 150,17 49,78 80.49 | 115,90 154,04 53,66 82.05 | 11637 157,41 56,14 84,08 118,50 160,56 56,89 88,62 123,10 161,45 enn 90,98 127,67 163,22 61,23 94,95 129,42 163,34 2.11 96,38 129,67 165,09 63,78 97,69 132,05 170,04 63,85 99,76 134,15 170,30 64,82 102,41 13654 | 173,77 67,93 106,73 137,10 177,67 1m grupo de tébuas produzidas pela Movelaria Campestre esto apresentados na ta- expostos, construa 0 agrupamento em classes empregando o procedi- indo quatro casas decimais para o valor de h; (b) informal, comegando em 130 e com intervalos de classes iguais a 20. Use duas casas decimais nas colunas com percentuais. 13500 | 14782 | 16211 | (17655 135.22 | 14926 | 16235 | 17675 13596 | 15045 | 16268 | 17869 w36s1 | t5n27_| 16277 | 179,12 13834 | 15287 | 163,26 14022 | 15304 | 164,71 waar | 15336 | 16554 14095 | 15492 | 167,33 vaia7_| 15584 | 169,03 vaz3s_ | 15673 | 17085 v4a06 | 157.73 | 171,07 14552 | 15859 | 172,78 oe a 147.37 | 160.05 | 176.13 1768 | 16099 | 176.15 10. 0 gerente da Loja de Bugingangas Ltda. verificou que, em 45 dias, o niimero de clientes que entraram no estabelecimento comercial poderia ser apresentado na tabela seguinte. Construa 0 agrupamento em clas- ses de frequéncia para os dados expostos. Empregue o procediment: a) formal (calculando h com quatro casas decimais); (b) informal, comecando em 0 e com intervalos de classe iguais a 5. 20 stausicaaplicade A gesto empresaral + Brunt 1 6 5 1 7 16 1 7 17 2 7 18 2 8 19 2 9 19 2 10 19 3 10 2 3 1" 2 3 2 2 4 3 2 5 3 5 5 3 5 5 14 ry 6 15 7 11. Construa o rol da série dada a seguir, agrupando em classes de frequéncia. Use 0 procedimento formal. = fd ia oe | =o | 120 60 so | 30 | 20 70 | a ooo a a yl nz a is a om 12. Uma amostra de vendas didrias de uma mercearia coletadas durante o més de janeiro do ano pasado re- velou niimeros iguais a: (68,98; 72,92; 89,19; 98,57; 123,34; 134,80; 141,34; 153,59; 158,59; 165,92; 169,21; 175,76; 177,79; 178,07; 180,38; 181,99; 185,95; 188,83; 194,88; 208,09; 214,66; 251,94; 265,70; 271,90; 276,59; 280,56; 303,99; 318,33}. Com base nos dados fornecidos, construa a tabela de classes de frequéncia, empregando o procedimento formal. Calcule h com duas casas decimais, 13. Os salirios pagos em determinada empresa da cidade esto apresentados na tabela seguinte. Agrupe os da dos em classes de frequéncia. O que poderia ser dito sobre as remuneragdes pagas na empresa? 381,00] 389,00] 389,00] 418,00] 429,00] 430,00] 472,00] 486,00] s68,00| _623,00 669,00| 682,00] 699,00] 728,00) 821,00] 821,00] 822,00] 856,00] 866,00 904,00 904,00] 912,00] 924,00] 926,00] 968,00] 973,00] 989,00] 996,00] 1.006,00| 1.007,00 028,00] 1.08400] 1.109,00] 1.112,00] 1.148,00] 1.149,00] 1.168,00] 1.175,00] 1.201,00] 1.209,00 14. A tabela seguinte mostra as vendas das 120 maiores empresas nacionais em 1995, segundo uma revista de grande circulagio nacional. Com base nos dados apresentados, agrupe-os em classes de frequéncia, em- pregando os procedimentos formais da Estatistica. Considere: (a) as 40 maiores empresas, apenas; (b) as 70 maiores empresas, apenas; (c) todas as empresas. As raizes quadradas de 40, 80 e 120 sao, respectiva Esttistiea e anise exploratéria de dads 21 € aproximadamente, iguais a 6,32, 8,94 e 10,95. Calcule h com trés casas decimais e use apenas uma casa decimal nas colunas que apresentam percentuais, Nome da empresa Vendas em § mithoes Nome da empresa ‘Vendas em § milhoes Volkswagen (SP) 7.22220 Prosdécimo/Refripar (384,30 GM (SP) 6.39070 Philips (SP) 875,10 Fiat Automéveis (MG) 6228.90 Hoechst (SP) 374,40 Souza Cruz (Rd) 5.67010 Pirelli Pnews | 368,20 Shell 5.30020 Goodyear 858,80 Carrefour (SP) 133,80 ‘Aracruz Celulose (65) 855,10 Ipiranga (SP) 3.861,00 Rhoda (SP) 33350 Mercedes-Benz (SP) 3.398,00, ‘Acesita (MG) 333,20 Nestlé (5) 3.37230 RMB (SP) 83070 Gessy Lever (SP) 3.369,10 Copesul (RS) #2020 Pao de Agdcar (SP) 3.260,60 NEC do Brasil (SP) 787,00 Varig (RS) 3,207.30 Lojas Colombo (RS) 76050 Texaco (R) 2911.80 ‘Suzano (SP) 752,50 Brahma (8) 2.831,30 Tlochpe-Maxion (SP) 746,70 Esso (®) 2.82320 Lojas Mesbla (R)) 735,60 Ford (SP) 2211.60 Cosigua (R) 724,50 CSN () 2.636,10 ‘Semp Toshiba Amazénia (AM) 719,60 Lojas Americanas (8) 2371.70 ‘SuperMar (BA) 719,30 Usiminas (MG) 2.166,00 Alan (SP) 71220 Copersucar (SP) 2.07130 Kibon (SP) 711,90 Multibras (SP) 4.997,20, ‘Agominas (MG) 709,90 eM () 1.914,90 ‘Andrade Gutierrez (MG) 697,20 (Casas Bahia (SP) 1.75450 ‘Antarctica RU (0) 696,50 Coimex (ES) 1.741,00 Belgo-Mineira (MG) 692,50 Ceval (50) 1,735,00, Abril (SP) 679,40 Xerox (ES) 1.581,00 ‘Agos Vilares (5°) 672,70 Santista Alimentos () 1572.20 NacionalSupermercados (RS) 663,60 Sadia Concérdia (SC) 1532.10 BA SP) 661.40 osipa (SP) 1501.90 Bayer (SP) 659,70 Sendas (®) 1.480,70 ‘Coamo (PR) 64120 Makro (SP) 1.480,50 FIC (SP) 639,20 Copene (8A) 1.433,00 Bridgestone/Firestone () 636,40 Bompreso (PE) 1.341,70 Distr. Petree Ipiranga (RS) 635,90 ‘Arapua (SP) 1.328,20 Caralba Metais (8A) 629,80 ‘Alcoa (MG) 131520, ‘Sharp do Brasil (AM) 628,70 Ponto Frio (Rd) 1,257.90 ‘White Martins (R)) 618,70 ‘Armazém Martins (MG) 4,234.60, ‘volvo (PR) (603,00 Cargill (SP) 1.234,30 Kodak (SP) 601,70 Philip Moris (5) 1.17660, Leite Paulista (SP) 598,10 Coca-Cola/Spal (SP) 1.165,00 Johnson & Johnson (SP) 594,30 asp (SP) 1.154,00 Petroquimica Unido (SP) 584,70 Bast (5) 1.135,70 Eldorado (SP) 578,40 22 Estaisticaaplicada & gest empresaral + Brunt ‘Avon (SP) 1.08030 Norberto Odebrecht (RI) 571.40 Encol (OF) 1.068,10 | | Azali (RS) 558,70 ‘Mappin (SP) 1.058,60 Cofap (SP) 557.50 [Traes Mendonca (BA) 1.02300 PC (BA) 551,90 Bosch (SP) 1.01850 Zatfari (RS) 550.90 ST (ES) 995,10 Central també (MG) 545,30 Antarctica Paulista (SP) 982,30 ‘Champion (SP) 535,60 (CCE da Amazénia (AM) 966,20 Embraco (SC) 531,80 Perdigao (SP) 959,90 3M (SP) 531,50 Klabin Fabricadora (SP) 956,50 CRO (RS) 53050 ‘Saab-Scania (5) 949,40 Gradiente Eletronica (AM) 528,90 Parmalat (SP) 943,20 Pirelli Cabos (SP) 51950 Philips da Amazénia (AM) (941,60 ‘Sdo Paulo Alpargatas (SP) 517.20 Kaiser (SP) 932,60 Ericsson (SP) 51320 Ttautec Philco (AM) 921,50 encore (SP) 512,10 Casas Pernambucanas (SP) 918,30 Alpargatas-Santista (SP) 511,80 Sadia Frigobrés PR) 916,10 ‘Atacadao (SP) 510,10 ‘Transbrasil (OF) [ 895,30 Brasimac (SP) 507,00 1 ‘Sugestio: resolva os exercicios propostos no Excel. Leia as sugestdes do Capitulo 15. AVISO IMPORTANTE O site apresenta um importante conjunto de complementos ao livro, como, tabelas, respostas, slides, listas extras de exercicios e casos. Para enriquecer o seu aprendizado, consulte todo (© material de apoio disponivel na Internet!