Escolar Documentos
Profissional Documentos
Cultura Documentos
A Estatstica (ou cincia a Estatstic ca) um conjunto c de tcnicas s e mtodo os de pesq quisa que entre e outr ros tpicos s envolve o planejam mento do experimen nto a ser r realizado, a coleta qualificada q a dos dado os, a inferncia, o p processame ento, a anlise e a dissemina d o das info ormaes. Na e estatstica trabalham mos com d dados, os quais q pode em ser obt tidos por meio de u uma amost tra da popu ulao em m estudo. A seguir, definimos d e esses conc ceitos bsic cos:
Popu ulao: co onjunto de e elemento os que tem pelo menos uma a caracter stica em comum. Esta E carac cterstica deve delimitar corretamente e quais s o os elem mentos da populao o.
de
elem mentos
de d
uma
popula o,
que
so
repr resentativo os para es studar a c caracterstica de int teresse da a popula o. A sele o dos elementos que iro c compor a amostra pode p ser f feita de vrias v maneiras e ir depende er do con hecimento o que se tem da po opulao e da quan ntidade de e recursos disponveis d s.
Vam mos aprese entar os elementos e bsicos da d anlise de dados s. Veremo os as Estatsticas Descritivas utilizadas s para or rganizar, resumir r e descreve er os aspe ectos impo ortantes do comport tamento dos d dados. . A descri o dos dados d tamb bm pode e identific car anoma alias, at mesmo resultante es do reg gistro incorreto de valores v e valores ext remos (aqueles que no segue em a tend ncia gera al do resta ante do co onjunto de e dados). As ferram mentas des scritivas s o os muit tos tipos de d graficos e tabelas s, bem com mo as medidas de sn ntese: med didas de p posio e medidas m de e disperso o.
Sempre que resumimos um conjunto de dados, perdemos informao sobre o mesmo, pois condensamos as observaes originais. Entretanto, esta perda de informao pequena se comparada ao ganho que se tem com a clareza da interpretao proporcionada.
1 - Noes bsicas de estatstica
A Estatstica durante sculos foi usado inconsientemente pelos povos como um carter meramente descritivo e de registro de ocorrncias. As primeiras atividades foram por volta de 2000 a.C. e foram usados no recenseamento das populaes agrcolas chinesas. No incio do sculo XIX, os grandes matemticos entraram em cena, como exemplo, o francs Simon Laplace e o alemo Carl Friedrich Gauss (1777 1855), este ltimo surge com a idia de ``distribuio normal de frequncia". A teoria da distribuio normal foi usada pelo astrnomo e matemtico belga Adolphe Qutelet (1796 1874), no estudo estatstico de diversas caractersticas das populaes humanas: altura, peso, natalidade, mortalidade, renda mensal etc. Ronald Aylmer Fisher (1890 1962), geneticista britnico, concentrou seus estudos na gentica das populaes, campo em que obteve importantes resultados, sendo considerado um dos grandes criadores do neodarwinismo. Na Estatstica trabalhou com ajustes de curvas de freqncias, com coeficientes de correlao, os chamados coeficientes de Fisher, na anlise de varincia (ANOVA) e nas tcnicas de estimao dos parmetros. Influenciado pelos trabalhos deKarl Pearson, outro importante geneticista britnico. Fisher utilizou os resultados que obteve na Estatstica como ferramentas para aplicao nos seus estudos de gentica, sendo hoje considerado um dos maiores nomes na Teoria de Estatstica e na Estatstica aplicada Biologia.
1.1 - Introduo
Em geral, manipulamos um conjunto de dados com o objetivo de extrairmos informao sobre o comportamento de um processo ou produto. A Estatstica utiliza a variabilidade presente nos dados para obter tal informao. A variabilidade est presente em todo lugar. Por exemplo, a posio de um carro estacionado em uma garagem no a mesma ao longo dos dias. Neste caso, a posio do carro apresenta uma variao. Nossa estratgia consiste em avaliar as variaes e obter informaes atravs dela. A aplicao de tcnicas estatsticas envolve vrias etapas:
A qu ualidade da d soluo o est dire etamente relacionad da com a qualidade e dos dado os obtidos s. Podemo os evitar q que alguns problem mas ocorra am observ vando fatos s como:
No se deve coletar da ados sem que antes s se tenha a definido o claramen nte o prob blema ou situao s a ser enfre entada, bem como os o objetivo os com rel lao aos m mesmos;
Os s sistemas de e medio o (instrume ento, oper radores, mtodo, m m meio) que sero s utiliz zados deve em ser ava aliados e te er capacidade de me edio sufi iciente; Os c clculos e leituras devem s er feitos com muita aten o para evitar e disto ores; Deve em ser utlizados mtodos adeq quados pa ara coleta de dados d de acordo com o pro oblema estudado. Uma a amostra uma par rcela de u uma popula ao que pode p conte er informa aes sobr re esta pop pulao. Outra O defin nio impo ortante (pa ara a esco olha da tc cnica estatstica e das interpre etaes do os resultad dos) a cla assificao o dos dados s.
Com m que frequ uncia oco orrem os pr roblemas? Quai is so as ca ausas pote enciais do p problema? ?
Um bom plan nejamento o para cole eta de da ados deve considera ar as seguintes perg guntas:
Qual l a pergunt ta a ser re espondida? Com mo comunic car a respo osta obtida a? Qual l ferramen nta de anl lise preten ndemos usa ar e como utilizar os s resultado os? Qual l tipo de dado nece essrio par ra utilizar as ferrame entas dese ejadas e responder a pe ergunta? Com mo coletar esses e dado os com o m mnimo de esforo e erro? e Onde e acessar estes e dado os? Quem m pode no os fornecer r os dados? ? Qual l o perodo o em que os o dados se ero coleta ados? Tend do as respo ostas para estas perg guntas, de evemos:
Cons struir uma metodologia para no os certificar de que todas as in nformae es esto definidas; Cole etar os dad dos de form ma consiste ente e hon nesta; Cert tificar-se de d que exis ste tempo suficiente e para a coleta de da ados;
Definir quais informaes adicionais sero necessrias para estudos futuros, referncias ou reconhecimento.
1.3 - Exposio dos dados
Antes da exposio dos dados coletados necessrio que se faa um trabalho de reviso e correo nos dados coletados na tentativa de eliminar possveis enganos na elaborao do relatrio. Inicialmente, os dados podem ser classificados como "qualitativos" ou "quantitativos". Atravs desta classificao, vamos definir algumas tcnicas para resumir o conjunto de dados.
Dados qualitativos
Os dados qualitativos representam uma caracterstica da qualidade (ou atributo) associado ao item pesquisado. Por exemplo, podemos classificar um produto em: bom, razovel ou ruim. Os dados qualitativos podem ser divididos em dois tipos:
Dado qualitativo nominal - Para o qual no existe nenhuma ordenao nas possveis realizaes; Dado qualitativo ordinal - Para o qual existe uma ordem em seus resultados. Exemplo 1.3.1: Uma indstria de calculadoras eletrnicas, preocupada com vrios defeitos que um de seus produtos vem apresentando, fez um levantamento e constatou os seguintes problemas:
A: Defeito na cobertura plstica; B: Defeito no teclado; C: Defeito na fonte de energia; D: Soldas soltas; E: Defeito na placa da unidade de processamento; F: Defeito no visor; G: Outros. Este um tpico exemplo de dados qualitativos nominais. Nesta situao, para cada item inspecionado, existe uma varivel T que representa o tipo de defeito encontrado. Portanto, essa varivel T pode assumir os valores: T = A, T = B, ... ,T = G. Logo, por exemplo, para uma calculadora com defeito na cobertura plstica, temos que T = A. A seguir, temos uma Tabela com os valores observados.
Frequncia 10 20 55 80 25 3 7
Neste exemplo, todos os defeitos apresentam o mesmo nvel de severidade e portanto, no apresentamos uma ordem entre os atributos (defeitos). Neste caso, temos um exemplo de dados qualitativos nominal. Exemplo 1.3.2: Em um concurso pblico foram contabilizados os nmeros de pessoas inscritas segundo os nveis de escolaridade: fundamental completo, mdio completo, superior completo e ps-graduao completa. Segue abaixo a Tabela com os valores observados.
Nvel de escolaridade Fundamental completo Mdio completo Superior completo Ps-graduao completa
Neste exemplo, temos um ordem natural entre os atributos (nvel de escolaridade) e consequentemente, temos um exemplo de dados qualitativos ordinais.
Dados quantitativos
Neste caso, a caracterstica observada assume valores numricos que podem ser classificados em "discretos" ou "contnuos".
Portanto, a varivel "nmero de pessoas com diabetes" assume valores discretos, isto , inteiros: ...,7,8,9,... .
caracterstica da qualidade de uma pea ou produto. Os possveis valores incluem "todos" os nmeros do intervalo de variao da caracterstica medida. Por exemplo, ao medirmos os dimetros dos eixos de determinados motores com uma clula eletrnica, obtemos dados quantitativos contnuos. Exemplo 1.3.4: Numa fbrica de motores eltricos, o gerente de produo precisa avaliar o problema de rudo excessivo do motor. Uma das possveis causas est associada com variaes no dimetro do eixo. Assim, o gerente de produo mediu o dimetro do eixo de 200 motores e o resultado est apresentado na Tabela a seguir. Os valores esto em milsimos de milmetros.
Dimetro do eixo de 200 motores 4,8 4,9 4,3 5,1 4,9 5,7 5,1 4,9 5,0 4,8 4,8 4,9 4,2 4,8 4,9 4,9 4,3 4,9 4,9 4,8 5,2 5,1 4,2 5,1 5,1 5,0 4,7 4,8 4,6 5,2 4,9 4,2 4,2 4,6 5,1 4,8 5,2 5,3 5,2 4,8 4,7 4,8 5,1 5,2 4,9 4,8 5,2 4,9 4,8 4,9 4,8 5,0 4,7 4,9 5,2 5,1 5,1 5,2 4,8 4,8 4,7 5,5 4,4 4,8 5,3 4,9 4,7 4,7 4,6 4,5 4,7 5,0 4,9 5,2 5,6 5,1 4,4 4,4 4,8 5,5 5,4 4,9 4,9 5,3 4,5 5,1 5,0 5,4 4,7 4,7 4,6 4,7 4,6 4,5 4,7 4,9 4,9 4,6 5,0 4,2 4,8 4,8 5,2 4,7 4,8 5,4 4,9 5,5 4,5 4,9 5,0 5,1 5,2 5,1 5,5 4,4 5,2 4,5 4,5 5,2 4,9 4,8 4,8 4,9 4,5 5,4 5,2 4,8 5,1 4,9 4,7 5,2 5,1 5,1 5,2 4,6 5,1 5,0 4,2 4,2 4,7 4,6 5,2 4,7 4,8 4,6 4,5 5,4 4,6 4,4 4,9 5,2 5,2 4,7 5,5 4,8
Podemos fazer a apurao considerando intervalos de medidas, como apresentado na Tabela a seguir
Dimetro do eixo de 200 motores (com apurao) Dimetro [4,2;4,4) [4,4;4,6) [4,6;4,8) [4,8;5,0) [5,0;5,2) [5,2;5,4) [5,4;5,6) [5,6;5,8) Apurao //////////// ////////.../ /////////.../// //////////...////// //////////...///// //////////...// //////////// //// N de motores apurados 12 16 31 66 35 25 11 4
Ao estabelecermos intervalos de classes, estamos admitindo que o eixo pode assumir qualquer valor entre o limite inferior (inclusive) e o limite superior (exclusive).
1.4 - Grfico de barras
Exem mplo 1.4.1: Conside ere os dado os do Exem mplo 1.3.2. Constru ua o grfic co de barras corresp pondente.
clique aqui i para efetuar o download d dos dados ut tilizados ness se exemplo
Ent o, o grfic co de barras corresp pondente seria um gr rfico onde e os retng gulos corre espondent tes a cada a nvel de instruo teria a altura corre espondent te ao nmero de ins scritos com m o respec tivo grau de d escolar ridade. Pod demos resolver este problema a utilizando o o softwa re Action. O resultad do o segu uinte
Para a entender r como exe ecutar essa a funo do o Software e Action, v voc pode cons sultar: manua al do usurio video dem monstrativo o
Diag grama de Pareto um u grfico o de barra as que ord dena as fr requncias s das ocor rrncias, da maior pa ara a men nor, permit tindo a pri iorizao d dos proble emas. Most tra ainda a curva de percentag gens acum muladas. Su ua maior u utilidade a de perm mitir uma fcil visua alizao e identificao das ca ausas ou p problemas mais impo ortantes, possibilitando a con ncentrao o de esfor ros sobre os mesmo os. utiliz zado para dados qua alitativos.
5. Colete os dados necessrios para cada categoria. Exemplo: Defeito A ocorreu X vezes ou defeito C custou Y. 6. Preencha a planilha de dados, listando as categorias em ordem decrescente com relao unidade de comparao. 7. Marque o eixo horizontal no lado esquerdo com a escala de zero at o total da coluna Quantidade da planilha de dados. Identifique o nome da varivel representada neste eixo e a unidade de medida utilizada, caso seja necessrio. 8. Marque o eixo vertical do lado direito com uma escala de zero at 100%. Identi
que este eixo como c "Porcentagem acumulada"(%). 9. Li iste as cat tegorias da esquerda a para dir reita no ei ixo horizon ntal em or rdem decr rescente de d frequncia ou cus sto. Os ite ens de me enor impo ortncia po odem ser c combinado os na cate egoria Out ros, que colocada a no extre emo direit to do eixo, com a ltima barra a. 10. Identifique e cada intervalo do o eixo hor rizontal es screvendo os nomes s das cate egorias, na mesma or rdem em q que eles ap parecem na a planilha de dados. 11. C Construa um u grfico o de barras s utilizando a escala do eixo v vertical do lado esqu uerdo. Para a construir r um grfic co de barra as, acima de cada ca ategoria, basta b dese enhar um retngulo r cuja c a altu ura represe enta a freq quncia ou u custo daq quela cate egoria. 12. Construa a curva de Paret to marcan ndo os valores da a porcenta agem acum mulada aci ima e no centro ou la ado direito o do interv valo de cad da categor ria, e ligue e os pontos s por segm mentos de r reta. Exem mplo 1.5. .1: Conside erando os s dados do d Exemplo o 1.3.1, construim mos o diagrama de Pareto, P utilizando o Action. Os s resultado os obtidos so mostr rados a seg guir.
clique aqui i para efetuar o download d dos dados ut tilizados ness se exemplo
Tipos de Fre equncia Porcenta agem Freq ncia P Porcentagem m Problemas Acumulada Acumalada D C E B Ou utros 8 80 5 55 2 25 2 20 1 10 80 135 160 180 190 40 27,5 12,5 10 5 40 67,5 5 80 90 95
1 10
200
100 0
Para a entender r como exe ecutar essa a funo do o Software e Action, v voc pode cons sultar: manua al do usurio video dem monstrativo o
Exem mplo 1.5.2: Em uma a empresa a de carto o de ident tificao, c contabiliza amos os de efeitos nos s cartes com c medid da de comp parao ba aseada no custo.
Cara acteres errad dos A Amassado P Perfurado Impr resso ilegv vel Rasgado Outros Total
28 4 3 2 2 1 68
clique aqui i para efetuar o download d dos dados ut tilizados ness se exemplo
Orde enando os defeitos pelos p seus c custos, tem mos o segu uinte diagr rama
Pr rincipais de efeitos Amassad do Rasgado o N Nmeros troc cados Caracteres er rrados Perfurad do Im mpresso ile egvel Outros
Para a entender r como exe ecutar essa a funo do o Software e Action, v voc pode cons sultar: manua al do usurio video dem monstrativo o
1.6 - Histogram ma
Freq quncia ab bsoluta (i): o nm mero de ob bservaes s correspo ondente a cada class se. A frequ uncia absoluta , ge eralmente, chamada a apenas de e frequnc cia. Freq quncia re elativa (ri): o quoc ciente entre a frequ uncia abso oluta da classe corre espondent te e , a soma da as frequ ncias (total obs servado), isto
Freq quncia pe ercentual (pi): obt tida multip plicando a frequncia a relativa por 100% %. Freq quncia acumulada a a: o tota al acumulado (soma) de tod das as cla asses ante eriores at a classe atual. Pod de ser: fre equncia acumulada a a absoluta (Fi), frequncia acu umulada re elativa (Frii), ou frequ uncia acu umulada pe ercentual (Pi).
Nmero de Frequncia a Frequncia(i) pessoas com c r relativa (rii) diabete es 7 1 0,05 8 2 0,1 9 5 0,25 10 8 0,4 11 3 0,15 12 1 0,05
Para a entender r como exe ecutar essa a funo do o Software e Action, v voc pode cons sultar: manua al do usurio video dem monstrativo o
2. (l li) (Li) , onde o limi ite superio or da classe incluido na con ntagem, mas m o infer rior no. Pode emos esco olher qualquer uma a destas opes, mas im mportante que deix xemos clar ro no texto o ou na ta abela qual delas est sendo u usada. Em mbora no seja nece essrio, os intervalos s so freq quentemen nte constru udos de modo m que todos ten nham larguras iguai is, o que facilita as s compara aes entr re as class ses. Na t tabela de distribui o de freq quncia, acrescenta a mos uma coluna com os pont tos mdios s de cada intervalo de classe, , denotada a por xi. E Esta def finida como a mdia a dos limit tes da clas sse na construo de grfico os. Algu umas indica aes na construo de distribuio de frequncias s so:
Na m medida do possvel, as a classes d devero te er amplitud des iguais. . Esco olher os lim mites dos in ntervalos e entre duas s possveis observa es. O n mero de intervalos no deve u ultrapassar 20. Esco olher limite es que faci ilitem o ag grupament to. Marc car os pont tos mdios s dos interv valos. Ao c construir o histogram ma, cada re etngulo de ever ter rea propo orcional frequncia relativa (ou frequnc cia absoluta, o que d no mesm mo) corre espondent te.
Hist tograma
Histo ograma uma representao o grfica (um grfico o de barra as verticais ou barras horizon ntais) da distribuio d o de frequ uncias de e um conj unto de dados d quan ntitativos contnuos s. O histo ograma po ode ser um u grfic co por valores abso olutos ou frequncia relativa a ou densidade. No o caso de e densidad de, a frequncia relativa do intervalo i, (fri), represen ntada pela a rea de e um retngulo qu ue colocado a acima do ponto mdio d da classe e i. Cons sequentem mente, a rea total do histog grama (igual a soma a das rea as de todo os os retn ngulos) ser igual a 1. Assim, ao const truir o his stograma, cada retngulo deve er ter re ea proporc cional fre equncia relativa r (o ou frequ ncia abso oluta, o qu ue indife erente) cor rrespondente. No ca aso em que e os interv valos so d de tamanh hos (amplitudes) igu ais, as alturas dos re etngulos sero igua ais s
frequncias relativas (ou iguais s frequ uncias ab bsolutas) dos interv valos corre espondent tes. Exem mplo 1.6 6.2: Consid derando o os dados do Exem mplo 1.3 .4, mont te distr ribuio de e frequnc cias e cons trua o hist tograma co orresponde ente.
clique aqui i para efetuar o download d dos dados ut tilizados ness se exemplo
Com mo temos dados d quantitativos contnuos s, para con nstruir a d distribui o de frequncias, vamos v sep parar os da ados em classes. c Dividimos o os dados em e 8 class ses de tam manhos igua ais. A distr ribuio de e frequnc cias ento a seguin nte
Freq. F Re elativa 0,06 0 0,08 0 0,15 0 0,33 0 0,17 0 0,12 0 0,06 0 0,02 0
Po orcentagem m
Dens sidades
Ponto mdio 4,3 4,5 4,7 4,9 5,1 5,3 5,5 5,7
[4,2; ;4,4) [4,4; ;4,6) [4,6; ;4,8) [4,8; ;5,0) [5,0; ;5,2) [5,2; ;5,4) [5,4; ;5,6) [5,6; ;5,8)
12 2 16 31 66 35 25 11 4
E ento, con nstrumos o histogr rama corr respondent te. Podem mos utilizar o softw ware Actio on para res solver este e problema a.
Para a entender r como exe ecutar essa a funo do o Software e Action, v voc pode cons sultar: manua al do usurio video dem monstrativo o
Exem mplo 1.6 6.3: Consid derando o os dados do Exemp plo 1.3.4 4, constru ua o histo ograma de densidade es correspo ondente
clique aqui i para efetuar o download d dos dados ut tilizados ness se exemplo
Para a construir r o histogr rama de d densidades, basta qu ue os ret ngulos ten nham altur ra do tam manho da densidade e de cada classe e largura d do tamanho da class se. Neste caso, c o histograma fi icaria da seguinte s fo orma:
Para a entender r como exe ecutar essa a funo do o Software e Action, v voc pode cons sultar: manua al do usurio video dem monstrativo o
O gr rfico de pizza, tam mbm con nhecido co omo grfico de seto ores ou grfico circu ular um diagrama circular o onde os val lores de ca ada catego oria estat stica repr resentada so proporcionais s s respectiv vas frequ ncias. Est te grfico pode vir a acompanha ado de su uas respec ctivas perc centagens. utilizad do para dados d qual litativos nominais. n Para P const truir um grfico tipo pizza neces ssrio dete erminar o ngulo do os setores s circulare es correspo ondentes contribu uio perc centual de cada valor no total.
Exem mplo 1.7.1: Uma em mpresa da a rea auto omobilstic ca acompa anha o nm mero de d defeitos encontrado os nos equ uipamentos enviados s para a c calibrao o. Na tabe ela a seguir apre esentamos os dad dos refere entes a um ms s de acom mpanhame ento dos defeitos d e encontrado os nos equ uipamento os das dive ersas rea as.
Centro de e custo Pr-usina agem T Tratamento trmico Fundi o Usinag gem Tr ratamento superficial Tota al
clique aqui i para efetuar o download d dos dados ut tilizados ness se exemplo
Com mo temos um total de e 89 defeit tos, o seto or circular de 360 se er equival lente a 89 9. Calculan ndo as propores, e encontramos os ngu ulos corres spondentes aos nmero de def feitos de cada c centro o de custo o. Com isso o, construi mos o segu uinte grfi ico de barras.
Tal e exemplo pode ser re ealizado ut tilizando o software Action. A Para a entender r como exe ecutar essa a funo do o Software e Action, v voc pode cons sultar: manua al do usurio