Você está na página 1de 8
Six Sigma A normalidade em fungao do arredondamento e baixa discriminagao dos dados. r | | Normalmente nés gostariamos que a maioria dos dados que coletamos e analisamos em projetos seguissem a chamada distribuigao normal (curva de sino ou curva de Gauss). Na verdade, na maioria das andlises e cdlculos da inferéncia estatistica, dependemos ou assumimos que os dados se ajustem bem as caracteristicas desse modelo. Isso é 0 que cha- mamos de “suposigiio de normalidade” 12 - Revista Banas Qualidade - Maio de 2014 Six Sigma Por Gilberto Strafacci Neto suposigao de normalidade & aquela, segunda a qual assumi- ‘mos que um conjunto de dados segue uma distribuigo normal por ndo termos evidéncias suficientes para descartar essa, Dessa forma, seguimos com os cilculos da inferéncia estatistica {que assumem esse modelo de curva para a explicagao da populagio. Alguns testes e andlises importantes dependem dessa suposigdo: Cartas de controle para dados continuos, teste t para uma ou duas amostras, teste Z, estu- dos de capacidade, etc Felizmente a coisa nao é sempre assim. ‘Temos que lembrar que, de acordo com ‘Teorema do Limite Central , quando os da- dos sao continuos ¢ 0 tamanho da amostra émaior do que 30 ,a normalidade nao & ‘um pré-requisito fundamental para o teste t de uma amostra ou teste Z: nesses casos, independentemente do resultado dos valo- res individuais, assumimos que a média da populagao iri se distribuir normalmente. Além disso, alguns testes sio tio robus- tos que a normalidade nao é um problema: Por exemplo, se realizarmos um teste t de duas amostras no Minitab ele ira requerer apenas 15 valores por amostra. Se o tama- nho da amostra for de pelo menos 15, a normalidade nao é um problema e o teste é preciso mesmo com dados nao normais. Isso porque os testes foram modificados no software para ajustar esses desvios de normalidade. O teste t de uma amostra para menos de 20 dados, também sera bastante robusto. Entaio, quando a normalidade se torna ‘um problema? Quando, apesar do Teorema do Limite Central e dos ajustes do Minitab citados acima, seguir mos com valores de 1P<0,05 no teste de Anderson-Darling, esses casos, temos as seguintes opgaes que podem ocorrer: 1. Os dados esto com baixa discrimina- ‘¢20 ou arredondamento 2. Os dados precisam de ajustes e sto passiveis de transformacao 3. Os dados realmente nao sio normais (anormais ou outra distribuigo) Nesse artigo, tratarei somente das questies relacionadas ao arredondamento e baixa discriminagao trazendo o compara- tivo com relacio aos testes de normalidade. Posteriormente tratarei de transformagies de testes ndo parameétricos, De formas bem simples: A baixa discri- minagio dos instrumentos de medigao ¢ os arredondamentos tendem a discretizar seu conjunto de dados. Isso afeta a condigio de normalidade de forma bastante importante. grau de arredondamento ¢ definido como (Resolugdo da Medigao) / Desvio Pa- dro), onde a resolucdo éa menor mudanga que um sistema de medigdo pode detectar, também chamada de discriminacio. ‘Todas as medigoes sio arredondamentos uma vez que enxergamos nosso mundo através de instrumentos de medigao ¢ eles possuiem sempre certo nivel de preciso ou discriminagao, Na maioria dos casos isso passa de forma despercebida, mas é um fato que devemos nos atentar: Qual a precisio tipica para a medigdo da altura das pessoas? Normalmente a precisio é de centi- metros 0 que possibilita diferenciarmos uma pessoa da outra em termos de altu- ra. Com certeza isso ajuda os fabricantes de roupas, acessérios e diversos segmen- tos, Mas imagine se a precisao da nossa altura fosse de decimetros ou metros. Como ficaria a anélise? Para exemplificar, temos 0 exemplo de dois conjuntos de dados: Altura Arredon- dada e Altura Bem Arredondada, Para n=300, com precisio de centimetro, ‘vemos que os dados apresentam uma distri- buigdo minimamente continua e que 0 valor de p>0,05 0 que denota Normalidade para o teste de Anderson-Darling. Maio de 2014 - Revista Banas Qualidade - 13 Six Sigma Relatorio Resumo para Altura Arredondada “ese enorme de aceon ting AQundrdo 040 Vaoep ae wa Lex Grafico de Probabilidade de Altura Arredondada Normal Percentual Boia aS ae? a0 ‘Altura Arredondada Se pegarmos essas mesmas 300 pessoas e levarmos para um planeta onde. preciso da trena é em decimetros (menor discriminagao) teremos um resultado bastante diferente. (Os dados aparecem de forma mais discreta e o resultado da normalidade é p<0,05 para 6 teste de Anderson-Darling. 14- Revista Banas Qualidade - Maio de 2014 Six Sigma Relatério Resumo para Altura Bem Arredondada ‘este enema e nderce-Dring AQudrde nae Vaorp «005 wea 1.60 | Deva ed Vatira 0017 comers 00831 Gree” a2sm1 a Legian 45000 Masons” 70 Secure! 000 seine” 20000 Tiara de 95 de Conan pars Mba ae Sane eM ae a ase sen _ yy 78 Ine de Conan pu eae ‘me ae ned Conan pus ead [| _ ams uur Normal Percentual on . 13 ise 7s aso ‘Altura Bem Arredondada Dessa forma, jé fica claro a importancia de avaliarmos na nossa base de dados os arredondamentos e sempre que possivel uma avaliacao sobre o sistema de medigao. De acordo com o Manual AIAG MSA 4° Edigdo, existem certas regras que devem ser obedecidas e é importante que sejam avaliadas no momento da medicio. Maio de 2014 - Revista Banas Qualidade - 15, Six Sigma Como o foco deste texto € discutira normalidade, deixo para o letor a consulta a esse manual. E importante pereebemos que a altura das pessoas nao variou de um exemplo para outro, Sao os mesmos dados vistos de forma diferente com menos precisio. Alguns testes de normalidade rejeitam um percentual ‘muito elevado devido 20 arredondamento (Anderson -Darling ¢ Kolmogorov Smirnov) ,enquanto outros ignoram esse arredonda- ‘mento (Ryan- Joiner). Quando realizamos teste de normalidade de Ryan-Joiner para a Altura Bem Arredondada vemos que p>0,05. sso significa que esse test fa ajustes com re- lagao ao arredondamento, O que nao ocorre para o teste Kolmogorov-Smirnov. Grafico de Probabilidade de Altura Bem Arredondada Normal Percentual 13044 45 46 a7, Méde 1698 ° DenvPad 0.1083 " 200 1000 ye 490k Altura Bem Arredondada Percentual sy a3 a4 as a6) 17 Média 1638 e Dena 01083 % aan Vitor? <0010 ves 20 at ‘Altura Bom Arredondada 16 - Revista Banas Qualidade - Maio de 2014 Six Sigma Dessa forma, ¢ importante entender- de normalidade da populagio. Esse teste & mos cada teste: semelhante ao teste de normalidade de Sha- piro-Wilk. Considera o arredondamento. Teste de Anderson-Darling Este teste compara a fungio de distri- Teste de normalidade de buigdo acumulada empirica de seus dados_- Kolmogorov-Smirnov amostrais com a distribuigdo esperada se os _Este teste compara a fungio de distri- dados fossem normais. Se essa diferenca ob-buigdo acumulada empirica de seus dados servada for suficientemente grande, o teste _amostrais com a distribuigao esperada se rejeitard a hipétese nula de normalidade das dados fossem normais. Se essa diferenga populacio, Nao considera arredondamento. _observada for suficientemente grande, teste rejeitard a hipétese mula de normalida- ‘Teste de normalidade de Ryan-Joiner de da populacao. Este teste avalia a normalidade calculan- do a correlagao entre seus dados eos esco- Com isso, surgem duas perguntas: Qual res normais de seus dados. Seo coeficiente 0 teste mais adequado e se todos os de correlagao é proximo a 1, é provavel que _ testes tem a mesma capacidade de detectar a populacio seja normal. A estatistica de —_distribuigdes nao normais. Ryan-Joiner avalia a resistencia dessa cor- Para essa andlise, criarei um conjunto de relagdo; se ela recair abaixo do valor critico 300 pontos chamado Dados Anormais e adequado, vocé rejeitara a hipotese nula_farei a anilise através dos trés testes. Relatorio Resumo para Dados Anormais ‘Teste de normalidade de Anderson-Daring AQuedrado 1216 Valorp —_<0.005 Média Lae Deswad 13265 Varisncia 1.7596 Asimetia 185046 ‘Gurtose 491779 N 300 ‘Minimo 60021 Yo. Quart 04374 Medians 1.0153 3oQuarsl 20052 Misimo 84071 Titervale de 95% de Conflanca para Média 1s ST Intervalo de 95% de Confanga para Medians osm L1Ss6 Intervalo de 95% de Confanga para DesvPad ee Intervalos de 95% de Confianga sua H+ wocwa| | + w a ae Maio de 2014 - Revista Banas Qualidade - 17, Six Sigma Grafico de Probabilidade de Dados Anormais Normal © | | Média . DeevPad 1327 99° e « N \? AD a Valor-P <0,005 90. 80 3 on & ol 8 a0, gt 20 10 5 af ° oa’ 2 ° 2 4 6 8 Dados Anormais Grafico de Probabilidade de Dados Anormais Normal 999 Médio oo te DewPad 1327 Rn 3s Volor-P_<0010 90, 20. 33 50 co He 20. 10, s| 1 oa _—— 4 a 18 - Revista Banas Qualidade - Maio de 2014 Six Sigma Grafico de Probabilidade de Dados Anormais Normal 2 ° A 4 Dados Anormais Os trés testes foram capazes de detectar a nao normalidade dos dados. Dessa forma, € importante entendermos que o estudo da normalidade dos dados ¢ pré-requisito para ‘uma série de outras andlises. Além disso, presenta uma série de regras e de comporta- mentos tipicos que podem ser estudados. Nesse artigo, tratamos da comparagio enire tipos de teste e também do efeito do arredondamento nos resultados. Esteja atendo a discriminagao do instru- mento de medigio, faga previamente a andlise do sistema de medigio, escolha o teste correto ce aproveite o estudo de normalidade para, cconhecer mais o que esta ocorrendo em seu. processo, No préximo artigo trataremos dos emai casos que jd foram citados. Referéncias Bibliograficas SE Arnold (1990). Mathematical Statistics Prentice-Hall DG, Bonett (2006). “Approximate Confidence Interval for Standard Deviation of Nonnormal Distributions," Computational Statistics & Data Analysis, 50, 775-782 DG. Bonett (2006). "Robust Confidence hnter- vals for a Ratio of Standard Deviations,” Applied a " | | Média . DeovPad 4427 4327 300, xs oaa Valor-P <0010 Psychological Measurements, 30, 432-439 M.B. Brown e A.B. Forsythe (1974). "Robust Tests forthe Equality of Variances,” Journal ofthe American Statistical Association, 69, 364-367. G. Casella e RL. Berger (1990). Statistical Ine rence, Duxbury Press, p. 421 H.WLitliefore(1962)"On the Kolmogorov Snir nov Test for Normality withMean and Variance Unknow,” Journal ofthe American Staistial Assocation, 62, 399-402. CA. Ryan, te BL. Joiner (1976). “Normal Pro babilty Plots and Tests for Normality," Technical Report, Statistics Department, The Pennsylvania State University (Dispontvel na Minitab inc. )® Gilberto Strafacci ~ gstrafacci@setecnet.com. br - Engenheiro Mecaico e mestrando em Engenharia Mecanica com énfase automo: tiva pela Escola Politécnica da Universidade de Sao Paulo e Master Black Belt pelo Sete Consulting Group. Consultor de Lean Seis Sigma e Instrutor de diversos treinamentos nas dreas da Qualidade ¢ Produtividade. Responséivel pelo desenvolvimento dos trei- namentos de GDE&T na Setec e especialista em trabalhos de mapeamento das processos, cronoandlise e reducao de desperdicias. Maio de 2014 - Revista Banas Qualidade - 19

Você também pode gostar