Escolar Documentos
Profissional Documentos
Cultura Documentos
Celso Francisco de Moraes (UNIFEI) celso1moraes@terra.com.br Joo Roberto Ferreira (UNIFEI) jorofe@unifei.edu.br Pedro Paulo Balestrassi (UNIFEI) pedro@unifei.edu.br
Resumo: Este artigo apresenta uma anlise crtica da utilizao de determinadas ferramentas da Qualidade e de alguns procedimentos em Engenharia de Produo, nos casos em que os dados estatsticos coletados no se apresentam normalmente distribudos. O problema geral, aqui identificado, diz respeito ocorrncia de decises questionveis, tomadas a partir da anlise de dados, considerados normais. A justificativa primordial para este estudo reside na relevncia da anlise dos dados durante sua coleta e tratamento em trabalhos cientficos, nos mais variados nveis. Os principais objetivos deste artigo so: apresentar alguns exemplos relacionados ao Controle Estatstico de Processo e Metodologia Seis Sigma que possam induzir as concluses duvidosas devido adoo incorreta de normalidade; propor reviso crtica efetuando as transformaes de Box-Cox e/ou Johnson; e, finalmente, discutir as concluses e decises estabelecidas, atravs da comparao entre os dados originalmente coletados e os dados transformados. Palavras-chave: Mtodos estatsticos; Dados no normais, Transformao de dados. Abstract: This paper presents a critical analysis regarding the use of specific quality tools and some methods applied to Production Engineering when the collected data are not normally distributed. The general problem refers to the occurrence of questionable decisions starting from the interpretation of data considered normally distributed. The primary justification for this study is the relevance of the data analysis during their collection and the handling of scientific works in the most varied levels. The main objectives of this paper are: to present some examples related to the Statistical Process Control and the Six Sigma Methodology, which may induce to doubtful conclusions due to the incorrect assumption of normality; to propose critical review proceedings to the Box-Cox and/or Johnson transformations; finally, to discuss the conclusions and decisions established through the comparison among the originally collected and the transformed data. Keywords: Statistical Methods; Non-normal Data; Data Transformation.
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
1. INTRODUO
XII SIMPEP Simpsio de Engenharia de Produo
A proposta deste artigo, em analisar a aplicao de alguns mtodos estatsticos, est inserida em um contexto mais amplo, que se refere ao Controle Estatstico da Qualidade e aos aspectos bsicos, que devem ser observados pelas organizaes que buscam a plena satisfao de seus clientes. Segundo Feigenbaum (1994) a Estatstica desempenha papel importante nos programas de Controle da Qualidade, pois ao longo dos anos suas tcnicas e metodologias tornaram-se cada vez mais amplamente utilizadas e aceitas nas organizaes. Na viso de Montgomery (1985) o objetivo primrio do Controle Estatstico da Qualidade a reduo sistemtica da variabilidade nas caractersticas-chave do produto, fornecendo as ferramentas necessrias para avaliao e melhoria de processos, produtos e servios de forma robusta e abrangente. Entretanto, tais ferramentas tambm, dependem da qualidade da informao e da forma como os dados so coletados, processados e interpretados. Por este motivo, de fundamental importncia o rigor metodolgico na coleta e tratamento dos dados. No desenvolvimento deste artigo, pretende-se analisar a utilizao de alguns mtodos estatsticos, tais como, os grficos de controle em Controle Estatstico de Processo e avaliao de desempenho na Metodologia Seis Sigma, com enfoque na correta interpretao dos dados coletados, especificamente no que se refere suposio de sua distribuio normal, com reviso crtica, atravs das transformaes propostas por Box & Cox (1964) e Yeo & Johnson (2000). As concluses e decises estabelecidas sero discutidas por meio de comparao entre os dados originalmente coletados e os dados transformados em distribuio normal.
2. RESUMO DOS MTODOS EM ANLISE 2.1. GRFICOS DE CONTROLE NO CONTROLE ESTATSTICO DE PROCESSO (CEP)
Com base na norma NBR ISO 9000:2000, define-se processo como um conjunto de atividades interrelacionadas ou interativas, que transformam insumos (entradas) em produtos (sadas). A Figura 1 exemplifica a situao esquemtica de um processo com suas entradas, seus fatores controlveis, seus fatores incontrolveis (rudos) e suas sadas.
Processo
... Z1 Z2 Zp
Y2 . . Yp
Fatores Incontrolveis
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
Controle Estatstico de Processo (CEP) pode ser definido como um conjunto de ferramentas que tem o propsito de indicar se um processo est funcionando de forma ideal, quando apenas causas comuns de variao esto presentes ou se este processo est desordenado e necessita de algum tipo de ao corretiva, ou seja, quando existem causas especiais de variao. De acordo com Montgomery & Runger (2003), o grfico de controle a mais poderosa ferramenta do CEP, pois evidencia a variao do processo em relao aos limites de controle estipulados. Segundo Alwan & Roberts, apud Toledo (2005) algumas suposies precisam ser satisfeitas para que, independentemente do tipo do grfico de controle utilizado, os resultados sejam vlidos: a) necessrio que as observaes sejam independentes e identicamente distribudas, ou seja, que as amostras sejam retiradas de forma aleatria e que o processo, que as gerou, esteja sob controle estatstico; b) As observaes devem seguir alguma distribuio de probabilidade especfica, tais como Normal, Binomial ou Poisson.
DPMO
(defeitos por milho de oportunidades)
Custo da no qualidade < 10 % das vendas 10-15 % das vendas 15-20 % das vendas 20-30 % das vendas 30-40 % das vendas -
Empresa no competitiva
Conforme norma NBR ISO 9000:2000, capacidade definida como a aptido de uma organizao, sistema ou processo de realizar um produto, que ir atender aos requisitos especificados para esse produto. Em termos estatsticos, a capacidade e o desempenho de um processo so representados por meio das 9
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
onde: CP = ndice de capabilidade potencial (processo centrado na mdia das especificaes) CPK = ndice de capabilidade real (processo no centrado na mdia das especificaes) PP = ndice de desempenho potencial (processo centrado na mdia dos dados) PPK = ndice de desempenho real (processo no centrado na mdia dos dados) LSE = limite superior de especificao LIE = limite inferior de especificao = mdia do processo S = desvio padro (amostra) = desvio-padro do processo (populao) Para Montgomery & Runger (2003), um processo com CPK = 2 referido como um processo Seis Sigma, pois a distncia a partir da mdia do processo at a especificao mais prxima, de seis desvios-padro. Se a mdia do processo se deslocar do centro por 1,5 desvio-padro, o CPK diminuir para 4,5/3 = 1,5. Considerando um processo distribudo normalmente, a frao no conforme do processo deslocado de 3,4 partes por milho. Assim sendo, a mdia de um processo Seis Sigma pode se deslocar de 1,5 desvio-padro, do centro das especificaes e ainda, manter uma frao no conforme de apenas 3,4 partes por milho. Boas aproximaes podem ser obtidas para determinao do nvel sigma, atravs da equao (5) (BALESTRASSI, 2004) e da equao (6) (BREYFOGLE, 2003, apud BALESTRASSI, 2004)
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
certamente se revelaro inadequadas. Na realidade, a existncia de no normalidade, em distribuio de dados, bastante comum, principalmente quando o nmero de observaes no muito grande. O Quadro 1 resume o que ocorre com a aplicao de alguns mtodos estatsticos, quando se assume incorretamente normalidade para dados que no apresentam distribuio normal. QUADRO 1 Conseqncias da suposio incorreta de normalidade Mtodo estatstico Controle Estatstico de Processo Seis Sigma Teste de Hipteses Anlise de Regresso Planejamento de Experimentos Conseqncia da no-normalidade Falsas causas especiais detectadas nos grficos de controle individuais Clculo incorreto do nvel sigma Concluses incorretas sobre diferenas entre grupos Identificao equivocada de fatores e erros em predies Concluses incorretas sobre importncia e efeito dos fatores
Tais fatos demonstram a importncia do rigor metodolgico na coleta e no tratamento dos dados, pois concluses e definies questionveis podem ocorrer devido incorreta suposio de aderncia distribuio normal. Para evitar este problema, necessrio efetuar o teste de normalidade dos dados, antes de se aplicar os procedimentos metodolgicos descritos. Um exemplo de anlise grfica, utilizando o software estatstico MiniTab, mostrado atravs da Figura 2. No teste de normalidade de Anderson-Darling, considera-se normal a distribuio que apresentar p-value maior que 0,05, o que significaria uma probabilidade maior que 5% em cometer erro, ao rejeitar a hiptese de normalidade da distribuio em anlise. Os dados referem-se ao tempo mdio de atendimento (em minutos) extrado diariamente, ao longo de um ano, em uma empresa fictcia de prestao de servios, denominada Gamma 220 Ltda. Neste caso, como p-value menor que 0,05, a distribuio no pode ser considerada normal. Summary for Gamma 220
0,0
2,4
4,8
7,2
9,6
12,0
Median
3,0
3,2
3,4
3,6
3,8
4,0
4,2
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
Juran & Gryna (1992) estabeleceram alguns critrios de anlise para abordagem dos dados, em caso de no aderncia distribuio normal:
a) Examinar os dados, para verificar se h alguma explicao no estatstica para o padro distribucional no convencional; b) Analisar os dados em termos de mdias, em vez de valores individuais, pois mdias de amostra seguem de perto uma distribuio de probabilidade normal, mesmo se a populao de valores individuais no distribuda normalmente (teorema central do limite); c) Utilizar como referncia outro tipo de distribuio, que se enquadre mais adequadamente ao conjunto de dados coletados; d) Efetuar transformao matemtica da caracterstica original, para uma nova caracterstica que se aproxime de uma distribuio normal.
Segundo Box & Cox (1964), esta transformao definida somente para variveis, com valores positivos (x > 0) e o parmetro , possivelmente um vetor, o elemento que define a transformao especfica e que, com freqncia, resulta em normalidade. Como a anlise de varincia no afetada por uma transformao linear, na prtica a equao (7) pode ser simplificada para a seguinte forma:
Para o conjunto de dados apresentado na Figura 2, foi efetuada aplicao da transformao de BoxCox, utilizando o software estatstico MiniTab . As caractersticas da transformao, com destaque para determinao do parmetro , estimado com 95% de confiana, so mostradas na Figura 3.
12
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
50
40
Lower CL Upper CL
30
Best Value
20
10
Limit
0 -2 -1 0 1 2 Lambda 3 4 5
FIGURA 3 Transformao de Box-Cox Aps transformao de Box-Cox, os dados obtidos podem ser bem representados por uma distribuio normal, visto que p-value = 0,476, ou seja, existe grande probabilidade de se cometer erro, ao rejeitar a hiptese de normalidade da distribuio obtida. A Figura 4 apresenta a anlise grfica da distribuio resultante da transformao.
Summary for Trasnf Gamma 220
Anderson-Darling Normality Test
A-Squared P-Value < Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rt Maximum 0,35 0,476
0,6
0,9
1,2
1,5
1,8
95% Confidence Interval for Mean 1,3462 1,3402 0,2625 1,4104 1,4240 0,3081 95% Confidence Interval for Median
FIGURA 4 Anlise dos dados transformados (Box-Cox) Para Box & Cox, (1964), aps a adequada transformao da varivel x para x(), pode-se presumir que os valores esperados das observaes transformadas apresentem as seguintes caractersticas: a) Sejam descritos por um modelo de estrutura simples;
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
Para o conjunto de dados apresentados na Figura 2, tambm foi efetuada aplicao da transformao de Yeo-Johnson, utilizando o software estatstico MiniTab . As caractersticas da transformao, com destaque para determinao da equao de transformao das variveis, so apresentadas na Figura 5. Aps transformao de Yeo-Johnson, os dados podem ser melhor representados por uma distribuio normal, visto que p-value = 0,950, ou seja, existe elevada probabilidade de se cometer erro, ao rejeitar a hiptese de normalidade da distribuio obtida. Johnson Transformation for Gamma 220
Probability Plot for Original Data 99,9 99 90 50 0,25 10 1 0,1 -5 0 5 10 Probability Plot for Transformed Data 99,9 99 90 50 10 1 0,1 -2 0 2 2
N AD P-Value 302 0,159 0,950 N AD P-Value 302 6,515 < 0,005
P-Value for Best Fit: 0,950434 Z for Best Fit: 0,32 Best Transformation Type: SB Transformation function equals 1,50964 + 1,05836 * Log((x + 0,177547)/(17,5569 - x))
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
UCL = 11,92 10
X = 3,96
LCL = -4,01
FIGURA 6 Grfico de controle para Gamma 220, considerando os dados normalmente distribudos. O grfico de controle individual obtido aps prvia transformao dos dados, utilizando a transformao de Box-Cox, mostrado na Figura 7. Os dados transformados com = 0,27 assumem uma forma de distribuio que pode ser considerada normal, pois no teste de Anderson-Darling, o parmetro p-value igual a 0,476. Neste caso, o grfico apresenta o mesmo comportamento do processo com os dados originais, porm, devido aos novos limites de controle, no h causas especiais de variao.
I Chart of Gamma 220 Using Box-Cox Transformation With Lambda = 0,27 2,25 2,00 1,75 1,50 1,25 1,00 0,75 0,50 1 30 60 90 120 150 180 Observation 210 240 270 300 LCL = 0,520 X = 1,378 UCL = 2,236
FIGURA 7 Grfico de controle para Gamma 220, com transformao de Box-Cox. Utilizando-se a transformao de Yeo-Johnson, os dados tambm assumem uma distribuio considerada normal, visto que no teste de Anderson-Darling, o parmetro p-value igual a 0,950. A anlise 16
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
do grfico de controle individual, aps a transformao de Yeo-Johnson, indica o mesmo comportamento do processo, em relao aos dados originais e, assim como nos dados transformados por Box-Cox, no se observam causas especiais de variao.
5. CONSIDERAES FINAIS
Atravs deste artigo, foi efetuada uma breve reviso bibliogrfica sobre alguns mtodos estatsticos aplicados gesto da qualidade, que podem ser afetados pela suposio inadequada de normalidade dos dados, em especial o Controle Estatstico de Processo e a Metodologia Seis Sigmas. Tambm foram apresentados alguns procedimentos de transformao, utilizados para ajustar os dados coletados em uma distribuio normal, de modo a evitar que concluses duvidosas sejam assumidas como verdadeiras. A anlise dos dados da empresa fictcia Gamma 220 Ltda, adotada como exemplo neste trabalho, indicou que, quando os mtodos estatsticos foram aplicados sem os cuidados necessrios de confirmao de aderncia distribuio normal, ocorreram equvocos na determinao das causas especiais de variao do processo e na avaliao do desempenho da empresa, ao longo do ano. Incorrees desta natureza podem prejudicar a compreenso dos cenrios para a tomada de decises e, at mesmo, comprometer o desdobramento de estratgias empresariais. As duas falsas causas especiais de variao, identificadas no processo, se corretamente monitoradas, poderiam estimular uma ao gerencial desnecessria que, muito provavelmente, no agregaria benefcios aos resultados da empresa Gamma 220 Ltda. Com relao definio incorreta do nvel sigma, vale ressaltar que a defasagem entre dados originais e dados transformados corresponde a uma diferena de 14540 defeitos por milho de oportunidades (com a transformao de Box-Cox) e 9037 defeitos por milho
A anlise do nvel sigma, calculado nas trs situaes apresentadas, indica grande disparidade entre os dados no transformados, isto , considerados normais e os dados adequadamente transformados por BoxCox ou Yeo-Johnson. O valor 4,47 obtido com os dados originais denota um desempenho de 1470 defeitos por milho de oportunidades (dpmo), ao passo que na realidade, devido no aderncia dos dados distribuio normal, este desempenho estaria melhor representado pelos valores 3,63 (16010 dpmo) ou 3,81 (10507 dpmo) de acordo com o tipo de transformao adotado.
Anlise crtica da aplicao de mtodos estatsticos em processos definidos por dados que no apresentam distribuio normal
de oportunidades (com a transformao de Yeo-Johnson). Tais quantidades so muito significativas, em termos de avaliao de capabilidade e desempenho. A evoluo desta pesquisa aponta para uma anlise crtica de outros casos onde efetivamente a premissa de normalidade dos dados seja inadequadamente assumida nos mtodos estatsticos abordados e, para trabalhos futuros, outros mtodos, tais como Planejamento de Experimentos, Teste de Hipteses e Anlise de Regresso, tambm podero ser analisados.
6. REFERNCIAS BIBLIOGRFICAS
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS NBR ISO 9000: Sistema de Gesto da Qualidade Fundamentos e Vocabulrio, Rio de Janeiro, 2000. ASTI VERA, A. Metodologia da Pesquisa Cientfica. Porto Alegre: Globo, 1973. BALESTRASSI, P.P. Metodologia Seis Sigma. Notas de Aula do Curso de Ps-Graduao em Engenharia de Produo. Universidade Federal de Itajub, 2004. BOX, G.E.P. and COX, D.R. An Analysis of Transformations. Journal of Royal Statistical Society. B, 39, 211-252, 1964. BREYFOGLE. F. Six Sigma Methods to Ensure Organizations Health. New York: Quality Progress, 45, 4, p.28-29, April 2003. FEIGENBAUM. A.V. Controle da Qualidade Total, vol. 3, Mtodos Estatsticos Aplicados Qualidade. 3 ed. So Paulo: Makron Books, 1994. GIL, A.C. Como Elaborar Projetos de Pesquisa. 3 ed. So Paulo: Atlas, 1991. HARRY, M.J. Six Sigma: A Breakthrough Strategy for Profitability. New York: Quality Progress, 31, 5, p.6064, May 1998. JURAN, J.M. e GRYNA, F.M. Controle da Qualidade Handbook, vol. 6, Mtodos Estatsticos Clssicos Aplicados Qualidade. 4 ed. So Paulo: Makron Books, 1992. KCHE, J.C. Fundamentos de Metodologia Cientfica. 7 ed. Caxias do Sul: Editora Vozes, 1984. Linderman, K., Schroeder,K.G. Zaheer, S., Choo, A.S., Six Sigma: A Goal-Theoretic Perspective. Journal of Operations Management, v.21, n.2, p.193-203, 2003. LIPSON, C. and SHETH, N.J. Statistical and Analysis of Engineering Experiments. New York: McGrawHill Book Company, 1973. MONTGOMERY, D.C. Introduction to Statistical Quality Control. New York: John Wiley & Sons, Inc, 1985. MONTGOMERY, D.C., RUNGER, G.C. Estatstica Aplicada e Probabilidade para Engenheiros. 2 ed. Rio de Janeiro: LTC, 2003. TOLEDO, T.P.A. Uma Investigao sobre ndices de Capabilidade com nfase na Metodologia Seis Sigma. Dissertao de Mestrado. Universidade Federal de Itajub, 2005. YEO, I.K., JOHNSON, R.A. A New Family of Power Transformation to Improve Normality or Symmetry. Biometrika, 87, 954-959, 2000.
18