Escolar Documentos
Profissional Documentos
Cultura Documentos
A FON S O
LOPES
E S T A T STICA A P LICA D A
e EX C ELN C I A E M G E S T O
CADERNO DE ATIVIDADES
ANVISA
INSTITUTO ADOLPHO LUTZ 11 a 15 de agosto de 2003
http://www.estatistica.eng.br Rua Voluntrios da Ptria, 474/701 - Humait endereo eletrnico: estatistica@estatistica.eng.br 22270-010 - Rio de Janeiro - RJ telefone: (21) 2539-7966 / fax: (21)2286-9877 / celular:(21) 9-627-0648
p. 1
A. Ementa
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. A Estatstica nas normas ABNT ISO/IEC. Introduo aos mtodos estatsticos para a tomada de deciso. Procedimentos para um estudo estatstico. Incio de um estudo: retirada de uma amostra. Estatstica Descritiva (E.D.): medidas de representatividade (tendncia central) e de disperso. Ainda E.D.: o z-escore. Inferncia Estatstica (I.E.): questo de confiana e risco de errar. Intervalo para a Estatstica Descritiva: apresentando os valores observados em uma tabela e em um grfico. Introduo s Probabilidades, a segunda ferramenta para a Inferncia. A primeira parte da I.E.: testes de hipteses. A segunda parte da I.E.: estimando parmetros da populao. Voltando Inferncia: comeando a estimar a mdia da populao a partir de uma amostra I.E., continuando a testar hipteses: um valor extremo, em relao ao seu conjunto, pode ser considerado vlido? (assunto tambm conhecido como "rejeio de dispersos"). I.E., teste de hipteses: repetitividade e reprodutibilidade. I.E., teste de hipteses: diagrama de Youden. I.E.: continuando a testar hipteses e usando tudo o que foi visto: os grficos de controle. Comeando na Matemtica e acabando na Inferncia Estatstica: descobrindo a "melhor" de todas as retas (chamam de "regresso linear "). Um outro olhar: Estatstica Robusta
C. Objetivo
Proporcionar ao pessoal do Instituto Adolpho Lutz o conhecimento dos conceitos estatsticos bsicos necessrios ao entendimento e interpretao dos requisitos especficos da norma ABNT ISO/IEC 17025: 2001, tornando-se -se capaz de compreender e analisar os resultados para uma correta tomada de deciso.
D. Metodologia
Exposio dialogada dar suporte aos debates, estudos de caso, vivncias e exerccios.
E. Bibliografia recomendada
ABNT ISO/IEC Guia 43-1: 1999, Ensaios de proficincia por comparaes interlaboratoriais Parte 1: Desenvolvimento e operao de programas de ensaio de proficincia. ABNT ISO/IEC Guia 43-2: 1999, Ensaios de proficincia por comparaes interlaboratoriais Parte 2: Seleo e uso de programas de ensaio de proficincia por organismos de credenciamento de laboratrios. ABNT ISO/IEC 17025: 2001, Requisitos gerais para competncia de laboratrios de ensaio e calibrao. LOPES, Paulo Afonso. Probabilidades e Estatstica conceitos, modelos, aplicaes em Excel. Rio de Janeiro: Reichmann&Affonso Editores, 3 reimpresso, 2003.
p. 2
incluso:
identificao do Colar Funo e estudo do seu potencial: Livro, p. 13 identificao da Ferramenta Anlise de Dados: Livro, p. 14 Ateno: aps digitar os dados, escolher uma clula diferente para os resultados
p. 3
2. 3. 4. 5.
Identificar as variveis mais importantes. Coletar os dados. Identificar o melhor modelo estatstico e utiliz-lo. Relatar as concluses de modo que todos entendam.
2. Tamanho da amostra: deve ser o maior que se puder conseguir. 3. O laboratrio deve informar qual o plano de amostragem para a retirada das amostras. 4. Dois tipos de amostragem: aleatria simples e sistemtica. 5. Cuidado: a amostra deve ser representativa da populao
MEDIANA amostral
s2 =
i=1 X i2
n
n 1
i=1 X i
n
DESVIO-PADRO amostral, s
EXCEL: Livro, p. 37, "Colar funo/DESVPAD"
5. Comentrios a respeito de clculos manuais, com a calculadora e com o Excel. 6. As medidas mais importantes da Estatstica Descritiva so: a mdia aritmtica e o desvio-padro. para alguns autores de lngua inglesa, tambm conhecido como RSD (relative standard deviation), desviopadro relativo. O CV razovel somente quando o desvio-padro estritamente proporcional mdia aritmtica; se o desviopadro constante em uma faixa extensa dos nveis da propriedade sendo observada, o CV , neste caso, ilusrio; outra desvantagem que seu valor no muito til quando a mdia prxima do valor zero. Paulo Afonso Lopes Instituto Adolfo Lutz/IAL, 11 a 15 de agosto de 2003
1
p. 4
Exemplo
A Norma NIT-DICLA-026, reviso 01, aprovada em AGO/01 afirma: 7.6.Documentos e Registros do Laboratrio 7.6.1 O laboratrio deve manter registros atualizados contendo os ensaios de proficincia em que participou, com as seguintes informaes, quando aplicveis: ......................................... e) critrio de aceitao dos resultados ou avaliao de desempenho (ex.: percentual mnimo exigido de acertos, Youden, z-score, etc.); f) resultados obtidos (satisfatrio/questionvel/insatisfatrio);
TODA AFIRMAO DEVE VIR ACOMPANHADA DE UM GRAU DE CERTEZA (ou confiana). Toda deciso tem um risco, que a probabilidade associada a uma deciso errada.
4. Nvel de significncia: nome de grife para o conhecido "erro". O nvel de significncia representado pela letra grega (usualmente expresso em porcentagem, (x100)%; complementar ao nvel de significncia, tem-se o nvel de confiana, representado por (1 - )x100%; indicam, respectivamente, probabilidades de erro e de certeza nas inferncias estatsticas.
p. 5
OBSERVAO IMPORTANTE: Quando se tem os dados originais, todos os clculos devem ser feitos com eles. A construo de tabelas, nos dias de hoje, tem o objetivo de facilitar a apresentao dos resultados, no sendo recomendada para clculos. Usar os valores da tabela era natural nos milnios passados, quando no existiam os modernos recursos computacionais.
conceito experimental: regularidade estatstica conceito clssico: intuitivo conceito axiomtico a) b) aps observar o experimento inmeras vezes, verifica-se o comportamento do fenmeno: para que repetir o experimento sempre que se quiser verificar o resultado? modelos matemticos a partir dos resultados da parte experimental.
OBSERVAO: para melhor compreenso pelas pessoas, as probabilidades devem ser expressas em porcentagens.
5.
p. 6
temperatura mdia de um forno ou comprimento mdio de um componente so desconhecidos, podendo ser necessrio estimar o valor desses parmetros. Na estimativa pontual, um valor numrico simples obtido como uma estimativa do parmetro da populao. Na estimativa por intervalo, um intervalo determinado tal que exista alguma probabilidade de que o verdadeiro valor do parmetro esteja contido nele. Estimativas por intervalos so tambm chamadas de intervalos de confiana. I - Estimativas Pontuais Uma estimativa pontual consiste de um valor numrico nico, usado para fazer uma inferncia sobre um parmetro desconhecido do processo, produto ou servio. Por exemplo, para estimar a mdia de uma populao, pode-se selecionar uma amostra de 100 elementos e calcular a mdia amostral; se este valor for 27, a estimativa pontual da mdia da populao , portanto, 27. II - Estimativas por Intervalo A idia do intervalo de confiana um refinamento da estimativa pontual. Nesta, afirmava-se que: valor do parmetro = valor da amostra Todavia, dificilmente o valor da amostra ser igual ao da populao, mais ainda porque este ltimo desconhecido. Desse modo, considera-se uma variao em torno do valor amostral e, assim, pode-se escrever que o parmetro se situa entre dois limites, ou seja valor do parmetro = valor da amostra "variao" Essa variao diretamente proporcional disperso da populao (quanto mais dispersa a populao, maior ser a variao entre as amostras) e confiana dos resultados (se se desejar um intervalo de confiana que contenha o verdadeiro valor do parmetro, este intervalo deve ser o maior possvel), mas inversamente proporcional ao tamanho da amostra (quanto maior a amostra, mais se aproxima da populao e a estimativa fica mais precisa, com menor variao). Quanto maior o intervalo de confiana, mais confiante se est de que o intervalo realmente conter o verdadeiro valor do parmetro. Por outro lado, quanto maior o intervalo, menos informao obtm-se para esse mesmo parmetro. Na situao desejvel, obtm-se um intervalo relativamente pequeno com uma confiana elevada. Para um tamanho fixo de amostra e para a mesma varincia, quanto maior o nvel de confiana, maior o intervalo de confiana. importante enfatizar que toda afirmao deve vir acompanhada de um grau de certeza (ou confiana), o quanto se est certo ao comunicar aquela informao. A interpretao desse enfoque a seguinte: se um grande nmero de intervalos de confiana forem construdos a partir de amostras independentes da mesma populao, ento espera-se que uma porcentagem desses intervalos contenha o valor verdadeiro do parmetro da populao. Por exemplo, ao desejar-se um intervalo de confiana de 90% para estimar a mdia de uma populao, uma amostra pode fornecer um intervalo entre (48,5, 51,5). Embora se desconhea o verdadeiro valor da mdia da populao, se 100 desses intervalos forem construdos a partir de 100 amostras, deve-se esperar que 90 desses intervalos contenham o verdadeiro valor da mdia da populao.
Entendendo realmente o conceito de intervalo de confiana
Algumas estimativas intervalares podem incluir e outras no o verdadeiro valor do parmetro da populao. Quando se retira uma amostra e se calcula um intervalo de confiana, no se sabe, realmente, se o parmetro da populao se encontra naquele intervalo calculado. O importante reconhecer que se est utilizando um mtodo com (1-)% de probabilidade de sucesso: em uma seqncia muito grande de repeties, (1-)% dos intervalos assim construdos abrangero o verdadeiro valor do parmetro da populao, embora no se saiba exatamente quanto ele valha.
p. 7
12. Voltando Inferncia: comeando a estimar a mdia da populao a partir de uma amostra
ts n
13. I.E., continuando a testar hipteses: um valor extremo, em relao ao seu conjunto, vlido (assunto tambm conhecido como "rejeio de dispersos")
Antes de se interpretar uma srie de resultados obtidos a partir de uma ou mais amostras, necessrio verificar a existncia de valores que, eventualmente, possam ser considerados como dispersos, ou seja, valores que muito provavelmente no pertenam ao mesmo conjunto de resultados. Uma ampla variedade de testes de estatstica tem sido sugerida para determinar se uma observao deve ser rejeitada; em todas essa, um intervalo estabelecido com uma determinada significncia estatstica. Infelizmente, no h um critrio uniforme que pode ser usado para decidir se um resultado suspeito pode ser devido a erro acidental ao invs de ser resultado de uma variao aleatria. A nica base confivel para rejeio ocorre quando se sabe que alguns erros especficos teriam sido cometidos na obteno de um resultado duvidoso. O importante usar o mesmo critrio ao longo de todo o trabalho. Freqentemente, um analista que conhece o desvio-padro dos resultados espera que um mtodo rejeitar um conjunto de pontos que estejam distantes 2s ou 2,5s da mdia, porque h, aproximadamente, uma chance em 20 (caso de 2s) ou 1 em 100 (caso de 2,5s) de que isto ocorrer . Existem vrias maneiras de verificar se um ou mais valores podem ser considerados dispersos, e os mais comuns so os seguintes testes: - Chauvenet; - Cochran; - Dixon, e - razo Q. I - Teste de CHAUVENET
PROCEDIMENTO: 1. 2. 3. 4. 5. 6. 7. Calcular a mdia aritmtica e o desvio-padro amostral dos valores. Identificar os valores extremos: maior valor e menor valor. Determinar, para cada um dos valores extremos, a diferena d entre ele e a mdia aritmtica. Calcular a relao
d s
Determinar o valor tabelado para o tamanho da amostra em estudo. Se a relao for menor que o valor tabelado, aceitar o ponto extremo; caso contrrio, elimin-lo da amostra. Eliminado o valor disperso, refazer a anlise com os valores restantes, at que todos os valores sejam considerados no dispersos. Tabela 1. Critrio de Chauvenet - valores crticos n |d|/s n |d|/s 10 1,96 20 2,24
n 5
|d|/s 1,65
n 40
|d|/s 2,50
p. 8
6 7 8 9
12 14 16 18
22 24 26 30
Exemplo
Sejam os seguintes valores: X1 = 858, 77 X7 = 1050,51 X13 = 936,85 X19 = 859,49 1) 2) 3) 4) 5) 6) X2 = 819,29 X8 = 996,85 X14 = 831,41 X20 = 1568,60 X3 = 777,37 X9 = 1097,35 X15 = 845,40 X4 = 724,51 X10 = 824,16 X16 = 812,86 X5 = 752,39 X11 = 1086,09 X17 = 842,69 X6 = 736,69 X12 = 1077,09 X18 = 986,83
a mdia aritmtica igual a 924,26 e o desvio-padro amostral 193,25 o maior valor 1568,60 e o menor valor 924,26 para o maior valor, d20 = 1568,60 - 924,26 = 644,34; para o menor valor, d24 = 724,51 - 924,26 = -199,75 para o maior valor, |d20|/s = |1568,60 - 924,26|/193,25 = 3,33; para o menor valor, |d4|/s = |724,51 924,26|/193,25 = 1,03. para a amostra de tamanho 20, o valor tabelado de |d|/s igual a 2,24. como 1,03 < 2,24, X4 permanece e como 3,33 > 2,24, elimina-se X20 .
II - Teste de COCHRAN Neste teste, comparam-se varincias, ou seja, verifica-se se a varincia dos resultados obtidos por um grupo excessiva em relao dos demais grupos, sendo um teste unilateral, isto , s verifica o maior valor. Para um conjunto de n inspetores, cada um com desvio-padro amostral si ( i = 1,2,...,n) todos calculados para o mesmo nmero n de observaes, o valor a calcular para o teste de Cochran dado por:
s2 max n s2 i i =1
Ccalculado =
onde: s2 = estimativa da varincia 2 s max = maior valor encontrado no conjunto como estimativa da varincia, no n = nmero de inspetores Se Ccalc< Ctab 5% , o valor no rejeitado Se Ctab 1% > Ccalc > Ctab 5% , o valor considerado suspeito ou estranho Se Ccalc > Ctab 1% , o valor considerado disperso Os valores crticos deste teste estatstico encontram-se no Anexo 1.
conjunto
III - Teste de DIXON Neste teste, comparam-se valores individuais obtidos por um operador ou valores mdios obtidos por vrios operadores, ou ainda diferenas entre dois resultados obtidas por vrios operadores. um teste bilateral, isto , so testados os valores mnimo e mximo.
p. 9
Para um conjunto de resultados Z(h), h = 1,2,....H, agrupados em ordem crescente, o Teste de Dixon utiliza o seguinte critrio: se o total de resultados estiver entre 3 e 7, Dcalc =
Os valores crticos deste teste estatstico encontram-se na Tabela 2. Se Dcalc< Dtab 5% , o valor no rejeitado Se Dtab 1% > Dcalc > Dtab 5% , o valor considerado suspeito ou estranho Se Dcalc > Dtab 1% , o valor considerado disperso IV - razo Q Comea-se a calcular a razo Q ordenando-se os dados de modo decrescente. A diferena entre o nmero suspeito e seu vizinho mais prximo dividida pela amplitude total; esta razo comparada com o valor tabelado de Q. Se for igual or maior que o valor tabelado, a observao suspeita pode ser rejeitada. Os valores tabelados de Q para 90%,95% e 99% de nvel de confiana so fornecidos na Tabela 2. Se Q excede o valor tabelado para um dado nmero de observaes e um nvel de significncia, a medio questionvel com, por exemplo, 95% de confiana. Tabela 2. Valores crticos de Q Nvel de confiana No. de observaes Q90 Q95 Q99 3 0,941 0,970 0,994 4 0,765 0,829 0,926 5 0,642 0,710 0,821 6 0,560 0,625 0,740 7 0,507 0,568 0,680 8 0,468 0,526 0,634 9 0,437 0,493 0,598 10 0,412 0,466 0,568 15 0,338 0,384 0,475 20 0,300 0,342 0,425 25 0,277 0,317 0,393 30 0,260 0,298 0,372
Exemplo: A preciso de um mtodo est sendo estabelecida, e os seguintes dados so obtidos: 22,23; 22,18; 22,25; 22.09 e 22,17%. A medio de 22.09% pode ser considerada vlida com 95% de nvel de confiana?
p. 10
laboratrio, por um mesmo operador e usando o mesmo equipamento em intervalos de tempo pequenos. O desvio padro do resultado de teste obtido sob condies de repetitividade denomina-se desvio padro de repetitividade. um parmetro de disperso da distribuio dos resultados de testes. Como o desvio padro de repetitividade, calcula-se o chamado valor de repetitividade r; a partir dos dois resultados de testes obtidos sob condies de repetitividade, calcula-se o mdulo da diferena entre eles. A probabilidade de que esta diferena seja menor do que o valor de repetitividade r igual a 95%. II - REPRODUTIBILIDADE (tambm conhecida como REPR) A Reprodutibilidade se refere a testes executados sob condies variadas, chamadas de condies de reprodutibilidade. Os resultados so obtidos com o mesmo mtodo de ensaio e material idntico, mas em laboratrios diferentes, com diferentes operadores e usando equipamentos diferentes, sendo os testes executados com grandes intervalos de tempo entre um e outro. O desvio padro do resultado de teste obtido sob condies de reprodutibilidade denomina-se desviopadro de reprodutibilidade. um parmetro de disperso da distribuio dos resultados de testes. Com o desvio padro de reprodutibilidade, calcula-se o chamado valor de reprodutibilidade R: a partir dos dois resultados de testes obtidos sob condies de reprodutibilidade, calcula-se o mdulo da diferena entre eles. A probabilidade de que esta diferena seja menor do que o valor de reprodutibilidade R igual a 95%.
Exemplo
Observe, agora, uma definio de reprodutibilidade, segundo a Norma XYZ4 de uma empresa avaliada: 6.7. Reprodutibilidade NORMA 1 - A diferena entre dois resultados individuais e independentes, obtidos por dois operadores, operando em laboratrios diferentes a partir de uma mesma amostra submetida ao ensaio, no deve ultrapassar ..... em valor absoluto. III - APLICAO DOS NDICES A repetitividade e a reprodutibilidade so dois valores extremos, sendo a repetitividade a mnima variabilidade entre resultados e a reprodutibilidade a mxima variabilidade entre resultados. A repetitividade representada pelo smbolo r e a reprodutibilidade pelo smbolo R. Convm enfatizar que tanto uma quanto outra tm unidades. Suponha-se que os ndices calculados tenham sido R= 0,03 e r= 0,02. Um laboratrio, efetuando duas repeties, obteve em um teste os valores 0,17 e 0,18. A diferena 0,01 aceitvel e as duas anlises so vlidas, porque essa diferena menor que r; caso se obtivesse 0,17 e 0,20, a diferena 0,03 inaceitvel, e um dos valores deve ser rejeitado; no havendo informaes mais especficas, a rejeio deve ser do valor mais afastado da mdia. Considere-se agora que o laboratrio 1 obteve 0,18 e o laboratrio 5 obteve 0,20. A diferena 0,02 inferior a R = 0,03 e os dois valores so aceitveis. No caso de ser necessrio rejeitar um resultado, este deve ser o mais disperso, como no caso da repetitividade. Convm relembrar que R e r so ndices intimamente ligados preciso de resultados de medies. importante, portanto, que esses ndices sejam expressos de modo correto para que no se perca de vista o significado fsico que deve ser associado a esses nmeros. O objetivo metrologicamente desejvel (porm difcil) reduzir os valores de R e r, necessitando maior controle em todo o processo. Deve haver esforo para reduzir os erros em cada um dos laboratrios, em cada repetio e tambm em cada amostra. Como o processo lento, deve-se considerar os ndices R e r como ndices dinmicos, sujeitos a reavaliaes e revises. Nas fases iniciais do processo, pode haver muita instabilidade, mas ao longo do tempo espera-se que diminua.
p. 11
preciso cuidado com um ndice com valor muito pequeno, o qual pode cair em descrdito por ser muito difcil a sua reproduo. lgico, portanto, iniciar a utilizao desses ndices com valores maiores (toleram-se variaes em faixa ampla de valores) que possam ir sendo reduzidos.
Exemplo
4.2. Elipse de Confiana Os resultados obtidos pelos laboratrios participantes, relativos ao par de amostras A e B permitiram a construo de diagramas de disperso elaborados em um sistema de eixos cartesianos, onde a escala do eixo X cobre a faixa de resultados referentes amostra A e
Paulo Afonso Lopes Instituto Adolfo Lutz/IAL, 11 a 15 de agosto de 2003
p. 12
do eixo Y, a faixa de resultados da amostra B. Para cada uma das propriedades (ensaios) foi construdo um diagrama em que cada laboratrio representado por um ponto. A abcissa do ponto o resultado de ensaio da amostra A e a ordenada, o resultado de ensaio da amostra B. As retas que passam pelos valores mdios de todos os laboratrios dividem o diagrama em quadrantes. Numa situao ideal os pontos devem se encontrar igualmente distribudos pelos quadrantes; isto acontece somente quando ocorrem erros aleatrios em nveis no significativos, Quando os pontos se encontram mais concentrados nos quadrantes superior direito e inferior esquerdo, significando que os laboratrios tendem a obter valores maiores do que a mdia para as duas amostras ou valores menores do que a mdia para ambas amostras do par, isto evidencia ocorrncia de erros sistemticos. A Elipse de Confiana delimita uma regio em que qualquer ponto tem a mesma probabilidade P de se situar dentro da elipse. A construo da elipse foi feita utilizando um programa de computador que determina a elipse e a eliminao sucessiva dos pontos dispersos adotando um grau de confiana de 95%. Os tipos de erros que podem ocorrer so funo da posio do ponto em relao elipse e esto representados na Figura 1. Erros sistemticos ocorrem devido a condies adversas do laboratrio, podendo ter origem em modificaes no permitidas na metodologia e/ou equipamentos no calibrados. Erros aleatrios ocorrem devido variabilidade dentro do laboratrio podendo ter origem em operador no devidamente treinado e/ou erros ocasionais como: erro de leitura, erro de clculo, erro em transcrio de dados, etc.
p. 13
Exemplo
5.1. Resduo Peneira de Abertura 75/m (%) De acordo com a NBR XYZ2 o resultado expresso em porcentagem de massa calculado at os dcimos. Tabela 5 LABORATRIO AMOSTRA A AMOSTRA B F 1 1,1 1,2 O 2 1,2 1,4 O 3 1,2 1,4 O 4 1,7 1,6 O 5 1,5 1,8 O 6 1,2 1,3 O 7 1,0 1,0 O 8 1,4 1,6 O 9 1,3 1,4 O 10 0,6 0,7 O 11 1,2 1,1 O 16 1,4 1,6 O 13 2,0 2,0 O 14 1,8 2,1 O 15 1,5 1,6 O 12 2,3 2,7 * 20 0,6 1,2 * Mdia Geral 1,34 1,45 Desvio Padro 0,3418 0,3701
Numero de Observaes da Elipse: 15 Numero de Observaes Total: 17 o - Laboratrios includos no calculo da elipse de 95% de confiana e se encontram dentro dela. * - Laboratrios excludos da elipse de 95% de confiana. Laboratrios 12 - Erro sistemtico significativo. Verificar metodologia, calibrao de equipamento, condies ambientais. Laboratrios 20 - Erro aleatrio. Verificar operador, erro de leitura, de clculo, de transcrio. O erro ocorreu na amostra A. Paulo Afonso Lopes Instituto Adolfo Lutz/IAL, 11 a 15 de agosto de 2003
p. 14
17. Comeando na Matemtica e acabando na Inferncia: descobrindo a melhor de todas as retas (chamam de "regresso linear")
1. REGRESSO: compreende a anlise de dados amostrais para saber se e como duas ou mais variveis esto relacionadas uma com a outra na populao. No implica, necessariamente, em relao de causa e efeito. 2. REGRESSO LINEAR (Livro, p. 130)
O modelo matemtico: y = + x+ denomina-se resduo ou erro aleatrio e tem os seguintes pressupostos: ? varivel aleatria com distribuio de deMoivre-Laplace-Gauss, mdia zero e desvio-padro constante ? corresponde a observaes independentes e no correlacionadas elementos bsicos: ? variveis: dependente (Y), ou explicada, e independente (X), ou explicativa, esta podendo ser qualitativa ou quantitativa ? equao ? parmetros: so as grandezas das relaes (coeficientes) ? termo aleatrio ou de erro mtodo dos mnimos quadrados EXCEL: Livro, p. 134, "Colar Funo"/INCLINAO e INTERCEPO
p. 15
p. 16
c) z para mtodos clssicos = (valor do laboratrio - mdia)/desvio-padro d) z-escore entre laboratrios = (valor S do laboratrio - mdia dos S)/amplitude interquartlica normalizada dos S, onde S = (valor da 1 medida + valor da 2 medida)/ 2 e) z-escore dentro do laboratrio = (valor D do laboratrio - mdia dos D)/amplitude interquartlica normalizada dos D, onde D = (valor da 1 medida - valor da 2 medida)/ 2 f) grfico de Youden para escores z robustos: grfico retangular de pares de escores z robustos, no qual cada laboratrio representado por um X; a abcissa o valor z da 1 medida e a ordenada o valor z da 2 medida); apresenta-se, usualmente, uma elipse com 5% de probabilidade, onde as amplitudes interquartlicas normalizadas para todas as medidas so calculadas com todos os valores e usadas como desvio-padro, e os coeficientes de correlao so calculados aps eliminarem-se os dispersos na avaliao z. Denomina-se disperso na avaliao z quando ao menos um mdulo de um escore z maior que 3. g) grfico de Youden para valores encontrados: grfico retangular de pares de valores, no qual cada laboratrio representado por um X; a abcissa o valor da 1 medida e a ordenada o valor da 2 medida); apresenta-se, usualmente, uma elipse com 5% de probabilidade, onde as amplitudes interquartlicas normalizadas para todas as medidas so calculadas com todos os valores e usadas como desvio-padro, e os coeficientes de correlao so calculados aps eliminarem-se os dispersos na avaliao Y. Denomina-se disperso na avaliao Y quando laboratrio est fora da elipse de 5% de probabilidade. Como o NIQR calculado? A partir de todos os (Q3 - Q1) de todos os laboratrios, determina-se a mdia e o dp deles. Ento o NIQR = ([Q3-Q1] - mdia )/dp EXEMPLO NUMRICO do relatrio APLAC Considere os seguintes extratos de resultados para uma determinada caracterstica de um conjunto de 63 laboratrios. Cada laboratrio fez duas medidas, X e Y.: escore z Mdia Avaliao LAB aritmtica robusta clssica robusta X Y X Y X Y Entre Dentro Z Y 1 0,1510 0,4027 -0,660 -0,471 -0,522 -0,283 -0,867 0,000 ... ... ... ... ... ... ... ... ... ... ... 63 0,1610 0,3633 0,660 -3,562 0,273 -2,749 -2,891 4,033 * * (*) disperso segundo este critrio Os resultados apresentados foram os seguintes: Para X: nmero de resultados = 63 mediana = 0,1560 amplitude interquartlica normalizada (AIN) = 0,0076 Mdia = 0,1576 Desvio-padro = 0,0126 Coeficiente de correlao = 0,4035 t x AIN/ n = 0,0019 Para Y: nmero de resultados = 63 mediana = 0,4087 amplitude interquartlica normalizada (AIN) = 0,0127 Mdia = 0,4072 Desvio-padro = 0,0160 Coeficiente de correlao t x AIN/ n = 0,0033 Perguntas: a) para o conjunto de medidas X e Y, indique como foram determinados o nmero de resultados a mediana a amplitude interquartlica normalizada (AIN) a mdia o desvio-padro
Paulo Afonso Lopes Instituto Adolfo Lutz/IAL, 11 a 15 de agosto de 2003
p. 17
b) para o Laboratrio 1, indique como foram calculados os valores em negrito Mdia escore z LAB aritmtica robusta clssica robusta X Y X Y X Y Entre Dentro 1 0,1510 0,4027 -0,660 -0,471 -0,522 -0,283 -0,867 0,000
Avaliao Z Y
c) para o Laboratrio 63, indique como foi decidida a eliminao dele pelos dois critrios de avaliao escore z Mdia Avaliao LAB aritmtica robusta clssica robusta X Y X Y X Y Entre Dentro Z Y 63 0,1610 0,3633 0,660 -3,562 0,273 -2,749 -2,891 4,033 * * Aps eliminarem-se dispersos na avaliao z, encontrou-se: Para X: nmero de resultados = 57 mediana = 0,1560 amplitude interquartlica normalizada (AIN) = 0,0067 Mdia = 0,1563 Desvio-padro = 0,0069 Coeficiente de correlao = 0,3093 t x DP/ n = 0,0018 Para Y: nmero de resultados = 57 mediana = 0,4103 amplitude interquartlica normalizada (AIN) = 0,0114 Mdia = 0,4087 Desvio-padro = 0,0116 Coeficiente de correlao t x DP/ n = 0,0030
BIBLIOGRAFIA
LOPES, Paulo Afonso, Probabilidades e Estatstica Reichmann&Affonso Editores, 1999.
p. 18
p. 19
Anexo 2 - VALORES CRTICOS PARA O TESTE DE DIXON H 5% 1% 3 0,970 0,994 4 0,820 0,926 5 0,710 0,821 6 0,628 0,740 7 0,569 0,680 8 0,608 0,717 9 0,564 0,672 10 0,530 0,635 11 0,502 0,605 12 0,479 0,579 13 0,611 0,697 14 0,586 0,670 15 0,565 0,647 16 0,546 0,627 17 0,529 0,610 18 0,514 0,594 19 0,501 0,580 20 0,489 0,567 21 0,478 0,555 22 0,468 0,544 23 0,459 0,535 24 0,451 0,526 25 0,443 0,517 26 0,436 0,510 27 0,429 0,502 28 0,423 0,495 29 0,417 0,489 30 0,412 0,483