Você está na página 1de 56

Introduo Estatstica aplicada Qumica Marilena Meira

1. INTRODUO

A medida experimental de uma quantidade fsica est sempre sujeita a uma certa incerteza. Mesmo que a quantidade fsica seja medida repetidas vezes pela mesma pessoa e utilizando o mesmo instrumento, ainda assim, os resultados obtidos nas sucessivas medidas diferiro, em extenso maior ou menor, do valor verdadeiro, e tambm entre si. Isto inteiramente vlido para os resultados em anlise quantitativa. 1.1. ALGARISMOS SIGNIFICATIVOS Algarismos significativos so todos os algarismos do valor de uma medida dos quais se tem certeza mais o ltimo algarismo que estimado, ou seja, o algarismo duvidoso. O nmero de algarismos significativos expressa a incerteza de uma medida. Na apresentao numrica de um resultado experimental todos os algarismos devem ser conhecidos com certeza, exceto o ltimo que ser o duvidoso. A menos que se estipule diferentemente, considera-se que na expresso numrica de uma medida, o ltimo algarismo apresenta uma incerteza de 1. Por exemplo, o resultado de uma pesagem igual a 8,16 g no significa exatamente este valor, mas, um valor situado na faixa de 8,16 0,01 g. Algarismo mais significativo: o algarismo no nulo mais esquerda. Algarismo menos significativo: No havendo vrgula o algarismo no nulo mais direita. Havendo vrgula, o algarismo mais direita, mesmo sendo zero. Entre os algarismos mais e menos significativos, todos so significativos.

1.2. REGRAS DE ARREDONDAMENTO A Tabela 1 apresenta as regras de arredondamentos de valores estabelecidas pelo Sistema Internacional de Unidades (SI). sugerido que o arredondamento seja aplicado nos resultados finais, ou seja, na apresentao dos resultados, assim minimizando o possvel erro de arredondamento. No arredondamento de fatores intermedirios conveniente reter um dgito a mais que o necessrio e somente arredondar o resultado final incerteza requerida. Tabela 1. Regras de Arredondamento CONDIES O algarismo retirado > 5 PROCEDIMENTOS permanecer unidade. O algarismo retirado < 5 O algarismo retirado = 5 O algarismo a permanecer 23,34 passa a 23,3. fica inalterado. I) Se ao 5 seguir em 2,352 passa a 2,4 qualquer algarismo zero, casa diferente um 25,6501 passa a 25,7 de 76,250002 passa a 76,3 uma de uma EXEMPLOS

Aumenta-se o algarismo a 63,27 passa a 63,3.

aumenta-se

unidade no algarismo a permanecer. II) Se o 5 for o ltimo 54,75 passa a 54,8 algarismo ou se ao 5 s 54,65 passa a 54,6 seguirem zeros, o ltimo 54,7500 passa a 54,8 algarismo conservado aumentado a s de ser 54,6500 passa a 54,6 ser uma

unidade se for mpar.

1.3. PROPAGAO DAS INCERTEZAS NOS CLCULOS Os clculos de resultados de trabalhos experimentais base de certo nmero de quantidades numricas devem levar em conta as repercusses dos algarismos significativos dos dados individuais na realizao do clculo e na expresso do resultado final. O resultado final no pode ser expresso com mais algarismos significativos do que o justificado pelas incertezas dos dados individuais. A maneira como tais incertezas se propagam ao resultado final depende da natureza das operaes matemticas. As seguintes regras so aplicadas: O resultado de uma multiplicao ou diviso no deve conter mais algarismos significativos do que o nmero com menos algarismos significativos que entrar na operao. O resultado de uma soma ou subtrao deve conter tantas casas decimais quantas apresenta o componente com menor nmero de casas decimais.

1.3. EXATIDO E PRECISO O desenvolvimento de mtodo e sua validao constituem etapas extremamente relevantes na rea de anlises qumicas. A etapa de validao de um mtodo consiste na avaliao de diversos critrios, tais como, seletividade, linearidade, grfico analtico, sensibilidade, limites de deteco e quantificao, exatido e preciso. Estes dois ltimos critrios so considerados os mais relevantes porque permitem estimar os erros e as variaes dos resultados analticos. No processamento de uma anlise quantitativa so envolvidos sempre trs elementos, a saber: a amostra, o instrumento utilizado e o analista. Se a anlise em questo for medidas repetidas vezes, com o mesmo instrumento e pelo mesmo analista, os resultados obtidos nas sucessivas medidas diferiro em extenso maior ou menor do valor verdadeiro e tambm entre si. As medidas esto sujeitas a certa incerteza e o analista se defronta com o problema de definir o melhor. Estes resultados podem ser apreciados sob dois diferentes aspectos, a

exatido e a preciso. A exatido pode ser estimada pelo clculo do erro absoluto e relativo e a preciso pelas medidas de disperso, como desvio-padro e varincia. A Exatido indica a fidelidade da medida, isto , o grau de concordncia do valor encontrado experimentalmente com o valor verdadeiro. A exatido proporcional diferena entre um valor observado e o valor verdadeiro. A verificao da exatido de resultados necessria quando um novo mtodo proposto, quando so introduzidas modificaes no procedimento ou quando um novo equipamento esta sendo testado. Os principais meios de verificar a exatido dos resultados analticos so atravs do uso de amostras padres ou atravs da comparao dos resultados com aqueles obtidos com um mtodo j conhecido. Em ambos casos deve-se tratar estatisticamente os resultados. A Preciso indica o grau de concordncia dos resultados individuais dentro de uma srie de medidas. Quanto mais prximos entre si, os valores estiverem, maior a preciso. A preciso costuma ser expressa como repetitividade, preciso intermediria ou reprodutividade A repetitividade constitui a preciso estudada no mesmo laboratrio sob as mesmas condies e em pequeno intervalo de tempo (mesmo dia, mesmo analista e mesmo equipamento). Em outras palavras, o grau de concordncia entre os resultados de medies sucessivas de um mesmo mensurando efetuadas sob as mesmas condies de medio. Estas condies so denominadas condies de repetitividade que incluem: mesmo procedimento de medio; mesmo analista; mesmo instrumento, utilizado nas mesmas condies; mesmo local; repetio em curto perodo de tempo. A Repetitividade pode ser expressa, quantitativamente, em funo das caractersticas da disperso dos resultados. A preciso intermediria expressa pela variao entre resultados obtidos em dias diferentes pelo mesmo laboratrio. Reprodutibilidade (de resultados de medio): Grau de concordncia entre os resultados das medies de um mesmo mensurando efetuadas sob condies variadas de medio. Para que uma expresso da reprodutibilidade seja vlida necessrio que as condies alteradas sejam especificadas. As condies alteradas podem incluir:

mtodo, instrumento de medio, analista, padro de referncia, condies de utilizao, local e tempo. A Reprodutibilidade pode ser expressa, quantitativamente, em funo das caractersticas da disperso dos resultados. Reprodutibilidade estudada geralmente entre diferentes laboratrios, em diversas localidades do mundo, utilizando o mesmo conjunto de amostras.

1.4. ERRO ABSOLUTO Denomina-se erro absoluto diferena entre o valor observado e o valor verdadeiro. Conseqentemente o erro absoluto de uma medida s poder ser avaliado quando se conhece o correspondente valor verdadeiro. Este quase sempre desconhecido e geralmente o valor adotado como verdadeiro tambm encontrado experimentalmente e tambm sujeito considervel incerteza. O erro uma medida inversa da exatido. Ou seja, quanto menor o erro, maior a exatido da medida. 1.5. TIPOS DE ERROS 1.5.1. Erros Determinados: So devidos a causas definidas, que se repetem sistematicamente ocasionando resultados persistentemente mais altos ou mais baixos do que o valor verdadeiro. A causa de um erro determinado pode ser localizada e, portanto eliminada. So exemplos de erros determinados: a) Erros de Mtodos: Solubilidade do precipitado na anlise gravimtrica, higroscopicidade de um resduo a ser pesado. b) Erros operacionais: So relacionados com a capacidade tcnica do analista. Ocorrem sempre que a correta tcnica analtica no obedecida. Exemplos: Perdas mecnicas do material no processo analtico, calcinao de resduo em temperaturas imprprias, erros de clculo, uso de uma concentrao errnea de uma soluo padro titulante, etc.

c) Erros instrumentais: So relacionados com imperfeies e limitaes dos equipamentos (aparelhos, utenslios e inclusive reagentes). Exemplos: Buretas, pipetas e bales mal calibrados; ataque de recipientes de vidro durante as anlises, etc. 1.5.2. Erros indeterminados: So erros que refletem a incerteza do mtodo empregado. Mesmo que uma medio seja repetida vrias vezes, com o maior cuidado por uma mesma pessoa, em condies de trabalho uniformes, ainda assim, os valores no so idnticos. Eles diferem entre si e se situam dentro de uma faixa de disperso. As diferenas entre os valores revelam a presena de erros indeterminados. So as estimativas feitas pelo observador da medida. Exemplos: Localizao do nvel nos aparelhos volumtricos, interpolao nas leituras de uma balana, leitura da posio da agulha sobre a escala fixa de um medidor, etc. Denomina-se desvio de uma medida diferena entre o valor observado e a mdia aritmtica das medidas.

EXERCCIOS 1) Assinale os algarismos mais e menos significativos nas seguintes medidas: a) 0,0854 g) 36 b) 5,60 h) 360,0 c) 3600 i) 3,600 d) 0,80 j) 1000,0 e) 18,460 l) 1000 f) 280 m) 6,36

2) Efetuar as seguintes operaes levando em conta os algarismos significativos: a) 0,0002 x 1,3328 = b) 3,15 x 5,6 = c) 18,36 x 3600 = d) 0,4000 x 2,302 = e) 6,502 + 3,41 + 25,231= f) 18,21 (25,41 + 0,42 + 0,029 + 15) = g) 2,31(600,49 - 15,3)/ 3,2 = h) 300,4956(27,9 2,379 + 1,5349) = i) 130,0 x 56 =

3) Na figura a seguir esto representados os resultados de quatro sries de medidas de uma mesma medida, obtidos com diferentes mtodos. Em cada srie definir a preciso e exatido dos mtodos usados se baixa ou alta, justificando a resposta e verificar os tipos de erros encontrados:

Valor verdadeiro Mtodo I Mtodo II Mtodo III Mtodo IV 8,0 9,0 10,0 11,0 12,0

4) Complete: a) Os erros determinados afetam a ........................ (preciso ou exatido). Os resultados se ..................................................................................................(se afastam do valor verdadeiro no mesmo sentido ou se distribuem em torno do valor verdadeiro) b) Os erros indeterminados so ...........................................( acidentais ou sistemticos) e afetam a ..................................(preciso ou exatido). Os resultados obtidos se afastam do valor verdadeiro no mesmo sentido ou se distribuem em torno do valor verdadeiro).

2. NOES BSICAS DE ESTATSTICA

2.1. MEDIDAS DE TENDNCIA CENTRAL Quando trabalhamos com variveis quantitativas com grande nmero de observaes necessitamos de parmetros para descrever sucintamente o comportamento desse conjunto de informaes. Para isso, utilizamos as medidas de tendncia central que expressam onde tende a se concentrar um conjunto de dados numricos. O conhecimento das propriedades das medidas de tendncia central fundamental para descrio, interpretao e anlise de dados numricos. 2.1.1 Mdia a medida de tendncia central mais utilizada e melhor compreendida, mas, nem sempre a mais adequada para representar um conjunto de dados numricos. A mdia influenciada por valores extremos. S deve ser utilizada quando a distribuio dos dados for simtrica (normal ou Gaussiana). O clculo da mdia feito pelo somatrio (representado aqui pela letra grega sigma ) dos valores de todas as observaes (indivduos), dividido pelo nmero de observaes (n), conforme a frmula abaixo.

X =

xi
n

Para dados classificados: X =

xi.fi
n

2.1.2. Mediana Esta a segunda medida de tendncia central mais utilizada. Para encontrar a mediana os dados devem ser colocados em ordem crescente ou decrescente. Quando

o nmero de observaes for impar a mediana valor central, que divide o conjunto de informaes em duas partes iguais. Quando o nmero de observaes for par, existiro dois valores centrais. Somamos esses dois valores centrais e dividimos por dois, para obter o valor da mediana. A mediana no levada em considerao na maior parte dos testes estatsticos. Encontra uso especialmente para distribuies assimtricas. No entanto, tambm pode ser utilizada para dados com distribuio simtrica. .A grande vantagem da mediana em relao mdia que ela no sofre influncia de valores extremos. Exemplo com nmero impar de observaes: Seja a seguinte srie de 9 observaes: 1,2 ; 1,3; 1,4; 1,5; 1,6; 1;7; 1,8; 1,9; 2,0; O valor central 1,6, sendo portanto, a mediana da srie. Exemplo com nmero par de observaes: Seja a seguinte srie de 6 observaes: 4287; 4298; 4300; 4320; 4330; 4340. Os dois valores centrais so 4300 e 3420. A mediana o valor mdio entre o dois, ou seja, 4310.

2.1.3. Moda A moda pouco utilizada como medida de tendncia central. A moda serve para demonstrar qual valor o mais freqente, ou seja, o que mais se repete, em um conjunto de dados. Algumas vezes, a distribuio de um conjunto de dados pode no ter moda, caso as observaes sejam todas diferentes entre si nesse conjunto de dados. Ou, a moda pode apresentar-se mais do que uma vez em outras. Sempre que uma distribuio for perfeitamente simtrica, o valor da moda tambm ser igual ao da mdia e ao da mediana.

EXERCCIOS: 1) Encontrar a mdia, a mediana e a moda dos dados abaixo referentes a um conjunto de resultados de anlises da concentrao de oxignio de um determinado rio em funo do ms. Ms Janeiro Fevereiro Maro Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro [O2] (mg/l) 7,0 8,0 7,0 5,0 7,0 5,0 4,0 3,0 1,0 7,0 6,0 7,0

2) Encontre a mdia e mediana dos valores a seguir referentes a concentraes de chumbo em galena em 6 lotes deste minrio: a) 90,3%, 90,7%, 80,5%, 85,8%, 87,6%, 75,6% 2.2. DADOS AMOSTRAIS

2.2.1. Dados Brutos So aqueles valores a que se chegou pela simples coleta, sem qualquer preocupao quanto sua ordenao.

Exemplo de dados brutos: Relao dos dados de anlise de teor de ferro em um minrio em 50 lotes (%) 58; 34; 56; 34; 24; 34; 26; 14;19; 22; 34; 53; 45; 23; 11; 25; 34; 34;38; 12; 23; 34; 32; 37; 31; 27; 46; 37;29; 16; 56; 23; 10; 54; 11; 46; 46; 38;17; 32; 43; 12; 26; 57; 21; 66; 56; 24;49; 42; Pela observao dos dados, verifica-se que os valores esto dispostos de forma desordenada. Em razo disso, pouca informao se consegue obter por inspeo dos dados. Mesmo uma informao to simples como a de saber os teores mximo e mnimo requer um certo exame dos dados da tabela. 2.2.2. Rol Consiste na ordenao dos valores em ordem crescente: 10; 11; 11; 12; 12; 14; 16; 17; 19; 21; 22; 23; 23; 23; 24; 24; 25; 26; 26; 27; 29; 31; 32; 32; 34; 34; 34; 34; 34; 34; 34; 37; 37; 38; 38; 42; 43; 45; 46; 46; 46; 49; 53; 54; 56; 56; 56; 57; 58; 66;

O Rol proporciona algumas vantagens em relao com relao aos dados brutos: possvel visualizar de forma ampla as variaes entre os valores; os valores extremos so percebidos de imediato e possvel observar uma tendncia de concentrao dos valores. No entanto, apesar de o rol propiciar ao analista mais informaes e com menos esforo de concentrao do que os dados brutos, ainda assim persiste o problema de a anlise ter que se basear nas 50 observaes e o problema tende a se agravar com maior nmero de

observaes.

2.2.3. Distribuio de freqncias Uma distribuio de freqncia uma coleo de dados obtidos a partir de uma srie de medidas em que os dados so organizados por intervalos de freqncia ou classes e exibem o nmero de porcentagem de observaes em cada classe. A distribuio de freqncia pode ser apresentada sob forma grfica ou tabular. As tabelas de freqncias podem representar tanto valores individuais como valores agrupados em classes. Para representar os intervalos de classes usam-se os smbolos: 0 ---| 10 : a classe compreende valores de 0, exclusive, at 10, inclusive 0 --- 10: a classe compreende valores de 0, exclusive, at 10, exclusive 0 |---| 10: a classe compreende valores de 0, inclusive, at 10, inclusive Desta maneira, a tabela de freqncia abaixo representa os mesmos dados do rol anterior. Verifica-se que possvel observar de imediato a classe de valores com maior
freqncia.

Tabela de freqncia: Teor de Ferro 10 |---20 20 |---30 30 |---40 40 |---50 50|--- 60 60 |--- 70 Freqncia 9 12 14 7 7 1

Uma determinada classe pode ser identificada por seus extremos ou pela ordem em que ela se encontra na tabela. Na tabela acima a classe de maior freqncia a classe 30 |---40 ou terceira classe.

2.2.4. Elementos de uma distribuio de freqncia a) Freqncia Simples Absoluta de uma classe ou de um valor individual (fi): o nmero de observaes correspondentes a essa classe ou a esse valor. b) Freqncia Simples Relativa (fri ou fri%): Representa a proporo de observaes de um valor individual ou de uma classe, em relao ao nmero total de observaes. c) Freqncia Absoluta Acumulada (Fi): a soma da freqncia simples absoluta dessa classe ou desse valor com as freqncias simples absolutas das classes ou dos valores anteriores. d) Amplitude Total: (At ou intervalo total): a diferena entre o maior e o menor valor observado da varivel em estudo. e) Classe: cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da varivel. f) Limites de Classe: Os limites de classes so seus valores extremos ou seja, o limite inferior e o superior da classe. g) Amplitude do intervalo de Classe (h): o comprimento da classe, sendo geralmente definida como a diferena entre os imites superior e inferior. h) Ponto Mdio de Classe (xi): o ponto eqidistante dos limites de classe. Para obter o ponto mdio de uma classe, basta acrescentar ao seu limite inferior a metade da amplitude do intervalo de classe.

2.2.5. Representao Grfica de uma Distribuio de Freqncia O histograma a representao grfica de uma distribuio de freqncia. um grfico formado por um conjunto de retngulos justapostos. Cada retngulo tem como base, o seu intervalo de classe e a rea de cada retngulo proporcional freqncia da classe que ele representa. A soma dos valores correspondentes s reas dos retngulos ser sempre igual freqncia total. Para se construir um histograma encontra-se a altura de cada retngulo dividindo-se sua rea (freqncia) pela respectiva base (intervalo de classe).

EXERCCIOS: 1) A partir dos dados abaixo, referentes a uma distribuio de freqncia do controle de qualidade de um fitoterpico, construa o histograma em papel milimetrado. Identifique todos os elementos da distribuio de freqncia: a) Freqncia Simples de cada classe; b) Freqncia Simples Relativa (fri ou fri%) de cada classe; c) Freqncia Absoluta Acumulada (Fi); d) Amplitude Total: (At ou intervalo total); e) As classe e seus limites; f) Amplitude do intervalo de cada classe (h); g) Ponto Mdio de cada classe (xi). Concentrao do Composto bioativo (ppm)
6 |---8 8 |---10 10 |---12 12 |---14 14 |---16 16 |---18 18 |---20 20 |---22

Freqncia 241 809 1034 464 159 26 14 3

Altura de cada retngulo no histograma 120,5 404,5 517,0 232,0 79,5 13,0 7,0 1,5

2) O rol de resultados a seguir refere-se s percentagens de prata em 50 lotes de um determinado minrio. Construa um histograma em papel milimetrado, separando os dados em intervalos de 1%. A seguir encontre a moda, mdia e mediana. 12,12 10,36 10,40 9,76 9,93 8,31 9,84 10,26 9,77 7,14 10,25 11,02 12,62 8,39 8,81 10,77 9,13 9,60 10,02 11,40 6,21 8,68 8,91 10,24 8,25 9,65 9,78 10,38 11,53 7,95 9,37 11,75 11,40 9,63 10,90 11,18 10,61 8,74 10,62 8,71 12,27 9,19 11,36 9,35 11,76 9,32 11,97 13,84 7,51 10,56

2.2.6. Tipos de Histogramas: a) Histograma simtrico, tipo distribuio Normal: Possui a forma de sino, sendo a freqncia mais alta no centro e decresce gradualmente para as caudas de maneira simtrica. A mdia e a mediana so aproximadamente iguais e localizam-se no centro do histograma.
90 80 70 60 50 40 30 20 10 0

b) Histograma assimtrico e com apenas um pico: Possui calda mais longa em um dos lados, isto porque a freqncia decresce bruscamente em um dos lados e de forma gradual no outro. Quando a assimetria direita a mediana inferior a mdia e o contrrio se verifica quando a assimetria esquerda. Exemplo: Em processos industriais com apenas um limite de especificao, o processo controlado para satisfazer esta especificao.

90 80 70 60 50 40 30 20 10 0

c) Histograma do tipo despenhadeiro: Termina abruptamente de um ou dos dois lados. Exemplo: Processos industriais atendendo a um ou dois limites de especificaes.

90 80 70 60 50 40 30 20 10 0

90 80 70 60 50 40 30 20 10 0

d) Histograma com dois picos: Neste caso pode ter havido mistura de dados com mdias diferentes obtidos em duas condies distintas. Exemplo: dois tipos de matrias primas, dois mtodos, duas mquinas ou dois operadores.

100 80 60 40 20 0

e) Histograma do tipo plat: As classes centrais possuem aproximadamente a mesma frequncia. Possvel mistura de vrias distribuies com mdias diferentes.

80 70 60 50 40 30 20 10 0

f) Histograma com uma pequena ilha isolada: Algumas faixas de valores ficam isoladas da grande maioria dos dados, gerando barras ou pequenos agrupamentos separados. Possvel ocorrncia de anormalidades temporrias no processo produzindo alguns resultados muito diferentes dos demais ou devido a erros de medio, de registro ou transcrio dos dados.

100 80 60 40 20 0

2.3. MEDIDAS DE DISPERSO 2.3.1. Conceitos de Populao e Amostra Populao ou Universo: o conjunto de indivduos, objetos ou dados de observao. Amostra um conjunto de elementos selecionados da populao. Se esses objetos so selecionados de tal maneira que cada objeto tem a mesma chance de ser selecionado do que o outro, temos uma amostra aleatria. Duas distribuies de freqncia, embora com a mesma mdia, podem ter uma flutuao de valores muito diversa em torno dessa mdia. A caracterizao desse fato feita por meio da disperso. As medidas de disperso mais usadas so:

2.3.2. Varincia (2) Corresponde soma dos quadrados dos desvios de todas as observaes, relativamente mdia, dividida pelo nmero de observaes. Como a varincia envolve a soma de quadrados, a unidade em que se exprime no a mesma que a dos dados.. 2 =

(xi - )2
n

2.3.3. Desvio-padro () Corresponde raiz quadrada da varincia, possuindo assim as mesmas unidades que os dados. S pode assumir valores no negativos e quanto maior for, maior ser a disperso dos dados.. Quanto maior o desvio padro, maior a variabilidade entre os dados. a medida de disperso mais geralmente empregada, pois leva em considerao a totalidade dos valores da varivel em estudo. =

(xi - )2
n

Se o valor da mdia da populao ou mdia verdadeira desconhecida, ento no poderemos calcular o desvio padro nem a varincia. No entanto, poderemos substituir os parmetros da populao pelos seus valores estimados a partir dos seus equivalentes amostrais; isto , X para e s para o desvio-padro . Neste caso, substituindo o divisor n por n-1 e as frmulas da varincia e desvio padro ficaro como a seguir

s2 =

(xi - X )2
n 1

s=

(xi n1

X)

Para dados classificados a frmula do desvio padro :

s=

(xi -

X )2. fi n-1

2.3.4. Coeficiente de Variao de Pearson CVP: a razo entre o desvio padro e a mdia, referentes a dados de uma mesma srie. CVP = ( / ) x 100 para a populao Ou CVP = (s / X ) x 100 para a amostra

2.3.5. Amplitude total a nica medida de disperso que no tem a mdia como ponto de referncia. Corresponde diferena entre o maior e o menor valor observado. 2.3.6. Desvio Mdio a mdia aritmtica dos desvios individuais tomados sem considerao do sinal (em mdulo). x1 - X n

EXERCCIOS 1) Calcule a mdia e o desvio padro dos valores a seguir referentes a anlises de colesterol (mg/100g) em contra-fil cru sem gordura em 10 peas deste alimento: 907,82 800,56 988,90 768,76 876,90 769,90 906,78 879,09 876,76 768,98

2) Encontrar a mdia, o desvio padro, a amplitude e a mediana dos dados a seguir referentes ao teor de impurezas em um produto medido em 120 bateladas produzidas por uma fbrica. FAIXA 1,11 a 1,20 1,21 a 1,30 1,31 a 1,40 1,41 a 1,50 1,51 a 1,60 1,61 a 1,70 1,71 a 1,80 1,81 a 1,90 1,91 a 2,00 2,01 a 2,10 2,11 a 2,20 FREQNCIA 1 4 17 28 25 18 13 6 5 2 1

3. DISTRIBUIO NORMAL

Vimos que um histograma uma representao grfica da distribuio de freqncias, composto por retngulos justapostos em que a base de cada um deles corresponde ao intervalo de classe, sendo a altura proporcional freqncia. Quando o nmero de dados tende ao infinito e o intervalo de classe tende a zero, o histograma simtrico de uma distribuio de freqncia, tender a assumir um aspecto de sino. Esta curva denominada Curva de Gauss ou Curva de Distribuio Normal.

Freqncias

I Intervalos de classes

Na Curva de Gauss, o eixo de simetria dado pela mdia e a amplitude da distribuio definida pelo desvio padro (). Geometricamente, o desvio padro a distncia do ponto de inflexo de qualquer um dos ramos da curva ao eixo vertical que passa pelo centro. O valor de f(x) mximo quando x = e cai simetricamente dos dois lados aproximando-se da abscissa nas duas direes, sem jamais toc-la. O valor de f(x) no se torna igual a zero para nenhum valor de x, mas, torna-se praticamente negligencivel quando x se afasta grandemente da mdia. A funo densidade de probabilidade da distribuio normal com mdia e desvio padro dada por:

f(x) =

1 2

exp[

(x )2 2 2

Onde: : constante matemtica ( 3,14159). exp: funo exponencial exp(y) = ey. e: constante matemtica ( 2,71828). : mdia da distribuio. : desvio-padro da distribuio.

A distribuio simtrica em relao mdia e os valores de mdia, moda e mediana so iguais. A rea total sob a curva igual a 1, ou 100%, com 50% dos valores distribudos esquerda da mdia e 50% sua direita. A rea sob a curva pode ser entendida como uma medida de sua probabilidade. Ou seja, a probabilidade de ocorrer um evento entre x=- e x=+ igual a 1 ou 100%.

x=-

x=+

A probabilidade (ou freqncia relativa) com que a varivel x toma um valor entre a e b dada pela rea abaixo da curva limitada pelas verticais que passam por aqueles valores (a e b).

Para a distribuio Normal, a proporo de valores caindo no intervalo de um, dois, ou trs desvios padro da mdia so: Entre 1 2 3 igual a: 68,26% 95,44% 99,74%

A anlise da curva normal permite a concluir o que se verifica na prtica com os valores observados: as ocorrncias tendem a concentrar-se em torno de uma mdia e se tornam mais raras ou com menos probabilidade de ocorrncia medida que dela se afastam.

EXERCCIOS

1) Considere as distribuies a seguir: a) Qual a distribuio que apresenta o menor desvio padro? b) Qual a distribuio que apresenta o maior desvio padro? c) Qual o valor da mdia de cada distribuio?

3.1. DISTRIBUIO NORMAL REDUZIDA

Se a varivel x tem distribuio normal, pode ser transformada para uma forma padro ou reduzida, denominada Z, subtraindo-se sua mdia e dividindo-se pelo seu desvio padro: Z = ( x - )

Na Distribuio Normal Reduzida a mdia i g ual a 0 ( = 0) e o desvio padro i gu al a 1 ( = 1). A s probabilidades da Distribuio Normal Reduzida j foram calculadas e so apresentadas em tabelas de fcil utilizao. Como a distribuio simtrica, a probabilidade de um intervalo qualquer da metade esquerda igual probabilidade do intervalo equivalente na metade direita. Por isso, as tabelas apresentam somente as probabilidades da metade direita da curva. Na normal reduzida P(0,z) = p enquanto P(> z) = 0,5 p.

Ento, se forem tomados dois valores especficos, pode-se determinar a proporo de rea sob a curva entre esses dois valores. Para a distribuio Normal, a proporo de valores caindo no intervalo de um,

dois, ou trs desvios padro da mdia so: Entre 1 2 3 igual a: 68,26% 95,44% 99,74%

3.1.1. USO DA TABELA DA DISTRIBUIO NORMAL REDUZIDA PARA OBTER AS REAS OU PROBABILIDADE A tabela d a probabilidade de ocorrncia de um evento entre 0 e z. Na margem esquerda temos o valor de z com uma decimal e, se necessitamos considerar a segunda decimal devemos encontr-la na margem superior. obtemos as probabilidades. Exemplo 1: Para calcular a probabilidade de z entre 0 e 1, procuramos na margem esquerda a linha que tem z = 1,0 e a coluna 0,00 e encontramos o valor 0,3413. Isto significa que a probabilidade de encontrar um valor de x entre a mdia zero e z=1,0 0,3413 ou 34,13%. Exemplo 2: Para se obter a probabilidade de z entre 0 e 1,87, procuramos a clula cuja linha 1,8 e coluna 0,07 o que resulta o valor 0,4693 ou 46,93%. Para se obter a probabilidade de z maior que 1, calculamos a probabilidade de z entre 0 e 1 que 0,3413 e a seguir fazemos 0,5-0,3413 = 0,1587 ou 15,87%. No interior

CURVA NORMAL REDUZIDA (p = rea entre 0 e z)


Segunda casa decimal z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 0.00 0.0000 0.0398 0.0793 0.1179 0.1554 0.1915 0.2257 0.2580 0.2881 0.3159 0.3413 0.3643 0.3849 0.4032 0.4192 0.4332 0.4452 0.4554 0.4641 0.4713 0.4772 0.4821 0.4861 0.4893 0.4918 0.4938 0.4953 0.4965 0.4974 0.4981 0.4987 0.01 0.0040 0.0438 0.0832 0.1217 0.1591 0.1950 0.2291 0.2611 0.2910 0.3186 0.3438 0.3665 0.3869 0.4049 0.4207 0.4345 0.4463 0.4564 0.4649 0.4719 0.4778 0.4826 0.4864 0.4896 0.4920 0.4940 0.4955 0.4966 0.4975 0.4982 0.4987 0.02 0.0080 0.0478 0.0871 0.1255 0.1628 0.1985 0.2324 0.2642 0.2939 0.3212 0.3461 0.3686 0.3888 0.4066 0.4222 0.4357 0.4474 0.4573 0.4656 0.4726 0.4783 0.4830 0.4868 0.4898 0.4922 0.4941 0.4956 0.4967 0.4976 0.4982 0.4987 0.03 0.0120 0.0517 0.0910 0.1293 0.1664 0.2019 0.2357 0.2673 0.2967 0.3238 0.3485 0.3708 0.3907 0.4082 0.4236 0.4370 0.4484 0.4582 0.4664 0.4732 0.4788 0.4834 0.4871 0.4901 0.4925 0.4943 0.4957 0.4968 0.4977 0.4983 0.4988 0.04 0.0160 0.0557 0.0948 0.1331 0.1700 0.2054 0.2389 0.2704 0.2995 0.3264 0.3508 0.3729 0.3925 0.4099 0.4251 0.4382 0.4495 0.4591 0.4671 0.4738 0.4793 0.4838 0.4875 0.4904 0.4927 0.4945 0.4959 0.4969 0.4977 0.4984 0.4988 0.05 0.0199 0.0596 0.0987 0.1368 0.1736 0.2088 0.2422 0.2734 0.3023 0.3289 0.3531 0.3749 0.3944 0.4115 0.4265 0.4394 0.4505 0.4599 0.4678 0.4744 0.4798 0.4842 0.4878 0.4906 0.4929 0.4946 0.4960 0.4970 0.4978 0.4984 0.4989 0.06 0.0239 0.0636 0.1026 0.1406 0.1772 0.2123 0.2454 0.2764 0.3051 0.3315 0.3554 0.3770 0.3962 0.4131 0.4279 0.4406 0.4515 0.4608 0.4686 0.4750 0.4803 0.4846 0.4881 0.4909 0.4931 0.4948 0.4961 0.4971 0.4979 0.4985 0.4989 0.07 0.0279 0.0675 0.1064 0.1443 0.1808 0.2157 0.2486 0.2794 0.3078 0.3340 0.3577 0.3790 0.3980 0.4147 0.4292 0.4418 0.4525 0.4616 0.4693 0.4756 0.4808 0.4850 0.4884 0.4911 0.4932 0.4949 0.4962 0.4972 0.4979 0.4985 0.4989 0.08 0.0319 0.0714 0.1103 0.1480 0.1844 0.2190 0.2517 0.2823 0.3106 0.3365 0.3599 0.3810 0.3997 0.4162 0.4306 0.4429 0.4535 0.4625 0.4699 0.4761 0.4812 0.4854 0.4887 0.4913 0.4934 0.4951 0.4963 0.4973 0.4980 0.4986 0.4990 0.09 0.0359 0.0753 0.1141 0.1517 0.1879 0.2224 0.2549 0.2852 0.3133 0.3389 0.3621 0.3830 0.4015 0.4177 0.4319 0.4441 0.4545 0.4633 0.4706 0.4767 0.4817 0.4857 0.4890 0.4916 0.4936 0.4952 0.4964 0.4974 0.4981 0.4986 0.4990

EXERCCIOS 1) Considere o esboo abaixo de distribuio normal com mdia 20 e desvio padro 5.

10

15

20

25

30

a) Assinale no grfico a probabilidade de que x esteja entre 10 e 30. b) Calcule com o auxlio da curva normal reduzida a probabilidade de que x esteja entre 10 e 30. c) Calcule com o auxlio da curva normal reduzida a probabilidade de que x esteja entre 15 e 25. 2) Uma distribuio norma tem mdia 10 e desvio padro 1,3. Qual a probabilidade de que um valor esteja entre 12,4 e 11,8? 3) Qual deve ser o desvio padro do teor de matria ativa em um inibidor de corroso, sabendo que a faixa especfica com 95% de certeza de 61-69? 4) Sabendo-se que a mdia de uma srie de resultados de anlise de nitrato em esgoto de 3,55 e o desvio padro 0,10, qual a probabilidade de se encontrar valores entre: a) 3,55 0,10 b) 3,55 0,20 c) 3,55 0,30

4. ESTIMATIVA

4.1. DISTRIBUIO DE X COMO AMOSTRA DE UMA POPULAO NORMAL Considere uma populao tendo uma mdia e um desvio-padro . Faa

X representar a mdia de n observaes aleatrias independentes desta populao.


No estudo de uma populao possvel considerar vrias amostras. Ento, cada amostra fornecer uma diferente estimativa ( X ) da mdia paramtrica () e uma diferente estimativa (s) do desvio padro paramtrico (). As diversas estimativas se distribuiro tambm em torno da mdia paramtrica, tal como acontecia com os valores individuais. A distribuio amostral X tende distribuio normal com mdia e desvio-padro da mdia, ou erro padro igual ao desvio padro de uma observao, dividido pela raiz quadrada do nmero de observaes: X = n O desvio padro da

mdia considerado um ndice de preciso da mdia e diminui quando o tamanho da amostra aumenta. A distribuio de amostragem da mdia mais se aproxima da distribuio normal quando o nmero de observaes aumenta. Na prtica, a distribuio de amostragem da mdia pode se considerada como normal sempre que o nmero de dados for maior que 30 (n 30). A varivel aleatria com distribuio normal padro, Z, dada agora por:

Z=

4.2. DISTRIBUIO DE STUDENT Quando a mdia da populao, , no conhecida, implica geralmente em no se conhecer o desvio-padro . Conseqentemente, o desvio-padro da mdia, X , no pode ser calculado. Uma maneira de contornar este problema, substituir os parmetros da populao pelos seus valores estimados a partir dos seus equivalentes amostrais; isto , X para e s para o desvio-padro .

O termo

ser trocado por:

X . s n

William Sealey Gosset que trabalhava sob o pseudnimo de Student, props chamar este novo termo de t, para no confundir com o Z, que se refere a Dsitribuio Normal Reduzida. Desta forma, o termo fica:

t=

X s n

O conjunto dos valores de t forma uma nova populao normalmente distribuda no caso de amostras grandes. Quando o nmero de observaes pequeno, a varivel no segue a lei normal, mas Student estudou a distribuio de t e os dados se encontram tabelados. esta a importncia da Distribuio de Student, ou seja, ser adequada a amostras de pequeno tamanho, diferente da Distribuio Normal que somente pode ser aplicada para amostras acima de 30 componentes. O parmetro usado para descrever a distribuio t o nmero de graus de liberdade que ter relao com o tamanho da amostra (n). A figura a seguir mostra uma comparao entre as distribuies normal e de Student. Esta ltima apresenta uma disperso maior que a normal. A distribuio de Student aplicada somente quando o tamanho da amostra pequeno (n<30). Para amostras grandes a distribuio normal adequada.

4.3. INTERVALO DE CONFIANA Intervalos de confiana uma maneira de calcularmos uma estimativa de um parmetro desconhecido. Como X apenas uma estimativa da mdia paramtrica devemos saber qual o grau de proximidade da estimativa em relao ao valor verdadeiro. Ento, ao invs de fornecer-se um valor exato, informa-se um intervalo e a probabilidade que o valor desconhecido esteja dentro deste intervalo. A idia construir um intervalo de confiana para o parmetro com uma probabilidade de 1 - (nvel de confiana) de que o intervalo contenha o verdadeiro parmetro.

o nvel de

significncia, isto o erro que estaremos cometendo ao afirmamos, por exemplo, que 95 % das vezes o intervalo a < < b contm .. Neste caso o erro seria de 5%. . Quanto maior o intervalo de confiana mais confiantes ns estaremos de que realmente o intervalo calculado contm o valor verdadeiro. Por outro lado, quanto maior o intervalo, menos informao termos sobre o valor verdadeiro. A mdia de um pequeno nmero de observaes costuma desviar-se consideravelmente da mdia paramtrica. Uma grande diferena entre X e torna-se cada vez menos provvel media que o nmero de observaes aumenta. A mdia paramtrica uma constante caracterstica da populao, quase sempre desconhecida, entretanto possvel estabelecer limites em torno da estimativa da mdia que devem abranger a mdia paramtrica com um certo grau de probabilidade. O intervalo assim

definido chamado intervalo de confiana ou intervalo fiducial e seus limites so os limites fiduciais. A avaliao dos limites fiduciais requer o conhecimento do desvio padro ou de sua estimativa s. sabido que s se aproxima de quando o nmero de observaes aumenta. Sendo n > 30 ser possvel tomar o valor computado para s como igual a . 4.3.1. Intervalo de confiana da mdia quando o desvio padro conhecido Se X a mdia para uma amostra aleatria de tamanho n, com desvio padro conhecido, , o intervalo de confiana 100 (1 - ) % da mdia dado por:
X - Z/2. X + Z/2. n n

Onde Z/2 obtido da Distribuio Normal Reduzida.

4.3.2. Intervalo de confiana da mdia quando o desvio padro desconhecido Na maioria dos casos, o desvio padro desconhecido. Deve-se usar os dados de uma amostra aleatria para se estimar no somente a mdia, mas, tambm o desvio padro s. Em virtude da incerteza associada ao desvio padro s, o intervalo de confiana mais largo do que se fosse conhecido. O intervalo de confiana determinado com o auxlio da tabela de Student. Se X e s so respectivamente a mdia e o desvio padro para uma amostra aleatria de tamanho n, com desvio padro, , da populao desconhecido, o intervalo de confiana 100 (1 - ) % da mdia dado por:
X - t/2. s X + t/2. s n n

Onde t/2 obtido da Distribuio t de Student

Distribuio t de Student
gl\P 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 i 0,50
1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,683 0,683 0,683 0,681 0,679 0,677 0,674

0,40
1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,856 0,856 0,854 0,854 0,851 0,848 0,845 0,842

0,30
1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,050 1,046 1,041 1,036

0,20
3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,296 1,289 1,282

0,10
6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,658 1,645

0,05
12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,980 1,960

0,02
31,821 6,965 4,541 3,747 3,365 3,143 2,365 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326

0,01
63,657 9,925 5,541 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,576

0,001
636,619 31,598 12,924 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,767 3,745 3,726 3,707 3,690 3,674 3,659 3,646 3,551 3,460 3,373 3,291

EXERCCIOS 1) Em uma srie de 18 observaes os seguintes dados foram obtidos: 2,142 2,139 2,136 2,142 2,134 2,142 2,132 2,138 2,135 2,139 2,139 2,144 2,138 2,132 2,135 2,137 2,145 2,132

a) Calcular a mdia, o desvio padro e o desvio padro da mdia ou erro padro.

b) Encontrar o intervalo que toda observao tem 95% de confiana para se situar.

c) Encontrar o intervalo com 95% de confiana em que a mdia paramtrica se encontra.

2) a) Calcular a mdia e seu limite de confiana com 95% de confiana para os seguintes resultados de anlises de fenol em cinco amostras de efluente industrial armazenado em um container para tratamento. (mg/l): 34,50; 343,0; 342,8; 34,44; 34,62

b) Calcular o intervalo em que se encontrar o resultado de uma determinao posterior com 95 % de confiana para a mesma anlise deste efluente, considerando que no houve degradao do material. 4.4. TESTE F DE DIFERENA ENTRE VARINCIAS POPULACIONAIS Este teste conhecido tambm como teste de razo entre varincias, j que a varivel do teste um quociente entre as 2 varincias amostrais. usado na

comparao de duas estimativas de varincias. Seja sA2 razo entre as varincias ser: F =- sA2 sB2 em que sB2 > sA2

sB2 as estimativas das

varincias de duas amostras A e B, de uma mesma populao de varincia 2, ento a

O teste F est associado aos graus de liberdade de sA2 e sB2. Quando as duas amostras pertencem mesma populao, os valores de F correspondem a uma probabilidade de ocorrncia superior 5%. Se a probabilidade for igual ou inferior a 5%j no ser possvel tomar a discrepncia entre sA2 e sB2 como simples decorrncia das flutuaes de amostragem e dever-se- admitir que as duas amostras no representam a mesma populao.

5. TESTES DE HIPTESES

5.1. FORMULAO DAS HIPTESES A estatstica serve para saber se um efeito observado real, ou devido a mero acaso. Para se testar algo necessrio estabelecer uma hiptese nula (H0) e uma hiptese alternativa (H1), sendo ambas antagnicas. H0 uma hiptese tida como verdadeira at que testes estatsticos indiquem o contrrio. H0 pode ser uma afirmao quanto a um parmetro de uma populao, por exemplo, mdia, varincia ou desvio padro. Como as hipteses so contraditrias ou opostas elas no podero ser simultaneamente verdadeiras. Assim, quando se aceita H0 tambm se rejeita H1 e viceversa. Os testes estatsticos devem responder a perguntas do tipo: Qual a probabilidade, no caso da hiptese nula ser verdadeira, de obtermos, por mera casualidade, o resultado obtido? Se a probabilidade for baixa, significa, que o resultado obtido no obra do acaso, ou seja, de efeitos aleatrios, mas que sim, se trata de um efeito real. A probabilidade encontrada exatamente o nvel de significncia. Por conveno, consideramos que resultados cuja probabilidade seja inferior a 5% (p<0.05) so significativos, ou seja, no aconteceram por acaso e conseqentemente rejeita-se H0. Como geralmente impossvel observar toda a populao, o teste baseado na observao de uma amostra aleatria dela retirada. freqente tambm o teste estatstico em que a hiptese nula consista em afirmar que os parmetros ou caractersticas matemticas de duas ou mais populaes so idnticos. Por exemplo, se desejarmos comparar valores obtidos para a varivel peso entre mulheres de amostras de 2 pases, A e B, a hiptese nula poderia ser: H0: "A mdia dos pesos das mulheres do pas A igual mdia dos pesos das mulheres do pas B". A hiptese alternativa deve ser contrria hiptese nula. comumente designada por H1 ou Ha. No exemplo acima a hiptese alternativa seria:

H1: "A mdia dos pesos das mulheres do pas A diferente da mdia dos pesos das mulheres do pas B".

5.2. SIGNIFICNCIA ESTATSTICA (nvel-p) A anlise estatstica deve estabelecer se os resultados obtidos tm significncia, de acordo com limites pr-estabelecidos. Quando se formula uma hiptese em relao a uma determinada caracterstica de uma populao, a amostra dela retirada pode pertencer populao de origem, e neste caso as diferenas observadas so decorrentes de flutuaes normais ou no segundo caso, no pertencer a essa populao e as diferenas encontradas representam um efeito real, e no ocorreram em funo do acaso. No primeiro caso, diz-se que os valores encontrados "no so estatisticamente significativos" e no segundo "so estatisticamente significativos". importante notar que essas expresses so empregadas sempre tendo em vista "nveis de significncia" previamente escolhidos. Na linguagem estatstica, o termo significante quer dizer provavelmente verdadeiro e, portanto, no resultante de uma situao aleatria. A significncia estatstica de um resultado uma estimativa do grau em que este resultado "verdadeiro", ou seja, representativo da populao. Quanto mais alto o nvel-p, menor a confiabilidade de um dado. Um resultado significante se for improvvel que tenha ocorrido por acaso. Por exemplo, um nvel-p de 0,05 (1/20) indica que h 5% de probabilidade de que os resultados encontrados sejam decorrncia de acaso. Ou que o valor calculado pelo teste (qualquer que seja este) s poderia ser encontrado, por simples variao natural do acaso, no mximo 5 vezes em 100 amostras aleatrias semelhantes. O valor de p<0,05 significa que estamos assumindo uma probabilidade de 5% de que o resultado do estudo no seja verdadeiro, apesar de, estatisticamente, ter sido encontrado. Quanto menor o valor de p, menor ser a probabilidade disso acontecer. No nvel p = 0,01, o valor encontrado pelo teste seria ainda mais difcil de obter em conseqncia do acaso, pois seria da ordem de 1 caso em 100. Em geral, os

resultados podem variar de no significante at extremamente significante, como mostra a tabela a seguir.

Valor de p >0,05 0,01 a 0,05 0,001 a 0,01 <0,001

Significado No significante Significante Muito significante Extremamente significante

Tipicamente, resultados que atingem nvel-p < 0,05 so considerados estatisticamente significantes. Um resultado considerado significante a 0,05, por exemplo, pode no s-lo a 0,01.

5.3. TESTE DE MDIA Este tipo de teste visa testar se um determinado valor corresponde mdia da populao. H0: = 0 H1: 0 0 simboliza o valor particular que est sendo testado. H muitos casos em que se tem certeza que se a mdia no igual ao valor postulado sob H0, ento seu valor deve ser maior ou menor: H0: = 0

H1: > 0 Exemplo: Um determinado medicamento da marca A, cujo princpio ativo o XYZ vem sendo vendido por vrios anos a uma clnica de esttica. Os vendedores da marca B, de mesmo princpio ativo afirmam que seu produto to bom quanto o da marca B, com a vantagem do preo reduzido. O produto da marca A possui 1180 mg/l de XYZ com um desvio padro de 90 mg/l. Para testar a afirmativa dos vendedores, foram testadas 100 amostras da marca B, o que forneceu uma mdia de 1140 mg/l do princpio ativo XYZ e desvio padro de 80 mg/l. O problema testar a hiptese de que a marca A seja igual marca B considerando o princpio ativo. H0: = 1180 H1: < 1180 Clculo do intervalo de confiana com 95% de certeza para a marca B:

X - Z/2. X + Z/2. n n
1140 - 1,96. 80 1140+ 1,96. 80 100 100 1124 1157 Logo, podemos concluir que a marca B inferior marca A, pois, possui inferior a 1180. Rejeita-se H0 e aceita-se a hiptese alternativa H1.

5.4. COMPARAO DE DUAS MDIAS

5.4.1. Comparao de dados emparelhados Existe uma forma de teste t destinada a verificar se significativa ou no, a diferena observada em duas sries de dados emparelhados. Suponhamos que dois mtodos analticos, A e B, sejam aplicados determinao de um constituinte variando dentro de uma certa faixa de concentrao. Se cada concentrao do constituinte determinada por ambos mtodos, resultam duas sries de dados emparelhados. Os resultados podero ser relacionados dois a dois formando pares. Neste caso o teste t consiste em achar as diferenas entre os dados emparelhados a fim de estabelecer a diferena mdia e calcular o desvio padro da nova varivel. Sendo x1, x2, x3 ........xn os resultados encontrados com o mtodo A e y1, y2, y3..............yn os resultados obtidos com o mtodo B, tem-se ento as seguintes diferenas entre os dados emparelhados: d1 = (y1 x1); d2 = (y2 x2); d3 = (y3 x3);......dn = (yn xn), ento:

Sendo sd = desvio padro de d:

O teste t assume a frmula:

Exemplo com dados emparelhados: O mtodo de anlise de mercrio por espectrofotometria de absoro atmica utilizando forno de grafite foi testado em uma nova matriz utilizando adio de padres na matriz isenta de mercrio. Os resultados obtidos, bem como, as concentraes reais dos padres so apresentadas a seguir. Verificar a exatido do mtodo, considerando o nvel de 95% de confiana, por comparao dos dados encontrados com os dados dos padres. [Hg] Encontrado (g/l) [Hg] Real (g/l) 0,22 0,34 0,55 0,73 1,01 1,48 0,20 0,30 0,50 0,70 1,00 1,50 d 0,02 0,04 0,05 0,03 0,01 -0,02 - 0,0017 0,0183 0,0283 0,0083 - 0,0117 -0,0417 2,89 . 10-6 3,3489 . 10-4 8,0089. 10-4 6,889. 10-5 1,3689. 10-4 1,73889. 10-3 =3,0833. 10-3

Clculos:

Aplicao do teste t:

t= 0,0217

0,0217 0,0248/ 6

t = 2,148 t tabelado = 2,571 > 2,148, logo o mtodo possui boa exatido. Os resultados obtidos podem ser considerados iguais aos dos padres no nvel de 95% de confiana.

sd =

3,0833. 10-3 5

sd = 0,0248

EXERCCIOS 1) Dez pares de amostras de sangue foram tratadas com metacrilato e parafina, sendo medido o tempo de coagulao aps o tratamento. Os mtodos podem ser considerados iguais no nvel de 95% de confiana? Amostra 1 2 3 4 5 6 7 8 9 10 Parafina (min) 10 27 11 18 19 16 16 18 22 26 Metacrilato (min) 13 20 9 12 11 14 19 12 11 18

5.4.2. Dados Independentes Atravs do teste t possvel verificar se duas mdias com dados independentes diferem significativamente ou, se as respectivas amostras podem ser consideradas como pertencentes mesma populao. Inicialmente admite-se a hiptese de que as duas mdias no apresentam diferena real.

Sejam as amostras: x1, x2, x3, x4.............xn (mdia X , desvio padro s1) y1, y2, y3, y4.............yn (mdia Y desvio padro s1)

No estudo de vrias amostras de uma mesma populao, tal como acontece com as estimativas da mdia, as estimativas da varincia e do desvio padro diferem em virtude das flutuaes de amostragem. O processo para se calcular a varincia duas amostras consiste em: s12(n1 1) + s22 (n2 1) (n1 1)+ (n2 1) Caso as amostras sejam de mesmo tamanho a frmula fica ainda mais simples: s2 = s12+ s22 2 O erro padro da diferena das duas mdias ser dado por:

s2 =

Se as amostras possuem o mesmo tamanho, o erro padro da diferena das duas mdias se reduz a:

O teste t ser dado por:

Exemplo: 1) Deseja-se verificar a reprodutibilidade de um determinado mtodo de anlise de chumbo. Para isso foram feitas seis repeties da anlise de uma mesma matriz por dois laboratrios diferentes. Verificar pelo teste t se as duas mdias podem ser consideradas iguais ao nvel de 95% de confiana. Laboratrio A 798 786 767 805 760 796 Laboratrio B 766 777 756 778 768 780

XA = 785,3 sA = 18,107 XB = 770,8 sB = 9,218 F calculado: (18,107)2 = (9,218) iguais.


2

327,867 84,972

= 3,858

F tabelado: 5,05 > F calculado. Concluso: as varincias podem ser consideradas

Sd = 8,295 t = 785,3 770,8 = 1,748 8,295 t tabelado para n1 + n2 2 = 10 graus de liberdade: 2,228 Como t tabelado > t calculado, as mdias podem ser consideradas iguais no nvel de 95% de confiana.

1) O calor latente de fuso do gelo foi medido por dois mtodos para amostras nas mesmas condies. Tendo sido obtidos os resultados abaixo, verificar no nvel de 95% de confiana, se os mtodos podem ser considerados iguais.

Mtodo A Cal/g 79,98 80,04 80,02 80,04 80,03 80,04 79,97 80,05 80,03 80,02 80,00 80,02 80,03

Mtodo B (Cal/g) 80,02 79,94 79,98 79,97 80,03 79,95 79,97 79,97

3) Deseja-se admitir um analista em uma fbrica e faz-se o seguinte teste prtico com os dois concorrentes finais: Entrega-se a cada concorrente seis amostras em frascos rotulados de A a F par que analisem a concentrao de chumbo em cada amostra por espectrofotometria de absoro atmica. Verificar se os desvios encontrados por cada analista so devido presena de erros determinados ou so acidentais. Os valores reais das amostras e os resultados encontrados pelos dois analistas esto relacionados a seguir: Analista I (ppm) de Pb 0,108 0,201 0,310 0,340 0,431 0,551 Analista II (ppm) de Pb 0,108 0,205 0,310 0,372 0,441 0,551 Analista III (ppm) de Pb 0,103 0,205 0,308 0,351 0,424 0,530

4) Uma amostra contendo cloreto (500 mg/l) analisada em seis repeties por um mesmo analista e nas mesmas condies visando testar a exatido de um novo mtodo. Os valores obtidos em mg/l foram: 510,0; 505,2; 500,1; 504,8; 500,0; 490,8; 503,7. Verificar se as diferenas obtidas em relao ao valor verdadeiro podem ser consideradas significativas no nvel de 95% de confiana.

5) Um analista analisou o teor de amnia de uma mesma amostra em seis repeties por dois mtodos diferentes. Verificar se os dois mtodos podem ser considerados iguais no nvel de 95% de confiana. Mtodo A (mg/l) 23,47 23,56 23,60 23,50 23,71 23,66 Mtodo B (mg/l) 23,71 23,83 23,60 23,50 23,61 23,76

6) Um pesquisador deseja saber se o uso de um ch popular diminui o colesterol do sangue de ratos. Para isso selecionou dois grupos de indivduos, o grupo 1 usou o ch e rao durante 1 ms e o grupo 2 usou gua e rao. Os dois grupos recebiam dieta hipercalrica. Os resultados hipotticos so dados a seguir. Verificar se houve ao efetiva do ch ou, ao contrrio, se as mdias dos dois grupos podem ser consideradas iguais. Grupo 1
colesterol srico (mg/dl)

Grupo 2
colesterol srico (mg/dl)

106,0 117,6 107,9 105,8 100,3 115,5 107,6 105,8 117,8 117,8 100,3 105,9 106,7 116,7 105,8

100,8 110,6 100,9 106,8 104,3 114,5 103,6 100,8 113,8 111,8 116,3 122,9 123,8 100,6 118,5

7) Deseja-se verificar se um medicamento produzido no Brasil possui a mesma qualidade do que um importado. Para isso, uma amostra de cada medicamento foi analisada em relao ao princpio ativo obtendo-se os seguintes resultados: Brasileiro (mg/g) 631 626 625 640 620 617 Importado (mg/g) 641 630 635 633 611 640

8) Dois diferentes mtodos foram usados para determinao de cianeto em soluo, sendo feitas dez rplicas por cada mtodo. Verificar se pode ser afirmado no nvel de 95% de confiana que os dois mtodos fornecem o mesmo resultado. Mtodo A 5,11 5,14 5,13 5,17 5,12 5,08 5,15 5,20 5,16 5,14 Mtodo B 5,18 5,13 5,27 5,12 5,29 5,17 5,28 5,27 5,14 5,18

9) Analisaram-se diversos padres de molibdnio de concentraes conhecidas pelo mtodo espectrofotomtrico. Verificar se significativa a diferena obtida entre as duas sries de valores. Os seguintes resultados foram obtidos: Concentrao encontrada (mg/l) 0,030 0,063 0,073 0,120 0,160 0,190

Padro 1 2 3 4 5 6

Concentrao real (mg/l) 0,020 0,050 0,070 0,100 0,150 0,200

10) Seis amostras de concentraes diferentes foram analisadas antes e aps o uso perodo de um ms em geladeira para verificar se a preservao em geladeira adequada para anlise de DQO (Demanda Qumica de Oxignio). Os seguintes resultados foram obtidos: Amostra 1 2 3 4 5 6 Antes 4049 1560 10330 347 2320 152 Aps 3960 1659 9960 352 2300 156

11) Pretende-se verificar a exatido de um mtodo. Para isso, uma soluo de concentrao conhecida analisada cinco vezes. Os seguintes resultados so obtidos: 10,74 %; 10,77 %; 10,73 %; 10,81 %; 10,87 % Sabendo-se que a concentrao real desta soluo 10,77, verificar se a diferena obtida entre a mdia e o valor verdadeiro significativa.

12) Para publicao de um artigo em uma revista cientfica preciso que os resultados sejam dados com seu intervalo de confiana (no nvel de 95%). A atividade citotxica de um novo alcalide foi feita em triplicata sendo obtidos os seguintes dados de LC50 (concentrao letal mediana) em mg/l: 5,0; 4,5; 4,0 Como deve ser expresso o resultado da IC50 para publicao na revista cientfica?

6. REGRESSO LINEAR

Regresso em Estatstica corresponde palavra funo em Matemtica. Ou seja, enquanto na linguagem matemtica dizemos que y funo de x, em estatstica devemos falar em regresso de y sobre x. A anlise de regresso utilizada principalmente com o objetivo de previso de valores de uma varivel dependente (Y) com base nos valores de pelo menos uma varivel independente (X) atravs da determinao de uma equao de Y em funo de X. A regresso denominada linear porque se considera que a relao da resposta s variveis uma funo linear de alguns parmetros. Diz-se regresso de Y sobre X. Se a relao funcional entre elas expressa por uma equao de 1 grau, cuja representao geomtrica uma linha reta, a regresso dita linear. Os modelos de regresso que no so uma funo linear dos parmetros se chamam modelos de regresso no-linear.

6.1. A EQUAO LINEAR OU RETA DE REGRESSO A equao da reta pode ser encontrada pelo Mtodo dos Mnimos Quadrados. Por este mtodo encontra-se a linha reta para a qual mnima a soma dos quadrados dos desvios em relao a ela. O coeficiente angular da reta dado pela tangente da reta e se denomina a. O denominado coeficiente linear b o valor de y quando x = 0. Ou seja, o ponto da reta que corta o eixo Y. N a regresso, os valores y so preditos com base em valores dados ou conhecidos de x. y = ax + b

6.2. O MTODO DOS MNIMOS QUADRADOS O critrio encontrar os coeficientes a e b da reta de regresso que minimizem a soma dos quadrados dos desvios, isto , a diferena entre o valor observado e o estimado pela equao de regresso para cada observao. A soma dos quadrados desses desvios mnima (isto , nenhuma outra reta daria menor soma de quadrados de tais desvios).

( yi yi )

O valor do coeficiente angular da reta ou inclinao da reta denominado coeficiente de regresso e dado por:

O valor do coeficiente linear obtido como resultado da subtrao da mdia da varivel dependente menos o produto do coeficiente angular pela mdia da varivel independente.

EXERCCIOS 1) Encontrar a equao da reta a partir dos dados a dados a seguir referentes determinao de acetona em sangue humano, atravs de espectrofotometria molecular no UV.

2) Encontrar a equao da reta a partir dos dados abaixo referentes determinao de padres de arsnico por espectrofotometria em 510 nm. g/g 5 10 15 20 25 Absorbncia 0,12 0,28 0,40 0,55 0,72