Você está na página 1de 67

Introduo da Estatstica aplicada Qumica

Marilena Meira

Objetivo
Apresentar a Estatstica bsica como ferramenta para sua fcil aplicao na rotina dos laboratrios de controle de qualidade de indstrias e em laboratrios de pesquisas.

Introduo
Toda medio est sujeita uma certa incerteza.

Algarismos significativos
Algarismos significativos so todos os algarismos do valor de uma medida dos quais se tem certeza mais o ltimo algarismo que estimado, ou seja, o algarismo duvidoso.

Algarismos significativos
Algarismo mais significativo: o algarismo no nulo mais esquerda. Algarismo menos significativo: No havendo vrgula o algarismo no nulo mais direita. Havendo vrgula, o algarismo mais direita, mesmo sendo zero. Entre os algarismos mais e menos significativos, todos so significativos.

Regras de arredondamento
O algarismo retirado > 5: Aumenta-se o algarismo a permanecer de uma unidade. 123,58 passa para 123,6 23,576 passa para 23,58 O algarismo retirado < 5: O algarismo a permanecer fica inalterado. 567,43 passa para 567,4 123,372 passa para 123,37

O algarismo retirado = 5
I) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade no algarismo a permanecer. 25,6501 passa a 25,7 76,250002 passa a 76,3 II) Se o 5 for o ltimo algarismo ou se ao 5 s seguirem zeros, o ltimo algarismo a ser conservado s ser aumentado de uma unidade se for mpar. 54,75 passa a 54,8 54,65 passa a 54,6 54,7500 passa a 54,8

PROPAGAO DAS INCERTEZAS


O resultado de uma soma ou subtrao deve conter tantas casas decimais quantas apresenta o componente com menor nmero de casas decimais.

PROPAGAO DAS INCERTEZAS


O resultado de uma multiplicao ou diviso no deve conter mais algarismos significativos do que o nmero com menos algarismos significativos que entrar na operao.

Exatido e Preciso
Exatido: grau de concordncia do valor encontrado com o valor verdadeiro. Preciso: grau de concordncia dos resultados individuais dentro de uma srie de medidas

A preciso costuma ser expressa como: Repetitividade Preciso intermediria Reprodutibilidade

Repetitividade
A repetitividade constitui a preciso estudada no mesmo laboratrio sob as mesmas condies e em pequeno intervalo de tempo

Mesmo dia, mesmo analista e mesmo equipamento.

Preciso intermediria
A preciso intermediria expressa pela variao entre resultados obtidos em dias diferentes pelo mesmo laboratrio.

Resultados obtidos em diferentes dias

Reprodutibilidade
Grau de concordncia entre os resultados das medies de um mesmo mensurando efetuadas sob condies variadas de medio que devem ser especificadas.

Laboratrios diferentes

Reprodutibilidade
As condies alteradas podem incluir: Mtodo Instrumento de medio Analista Padro de referncia Condies de utilizao Local Tempo

Erro absoluto e tipos de erros


Diferena entre o valor observado e o valor verdadeiro Tipos de erros: Erros Determinados ou sistemticos Erros indeterminados ou acidentais

Erros Determinados
So devidos a causas definidas; Se repetem sistematicamente; Ocasionam resultados mais altos ou mais baixos do que o valor verdadeiro; A causa de um erro determinado pode ser localizada e, portanto eliminada.

Erros Indeterminados
So erros que refletem a incerteza do mtodo empregado. Mesmo que uma medio seja repetida vrias vezes, com o maior cuidado por uma mesma pessoa, em condies de trabalho uniformes, ainda assim, os valores no so idnticos.

Medidas de Tendncia Central


Mdia X = xi n a mais utilizada. Nem sempre a mais adequada. influenciada por valores extremos. S deve ser utilizada para distribuies simtricas

Medidas de Tendncia Central


Mediana a segunda mais utilizada. A mediana no sofre influncia de valores extremos. Os dados devem ser colocados em ordem crescente ou decrescente. Quando n for impar a mediana valor central, Quando n for par, existiro dois valores centrais. O valor da mediana a mdia entre estes dois valores.

Medidas de Tendncia Central


Moda pouco utilizada. Demonstra qual valor o mais freqente ou que mais se repete. Algumas distribuies no tm moda. Outras distribuies podem ter mais de uma moda.

Medidas de Tendncia Central


Em uma distribuio perfeitamente simtrica ocorre: Mdia = moda = mediana Exemplo: 70, 80, 90, 100, 100, 100, 110, 120, 130

DADOS AMOSTRAIS
Dados Brutos: simples coleta, sem qualquer preocupao quanto sua ordenao. Rol: Consiste na ordenao dos valores em ordem crescente: Distribuio de freqncias: Os dados so organizados por intervalos de freqncia ou classes e exibem o nmero de porcentagem de observaes em cada classe. Pode se apresentada por grfico (histograma) ou tabela.

Representao dos intervalos de classes


Para representar os intervalos de classes usam-se os smbolos: 0 ---| 10 : a classe compreende valores de 0, exclusive, at 10, inclusive 0 --- 10: a classe compreende valores de 0, exclusive, at 10, exclusive 0 |---| 10: a classe compreende valores de 0, inclusive, at 10, inclusive

Elementos de uma distribuio de freqncia


Freqncia Simples Absoluta de uma classe ou de um valor individual (fi) Freqncia Simples Relativa (fri ou fri%) Freqncia Absoluta Acumulada (Fi) Amplitude Total (At) Classe Limites de Classe Amplitude do intervalo de Classe (h) Ponto Mdio de Classe (xi)

Tabela de Freqncia
Teor de Fe % 10 |---20 20 |---30 30 |---40 40 |---50 50|--- 60 60 |--- 70

xi
15 25 35 45 55 65 9

fi
12 14 7 7 1

Fi
9 21 35 42 49 50

fri %
18 24 28 14 14 2

At = 69 10 h = 20 10 = 10

Histograma: Grfico da Distribuio de Freqncia


100 80 60 40 20 0

Conjunto de retngulos justapostos. A base de cada retngulo o seu intervalo de classe. A sua rea proporcional freqncia da classe que ele representa. A soma das reas dos retngulos ser sempre igual freqncia total

Construo de histograma
A base de cada retngulo o seu intervalo de classe. Encontra-se a altura de cada retngulo dividindo-se sua rea (freqncia) pela respectiva base (intervalo de classe).

Tipos de Histogramas
100

a) Histograma simtrico

80 60 40 20 0

100

b) Histograma assimtrico

80 60 40 20 0

Tipos de Histogramas
c) Histograma do tipo despenhadeiro:
100 80 60 40 20 0 100 80 60 40 20 0

Tipos de Histogramas
d) Histograma com dois picos
100 80 60 40 20 0

e) Histograma do tipo plat


80 70 60 50 40 30 20 10 0

Tipos de Histogramas
f) Histograma com uma pequena ilha isolada
100 80 60 40 20 0

Conceitos de Populao e Amostra


Populao ou Universo: o conjunto de indivduos, objetos ou dados de observao. Amostra um conjunto de elementos selecionados da populao. Se os elementos so selecionados de tal maneira que cada um tem a mesma chance de ser selecionado do que o outro, temos uma amostra aleatria.

Medidas de Disperso
Varincia (2) 2 = (xi - )2 n s2 = Populao

(xi -X )2 Amostra n -1

Medidas de Disperso
Desvio-padro () = (xi - )2 n Populao

s=

(xi -X )2 n -1

Amostra

Medidas de Disperso
Coeficiente de Variao de Pearson CVP: CVP = ( / ) x 100 populao CVP = (s / X ) x 100 amostra

Amplitude total: diferena entre o maior e o menor valor observado. Desvio Mdio: x1 - X n

Distribuio Normal
Quando n intervalo de classe 0, O histograma aspecto de sino. Curva de Gauss ou de Distribuio Normal.
Freqncia Intervalo

Curva de Gauss

O eixo de simetria dado pela mdia o desvio padro a distncia do ponto de inflexo de qualquer um dos ramos da curva ao eixo vertical que passa pelo centro.

Curva de Gauss
O valor de f(x) mximo quando x = e cai simetricamente dos dois lados aproximando-se da abscissa nas duas direes, sem jamais toc-la.

Curva de Gauss
O valor de f(x) no se torna igual a zero para nenhum valor de x, mas, torna-se negligencivel quando x se afasta grandemente da mdia.

Distribuio Normal
A funo densidade de probabilidade da distribuio normal com mdia e desvio padro dada por:

Curva de Gauss
simtrica em relao mdia e os valores de mdia, moda e mediana so iguais. A rea total sob a curva igual a 1, ou 100%. 50% dos valores distribudos esquerda da mdia e 50% sua direita.

Curva de Gauss
A rea sob a curva pode ser entendida como uma medida de sua probabilidade. A probabilidade de ocorrer um evento entre x=- e x=+ igual a 1 ou 100%.

A imagem no pode ser exibida. Talv ez o computador no tenha memria suficiente para abrir a imagem ou talv ez ela esteja corrompida. Reinicie o computador e abra o arquiv o nov amente. Se ainda assim aparecer o x v ermelho, poder ser necessrio excluir a imagem e inseri-la nov amente.

x=-

x=+

Curva de Gauss
A probabilidade (ou freqncia relativa) com que a varivel x toma um valor entre a e b dada pela rea abaixo da curva limitada pelas verticais que passam por aqueles valores (a e b).
A imagem no pode ser exibida. Talv ez o computador no tenha memria suficiente para abrir a imagem ou talv ez ela esteja corrompida. Reinicie o computador e abra o arquiv o nov amente. Se ainda assim aparecer o x v ermelho, poder ser necessrio excluir a imagem e inseri-la nov amente.

Curva de Gauss
Para a distribuio Normal, a proporo de valores caindo no intervalo de um, dois, ou trs desvios padro da mdia so:
Entre 1 2 3 igual a: 68,26% 95,44% 99,74%

Curva de Gauss
As ocorrncias tendem a concentrar-se em torno de uma mdia e se tornam mais raras ou com menos probabilidade de ocorrncia medida que dela se afastam.

Distribuio Normal Reduzida


Se a varivel x tem distribuio normal, pode ser transformada para uma forma padro ou reduzida, denominada Z, subtraindo-se sua mdia e dividindo-se pelo seu desvio padro:
A imagem no pode ser exibida. Talv ez o computador no tenha memria suficiente para abrir a imagem ou talv ez ela esteja corrompida. Reinicie o computador e abra o arquiv o nov amente. Se ainda assim aparecer o x v ermelho, poder ser necessrio excluir a imagem e inseri-la nov amente.

Z = ( x - )

Distribuio Normal Reduzida


A mdia igual a 0 ( = 0) O desvio padro igual a 1 ( = 1). As probabilidades da Distribuio Normal Reduzida j foram calculadas e so apresentadas em tabelas de fcil utilizao. A probabilidade de um intervalo qualquer da metade esquerda igual probabilidade do intervalo equivalente na metade direita.

Uso da Tabela Z para obter as reas ou probabilidade


A tabela d a probabilidade de ocorrncia de um evento entre 0 e z. Na margem esquerda temos o valor de z com uma decimal. Se necessitamos considerar a segunda decimal devemos encontr-la na margem superior. No interior obtemos as probabilidades.

Tabela Z Distribio Normal Reduzida

Z = ( x - )
A imagem no pode ser exibida. Talv ez o computador no tenha memria suficiente para abrir a imagem ou talv ez ela esteja corrompida. Reinicie o computador e abra o arquiv o nov amente. Se ainda assim aparecer o x v ermelho, poder ser necessrio excluir a imagem e inseri-la nov amente.

p = rea entre 0 e z

Clculo da probabilidade
Considere uma distribuio normal das anlises do teor de ferro em gua de rio com mdia 20 mg e desvio padro 5 mg.

Qual a probabilidade de que um resultado de anlise esteja entre 10 mg e 30 mg? Qual a probabilidade de que um resultado de anlise esteja entre 15 mg e 25 mg?

Exerccio
Qual deve ser o desvio padro do teor de matria ativa em um inibidor de corroso, sabendo que a faixa especfica com 95% de certeza de 6169? Z = ( x - )

Diferentes amostras de uma populao


No estudo de uma populao possvel considerar vrias amostras. Ento, cada amostra fornecer uma diferente estimativa (X ) da mdia paramtrica () e uma diferente estimativa (s) do desvio padro paramtrico ().

Distribuio das mdias amostrais


As diversas estimativas se distribuiro tambm em torno da mdia paramtrica, tal como acontecia com os valores individuais.
A imagem no pode ser exibida. Talv ez o computador no tenha memria suficiente para abrir a imagem ou talv ez ela esteja corrompida. Reinicie o computador e abra o arquiv o nov amente. Se ainda assim aparecer o x v ermelho, poder ser necessrio excluir a imagem e inseri-la nov amente.

X1

X2

Desvio padro da mdia


A distribuio das mdias tende distribuio normal com mdia e desvio-padro da mdia, ou erro padro igual ao desvio padro de uma observao, dividido pela raiz quadrada do nmero de observaes: Desvio-padro da mdia: X = n

Distribuio das mdias amostrais


O desvio padro da mdia considerado um ndice de preciso da mdia e diminui quando o tamanho da amostra aumenta. A distribuio de amostragem da mdia mais se aproxima da distribuio normal quando o nmero de observaes aumenta.

Reduo da distribuio das mdias amostrais Na prtica, a distribuio de amostragem da mdia pode se considerada como normal sempre que o nmero de dados for maior que 30 (n 30). A distribuio normal reduzida, Z, dada agora por:

Distribuio de Student
Quando o desvio padro da populao no conhecido, o termo:

substitudo por:
t= X s n

Distribuio de Student
O conjunto dos valores de t forma uma nova populao normalmente distribuda no caso de amostras grandes. Quando o nmero de observaes pequeno, a varivel no segue a lei normal, mas Student estudou a distribuio de t e os dados se encontram tabelados. esta a importncia da Distribuio de Student, ou seja, ser adequada a amostras de pequeno tamanho, diferente da Distribuio Normal que somente pode ser aplicada para amostras acima de 30 componentes.

Distribuio de Student x Distribuio Normal A distribuio de Student apresenta uma disperso maior que a Distribuio Normal. A distribuio de Student aplicada somente quando o tamanho da amostra pequeno (n<30). Para amostras grandes a distribuio normal adequada.

Distribuio t de Student

Distribuio t de Student

Intervalos de confiana
uma maneira de calcularmos uma estimativa de um parmetro desconhecido. Como X apenas uma estimativa da mdia paramtrica devemos saber qual o grau de proximidade da estimativa em relao ao valor verdadeiro. Ento, ao invs de fornecer-se um valor exato, informa-se um intervalo e a probabilidade que o valor desconhecido esteja dentro deste intervalo.

Intervalo de confiana para n> 30


Intervalo em que 95% das observaes se encontram: X + 1,96.S Intervalo em que se localiza a mdia paramtrica com 95% de confiana: X + 1,96.Sm

Exerccio
Sabendo-se que no controle de qualidade industrial a mdia do comprimento do percurso tico de uma cubeta de 10 mm e o desvio padro 0,1 mm e 95% como intervalo de confiana verifique se as cubetas com as medidas a seguir devem ser aceitas: a) 10,1 mm b) 9,7 mm c) 10,2 mm

Intervalo de confiana para n< 30


Intervalo em que 95% das observaes se encontram: X + t.S Intervalo em que se localiza a mdia paramtrica com 95% de confiana: X + t.Sm T depende do tamanho da amostra. Consultar a tabela de Student.

Em uma srie de 18 observaes os seguintes dados foram obtidos:


2,142, 2,142, 2,132, 2,139, 2,138, 2,137, 2,139, 2,134, 2,138, 2,139, 2,132, 2,145, 2,136, 2,142, 2,135, 2,144, 2,135, 2,132.
a) Calcular a mdia, o desvio padro e o desvio padro da mdia ou erro padro. b) Qual o intervalo que toda observao tem 95% de confiana para se situar. c) Encontrar o intervalo com 95% de confiana em que a mdia paramtrica se encontra.