Você está na página 1de 43

UNIVERSIDADE FEDERAL DO PIAUI

CENTRO DE CIÊNCIAS DA NATUREZA


DEPARTAMENTO DE QUÍMICA
DISCIPLINA: Estatística Aplicada a Química

Tratamento e Avaliação Estatística de Dados

Prof. Herbert Barbosa

Fevereiro/2023
Tratamento e Avaliação Estatística de Dados

O intervalo de confiança, para a média, é a faixa de valores entre os quais se


espera que a média da população m esteja contida com uma certa probabilidade.

 Por exemplo, podemos dizer que é 99% provável que a média verdadeira da
população de um conjunto de medidas envolvendo potássio esteja contida no
intervalo 7,25%  0,15% de K. Assim, a média deve estar contida no intervalo
de 7,10% a 7,40% de K, com 99% de probabilidade.

 A amplitude do intervalo de confiança, que é calculado a partir do desvio padrão da


amostra, depende do quão bem o desvio padrão s da amostra estima o desvio padrão
s da população;
 Se s for uma boa aproximação de s, o intervalo de confiança pode ser
significativamente mais estreito do que se a estimativa de s for baseada apenas em
poucos valores medidos;
Tratamento e Avaliação Estatística de Dados

Determinação do Intervalo de Confiança quando s é Conhecido ou s é


uma Boa Estimativa de s

O nível de confiança é a
probabilidade de que a média
verdadeira esteja localizada
em um certo intervalo.
O nível de significância é a
probabilidade de um
resultado estar fora do
intervalo.
Tratamento e Avaliação Estatística de Dados

Determinação do Intervalo de Confiança quando s é Conhecido ou s é


uma Boa Estimativa de s

Calculo do IC para a média verdadeira com um único valor de x:

Calculo do IC para a média experimental x de N medidas:


Tratamento e Avaliação Estatística de Dados

Determinação do Intervalo de Confiança quando s é Conhecido ou s é


uma Boa Estimativa de s
Determine os intervalos de confiança de 95% para: (a) valor único do teor de glicose em
amostra de sangue no valor de 1.108 mg/L de glicose e (b) o valor médio (1.100,3 mg/L)
para um total de 7 medidas. Considere s = 19 como uma boa estimativa de s.
Tratamento e Avaliação Estatística de Dados

Determinação do Intervalo de Confiança quando s é Conhecido ou s é


uma Boa Estimativa de s
Quantas réplicas de medidas são necessárias para decrescer o intervalo de confiança de
95% para 1.100,3  10,0 mg/L de glicose?
Tratamento e Avaliação Estatística de Dados

Determinação do Intervalo de Confiança Quando s e m não forem


conhecidos
 O teste t de student é uma ferramenta estatística utilizada frequentemente para
expressar intervalos de confiança e para a comparação de resultados experimentais
diferentes.

 O intervalo de confiança para a média de N réplicas de medidas pode ser calculado a


partir de t :

 Para a comparação de resultados experimentais diferentes com N medidas:


Tratamento e Avaliação Estatística de Dados

Determinação do Intervalo de Confiança Quando s não for Conhecido


Tratamento e Avaliação Estatística de Dados

Determinação do Intervalo de Confiança Quando s não for Conhecido


A escala de absorbância de um espectrômetro é testada em um determinado
comprimento de onda com uma solução padrão que tem uma absorbância dada como
0,470. Dez medições da absorbância com o espectrômetro geraram um média de 0,461,
e desvio-padrão de 0,003. Considerando o intervalo de confiança de 95% para a
absorbância média medida pelo espectrômetro , há erro sistemático presente?
Tratamento e Avaliação Estatística de Dados

• Para explicar uma observação, um modelo hipotético é proposto e testado


experimentalmente para avaliar sua validade;

• Se os resultados desses experimentos não dão suporte para o modelo, nós o


rejeitamos;
• Os resultados experimentais raramente concordam exatamente com aqueles previstos
por um modelo teórico;
• Como consequência precisamos julgar se as diferenças numéricas são um resultado
de erros aleatórios inevitáveis de todas as medidas ou o resultado de erros
sistemáticos utilizando testes estatísticos;

• Testes deste tipo lançam mão da hipótese nula, a qual considera que as quantidades
numéricas que estão sendo comparadas são iguais.

• Para isso utilizamos a distribuição de probabilidade para calcular a probabilidade de


que as diferenças observadas são um resultado de erros aleatórios.
Tratamento e Avaliação Estatística de Dados

Comparação de uma Média Experimental com um Valor Conhecido:


Teste de hipótese

Teste z para Grandes Amostras


 Se um grande número de resultados encontra-se disponível, então s é uma boa
estimativa de s e o teste z é adequado!
1) Apresentar a hipótese nula:

2) Formular o teste estatístico:

3) Determinar a hipótese alternativa, Ha:


Tratamento e Avaliação Estatística de Dados

Comparação de uma Média Experimental com um Valor Conhecido:


Teste de hipótese
Teste z para Grandes Amostras: teste de duas caldas
• Podemos rejeitar tanto valores positivos de z
quanto valores negativos de z que excedam
os valores críticos;

• Exemplo: Para um N.C = 95%, existe apenas


5% de probabilidade de erros aleatórios
gerarem valores de z  zcrit ou z  zcrit;
Tratamento e Avaliação Estatística de Dados

Comparação de uma Média Experimental com um Valor Conhecido:


Teste de hipótese
Teste z para Grandes Amostras: teste de uma calda

• Nesse caso, para o N.C de 95%, queremos que a probabilidade de que z exceda zcrit seja
de 5% ou a probabilidade total em ambas as caldas seja de 10%;
• O nível de significância global seria  = 0,10 e o valor crítico é 1,64;
Tratamento e Avaliação Estatística de Dados

Comparação de uma Média Experimental com um Valor Conhecido:


Teste de hipótese
Uma classe de 30 alunos determinou a energia de ativação de uma reação química como
27,7 kcal mol (valor médio), com um desvio padrão de 5,2 kcal mol. Os dados estão de
acordo com o valor de 30,8 kcal mol descrito na literatura em; (1) nível de confiança de 95%
e (2) nível de confiança de 99%? Estime a probabilidade de se obter uma média com valor
igual àquele da literatura.
Tratamento e Avaliação Estatística de Dados

• Se você fizer dois conjuntos de medidas de mesma grandeza, o valor da média de


um conjunto será diferente do valor da média de outro conjunto;

• Usamos o teste t de Student para comparar essas médias para decidir se existe uma
diferença com significado estatístico entre elas;
• Testes deste tipo lançam mão da hipótese nula, a qual considera que as quantidades
numéricas que estão sendo comparadas são, de fato, iguais.
• Procedimento para aplicação do teste t:

3. Determinar a hipótese alternativa, Ha:


Tratamento e Avaliação Estatística de Dados

• Como saber se um método analítico possui erros sistemáticos (ou viés)?


 Para isso, uma amostra padrão como um material de referência deve ser analisada!
 A determinação do analito no material de referência fornece uma média experimental
que é uma estimativa da média da população.

 A curva A é a frequência de distribuição


para o valor aceito por um método sem
viés;
 A curva B é a frequência de distribuição
para um método que pode ter um viés
significativo!
Tratamento e Avaliação Estatística de Dados

 (1) da média de um conjunto de dados experimentais com aquilo que se acredita


ser o valor verdadeiro.
Um novo procedimento para a determinação rápida da porcentagem de enxofre em
querosene foi testado em uma amostra cujo teor de S era de 0,123% (m0 = 0,123%),
determinado pela forma da sua preparação. Os resultados foram % de S = 0,112; 0,118;
0,115 e 0,119. Os dados indicam que existe um viés no método em um nível de confiança
de 95%?
Tratamento e Avaliação Estatística de Dados

 (2) comparação de duas médias experimentais;

 Para ilustrar, vamos considerar que N1 réplicas de análises desenvolvidas pelo analista 1
forneceram um valor médio x1 e que N2 análises feitas pelo analista 2 pelo mesmo
método forneceram o valor médio x2;

 A hipótese nula declara que as duas médias são idênticas e que qualquer diferença é
resultado de erros aleatórios;
 Considerando que os desvios-padrão de ambos conjunto de dados sejam similares,
usamos o desvio padrão da média calculado a partir da variância:
Tratamento e Avaliação Estatística de Dados

 (2) comparação de duas médias experimentais;

 No teste t estamos interessados na diferença entre as médias ( ). A variância da


diferença entre as médias é dada por:

 O desvio padrão da diferença entre as médias pode ser encontrado extraindo a raiz
quadrada:

 Considerando que o desvio padrão combinado é uma estimativa melhor do desvio


padrão s1 e s2, temos:
Tratamento e Avaliação Estatística de Dados

 (2) comparação de duas médias experimentais;

• O teste estatístico é então comparado


com o valor crítico de t obtido a partir
da tabela, para o nível de confiança
específico desejado;

• O número de graus de liberdade para se encontrar o valor crítico de t na


Tabela é (N1 + N2)  2.
• Se o valor absoluto do teste estatístico for menor que o valor crítico, a
hipótese nula é aceita e não há diferença significativa entre as médias.
Tratamento e Avaliação Estatística de Dados

 (2) comparação de duas médias experimentais;

A homogeneidade dos níveis de cloreto presente em uma amostra de água de um lago foi
testada por meio de análises de porções retiradas do topo e do fundo da coluna de água,
tendo apresentado os seguintes resultados, em ppm de Cl−:

Aplique o teste t em um nível de confiança de 95% para


determinar se as médias são diferentes.
Tratamento e Avaliação Estatística de Dados

 (3) teste t emparelhado para comparação de diferenças individuais.


Um novo procedimento automático para a determinação de glicose em soro sangüíneo
(Método A) será comparado com o método estabelecido (Método B). Ambos os métodos
são realizados em amostras de sangue dos mesmos pacientes para eliminar variabilidades
entre os pacientes. Os resultados que seguem confirmam uma diferença entre os dois
métodos em um nível de confiança de 95%?
Tratamento e Avaliação Estatística de Dados

• Erros nos teste de hipóteses

 Erro do tipo I: erro que resulta quando rejeitamos a H0 quando esta é


verdadeira (falso negativo);

 Erro do tipo II: erro que resulta quando aceitamos a H0 quando esta é falsa
(falso positivo);
Tratamento e Avaliação Estatística de Dados

 Comparação da precisão

• Muitas vezes torna-se necessário comparar as variâncias (ou desvios padrão) de


duas populações;

• Por exemplo, o teste t normal demanda que os desvios padrão dos conjuntos
de dados, que estão sendo comparados, sejam iguais;

• Um teste estatístico simples, chamado teste F, pode ser utilizado para avaliar
essa consideração sob a condição de que as populações sigam uma distribuição
normal (gaussiana);
• O teste estatístico F, que é definido como a razão entre as duas variâncias
das amostras.
Tratamento e Avaliação Estatística de Dados

 Comparação da precisão
Tratamento e Avaliação Estatística de Dados

 Comparação da precisão
Tratamento e Avaliação Estatística de Dados

• A análise de variância (ANOVA) permite a comparação entre mais de duas


médias de população;

• A ANOVA pode ser uma ferramenta bastante útil em métodos de planejamento


experimental;

• Na ANOVA podemos detectar diferenças nas médias de populações a partir da


comparação de suas variâncias;

H0: m1 = m2 = m3 =    mI
Ha: pelo menos dois dos mi são diferentes.
Tratamento e Avaliação Estatística de Dados

Exemplos da aplicação da ANOVA:

1. Existe uma diferença nos resultados de cinco análises para se determinar cálcio por
meio de um método volumétrico?

2. Quatro solventes com composições diferentes terão influência no rendimento de


uma síntese química?

3. Os resultados da determinação de manganês realizada por três métodos analíticos


distintos são diferentes?

4. Há alguma diferença na fluorescência de um íon complexo em seis valores


diferentes de pH?
Tratamento e Avaliação Estatística de Dados

• Em cada uma das situações anteriores, as populações têm diferentes valores para
uma característica comum denominada fator;

• Os valores diferentes do fator de interesse são chamados níveis;


• A comparação entre os vários níveis de um fator é feita pela medida da resposta
para cada item amostrado;
• O teste estatístico básico usado pela ANOVA é o F, onde um valor grande de
F, comparado com o valor crítico descrito nas tabelas, pode nos fornecer a
razão para rejeitar H0 em favor da hipótese alternativa.
Tratamento e Avaliação Estatística de Dados

1. Existe uma diferença nos resultados de cinco análises para se determinar cálcio por
meio de um método volumétrico?
Tratamento e Avaliação Estatística de Dados

Calculo da média global:

em que N1 é o número de medidas do grupo 1; N2, o número correspondente ao grupo


2 e assim por diante; N é numero total de medidas.

Para calcular a razão das variâncias, necessária no teste F, é preciso obter


várias outras grandezas denominadas somas dos quadrados:

1. A soma dos quadrados devido ao fator (SQF):


Tratamento e Avaliação Estatística de Dados

Para calcular a razão das variâncias, necessária no teste F, é preciso obter


várias outras grandezas denominadas somas dos quadrados:
2. A soma dos quadrados devido ao erro (SQE):

3. A soma total dos quadrados (STQ) é obtida como o resultado de SQF e SQE
Tratamento e Avaliação Estatística de Dados

Para calcular a razão das variâncias, necessária no teste F, é preciso obter


várias outras grandezas denominadas somas dos quadrados:
4. O número de graus de liberdade para cada uma das somas dos quadrados precisa
ser obtido.

5. Dividindo-se as somas dos quadrados pelos seus graus de liberdade correspondentes,


obtemos quantidades que são estimativas das variações entre grupos e dentro dos
grupos. Essas quantidades são denominadas valores médios quadrados e definidas
como:
Tratamento e Avaliação Estatística de Dados

A média global pode ser obtida de:


Tratamento e Avaliação Estatística de Dados

A soma dos quadrados entre os grupos é dada por:


Tratamento e Avaliação Estatística de Dados

A soma dos quadrados dos erros é dado por:


Tratamento e Avaliação Estatística de Dados

• A soma dos quadrados do fator tem (5  1) = 4 graus de liberdade.


• A soma dos quadrados dos erros tem (15  5) = 10 graus de liberdade.
Tratamento e Avaliação Estatística de Dados

A tabela ANOVA é apresentada a seguir:


Tratamento e Avaliação Estatística de Dados

• A soma dos quadrados do fator = 4 graus de liberdade.


• A soma dos quadrados dos erros = 10 graus de liberdade.
Tratamento e Avaliação Estatística de Dados

Determinação de Quais Resultados são Diferentes: Método da diferença menos


significativa (DMS)

• Calcula-se uma diferença que é avaliada como a menor diferença que é significativa;

• A diferença entre cada par de médias é então comparada com a diferença menos
significativa para se determinar quais médias são diferentes.

em que MQE é o quadrado da média para o erro e o valor de t deve ter N − 1 graus de
liberdade.
Tratamento e Avaliação Estatística de Dados

Determinação de Quais Resultados são Diferentes: Método da diferença menos


significativa (DMS)
Tratamento e Avaliação Estatística de Dados

O teste Q é um teste estatístico simples, amplamente utilizado para se decidir


se um resultado suspeito deve ser mantido ou rejeitado;
Tratamento e Avaliação Estatística de Dados

Você também pode gostar