Você está na página 1de 5

7

PRÁTICA 1: Estatística aplicada a química analítica

1.1. Objetivos
Apresentar ao aluno testes de hipóteses estatísticos (teste-t e teste F) utilizados em análises químicas.

1.2. Introdução
Os cientistas empregam cálculos estatísticos para aprimorar seus julgamentos relacionados à qualidade de
medidas experimentais. Várias aplicações dos testes estatísticos no tratamento de resultados analíticos incluem (i) definir
o intervalo numérico ao redor da média de um conjunto de réplicas de resultados analíticos na qual se espera que a
média da população possa estar contida, com uma certa probabilidade. Esse intervalo – chamado intervalo de confiança
(IC) – relaciona-se ao desvio padrão da média, (ii) determinar o número de réplicas de medidas necessário para assegurar
que uma média experimental esteja contida em uma certa faixa, com um dado nível de probabilidade, (iii) estimar a
probabilidade de (a) uma média experimental e um valor verdadeiro ou (b) duas médias experimentais serem diferentes;
isto é, se a diferença é real ou simplesmente o resultado de um erro aleatório (considerar os erros tipo I e tipo II).
Esse teste é particularmente importante para se detectar a presença de erros sistemáticos em um método e para
determinar se duas amostras são provenientes da mesma fonte, (iv) determinar, dentro de um dado nível de
probabilidade, se a precisão de dois conjuntos de resultados é diferente, (v) comparar as médias de mais de duas amostras
para determinar se as diferenças nas médias são reais ou resultado de erros aleatórios. Esse processo é conhecido como
análise de variância e (vi) decidir com uma certa probabilidade se um valor aparentemente crítico, contido em um
conjunto de réplicas de medidas, é o resultado de um erro grosseiro que, portanto, pode ser rejeitado, ou se é parte
legítima de uma população que precisa ser mantida no cálculo da média do conjunto de resultados.
Na maioria das situações encontradas em análises químicas, o valor verdadeiro da média µ não pode ser
determinado, porque um número imenso de medidas (aproximadamente infinito) seria necessário. Com a estatística,
entretanto, podemos estabelecer um intervalo ao redor da média determinada experimentalmente (x), no qual se espera
que a média da população µ esteja contida com certo grau de probabilidade. Esse intervalo é conhecido como o intervalo
de confiança (IC) e os limites são chamados limites de confiança.

(eq. 1)

Em alguns casos, o valor conhecido representa o valor verdadeiro ou aceito, que se baseia em conhecimento ou
experiência prévia. Em outras situações, o valor conhecido pode ser um valor previsto por uma teoria ou pode ser o
valor de referência que utilizamos para a tomada de decisões acerca da presença ou ausência de um constituinte. Em
todos os casos, utilizamos um teste de hipótese (sempre em módulo) estatístico para tirar conclusões sobre a média da
população µ e sua proximidade do valor conhecido (µ). Para um número pequeno de resultados, usamos um
procedimento similar ao teste z, exceto que o teste estatístico é o teste-t.

(eq. 2)

Muitas vezes torna-se necessário comparar as variâncias (ou desvios padrão) de duas populações. Por exemplo,
o teste-t normal demanda que os desvios padrão dos conjuntos de dados, que estão sendo comparados, sejam iguais. Um
teste estatístico simples, chamado teste F, pode ser utilizado para avaliar essa consideração sob a condição de que as
populações sigam uma distribuição normal (gaussiana). O teste F também é empregado na comparação de mais de duas
médias e na análise de regressão linear, onde GL1 e GL2 correspondem aos graus de liberdade do numerador e
denominador, respectivamente.
𝑠
𝐹( , ) = (eq. 3)
𝑠
8

No caso da comparação de medidas de dois conjuntos de dados experimentais, ambos os conjuntos com poucos
resultados, podemos empregar o teste t com variância agrupada (n1 + n2 – 2 graus de liberdade). Neste caso, porém, é
necessário que não haja uma diferença significativa entre as variâncias (teste F).

(eq. 4)

(eq. 5)

Porém, se as variâncias dos conjuntos de dados não forem da mesma ordem de grandeza (iguais), então não é
recomendado a obtenção de um desvio padrão global (combinado) a partir dos mesmos. Nesse caso, utilizamos o teste-
t com variância não agrupada:

(eq. 6)

GL (graus de liberdade) = (eq. 7)

Analistas frequentemente fazem uso de pares de medidas da mesma amostra para minimizar fontes de
variabilidade que não são de interesse. Por exemplo, na comparação de dois métodos (ou laboratórios diferentes,
analistas ou grupos de analistas diferentes) de determinação de um analito, por exemplo, ácido acético (acidez) em
vinagre, o método A pode ser utilizado em amostras escolhidas aleatoriamente a partir de cinco fabricantes e o método
B, em amostras de cinco outros fabricantes. Poderia haver alguma variabilidade, entretanto, devido às diferenças nos
níveis de ácido acético de cada fabricante.
Uma maneira mais adequada de se comparar os métodos seria pelo uso de ambos nas mesmas amostras e,
então, focalizar nas diferenças. O teste-t pareado usa o mesmo tipo de procedimento do teste-t normal, exceto que
analisamos pares de dados. O desvio padrão agora é o desvio padrão da diferença nas médias (sd). Nossa hipótese nula
é H0: µd = 0, em que 0 é um valor específico da diferença a ser testado, frequentemente zero. O valor do teste
estatístico é:

(eq. 8)

em que o somatório da diferença média igual a . A hipótese alternativa (Ha) poderia ser µd ≠ 0, µd  0
ou µd  0.
O teste-Q é um teste estatístico simples, amplamente utilizado para se decidir se um resultado suspeito deve ser
mantido ou rejeitado. Nesse teste, o valor absoluto da diferença entre o resultado questionável xq e seu vizinho mais
próximo xp é dividido pela faixa f do conjunto inteiro para dar a grandeza Q:

(eq. 9)

Essa razão é então comparada com o valor crítico Qcrít, encontrado na Tabela 1. Se Q for maior que Qcrít, o
resultado questionável pode ser rejeitado, com o grau de confiança indicado. Aplica-se este teste da seguinte forma:
1. Colocam-se as medidas obtidas em ordem crescente;
9

2. Determina-se a diferença entre o menor e o maior valor da série de medidas (faixa);


3. Determina-se a diferença entre o menor valor da série e o valor mais próximo;
4. Divide-se esta diferença pela faixa (obtida em 2), obtendo-se um valor de Q;
5. Se Q > Qcrit (olhar Figura 3), o menor valor é rejeitado;
6. Se o menor for rejeitado, determina-se nova faixa para os valores restantes e testar o maior da série;
7. Se o menor é aceito o maior é testado;
8. Repetir o procedimento até que o menor e o maior valor sejam aceitos;
9. Quando temos uma série de 3 medidas, aparentemente um valor é duvidoso, portanto, aplica-se somente uma vez o
teste Q.
A Região de rejeição de um teste estatístico pode ser unicaudal (uma cauda) ou bicaudal (duas caudas). No
unicaudal é postulada a direção da diferença e a zona de rejeição fica à direita ou à esquerda da distribuição. No bicaudal
H0 postula a diferença entre as médias, mas não a direção das diferenças. Neste caso, a área de rejeição estará dividida
por duas áreas da curva. Erro a considerar: (i) falsa a hipótese verdadeira – Erro tipo I e (ii) Verdadeira a hipótese falsa
– Erro tipo II. No Erro tipo I quando se rejeita a hipótese nula (falsa) e, no entanto, ela é verdadeira. A probabilidade de
se cometer esse tipo de erro é igual ao nível de significância. Quanto maior é o nível de significância, maior é a
probabilidade de se cometer esse erro. Já no Erro tipo II quando se aceita como verdadeira a hipótese nula e, no entanto,
ela é falsa. Isso quer dizer: aumenta a área de aceitação e diminui a de rejeição. Pode-se diminuir a probabilidade de se
cometer os dois tipos de erro aumentando-se o tamanho da amostra.

1.3. Procedimento
1.3.1. Comparação de medidas repetidas
a) Preparo das amostras
Transferir 5,00 mL do vinagre 1, com auxílio de uma pipeta volumétrica (ver seção 3.3 – pipetas em 3. Medidas
de Volume), para balão volumétrico de 50,0 mL e completar o volume até a marca de aferição com água destilada
(ajustar o menisco com pipeta Pasteur).

b) Titulação volumétrica
Com uma pipeta volumétrica, transfira uma alíquota de 3,00 mL da amostra preparada anteriormente para um
erlenmeyer de 125 mL e dilua aproximadamente a solução até 50,0 mL com água destilada. Adicione 2,00 gotas de
indicador fenolftaleína e titule a solução cuidadosamente com a solução padrão de NaOH ___mol/L até o aparecimento
de uma leve coloração rósea, que persista por 30 segundos. Anote o volume gasto. Repita o procedimento para mais 4
replicatas (Tabela 1).

Tabela 1 - Comparação dos teores de ácido acético (HAc) em % m/v obtidos pelos Grupo A e B após análise
volumétrica* de replicatas de uma (1) amostra de vinagre.
Amostra Grupo A Grupo B**
(Vinagre 1) VNaOH*** [HAc] (% m/V) VNaOH*** [HAc] (% m/V)
1
2
3
4
5
Média - -
Desvio padrão - -
Valor esperado**** - -
*A titulação deve ser feita por diferentes estudantes; **Não há necessidade de refazer os cálculos já feitos pelo “Grupo
B”; *** Volume de titulante gasto na titulação em mililitros (mL); ****Checar o valor no rótulo da amostra escolhida.
Ambos os grupos devem comparar a mesma amostra.
10

1.3.2. Comparação de médias de dados em pares


1.3.2.1. Preparo das amostras
Transferir 5,00 mL de cada vinagre (2 – 6), com auxílio de uma pipeta volumétrica, para um balão volumétrico
de 50,0 mL e completar o volume até a marca de aferição do com água destilada (obs.: usar pipeta Pasteur para ajustar
o menisco).
Obs.: No caso da necessidade de reutilizar a pipeta Pasteur para ajustar o menisco proceda da seguinte forma:
puxar água destilada três (3) vezes e descartar. Após esse procedimento a pipeta estará pronta para ao uso.

1.3.2.2. Titulação volumétrica


Transferir uma alíquota de 3,00 mL das amostras preparadas anteriormente, com o auxílio de uma pipeta
volumétrica, para cada erlenmeyer, adicionar aproximadamente 50,0 mL de água destilada e 2,00 gotas de indicador
fenolftaleína em cada erlenmeyer. Cada mistura é cuidadosamente titulada com solução padrão de NaOH  0,100 mol/L
até o aparecimento de uma leve coloração rósea, que persista por 30 segundos. Anote o volume gasto.

Tabela 2 – Comparação dos resultados de teores de ácido acético (HAc) em % m/v obtidos pelos grupos A e B após
análise volumétrica* de diferentes amostras de vinagres.
Grupo A Grupo (B)*** Diferença
Amostra
VNaOH*** [HAc] (% m/V) VNaOH*** [HAc] (% m/V) [A] - [B]
Vinagre 1***
Vinagre 2
Vinagre 3
Vinagre 4
Vinagre 5
Desvio padrão (s) - - -
Média da diferença - - - -
Desvio padrão da diferença
- - - -
(sd)
*A titulação deve ser feita por diferentes estudantes; **Não há necessidade de refazer os cálculos já feitos pelo “Grupo
B”; ***Volume de titulante gasto na titulação (mL); ****Usar média Tabela 1.

1.4. Relatório
a) Todos os cálculos devem ser realizados com quatro casas (x,xxxx). O arredamento deve ser feito apenas no valor
final considerando dois (2,0) algarismos significativos. Considerar um nível de confiança de 95% (p = 0,05) para todos
os cálculos. Observar atentamente os valores de acidez nos rótulos das amostras de vinagre. Identificar o tipo de vinagre
usada (maça, balsâmico, álcool, colorido, etc.).
b) Para o procedimento 1.3 determine:
b1) O intervalo de confiança (IC) para a média obtida pelo grupo (n = 5)
b2) O intervalo de confiança (IC) pela média geral (n = 10, grupo A + grupo B). Obs.: Incluir no relatorias as tabelas
com os dados utilizados nos itens (b1) e (b2)
c) Aplicar antes o teste-Q para os dados de concentração de ácido acético calculados no item (b1) e (b2).
d) Para o procedimento 3.1 compare o valor determinado pelo grupo com o estipulado pelo fabricante (rótulo)
empregando o teste-t mais adequado; verifique se os resultados experimentais são ou não diferentes do esperado, num
nível de 95 % de confiança.
e) Para o procedimento 3.1 compare o valor determinado pelo grupo com o determinado pelo outro grupo empregando
o teste-t mais adequado (teste-F); verifique se os resultados experimentais são ou não diferentes do esperado, num nível
de 95 % de confiança.
f) Para o procedimento 3.2 faça a análise de variância (teste F) dos conjuntos de dados e avalie a aplicabilidade do uso
do teste-t pareado para comparar os resultados experimentais do grupo A e do grupo B, num nível de 95 % de confiança.
Obs.: mesmo que H0 seja rejeitado o teste deve se aplicado.
g) Conclusões a respeito de cada teste estatístico aplicado aos conjuntos de dados (itens a-d).
11

1.5. Referências
Harris, D.C. Análise Química Quantitativa, 7ª ed, Rio de Janeiro: LTC, 2008, 886p.
Miller, J.N.; Miller, J.C. Statistics and Chemometrics for Analytical Chemistry, 4a Ed. Person Education, 2005.
Skoog, D.A., West, D.M., Holler, F.J. E Crouch, S.R. Fundamentos de Química Analitica, 1a ed., Thomson, 2006.

Figura 1. Distribuição-t de Student

Figura 2. Valores críticos de F para um teste de duas caudas (P = 0,05)

Figura 3. Valores críticos para o coeficiente de rejeição Q.

Você também pode gostar