Você está na página 1de 24

14/05/2021

TÉCNICAS ESTATÍSTICAS
APLICADAS À
LABORATÓRIOS

Dra Milene Luz

TÉCNICAS ESTATÍSTICAS
APLICADAS À
LABORATÓRIOS

TESTE DE HIPÓTESE
14/05/2021

O que fazem os testes de hipótese?


 Admite-se um valor hipotético para um parâmetro populacional, e
com base nas informações da amostra realizaremos um teste
estatístico, para aceitar ou rejeitar esse valor.

 A decisão é sujeita a erros, uma vez que são tomadas em


condições de incerteza de acordo com os elementos de uma
amostra.

 Podemos dimensionar a probabilidade (ou risco) da decisão de


aceitar ou rejeitar uma hipótese estatística.
população
amostra

Tratamento
estatístico
Inferência
estatística

Hipóteses estatísticas

 Trata-se de uma suposição quanto ao valor de um parâmetro


populacional, ou quanto à natureza da distribuição de
probabilidade de uma variável populacional.

 Exemplos

 Peso médio da população da cidade X é 65 kg


 A proporção de pessoas loiras é de 40%
 Homens e mulheres realizam certa tarefa num mesmo intervalo
de tempo
 O pH da água de abastecimento é 6,8
 O teor de ferro no minério de ferro é de 75,5%
14/05/2021

O que são os testes de hipótese?

 É uma regra de decisão para aceitar ou rejeitar uma hipótese


estatística populacional com base nos elementos amostrais.

 Para testar um parâmetro populacional, devemos afirmar,


cuidadosamente, um par de hipóteses:
 Uma hipótese representa a afirmação  hipótese nula (H0)
 Outra representa o seu complemento  hipótese alternativa (H1)

 Quando uma dessas hipóteses for falsa, a outra deve ser verdadeira

Tipos de hipóteses
 A hipótese nula (H0) é uma hipótese estatística que contém uma
afirmação de igualdade, tal como ≤, =, ≥

 A hipótese alternativa (H1) é o complemento da hipótese nula.


 É a afirmação que deve ser verdadeira se H0 for falsa e contém uma
afirmação de desigualdade estrita, tal como >, ≠, <

vc

 EX : Possibilidades para testes da média populacional:

Teste unilateral ou unicaudal


Teste bilateral ou bicaudal H0 : µ = k H0 : µ = k
H1 : µ > k H1 : µ < k
H0 : µ = k
H1 : µ ≠ k
H0 : µ ≤ k H0 : µ ≥ k
H1 : µ > k H1 : µ < k
(mais utilizado)
14/05/2021

 Em um teste de hipótese, sempre partimos do pressuposto que a


hipótese nula H0 é verdadeira.
 Podemos tomar uma dessas decisões:
 Aceitar H0, rejeitando H1
 Rejeitar H0, aceitando H1

 Pelo fato da decisão ser baseada em uma amostra ao invés de


ser baseada na população, há sempre a possibilidade de
tomarmos a decisão errada.

Moeda, que eu acho ser tendenciosa, lançada 100 vezes


a) 49 caras e 51 coras  não há evidências para apoiar a minha
afirmação
b) 21 caras e 79 coroas  há evidências... Mas não tenho 100% de
certeza.. Pode ser um resultado incomum.

Como escrever as hipóteses?


 Se p representa a proporção de caras, a afirmação “a moeda é
tendenciosa” pode ser escrita como a afirmação matemática
p ≠ 0,5;
 O complemento “a moeda é imparcial” é escrita por p = 0,5.

 Então as hipóteses nula e alternativas são:


 H0 : p ≠ 0,5 (afirmação)
 H1: p = 0,5

 LEMBRE-SE:
 a única maneira de ter certeza absoluta se H0 é verdadeira ou falsa
é testando toda a população
 Pelo fato da sua decisão ser baseada em uma amostra, aceite
que sua decisão pode estar errada
14/05/2021

Erros

realidade
H0 verdadeira H0 falsa
Aceitar H0 Decisão correta (1-) Erro tipo II (β)
decisão
Rejeitar H0 Erro tipo I () Decisão correta (1-β)

Erro tipo I e tipo II


 Erro do tipo I : rejeitar a hipótese nula quando ela é verdadeira e
absoluta;

 Erro do tipo II: é o erro que ocorre quando a análise estatística dos
dados não consegue rejeitar uma hipótese, no caso desta hipótese
ser falsa.

 Para um mesmo tamanho de amostra, a probabilidade dos Erros


tipo I e II são inversamente proporcionais;
 A redução simultânea dos Erros poderá ser alcançada pelo
aumento do tamanho da amostra, evidentemente com aumento
de custos.
 Normalmente, ao se testar uma hipótese, é definido o nível de
significância do Erro do tipo I;
14/05/2021

Nível de significância
 É a maior probabilidade máxima permissível para cometer um Erro
tipo I, ou seja, o nível de significância é igual ao valor de  (alfa);
 Os testes de hipóteses são normalmente realizados fixando o seu
nível de significância (5%, 1% e 0,1%);
 Ao fixar um nível de significância de 5% num determinado teste,
estamos a afirmar que em 5% das vezes rejeitaremos a hipótese
nula sendo esta verdadeira;
 Diferentes níveis de significância poderão levar a conclusões
diferentes. É possível, para um mesmo caso, rejeitar a hipótese nula
a um nível de significância de 5% mas já não a rejeitar a um nível
de significância de 1%;

realidade
H0 verdadeira H0 falsa
Aceitar H0 Decisão correta (1-) Erro tipo II (β)
decisão
Rejeitar H0 Erro tipo I () Decisão correta (1-β)

E por que não usamos β?

 Dificilmente será possível determinar a probabilidade β (beta) de


um Erro tipo II.

 1 – β  poder do teste
 Representa a probabilidade de rejeitar a hipótese nula quando a
hipótese alternativa for verdadeira.
14/05/2021

Etapas do Teste de hipótese


 Passo 1: desenvolver as hipóteses nula e alternativa
 lembre-se que , para
 H0 você deve utilizar um desses símbolos: ≥, =, ≤
 H1 você deve utilizar um desses símbolos: >, ≠ , <
 Passo 2: definir o nível de significância  (alfa)
 Passo 3: escolher uma estatística de teste adequada
 Passo 4: retirar uma amostra e calcular o valor da estatística do teste
utilizando a fórmula adequada para obter o valor calculado.
 Passo 5: obter o valor crítico do teste de acordo com o nível de
significância  (alfa) utilizando a tabela de distribuição
correspondente
 Passo 6: interpretar o resultado obtido por comparação.

 OBS: o resultado obtido pode ser apresentado de duas formas:


 p-valor
 região crítica

Nível descritivo ou p-valor

 Quando o teste de hipóteses é feito em computador, através de


programa estatístico, recebemos como output o p-valor (p-value),
nível descritivo ou probabilidade de significância do teste;

 p-valor  corresponde à probabilidade associada ao valor


observado da amostra

 Tradicionalmente, o valor de corte para rejeitar a hipótese nula é


de 0,05, o que significa que, quando não há nenhuma diferença,
um valor tão extremo para a estatística de teste é esperado em
menos de 5% das vezes.
14/05/2021

Regra de decisão para p-valor


 A) se p-valor ≤ alfa  rejeitamos H0 // aceita H1  existe diferença
significativa entre os valores comparados
 B) se p-valor > alfa  aceitamos H0 // rejeita H1  não é possível
concluir que existe diferença significativa entre os valores
comparados
 Valores pequenos de p-valor evidenciam que a hipótese nula é
falsa pois, ou seja, existe uma probabilidade muito pequena da
hipótese nula H0 ser verdadeira.
 p-valor é considerado pequeno desde que esse valor seja menor
que o valor de alfa.
 Quanto menor o p-valor do teste, mais evidência há para se
rejeitar a hipótese nula H0  um p-valor muito pequeno indica um
evento incomum.

Região Crítica
 fixar a região crítica do teste com base no  (alfa) estabelecido
 rejeitar a hipótese nula se a estatística calculada pertencer à
região crítica

H1 < VC H1 > VC H1 ≠
Teste unilateral Teste unilateral Teste bilateral
à esquerda à direita
14/05/2021

Regra de decisão para região crítica

 Se o valor observado  região crítica, então rejeite H0


 Se o valor observado  região crítica, então aceite H0

Testes de hipóteses no laboratório?

 Comparação de valores medidos com:

 Valor tabelado
 Valor conhecido
 Valor de referência
 Valor aceito como verdadeiro

Testes paramétricos e testes não paramétricos


 Existem dois tipos de testes:
 Os testes paramétricos (também chamados teste t):
 Exigem que as amostras possuam distribuição normal, especialmente
se tiverem uma dimensão inferior a 30;
 Nas amostras de dimensão acima de 30, a distribuição aproxima-se da
normal e também se aplicam os testes t.
 Os testes não paramétricos:
 Não necessitam de requisitos tão fortes, como a normalidade, como os
testes paramétricos, para serem usados;
 São indicados para amostras pequenas (10 < n < 50);
 São usados quando a distribuição não é normal ou quando não se
pode pressupor que são normais;
 DESVANTAGEM: não são tão potentes quanto os testes paramétricos,
ou seja, com testes não paramétricos não se encontram tantas
diferenças entre os dados, quando essas diferenças realmente existem.
14/05/2021

TÉCNICAS ESTATÍSTICAS
APLICADAS À
LABORATÓRIOS

INTERVALO DE CONFIANÇA
(ESTIMATIVA DE PARÂMETROS)

Estimativa de parâmetros

 É um processo de indução, na qual usamos dados extraídos de


uma amostra para produzir inferência sobre a população.

 Esta inferência só será válida se a amostra for significativa.

 Tipos de Estimativa de Parâmetros


 Estimativa Pontual
 Estimativa Intervalar
14/05/2021

Nível de significância X nível de confiança

 Nível de significância 𝛼 (alfa) é a probabilidade máxima permissível


para cometer um Erro tipo I;

 Se um teste de hipótese for realizado, o nível de confiança 𝜸


(gama) é o complemento do nível de significância
𝜸=1-𝛼

 O nível de confiança 𝜸 é a probabilidade de que a estimativa


intervalar contenha o parâmetro populacional que está sendo
estudado.

Estimativa Pontual

 É usada quando a partir da amostra procura-se obter um único


valor de certo parâmetro populacional, ou seja, obter
estimativas a partir dos valores amostrais.

 Principais estatísticas:
 Média Amostral
 Proporção Amostral
 Variância Amostral

X
14/05/2021

Estimativa Intervalar (intervalo de confiança)


 É a construção de um intervalo que contenha o valor
desconhecido do parâmetro populacional a ser estudado com
uma probabilidade de 1- 𝛼 (nível de confiança);
 𝛼 é o nível de significância, isto é, o erro que se estará cometendo
ao afirmar que o parâmetro está entre o limite inferior e o superior
calculado.

Um intervalo de confiança com nível


de confiança de 90% reflete um nível
de significância de 10%, ou seja,
existe 10% de chances do valor de
um parâmetro estar fora do IC.

IC para a média populacional (µ) com a


variância (σ²) conhecida
 Para populações infinitas, a variável normal padrão de µ será denominada
Zobservado

𝑋 − µ
𝑍= Zobs = Xbar −
𝜎  

Distribuição normal padrão

 Para populações finitas, deve-se acrescentar o fator de correção


populacional ao calculo de Zobservado

Zobs = Xbar −  
 

 O fator de correção deve ser usado sempre que tivermos n/N > 0,05

N = tamanho da população
n = tamanho da amostra
14/05/2021

IC para a média populacional (µ) com a


variância (σ²) desconhecida
 Quando temos pequenas amostras e não conhecemos o desvio
padrão populacional, construímos intervalos de confiança para a
média populacional utilizando a distribuição t de Student para
encontrar os valores críticos (tc) com (n-1) graus de liberdade.

 Populações infinitas  IC = 𝑋𝑏𝑎𝑟 ±  

 
( )
 Populações finitas  IC = 𝑋𝑏𝑎𝑟 ±    
( )

 N = tamanho da população
 n = tamanho da amostra

Características de uma distribuição t Student


 Tem a forma de sino e é
simétrica em relação à média;
 É uma família de curvas, cada
uma é determinada por um
grau de liberdade (n-1);
 A área total sob a curva é 1 ou
100%;
 A média, moda e mediana são
iguais;
 Conforme os graus de
liberdade aumentam, a
distribuição t se aproxima da
distribuição Normal;
 Quando os graus de liberdade
forem superiores a 30, a
distribuição é igual a normal
14/05/2021

 Para calcular o IC da média populacional µ é necessário utilizar a


tabela de distribuição t Student para determinar os valores t críticos
conforme o nível de significância 𝛼 e os graus de liberdade (n-1);

nível de confiança 𝛾: 95%

nível de significância α: 5%

p=α

Como Determinar o valor de tc


14/05/2021

Exemplo tamanho da amostra (n)


média (Xbar)
12
281,3333

n Xi desvio padrão amostral (S) 38,2369


graus de liberdade (n-1) 11
1 337
nível de confiança (𝜸) 95%
2 294 nível de significância (𝛼) 0,05
3 245 t crítico (tc) 2,201
4 235
5 326
6 321 INTERVALO DE CONFIANÇA 24,295
limite inferior 257,0
7 244
limite superior 305,6
8 322
9 240
10 276 𝑡𝑐 𝑆
IC = 𝑋𝑏𝑎𝑟 ±  
11 286 𝑛
12 250
[257,0; 305,6]
resultado
257,0 ≤ µ ≤ 305,6

Interpretação: existe 95% de probabilidade do intervalo [257,0; 305,6]


conter a média verdadeira µ.

TÉCNICAS ESTATÍSTICAS
APLICADAS À
LABORATÓRIOS

TESTES t-STUDENT
(testes de hipóteses para médias)
14/05/2021

Teste t

 É o teste de hipótese mais conhecido


 Ferramenta estatística usada para:
 representar um intervalo de confiança (IC)
 calcular a probabilidade de que um certo valor esteja em um
certo intervalo de dados (distribuição normal)
 comparar resultados  avaliar se há diferença significativa
entre as médias de duas amostras
comparar uma média amostral com um valor hipotético ou
com um valor alvo (valor de referência) para uma amostra.
comparar as médias de dois grupos com um teste t para
duas amostras
Comparar parâmetros pareados.

Características de uma distribuição t Student

 Tem a forma de sino e é


simétrica em relação à média;
 É uma família de curvas, cada
uma é determinada por um
grau de liberdade 𝜐 (n-1);
 A área total sob a curva é 1 ou
100%;
 A média, moda e mediana são
iguais;
 Conforme os graus de
liberdade aumentam, a
distribuição t se aproxima da
distribuição Normal;
 Quando os graus de liberdade
forem superiores a 30, a
distribuição é igual a normal
14/05/2021

Amostras dependentes x amostras


independentes
 Amostras independentes: uma amostra selecionada de uma
população não se relaciona com a amostra de uma segunda
população.

A B
 Amostras dependentes/pareadas/relacionadas: quando cada
membro de uma amostra corresponde a um membro da outra
amostra.

1 Regra que você tem que lembrar!!

 O teste t compara os resultados de DUAS variáveis

 Ou seja, uma com a outra

 Não se compara 3 ou mais amostras com teste t, para mais que as


2 amostras usamos a ANOVA, mas isso será visto em outra aula!!!
14/05/2021

Tipos de teste t

 Os testes t recebem essa denominação porque os resultados do


teste são todos baseados na distribuição t-Student.

 teste para amostras dependentes  Teste t-pareado

 teste t independente

 Teste t para uma população

TÉCNICAS ESTATÍSTICAS
APLICADAS À
LABORATÓRIOS

TESTE t-STUDENT
PARA UMA POPULAÇÃO
14/05/2021

Teste t-Student para uma população

 É utilizado quando um material de referência padrão (MRC) ou


outro material, cuja concentração do analito pode ser tomada
como valor verdadeiro (Xv), é analisado pelo método em estudo.

 Se não houver erro sistemático associado ao método, o valor


verdadeiro é igual à média da população (μ), assim, pode-se usar
a expressão do cálculo do intervalo de confiança para calcular o
valor de tobs.

 Após a análise do material de referência calcula-se a média e o


desvio padrão e substituem-se esses valores na expressão do IC
juntamente com o valor verdadeiro e calcula-se o valor de tobs.

 O valor de ttab é obtido a partir no nível de significância 𝛼


previamente estipulado.

Estatística para o teste t

 A partir da expressão para IC, isola-se o valor de t.

Xbar = média amostral


S = desvio padrão amostral
µ = valor verdadeiro ou de referência
n = número de elementos da amostra
14/05/2021

Critério de aceitação

 tobs < ttab  a média é estatisticamente igual ao valor verdadeiro e


a diferença no valor numérico é devido apenas a erros aleatórios.
 H0: µ = Xbar  aceita-se a hipótese nula

 Tobs > ttab  a média é diferente do valor verdadeiro e há erros


determinados associados ao método.
 H0: µ ≠ Xbar  rejeita-se a hipótese nula

Exemplo
 Com a finalidade de avaliar um método em desenvolvimento foi
utilizado um MRC com princípio ativo X de 53,6 ppm e nível de
confiança de 95%. Os resultados encontrados foram

n Xi

1 48,7

2 49,3
𝜐 =𝑛−1
3 50,1

Xbar 49,37 Tobs = 10,44


Ttab = 4,303
S 0,702
Tobs > Ttab Rejeita-se a hipótese nula.
Existe algum erro no método
14/05/2021

TÉCNICAS ESTATÍSTICAS
APLICADAS À
LABORATÓRIOS

TESTE GRUBBS
(Teste de hipótese para
detecção de outliers)

Outliers
 um outlier é uma observação atipicamente grande ou pequeno

 são dados que apresentam um comportamento bem distinto dos


demais dados da amostra, podendo representar erros:
 por falha humana: erros de digitação, leitura errônea do
display,etc
 nos equipamentos: calibração inadequada, erro instrumental,
contaminação, etc

 O desvio padrão representa a variação dos dados a partir da


média e assim como esta, é influenciado por outliers que podem
elevar o valor drasticamente

 Importante detectar os outliers e entender as causas que os


geraram
14/05/2021

Causas x ações típicas de outliers

CAUSA AÇÕES POSSÍVEIS


Erro na entrada de dados Corrija o erro e analise os
dados novamente
Problema no processo Investigue o processo para
determinar a causa do outlier
Fator faltante Determine se você deixou de
considerar um fator que afeta
o processo
Ocorrência aleatória Investigue o processo e o
outlier para determinar se o
outlier ocorreu por acaso;
Faça a análise com e sem o
outlier para ver seu impacto
sobre os resultados
14/05/2021

Teste de Grubbs

 É similar ao teste Q (de Dixon), só que é utilizado para qualquer


tamanho de conjunto de dados

Teste Q comparação Teste G

Valor mais próximo Valor Valor médio


suspeito
Amplitude Desvio padrão

 Representado pela letra G


 Muito utilizado para avaliar a discrepância de resultados entre
laboratórios.

Estatística do teste

 calcula-se o valor de G para a medida suspeita, que é a razão da


diferença entre o valor suspeito e a média dos resultados, com o desvio
padrão (S)

| 𝑣𝑎𝑙𝑜𝑟 𝑠𝑢𝑠𝑝𝑒𝑖𝑡𝑜 − 𝑚é𝑑𝑖𝑎|


𝐺=
𝑆

 Compara-se o valor de G com o valor crítico tabelado, levando-se em


consideração o número de análises e o grau de confiança que se deseja
para a avaliação do resultado.
14/05/2021

Valores críticos do Teste de Grubbs

Procedimento
 Passo 1. Ordenar os dados em ordem crescente;
 Passo 2. Calcular a média ( x ) da amostra de dados sendo
analisada;
 Passo 3. Calcular a diferença do valor suspeito de em relação à
média,
 Passo 4. Calcular o desvio padrão ( s )
 Passo 5. Com base nos resultados dos passos anteriores, calcular o
valor de G para os dados suspeito (menores e maiores valores) do
conjunto
 Passo 6. Comparar o valor de G , com o valor crítico tabelado,
representado por Gcrít conforme nível de significância

 Se G > Gcrít  rejeita valor (é considerado um outlier);


 Se G ≤ Gcrít  aceita valor (não é considerado um outlier)

Você também pode gostar