Escolar Documentos
Profissional Documentos
Cultura Documentos
Intervalo de confiança
IC para m = xm ± z/√N
Assim, por exemplo, para uma média amostral de 1 e desvio-padrão de 0,1, se forem feitas
4 medidas, para um intervalo de confiança de 95,4% temos:
t = (xm – )/(s/√N)
NC = (1 – ) x 100%
Teste de Hipóteses
Em muitas ocasiões em trabalhos científicos, de engenharia e mesmo periciais, é preciso
se tomar decisões baseado nos dados que se possui. O teste de hipóteses é uma ferramenta
importante para isto.
O teste de hipótese é particularmente útil para testar a validade de modelos teóricos
propostos. Se os resultados experimentais concordam com o modelo podemos desenvolvê-lo mais
e continuar usando-o. Caso contrário, precisamos descartá-lo ou aprimorá-lo.
Com freqüência é necessário se julgar se a diferença entre números é resultado de
flutuações aleatórias presentes em todas análises, ou resultado de erros sistemáticos. A hipótese
nula diz que os resultados são iguais, enquanto a hipótese alternativa afirma o contrário.
O primeiro tipo de teste de hipótese é aquele onde se compara a média de um conjunto de
dados com um valor conhecido. Este caso ocorre, por exemplo, quando se tem um valor padrão ou
de referência e deseja-se comparar uma amostra analisada com este valor de referência. Este
valor é representado por 0.
A hipótese nula é descrita como = 0. Já a hipótese alternativa pode ser formulada de
maneiras diferentes 0 (teste bicaudal), 0, 0 (testes monocaudais). Para testar estas
hipóteses temos dois casos gerais.
Primeiramente, quando conhecemos ou temos um bom número de amostras para supor
que s = , devemos utilizar o teste z, que consiste em colocar a hipótese nula, formular o teste
estatístico z = (xm - 0)/(/√N) e testar a hipótese nula, como se segue:
Onde scomb é o valor combinado do desvio-padrão das duas amostras. O número de graus
de liberdade é de N1 + N2 – 2. Este teste é usado para o caso de se considerar que o desvio
padrão das duas amostras é parecido de forma que se pode usar o valor s comb. Caso se acredite
que os valores de desvio são diversos, pode-se usar o teste t para duas amostras, mas este é
complexo e o número de graus de liberdade é calculado de uma forma mais complexa. É possível
também realizar o teste para mais de duas amostras. Este caso é mais complexo e dificilmente
cairá em um concurso, de forma que não trataremos dele.
Outro tipo de teste de hipótese envolve o uso de dados pareados. Suponhamos, por
exemplo, que um perito deseja testar a resposta de um novo método de análise sanguínea. Ele
poderia usar o sangue de 5 voluntários e testar um dos métodos e usar outros 5 e testar o segundo
método. Porém ficaria a dúvida sobre a diferença entre as amostras analisadas. O que ele faria
então é testar as mesmas amostras nos 2 testes. Neste caso ele testaria a diferença entre os
resultados de cada análise e usaria o parâmetro t expresso por:
t = (dm – 0)/(sd/√N)
Onde dm é a diferença média dada por di/n, e 0 é um valor específico de diferença a ser
testado.
Além dos testes de médias, temos também os testes de hipótese envolvendo variâncias,
que são usados nos casos onde se deseja comparar o desvio-padrão de duas populações, ou de
outra forma, testar a precisão comparativa entre métodos. Caso se admita estar tratando com duas
populações que seguem uma distribuição normal, pode-se usar o teste F de Schneider. Este teste
tem como hipótese nula H0: 1 = 2 . O parâmetro f é dado por s1 /s2 e é também tabelado para
2 2 2 2
Uma premissa básica das decisões tomadas nos testes de hipóteses é que há erros
envolvidos. Assim, quando dizemos que com um nível de confiança de 95% que duas amostras
são diferentes, isto significa que existe 5% de chance de estas serem iguais. O erro que resulta de
rejeitar a hipótese nula quando esta é verdadeira é chamado de erro do tipo I. Porém existe
também a chance de aceitar H0 quando esta é falsa. Este erro é chamado de erro do tipo II. A
probabilidade de cometer um erro do tipo I é o , enquanto a probabilidade de cometer o erro do
tipo II é chamada de . Os dois tipos de erros são diretamente relacionados, de forma que ao
diminuir a chance de cometer um erro do tipo I aumentamos a chance de cometer um erro do tipo
II, e vice-versa. Quem está envolvido na análise deve ponderar quais dos tipos de erros é mais
grave para balancear sua escolha.
Q = I xq – x p I / f
Onde o módulo da diferença entre o valor anômalo e o valor mais próximo é dividido pelo
valor da amplitude total, ou seja, a diferença entre o maior valor medido e o menor. O valor de Q é
tabelado. Apresentamos alguns valores na Tabela 4.
Outros exercícios
1 – Um exame antidoping está sendo testado para determinar indiretamente uma ampla gama de
substâncias que elevam o desempenho de atletas, mas também afetam o nível de um hormônio.
Uma atleta foi submetida a este exame em um período e os resultados estão abaixo (em g/mL):
1108 1122 1075 1099
Como o valor permitido neste teste é de g/mL e o para aprovação era necessário que o valor
permitido estivesse no intervalo de confiança da amostra a 80%, a atleta foi reprovada. Seu
advogado entrou com um pedido liminar pedindo um novo teste, alegando que o intervalo de
confiança estava muito limitado. Ele alegou também que fosse o nível de confiança 95% para o
intervalo de confiança sua cliente teria sido considerada aprovada. Sabendo que o desvio padrão
para este teste é de 19 g/mL, a alegação do advogado é verdadeira.
Correto
A média da amostra da atleta é (1108+1122+1075+1099)/4 = 1101. Temos que s = 19, e como o
desvio-padrão é conhecido usamos o teste z. Os valores de z para 80% de confiança e 95% de
confiança são (da Tabela 1) 1,28 e 1,96. Portanto, o intervalo de confiança é dado por:
IC = xm ± z/√N
IC80% = 1101 ± 1,28.19/√4 = 1101 ± 12,16
IC95% = 1101 ± 1,96.19/√4 = 1101 ± 18,62
Portanto no intervalo de confiança a 80% o valor permitido, de 1085 g/mL, não está contido pois o
valor mínimo do intervalo de confiança é de 1101 – 12,16 = 1088,9 g/mL. Realmente para 95% de
confiança o valor estaria contido, e a atleta seria aprovada, pois o valor mínimo seria de 1101 –
18,62 = 1082,4 g/mL.
2 – O promotor do caso acima considerado sugeriu que se refizesse então o teste com o nível de
confiança de 95%, mas aumentando o número de amostras colhidas para 16 ao invés de 4 como
inicialmente. O advogado aceitou a proposta. Caso a média das 16 amostras seja igual ao do
primeiro teste a atleta será aprovada.
Errado
Se a média se mantiver então teremos xm = 1101 novamente. O valor de z para 95% de confiança
é de 1,96 e o desvio-padrão já foi definido como sendo 19 g/mL. Acontece que, por conta da
sugestão do promotor agora N = 16 ao invés de 4. O novo intervalo de confiança é, portanto, de:
IC = xm ± z/√N = 1101 ± 1,96.19/4 = 1101 ± 9,31
Portanto, o intervalo de confiança se tornou mais rigoroso do que antes e a atleta seria ainda mais
facilmente reprovada. Se o advogado estudasse estatística...
3 – Um perito analisou uma amostra de um composto desconhecido. No horário de almoço ele
propôs uma aposta para um colega APF. Após dizer que tinha realizado 3 medidas e encontrado
os valores de 10, 12 e 14 para a concentração desconhecida e que o desvio-padrão destas 3
amostras era igual ao desvio-padrão total, ele apostou que o APF não adivinharia quantas
amostras ele analisou no total, se o resultado para 95% de confiança foi de 11,5 ± 1,0. O APF após
pensar um bom tempo respondeu que ele tinha feito 16 análises. Nesta situação podemos dizer
que o perito ganhou a aposta.
Errado
A média para a amostra que ele falou é de (10+12+14)/3 = 12. O desvio-padrão da amostra é de s
= raiz ((xi – ) /(n-1)) = raiz {[(10-12) +(12-12) +(14-12) ]/2} = raiz (8/2) = 2. Para 95% de
2 2 2 2
Correto
Inicialmente o desvio-padrão não era conhecido, de forma que o IC precisou ser calculado pelo
valor de t. O desvio-padrão amostral é descoberto por:
xi = 0,084 + 0,089 + 0,073 = 0,252
xi = 0,007056 + 0,007921 + 0,006241 = 0,021218
2 2 2
=> s = raiz [(xi – (xi) )/n)/(n-1)]
2
s = raiz [(0,021218 – 0,252 /3)/2] = 0,0050%
Portanto o segundo IC é duas vezes menor que o primeiro realmente. Percebe-se que o simples
fato de se afirmar que s = diminui o IC de modo significativo.
5 – Na ANP uma turma de 36 alunos do CF estava praticando tiro em um alvo fixo a 50m de
distância e, conforme o lugar onde se acertava o alvo, pontos eram atribuídos. O resultado final da
turma foi de 27,7 ± 5,2 pontos. O instrutor disse que a média das turmas anteriores era de 30,8
pontos e que tinha mais de 99% de confiança de que o resultado da turma não era apenas fruto
de variações aleatórias. Analisando estatisticamente a situação o instrutor está correto.
Correto
Como temos 36 alunos temos bons motivos para acreditar que o desvio-padrão encontrado é uma
boa estimativa de , e podemos usar z. O valor de z para o resultado da turma é de:
z = (xm - 0)/(/√N) = (27,7 – 30,8)/(5,2/√36) = -3,57
O valor de z para 99% de confiança é - de acordo com Tabela 1 - 2,58. Portanto, realmente o valor
encontrado está bem além do valor para 99%, e até mesmo para o valor de 99,9% - que é de 3,29.
Eu recomendaria mais esforço desta turma também...
6 – Um novo procedimento para a determinação de enxofre em querosene foi testado usando um
padrão com concentração conhecida de 0,123% de S. Os resultados foram 0,112; 0,118; 0,115 e
0,119%. Em um nível de confiança de 95% os resultados indicam que o método apresenta um viés
negativo.
Correto
A hipótese nula é H0: 0,123 e a hipótese alternativa é 0,123. Para o teste realizado temos:
xi = 0,112 + 0,118 + 0,115 + 0,119 = 0,464
xi = 0,012544 + 0,013924 + 0,013225 + 0,014164 = 0,053854
2
Então:
xm = 0,464/4 = 0,116 e
2
s = raiz [(0,053854 – 0,464 /4)/(4-1)] = 0,0032%
Desta forma testamos para t:
t = (xm - 0)/(s/√N) = (0,116 – 0,123)/(0,0032/√4) = -4,375
Errado
A hipótese nula é H0: e a hipótese nula é Ha: O teste neste caso é o teste t para duas
médias:
Correto
Trata-se de comparar dados pareados, uma vez que os dois métodos foram usados para as
mesmas amostras. A hipótese nula é H0: ou seja, não há diferença entre os métodos e a
hipótese alternativa é ≠Primeiramente calcula-se a diferença entre os valores:
12 – Um método para determinação de um potente veneno é conhecido após muitas medições por
ter um desvio padrão de 0,21 ppm. Uma modificação deste método gerou s=0,15 ppm para um
conjunto de dados com 12 graus de liberdade. Uma segunda modificação, também com 12 graus
de liberdade, gerou s=0,12 ppm. Baseado nestes resultados podemos afirmar que a segunda
modificação do método é mais precisa, mas nada podemos afirmar sobre a primeira, no nível de
confiança de 95%.
Correto
Precisamos comparar as variâncias dos dois métodos. Primeiramente a primeira modificação:
2 2 2
F1 = spadrão /s1 = (0,21/0,15) = 1,96
Para a segunda modificação:
2 2 2
F2 = spadrão /s2 = (0,21/0,12) = 3,06
Para este caso, o método padrão é reconhecido e pode ser considerado como tendo grau de
liberdade infinito. Consultado a Tabela de F, vemos que para 12 graus de liberdade no
denominador e ∞ no numerador, nível de confiança 95% o valor de F é 2,30. Portanto o valor da
precisão do segundo método modificado é realmente significativo e podemos aceitar a hipótese
alternativa de que 1 ≠ 2 .
2 2
Correto
Um erro do tipo I consiste em rejeitar a hipótese nula sendo que esta é verdadeira. Neste caso,
consiste, portanto, em considerar o suspeito como não sendo culpado quando ele o é. Já o erro do
tipo II consiste em aceitar a hipótese nula quando ela é falsa. Neste caso consiste em considerar o
suspeito culpado quando ele é na verdade inocente. Este tipo de erro é considerado mais grave.
Na prática o perito acaba lidando com situações como estas em seu trabalho e precisa por isso
estabelecer bem o nível em que os erros de cada tipo serão mantidos.
14 – Em uma análise titulométrica foram obtidos os valores de 55,95; 56,00; 56,04; 56,08 e 56,23
mL de titulante. O perito responsável pela análise deve descartar a última medida em um nível de
confiança de 95%.
Errado
A diferença entre o valor anômalo e o valor mais próximo é 56,23-56,08 = 0,15. A amplitude dos
valores é 5,23-55,95 = 0,28.
Portanto, Q = (0,15/0,28) = 0,54
Observando a Tabela 4 vemos que Qcrít é 0,71 para 5 análises e 95% de confiança, portanto o
valor deve ser mantido.
15 – Um perito em treinamento será deixado para trabalhar por conta própria em um aparelho
quando seus resultados forem iguais aos do perito com experiência. Os resultados encontrados
pelo perito em treinamento foram 14,5±0,5 mg/dL em 3 análises e o perito experiente encontrou
13,9±0,4 mg/dL em 2 análises. Após estes resultados o perito deve ser mantido em treinamento
com certeza.
Errado
Trata-se da comparação de duas médias, com valores dos desvios desconhecidos. O teste é:
t = (xm - xm2)/{scomb√[(N1+ N2)/(N1N2)]}
2 2 2 2 2
Onde scomb = s1 +s2 => scomb = √(0,5 +0,4 ) = 0,64, então:
t = (14,5-13,9)/(0,64√[(2+3)/(2.3)] = 0,6/0,58 = 1,02
O valor do tcrít para 95% de confiança e 3 graus de liberdade é de 3,18 e para 80% de confiança é
de 1,64. Portanto o perito em treinamento obteve um valor que está dentro da faixa de valores do
perito experiente e poderia se pensar em deixá-lo por conta.