Teste de Significancia

UNIVERSIDADE JEAN PIAGET DE MOÇAMBIQUE
FACULDADE DE ENGINHARIA
CURSO DE GEOLOGIA E MINAS
2º Ano
1º Semestre
CADEIRA DE PROBABILIDADE ESTATISTICA:

Tema: Testes de Significância
Discentes⁚ 2ºGrupo
Jose Alberto Zeca
Jeremias Daniel
Juvêncio Sulemane
Tamires Carlos Camilo
Egnalda Ucucho
Benilton Antonio
Yuran Carlos
Docente⁚
INTRODUÇÃO
Neste trabalho iremos falar sobre Testes de Significância que concerne os seus subtemas tentando unir
de uma forma simplificada os seus conteúdos que não são poucos, e tentando trazer o máximo de
informação para este presente trabalho.
TESTES DE SIGNIFICANCIA
Na estatística, os testes-t são um tipo de teste de hipóteses que permite comparar médias. Eles
são chamados de testes-t porque cada um deles resume seus dados amostrais em um número, o
valor-t. Se você entender como os testes-t calculam os valores-t, você estará no caminho certo
para entender como esses testes funcionam.
Nesta série de posts, estou me concentrando em conceitos e não em equações para mostrar como
os testes-t funcionam. No entanto, este post inclui duas equações simples sobre as quais eu vou
discorrer, que usam a analogia de uma razão sinal-ruído.
COMO OS TESTES-T PARA 1 AMOSTRA CALCULAM OS VALORES-T
Entender esse processo é crucial para saber como os testes-t funcionam. Vou mostrar a fórmula
primeiro e depois explicarei como funciona.
Observe que a fórmula é uma razão. Uma analogia comum é que o valor-t é a razão sinal-ruído.
SINAL (TAMBÉM CONHECIDO COMO O TAMANHO DO EFEITO)
O numerador é o sinal. Você simplesmente pega a média amostral e subtrai o valor da hipótese
nula. Se a média amostral for 10 e a hipótese nula for 6, a diferença ou sinal será 4.
Se não houver diferença entre a média amostral e o valor sob a hipótese nula, o sinal no
numerador (assim como o valor da razão inteira) será igual a zero. Por exemplo, se a média da
sua amostra for 6 e o valor nulo for 6, a diferença será zero.
Como a diferença entre a média amostral e a média sob a hipótese nula aumenta, seja no sentido
positivo ou no negativo, a força do sinal aumenta.
RUÍDO
O denominador é o barulho. A equação no denominador é uma medida de variabilidade

conhecida como erro padrão da média. Essa estatística indica com que precisão sua amostra
estima a média da população. Um número maior indica que sua estimativa amostral é menos
precisa porque tem mais erros aleatórios.
Esse erro aleatório é o "ruído". Quando há mais ruído, você espera ver diferenças maiores entre a
média amostral e o valor sob a hipótese nula, mesmo quando a hipótese nula for verdadeira. Nós
incluímos o fator de ruído no denominador porque devemos determinar se o sinal é grande o
suficiente para se destacar dele.
A RAZÃO SINAL-RUÍDO
Os valores de sinal e ruído estão nas unidades dos seus dados. Se o seu sinal for 6 e o ruído for 2,
seu valor-t será 3. Este valor-t indica que a diferença é 3 vezes o tamanho do erro padrão. No
entanto, se houver uma diferença do mesmo tamanho, mas seus dados tiverem mais variabilidade
(6), seu valor-t será apenas 1. O sinal está na mesma escala do ruído.
Dessa forma, os valores-t permitem que você veja como o seu sinal é distinguível do ruído.
Sinais relativamente grandes e baixos níveis de ruído produzem valores-t maiores. Se o sinal não
se destacar do ruído, é provável que a diferença observada entre a estimativa amostral e o valor
sob a hipótese nula se deva ao erro aleatório amostral e não a uma diferença real no nível da
população.
UM TESTE-T PAREADO É APENAS UM TESTE-T PARA 1 AMOSTRA
Muitas pessoas estão confusas sobre quando usar um teste-t pareado e como ele funciona. Eu vou
lhe contar um pequeno segredo. O teste-t pareado e o teste-t para 1 amostra são na verdade o
mesmo teste! Como vimos acima, um teste-t para 1 amostra compara uma média amostral com
um valor sob a hipótese nula. Um teste-t pareado simplesmente calcula a diferença entre
observações emparelhadas (por exemplo, antes e depois) e, em seguida, realiza um teste-t para 1
amostra sobre as diferenças.
Você pode testar isso com esse conjunto de dados para ver como todos os resultados são
idênticos, incluindo a diferença média, o valor-t, o valor-p e o intervalo de confiança da
diferença.
Entender que o teste-t pareado simplesmente executa um teste-t para 1 amostra nas diferenças
pareadas pode realmente ajudar você a entender como o teste-t pareado funciona e quando usá-
lo. Você só precisa descobrir se faz sentido calcular a diferença entre cada par de observações.
Por exemplo, suponhamos que “antes” e “depois” representem os resultados dos testes e que
houve uma intervenção entre eles. Se as pontuações antes e depois em cada linha da planilha
exemplo representarem o mesmo assunto, faz sentido calcular a diferença entre as pontuações
dessa maneira - o teste-t pareado é apropriado. No entanto, se as pontuações em cada linha são
para assuntos diferentes, não faz sentido calcular a diferença. Nesse caso, você precisaria usar
outro teste, como o teste-t para 2 amostras (que discuto abaixo).
Usar o teste-t pareado economiza o passo de calcular as diferenças antes de executar o teste-t.
Você só precisa ter certeza de que as diferenças pareadas fazem sentido!
Quando for apropriado usar um teste-t pareado, ele pode ser mais poderoso do que um teste-t
para 2 amostras.
COMO TESTES-T PARA DUAS AMOSTRAS CALCULAM VALORES-T
O teste-t para 2 amostras coleta seus dados amostrais de dois grupos e os resume no valor-t. O
processo é muito semelhante ao teste-t para 1 amostra, e você ainda pode usar a analogia da
relação sinal-ruído. Ao contrário do teste-t pareado, o teste-t para 2 amostras requer grupos
independentes para cada amostra.
A fórmula está abaixo, e em seguida eu faço algumas considerações sobre isso.
Para o teste-t para 2 amostras, o numerador é novamente o sinal, que é a diferença entre as
médias das duas amostras. Por exemplo, se a média do grupo 1 for 10 e a média do grupo 2 for 4,
a diferença será 6.
A hipótese nula padrão para um teste-t para 2 amostras é que os dois grupos são iguais. Você
pode ver na equação que quando os dois grupos são iguais, a diferença (e a razão) também será
igual a zero. Como a diferença entre os dois grupos cresce em uma direção positiva ou negativa,
o sinal se torna mais forte.
Em um teste-t para 2 amostras o denominador ainda é o ruído, mas o Minitab pode usar dois
valores diferentes. Você pode supor que a variabilidade em ambos os grupos é igual ou diferente,
e o Minitab usa a estimativa correspondente da variabilidade. De qualquer forma o princípio
permanece o mesmo: você está comparando seu sinal ao ruído para ver o quanto o sinal se
destaca.
Assim como com o teste-t para 1 amostra, para qualquer diferença dada no numerador, à medida
que você aumenta o valor do ruído no denominador, o valor-t se torna menor. Para determinar se
os grupos são diferentes, você precisa de um valor-t grande.
Pretende-se comparar as duas médias de duas amostras emparelhada, partindo do pressuposto da
normalidade das populações. Devido ao emparelhamento, o procedimento passa por subtrair os pares de
observações. Trata-se esta situação como se trata uma única população.
Conteúdo
duas amostras emparelhadas (t test)
descrição
hipóteses a testar
estatística de teste
R project
texas TI 84
descrição
Temos duas amostras emparelhadas, de dimensão n, sendo X1,…,Xn e Y1,…,Yn. Estas formam
pares (Xi,Yi) dos quais se forma uma única amostra de diferenças:
XYDx1y1d1=x1−y1x2y2d2=x2−y2⋯⋯⋯xnyndn=xn−yn
Cada par amostral deve ser constituído por observações independentes.
A amostra D deve ter ajustamento à distribuição normal. Ver ajustamento à normal.
hipóteses a testar
O teste bilateral é:
H0:μX−μYμD=0vsH1:μX−μYμD≠0
e, de forma semelhante, para os casos unilaterais > ou < em H1.
Considerando que se reduzem as duas amostras a uma só então escreve-se o teste com base na v.a. D:
μD=μX−μY
ou seja, pode realizar-se o teste bilateralou os testes unilaterais:

H0:μD=0vsH1:μD≠0H0:μD=0vsH1:μD>0H0:μD=0vsH1:μD<0
estatística de teste
T=D¯−μDSD/n−−√∼sob H0tn−1,
onde Di=Xi−Yi.
O QUE SIGNIFICAM OS VALORES-T?
Cada tipo de teste t usa um procedimento para resumir todos os seus dados amostrais em um
valor, o valor-t. Os cálculos comparam sua(s) média(s) amostrais com a hipótese nula e
incorporam o tamanho amostral e a variabilidade nos dados. Um valor-t de 0 indica que os
resultados da amostra são exatamente iguais à hipótese nula. Na estatística, chamamos a
diferença entre a estimativa amostral e a hipótese nula o tamanho do efeito. À medida que essa
diferença aumenta, o valor absoluto do valor-t aumenta.
Tudo isso é interessante, mas o que um valor-t de 2, por exemplo, realmente significa? A partir
da discussão acima, sabemos que um valor-t igual 2 indica que a diferença observada é duas
vezes o tamanho da variabilidade em seus dados. No entanto, usamos testes-t para avaliar
hipóteses ao invés de somente descobrir a razão sinal-ruído. Queremos determinar se o tamanho
do efeito é estatisticamente significativo.
Para ver como obtemos valores-t para avaliar hipóteses e determinar a significância estatística,
leia o outro post desta série, Entendendo testes-t e distribuições-t.
Estatística de teste de Dixon
O teste de Dixon determina se o valor mais extremo em uma amostra é um outlier. O teste de
Dixon inclui uma escolha da estatística de teste que supere os potenciais efeitos de encobrimento
de outros valores extremos na amostra. A estatística do teste de Dixon é indicada por rij , onde os
subscritos i e j indicam o seguinte:
i indica o número de valores extremos do mesmo lado (superior ou inferior) dos dados que o
outlier suspeito. i = 1 ou 2.
i indica o número de valores extremos do lado oposto dos dados. i = 0, 1 ou 2.
Por exemplo, se o outlier suspeito é o menor valor na amostra, mas a amostra inclui também dois
valores atipicamente grandes, então r12 é a estatística de teste apropriada. A estatística de
teste r10 , (também chamada de Q de Dixon), é apropriada quando a amostra inclui apenas um
valor extremo.
Os valores críticos para as estatísticas dos testes de Dixon são tabulados em Rorabacher (1991).
Estatística de teste unilateral
A fórmula para o teste unilateral depende se você testar o menor valor, yi , ou o maior valor, yn.
Para testar se yi , é o outlier, use a seguinte fórmula:
Para testar se yn , é o outlier, use a seguinte fórmula:
Estatística de teste bilateral
Nós definimos a estatística de teste bilateral como King (1953) define a estatística de teste
bilateral relacionada com r10. A estatística de teste de bilateral é dada por:
Notação
Termo Descrição
rij Estatística de teste de Dixon (i = 1, 2; j = 0, 1, 2)
yi o io menor valor na amostra
n o número de observações na amostra
Referências
D.B. Rorabacher (1991). "Statistical Treatment for Rejection of Deviant Values: Critical Values
of Dixon Q Parameter and Related Subrange Ratios at the 95 percent Confidence
Level," Analytic Chemistry, 83, 2, 139-146.
E.P. King (1953). "On Some Procedures for the Rejection of Suspected Data," Journal of the
American Statistical Association, Vol. 48, No. 263, 531-533.
Estatística de teste de Grubbs
Fórmula para a estatística unilateral
Se você testar se o menor valor de dados é um outlier, então a estatística de teste G é dada por:
Se você testar se o maior valor de dados é um outlier, então a estatística de teste G é dada por:
Fórmula para a estatística bilateral
Para uma hipótese bilateral, G é dado por:
Notação
Termo Descrição
a média da amostra
yi o io menor valor na amostra
s o desvio padrão da amostra
n o número de observações na amostra
Valores de p para a estatística de teste de Dixon
Partindo-se do princípio de que os dados são normalmente distribuídos, a estatística de Dixon

tem a mesma distribuição se você testar o menor valor ou o maior valor. Assim, sem qualquer
perda de generalidade, podemos nos concentrar nas estatísticas para a detecção de outliers no
final extremo dos dados, a saber:
A Análise de Variância ou ANOVA é um procedimento usado para comparar a distribuição de
três ou mais grupos em amostras independentes.
A análise de variância é também uma forma de resumir um modelo de regressão linear através da
decomposição da soma dos quadrados para cada fonte de variação no modelo e, utilizando o teste
F, testar a hipótese de que qualquer fonte de variação no modelo é igual a zero.
Contextualizando uma aplicação da Anova
Suponha um curso preparatório para o ENEM que tenha em seu corpo docente três professores
de matemática, que são responsáveis por diferentes turmas de alunos. A direção da escola
suspeita que a variação do desempenho dos alunos nas provas de matemática do ENEM pode ser
explicada pelo trabalho desenvolvido pelos seus professores.
Sendo assim, a direção resolveu verificar as notas na prova de matemática dos alunos de cada
professor e calculou a média das notas de cada turma.
Mas será que essa informação é suficiente para afirmar que o desempenho dos alunos de cada
turma é realmente diferente? E se um dos professores tiver em sua turma um aluno que não se
preparou e errou quase todas as questões? Esse aluno não seria responsável por ter diminuído a
média do grupo de alunos desse professor?
Para verificar então se realmente o desempenho dos alunos variou de acordo com o professor, é
necessário a utilização de teste estatístico, que além de considerar a média das notas, leva
também em conta a variação das notas dentro de cada turma.
A Análise de Variância
Um dos objetivos da aplicação da ANOVA é realizar o teste estatístico para verificar se há

diferença entre distribuição de uma medida entre três ou mais grupos. Em nosso exemplo,
podemos definir as hipóteses do teste como:
H0: Não existe diferença entre o desempenho das notas dos alunos de cada professor.
H1: Há pelo menos um professor com alunos com desempenho diferente.
Mas o que significa diferença entre as distribuições? Qual a relação entre as distribuições das
notas dos alunos de cada professor e as hipóteses testadas pela análise de variância?
Caso os três grupos de alunos apresentem mesma variabilidade e a mesma média de
desempenho, suas distribuições tendem a se sobrepor, confirmando a hipótese de que não existe
diferença entre o desempenho das notas dos alunos de cada professor. Caso contrário, quando os
grupos apresentam a mesma variabilidade interna e médias de desempenho diferentes, as
distribuições se distanciam quanto mais as médias de desempenho se diferenciam.
O modelo ANOVA e seus pressupostos
Para aplicação da análise de variância, são necessárias algumas suposições, sendo elas:
As observações são independentes, ou seja, cada elemento amostral (aluno) deve ser
independente;
Os grupos comparados apresentam a mesma variância;
Os erros são independentes e provenientes de uma distribuição normal com média igual a zero e
variância constante.
Cabe ressaltar que os grupos de alunos de cada professor podem ser vistos como três níveis de
um mesmo fator, sendo que o objetivo é saber se o fator professor exerce alguma influência na
variação do desempenho das notas de matemática.
Quais são os resultados gerados pela análise de variância?
As informações geradas na análise de variância estão resumidas na tabela abaixo. Nela são
apresentados os graus de liberdade, a soma de quadrados, o quadrado médio, a estatística F e o
valor-p.
Os graus de liberdade são calculados com base no número de professores (grupos) e no número
total de alunos.
A soma de quadrados mede a variação dos dados. A soma de quadrados total mede a variação
total nos dados, a soma de quadrados dos tratamentos mede a variação entre os professores de
cada turma e a soma dos quadrados dos resíduos mede a variação dentro de cada turma, ou seja,
mede a variação dos alunos de cada professor.
O quadrado médio é a razão entre a soma de quadrados e os graus de liberdade e a estatística F,

pode ser encontrada na tabela de distribuição F de Fisher- Snedecor.
Como interpretar os resultados da ANOVA?
Tomando como base a tabela anterior, pode-se concluir que existe pelo menos dois professores
com alunos com desempenho significativamente diferentes ao avaliar o valor-p = 0,010 (menor
que o nível de significância estabelecido de 0,05).
A conclusão da ANOVA pode ser feita também com base na Estatística F. A estatística F tem
distribuição F de Fisher-Snedecor com k-1 e n-k graus de liberdade, onde k é o número de
grupos (k = 3) e n é o número de observações (n = 36). Neste caso fictício, obteríamos F ≅ 3,32
e como a Estatística F (5,25) foi maior que o F tabelado (3,32), conclui-se que existe pelo menos
dois professores com alunos com desempenho significativamente diferentes.
COMPARACAO DE VARIA MEDIAS RESULTADOS LABORATORIAS
Comparação de resultados A comparação dos valores de um conjunto de resultados com o valor

verdadeiro ou com os valores de outros conjuntos de resultados permite verificar a exatidão e
precisão do método analítico, ou se ele é melhor do que outro. Existem 2 métodos muito usados
para comparar resultados: -teste t de Student -teste da razão de variâncias (teste F) Estes métodos
utilizam o número de GRAUS DE LIBERDADE, em termos estatísticos, o número de
determinações independentes (dimensão da amostra) menos o número de parâmetros estatísticos
a serem avaliados na população.
Quando um novo método analítico está sendo desenvolvido é comum comparar-se a média e
precisão do novo método com as do método de referência. 1 2 1 2 1 2 n n n n s x x t p    2 1 2
1 x média x média   sP = desvio padrão agrupado 2 ( 1) ( 1) 1 2 2 2 2 2 1 1       n n n s
n s s p É necessário que não haja uma diferença significativa entre as precisões dos métodos 
aplica o teste F antes de usar o teste t

Teste de Significancia

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teste de Significancia

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE JEAN PIAGET DE MOÇAMBIQUE

CURSO DE GEOLOGIA E MINAS

CADEIRA DE PROBABILIDADE ESTATISTICA:

Jose Alberto Zeca

Tamires Carlos Camilo

COMO OS TESTES-T PARA 1 AMOSTRA CALCULAM OS VALORES-T

SINAL (TAMBÉM CONHECIDO COMO O TAMANHO DO EFEITO)

O denominador é o barulho. A equação no denominador é uma medida de variabilidade

UM TESTE-T PAREADO É APENAS UM TESTE-T PARA 1 AMOSTRA

A fórmula está abaixo, e em seguida eu faço algumas considerações sobre isso.

duas amostras emparelhadas (t test)

Temos duas amostras emparelhadas, de dimensão n, sendo X1,…,Xn e Y1,…,Yn. Estas formam

pares (Xi,Yi) dos quais se forma uma única amostra de diferenças:

Cada par amostral deve ser constituído por observações independentes.

A amostra D deve ter ajustamento à distribuição normal. Ver ajustamento à normal.

e, de forma semelhante, para os casos unilaterais > ou < em H1.

ou seja, pode realizar-se o teste bilateralou os testes unilaterais:

O QUE SIGNIFICAM OS VALORES-T?

i indica o número de valores extremos do lado oposto dos dados. i = 0, 1 ou 2.

Estatística de teste unilateral

Para testar se yn , é o outlier, use a seguinte fórmula:

Estatística de teste bilateral

rij Estatística de teste de Dixon (i = 1, 2; j = 0, 1, 2)

yi o io menor valor na amostra

n o número de observações na amostra

Estatística de teste de Grubbs

Fórmula para a estatística unilateral

Fórmula para a estatística bilateral

Para uma hipótese bilateral, G é dado por:

s o desvio padrão da amostra

n o número de observações na amostra

Valores de p para a estatística de teste de Dixon

Partindo-se do princípio de que os dados são normalmente distribuídos, a estatística de Dixon

Contextualizando uma aplicação da Anova

Um dos objetivos da aplicação da ANOVA é realizar o teste estatístico para verificar se há

H1: Há pelo menos um professor com alunos com desempenho diferente.

O modelo ANOVA e seus pressupostos

Os grupos comparados apresentam a mesma variância;

Quais são os resultados gerados pela análise de variância?

O quadrado médio é a razão entre a soma de quadrados e os graus de liberdade e a estatística F,

Como interpretar os resultados da ANOVA?

Comparação de resultados A comparação dos valores de um conjunto de resultados com o valor

Você também pode gostar