Você está na página 1de 14

INÉS TORIBIO ARGUELLES CURSO 2021-2022

Testes de Hipóteses sobre a Média: Uma Amostra e


Duas Amostras
Testes t de Student
- Testes paraméricos e testes não-paramétricos
- Três tipos de testes t de Student: Uma amostra e duas amostras
- Distribuição t de Student e graus de liberdade
- Teste t de Student de uma média (uma amostra)
- Teste t de Student da diferença de duas médias de dois grupos (amostras)
dependentes
- Teste t de Student da diferença de duas médias de dois grupos (amostras)
independentes
- Assunções matemáticas dos testes t
- Intervalos de confiança e Tamanho do efeito.

Caraterísticas dos testes paramétricos e não- paramétricos


PARAMÉTRICOS
- A maioria dos testes paramétricos (como os da família dos testes-t que vamos expor
seguidamente) requerem que se assuma uma dada forma da distribuição da
variável de resposta na população (e.g., normal).
- A escala de medida de intervalo é requerida para a inferência estatística.

Os testes paramétricos são, em geral, mais potentes do que os testes não- paramétricos

ÑAO PARAMÉTRICOS
- A maioria dos testes não-paramétricos tem assunções menos restritivas que os
modelos paramétricos
- A maioria dos testes paramétricos trabalhará com dados ordinais, e algumas técnicas
serão adequadas para dados de escalas nominais

Embora, geralmente, menos poderosos que os testes paramétricos, podem ser mais
poderosos quando as assunções dos modelos paramétricos estiverem erradas (i.e., não se
pode assumir que os dados sigam a lei normal).
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Critérios de Escolha de Testes Paramétricos e Não Paramétricos


PARAMÉTRICOS
- Dados contínuos (scores) e
- Distribuição normal para todos os grupos

ÑAO PARAMÉTRICOS
- Dados nominais (frequências em categorias), ou
- Dados ordinais (postos), ou distribuições não normais de dados contínuos.

Testes t e Distribuição t de Student


Os testes t e a distribuição t de Student foram desenvolvidos por William Gosset, ao efetuar
testes de controle de qualidade para a cervejeira Guinness de Dublin; os trabalhos de Gosset
foram publicados com o pseudónimo “Student”.

O seu trabalho de 1908, “The probable error of a mean", ofereceu a base para os distintos
testes t de Student.A utilização da distribuição t de Student é uma importante contribuição
para a análise de pequenas amostras. Os testes t incluem duas variedades: testes t para
uma única média e testes t para a diferença de duas médias.

Variedades de testes t de Student (Cohen & Lea) :


A) Teste t para uma amostra
- Assuma que é desconhecido.
- Substitua por s (i.e., substitua pelo desvio-padrão da amostra)
- Agora pode usar o teste z ou t, mas se a sua amostra é pequena (n < 30), então
apenas t deve ser usado.
- Vamos usar o teste t de Student (mais geral, pode usá-lo com pequenas e grandes
amostras)
- Compare t (i.e., a estatística de teste) com os valores obtidos na tabela desta nova
distribuição (t de Student).

B) Teste t duas amostras dependentes


- Este teste é usado quando se comparam as médias de dois grupos dependentes ou
correlacionados.

- Este teste é adequado se está a medir os mesmos participantes em duas condições


experimentais ou tratamentos (e.g., cada participante executa uma tarefa enquanto
ouve música e também enquanto realiza a mesma tarefa em silêncio). Também
podem ser participantes que foram previamente emparelhados antes de serem
atribuídos aleatoriamente a uma das condições experimentais

C) Teste t duas amostras independentes


INÉS TORIBIO ARGUELLES CURSO 2021-2022

- Este teste é apropriado quando se compararam as médias de dois grupos que


representam populações independentes (e.g., níveis de colesterol de vegetarianos e
de pessoas que comem carne).
- No exemplo acima há uma variável quantitativa/contínua (scores de colesterol) e
uma variável dicotómica (representando os dois grupos).

Distribuição de Amostragem de t
A distribuição de amostragem de t é a distribuição de probabilidade dos valores que
ocorreriam se todas as amostras de um tamanho fixo n fossem extraídas da população
definida pela hipótese nula. Dá-nos (1) todos os diferentes valores de t possíveis para
amostras de tamanho n e (2) a probabilidade de obter cada valor se a amostragem é
aleatória da população da hipótese nula. Pagano (2013, p. 329)

Graus de Liberdade, gl (𝜐)


No teste t temos duas variáveis aleatórias 𝑥ҧ e s. A assimetria da distribuição de
amostragem da variância (importante porque agora a variância figura no denominador do
rácio-t) diminui à medida que n aumenta.
- t diferirá menos de Z a medida que n aumenta.
No entanto, há necessidade de ajustar t em correspondência com este facto
e, por isso, usamos os graus de liberdade. Para o teste t de uma média:
- gl=n-1
O(s) valor(es) de t crítico(s) estão baseado(s) nos gl (e no nível de significância, α)

Distribuição de t (e tabela de t) para diferentes graus de


liberdade
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Assunções do teste t
O teste t (uma amostra) é apropriado quando a investigação tem apenas uma amostra, 𝜇 é
especificada, 𝜎 é desconhecido e a média da amostra é usada como estatística básica.

Tal como o teste Z, t requer que a distribuição de amostragem de 𝑥ҧ seja normal. Para que a
distribuição de 𝑥ҧ seja normal, n ≥ 30 ou a população dos scores deve ser normal.

Teste t para Uma Amostra - Fórmula


Estruturalmente idêntica à fórmula de Z exceto que s (desvio-padrão amostral) é inserido no
lugar de 𝜎.

Exemplo

Intervalo de Confiança
- A média da amostra é uma estimação pontual
- Desejamos uma estimação intervalar i.e., a probabilidade de que o intervalo inclua
𝜇 seja, por exemplo, igual a 0.95 (ou, 95%)
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Tamanho do efeito usando o d de Cohen


É desejável que ao fazer inferência estatística além de obter o valor-p, considere ainda a
precisão da estimativa (através do IC) e a magnitude do efeito obtido (i.e., o tamanho do
efeito).

Jacob Cohen (1988) disponibilizou um método muito simples para determinar a grandeza de
um efeito real. Quando aplicado ao teste t, o método baseia-se da existência de uma relação
direta entre o tamanho do efeito real e o tamanho da diferença da média (à média de H0).

No caso aqui considerado:

Use para os cálculos Effect Size Calculator for t test (psychstat.org)); Para interpretar

- 0.00-0.20 efeito pequeño


- 0.21-0.79 efeito médio
- ≥ .80 efeito grande

Testes t da diferença de duas Amostras


Problemas com uma única amostra são pouco frequentes em psicologia, muito mais
frequentes são os problemas que envolvem a comparação de duas amostras/duas médias.
Por exemplo, homens vs. mulheres, doentes vs. saudáveis, admitidos vs. recusados,
aprovados vs. reprovados, neuróticos vs. normais, etc.

Em alguns casos entre as duas amostras há uma relação de dependência (e.g., pais e filhos,
gémeos, ou os mesmos participantes em ambas as amostras) e noutras admite-se que as
amostras são completamente independentes. Podemos também dizer, no primeiro caso, que
temos um design intra-grupo (within-groups) enquanto, no segundo caso, falamos de um
design inter-grupos (between-groups).

Os procedimentos de teste de hipóteses com o teste t serão diferentes consonante admita


que as amostras em estudo são dependentes ou independentes.

Testes t da diferença de duas amostras dependentes


Este teste é apenas apropriado quando as amostras estão de algum modo relacionadas

Vários planos de investigação produzem dados apropriados para o teste t de duas médias
dependentes/relacionadas (ver os dois slides seguintes)
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Designs de Medidas repetidas


Plano simultâneo
Recordação de uma lista mista incluindo palavras emocionais e neutras.
Se os dois tipos de palavras estão misturados aleatoriamente isso assegura que nenhum dos
tipos detém uma vantagem temporal sobre o outro.

Plano sucessivo
Os protótipos são o plano antes- depois (pré- pós-teste) e o desenho contrabalançado
(usado para eliminar os efeitos de ordem simples.)

Designs Emparelhados
Plano dito experimenta
O experimentador cria os pares baseando-se quer num pré-teste, quer em qualquer outro
tipo de dados disponíveis (e.g., sexo, idade, QI).

Plano dito natural


Neste plano os pares ocorrem naturalmente e o investigador limita- se a selecioná-los para o
estudo (e.g., maridos e esposas; mães e filhas, gémeos monozigóticos).

Fundamentação lógica do teste t amostras dependentes


No caso mais simples, todos os participantes são medidos duas vezes com o mesmo
instrumento com algum tempo mediando entre ambas as medições. A técnica de correlação
(que estudaremos adiante), habitualmente, revelará que os pares de scores covariam (i.e.,
variam conjuntamente).

A correlação entre os dois conjuntos de scores pode ser usada vantajosamente pelo teste t.
Por exemplo, com amostras relacionadas, esperamos que alguém com score alto numa
medida (T1) provavelmente venha a obter um score elevado na segunda medida (T2), i.e.,
tenderá a manter a mesma posição relativa no grupo.

Esta variação intraindividual pode ser “descontada” do erro de amostragem (ver slide
seguinte).
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Erro padrão da diferença de duas amostras dependentes


A correlação expetável entre scores de amostras dependentes acarreta uma mudança na
estatística que podemos usar para medir a dispersão ou variabilidade nas distribuições (i.e.,
no erro padrão de amostragem – fator que se encontra no denominador do rácio t).

O erro-padrão da diferença de duas médias relacionadas é como se segue (onde r12 é o


coeficiente que mede a força da correlação):

O rácio t é dado por:

Fórmula de t para duas amostras dependentes baseada nos


scores diferenciais
É muito mais comum conceber o teste t aqui em análise como se tratasse de um teste t para
uma única amostra;

Essa semelhança é evidente se a análise for efetuada nos scores das diferenças, 𝐷, entre as
duas médias (𝑥1 − 𝑥2 = 𝐷); neste caso apenas terá uma amostra (i.e., a amostra das
diferenças).

Portanto, a fórmula de t será a que segue:

Exemplo
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Lógica e cálculos

Usando o SPSS para o teste t de duas amostras dependente

Em alternativa podia ter usado o SPSS para obter o teste t de uma única amostra, embora
neste caso com a variável de resultado das diferenças, 𝐷𝑖.

Em geral, preferirá usar o procedimento demonstrado no slide anterior!


INÉS TORIBIO ARGUELLES CURSO 2021-2022

Intervalo de Confiança para a diferença de duas amostras


dependentes e Tamanho do Efeito
No(s) slide(s) com o output do SPSS é reportado o intervalo de confiança para a estimativa
em estudo (𝜇 ); IC = 𝐷 ± 𝑡𝛼 × 𝑠ഥ.𝐷 Τ2𝐷

Verifique (ambos outputs podem ser usados) que o intervalo de confiança de 95% para a
diferença é IC95% (5.46, 10.99); Como se constata o intervalo não inclui zero (o valor
hipotético de H0), por isso, se rejeitou a hipótese nula (p < .05).

O tamanho do efeito, d de Cohen, pode obter-se, para este teste t, de forma idêntica ao do
teste t para uma única amostra, como se segue:

Use para os cálculos Effect Size Calculator for t test (psychstat.org));Para interpretar 𝑑:
- 0.00-0.20 efeito pequeño
- 0.21-0.79 efeito médio
- ≥ .80 efeito grande

Assunções do teste t para duas amostras dependentes


- A diferença entre os dois scores obtida para cada sujeito (par) deve estar distribuída
normalmente (excessiva assimetria e outliers tornam o teste menos robusto/fiável);
- A variável dependente/resposta é medida ao nível de intervalo ou de razão;
- Os scores foram obtidos por amostragem aleatória da população.

Teste t para Duas Amostras Independentes


- Um tipo básico de investigação usa um design para grupos/amostras independentes
- No design de grupos independentes, os sujeitos são selecionados aleatoriamente da
população-alvo e depois aleatoriamente alocados quer à condição/grupo
experimental, quer à condição/grupo controlo (Claro que designs mais complicados,
p. ex., envolvendo mais de dois grupos, são possíveis e frequentemente usados no
estudo do comportamento.)
- No caso dos designs com grupos independentes importa reter que na fase de análise
dos dados, uma vez que os sujeitos foram aleatoriamente distribuídos pelas
condições, não se dispõe de qualquer base para emparelhar os scores de ambas as
condições.
- Pelo contrário, uma estatística é calculada separadamente em cada grupo e as duas
estatísticas dos dois grupos são comparadas para se determinar se o acaso apenas é
INÉS TORIBIO ARGUELLES CURSO 2021-2022

uma explicação razoável para as diferenças entre as estatísticas dos dois grupos.

Alguns exemplos para os quais o teste t para duas amostras


independentes é apropriado
Um investigador deseja explorar a alegação de que os engenheiros auferem, em média, um
salário superior ao das engenheiras, controlando a categoria profissional e o desempenho
de funções idênticas.

Uma investigadora quer determinar se um programa de ensino integrado (i.e., combinando


a aprendizagem da estatística e da metodologia científica) em contraste com o ensino
independente destas matérias (duas disciplinas separadas) é, em média, mais eficaz na
promoção da aprendizagem dos estudantes.

Uma neuropsicóloga acredita que uma região situada no meio da hemisfério direito do
cérebro é essencial para resolver problemas em labirintos de papel-e-lápis e que a região
correspondente no hemisfério esquerdo, por sua vez, não está envolvida nesse processo.
Por sorte tem acesso a n = 6 pacientes que têm essa lesão no hemisfério direito. Para efeitos
comparativos, conseguiu encontrar 4 pacientes com uma lesão similar mas no hemisfério
esquerdo. Todos os pacientes são testados com o mesmo tipo de labirinto.

Lógica do teste t para dois grupos independentes (através


de um exemplo)
Considere a seguinte experiência sobre o efeito da hormona X no comportamento sexual
(Pagano, 2013, p. 367):

Uma psicofisióloga conjetura que a hormona X é importante na produção de


comportamento sexual. Para investigar a hipótese, 20 ratos machos foram aleatoriamente
escolhidos e depois aleatoriamente atribuídos a dois grupos. Os animais do grupo 1 foram
injetados com a hormona X e depois colocados num habitáculo individual com uma fêmea
sexualmente recetiva. Os animais no grupo 2 foram submetidos a um tratamento parecido
com a exceção de que foram injetados com uma solução placebo. Contou-se o número de
acasalamentos, num período de 20 minutos.

Distribuição de Amostragem das Diferenças entre as Médias


de Scores das Amostras
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Explanação do slide anterior


Mais uma vez o problema consiste em saber como estão distribuídas as diferenças das
médias de duas amostra, se H0 é verdadeira?

Para responder à questão necessitamos de conhecer a distribuição de amostragem das


diferenças entre duas médias; esta distribuição pode ser determinada teoricamente ou
empiricamente;

Independente da forma como determinamos esta distribuição, a distribuição de


amostragem da diferença entre as duas médias amostrais (vide figura à direita no slide
anterior) tem as seguintes caraterísticas:

A distribuição de amostragem teórica da diferença das médias de


duas amostras – Distribuição t de Student
Segundo Cohen e Lea, se extrairmos amostras aleatórias da população, uma amostra de
cada vez e se para calcularmos um score Z usamos o DP obtido na amostra, em vez do 𝜎 da
população, pode demonstrar-se (Gosset, 1908) que os scores Z seguem uma distribuição
que tem mais valores extremos do que a DN (caudas mais grossas) e mais valores no centro
da distribuição (mais pontiaguda que a DN). Esta distribuição é a distribuição t de Student.

Esta condição generaliza-se à amostragem de duas (ou +2) amostras sempre que
desconhecermos 𝜎 e tivermos de usar os DP amostrais para o estimarmos.

Matematicamente, a distribuição t é descrita através de um único parâmetro que é uma


função do tamanho N da amostra, os graus de liberdade, 𝜈.

Os graus de liberdade para o teste t de duas amostras independentes são: gl = n1 – n2 – 2


(ou identicamente, fazendo n1 + n2 = N, N – 2 gl).
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Assunções para o teste t de amostras independentes


A distribuição de 𝑥1 − 𝑥2 é normal.

Há homogeneidade da variância. O teste t assume que a variável independente afeta as


médias das populações mas não os desvios-padrão (𝜎 = 𝜎 ). Sendo a variância apenas o
quadrado do desvio-padrão, o teste t assume que as variâncias das duas populações são
iguais, i.e., 𝜎 = 𝜎 . Se as variâncias das amostras usadas na experiência (𝑠1 = 𝑠2 ) são muito
diferentes (e.g., se uma variância é mais de 4 vezes maior do que a outra), então as duas
amostras provavelmente não são amostras aleatórias de populações com 𝜎 = 𝜎 . Se isto é
verdade, então, como refere Pagano (2013), o pressuposto da homogeneidade da variância
é violado (𝜎 1 ≠ 𝜎2 ).

Variantes do teste t (grupos independentes) em função da


validade da assunção de 𝜎2 = 𝜎2
Se as variâncias são iguais (𝜎2 = 𝜎2), i.e., o princípio da homogeneidade das variâncias é
válido, então usará o teste t para variâncias combinadas (Pooled- Variances t test), como se
segue:

Violando-se o pressuposto da homogeneidade das variâncias (𝜎2 ≠ 𝜎2), então pode usar o
teste t para variâncias separadas (Separate-Variances t test), como se segue:

Verificação (teste) da assunção da homogeneidade das


variâncias
- O teste utilizado mais frequentemente para verificar esta assunção é o teste De
Levene1 (p. ex.: o SPSS testa automaticamente a assunção e imprime o valor-p para o
teste de H : 𝜎2 = 𝜎2 contra H : 𝜎2 ≠ 𝜎2);
- Habitualmente2 usará o teste t variâncias combinadas se p > .05, caso contrário (i.e.,
p < .05) usará o teste t para variâncias separadas;
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Dados da experiência hormona X e Comportamento sexual


- Hipótese nula: A hormona X não está relacionada com o comportamento sexual. A
diferença amostral média de 2.8 deve-se à amostragem aleatória de populações com
𝜇1 = 𝜇2.
- Hipótese Alternativa: Alega-se que a hormona X afeta o comportamento sexual. A
diferença amostral média de 2.8 é devida à amostragem aleatória de populações
com 𝜇1 ≠ 𝜇2.

Resolução

Escrita dos resultados ao estilo da APA: Os ratos do grupo experimental efetuaram M = 8.4
(DP = 2.066) acasalamentos, enquanto os ratos injetados com o placebo efetuaram M = 5.6
(DP = 1.713) acasalamentos; o teste t para variâncias combinadas foi usado depois de
comprovar-se que as variâncias eram homogéneas (o teste de Levene mostrou um valor p >
.05). O resultado do teste t revelou-se estatisticamente significativo: t(18) = 3.3, p < .05. A
hormona X mostrou-se associada ao aumento do comportamento sexual dos ratos.
INÉS TORIBIO ARGUELLES CURSO 2021-2022

Intervalo de Confiança e Tamanho do efeito


Obtenha o intervalo de confiança para a diferença de duas médias independentes, segundo
Cohen e Lea (p. 59), como se segue:

𝜇1 − 𝜇2 = X1 − X2 ± 𝑡𝑐𝑟𝑖𝑡𝑠 Sx1−X2

Obtenha o tamanho do efeito d de Cohen, segundo Pagano (2013, p. 377), como se segue:

Para interpretar 𝑑:
- 0.00-0.20 efeito pequeno
- 0.21-0.79 efeito médio
- ≥.80 efeito grande

Dois modos para obter o teste t de grupos independentes


no SPSS
1. Utilizando os scores brutos
2. Utilizando as estatísticas amostrais

Outputs do SPSS para o teste t grupos independentes

Você também pode gostar