Você está na página 1de 24

EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Testes t - 2 amostras independentes


Teste t-Student para comparação de duas médias
populacionais, a partir de duas amostras aleatórias
independentes
Pressupostos/Requisitos:
- as duas amostras são obtidas aleatoriamente de
duas populações;
- as variáveis possuam Distribuição Normal

Lembrar:
• se n > 30 – a distribuição t tende para a Normal
• Se n≤ 30 – verificar a Normalidade
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

SE a normalidade não é aplicável utiliza-se o


Teste Não Paramétrico de Mann-Whitney.

Exemplo: Comparação dos rendimentos dos homens e das mulheres:

H0: mHomens = mMulheres ou H0: mHomens-mMulheres = 0


H1: mHomens ≠ mMulheres H1: mHomens - mMulheres  0

A distribuição amostral t para a comparação de duas médias a partir de


duas amostras independentes, pode ter duas expressões diferentes,
consoante:
• s12≠s22 ou s12=s22
(as variâncias populacionais não são homogéneas ou são homogéneas)
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Exemplo:
Considere os dados Gastos
Género Frequência
(€/refeição):
amostrais da tabela ao lado:
8 Feminino 1
pretende-se saber se os
8 Masculino 2
gastos médios populacionais 9 Feminino 2
com a refeição, são 9 Masculino 3
equivalentes, para homens 10 Feminino 5
e mulheres. 10 Masculino 5
11 Feminino 7
(Masculino: n= 29) 11 Masculino 8
(Feminino: n= 26) 12 Feminino 6
12 Masculino 6
13 Feminino 3
Lembrar: 13 Masculino 4
<Data> 14 Feminino 2
14 Masculino 1
<Weight cases>
Weight cases by:
passar a variável “Frequência”
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

• Os gastos em refeições são uma variável métrica. Foram


ponderados pela sua frequência.
• O género é uma variável nominal.

Hipóteses:
H0: mHomens = mMulheres (afirmação inicial)
H1: mHomens ≠ mMulheres
O teste é bilateral pois a hipótese alternativa não explicita o
sentido da variação dos gastos.

A inferência da relação observada na amostra sobre as médias é


feita através do teste t – 2 amostras independentes.
A inferência da relação observada na amostra sobre as variâncias é
realizada através do Teste de Levene.

Para aplicar o teste t (Requisito):


As amostras devem seguir uma distribuição Normal
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Teste à normalidade:
Analyse

Descriptive
Statistics

Explore
Passar a variável em função do grupo:
Gastos em função do sexo

Clicar: Plots e
depois
Normality
Plots...
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Teste à normalidade:
Resultado:

P-value masc.
P-value femi.

Como p-value
é maior do que
 para os dois
géneros,
são aplicáveis
testes
paramétricos

Ou seja, os dados suportam Ho


aderência à Normalidade
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Analyse Teste t – 2 amostras independentes

compare means
Test Variable: Gastos
independent Grouping Variable: sexo
sample t-teste
Define Groups:
Group 1 e group 2 - definir
Resultados:

1º Quadro:
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Teste de Levene: Teste de Levene é usado para


testar se as amostras têm
Hipóteses a testar:
variâncias iguais. Variâncias iguais
H0:Variâncias iguais
entre amostras é chamada de
H1:Variâncias diferentes
homogeneidade de variância.
2º Quadro:

O teste de Levene, para um  = 0,05 apresenta um p-valor de 0,947,


pelo que não se rejeita a hipótese de igualdade das variâncias.
Variâncias idênticas assumidas!
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

2º Quadro: Teste t - 2 amostras independentes

Como p-value > , não se


rejeita H0.
Conclusão: não há evidência
para garantir a rejeição da
afirmação inicial.
Ho : mHomens = mMulheres
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Testes paramétricos vs. não paramétricos


Aplicação Teste Paramétrico Teste Não Paramétrico

Duas amostras Teste t Teste de Mann-Whitney


independentes

Duas Amostras Teste t •Teste de sinais


Emparelhadas •Teste de Wilcoxon

Várias amostras Análise da variância Teste de Kruskal-Wallis


independentes (Anova a 1 critério)

Correlação Correlação Linear de Correlação Linear de


Pearson Spearman
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Amostras Independentes
Teste Paramétrico T Teste de Mann-Whitney
Compara as médias Compara o centro de localização das duas
de duas amostras amostras, como forma de detectar
independentes diferenças entre as duas populações
correspondentes.
Deve ser utilizado quando:
• há violação da normalidade
• tamanho das amostras é pequeno
• as variáveis são de tipo pelo menos
ordinal.
H0: as medianas das populações de dados são iguais (afirmação inicial)
H1: as medianas das populações de dados são diferentes
H0: as duas distribuições têm igual distribuição, i.é, são homogéneas
H1: as duas distribuições não têm igual distribuição, i.é, não são
homogéneas
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas
Teste de Mann-Whitney
Analyse

Nonparametric
Tests
Test Variable: Gastos
Legacy Dialog
Grouping Variable: sexo
2 Independent Define Groups:
Samples Group 1 e group 2 - definir

R1

Decisão: como p-valor >  (0,636>0,05) não se rejeita H0.


Conclusão: não há evidência para garantir a rejeição da afirmação
inicial.
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Testes t - 2 amostras emparelhadas


Teste t para amostras dependentes ou emparelhadas:
- Permite inferir sobre a igualdade de médias de duas amostras
emparelhadas.
- Geralmente, cada caso é analisado duas vezes, antes e depois
de um tratamento ou intervenção, fazendo pares de
observações, cujas diferenças são testadas para ver se o
resultado é, ou não, ZERO.
(exemplo de utilização: pré-teste; teste; pósTeste;…)
Requisitos:
Uma ou ambas as condições são satisfeitas:
• O n.º de pares de dados é grande (n>30)
• Os pares de dados têm diferenças que são provenientes de
uma população com distribuição aproximadamente normal.
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

H0: m1 = m2
H1: m1 ≠ m2

Mas, no teste t para duas amostras emparelhadas é encontrada a


diferença entre cada par de dados e utiliza-se o conjunto das
diferenças amostrais para testar afirmações sobre a diferença
populacional.

Ex: comparação dos resultados obtidos para um conjunto de indivíduos, antes


e depois de sujeitos a uma determinada formação:
H0: md = 0
H1: md ≠ 0
md =(mantes – mdepois)
Parte II - 6.3 Processamento de dados em SPSS

Outra aplicação:
é válido para analisar duas amostras relativamente a uma
característica comum, pela qual possam ser comparadas.

Neste caso é necessário existir correlação entre os dois


grupos de variáveis

Se não existir correlação significa que o emparelhamento não


foi útil, devendo então utilizar-se o teste t para amostras
independentes, que possui um maior n.º de graus de
liberdade.
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Vendas antes da Vendas após


Exemplo: Promoção (xi) a Promoção (yi)
Seleciona-se uma 14 19 d = yi – xi
amostra aleatória de 21 21 5
12 lojas. 33 41 0
29 26 8
Teste a afirmação: 34 40 -3
a promoção favorece 26 33 6
21 28 7
as vendas a produto.
15 27 7
16 24 12
H0: 𝝁𝒅 ≤ 𝝁𝒊 20 25 8
H1: 𝝁𝒅 > 𝝁𝒊 29 27 5
18 26 -2
8
d = 5,08 d − m d 5,08 − 0
sd = 4,501 t= = = 3,912
sd 4,501
sd2 = 20,265 n 12
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Testes t – 2 amostras emparelhadas

Analyse

Compare
Means

Paired Samples T-test

Passar as variáveis:
“depois da promoção” – variável 1
“antes da promoção” – variável 2

d= depois – antes
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas
Resultados:

Significado dos quadros:


1º Quadro – Estatística descritiva para as duas amostras
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

2º Quadro: Avaliação da correlação entre as


: variáveis para confirmação da possibilidade
Só faz sentido
quando se tratam de emparelhamento
duas amostras
distintas.
p-value
Num estudo de
ANTES e DEPOIS, o
emparelhamento é
SEMPRE VÁLIDO!

O coeficiente de correlação linear de Pearson é elevado (r=0,786) o que significa que é


vantajoso o recurso ao teste t para amostras emparelhadas, comparativamente com o teste
t para amostras independentes.
Para a avaliação da correlação as hipóteses são:
H0: r = 0 (a correlação no universo é zero)
H1: r ≠ 0 (a correlação no universo não é zero)
Como p-valor =0,002 < , (para  = 0,05) rejeita-se a hipótese nula r =0, logo existe
correlação entre as variáveis, e os dados podem e devem ser tratados como emparelhados.
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

3º Quadro:
p-value

Note que diferença das vendas médias (depois–antes) é 5,083 o desvio


padrão da diferença 4,502.

Para α= 0,05, p-value < , rejeita-se a hipótese nula da diferença das


médias ser zero.

Por outro lado o intervalo de confiança de 95% para a média das diferenças
é [2,223; 7,944] pelo que, não fazendo o zero parte do intervalo, mais uma
vez está de acordo com a rejeição da hipótese nula.
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Testes - Dados Emparelhados:


Teste T Alternativas não-paramétricas ao teste T:
 Permite inferir sobre a Teste dos Sinais Teste de Wilcoxon
igualdade de médias
 Permite analisar
de duas amostras  Aplica-se para analisar
diferenças pré teste / pró
emparelhadas. diferenças pré teste / pró
teste de um mesmo teste de um mesmo
 Uma ou ambas as grupo de sujeitos.
grupo de sujeitos
condições são
satisfeitas:  É menos eficiente do que  Distribuição das
o Wilcoxon diferenças simétrica
• N.º de pares de  Não necessita simetria na  Ligeiramente menos
dados é grande distribuição das eficiente do que o
(n>30) diferenças dos pares de paramétrico t
• Distribuição das dados.
diferenças
aproximadamente
normal.
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Teste de Wilcoxon: dados emparelhados


▪ É um teste não paramétrico que usa as ordens de dados amostrais
compostos de pares combinados
▪ É usado para testar a hipótese nula de que as diferenças
populacionais dos pares de dados têm uma mediana nula.
▪ Pode também ser utilizado para testar a afirmação que uma amostra
provém de uma população com uma mediana especificada.

H0: medd = 0
H1: medd ≠ 0

REQUISITOS:
• Os dados consistem em pares de dados selecionados aleatoriamente
• A população das diferenças (encontradas a partir dos pares de dados) tem
uma distribuição que é aproximadamente simétrica.
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Teste de Wilcoxon: dados emparelhados


Antes Depois Dif (d) Ordem Ordem c/ Sinal
Considere o exemplo anterior: 14 19 +5 3,5 +3,5
21 21 0 -
33 41 +8 9 +9
H0: venda após ≤ venda antes 29 26 -3 2 -2
H1: venda após > venda antes 34 40 +6 5 +5
26 33 +7 6,5 +6,5
21 28 +7 6,5 +6,5
H0: medd = 0
15 27 +12 11 +11
H1: medd ≠ 0
16 24 +8 9 +9
20 25 +5 3,5 +3,5
29 27 -2 1 -1
18 26 +8 9 +9

n(n + 1) 11(11 + 1)
T− 3−
z= 4 = 4 = −2,667 n=11
n(n + 1)(2n + 1) 11(11 + 1)(22 + 1) Soma Ordens (-) = 3
24 Soma Ordens (+) = 63
EA – Dados Quantitativos – 2 amostras independentes e 2 amostras emparelhadas

Teste de Wilcoxon: dados emparelhados


Analyse

Nonparametric
Tests

Legacy Dialog Test Pair:


Passar a variável “antes”
2 Related Passar a variável “depois”
Samples Test type: WILCOXON

Você também pode gostar