EstPsicMASTER Testes

EST AV PSI Testes de independência DMat 2022
1 Conceitos básicos
Em Estatı́stica trabalhamos com dados provenientes de amostras (aleatórias) das pop-
ulações em estudo. Amostras aleatórias permitem que qualquer elemento da população
tenha a mesma probabilidade de ser selecionado que qualquer outro.
O processo de indução estatı́stica, ou seja, a partir da amostra retirar conclusões para a pop-
ulação, acarreta erros porque qualquer caracterı́stica da população calculada na amostra,
depende da amostra (ainda que estas sejam aleatória). Por exemplo, a médias das alturas
das crianças de 12 anos portuguesas calculada em 100 amostras aleatórias de dimensão 20,
tem 100 valores diferentes. Este erro de amostragem pode ser controlado a partir da dis-
tribuição das Estatı́sticas em análise.
Teste Estatı́stico, Hipótese Nula e Hipótese Alternativa
Um teste estatı́stico consiste numa regra quantitativa que permite tomar decisões sobre
determinado processo. O objetivo é determinar se existe evidência suficiente para “rejeitar”
uma conjetura ou hipótese sobre o processo – a hipótese nula, H0 . Esta conjetura H0 é,
usualmente, relativa ao statu quo (estado atual). Não rejeitar pode ser um bom resultado se
quisermos continuar a agir como se “acreditássemos” que a hipótese nula é verdadeira. Ou
pode ser um resultado dececionante, possivelmente indicando que ainda não temos dados
suficientes para “provar” algo rejeitando a hipótese nula e aceitando a hipótese alternativa,
H1 , que, em rigor, deve ser a conjetura complementar da H0 .
Testes Paramétricos e Testes Não Paramétricos
Os testes podem ser para parâmetros desconhecidos das populações, cuja distribuição de
probabilidade é supostamente conhecida – testes paramétricos. Por exemplo, testes para
os parâmetros µ (valor médio) e σ 2 (variância) de uma distribuição Normal, ou para o
parâmetro ρ (correlação) de uma distribuição Normal bivariada, ou ainda para o parâmetro
DMat 2022 1 cecilia castro

EST AV PSI Testes de independência
p (probabilidade de sucesso) de uma distribuição Bernoulli . . .
Se os testes são para a distribuição de probabilidade subjacente aos dados, ou para parâmetros
de populações cuja distribuição subjacente é desconhecida, então, dizem-se não paramétricos.
Por exemplo, testar que um conjunto de dados é proveniente de uma distribuição de Poisson,
ou testar que a mediana de uma população é 0.3, ou ainda que a diferença entre as medianas
de duas populações simétricas é 0, etc.
Erros em Testes de Hipóteses
Como se disse anteriormente, um teste de hipóteses é efetuado a partir de uma amostra, pelo
que existem erros associados a este procedimento e probabilidades associadas a esses erros.
• Erro Tipo I: A H0 é rejeitada, sendo verdadeira (falso positivo);
P (Rejetar H0 |H0 Verdadeira) = α
• Erro Tipo II: A A H0 não é rejeitada, sendo falsa (falso negativo).
P (Não Rejetar H0 |H0 Falsa) = β
As probabilidades α e β variam inversamente – se α diminui, β aumenta e vice-versa. A única
forma de se conseguir reduzir simultaneamente estas probabilidades é aumentar a dimensão
da amostra.
Considera-se mais grave cometer um Erro Tipo I do que um Erro Tipo II, pelo que é costume
fixar um valor de α máximo (usualmente 0.05). O valor de α é designado por significância
do teste. Assim, se num TH, α < 0.05, rejeita-se H0 , caso contrário, considera-se que não
existe evidência suficiente para se rejeitar H0 .
Estatı́stica de Teste e distribuição
A Estatı́stica de Teste (ET) é uma função da amostra que não contém parâmetros descon-
hecidos. A distribuição de probabilidade de uma ET permite decidir acerca da rejeição

ou não rejeição da H0 . Por exemplo, num teste paramétrico para o valor médio de uma
população Normal com variância conhecida σ 2 em que
H0 : µ = 105 H1 : µ ̸= 105
X − 105
a ET é Z = √ ∼ N (0, 1) com n dimensão da amostra e X média amostral.
σ/ n
Região Crı́tica
A Região Crı́tica (RC) ou Região de Rejeição (RR) é o conjunto de valores da estatı́stica de
teste (ET) que são menos prováveis de obter, caso H0 seja verdadeira. A definição desta RC
depende da distribuição da ET, do nı́vel de significância estabelecido e da H1 (unilateral ou
bilateral).
Por exemplo, se a população é Normal com variância conhecida, um teste para µ, com nı́vel
de significância α = 0.05, cuja H1 é bilateral, tem RC = ] − ∞, −1.95[∪]1.95, +∞[ conforme
figura (1). Recorda-se que se Z ∼ N (0, 1), P (Z < 1.96) = 0.975, pelo que o quantil de
probabilidade 0.975 no modelo N(0, 1) é 1.96. Se, por outro lado, a H1 é unilateral (à
Figure 1: Região Crı́tica bilateral
esquerda, por exemplo) a RC passa a ser ] − ∞, −1.645[ (figura 2). Recorda-se que se
Z ∼ N (0, 1), P (Z < −1.645) = 0.05, ou seja, o quantil de probabilidade 0.05 no modelo
N(0, 1) é −1.645.
Significância Estatı́stica ou valor p

Figure 2: Região Crı́tica unilateral esquerda
A Significância Estatı́stica do resultado de um teste é a Probabilidade de se obter um valor
da ET mais extremo do que aquele que foi obtido (devido ao acaso, à sorte), se a H0 for
verdadeira. A Significância Estatı́stica do resultado também se costuma designar por p
value. Se lançarmos uma moeda 20 vezes e se, nos 20 lançamentos, sair sempre cara, a
significância estatı́stica deste resultado é 0.520 ≈ 0, assumindo que a modeda é equilibrada.
Neste caso, rejeita-se a hipótese da moeda ser equilibrada para qualquer α. Este valor,
significância estatı́stica ou p value, é designado no SPSS por Sig.. Geralmente se o p value
≤ 0.05, rejeita-se H0 . No caso em que a decisão é com base na significância estatı́stica,
não se calcula a RC porque não se impõe um valor para α. De facto, o valor do p value
corresponde à probabilidade de se cometer Erro Tipo I – se o p value é 0.01, rejeitamos uma
H0 verdadeira 1 vez em 100 ( em média).
2 Testes de independência
Nos testes de independência têm-se duas caracterı́sticas em estudo de uma mesma população.
Pretende-se testar se as duas caracterı́sticas são, ou não, independentes. Por exemplo, na
população dos estudantes universitários, pretende-se testar se o número de pessoas com quem
o estudante reside é idependente, ou não, do estudante ter contraı́do a COVID19.

2.1 Tabelas de Contingência
Uma tabela de contingência é uma representação tabular da distribuição de variáveis categóricas.
No caso de duas variáveis, consiste numa tabela retangular, de dupla entrada, em que col-
unas e linhas são as diferentes categorias de cada uma das duas variáveis em estudo. Nas
tabelas de contigência as células correspondem às frequências observadas no cruzamento de
ambas as categorias.
Exemplo: Dados Titanic. Tabela de contigência associada à distribuição das variáveis
Classe de viagem, com categorias First, Second, Third e Crew, e ainda Resultado com
categorias Alive e Dead. A leitura da primeira linha da tabela é a seguinte:
Alive Dead
First 203 122 325
Second 118 167 285
Third 178 528 706
Crew 212 673 885
Total: 711 1490 2201
Table 1: Tabela de Contingência: dados Titanic
• 203 individuos que viajavam em primeira classe, sobreviveram e 122 morreram. O total
de indivı́duos que viajava em primeira classe é 325.
As outras linhas têm leitura análoga. Notar que a última linha tem a seguinte interpretação:
• 711 individuos sobreviveram, 1490 morreram. O total de indivı́duos considerado é
2201.
As entradas da tabela podem ser convertidas em frequências relativas, dividindo cada entrada
pelo número total de indivı́duos: 2201. A leitura da primeira linha da tabela é a seguinte:

Alive Dead
First 0.092 0.055 0.147
Second 0.054 0.076 0.130
Third 0.081 0.240 0.321
Crew 0.096 0.306 0.402
Total: 0.323 0.677 1
Table 2: Tabela de Contingência: frequências relativas
• A proporção de individuos que viajavam em primeira classe e sobreviveram é 0.092,
enquanto que a proporção de individuos que viajavam em primeira classe e morreram
é 0.055. A proporção de indivı́duos que viajavam em primeira classe é 0.147. Usando
as proporções (frequências relativas) dos acontecimentos como estimativas da proba-
bilidade desses acontecimentos, pode-se dizer que:
(1) P (First ∩ Alive) = 0.092
(2) P (First ∩ Dead) = 0.055
(3) P (First) = 0.147
As outras linhas têm leitura análoga. Note que a última linha tem a seguinte interpretação:
As estimativas para a probabilidade de Sobreviver (Alive) e de Morrer (Dead) são, respeti-
vamente, 0.323 e 0.677,
Probabilidades Condicionadas
Caso I
Dividindo cada linha da tabela de contigência (1) pelo total de linha, tem-se: Neste caso, a
leitura da primeira linha da tabela é a seguinte:

Alive Dead
First 0.625 0.375 1
Second 0.414 0.586 1
Third 0.252 0.748 1
Crew 0.240 0.760 1
Table 3: Tabela de Contingência: probabilidades condicionadas (linhas)
• A proporção de individuos que sobreviveram dos que viajavam em primeira classe é
0.625, enquanto que a proporção de individuos que morreram dos que viajavam em
primeira classe é 0.375. A entrada 1 é justificada pelo facto de se estar a usar como
universo o conjunto de indivı́duos que viajavam em primeira classe. Neste caso, as
frequências das entradas correspondem a estimativas de probabilidade condicionadas:
(1) P (Alive|First) = 0.625
(2) P (Dead|First) = 0.375
O sı́mbolo | entre os acontecimentos lê-se “dado que”. Assim, P (Alive|First) lê-se Prob-
abilidade de Sobreviver dado que viajava em Primeira Classe. As outras linhas têm leitura
análoga. Neste caso não faz sentido somar as colunas.
Caso II
Dividindo cada coluna da tabela de contigência (1) pelo total de coluna, tem-se: A leitura
da primeira coluna da tabela é a seguinte:
• Dos que sobreviveram, a proporção de individuos que viajavam em primeira classe é
0.286, a proporção de individuos que viajavam em segunda classe é 0.166, a proporção
de individuos que viajavam em terceira classe é 0.250 e a proporção de individuos
da tripulação é 0.298. A entrada 1 é justificada pelo facto de se estar a usar como

Alive Dead
First 0.286 0.082
Second 0.166 0.112
Third 0.250 0.354
Crew 0.298 0.452
Total: 1 1
Table 4: Tabela de Contingência: probabilidades condicionadas (colunas)
universo o conjunto de indivı́duos que sobreviveu. Neste caso, as frequências das
entradas correspondem a estimativas de probabilidade condicionadas:
(1) P (First|Alive) = 0.286
(2) P (Second|Alive) = 0.166
(3) P (Third|Alive) = 0.250
(4) P (Crew|Alive) = 0.298
2.2 Testes de independência em tabelas de contingência
Num teste de independência tem-se
H0 : X e Y são independentes vs. H1 : X e Y não são independentes vs.
A ET depende do tipo de variáveis.
Quando as variáveis são do tipo qualitativo (categóricas), com distribuição representada por
uma tabela de contingência com r linhas e s colunas, a ET é dada por

X (Oij − Eij )2
∼ χ2(r−1)(s−1)
ij
Eij
onde Oij representa a frequência observada na célula (i, j) da tabela e Eij a frequência
esperada nessa célula (i, j), se H0 for verdadeira (ou seja se X e Y forem independentes).

Esta distribuição é assintótica e só é válida sob determinadas condições:
1. As frequências esperadas em cada classe devem ter, no mı́nimo, valor 5. Caso contrário,
devem-se reorganizar os dados em classes que permitam que esta condição seja satis-
feita.
2. A condição anterior pode ser relaxada, mas não é possı́vel executar o teste se mais de
20% das classes tiverem uma frequência esperada inferior a 5. No entanto, nenhuma
das classes deve ter uma frequência esperada inferior a 1.
2.2.1 Caso Tabelas 2 por 2
No caso em que as variáveis em análise são dicotómicas, têm apenas 2 categorias, as tabelas
resultantes são 2 por 2. Neste caso, a ET a utilizar tem distribuição exata (Fisher) e pode
ser usada em todas as condições. Caso se opte por utilizar a distribuição assintótica do qui-
quadrado, deve ser feita uma correção de continuidade (de Yates), para melhorar a análise
feita a partir do qui-quadrado, uma vez que se está a aproximar uma distribuição discreta
por uma distribuição contı́nua. No entanto, se n é pequeno, deve-se usar o teste exato de
Fisher porque este teste não tem restrições à sua utilização em tabelas 2 por 2.
O SPSS produz ainda resultados de outros testes alternativos ao qui-quadrado, como
Likelihood Ratio que se usa em modelos log-lineares (para grandes amostras os dois testes
produzem resultados semelhantes). Quanto a Linear by Linear Association é coeficiente
do coeficiente de correlação de Pearson e apenas se aplica a variáveis quantitativas, pelo que
deve ser ignorado.
2.2.2 Cálculo de Frequências Esperadas. Exemplo Titanic.
Relativamente ao exemplo descrito acima, a frequência observada da célula (2, 1) da tabela
de contigência (1) é 118. Se as variáveis Classe e Resultado fossem independentes, a

frequência esperada nessa célula seria 92.42. De facto, no caso das variáveis serem indepen-
dentes, os acontecimentos Second e Alive também o são, pelo que, P (Second ∩ Alive) =
P (Second)P (Alive) = (285/2201) ∗ (711/2201) = 0.042, e a frequência esperada seria
(285/2201) ∗ (711/2201) ∗ 2201 = 92.065.
Efetuando todos os cálculos para as frequências esperadas, a tabela resultante será (5):
Como seria de esperar, dadas as diferenças entre o que se observou e o que se esperaria se as
Alive Dead
First 104.986 220.014
Second 92.065 192.935
Third 228.063 477.937
Crew 285.886 599.114
Table 5: Tabela de Frequências Esperadas
variáveis fossem independentes, o resultado do teste do qui-quadrado é muito significativo.
Tem-se o valor da ET = 190.4, graus de liberdade: 3, com uma significância estatı́stica,
p-value < 0.001, rejeitando-se a hipótese de independência entre Classe e Resultado, pelo
que Sobreviver depende da classe em que se viaja.
Exercı́cio: Executar todo o procedimento descrito com o SPSS. Elaborar um gráfico para
representar o problema.
2.3 Medidas de associação
Caso se rejeite da H0 num teste de independência do qui-quadrado, importa medir a inten-
sidade da associação entre as variáveis categóricas X e Y . O SPSS apresenta medidas de
associação baseadas na estatı́stica de qui-quadrado – Phi, C de Pearson e V. de Cramer.
• Phi – apenas para tabelas 2 por 2. Varia entre 0 (ausência de associação) e 1 (associação

perfeita).
ET
P hi =
n
• V. de Cramer – para tabelas r × s, com r ≥ 2 e s ≥ 2. Para tabelas 2 por 2 é igual ao
coeficiente Phi. Varia entre 0 (ausência de associação) e 1 (associação perfeita).
ET
V. de Cramer =
n(q − 1)
onde q = min{r, s}
• C de Pearson – para tabelas r × s, com r ≥ 2 e s ≥ 2. Varia de 0 (independência) a

q
q−1
q
< 1, onde q = min{r, s}.
r
ET
C. de P earson =
ET + n
Se o valor resultante do indicador for:
• > 0.5, a associação é elevada;
• entre 0.3 e 0.5, a associação é moderada;
• entre 0.1 e 0.3 (exclusive), a associação é baixa;
• < 0.1, a associação é negligenciável.
Exercı́cios
1. Suponha que conduziu um teste independência do χ2 no SPSS e obteve um valor de
significância estatı́stica de 0.026. Diga se rejeita, ou não rejeita a H0 para um nı́vel de
significância
(a) α = 0.01

(b) α = 0.05
(c) α = 0.1
2. Qual a probabilidade de erro tipo I associada ao teste da questão anterior?
3. Considere a tabela produzida pelo SPSS constante na Figura (3). Esta tabela inclui
as observações relativas às classes de Género (Male: masculino, Female: feminino)
cruzadas com a variável dicotómica representada pela questão “Aguma vez fumou
cigarros?” (“Ever smoked Ciggarettes?”) com valores não (No) e sim (Yes). De
Figure 3: Tabela Cruzada: Gender vs. Smoke
acordo com estes dados,
(a) Quantos indivı́duos foram inquiridos? Quantos do género feminino e quantos do
género masculino?
(b) Qual a estimativa para a probabilidade de um indivı́duo ter fumado alguma vez?
(c) Qual a estimativa para a probabilidade de nunca ter fumado e ser do género
masculino?

(d) Qual a estimativa para a probabilidade de ser do género feminino, dado que fumou
alguma vez?
(e) Qual a estimativa para a probabilidade de ter fumado alguma vez, dado que é do
género masculino?
4. Relativamente ao exercı́cio da alı́nea anterior, o SPSS produziu o quadro da Figura
(4).
Figure 4: Resultado SPSS Gender vs. Smoke
(a) Qual o valor da ET do Qui-Quadrado? Quantos graus de liberdade foram utiliza-
dos? Qual a significância estatı́stica do resultado.
(b) Caso se aplique, calcule indicadores da intensidade de associação entre as variáveis.
(c) Reproduza esta tabela, usando os dados do exercı́cio anterior.

EstPsicMASTER Testes

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

EstPsicMASTER Testes

Enviado por

Direitos autorais:

Formatos disponíveis

EST AV PSI Testes de independência DMat 2022

Em Estatı́stica trabalhamos com dados provenientes de amostras (aleatórias) das pop-

ulações em estudo. Amostras aleatórias permitem que qualquer elemento da população

tenha a mesma probabilidade de ser selecionado que qualquer outro.

ulação, acarreta erros porque qualquer caracterı́stica da população calculada na amostra,

tribuição das Estatı́sticas em análise.

Teste Estatı́stico, Hipótese Nula e Hipótese Alternativa

determinado processo. O objetivo é determinar se existe evidência suficiente para “rejeitar”

quisermos continuar a agir como se “acreditássemos” que a hipótese nula é verdadeira. Ou

H1 , que, em rigor, deve ser a conjetura complementar da H0 .

Testes Paramétricos e Testes Não Paramétricos

probabilidade é supostamente conhecida – testes paramétricos. Por exemplo, testes para

os parâmetros µ (valor médio) e σ 2 (variância) de uma distribuição Normal, ou para o

parâmetro ρ (correlação) de uma distribuição Normal bivariada, ou ainda para o parâmetro

DMat 2022 1 cecilia castro

p (probabilidade de sucesso) de uma distribuição Bernoulli . . .

de populações cuja distribuição subjacente é desconhecida, então, dizem-se não paramétricos.

de duas populações simétricas é 0, etc.

Erros em Testes de Hipóteses

• Erro Tipo I: A H0 é rejeitada, sendo verdadeira (falso positivo);

P (Rejetar H0 |H0 Verdadeira) = α

• Erro Tipo II: A A H0 não é rejeitada, sendo falsa (falso negativo).

P (Não Rejetar H0 |H0 Falsa) = β

As probabilidades α e β variam inversamente – se α diminui, β aumenta e vice-versa. A única

forma de se conseguir reduzir simultaneamente estas probabilidades é aumentar a dimensão

fixar um valor de α máximo (usualmente 0.05). O valor de α é designado por significância

existe evidência suficiente para se rejeitar H0 .

Estatı́stica de Teste e distribuição

hecidos. A distribuição de probabilidade de uma ET permite decidir acerca da rejeição

DMat 2022 2 cecilia castro

população Normal com variância conhecida σ 2 em que

A Região Crı́tica (RC) ou Região de Rejeição (RR) é o conjunto de valores da estatı́stica de

depende da distribuição da ET, do nı́vel de significância estabelecido e da H1 (unilateral ou

de significância α = 0.05, cuja H1 é bilateral, tem RC = ] − ∞, −1.95[∪]1.95, +∞[ conforme

Figure 1: Região Crı́tica bilateral

Significância Estatı́stica ou valor p

DMat 2022 3 cecilia castro

Figure 2: Região Crı́tica unilateral esquerda

A Significância Estatı́stica do resultado de um teste é a Probabilidade de se obter um valor

verdadeira. A Significância Estatı́stica do resultado também se costuma designar por p

significância estatı́stica deste resultado é 0.520 ≈ 0, assumindo que a modeda é equilibrada.

significância estatı́stica ou p value, é designado no SPSS por Sig.. Geralmente se o p value

≤ 0.05, rejeita-se H0 . No caso em que a decisão é com base na significância estatı́stica,

corresponde à probabilidade de se cometer Erro Tipo I – se o p value é 0.01, rejeitamos uma

H0 verdadeira 1 vez em 100 ( em média).

Pretende-se testar se as duas caracterı́sticas são, ou não, independentes. Por exemplo, na

o estudante reside é idependente, ou não, do estudante ter contraı́do a COVID19.

DMat 2022 4 cecilia castro

2.1 Tabelas de Contingência

Uma tabela de contingência é uma representação tabular da distribuição de variáveis categóricas.

tabelas de contigência as células correspondem às frequências observadas no cruzamento de

Exemplo: Dados Titanic. Tabela de contigência associada à distribuição das variáveis

categorias Alive e Dead. A leitura da primeira linha da tabela é a seguinte:

First 203 122 325

Second 118 167 285

Third 178 528 706

Crew 212 673 885

Total: 711 1490 2201

Table 1: Tabela de Contingência: dados Titanic

de indivı́duos que viajava em primeira classe é 325.

• 711 individuos sobreviveram, 1490 morreram. O total de indivı́duos considerado é

DMat 2022 5 cecilia castro

First 0.092 0.055 0.147