Você está na página 1de 13

EST AV PSI Testes de independência DMat 2022

1 Conceitos básicos

Em Estatı́stica trabalhamos com dados provenientes de amostras (aleatórias) das pop-

ulações em estudo. Amostras aleatórias permitem que qualquer elemento da população

tenha a mesma probabilidade de ser selecionado que qualquer outro.

O processo de indução estatı́stica, ou seja, a partir da amostra retirar conclusões para a pop-

ulação, acarreta erros porque qualquer caracterı́stica da população calculada na amostra,

depende da amostra (ainda que estas sejam aleatória). Por exemplo, a médias das alturas

das crianças de 12 anos portuguesas calculada em 100 amostras aleatórias de dimensão 20,

tem 100 valores diferentes. Este erro de amostragem pode ser controlado a partir da dis-

tribuição das Estatı́sticas em análise.

Teste Estatı́stico, Hipótese Nula e Hipótese Alternativa

Um teste estatı́stico consiste numa regra quantitativa que permite tomar decisões sobre

determinado processo. O objetivo é determinar se existe evidência suficiente para “rejeitar”

uma conjetura ou hipótese sobre o processo – a hipótese nula, H0 . Esta conjetura H0 é,

usualmente, relativa ao statu quo (estado atual). Não rejeitar pode ser um bom resultado se

quisermos continuar a agir como se “acreditássemos” que a hipótese nula é verdadeira. Ou

pode ser um resultado dececionante, possivelmente indicando que ainda não temos dados

suficientes para “provar” algo rejeitando a hipótese nula e aceitando a hipótese alternativa,

H1 , que, em rigor, deve ser a conjetura complementar da H0 .

Testes Paramétricos e Testes Não Paramétricos

Os testes podem ser para parâmetros desconhecidos das populações, cuja distribuição de

probabilidade é supostamente conhecida – testes paramétricos. Por exemplo, testes para

os parâmetros µ (valor médio) e σ 2 (variância) de uma distribuição Normal, ou para o

parâmetro ρ (correlação) de uma distribuição Normal bivariada, ou ainda para o parâmetro

DMat 2022 1 cecilia castro


EST AV PSI Testes de independência

p (probabilidade de sucesso) de uma distribuição Bernoulli . . .

Se os testes são para a distribuição de probabilidade subjacente aos dados, ou para parâmetros

de populações cuja distribuição subjacente é desconhecida, então, dizem-se não paramétricos.

Por exemplo, testar que um conjunto de dados é proveniente de uma distribuição de Poisson,

ou testar que a mediana de uma população é 0.3, ou ainda que a diferença entre as medianas

de duas populações simétricas é 0, etc.

Erros em Testes de Hipóteses

Como se disse anteriormente, um teste de hipóteses é efetuado a partir de uma amostra, pelo

que existem erros associados a este procedimento e probabilidades associadas a esses erros.

• Erro Tipo I: A H0 é rejeitada, sendo verdadeira (falso positivo);

P (Rejetar H0 |H0 Verdadeira) = α

• Erro Tipo II: A A H0 não é rejeitada, sendo falsa (falso negativo).

P (Não Rejetar H0 |H0 Falsa) = β

As probabilidades α e β variam inversamente – se α diminui, β aumenta e vice-versa. A única

forma de se conseguir reduzir simultaneamente estas probabilidades é aumentar a dimensão

da amostra.

Considera-se mais grave cometer um Erro Tipo I do que um Erro Tipo II, pelo que é costume

fixar um valor de α máximo (usualmente 0.05). O valor de α é designado por significância

do teste. Assim, se num TH, α < 0.05, rejeita-se H0 , caso contrário, considera-se que não

existe evidência suficiente para se rejeitar H0 .

Estatı́stica de Teste e distribuição

A Estatı́stica de Teste (ET) é uma função da amostra que não contém parâmetros descon-

hecidos. A distribuição de probabilidade de uma ET permite decidir acerca da rejeição

DMat 2022 2 cecilia castro


EST AV PSI Testes de independência DMat 2022

ou não rejeição da H0 . Por exemplo, num teste paramétrico para o valor médio de uma

população Normal com variância conhecida σ 2 em que

H0 : µ = 105 H1 : µ ̸= 105

X − 105
a ET é Z = √ ∼ N (0, 1) com n dimensão da amostra e X média amostral.
σ/ n

Região Crı́tica

A Região Crı́tica (RC) ou Região de Rejeição (RR) é o conjunto de valores da estatı́stica de

teste (ET) que são menos prováveis de obter, caso H0 seja verdadeira. A definição desta RC

depende da distribuição da ET, do nı́vel de significância estabelecido e da H1 (unilateral ou

bilateral).

Por exemplo, se a população é Normal com variância conhecida, um teste para µ, com nı́vel

de significância α = 0.05, cuja H1 é bilateral, tem RC = ] − ∞, −1.95[∪]1.95, +∞[ conforme

figura (1). Recorda-se que se Z ∼ N (0, 1), P (Z < 1.96) = 0.975, pelo que o quantil de

probabilidade 0.975 no modelo N(0, 1) é 1.96. Se, por outro lado, a H1 é unilateral (à

Figure 1: Região Crı́tica bilateral

esquerda, por exemplo) a RC passa a ser ] − ∞, −1.645[ (figura 2). Recorda-se que se

Z ∼ N (0, 1), P (Z < −1.645) = 0.05, ou seja, o quantil de probabilidade 0.05 no modelo

N(0, 1) é −1.645.

Significância Estatı́stica ou valor p

DMat 2022 3 cecilia castro


EST AV PSI Testes de independência

Figure 2: Região Crı́tica unilateral esquerda

A Significância Estatı́stica do resultado de um teste é a Probabilidade de se obter um valor

da ET mais extremo do que aquele que foi obtido (devido ao acaso, à sorte), se a H0 for

verdadeira. A Significância Estatı́stica do resultado também se costuma designar por p

value. Se lançarmos uma moeda 20 vezes e se, nos 20 lançamentos, sair sempre cara, a

significância estatı́stica deste resultado é 0.520 ≈ 0, assumindo que a modeda é equilibrada.

Neste caso, rejeita-se a hipótese da moeda ser equilibrada para qualquer α. Este valor,

significância estatı́stica ou p value, é designado no SPSS por Sig.. Geralmente se o p value

≤ 0.05, rejeita-se H0 . No caso em que a decisão é com base na significância estatı́stica,

não se calcula a RC porque não se impõe um valor para α. De facto, o valor do p value

corresponde à probabilidade de se cometer Erro Tipo I – se o p value é 0.01, rejeitamos uma

H0 verdadeira 1 vez em 100 ( em média).

2 Testes de independência

Nos testes de independência têm-se duas caracterı́sticas em estudo de uma mesma população.

Pretende-se testar se as duas caracterı́sticas são, ou não, independentes. Por exemplo, na

população dos estudantes universitários, pretende-se testar se o número de pessoas com quem

o estudante reside é idependente, ou não, do estudante ter contraı́do a COVID19.

DMat 2022 4 cecilia castro


EST AV PSI Testes de independência DMat 2022

2.1 Tabelas de Contingência

Uma tabela de contingência é uma representação tabular da distribuição de variáveis categóricas.

No caso de duas variáveis, consiste numa tabela retangular, de dupla entrada, em que col-

unas e linhas são as diferentes categorias de cada uma das duas variáveis em estudo. Nas

tabelas de contigência as células correspondem às frequências observadas no cruzamento de

ambas as categorias.

Exemplo: Dados Titanic. Tabela de contigência associada à distribuição das variáveis

Classe de viagem, com categorias First, Second, Third e Crew, e ainda Resultado com

categorias Alive e Dead. A leitura da primeira linha da tabela é a seguinte:

Alive Dead

First 203 122 325

Second 118 167 285

Third 178 528 706

Crew 212 673 885

Total: 711 1490 2201

Table 1: Tabela de Contingência: dados Titanic

• 203 individuos que viajavam em primeira classe, sobreviveram e 122 morreram. O total

de indivı́duos que viajava em primeira classe é 325.

As outras linhas têm leitura análoga. Notar que a última linha tem a seguinte interpretação:

• 711 individuos sobreviveram, 1490 morreram. O total de indivı́duos considerado é

2201.

As entradas da tabela podem ser convertidas em frequências relativas, dividindo cada entrada

pelo número total de indivı́duos: 2201. A leitura da primeira linha da tabela é a seguinte:

DMat 2022 5 cecilia castro


EST AV PSI Testes de independência

Alive Dead

First 0.092 0.055 0.147

Second 0.054 0.076 0.130

Third 0.081 0.240 0.321

Crew 0.096 0.306 0.402

Total: 0.323 0.677 1

Table 2: Tabela de Contingência: frequências relativas

• A proporção de individuos que viajavam em primeira classe e sobreviveram é 0.092,

enquanto que a proporção de individuos que viajavam em primeira classe e morreram

é 0.055. A proporção de indivı́duos que viajavam em primeira classe é 0.147. Usando

as proporções (frequências relativas) dos acontecimentos como estimativas da proba-

bilidade desses acontecimentos, pode-se dizer que:

(1) P (First ∩ Alive) = 0.092

(2) P (First ∩ Dead) = 0.055

(3) P (First) = 0.147

As outras linhas têm leitura análoga. Note que a última linha tem a seguinte interpretação:

As estimativas para a probabilidade de Sobreviver (Alive) e de Morrer (Dead) são, respeti-

vamente, 0.323 e 0.677,

Probabilidades Condicionadas

Caso I

Dividindo cada linha da tabela de contigência (1) pelo total de linha, tem-se: Neste caso, a

leitura da primeira linha da tabela é a seguinte:

DMat 2022 6 cecilia castro


EST AV PSI Testes de independência DMat 2022

Alive Dead

First 0.625 0.375 1

Second 0.414 0.586 1

Third 0.252 0.748 1

Crew 0.240 0.760 1

Table 3: Tabela de Contingência: probabilidades condicionadas (linhas)

• A proporção de individuos que sobreviveram dos que viajavam em primeira classe é

0.625, enquanto que a proporção de individuos que morreram dos que viajavam em

primeira classe é 0.375. A entrada 1 é justificada pelo facto de se estar a usar como

universo o conjunto de indivı́duos que viajavam em primeira classe. Neste caso, as

frequências das entradas correspondem a estimativas de probabilidade condicionadas:

(1) P (Alive|First) = 0.625

(2) P (Dead|First) = 0.375

O sı́mbolo | entre os acontecimentos lê-se “dado que”. Assim, P (Alive|First) lê-se Prob-

abilidade de Sobreviver dado que viajava em Primeira Classe. As outras linhas têm leitura

análoga. Neste caso não faz sentido somar as colunas.

Caso II

Dividindo cada coluna da tabela de contigência (1) pelo total de coluna, tem-se: A leitura

da primeira coluna da tabela é a seguinte:

• Dos que sobreviveram, a proporção de individuos que viajavam em primeira classe é

0.286, a proporção de individuos que viajavam em segunda classe é 0.166, a proporção

de individuos que viajavam em terceira classe é 0.250 e a proporção de individuos

da tripulação é 0.298. A entrada 1 é justificada pelo facto de se estar a usar como

DMat 2022 7 cecilia castro


EST AV PSI Testes de independência

Alive Dead

First 0.286 0.082

Second 0.166 0.112

Third 0.250 0.354

Crew 0.298 0.452

Total: 1 1

Table 4: Tabela de Contingência: probabilidades condicionadas (colunas)

universo o conjunto de indivı́duos que sobreviveu. Neste caso, as frequências das

entradas correspondem a estimativas de probabilidade condicionadas:

(1) P (First|Alive) = 0.286

(2) P (Second|Alive) = 0.166

(3) P (Third|Alive) = 0.250

(4) P (Crew|Alive) = 0.298

2.2 Testes de independência em tabelas de contingência

Num teste de independência tem-se

H0 : X e Y são independentes vs. H1 : X e Y não são independentes vs.

A ET depende do tipo de variáveis.

Quando as variáveis são do tipo qualitativo (categóricas), com distribuição representada por

uma tabela de contingência com r linhas e s colunas, a ET é dada por


X (Oij − Eij )2
∼ χ2(r−1)(s−1)
ij
Eij

onde Oij representa a frequência observada na célula (i, j) da tabela e Eij a frequência

esperada nessa célula (i, j), se H0 for verdadeira (ou seja se X e Y forem independentes).

DMat 2022 8 cecilia castro


EST AV PSI Testes de independência DMat 2022

Esta distribuição é assintótica e só é válida sob determinadas condições:

1. As frequências esperadas em cada classe devem ter, no mı́nimo, valor 5. Caso contrário,

devem-se reorganizar os dados em classes que permitam que esta condição seja satis-

feita.

2. A condição anterior pode ser relaxada, mas não é possı́vel executar o teste se mais de

20% das classes tiverem uma frequência esperada inferior a 5. No entanto, nenhuma

das classes deve ter uma frequência esperada inferior a 1.

2.2.1 Caso Tabelas 2 por 2

No caso em que as variáveis em análise são dicotómicas, têm apenas 2 categorias, as tabelas

resultantes são 2 por 2. Neste caso, a ET a utilizar tem distribuição exata (Fisher) e pode

ser usada em todas as condições. Caso se opte por utilizar a distribuição assintótica do qui-

quadrado, deve ser feita uma correção de continuidade (de Yates), para melhorar a análise

feita a partir do qui-quadrado, uma vez que se está a aproximar uma distribuição discreta

por uma distribuição contı́nua. No entanto, se n é pequeno, deve-se usar o teste exato de

Fisher porque este teste não tem restrições à sua utilização em tabelas 2 por 2.

O SPSS produz ainda resultados de outros testes alternativos ao qui-quadrado, como

Likelihood Ratio que se usa em modelos log-lineares (para grandes amostras os dois testes

produzem resultados semelhantes). Quanto a Linear by Linear Association é coeficiente

do coeficiente de correlação de Pearson e apenas se aplica a variáveis quantitativas, pelo que

deve ser ignorado.

2.2.2 Cálculo de Frequências Esperadas. Exemplo Titanic.

Relativamente ao exemplo descrito acima, a frequência observada da célula (2, 1) da tabela

de contigência (1) é 118. Se as variáveis Classe e Resultado fossem independentes, a

DMat 2022 9 cecilia castro


EST AV PSI Testes de independência

frequência esperada nessa célula seria 92.42. De facto, no caso das variáveis serem indepen-

dentes, os acontecimentos Second e Alive também o são, pelo que, P (Second ∩ Alive) =

P (Second)P (Alive) = (285/2201) ∗ (711/2201) = 0.042, e a frequência esperada seria

(285/2201) ∗ (711/2201) ∗ 2201 = 92.065.

Efetuando todos os cálculos para as frequências esperadas, a tabela resultante será (5):

Como seria de esperar, dadas as diferenças entre o que se observou e o que se esperaria se as

Alive Dead

First 104.986 220.014

Second 92.065 192.935

Third 228.063 477.937

Crew 285.886 599.114

Table 5: Tabela de Frequências Esperadas

variáveis fossem independentes, o resultado do teste do qui-quadrado é muito significativo.

Tem-se o valor da ET = 190.4, graus de liberdade: 3, com uma significância estatı́stica,

p-value < 0.001, rejeitando-se a hipótese de independência entre Classe e Resultado, pelo

que Sobreviver depende da classe em que se viaja.

Exercı́cio: Executar todo o procedimento descrito com o SPSS. Elaborar um gráfico para

representar o problema.

2.3 Medidas de associação

Caso se rejeite da H0 num teste de independência do qui-quadrado, importa medir a inten-

sidade da associação entre as variáveis categóricas X e Y . O SPSS apresenta medidas de

associação baseadas na estatı́stica de qui-quadrado – Phi, C de Pearson e V. de Cramer.

• Phi – apenas para tabelas 2 por 2. Varia entre 0 (ausência de associação) e 1 (associação

DMat 2022 10 cecilia castro


EST AV PSI Testes de independência DMat 2022

perfeita).
ET
P hi =
n

• V. de Cramer – para tabelas r × s, com r ≥ 2 e s ≥ 2. Para tabelas 2 por 2 é igual ao

coeficiente Phi. Varia entre 0 (ausência de associação) e 1 (associação perfeita).

ET
V. de Cramer =
n(q − 1)

onde q = min{r, s}

• C de Pearson – para tabelas r × s, com r ≥ 2 e s ≥ 2. Varia de 0 (independência) a


q
q−1
q
< 1, onde q = min{r, s}.
r
ET
C. de P earson =
ET + n

Se o valor resultante do indicador for:

• > 0.5, a associação é elevada;

• entre 0.3 e 0.5, a associação é moderada;

• entre 0.1 e 0.3 (exclusive), a associação é baixa;

• < 0.1, a associação é negligenciável.

Exercı́cios

1. Suponha que conduziu um teste independência do χ2 no SPSS e obteve um valor de

significância estatı́stica de 0.026. Diga se rejeita, ou não rejeita a H0 para um nı́vel de

significância

(a) α = 0.01

DMat 2022 11 cecilia castro


EST AV PSI Testes de independência

(b) α = 0.05

(c) α = 0.1

2. Qual a probabilidade de erro tipo I associada ao teste da questão anterior?

3. Considere a tabela produzida pelo SPSS constante na Figura (3). Esta tabela inclui

as observações relativas às classes de Género (Male: masculino, Female: feminino)

cruzadas com a variável dicotómica representada pela questão “Aguma vez fumou

cigarros?” (“Ever smoked Ciggarettes?”) com valores não (No) e sim (Yes). De

Figure 3: Tabela Cruzada: Gender vs. Smoke

acordo com estes dados,

(a) Quantos indivı́duos foram inquiridos? Quantos do género feminino e quantos do

género masculino?

(b) Qual a estimativa para a probabilidade de um indivı́duo ter fumado alguma vez?

(c) Qual a estimativa para a probabilidade de nunca ter fumado e ser do género

masculino?

DMat 2022 12 cecilia castro


EST AV PSI Testes de independência DMat 2022

(d) Qual a estimativa para a probabilidade de ser do género feminino, dado que fumou

alguma vez?

(e) Qual a estimativa para a probabilidade de ter fumado alguma vez, dado que é do

género masculino?

4. Relativamente ao exercı́cio da alı́nea anterior, o SPSS produziu o quadro da Figura

(4).

Figure 4: Resultado SPSS Gender vs. Smoke

(a) Qual o valor da ET do Qui-Quadrado? Quantos graus de liberdade foram utiliza-

dos? Qual a significância estatı́stica do resultado.

(b) Caso se aplique, calcule indicadores da intensidade de associação entre as variáveis.

(c) Reproduza esta tabela, usando os dados do exercı́cio anterior.

DMat 2022 13 cecilia castro

Você também pode gostar