Você está na página 1de 18

Universidade de Brasília - Y Instituto de Psicologia

Programa de Pós-graduação em Psicologia Social, do Trabalho e das Organizações.

ROTEIRO PARA REALIZAÇÃO DO TESTE t de COMPARAÇÃO ENTRE MÉDIAS, CORRELAÇÕES E QUI-


QUADRADO

Elaine Rabelo Neiva

Antes de qualquer análise estatística é necessário que se faça uma análise exploratória dos
dados coletados. Esta análise tem duas finalidades principais: (1) descrever e explorar as características
principais dos resultados sem uma preocupação exclusiva com os objetivos ou hipóteses do trabalho (o
que não significa que não possam ocorrer conjuntamente), e (2) investigar se um conjunto de
pressupostos estatísticos está presente nos dados. Para tanto, vamos utilizar o banco de dados
fornecido no livro de Hair, Anderson, Tatham e Black denominado HATCO. Na figura abaixo está uma
reprodução parcial desse banco de dados.

Figura 1: Banco de dados HATCO


São as seguintes as variáveis contidas no arquivo de dados HATCO:

Definições e codificação das variáveis

Percepções sobre a HATCO (empresa fictícia fornecedora industrial); medidas através de uma escala
gráfica de 10 cem foi desenhada entre os pontos: Ruim e Excelente. Os respondentes marcavam
qualquer ponto da linha e a distância em cm era anotada. As respostas foram arredondadas para
uma casa decimal. São sete os atributos avaliados pelos respondentes:
X1 – Velocidade de Entrega: tempo total necessário para entregar o produto assim que a encomenda
foi confirmada;
X2 – Nível de Preço: nível percebido de preço cobrado por fornecedores do produto;
X3 – Flexibilidade d Preço: disposição percebida de representantes da HATCO em negociar preços em
todos os tipos de compras;
X4 – Imagem do fabricante: Imagem geral do fabricante ou fornecedor;
X5 – Serviço Geral: nível geral de serviço necessário para manter uma relação satisfatória entre
fornecedor e comprador;
X6 – Imagem da Força de Vendas: imagem geral da força de vendas do fabricante;
X7 – Qualidade do Produto: nível percebido de qualidade de um produto em particular
(funcionamento ou produtividade).

Resultados das Compras: duas medidas que refletiram os resultados das relações de compra dos
respondentes com a HATCO –
X9 – Nível de Uso – quanto do produto total da empresa é comprado da HATCO, medido em uma
escala de 100 pontos percentuais, que varia de zero a 100%;
X10 – Nível de Satisfação: nível de satisfação do comprador com as compras que realizou junto à
HATCO, medido através da mesma escala gráfica de percepções utilizada nos itens X1 a X7.
3. Características do Comprador: cinco características, algumas métricas e outras não métricas.
X8. Tamanho da empresa: tamanho em relação a outras empresas (1=grande e 0=pequena);
X11. Especificação de compra: o quanto um comprador em particular avalia cada compra
separadamente (análise do valor total) versus uso de especificações de compra, as quais detalham
precisamente as características procuradas do produto (1= emprega análise do valor total, avaliando
cada produto em separado e 0 = uso de especificação de compra);
X12. Estrutura de Aquisição: método de adquirir ou comprar produtos em uma empresa em particular.
(1 = aquisição centralizada; 0 = aquisição não centralizada);
X13. Tipo de indústria: 1 = indústria; 0 = outras indústrias a que pertence o cliente;
X14. Tipo de situação de compra: situação de compra enfrentada pelo comprador. (1 = nova tarefa; 2 =
nova compra modificada; 3 =nova compra simples).
Fonte: Hair, Anderson, Tatham e Black (2005).

Neste roteiro serão exploradas formas de análise da associação entre duas variáveis ou
análises bivariadas.


ANÁLISE BIVARIADA

Para realizar uma análise bivariada, ou seja, análise da relação entre duas variáveis,
utilizam-se testes estatísticos e/ou gráficos adequados:
a) Para duas variáveis quantitativas
• Gráfico - “Scatterplot” de X e Y
• Coeficiente de Correlação de Pearson
• Análise de Regressão Simples
b) Para duas variáveis categóricas (qualitativas)
• Teste Qui-Quadrado e a Análise dos Resíduos
• Análise de Correspondência
• Gráfico de colunas por estratos da segunda variável
c) Para uma variável quantitativa e uma qualitativa
• Categoriza-se a variável quantitativa e procede-se como no item anterior.
• Gráfico “Box-Plot”, para cada estrato ou categoria da variável qualitativa.


VARIÁVEIS QUANTITATIVAS X QUANTITATIVAS


OBTER GRÁFICO DE PONTOS (SCATTERPLOT)

O gráfico de pontos (Scatterplot) deve ser uma etapa preliminar ao cálculo do
Coeficiente de Correlação. Neste gráfico, cada ponto representa um par observado de valores
das duas variáveis (X,Y).

Através deste gráfico podemos visualizar empiricamente a relação entre as variáveis. Para se
obter o gráfico Scatterplot (gráfico de pontos) procede-se da seguinte maneira:


Figura 1.1: Início da elaboração do gráfico scatter




a) Clicar em “Graphs”; “Scatter”, abre a janela “Scatterplot”, onde se seleciona o tipo de
gráfico, neste caso “Simple”;







Figura 1.2: Janela Scatterplot/Dot

Existem várias
opções de scatter.
Inicialmente
escolheremos a
opção simples



b) Clicar em “Define”. São apresentadas as variáveis do Banco de Dados, escolhem-se as
variáveis, no caso, Delivery Speed e Satisfaction Level;

Figura 1.3: Janela do gráfico scatter

É possível inserir títulos


no gráfico. A janela
options traz a forma de
exclusão de dados
ausentes




c) Define-se a variável Y no caso Delivery Speed, clicar na flecha pertinente e a variável X, no
caso Satisfaction Level, clicando-se na flecha correspondente;
d) Clicar em “OK”. O gráfico é gerado na janela “Chart”.

O gráfico aparecerá na janela de output do programa.



Figura 1.4: Visualização do gráfico scatter



No gráfico acima, é possível perceber uma linha formada pelo conjunto de pontos.
Essa linha caracteriza a relação positiva entre as duas variáveis.


COMO OBTER O COEFICIENTE DE CORRELAÇÃO DE PEARSON


Para medir o grau de correlação entre duas variáveis quantitativas estão disponíveis no
programa alguns coeficientes de correlação, entre os quais, o Coeficiente de Correlação de
Pearson.

Para calcular o coeficiente de Correlação de Pearson procede-se da seguinte maneira:
a) Clicar em “Analyze”, “Correlate”, “Bivariate”, abre-se a janela “Bivariate
Correlations”;









Figura 1.5: Janela inicial da correlação bivariada



b) Selecionar as variáveis (no caso Delivery Speed e Satisfaction Level), clicar na janela
options (para escolher o método de exclusão de dados ausentes;

Figura 1.6: Janela Bivariate Correlations

A janela options traz a


forma de exclusão de
dados ausentes



Nesta janela Options também pode-se selecionar as médias e desvios-padrão das
variáveis, os produtos cruzados e as covariâncias entre as variáveis.

Figura 1.7: Janela Options da correlação bivariada

Médias e desvios-padrão
podem ser retirados.
Produtos cruzados e
covariâncias também.





c) Selecionar a estatística desejada, no caso, Pearson (as estatísticas Kendall’s Tau-b e
Spearman são indicadas para variáveis categóricas;
d) Clicar em OK;

OBSERVAÇÃO:

O coeficiente de Correlação Linear de Pearson (r) é uma medida que varia de –1 a +1.
O coeficiente fornece informação do tipo de associação das variáveis através do sinal:
• Se r for positivo, existe uma relação direta entre as variáveis (valores altos de uma
variável correspondem a valores altos de outra variável);
• Se r for negativo, existe uma relação inversa entre as variáveis (valores altos de uma
variável correspondem a valores baixos de outra variável);
• Se r for nulo ou aproximadamente nulo, significa que não existe correlação linear.




As hipóteses do teste do Coeficiente de Correlação de Pearson são:
• Hipótese Nula (H0): r = 0 (não existe correlação entre as variáveis)
• Hipótese Alternativa (H1): r ¹ 0 (existe correlação significativa)

Inicialmente aparece a tabela de médias e desvios-padrão das variáveis, caso elas


sejam solicitadas. Em seguida aparece a tabela de correlações. A Tabela 1.0 apresenta os
resultados da análise de correlação. O coeficiente de correlação varia de –1 a +1 e quanto mais
próximo de 0 menor é a associação entre duas variáveis.

Tabela 1.0: Correlations


Satisfaction
Delivery Speed Level
**
Delivery Speed Pearson Correlation 1 ,651
Sig. (2-tailed) ,000
Sum of Squares and Cross- 172,688 72,783
products
Covariance 1,744 ,735
N 100 100
**
Satisfaction Level Pearson Correlation ,651 1
Sig. (2-tailed) ,000
Sum of Squares and Cross- 72,783 72,466
products
Covariance ,735 ,732
N 100 100

**. Correlation is significant at the 0.01 level (2-tailed).

Como é possível observer, há uma correlação positiva de 0,65 entre as duas variáveis.
Essa correlação é significativa quando se observa o valor de sig. De 0,000. A soma dos
quadrados das variáveis é dada pelo valor seguinte. Por último, há o valor da covariância das
variáveis. A correlação nunca pode ser maior do que 1 ou menor do que menos 1. Uma
correlação próxima a zero indica que as duas variáveis não estão relacionadas. Uma correlação
positiva indica que as duas variáveis movem juntas, e a relação é forte quanto mais a
correlação se aproxima de um. Uma correlação negativa indica que as duas variáveis movem-
se em direções opostas, e que a relação também fica mais forte quanto mais próxima de
menos 1 a correlação ficar. Duas variáveis que estão perfeitamente correlacionadas
positivamente (r=1) movem-se essencialmente em perfeita proporção na mesma direção,
enquanto dois conjuntos que estão perfeitamente correlacionados negativamente movem-se
em perfeita proporção em direções opostas.

Quando existirem duas séries de dados, existirão várias medidas estatísticas que
podem ser usadas para capturar como as duas séries se movem juntas através do tempo. As
duas mais largamente usadas são a correlação e a covariância. Para duas séries de dados, X (X1,
X2,.) and Y(Y,Y... ), a covariância fornece uma medida não padronizada do grau no qual elas se
movem juntas, e é estimada tomando o produto dos desvios da média para cada variável em
cada período.


O sinal na covariância indica o tipo de relação que as duas variáveis tem. Um sinal
positivo indica que elas movem juntas e um negativo que elas movem em direções
opostas. Enquanto a covariância cresce com o poder d o relacionamento, ainda é
relativamente difícil fazer julgamentos sobre o poder do relacionamento entre as duas
variáveis observando a covariância, pois ela não é padronizada.

QUI-QUADRADO

Para realizar comparação sobre a distribuição do número de casos em dois ou mais


grupos distintos, pode-se utilizar o teste qui-quadrado. Este teste é obtido por meio do
caminho Analyze Nonparametric tests Qui-square. A Figura 4.3 apresenta a caixa de diálogo
do qui-quadrado.

VARIÁVEIS CATEGÓRICAS X CATEGÓRICAS



COMO VERIFICAR A EXISTÊNCIA DE ASSOCIAÇÃO ENTRE VARIÁVEIS CATEGÓRICAS: Teste Qui-
Quadrado

O banco HATCO será utilizado para obter a tabela de contingência e estudar a
associação entre variáveis categóricas. Procede-se da seguinte forma:
a) Clicar em “Analyze”, “Descriptive Statistics”, “Crosstabs”;























Figura 1.8: Janela inicial da Tabela Cruzada




b) Definir a variável da linha no caso Firm Size;
c) Definir a variável da coluna: no caso Type of Buying Situation;
d) Clicar em “Statistics”;
e) Escolher o tratamento estatístico desejado, no caso, “Chi-Square”;
f) Clicar em “Continue”;
g) Clicar em “Cell”, veremos a janela “Crosstabs : Cell Display”;
h) Assinalar as opções “Observed”; etc, de acordo com o desejado;
i) Clicar em “Continue”; “OK”.
O valor esperado de cada casela na tabela pode ser obtido na janela “Crosstabs : Cell Display”
assinalando-se também a opção “Expected”.


Figura 1.9: Janela Crosstabs



Figura 1.10: Janela Crosstabs Statistics

Outros índices de
associação entre
variáveis categóricas
nominais e ordinais são
apresentados. .


OBSERVAÇÃO: Valor Esperado sob hipótese de independência para o Teste Qui-Quadrado,
para cada casela ij é obtido com a fórmula a seguir:
(TLi X TCj) TL = total da linha i
TG TC = total da coluna j
TG = total geral

Figura 1.11: Janela Crosstabs Cell Display

Há possibilidade de pedir
percentuais para as
caselas e verificação dos
resíduos entre o valor
esperado e observado.


A leitura das caselas na 1ª linha (count) informa a freqüência bruta e a 2ª linha
(expected count) corresponde ao valor esperado, isto é, o número de pessoas que seria
esperado caso não houvesse nenhuma associação entre as variáveis em estudo, ou seja, se as
variáveis fossem independentes.

Quando se deseja obter o percentual correspondente à linha (Row) procede-se como
anteriormente só que, em “Cell”, abre-se a janela “Crosstabs”: “Cell Display” e assinala-se a
opção “Row” em “Percentages”, obtendo-se a seguinte tabela:

Firm Size * Type of Buying Situation Crosstabulation


Type of Buying Situation
New Task Modified Rebuy Straight Rebuy Total
Firm Size SMALL Count 10 16 34 60
Expected Count 20,4 19,2 20,4 60,0
% within Firm Size 16,7% 26,7% 56,7% 100,0%
% within Type of Buying 29,4% 50,0% 100,0% 60,0%
Situation
% of Total 10,0% 16,0% 34,0% 60,0%
LARGE Count 24 16 0 40
Expected Count 13,6 12,8 13,6 40,0
% within Firm Size 60,0% 40,0% ,0% 100,0%
% within Type of Buying 70,6% 50,0% ,0% 40,0%
Situation
% of Total 24,0% 16,0% ,0% 40,0%
Total Count 34 32 34 100
Expected Count 34,0 32,0 34,0 100,0
% within Firm Size 34,0% 32,0% 34,0% 100,0%
% within Type of Buying 100,0% 100,0% 100,0% 100,0%
Situation
% of Total 34,0% 32,0% 34,0% 100,0%


Os percentuais relativos à coluna (Column) e ao total (Total) podem ser obtidos da mesma
forma que para o cálculo da percentagem da linha. Cada casela poderia ter até 5 valores,
descritos a seguir:
1ª linha: valor observado;
2ª linha: valor esperado;
3ª linha: percentual da linha;
4ª linha: percentual da coluna;
5ª linha: percentual total.

As hipóteses do teste “Qui-Quadrado” (Chi-Square) são:
• Hipótese Nula (H0): As variáveis são independentes.
• Hipótese Alternativa (H1): As variáveis são dependentes.


A primeira tabela apresenta o sumário dos casos processados.

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

Firm Size * Type of Buying 100 100,0% 0 ,0% 100 100,0%


Situation

A segunda tabela apresenta o cruzamento entre as variáveis categóricas tamanho da


firma e tipo de situação de compra. Esse cruzamento é apresentado por contagem e também é
feita a indicação do valor esperado, no caso das variáveis não apresentarem associação. No
caso da tabela abaixo, não foram especificados percentuais internos para cada casela. A
leitura das caselas na 1ª linha (count) informa a freqüência bruta e a 2ª linha (expected count)
corresponde ao valor esperado, isto é, o número de pessoas que seria esperado caso não
houvesse nenhuma associação entre as variáveis em estudo, ou seja, se as variáveis fossem
independentes.

Firm Size * Type of Buying Situation Crosstabulation

Type of Buying Situation

New Task Modified Rebuy Straight Rebuy Total

Firm Size SMALL Count 10 16 34 60

Expected Count 20,4 19,2 20,4 60,0

LARGE Count 24 16 0 40

Expected Count 13,6 12,8 13,6 40,0


Total Count 34 32 34 100

Expected Count 34,0 32,0 34,0 100,0

A última tabela traz o valor do qui-quadrado e a significância. No caso dos resultados


do teste, mostrados pela tabela abaixo, há associação entre as variáveis. A hipótese de
independência entre as variáveis não foi aceita (hipótese nula) e a hipótese alternativa foi
aceita.

Chi-Square Tests

Asymp. Sig. (2-


Value df sided)
a
Pearson Chi-Square 37,255 2 ,000
Likelihood Ratio 49,047 2 ,000
Linear-by-Linear Association 34,941 1 ,000
N of Valid Cases 100

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is
12,80.

Na última tabela, aparecem as correlações entre as variáveis. A correlação de Pearson


R e a correlação de Spearman. De acordo com os resultados dos testes simétricos, há uma
correlação negativa significativa entre as duas variáveis.

Symmetric Measures

Asymp. Std.
a b
Value Error Approx. T Approx. Sig.
c
Interval by Interval Pearson's R -,594 ,066 -7,311 ,000
c
Ordinal by Ordinal Spearman Correlation -,594 ,067 -7,311 ,000
N of Valid Cases 100

a. Not assuming the null hypothesis.


b. Using the asymptotic standard error assuming the null hypothesis.
c. Based on normal approximation.

TEST t: COMPARAÇÃO DE MÉDIAS



COMO COMPARAR MÉDIAS ENTRE DOIS GRUPOS: Teste “t” para Amostras Independentes.

Figura 1.12: Janela Inicial do Teste t




O teste “t” é apropriado para comparar as médias de uma variável quantitativa entre
dois grupos independentes. No SPSS também há a possibilidade de você comparar a sua média
com um valor fixo: one sample t test. Há também a possibilidade de realizar o test t com
amostras pareadas. Neste caso, as respostas são do mesmo respondente.

EXEMPLO: Comparar de velocidade de entrega entre firmas grandes e pequenas.
a) Firm Size (Small, Large) - Dois grupos (variável que define os grupos). Os grupos devem
ser definidos considerando os códigos e rótulos presentes no banco de dados.
b) Delivery Speed - Variável resposta ou de teste. Para a aplicação do teste “t” nesta
situação procede-se da seguinte forma:
c) Clicar em “Analyze”, “Compare Means”, “Independent Samples t test”;











Figura 1.12: Janela Independent Samples T test





d) Clicar sobre a variável de teste (Test Variables): “Delivery Speed” ou, conforme o caso
em estudo, clicar na variável correspondente;
e) Clicar sobre a variável de grupo (Grouping Variable) “Firm Size”;
f) Clicar em: “Define Group”;

Os grupos a serem definidos devem receber a numeração que apresentam no banco
de dados. Há também a opção de fazer ponto de corte caso a variável seja métrica ou
quantitativa.
Figura 1.13: Janela Define Groups



g) Abre-se uma janela, na qual se define a categoria correspondente ao “Group 1” (no
caso Small) – digitando-se o código da categoria atribuída quando da construção do
Banco de Dados, nesse caso 0 e “Group 2” (no caso Large) digitando-se o código 1.
Clicar em continue e depois em OK.

(Observação: No caso de se desejar confirmar os valores atribuídos às variáveis, abrir a janela
“Utilities”, “Variables”).



Figura 1.14: Janela Independent Samples T test




Ao finalizar a definição dos grupos, eles aparecerão designados na janela inicial.
Se você clicar na janela Options, terá a opção de definir o intervalo de confiança e escolher a
forma de exclusão dos dados ausentes.

Figura 1.15: Janela Independent Samples T test: Options



Ao final da análise aparecerá o output com os resultados da análise. A primeira tabela
informa as médias e desvios-padrão da variável dependente por grupos da amostra. Neste
caso, também aparecem os valores do erro padrão.

Group Statistics

Firm Size N Mean Std. Deviation Std. Error Mean

Delivery Speed dime


SMALL 60 4,192 1,0375 ,1339
nsion
LARGE 40 2,500 1,0190 ,1611
1





Na tabela seguinte, veremos os resultados do test t, a diferença de médias e os
intervalos de confiança. Além disso, aparecem os resultados do teste de Levene para igualdade
de variância.

INTERPRETAÇÃO: Ao serem analisados os dados do exemplo acima vemos o seguinte:

a) Observa-se o resultado do teste para variâncias iguais (Teste de Levene). Neste exemplo, o
valor de p para o teste Levene é 0,336, não se rejeita a hipótese de variâncias iguais.
b) O teste t a ser utilizado é o que aparece na primeira linha (Equal variances assumed),
considerando que p < 0,000 (Sig 2-tailed), rejeita-se a hipótese nula (H0) de igualdade das
médias dos dois grupos, logo, pode-se concluir que as médias da variável Delivery Speed são
significativamente diferentes entre os dois grupos de tamanho diferente de empresa.





As hipóteses do teste Levene de igualdade de variâncias são:
• Hipótese Nula (H0): As variâncias dos dois grupos são iguais.
• Hipótese Alternativa (H1): As variâncias dos dois grupos são diferentes.


As hipóteses do teste “t” para igualdade de médias entre Amostras Independentes são:
• Hipótese Nula (H0): As médias dos dois grupos são iguais.
• Hipótese Alternativa (H1): As médias dos dois grupos são diferentes.

Você também pode gostar