Apontamentos Freq

Respostas Pré Feitas
1. Variável Nominal
- Selecionar apenas a Moda
- Gráfico Circular
A variável “localização do hotel” é uma variável nominal, ou seja, os números servem apenas
para dar nome. Por ser uma variável nominal, a medida de tendência central a observar é a
moda. A moda é uma medida de tendência central que demonstra a observação que ocorre
com maior frequência. Se observarmos o gráfico acima, verificamos que a ocorrência mais
frequente é “Beja”, cujo código numérico corresponde ao número 4. Esta observação ocorreu
13 vezes em valor absoluto, correspondente a 26% das observações
2. Variável Ordinal
- Selecionar Moda, Mediana, Quartis
A última variável em análise é a “satisfação dos clientes”, variável esta expressa numa escala
ordinal, isto é, o código numérico serve apenas para estabelecer uma relação de ordem. Por
ser ordinal, utilizamos como medidas de tendência central, a moda e a mediana, e para as
medidas de dispersão, observamos a distribuição das frequências e a amplitude interquartílica.
O valor da moda neste caso, corresponde ao código numérico 1, que diz respeito ao grupo
“Não gosto mesmo nada”, sendo este o que ocorre com maior frequência 12 observações em
valor absoluto, correspondente a 24% das observações). A mediana tem o valor 3,
correspondente, mais uma vez ao grupo “não gosto nem desgosto”. Quanto à amplitude
interquartílica, diferença aritmética entre os valores contidos no 3º quartil e 1ºquartil, esta
será equivalente a 4,00-1,75, ou seja, 2,25.
3. Variável em Escala
- Selecionar Moda, Média, Mediana, Desvio Padrão, Curtose, Mínimo, Máximo, Quartis.
- Histograma
A variável “Lotação de clientes” está expressa em escala quantitativa, ou seja, os números têm
significado numérico. Por ser quantitativa, nas medidas de tendência central observamos a
moda, a mediana e a média. Em termos de medidas de dispersão, observamos a distribuição
das frequências, a amplitude interquartílica e o desvio padrão. O valor da moda é de 85, sendo
esta a observação mais frequente. A mediana, que é uma medida de tendência central que
contém até 50% das observações quando estas foram ordenadas de forma crescente, tem
como valor 147,5. A média – medida de tendência central que reflete ou espelha o centro de
gravidade de uma distribuição – é de 149,16. Nas medidas de dispersão, mais concretamente
na distribuição das frequências, voltamos a verificar que houve um total de 50 observações,
todas elas válidas.
A amplitude interquartílica – medida de dispersão que demonstra a diferença aritmética entre
o valor contido no 3ºquartil e no 1ºquartil – equivale a 198,25 – 87,75, ou seja, 56,35.
Assimetria = Skewness
O valor da assimetria nunca é completamente 0, no caso do exemplo a assimetria é negativa -
0,42 < 0. V. Assimetria/ Erro Padrão = -0,42/0,337= -1,246 Ou seja, está dentro do intervalo [-
1.96; 1.96], por isso sabe-se que a distribuição da idade é enviesada à esquerda (assimetria
negativa).
Curtosis
V. Curtosis/ Erro padrão = -1,220/ 0,662 = - 1, 843 Ou seja, está dentro do intervalo [-1.96;
1.96], por isso a distribuição é aproximadamente mesocurtica
4. Estudos Correlacionais
Nota: As perguntas geralmente começam com Averigue a existência de relação
estatisticamente significativa entre as variáveis
Nota: O sentido e a magnitude só aparecem nos 3 primeiros testes
4.1 Quando ambas as variáveis são quantitativas --> PEARSON

- Selecionar Analyze --> Correlate --> Bivariate --> Selecionar os dados
Pergunta: Averigue a existência de relação entre a variável A e b
Resposta:
H. Nula: Não há relação entre a variável A e B.
H. Alternativa: Há relação entre a variável A e B. (confirmar as escalas e escolher o teste de

correlação correto).
O valor de SIG foi de 0,011 < 0,05, anulando a hipótese nula, neste caso a resposta é “Há
relação entre a variável A e B”. Dado que avaliamos a correlação de Pearson com sinal positivo
de 0,299, pelo que podemos afirmar que o sinal do coeficiente é positivo, ou seja (ex.) quando
a dificuldade da matéria aumenta, também aumenta a ansiedade face a exames, ou quando a
dificuldade da matéria diminui, a ansiedade face a exames diminui. Quanto à magnitude do
coeficiente de correlação que é de 0,299 e está entre 0,25 e 0,50, afirmamos que a magnitude
é moderada.
NOTA: Só analisamos o sentido e a correlação SE a hipótese nula for anulada. –

Hipótese Alternativa
4.2 Quando as 2 variáveis são Ordinais ou 1 Ordinal e 1 Quantitativa -->

SPEARMAN
- Selecionar Analyze --> Correlate --> Bivariate --> Selecionar os dados
Pergunta: Averigue a existência de relação entre a variável A e b
Resposta:
H. Nula: Não há relação entre a variável A e B.
H. Alternativa: Há relação entre a variável A e B. (confirmar as escalas e escolher o teste de

correlação correto).
O valor de SIG foi de 0,011 < 0,05, anulando a hipótese nula, neste caso a resposta é “Há
relação entre a variável A e B”. Dado que avaliamos a correlação de Spearman com sinal
positivo de 0,299, pelo que podemos afirmar que o sinal do coeficiente é positivo, ou seja (ex.)
quando a dificuldade da matéria aumenta, também aumenta a ansiedade face a exames, ou
quando a dificuldade da matéria diminui, a ansiedade face a exames diminui. Quanto à
magnitude do coeficiente de correlação que é de 0,299 e está entre 0,25 e 0,50, afirmamos
que a magnitude é moderada.
Nota: Quando o valor da SIG (0,05), é variável entre 0,05 e 0,1, os resultados são considerados
marginalmente significativos.; quando a variável é inferior a 0,01 os resultados são
considerados extremamente significativos.
4.3 Quando uma das variáveis é qualitativa dicotómica e uma

quantitativa --> Teste correlação Bisserial (no spss é equivalente à de
pearson).
4.4 Quando há 2 variáveis qualitativas ou 1 qualitativa e 1 ordinal --> o
teste de correlação de Chi-Square (Qui Quadrado)
- Aqui só se avalia o SIG
- Selecionar Analyze --> Descriptive Statistics --> Crosstabs
- Sempre que o valor em parenteses na nota a. for menor ou igual a 20%, lemos o valor da
probabilidade de significância na alínea do Chi quadrado de Pearson. – Significância Assintótica
Quando a percentagem na alínea a. é >20%, lê-se o valor de probabilidade significância na
línea do teste Exato de Fisher. – SIG exta (2 lados).
5. Estudos Experimentais
Nota: As perguntas geralmente começam com Averigue a existência de diferenças
estatisticamente significativas entre a localização do hotel relativamente à satisfação das
agências de viagem.
- Quando a variável dependente é quantitativa --> testes paramétricos
- Quando a variável dependente não é quantitativa --> testes não paramétricos.
5.1 Quando a variável dependente é quantitativa (peso, altura…) e a

variável independente só tem dois grupos (ex. género-feminino e
masculino) --> Teste T (T-TEST).
1. Normalidade (<= rejeitamos hipótese nula)

H. Nula: A variável dependente segue uma distribuição normal em todos os grupos da variável
independente. -> A variável dependente “preço” segue uma distribuição normal nos grupos
não e sim da variável independente piscina.
H. Alternativa: A variável dependente não segue uma distribuição normal em todos os grupos
da variável independente. -> A variável dependente “preço” não segue uma distribuição
normal nos grupos não e sim da variável independente piscina.
- Analyze --> Explore --> Meter dados --> Descripitives --> Confidence interval for mean 95% -->
Plots (None; Normality plots with tests; untransformed)
- Utilizamos a Kolmogorov-Smirnov, ambas têm SIG superior a 0,05, por isso escolhemos a
hipótese nula, ou seja, a variável preço segue uma distribuição normal nos grupos sim e não da
variável independente piscina
2. Homogeneidade
H. Nula: A variável dependente tem variância homogénea
H. Alternativa: A variável dependente não tem variância homogénea
- Analisamos a SIG com base na média que é inferior a 0,005 e, por isso rejeitamos a hipótese
nula. E, por isso a variável dependente não tem variância homogénea.
Conclusão Normalidade - Homogeneidade
Assim, a variável preço tem distribuição normal, mas não tem variância homogénea. SEMPRE
que o teste da normalidade siga uma distribuição normal, seguimos com a realização do T-test,
mesmo que a não tenha variância homogénea.
3. T-Test
- Analyze --> Compare Means --> Independent – Samples T-Test -> Define Group (inserir group
1 e Group 2)
- Quando há homogeneidade lemos na linha de cima, caso não haja homogeneidade lemos
sempre na linha de baixo. No caso do exemplo, não existindo homogeneidade, lemos a linha
de baixo. SIG é de 0,288 que é superior a 0,05 e, por isso, não rejeitamos a hipótese nula: Não
há diferença de preços entre os apartamentos com e sem piscina.
Nota: Quando o pressuposto da normalidade não se verifica, pode-se realizar o teste Mann-
Whitney ou, caso existissem 30 observações em sim e 30 em não, podemos evocar o teorema
do limite central: “De acordo com o teorema do limite central realizamos o teste paramétrico
T-student para amostras independentes pq de acordo com este teorema, quando as amostras
são valores elevados, assumimos que a média tem uma distribuição +- normal”.
5.2 Quando a variável dependente é ordinal e a variável independente

só tem dois grupos --> Teste Mann Whitney.
Exemplo: Há diferenças entre os apartamentos com e sem piscina ao nível da satisfação com o
apartamento?
H. Nula: não há diferenças na satisfação com o apartamento entre os apartamentos com e

sem piscina
H. alternativa: há diferenças na satisfação com o apartamento entre os apartamentos com e

sem piscina
- Analyze --> Nonparametric Tests --> Legacy Dialogs --> 2 Independent Samples --> Define
Groups (definir) --> Selecionar test type (Mann- Whitney U)
Sempre que possível utilizar a sig exata. No caso, a sig é de 0,01 ou seja <0,005 e por isso
rejeitamos a hipótese nula, assim há diferenças na satisfação com o apartamento entre os
apartamentos com e sem piscina
5.3 Quando a variável dependente é quantitativa e a variável

independente tem 3 ou mais grupos (ex. nacionalidade) --> Teste One-
Way ANOVA.
- Analyze --> Descriptive Statistics --> Explore --> Selecionar variáveis --> Statistics -->
Descriptives --> Confidence Interval for Mean 95% --> Plots (None; Normality plots with tests;
untransformed)
1. Teste Normalidade
Assim, a sig é de 0,2, maior que 0,05, ou seja, não rejeitamos a hipótese nula o que significa
que a variável preço mantem uma distribuição normal nas 3 zonas da variável independente
zona.
2. Teste Homogeneidade
A variável é homogénea porque a variância baseada na média é de 0,160, maior que 0,005,
não rejeitando a hipótese nula, ou seja, a variável dependente (preço) tem variância
homogénea.
3. Teste A-Nova
- Analyze -> Compare Means --> One-Way A-Nova --> Options (Descriptive; Exclude cases
analysis by analysis; Level(%) 95%)
Nota: A sig é <0,001, menor que 0,005, rejeitando a hipótese nula. Contudo, como aqui temos
3 variáveis dentro da Zona (tem zona A, B e C), vamos ter que fazer um novo teste
- Analyze -> Compare Means --> One-Way A-Nova --> Post Hoc:
- Não há nenhum valor N menor ou maior em 50% que os outros, por isso vamos fazer
o teste --> Scheffle
- Se o valor N fosse menor ou maior em 50% que os outros, escolhia-se --> Gabriel
- Se a variância não for homogénea --> Games Howell
- Analisar Zona A e Zona B; Zona A e Zona C e Zona B e C

5.4 Quando a variável dependente é ordinal e a variável independente
tem 3 ou mais grupos --> Teste Kruskal-Wallis
- Analyze --> Non Parametric Tests --> Legacy Dialogs --> K Independent Samples --> Define
Range (no exemplo visto são 3 zonas, por isso 1 – 3)
- Como a SIG é de 0,458, maior que 0,05, não rejeitamos a hipótese nula, ou seja, A zona não
influencia a satisfação com o apartamento.
- Caso se rejeitasse a hipótese nula (a zona influencia a satisifação):
- Temos que fazer a correção da SIG (0,05), ou seja, se são 3 testes fazemos
0,05/3=0,017; ou seja apenas rejeitamos a hipótese nula para valores menores ou iguais a
0,017.
- Ver individualmente as diferenças das zonas (A vs B; A vs C; B vs C)
- - Analyze --> Non Parametric Tests --> Legacy Dialogs --> 2 Independent Samples --> Define
Group (1 e 2; 1 e 3; 2 e 3) -> Fazer 3 testes diferentes para cada uma dos grupos)
6. Regressão
- No caso do teste ANOVA e T-test, temos variáveis independentes qualitativas, mas pode
acontecer que as VI sejam quantitativas. Ex: avaliar o impacto que tem a área do apartamento
e a sua idade no preço.
- Com a análise de regressão podemos estimar o preço de um apartamento tendo em conta a

sua área e idade.
1º Ir ao capítulo da correlação e calculá-la, chegando à magnitude.
2º Fazer o quadrado da correlação: (ex: 0,8x0,8=0,64) -> impacto que uma variável tem sobre a
outra – relação entre as variáveis (0,64 – ex. as horas de estudo explicam 64% da variação das
notas académicas)
3º- Fazer um gráfico de dispersão - > Legacy Dialogs --> Scatter/Dot --> Simple Scatter --> X=
VD e Y= VI --> IR ao 5º Ícone a contar com a figura da mira --> Fit Line --> Linear
R2 Linear = 0,335 é o coeficiente de correlação de Pearson Ou seja 33,5% da variabilidade no

preço é explicada pela área em metros quadrados dos apartamentos. No retângulo no meio do
gráfico está o sinal (+) que indica que a inclinação da reta é positiva. Ou seja, quanto maior a
área do apartamento, maior o preço e quanto menor a área, menor o preço.
4º REPETIR OS PASSOS EM CIMA MAS ALTERAR A X AXIS PARA (Ex:“IDADE”).
5º Analyze --> Regression --> Linear --> Dependent Preço; Independent (Área Idade)
6º Analisar ANOVA (Anova) – Sig -> Se valor p do teste <0,05 há evidência que pelo menos
uma variável no modelo, está relacionada com o preço
7º Analisar Variável Explicativa (Model Summary) – Rquarado (x% é explicada pelo modelo
com área e idade) -> Rquadrado ajustado (ligeiramente menor que o Rquadrado. Deve ser
utilizado para comparar modelos com diferentes quantidades de variáveis)
8º Analisar se cada Variável independente tem ou não capacidade explicativa (Coeficients) ->
Há evidências estatísticas de relação da área e da idade com o preço se os valores p-value/sig
<0,1. Se superior não existe evidências.
8º Construção do Modelo
- Na tabela “Coeficients” -> Y= (Constant) + (Ex: ÀREAm2 x Área (que aparecer na pergunta) –
(Ex: Idade do imóvel x Idade)
Nota: Caso peçam mais variáveis (caso das zonas) --> Utilizar a mesma base acima )
VER DE NOVO E ADICIONAR PAGINA 46
7. Relações Intra-Sujeitos
7.1 Quando há 2 variáveis independentes e 1 dependente são
quantitativas --> ttes for paired samples. Temos que ver o pressuposto
da normalidade (igual ao anterior da normalidade).
- Analyze --> Descriptive Statistics --> Explore --> Ver pressuposto de Normalidade ->
Correlações de Amostras Emparelhadas
7.2 Quando há 2 variáveis independentes e 1 dependente são ordinais --

> Wilcoxon Test.
- Analyze --> Non Parametric Tests --> Legacy Dialogs --> 2 Related Samples --> Aparecer e
analisar Tabela Estatísticas de Teste e Postos

Apontamentos Freq

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apontamentos Freq

Enviado por

Direitos autorais:

Formatos disponíveis

Respostas Pré Feitas

Nota: O sentido e a magnitude só aparecem nos 3 primeiros testes

4.1 Quando ambas as variáveis são quantitativas --> PEARSON

Pergunta: Averigue a existência de relação entre a variável A e b

H. Nula: Não há relação entre a variável A e B.

H. Alternativa: Há relação entre a variável A e B. (confirmar as escalas e escolher o teste de

NOTA: Só analisamos o sentido e a correlação SE a hipótese nula for anulada. –

4.2 Quando as 2 variáveis são Ordinais ou 1 Ordinal e 1 Quantitativa -->

Pergunta: Averigue a existência de relação entre a variável A e b

H. Nula: Não há relação entre a variável A e B.

H. Alternativa: Há relação entre a variável A e B. (confirmar as escalas e escolher o teste de

4.3 Quando uma das variáveis é qualitativa dicotómica e uma

- Aqui só se avalia o SIG

- Selecionar Analyze --> Descriptive Statistics --> Crosstabs

- Quando a variável dependente é quantitativa --> testes paramétricos

- Quando a variável dependente não é quantitativa --> testes não paramétricos.

5.1 Quando a variável dependente é quantitativa (peso, altura…) e a

1. Normalidade (<= rejeitamos hipótese nula)

H. Alternativa: A variável dependente não tem variância homogénea

Conclusão Normalidade - Homogeneidade

5.2 Quando a variável dependente é ordinal e a variável independente

H. Nula: não há diferenças na satisfação com o apartamento entre os apartamentos com e

H. alternativa: há diferenças na satisfação com o apartamento entre os apartamentos com e

5.3 Quando a variável dependente é quantitativa e a variável

- Se a variância não for homogénea --> Games Howell

- Analisar Zona A e Zona B; Zona A e Zona C e Zona B e C

- Caso se rejeitasse a hipótese nula (a zona influencia a satisifação):

- Ver individualmente as diferenças das zonas (A vs B; A vs C; B vs C)

- Com a análise de regressão podemos estimar o preço de um apartamento tendo em conta a

1º Ir ao capítulo da correlação e calculá-la, chegando à magnitude.

R2 Linear = 0,335 é o coeficiente de correlação de Pearson Ou seja 33,5% da variabilidade no

4º REPETIR OS PASSOS EM CIMA MAS ALTERAR A X AXIS PARA (Ex:“IDADE”).

VER DE NOVO E ADICIONAR PAGINA 46

7.2 Quando há 2 variáveis independentes e 1 dependente são ordinais --

Você também pode gostar