Você está na página 1de 32

Eduarda

1º Seminário de Analise de Dados II

Universidade Rovuma
Nampula
2022
Eduarda

1º Seminário de Analise de Dados II


(Licenciatura em ensino de matematica)

1º Seminario de caracter avaliativo de


cadeira de analisa de dados-II do curso de
licenciatura em ensino de matematica
habilitações em estatistica 4º ano, acadeira
leccionado por:
MSc: Abubacar Nizar

Universidade Rovuma
Nampula
2020-2021
Introdução
O presente trabalho de análise de dados II trata dos seguintes conteúdos: análise
exploratória de dados, cruzamentos e medidas de associação, teste t para medias,
One-way anova e ancova, Analise de variância a mais de um factor, e mais
outros conteúdos cá não citados. Para este trabalho será usado o software SPSS
(Statistical Package for the Social Sciences – pacote estatístico para as ciências
sociais) para a ajuda de processamento de dados (imput e output) de seguida
interpretar os resultados com base no output manipulado no software baseando-
se em algumas obras, vídeos aulas e mais outras fontes, essas fontes não serão
usadas só para a interpretação dos resultados mas também para a execução de
alguns comandos no mesmo software SPSS. O trabalho apresenta alguns
elementos pré-textuais e alguns pois textuais. O trabalho tem objectivo de
ensinar a respeito dos conteúdos acima citados, não só, mas também a manipular
e aperfeiçoar o software a fim de fazer várias análises necessárias e precisas
como um formado na área.
1. Os pressupostos que devem ser satisfeitos no uso do teste t são:
As observações devem ser independentes e retiradas duma população de
distribuição normal.
As duas amostras devem ter a mesma variância, pode se verificar observando o
desvio padrão amostral das duas amostras. Ou usando o teste f de igualdade das
variâncias.
As duas amostras devem ser independentes.
A Variável dependente deve ser quantitativa;

Segundo (PEREIRA, 1999) apresenta também os seguintes pressupostos a saber:

 O primeiro requisito para utilizar a estatística paramétrica exige que seja possível
realizar operações numéricas sobre os dados experimentais. Não é suficiente que
se possa apenas ordenar os dados, como nos testes não paramétricos. As variáveis
devem ser naturalmente numéricas, como uma escala contínua de tempos de
leitura, ou a nota de um exame.
 O segundo requisito obriga a que os resultados se distribuam normalmente. No
entanto, como os testes paramétricos são bastante robustos, podem ser utilizados
mesmo quando este pressuposto é violado, a menos que os dados tenham uma
distribuição muito diferente da normal.
 O terceiro requisito designa-se por homogeneidade. Isto significa que a
variabilidade dos resultados em cada situação deve ser sensivelmente a mesma.
No entanto, este requisito perde a relevância se o número de sujeito for o mesmo
em cada situação experimental.

2. Vinte e quatro pessoas foram envolvidas em um experimento para determinar se o


barulho do fundo (musica, batida de portas, circulacao de viaturas, etc.) afecta a memoria de
curto prazo (lembrar de palavras). Metade da amostra foi alocada aleatoriamente à condiçao
barrulho e metade a condiçao sem barulho. Os participantes na condiçao barulho tentaram
memorizar uma lista de 20 palavras em dois minutos, enquanto escutavam com fones de
ouvido um barulho pré-gravado. Os outros participantes utilizaram tambem fones de ouvido
mas sem o barulho. Foram testados para ver quantas palavras lembravam. O numero de
palavras lembradas por cada pessoa em cada uma das condiçoes está na base de dados em
excel “Dados_Seminario 1 de analise de dados 2_2021 – exercicio 2”. Faça um teste de
hipoteses com nivel de significancia de 5% para verificar se o numero de palavras
memoridas é igual nos dois grupos. Inclua uma analise exploratoria dos dados e apresente o
tamanho do efeito.

H0: A media das palavras memorizada em lugar sem barulho é igual a media das
palavras memorizada em lugar com barulho
H1: A media das palavras memorizada em lugar sem barulho é diferente com a media
das palavras memorizada em lugar com barulho

Decisão
A partir da tabela de teste de amostra independente mostra que o p-valor (sig) é
menor que 0.05, rejeitamos a hipótese nula, isto é, o número das palavras memorizada
sem barulho é diferente com o número de palavras memorizada com barulho.

Analise exploratoria dos dados

A tabela a cima mostra a exploração das medidas descritivas, assim podemos ver que
o menor número das palavras memorizada é de 3 palavras e o maior número é de 18
palavras com um desvio padrão de 4,232 em relação a sua media, quaanto a simetria é
simetrica positiva e apresenta uma curva platicúrtica.
A partir da tabela acima podemos notar que o número de palavras memorizada sem
barulho é maior que palavras memorizada com barulho.

H0: A distribuição de dados segue uma distribuição normal


H1: A distribuição de dados não segue uma distribuição normal

Decisão
A partir da tabela de teste de normalidade mostrado à cima, como o p-valor (sig) é
menor que 0.05, rejeitamos a hipótese nula, isto é, a quatidade das palavras memorizada
com e sem barulho não seguem uma distribuição normal.

Apresente o tamanho do efeito.


Cohen introduziu uma medida similar ao escore z, denominada d de Cohen,( Medidas
de efeito para comparações de duas amostras independentes) na qual uma das médias
das duas distribuições é subtraída da outra e o resultado é dividido pelo desvio-padrão
comum às duas populações, sendo este estimado pelos desvios-padrão amostrais
x 1−x 1 8,03−14,34
d= = =2,73

√ √
2
( n1−1 ) S1 + ( n2−1 ) S2
2
11∗5,127+11∗6,528
n1 +n2 12+12

3. Vinte crianças em idade escolar (10 meninos e 10 meninas) foram examinadas nas
seguintes variaveis: numero de epsodios de doenças no periodo de um ano, desempenho
em um teste no inicio do ano e desemepnho em teste similar no fim do ano
(“Dados_Seminario 1 de analise de dados 2_2021 – exercicio 3”).
Suponha que os dados são retirados de uma populaçao normalmente distribuida.

a) Faça uma analise exploratoria dos dados

b) Realize um test t independente entre meninos e meninas em epsodios de doença e no


teste de fim de ano
Teste para igualidade de variâncias
H0: As variâncias de episódio de doença é igual nos dois grupo de crianças
H1: As variâncias de episódio de doença é diferente nos dois grupo de crianças
Decisão
A partir da tabela de teste de amostra independente mostra-nos o teste de Levene
para igualidade de variâncias, que o p-valor (sig = 0,376) é maior que 0.05, sendo assim
aceitamos a hipótese nula, isto é, As variâncias de episódio de doença é igual nos dois
grupo de crianças.

H0: As variâncias de teste no fim do ano é iguais nos dois grupo de crianças
H1: As variâncias de teste no fim do ano é diferente nos dois grupo de crianças
Decisão
A partir da tabela de teste de amostra independente mostra-nos o teste de Levene
para igualidade de variâncias, que o p-valor (sig = 0,173) é maior que 0.05, sendo assim
aceitamos a hipótese nula, isto é, As variâncias de teste no fim do ano é igual nos dois
grupo de crianças.

Teste para igualidade da Média


H0: As medias de episódio de doença das crianças são iguais
H1: Há diferenças entre as medias de episódio de doença, das crianças

Decisão
A partir da tabela de teste de amostra independente mostrado que o p-valor (sig =
0,679) é maior que 0.05, aceitamos a hipótese nula, isto é, As medias de episódio de
doença das crianças é igual.
H0: As medias de teste no fim do ano das crianças é igual
H1: Há diferenças entre as medias de teste no fim do ano, das crianças
Decisão
A partir da tabela de teste de amostra independente mostrado que o p-valor (sig =
0,025) é menor que 0.05, rejeitamos a hipótese nula, isto é, Há diferenças entre as
medias de teste no fim do ano, das crianças.

c) Calcule o tamanho do efeito, quando apropriado

Considerando o desempenho de teste no inicio e no fim ano com variaveis de medidas


repetidas então, o f 2 de Cohen é apropriado para calcular o tamanho de efeito dentro de
um modelo com medidas repetidas cuja a variável independente de interesse e a variável
dependente são ambas contínuas.

2 R
2
(0,792)2
f = 2
= 2
=1,68
1−R 1−(0,792)

d) O significado de tamanho do efeito ou intervalos de confiança.

O tamanho de efeito é uma estatística descritiva que serve como complemento ao teste
de significância estatística. Cada vez mais esse tipo de abordagem vem sendo
estimulada, em alguns casos até exigida, pelas publicações da área científica. ( Cohen J.
1969). Valores superiores ou iguais a 0,8 representam tamanho de efeito grande; entre 0,8
a 0,2 são considerados médios e inferiores a 0,2 pequenos.
O intervalo de confiança indica a chance de um determinado valor da população estar
verdadeiramente contida num intrevalo estimado.
e) Teste t de medidas repetidas para o desempenho no teste do inicio do ano e no
teste do fim do.

A partir da tabela de teste de esfericidade de Mauchly podemos ver que não


possui o valor de o sig assim concluímos que não existe esfericidade entre as condições.

H0: As médias dos dois testes são iguais


H1: Há diferença entre as médias dos dois testes.

Decisão
Considerando que não existe esfericidade entre as variaveis iremos usar teste
corrigido de Greenhouse-Geisser, a anova de uma via com medidas repetidas mostrou
que não existe efeito significativo no desempenho dos testes no inicio e fim, [F(1, 19) =
4,520, p-valor (0,051) > 0,05]. Na aceitação da Hipótese nula.

4. Os pressupostos que devem ser satisfeitos no uso do teste anova são


 As observações dentro de cada grupo tem distribuição normal.
 As observações são independente entre si.
 Homogeniedade de variância entre os grupos (homocedasticidade).

5. trinta e seis pessoas participaram de um experiment para descobrir os efeitos do


alcool na habilidade de dirigir. Foram aleatoriamente associados a tres condicoes:
placebo (sem alcool), pouco alcool e muito alcool. A bebida não-alcoolida parecia e
tinha o mesmo gosto que as demais. Os participantes foram pesados e tomaram a
quantidade apropriada de bebida. Uma hora após terem bebido, os participantes
dirigiram em um simulador por 10 minutos, e o numero de erros cometidos foi
automaticamente registado em um computador. Os dados estao na base de dado
“Dados_Seminario 1 de analise de dados 2_2021 – exercicio 4”. Faça uma analise
exploratoria dos dados, realize um test apropriado para este experimento e calcule o
tamanho do efeito. Interprete os resultados.

i) Analise exploratoria dos dados

A tabela acima explora algumas medidas estatística básica, em que na coluna de


média mostra o erro medio cometido em cada grupo com e sem efeito de alcool, coluna
de desvio padrão mostra os desvios de cada grupo em relação a sua média, a coluna de
maximo mostra o erro máximo cometido por cada grupo e por fim a ultima coluna
mostra o erro mínimo cometido por cada grupo.
Avaliando análise de teste de normalidade de Kolmogorov-Smirnov (t(36)=0,125 p-
valor > 0,05) e Shapiro-Wilk (t(36) = 0,952 p-valor > 0,05), mostra nos que p-valor é
maior que 0,05, na aceitação de hipótese nula, assim assumimos que o numero de erro
cometido automáticamente segue uma distribuição normal.

Analisando a homogeneidade de variâncias nos grupos a partir da tabela acima, o


teste de Levene com sig (p-valor = 0,808) maior que 0,05, aceita-se a hipótese nula que
os três grupos possuem variancias homogéneo, isto é, as variâncias são iguais.

ii) Teste apropriado para este experimento


A partir da informação detalhada no nº5 e na analise exploratória, isto é a variavel
dependente não viola a normalidade e homogeniedade iremos usar um teste
parametrico, como precisamos avaliar os três grupos ( sem alcool, pouco alcool e muito
alcool) o teste apropriado para este experimento é teste de ANOVA.

H0: As médias de erros cometido entre os grupos não diferem


H1: As médias de erros cometido entre os grupos diferem
Decisão
A partir da tabela de de anova mostrado que o p-valor (sig = 0,0001) é menor que
0.05, rejeitamos a hipótese nula, isto é, existe diferenças significativa entre os três
grupos.
A partir da tabela de comparação multipla que mostra os testes de post hoc,
chegamos a confirmar que os erros cometidos ao dirigir sem beber alcool ou beber
pouco alcool são menor que dirigir depois de beber muito alcool.

iii) Calcule o tamanho do efeito

z 9,915
d= = =1,65
√ n √ 36

6. existem evidencias indicando que fumar suruma leva à perda da memoria de curto
prazo e à reduçao da habilidade na execuçao de tarefas simples. Sete estudantes
fumantes que normalmente não consomem suruma foram solicitados a responder
questoes dificies de aritmetica sob quatro condiçoes diferentes. Na condiçao 1, fumaram
uma mistura de ervas que pensavam ser suruma. Na condiçao 2, fumaram uma pequena
quantidade de suruma, ampliada para uma media e grande quantidade nas condiçoes 3 e
4 respectivamente. Os estudantes foram solicitados a fumar sozinhos. Para evitar efeitos
de pratica, foram feitos quatro testes diferentes, todos com o mesmo grau de
dificuldade. Para evitar efeitos de ordem e fadiga, foi contrabalanceada a ordem de
aplicaçao dos testes. Os dados estao em “Dados_Seminario 1 de analise de dados
2_2021 – exercicio 5”. Faça uma analise exploratoria dos dados, realize um test
apropriado para este experimento e calcule o tamanho do efeito. Interprete os resultados.

i) Analise exploratoria dos dados


A tabela a cima mostra que para a nossa pesqueisa da questão nº 6 os sete estudantes
solicitado foram todos testado nas quatros condições, que correspondia ao 100% da
nossa amostra de pesquisa.

A tabela acima ( descritivos ) ilustra as médias e os valores máximo e mínimo dos


sete estudantes em cada condição. Isto é antes de fumar suruma, depios de fumar
pequena quantidade de suruma, depois de fumar uma quantidade média de suruma e
depois de fumar uma grande quantidade.
Olhando na tabela de teste de normalidade de Kolmogorov-Smirnov e Shapiro-Wilk
mostra nos que p-valor é maior que 0,05, na aceitação de hipótese nula, assim
assumimos que os valores dos testes nos quatro condições segue uma distribuição
normal.

A partir da tabela de teste de esfericidade de Mauchly podemos ver que o sig (=


0,169) é maior que 0,05, assim aceitamos a hipótese nula que existe esfericidade entre
as condições.

ii) Teste apropriado para este experimento


Apartir de amostra disponível no exercício nº 6 chega-se a conclusão que, para ver se
existem evidencias indicando que fumar suruma leva à perda da memoria de curto prazo
e à reduçao da habilidade na execuçao de tarefas simples, deve-se testar pares de
condições isto é, um estudo de duas condições simultâneos, assim sendo em quatro
condiçoes termos 6 pares de condição, como ilustra o teste a seguir:
H0: As médias das condições são iguais
H1: Há pelo menos uma diferença entre as médias das condições

Decisão
Considerando a existencia de esfericidade, a anova de uma via com medidas
repetidas mostrou que a efeito de factore Condições de fumante sobre as notas [F(3, 18)
= 4,278, p < 0,05]. Na rejeição da Hipótese nula.
O post-hoc de Sidak mostrou que as condições fumante diferem entre si.
Logo existem evidencias indicando que fumar suruma leva à perda da memoria de
curto prazo e à reduçao da habilidade na execuçao de tarefas simples.

iii) Calcule o tamanho do efeito

2
2 R2 (0,792)
f = = =¿
1−R 1−(0,792)2
2

7. Um(a) professor(a) de Matematica da escola secundaria de Quissanga desconfia


que o desempenho dos seus alunos está associado aos factores como sexo e o nivel de
motivaçao para aprender a sua disciplina. Para confirmar ou não a sua suspeita,
seleccionou de forma aleatoria um grupo de alunos da 10ª classe. Mediu atraves de uma
bacteria de perguntas o nivel de motivacao e estratificou em dois grupos; motivaçao
baixa e motivaçao alta assim como o sexo do aluno. Os dados estao em
“Dados_Seminario 1 de analise de dados 2_2021 – exercicio 6”.

a) o professor não entende nada sobre a estatistica. Ajude a ele a decidir sobre a sua
desconfiança;

A tabela a cima mostra as medidas de associação baseadas no teste do Qui-quadrado,


(Phi = - 0,019, V de Cramer = 0,019 e C. contingência = 0,019), o nível de significância
a elas associado é 0,650 é superior 0,05, informando que não existe uma associação
entre sexo e o nivel de motivaçao, no desempenho dos seus alunos.

b) existe interaccao entre as duas variaveis?


H0: Existe interação das variáveis
H1: Não existe interacção entre as variáveis

Olando na tabela a cima o sig é menor que 0.05 aceitamos hipotese nula, isto é não
existe interacção entre as variáveis.

c) qual é o tamanho de efeito e coeficiente de determinacao?

Tamanho de efeito
2 2
2 R (0,019)
f = 2
= 2
=0,000361
1−R 1−(0,019)

Coeficiente de determinacao
R2=( R de pearson)2=¿

8. Os pressupostos que devem ser satisfeitos no uso do teste qui-quadrado são:


 Duas variaveis nominais
 Independencia de observações, o que significa que não há relação entre as
observações em cada grupo de cada variável ou entre os próprio grupos.
 As observações devem ser frequências ou contagens
 Cada observação pertence a uma e somente categoria e
 No minimo 20% das celulas devem ter valores esperado maior ou igual a
cinco

9. Em um estudo de cohorte se seguiu durante dois anos a 595 pacientes que haviam
recebido transfusoes de sangue e 712 pacientes não transfundidos previamente. Ao final
do periodo haviam apresentado hepatites 75 individuos do grupo dos transfundidos e 16
dos não transfundidos.

a) Represente os dados da tabela em um grafico

Transfusões e doença de sangue

b) Faça um teste qui-quadrado com todos os passos

i) Duas variáveis nominais


A partir do questionário nº 9 podemos perceber que a condição de duas variáveis
nominais foi atingido ( Doença sanguíneo “hepatite e sem hepatite” e Transfusão
Sanguíneo “Transfudido e Não Tranfudido”).
ii) As observações devem ser frequências ou contagem.
Para nosso caso as observações são frequência, os valores de interseção de
categorias.

iii) Todas as celulass devem ter valores esperado maior ou igual a cinco

Segundo a tabela acima podemos ver que os valores da contagem esperada em cada
celula é maior que cinco (5).

H0: As variáveis transfusões e doença de sangue são independentes.


H1: Existe relação entre as variável transfusões e doença de sangue.

Decisão
A partir da tabela de teste qui-quadrado de independência, mostra que o p-valor (sig)
é menor que 0.05, assim rejeitamos a hipótese nula que as variáveis sexo e nivel de
motivação são independente.
Consultando a tabela do Qui-quadrado com 1 grau de liberdade e α =0.05 , obtém-se
a região critica ou de rejeição da hipótese nula [3,84; + ∞[. Esta região contém o valor
do teste 53,683. Deste modo, rejeita-se hipótese de existir Independência das variaveis.

c) Calcule a medida do risco relativo (RR)

16
Riscode desfacho nos individuosexpostos 91
RR= = =0.307 Como mostra a tabela
Risco do desfecho nos individuosnão exposto 696
1216
acima.

RR=0,307(IC 95 % :0,196−0.481) o risco relativo é significativo, isto é o intervalo não


contém o valor 1, que indica nulidade de associação. Ou podemos dizer que a amostra
estudada reflete um efeito real do factor de risco na população.

d) Faça teste post hoc dos residuos


A partir da tabela a cima podemos ver os valores de resíduos ajustados, considerando o
nível de significância α =0,05 teremos o valor de Z=1,96,
Decisão
Entre o inquerido parece existir uma afnidade entre hepatites e transfundido e o sem
hepatites e não transfundido. Dado que aceitamos a hipótese de existencia da relação, e
é apena estas células (com resíduo maior que Z ajustado) que mais contribuem
significativamente para explicar a relação existente entre as variáveis

10. Em um estudo de cohorte para avaliar a associacao entre uso de anticonceptivos e


infarto de miocardio em mulheres, surgiram 46 casos entre as 140 mulheres que
utilizaram anticonceptivos, e 33 casos entre as 138 que não utilizaram.

a) Represente os dados da tabela em um grafico


b) Faça um teste qui-quadrado com todos os passos possiveis.

i) Duas variáveis nominais


A partir do questionário nº 10 podemos perceber que a condição de duas variáveis
nominais foi atingido ( Anticonceptivo e Infarto de miocardio).

ii) As observações devem ser frequências ou contagem.


Para nosso caso as observações são frequência, os valores de interseção de
categorias.

iii) Todas as celulass devem ter valores esperado maior ou igual a cinco
Segundo a tabela acima podemos ver que os valores da contagem esperada em cada
celula é maior que cinco (5).

H0: As variáveis anticonceptivos e infarto de miocardio são independentes.


H1: Existe relação entre as variável anticonceptivos e infarto de miocardio.

Decisão
A partir da tabela de teste qui-quadrado de independência mostra que o p-valor (sig)
é maior que 0.05, assim aceitamos a hipótese nula que as variáveis sexo e nivel de
motivação são independente.
Consultando a tabela do Qui-quadrado com 1 grau de liberdade e α =0.05 , obtém-se
a região critica ou de rejeição da hipótese nula [3,84; + ∞[. Esta região não contém o
valor do teste 2,733. Deste modo, aceita-se hipótese de existir Independência das
variaveis.
c) Calcule a medida de odds ratio e interprete.

Segundo a tabela acima a medida de Odds ratio é igual 1,557, (e pode ser calculada
46
94
¿= ) sendo um estudo rectrospetivo, as mulheres diagnosticadas com uso de infarto
33
105
de miocárdio tem uma vez vírgula seis (1,557) mais probabilidade de usarem
anticonceptivos do que mulheres que não usam infarto de miocárdio.

d) Faça teste post hoc dos residuos

A partir da tabela a cima podemos ver os valores de resíduos ajustados, considerando o


nível de significância α =0,05 teremos o valor de Z=1,96 ,
Decisão
Entre o inquerido parece não existir uma afnidade entre as variaveis, na aceitação de H0
de teste qui-quadrado. Dado que nenhuma célula tem o valor de resíduo maior que Z
significa que não existe celula que contribuem significativamente para explicar a
relação existente entre as variáveis.

11. Defina os seguintes conceitos e apresente exemplos na area de Biologia: taxa de


incidencia e taxa de prevalencia. É possivel calcular essas medidas no exercicio
anterior? Justifique.

Taixa de incidência é um estudo prospectivo, de manifestação de um determinado


estudo onde se começa por analisar o factor ou variável em coluna e se conta o numero
de incidantes da variavel em linha.

Taixa de prevalência é um estudo onde se mede prevalencia ao invés de incidência


como no caso de estudos transversais, e pode se usar como medida de associação. Ou
também poder um número de casos de uma doença em uma população, durante um
período específico de tempo.
E essas medidas é posivel calcular na tabela anterior.

Ex: O hospital central de Nampula verificou-se que as pessoaa que consomem muito
açucar tem mais probabilidade de causar doença de diabete. Considerando doença de
diabete como factor (variável em coluna) pretende-se analisar quantas vezes mais
provável de uma pessoa que consome muito açucar causar doença de diabete do que
uma pessoa que não consome muito açúcar? Para nós sabermos o numero de vezes mais
provável devemos calcular a taixa de incidência.

12. Novecentos cinquenta alunos foram classificados de acordo com os seus hábitos
alimenticios e o seu coeficiente intelectual:

Coeficiente Intelectual
< 80 80 - 90 90 – 99 > = 100
Nutriçao boa 245 228 117 219
Nutriçao pobre 31 27 13 10
a) Identifique a variavel independente e dependente. Justifique

A partir da tabela de medidas direcionais, podemos ver que o Lambda apresenta valor
0,000 o erro da previsão na escolha da variavel dependente é muito menor. Olhando
para Goodman e kruskal tau, mostram que na escolha de Hábitos alimenticios para
prever sa categorias de Coeficiente intelectual correspondente a uma dada pessoa existe
uma redução de 10% no erro de previsão e na escolha de Coeficiente intelectual para
prever sa categorias de Hábitos alimenticios correspondente a uma dada pessoa existe
uma redução de 3% no erro de previsão. Assim sendo:
A variável independente é Hábitos alimenticios e
A variavel dependente é Coeficiente Intelectual
Justificação: Escolhemos Coeficiente Intelectual como variável dependente porque o
seu erro de previsão é menor que de Hábitos alimenticios.

b) Apresente tabela de percentagens (considere a))


c) Ao nivel de confiançao de 90%, ha relacao entre as duas variaveis da tabela? Excute
teste post hoc.

H0: As variáveis hábitos alimenticios e coeficiente intelectual são independentes.


H1: Existe relação entre as variável hábitos alimenticios e coeficiente intelectual.

Decisão
A partir da tabela de teste qui-quadrado mostrado que o p-valor (sig) é menor que
0.10, assim rejeitamos a hipótese nula que as variáveis hábitos alimenticios e
coeficiente intelectual são independente.

Teste post hoc


A partir da tabela a cima podemos ver os valores de resíduos ajustados, considerando o
nível de significância α =0,10 teremos o valor de Z=1,64, a partir 8 operações (celula)
que fizemos podemos obter o valor de Z ajustado isto é, α =0,10 /8 teremos o valor de
Z=2,4 .
Decisão
Entre o inquerido parece existir uma afnidade entre nutrição boa e coeficiente
intelectual. Dado que aceitamos a hipótese de existencia da relação, e é apena esta
célula (com resíduo maior que Z ajustado) que mais contribuem significativamente para
explicar a relação existente entre as variáveis.

13. A política de uma empresa exige que os espaços do estacionamento sejam


designados aleatoriamente a cada pessoa, mas você suspeita que não seja bem assim.
Existem 3 áreas de igual tamanho com 80 vagas cada: área A, próximo ao prédio;
área B, um pouco mais longe; e área C, do outro lado da rua. Você coleta dados
sobre os funcionários de gerência de nível médio e acima para ver quantos foram
designados para cada área. 18 estão na área A; 13 estão na área B e 8 estão na área C.
Os dados estão consistentes com a proposta da empresa?

H0: Os dados estão consistente com a distribuição especificada.


H1: Os dados não estão consistente com a distribuição especificada.
Decisão
O teste de qui-quadrado de aderencia mostrou que os dados obtidos são consistentes
com a distribuição especificada, [x2(3) = 0,006; p-valor(0,997) > 0,05]

14. Uma pesquisa foi feita durante os primeiros três meses do ano para verificar a
audiência de redes de televisão no horário entre 21 hs e 21:40 hs. Os resultados indicam
as seguintes proporções de lares assistindo a canais de tevê (dados fictícios):
STV: 32%; TVM: 18%; MIRAMAR: 15%; TIM: 7%; Outras: 28%.
No último mês a TVM começou e exibir uma nova novela com um apelo popular muito
forte e seria interessante avaliar se o seu lançamento provocou alguma alteração nas
audiências.
Uma amostra de 600 lares foi selecionada e se obteve as seguintes freqüências
observadas foram respectivamente: 156, 126, 84, 20 e 204.
Faça um teste para determinar se as proporções foram alteradas. Considere niveis de
significancia de 1% e 5%.

A tabela acima ilustra as frequências esperadas depois de TVM exibir a novela, portanto
podemos ver que a maoir alteração ocorrem nas outras canais.

H0: Os dados estão consistente com a distribuição especificada.


H1: Os dados não estão consistente com a distribuição especificada.
Decisão
O teste de qui-quadrado de aderencia mostrou que os dados obtidos não são
consistentes com a distribuição especificada, [x2(4) = 29,717; p-valor(0,000) < 0,10
e 0,05]. Por tanto podemos dizer que as proporções foram alteradas no mês em que
TVM começou a exibir a novela.
Referências Bibliográficas
KELLEY, Ken; et all; On Effect Size (Métodos psicológicos). 2012
PEREIRA, Alexandre. Guia prática de utilização do SPSS (Analise de dados para ciências
sociais e psicologia). 2ª Edição. Lisboa 1999.
PESTANA, Maria Helena; et all; Análise de dados para ciências sociais (complementaridade
do SPSS). Edições Sílabos.
VASCONCELOS, Victor Vieira; et all; Análise Exploratória de Dados no SPSS (gráficos e
Estatísticas Descritivas). 2017.

Você também pode gostar