Escolar Documentos
Profissional Documentos
Cultura Documentos
Presidente Prudente
2007
1
do Campus”
Presidente Prudente
2007
2
SUMÁRIO
INTRODUÇÃO ..........................................................................................................04
OBJETIVO ..................................................................................................................04
METODOLOGIA.........................................................................................................05
REFERÊNCIAS ..........................................................................................................28
APÊNDICE A ...............................................................................................................29
APÊNDICE B................................................................................................................32
APÊNDICE C ...............................................................................................................33
APÊNDICE D ...............................................................................................................35
APÊNDICE E................................................................................................................37
APÊNDICE F................................................................................................................39
APÊNDICE G ...............................................................................................................40
3
APÊNDICE H ...............................................................................................................41
APÊNDICE I.................................................................................................................44
APÊNDICE J ................................................................................................................46
4
INTRODUÇÃO
OBJETIVO
METODOLOGIA
A FCT / UNESP no ano de 2007, tem aproximadamente 2735 alunos matriculados nos
cursos de graduação, 226 alunos nos cursos de pós-graduação, além de 214 professores e 209
funcionários que foram selecionados através de uma Amostragem Aleatória Simples (n = 552),
através de um Sistema de Referências (listagem de alunos, professores e funcionários). O
questionário foi aplicado pela turma da disciplina Pesquisa de Mercado do curso de Estatística da
FCT/Unesp de Presidente Prudente. Estes 25 alunos aplicaram em torno de 23 questionários.
Cada aluno recebeu da professora uma folha com 23 pessoas (professores, alunos e
funcionários) para aplicação do questionário em horário conveniente ao entrevistado.
Cada aluno fez suas próprias análises estatísticas1 e entregou um relatório da pesquisa
para a professora Miriam R Silvestre que juntará as informações para uma análise final a ser
entregue ao tomador de decisões da FUNDACTE.
1
Neste relatório as análises estatísticas são feitas no software Minitab no capítulo 1, o no apêndice as análises
estatísticas são feitas no software SAS e R.
6
1 ANÁLISES ESTATÍSTICAS
P3) Calcule para cada indivíduo a média de livros lidos nos quatro meses (julho até
outubro), para isto divida o número digitado por 4 (faça no computador). Verifique se a média
amostral é maior que 1. Lembre-se de excluir os indivíduos para os quais digitou 88 e 99 das
contas.
H O : µ = 1
H A : µ >1
Test of mu = 1 vs mu > 1
Como p-valor é grande , NÃO rejeita-se Ho, logo a média de livros lidos por mês é igual a
1.
P4) Faça uma tabela de freqüências e percentuais. Quem são os concorrentes da Livraria
do Campus (livraria)? Responda em percentuais.
Internet 2 0,05
Sebo 4 0,11
Supermercados 1 0,03
Total 37 1,00
Pode ser usado o seguinte comando no Minitab: Stat,Tables, Tally selecionar todas as
variáveis de interesse.(O problema está na tabulação).
P6) Faça uma tabela de freqüências e percentuais. Quantos foram pelo menos uma vez
clientes da Livraria do Campus (cafeteria, papelaria, impressão e livraria), responda em
percentuais.
Tally for Discrete Variables: Comprou Cafe; Comprou Pape; Comprou Impr; Comprou
Note que o setor de impressão foi o menos utilizado, e o setor de cafeteria o mais usado
pelos entrevistados.
C5 Count Percent
Não 49 58,33
Sim 35 41,67
N= 84
C5 é a coluna em que foram inseridas as 4 variáveis, como são 4 variáveis com n=21,
logo n = 84. Então 41,67 % dos pesquisados já utilizou algum serviço da Livraria do Campus.
9
Sendo: 0=nenhum 1=1 ou 2 vezes 2=3 ou 4 vezes 3=5 ou + vezes 4=1 ou 2 x por mês
quantas o entrevistado utiliza os serviços da Fundacte por semana, percebe-se que a Livraria e
Impressão quase nunca foram usadas (bastante quantidade de zeros). O setor de cafeteria é o mais
freqüentado.
C5 é a coluna em que foram inseridas as 4 variáveis, como são 4 variáveis com n=14
cada, logo n = 56. Então mais de 70 % dos entrevistados nunca freqüentaram ou freqüentou com
uma freqüência muito baixa a Livraria do Campus.
10
Para criar uma tabela de dupla entrada no Minitab os comandos são os seguintes: Stat,
Tables, Cross Tabulation, selecionar todas as variáveis de interesse e clicar em counts e percents.
• Variável Papelaria
0 1 2 4 All
1 1 1 2 6 10
10,00 10,00 20,00 60,00 100,00
2 4 0 0 0 4
100,00 -- -- -- 100,00
All 5 1 2 6 14
35,71 7,14 14,29 42,86 100,00
• Variável Cafeteria
Rows: comp caf Columns: freq caf
0 1 2 3 4 All
1 1 3 5 2 3 14
7,14 21,43 35,71 14,29 21,43 100,00
• Variável Impressão
Rows: comp imp Columns: freq imp
0 4 All
1 0 3 3
-- 100,00 100,00
2 11 0 11
100,00 -- 100,00
All 11 3 14
78,57 21,43 100,00
• Variável Livraria
Rows: comp liv Columns: freq liv
0 1 2 4 All
1 1 2 1 4 8
12,50 25,00 12,50 50,00 100,00
2 6 0 0 0 6
100,00 -- -- -- 100,00
All 7 2 1 4 14
50,00 14,29 7,14 28,57 100,00
Quem não compra na livraria tem uma freqüência zero, e 50% de quem compra tem uma
freqüência de 4 (1 a 2 vezes por mês).
12
Para responder esta pergunta basta verificar a pergunta 7 do questionário , motivo não
compra livraria: Temos a seguinte Tabela:
2
0
Note que houve o valor 0 significando que a pessoa comprou livro e houve espaços em
branco na linha indicando que o entrevistado respondeu não em todas as alternativas da pergunta
6, excluindo as linhas brancas e linhas com valores iguais a zero, tem-se a seguinte tabela de
freqüências:
13
Ruim 1 14,3
Total 7 1,00
Note que a grande maioria dos entrevistados não compraram livros por que não
precisaram (71,4 %).Como o aluno Alexandro Vieira Lopes entrevistou funcionários, supõe-se
que estes não leiam muitos livros.
As hipóteses são:
H O : µ = 4
H A : µ > 4
Test of mu = 4 vs mu > 4
Como p-valor é zero , rejeita-se Ho, logo Nota Satisfação Cafeteria2 é maior que 4.
P8) e P18) Verifique se há diferença entre homens e mulheres quanto à satisfação média
(use teste t independente, para isto verifique as suposições de normalidade que o teste necessita)
para cada um dos itens: cafeteria, papelaria, impressão e livraria.
OBS: As pessoas no questionário que não responderam (9) não serão consideradas.
2
A Nota de Satisfação varia de 1 (Bastante Insatisfeito) até 7 (Bastante Satisfeito).
15
Sexo Cafeteria
1 7
1 5
2 3
2 6
1 5
2 7
1 7
1 6
2 7
1 7
1 7
1 2
1 7
1 6
,999
,99
,95
Probability
,80
,50
,20
,05
,01
,001
2 3 4 5 6 7
Cafeteria
Average: 5,85714 Kolmogorov-Smirnov Normality Test
StDev: 1,61041 D+: 0,105 D-: 0,178 D : 0,178
N: 14 Approximate P-Value > 0.15
Como p-valor é grande, não rejeita H0, logo os dados da variável cafeteria dados seguem
normalidade.
Response Cafeteria
Factors Sexo
ConfLvl 95,0000
Como p-valor é grande, não rejeita a hipótese de que as variâncias são iguais.
Aplicando o teste t no Minitab: Stat, Basic Statistic, 2 Sample t, samples in ONE column,
samples: variável cafeteria, subscripts: sexo, clicar em assume equal variances a saída é a
seguinte:
17
Observe que a média para o grupo 1 (Feminino) = 5,9 e grupo 2 (Masculino) = 5,75 são
parecidas e como p-valor = 0,882, NÃO Rejeita Ho , logo as médias dos grupos feminino e
masculino são iguais para a variável cafeteria.
Sexo Papelaria
1 7
2 5
2 4
1 4
1 6
2 7
1 7
1 6
1 6
Verificando a normalidade da variável papelaria no Minitab: Menu Stat,Basic Statistics,
Normality Test, selecionar variável papelaria e escolher o teste, escolhendo o teste de
Kolmogorov-Smirnov, tem-se a seguinte figura:
18
,999
,99
,95
Probability ,80
,50
,20
,05
,01
,001
4 5 6 7
Papelaria
Average: 5,77778 Kolmogorov-Smirnov Normality Test
StDev: 1,20185 D+: 0,097 D-: 0,129 D : 0,129
N: 9 Approximate P-Value > 0.15
Como p-valor é grande, não rejeita H0, logo os dados da variável papelaria dados seguem
normalidade.
Response Papelaria
Factors Sexo
ConfLvl 95,0000
Como p-valor é grande, não rejeita a hipótese de que as variâncias são iguais.
Perceba que a média para o grupo 1 (Feminino) = 6 e grupo 2 (Masculino) = 5,33 são
quase iguais e como p-valor = 0,470, NÃO Rejeita Ho , logo as médias dos grupos feminino e
masculino são iguais para a variável papelaria.
OBS: o p-valor é igual a 0,470 e foi igual ao do teste t. Lembrando que o teste da Análise
de Variâncias (ANOVA) é válido para 3 ou mais grupos.
20
Excluindo todas as pessoas não utilizaram o serviço da impressão temos a seguinte tabela
Sexo Impressão
2 4
1 6
1 2
,999
,99
,95
Probability
,80
,50
,20
,05
,01
,001
2 3 4 5 6
Impressão
Average: 4 Kolmogorov-Smirnov Normality Test
StDev: 2 D+: 0,175 D-: 0,175 D : 0,175
N: 3 Approximate P-Value > 0.15
Como p-valor é grande, não rejeita H0, logo os dados da variável impressão dados seguem
normalidade.
Observe que a média para o grupo 1 (Feminino) = 4 e grupo 2 (Masculino) = 4 são iguais
e como p-valor = 1, NÃO Rejeita Ho , logo as médias são dos grupos feminino e masculino são
iguais para a variável impressão.
Feminino Masculino
6 5
4 7
5
7
6
22
,999
,99
,95
Probability
,80
,50
,20
,05
,01
,001
4 5 6 7
Feminino
Average: 5,6 Kolmogorov-Smirnov Normality Test
StDev: 1,14018 D+: 0,120 D-: 0,137 D : 0,137
N: 5 Approximate P-Value > 0.15
Como p-valor é grande, não rejeita H0, logo os dados da variável feminino dados seguem
normalidade. Contudo, como há apenas 2 observações na variável masculino o teste de
normalidade não pode ser aplicado, considerando normalidade dos dados A hipótese a ser testada
é:
Para testar a hipótese, primeiro deve ser verificada a igualdade de variâncias. Usando o
comando no Minitab: Stat, Basic Statistic, 2 Variances , samples in different columns, first sexo
feminino, second sexo masculino, segue a saída3:
3
Observe que os dados foram digitados separando uma coluna para sexo feminino e outra para sexo masculino.
Pode-se também digitar os dados numa coluna com a variável sexo e a outra coluna com as notas como foi feito nos
exemplos de Cafeteria , Papelaria e Impressão.
23
Level1 Feminino
Level2 Masculino
ConfLvl 95,0000
Como p-valor é grande, não rejeita a hipótese de que as variâncias são iguais.
Observe que a média para o grupo 1 (Feminino) = 4,83 e grupo 2 (Masculino) = 6 são
parecidas e como p-valor = 0,509, NÃO Rejeita Ho , logo as médias dos grupos feminino e
masculino são iguais para a variável livraria.
24
1 Sim 8 57,2
2 Não 6 42,8
Total 14 1,00
As hipóteses são:
H O : p = 0,5
H A : p > 0,5
Success = 2
Exact
Variable X N Sample p 95,0% Lower Bound P-Value
C1 6 14 0,428571 0,206073 0,788
Success = 2
Exact
Variable X N Sample p 95,0% Lower Bound P-Value
C2 8 14 0,571429 0,325028 0,395
25
P16) Verifique se a média das respostas da P16 é maior que a da P15. Use um teste t-
pareado.
Seja µ1 a média das respostas da P15 (Nota sobre os preços cobrados na Livraria antes de
uma afirmação).
Seja µ2 a média das respostas da P16 (Nota sobre os preços cobrados na Livraria depois
de uma afirmação).
Antes Depois
7 7
5 5
4 4
4 5
4 4
1 1
5 1
5 6
7 4
4 4
5 5
3 3
2 2
4 4
6 4
7 7
5 4
1 1
7 7
7 7
3 2
26
As hipóteses são:
H O : µ1 = µ 2
H A : µ1 < µ 2
Utilizando o software Minitab, com os comandos Stat , Basic Statistics, Paired t, first
sample : Preço Antes, second sample Preço Depois, clicar em options e clicar em alternative less
than. A saída é a seguinte:
A média da variável Preço Antes é 4,57 e a média da variável Preço Depois é 4,13, elas
são quase iguais , o que é refutado pelo p-valor 0,940 que é grande, NÃO rejeitando Ho . Portanto
as medias são iguais, ou seja, a afirmação não mudou a opinião dos entrevistados.
27
2 CONSIDERAÇÕES FINAIS
A sorte é relacionada com a aleatoriedade, pois no momento em que cada aluno recebeu
da professora uma folha com 23 possíveis usuários da Livraria do Campus, esta folha foi dividida
3 categorias: alunos (estudam manhã, tarde), alunos (estudam noite), misto (professores e
funcionários) . Cada aluno selecionou aleatoriamente uma folha que estava uma destas 3
categorias.A categoria misto foi selecionada por mim. Os funcionários e professores sempre estão
na faculdade, o que facilitou um pouco a aplicação dos questionários.Houve casos de alunos que
tiveram que aplicar questionários para alunos de pós-graduação, logo a dificuldade da aplicação
de questionários é maior, pois dificilmente estes alunos se encontram na faculdade.
A análise desta pesquisa foi importante e pode ajudar num futuro profissional, pois vários
testes foram aplicados, ajudando a melhor compreensão do conteúdo teórico da disciplina.
4
Os resultados dos 3 softwares foram muito semelhantes.
28
REFERÊNCIAS
MALHOTA, N.K. Pesquisa de Marketing Uma Orientação Aplicada. – 4 ed. Porto Alegre:
Bookman, 2006.
29
PROGRAMA SAS
proc print;
run;
quit;
data prob;
p1 = 1 -probt(-3.8,13);
tcrit = tinv(0.99890,13);
run;
proc print;
run;
30
SAÍDA SAS
Note que o p-valor da variável ler (0,0022) é pequeno, rejeitando H0, pois é uma hipótese
bilateral, mas usando o comando p1 = 1 - probt t com a estatística do teste e os n-1 graus de
liberdade chega-se ao p-valor calculado no Minitab 0,99890, NÃO rejeitando H0. O comando
probt calcula a probabilidade acumulada, logo se deve atribuir 1 - probt.
Uma forma muito mais fácil é utilizar o Comando do SAS: Solutions, Analysis, Analist,
digitar os dados e depois clicar em: Statistics, Hypotheses Tests, One-Sample t-test for Mean ,
Variável é a coluna digitada, Null =1, Mean > 1. A saída é a seguinte:
USANDO O SOFTWARE R:
PROGRAMA SAS
SAÍDA SAS
PROGRAMA SAS
data ex3;
input cafeteria$ papelaria$ impressao$ livraria$;
datalines;
Sim Sim Não Sim
Sim Sim Não Não
Sim Não Não Não
Sim Sim Não Sim
Sim Não Não Sim
Sim Sim Sim Não
Sim Sim Não Sim
Sim Sim Sim Sim
Sim Sim Não Sim
Não Não Não Não
Não Não Não Não
Sim Sim Não Sim
Não Não Não Não
Não Não Não Não
Não Não Não Não
Sim Não Não Não
Não Não Não Não
Sim Não Não Não
Sim Sim Não Sim
Não Não Não Não
Sim Sim Sim Não
;
proc print;
proc freq;
run;
34
SAÍDA SAS
PROGRAMA SAS
data ex4;
input cafeteria$ papelaria$ impressao$ livraria$;
datalines;
3 2 0 2
2 0 0 0
0 0 0 0
2 4 0 1
4 0 0 0
3 1 4 0
2 4 0 4
2 4 4 4
4 4 0 4
4 2 0 1
1 0 0 0
1 0 0 0
2 4 0 4
1 4 4 0
;
proc print;
proc freq;
run;
SAÍDA SAS
PROGRAMA SAS (apenas para a variável papelaria, pois para as outras variáveis os comandos
são análogos).
data ex5;
input compra frequencia;
title ' Tabela de Contigência CompraxFrequência PAPELARIA';
datalines;
1 3
1 2
2 0
1 2
2 4
1 3
1 2
1 2
1 4
1 4
2 1
2 1
1 2
1 1
;
proc print;
proc freq;
tables compra*frequencia;
run;
SAÍDA SAS
PROGRAMA SAS
data ex6;
input nao_compra$;
datalines;
RUIM
2
2
2
NÃO ENCONTROU O LIVRO
2
2
;
proc print;
proc freq;
run;
SAÍDA SAS
UTILIZANDO O SOFTWARE R :
Utilizando a forma muito mais fácil : Solutions, Analysis, Analist, digitar os dados e
depois clicar em: Statistics, Hypotheses Tests, One-Sample t-test for Mean , Variável é a coluna
digitada, Null =1, Mean > 4. A saída é a seguinte:
SAÍDA SAS
UTILIZANDO O SOFTWARE R :
PROGRAMA SAS (apenas para a variável livraria, pois para as outras variáveis os comandos são
análogos).
SAÍDA SAS
Temos que as mulheres (1) têm uma nota média 4,833 e os homens (2) nota média de 6
com relação à satisfação da livraria. Verificando a saída Equality of Variances temos um p-valor
grande, daí não rejeita a hipótese de igualdade de variâncias, assim o p-valor (Pr > | t |) para o
caso de médias, é p-valor = 0.5088 (saída do T-Test Equal Variance) . Então NÃO se Rejeita H0,
portanto a média do sexo feminino é IGUAL do sexo masculino.Note que o valor é quase igual
ao do Minitab.
43
UTILIZANDO O SOFTWARE R :
>feminino =c(6,4,5,7,6,1)
> masculino =c(5,7)
> shapiro.test(feminino)
Note que p-valor = 0,3173 (feminino) indica uma variável normal, enquanto que assim
como no Minitab, no software R o p-valor para sexo masculino não pode ser obtido. O p-valor =
0,9252 indica que as variâncias são iguais e finalmente com o p-valor = 0,5088 não rejeita H0.
Assim a média sexo feminino é igual a média sexo masculino quanto a satisfação da livraria.
44
O programa é difícil, dai utilizando no SAS Solutions, Analysis, Analist, digitar os dados
e depois clicar em: Statistics, Hypotheses Tests, One-Sample Test for a Proportion, depois level
of interest sim, e hipotheses null <= 0.5 e alternate prop > 0.5,conforme a Figura 21 ,tem-se a
seguinte saída :
Perceba que no SAS a probabilidade é uma aproximação da Normal (Pr > Z = 0,2965),
enquanto que no Minitab o p-valor é exato (0,39).
45
UTILIZANDO O SOFTWARE R :
PROGRAMA SAS
data ex10;
input antes depois ;
diferenca = antes - depois;
datalines;
77
55
44
45
44
11
51
56
74
44
55
33
22
44
64
77
54
11
77
77
32
;
proc print;
run;
SAÍDA SAS
UTILIZANDO O SOFTWARE R