Escolar Documentos
Profissional Documentos
Cultura Documentos
APLICADA
Simone Echeveste
1
SUMÁRIO
7. Estimação................................................. 084
2
INTRODUÇÃO
. A Estatística hoje se configura como uma das ciências que mais vem
crescendo em termos de utilização e importância na Administração: pesquisas
de marketing, comportamento do consumidor, estudos de qualidade,
confiabilidade, desenvolvimentos de novos produtos, avaliação de de
satisfação dos clientes, etc. são alguns exemplos da ampla utilização das
ferramentas estatísticas para resolução de problemas e tomada de decisões
nesta área.
3
1. CONCEITOS BÁSICOS DE ESTATÍSTICA
Simone Echeveste
b) O padrão de variação nos dados faz com que a resposta não seja óbvia,
ou seja, somente tratando os dados adequadamente é que poderemos
verificar o comportamento das variáveis de estudo.
4
c) Uma análise estatística é composta por métodos para coleta e descrição
dos dados, viabilizando a verificação da força da evidência nos dados
pró ou contra as hipóteses de pesquisa. A presença de uma variação
não previsível nos dados faz disso, muitas vezes, uma tarefa pouco
trivial.
Problema
Tomada de Decisão
5
DEFINIÇÕES IMPORTANTES NA ESTATÍSTICA
QUALITATIVA X QUANTITATIVA
6
Figura 3. Contribuição da Estatística para a pesquisa
PESQUISA QUANTITATIVA
Reconhecimento e formulação
do problema de pesquisa
ESTATÍSTICA
Planejamento da pesquisa
(amostra, variáveis,
questionários,...)
Execução da pesquisa (campo)
Comunicação dos resultados
7
defendem a ideia de que a Estatística representa por si só uma área única da
ciência desconsiderando ser esta uma subdivisão da matemática.
8
Para ilustrar estes conceitos através de um exemplo, considere a
seguinte situação de pesquisa:
SITUAÇÃO DE PESQUISA
Uma variável (x) é uma característica dos elementos investigados que difere
de um elemento para outro e do qual temos interesse em estudar. Cada
unidade (elemento) da população que é escolhido como parte de uma amostra
fornece uma medida de uma ou mais variáveis, também chamadas
observações.
9
As variáveis podem ser classificadas em:
10
Figura 4. Classificação das variáveis
Variável
Qualitativa Quantitativa
RECAPITULANDO
11
Algumas definições importantes:
12
Questão 2. A amostra desta pesquisa pode ser considerada como sendo:
a) Perfil do cliente
b) Características do cliente como bairro, tempo que frequenta, gasto e
grau de satisfação
c) 400 clientes deste restaurante japonês
d) Todos os clientes deste restaurante japonês
e) Os restaurantes Japoneses
13
b) ( ) As variáveis quantitativas são características que não possuem
valores, mas, ao contrário, são definidas por categorias, ou seja,
representam uma classificação dos elementos.
14
2. APRESENTAÇÃO DE DADOS
TABELAS DE FREQUENCIA
d) Rodapé: espaço logo abaixo da tabela que pode ser utilizado para a
apresentação de notas ou observações de natureza informativa.
15
EXEMPLO DE CONSTRUÇÃO DE UMA TABELA DE FREQUÊNCIA:
0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0
16
Já 2 dias de atraso se repetiu em 3 clientes:
0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0
17
Cálculo da Porcentagem:
IMPORTANTE!!!
De acordo com as normas, as tabelas de frequência não podem ser fechadas dos
lados e nem ter linhas dividindo as categorias da variável. As únicas linhas
permitidas são as que delimitam o cabeçalho e as que delimitam o total e no
centro da tabela é opcional colocar ou não o traço divisório das colunas.
GRÁFICOS ESTATÍSTICOS
18
A representação gráfica deve ser utilizada levando-se em conta algumas
qualidades essenciais básicas para a construção destes conforme nos mostra
a figura 2.
SIMPLICIDADE
CLAREZA
VERACIDADE
19
GRÁFICO DE SETORES
Caixa Banco do
Econômica Brasil
Federal
Santander
Banrisul
20
GRÁFICO DE COLUNAS
80
60
40
20
0
Muito Satisfeito Satisfeito Indiferente Insatisfeito Muito
Insatisfeito
21
GRÁFICO DE BARRAS
Profissão (em %)
Contador
Psicólogo
Engenheiro
Administrador
Advogado
Médico
Professor
0 5 10 15 20 25 30
O gráfico de barras é um gráfico que não possui restrições, pode ser utilizado
para representar variáveis qualitativas e quantitativas. Quando o número de
categorias for muito extenso podemos utilizar legendas com cores distintas
para a identificação das categorias. É um excelente gráfico para os casos em
que as categorias das variáveis são expressas através de frases ou palavras
muito extensas.
22
GRÁFICO DE LINHAS
450
Lucro (mil reais)
400
350
300
250
200
JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ
23
COMO FAZER GRÁFICOS NO EXCEL
24
Marque com o mouse estas duas colunas na planilha e escolha a opção
na barra de ferramentas Inserir Gráfico Barras
25
Após o gráfico pronto você poderá formatar as cores, estilos,
acrescentar título, etc. utilizando a barras de ferramentas de Gráfico.
26
No item Design você pode modificar as cores do gráfico.
27
RECAPITULANDO
28
Questão 1. A variável de pesquisa para este exemplo é:
a) 15 clientes de uma casa lotérica
b) Clientes da casa lotérica
c) Tempo de espera na fila (em minutos)
d) Contas pagas na fila da casa lotérica
e) Nenhuma das respostas anteriores
29
Os dados abaixo correspondem aos resultados de uma pesquisa realizada com
20 lojas de um shopping com o objetivo de verificar o valor mensal de suas
vendas (mil reais) pagas com cartão de débito:
12 15 10 5 10 10 5 12 2 2
10 15 10 15 10 5 10 10 10 10
30
Questão 5.
Valor mensal de suas vendas (mil reais) pagas com cartão de débito:
Valor (mil reais) Frequência %
2 2 10,0
5 3 15,0
10 10 50,0
12 2 10,0
15 3 15,0
Total 20 100
Fonte: Pesquisa
31
3. MEDIDAS DE TENDÊNCIA CENTRAL
Simone Echeveste
32
MÉDIA
Notação:
- média populacional
- média amostral
Fórmula:
onde:
= somatório
x – variável (valores obtidos para a variável investigada)
n – tamanho da amostra
Exemplo
15 18 18 20 17 18 16
Elementos importantes:
33
Média:
= 17,4 anos
onde:
= somatório
x – variável
f – frequência de cada valor da variável
n – tamanho da amostra
34
Exemplo
= 2,9 faltas
35
MEDIANA
Notação:
Md ou Me
36
Mediana (Md)
Mediana
Interpretação: “Metade dos clientes desta loja possuem renda de 9,1 salários
mínimos ou menos e metade dos clientes possui renda de 9,1 salários mínimos
ou mais.”
37
2º) Encontrar os dois valores centrais no conjunto de dados
Mediana
3º) Calcular o ponto médio entre estes dois valores central (somando os dois
valores e dividindo por dois)
MODA
Notação:
Mo
38
EXEMPLO
Mo = 210 reais (este valor se repete quatro vezes na amostra, foi o valor de
diária que mais se repetiu).
ATENÇÃO!!!
- Um conjunto de dados pode não ter moda, ou seja, nenhum valor se repetir
Exemplo: Idade de 5 clientes
34, 56, 23, 42, 38
Nenhum valor se repete – não tem moda!
- Um conjunto de dados pode ter mais que uma moda, ou seja, poderemos ter mais que um
valor da variável se repetindo com frequências iguais.
Exemplo: Idade de 8 clientes:
35, 23, 35, 40, 51, 40, 32, 55
Duas modas: 35 e 40 peças!
39
RECAPITULANDO
32 35 45 50 30 22 15 25 10 15 30 21
Calcule e interprete:
a) Média
b) Mediana
c) Moda.
40
Questão 2. A tabela abaixo representa os salários pagos a 100 operários da
empresa GLT & Cia:
41
Questão 4. A tabela abaixo apresenta os valores das diárias pagas por 40
turistas nos hotéis do balneário Beach Star:
42
GABARITO DAS ATIVIDADES PROPOSTAS
Questão 1.
a) Em média estas empresas possuem 27,5 funcionários
b) Metade das empresas possui menos que 27,5 funcionários e metade mais
que 27,5 funcionários.
c) Os números de funcionários que ocorrem com maior freqüência são 15 e
30 funcionários
Questão 2.
a) Variável: Salários GLT&Cia
b) Amostra: 100 operários
c) 2,3 salários mínimos
Questão 3.
a) Variável: Total de vendas
b) Amostra: 8 anos
c) Em média foram vendidos 8,5 milhões de reais neste período por ano.
d) Metade do período foi vendido menos que 9,9 milhões de reais e metade
mais que 9,9 milhões de reais
e) Não tem moda, pois nenhum valor se repete
Questão 4.
O valor médio das diárias é de 114,9 reais.
Questão 5.
a) O preço médio da cesta básica nestas capitais é de 206,5 reais.
b) Metade das capitais o preço da cesta básica é inferior a 212,6 reais e
metade é superior a 212,6 reais.
43
4. MEDIDAS DE VARIABILIDADE
Simone Echeveste
44
Figura 11. Medidas de Variabilidade
Medias de Variabilidade
Coeficiente de
Variância Desvio-padrão
Variação
VARIÂNCIA
Notação:
2
- variância populacional
2
s - variância amostral
Onde:
Fórmula:
x – valores da variável investigada
- média da amostra
n – tamanho da amostra
Σ - somatório
Propriedades da Variância
1. Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores
uma constante, a variância não se altera;
2. Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores
por um valor constante, a variância fica multiplicada (ou dividida) pelo quadrado
da constante.
45
EXEMPLO
17 18 16 20 22
Elementos importantes:
Média:
Variância:
reclamações/dia2
46
No cálculo da variância pode-se observar que a unidade da variável
estudada é levada ao quadrado, dificultando assim, a interpretação de seu
resultado final. A solução para este problema é extrair a raiz quadrada da
variância, permitindo assim que se volte à unidade original da variável. Essa
nova medida (a raiz quadrada da variância) é chamada de desvio-padrão.
DESVIO-PADRÃO
Notação:
- desvio-padrão populacional
s- desvio-padrão amostral
Fórmula:
Propriedades do Desvio-padrão
1. Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma
constante, o desvio-padrão não se altera;
2. Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por
um valor constante, o desvio-padrão fica multiplicado (ou dividido) pela constante.
47
Figura 12. Etapas para o cálculo do Desvio-padrão
Variância:
reclamações/dia2
Desvio-padrão:
reclamações/dia
Interpretação:
Em média, o PROCON recebe diariamente 18,6 reclamações com uma
variação em torno desta média de 2,4 reclamações.
48
COEFICIENTE DE VARIAÇÃO
Notação:
C.V. - Coeficiente de variação
Fórmula:
Onde:
- média da amostra
s – desvio-padrão
Para o exemplo...
Interpretação:
Existe uma variação em torno da média de 12,9%.
49
Figura 13. Interpretação Coeficiente de Variação
Média:
50
Agora vamos calcular a variância e o desvio-padrão. Neste caso
devemos considerar a frequência de cada valor da variável.
Variância:
minutos2
Desvio-padrão:
s = 1,4 minutos
Interpretação:
“Em média o tempo de espera na fila deste supermercado é de 2,9 minutos
com uma variação em torno desta média de 1,4 minutos”.
51
RECAPITULANDO
Corsa: 240 litros Uno: 224 litros Hobby: 325 litros Gol: 146 litros
52
Questão 3. Um fabricante de molas está interessado em implementar um
sistema de controle de qualidade para monitorar seu processo de produção.
Para isto, foi registrado o número de molas fora da conformidade em cada lote
de produção. Os dados apresentados na tabela de frequência abaixo referem-
se a 20 lotes selecionados, observando-se o número de molas fora da
conformidade.
53
Questão 5. Duas turmas de Estatística apresentam as seguintes estatísticas
para as notas na prova G1:
Turma A: média = 7,8 pontos e desvio-padrão = 1,4 pontos
Turma B: média = 8,2 pontos e desvio-padrão = 2,5 pontos.
Qual das duas turmas teve um desempenho mais homogêneo na prova G1?
Justifique.
Questão 1.
A taxa média de desemprego é 7,7% com uma variação em torno desta média
de 2,9%.
Questão 2.
Em média, a capacidade do porta malas destes carros é de 233,8 litros com
uma variação em torno desta média de 73,4 litros.
Questão 3.
Em média são produzidas por lote 8,4 molas fora da conformidade com uma
variação de 2,2 molas.
Questão 4.
Em média, os funcionários da empresa WK possuem 0,8 falta, com uma
variação em torno desta média de 1 falta.
Questão 5.
CVA = 17,9% CVB = 30,5%
CVA < CVB
A turma A teve um desempenho mais homogêneo na prova G1, comparada
com a turma B pois tem um coeficiente de variação menor.
54
5. DISTRIBUIÇÃO DE PROBABILIDADE NORMAL
Simone Echeveste
(x )2
1 2 2
f ( x) e ; para - < x < ,- < < e 2
>0
2
55
Figura 14. Gráfico da Curva Normal
56
A distribuição Normal, independentemente dos valores dos parâmetros,
apresenta sempre a seguinte relação (Figura 11):
Para evitar cálculos com a integração, uma tabela única foi desenvolvida
para uma variável aleatória agora chamada de “Z” com μ=0 e σ=1, e sua
distribuição de probabilidades é definida como normal padronizada, ou ainda
normal padrão.
57
Seja X uma variável aleatória normalmente distribuída com quaisquer
parâmetros média e desvio-padrão . Para realizar o processo de
padronização devemos realizar a seguinte transformação:
x
Z
Onde:
x = valor de interesse da variável
= média da variável
= desvio-padrão da variável
58
Tabela da Distribuição Normal Padrão P(Z<z) – VALORES POSITIVOS
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
59
Tabela da Distribuição Normal Padrão P(Z<z) – VALORES NEGATIVOS
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
60
COMO UTILIZAR A TABELA NORMAL PADRÃO
1,35
Linha
1,35 Coluna
61
Outro exemplo: P(z<-0,27)
Linha
-0,27 Coluna
EXEMPLO 1
62
Passo 2: Padronizar para obter o cálculo da área pela tabela Normal Padrão
Linha
2,00
Coluna
63
Então a P(x < 21 reais)= 0,9772 ou 97,72%
97,72%
EXEMPLO 2
Pede-se:
P(x < 6400 unidades)
64
Passo 2: Padronizar para obter o cálculo da área pela tabela Normal Padrão
Linha
-1,00
Coluna
65
15,87%
Pede-se:
P(x > 7500 unidades)
66
(área clara). Neste caso utilizaremos a informação que a curva ao todo possui
100% de área, então calcularemos a área INFERIOR e do resultado obtido na
tabela subtrairemos 100%.
P( x ≥ a ) = 100% - P( x ≤ a )
Voltando ao exemplo:
67
Buscando o valor da probabilidade P(z<0,83) na tabela normal
Linha
0,83
Coluna
79,67%
68
79,67%
20,33%
Pede-se:
P( 6300 ≤ x ≤ 7400 )
Neste caso, teremos dois valores de “x” que deverão ser padronizados
resultando em dois valores de probabilidade, uma referente á área inferior a
7400 e outra inferior a 6300.
P (x < 7400)
P (x < 6300)
69
Para obter a área de interesse devemos subtrair uma área da outra.
Então poderemos estabelecer a seguinte regra:
P( a ≤ x ≤ b ) = P( x ≤ b ) – P( x ≤ a )
Voltando ao exemplo:
Pede-se:
P( 6300 ≤ x ≤ 7400 )
70
Então:
P( 6300 ≤ x ≤ 7400 ) = 74,86% – 12,10%
62,76%
RECAPITULANDO
71
a) Inferior a 306 ml
b) Superior a 305 ml
c) entre 302 e 304 ml
72
6. AMOSTRAGEM
Simone Echeveste
73
As técnicas de amostragem se dividem em: probabilísticas e não-
probabilísticas. As técnicas probabilísticas são aquelas onde todos elementos
da população têm uma probabilidade não nula de seleção. Nas técnicas não-
probabilísticas não podemos garantir que todos elementos têm probabilidade
de serem selecionados para a amostra.
Amostra Sistemática
Uma amostra sistemática poderá ser tratada como uma amostra
aleatória simples se os elementos da população estiverem ordenados
aleatoriamente, e a seleção será realizada através da escolha
sistemática, por exemplo, de uma a cada cinco elementos.
Amostra Estratificada
Esta técnica consiste em dividir a população em subgrupos, que são
denominados estratos. Estes estratos devem ser internamente mais
homogêneos do que a população toda, com respeito às variáveis em
estudo.
74
TÉCNICAS DE AMOSTRAGEM NÃO-PROBABILÍSTICAS
75
Neste contexto, definir o tamanho mínimo da amostra é indispensável
para garantir a capacidade de o estudo responder aos objetivos propostos
considerando o rigor científico indispensável em qualquer pesquisa. É
importante observar que não existe um tamanho de amostra pré-determinado,
ou seja, cada pesquisa deve ser considerando sua população e seus objetivos.
Estimativa • É preciso ter uma idéia inicial do que se espera encontrar como
inicial dos resultado. Esse valor pode ser obtido através de um estudo
parâmetros piloto, ou ainda, através de estudos similares.
76
DETERMINAÇÃO DO TAMANHO MÍNIMO DA AMOSTRA
Tamanho da
Amostra
Erro Amostral
77
CÁLCULO DO TAMANHO MÍNIMO DA AMOSTRA
A fórmula utilizada é:
Onde:
2
– desvio-padrão populacional elevado ao quadrado (variância)
Z2 – valor da tabela normal padrão elevado ao quadrado
2
– erro máximo de estimação estabelecido pelo pesquisador
N – tamanho da população
78
EXEMPLO
Informações do problema:
Deseja estimar a média de gastos mensais no supermercado
N = 6.500 clientes (População)
Z= 1,96 (valor da tabela normal para uma confiança de 95%)
= 15 reais (erro amostral)
= 200 reais (desvio-padrão)
79
Para o caso do desvio-padrão ser desconhecido, deve-se utilizar uma
estimativa deste valor com base em dados amostrais, como por exemplo:
EXEMPLO
80
Devemos, portanto, obter uma amostra de ao menos 216
administradores que estejam no primeiro ano de trabalho, selecionadas
aleatoriamente.
z 2 p (1 p ) N
n
(N 1) 2 z 2 p (1 p)
Onde:
EXEMPLO 1
Informações do problema:
Z- 1,96 (para 95% de confiança, z=1,96)
p = 0,50 (quando não sabemos esta proporção, utilizamos o valor de p=0,50)
N = 1.450
= 0,05
81
z 2 p(1 p) N 1,962.0,50(1 0,50).1450
n
(N 1) 2 z 2 p(1 p) (1450 1).0,052 1,962.0,50(1 0,50)
EXEMPLO
Informações do problema:
82
Devemos então investigar uma amostra de 385 consumidores.
RECAPITULANDO
ATIVIDADES AMOSTRAGEM
83
Questão 2. Um estudo deseja saber a proporção de eleitores que se declaram
indecisos em relação a certo candidato. Qual deverá ser o tamanho mínimo de
amostra para uma confiança de 95% e um erro máximo de estimação de 5%.
84
7. ESTIMAÇÃO
Simone Echeveste
85
IMPORTANTE:
86
Destaca-se aqui que a variável analisada (x) deve apresentar
distribuição aproximadamente normal para que se possa realizar esse
procedimento de estimação intervalar.
95%
Seja “X” uma variável aleatória que apresenta distribuição normal com
desvio-padrão desconhecido, o intervalo de confiança para a média µ pode
ser assim determinado:
Atenção!
x = média amostral
= erro de estimação
t= valor tabelado tabela t-student
Onde: s = desvio-padrão amostral
n = tamanho da amostra
87
Observe que neste intervalo utilizaremos a distribuição t-student que é
uma distribuição muito semelhante à distribuição normal e é utilizada em casos
de pequenas amostras ou ainda quando é desconhecido. A tabela t-student
apresentada abaixo possui ( n - 1) graus de liberdade:
88
EXEMPLO 1
Dados do Problema:
Variável (x) – Idade (em anos)
Amostra (n)= 25 clientes
= 54,7 anos
s = 5,2 anos
t = 2,064 (veja na página a seguir como encontrar esse valor)
= 2,1466
[54,7 ± 2,15]
[52,55 a 56,85]
89
COMO ENCONTRAR O VALOR DE “T” NA TABELA T-STUDENT
90
EXEMPLO 2
Dados do Problema:
Variável (x) – Número de atendimentos realizados ao dia
Amostra (n)= 15 dias
= 53 atendimentos
s = 4 atendimentos
t = 2,145 (procurar na tabela - linha 14 e coluna IC95%)
= 2,22
91
[53 ± 2,22]
[50,78 a 55,22]
95%
Atenção!
92
Os valores de Z (normal-padrão) podem ser obtidos na tabela t com
infinitos graus de liberdade. Valores típicos:
EXEMPLO
Dados do Problema:
Proporção investigada – proporção de latas com prazo de validade vencido
= 0,0522
93
Intervalo de Confiança 95%
94
RECAPITULANDO
95
95% para o verdadeiro tempo médio necessário para completar um pedido-
padrão.
96
8. TESTES DE HIPÓTESES
Simone Echeveste
97
Exemplos:
- O lucro médio mensal da empresa é de 500 mil reais.
- As vendas médias da loja A são superiores às da loja B.
- O tempo médio de entrega da mercadoria é de 7 dias.
2º) A Hipótese Nula (H0) é a afirmação de que tal efeito não está presente
na população;
3º) Com base nos dados obtidos na amostra verifique se os valores obtidos
estão muito distantes do valor do parâmetro pela hipótese nula; caso
afirmativo, os dados evidenciam que a hipótese nula é falsa e que o efeito
que está procurando está realmente presente;
98
Em geral, estipula-se um nível de 5%. O valor da probabilidade de se
obter o efeito observado, dado que a hipótese nula é verdadeira, é chamado de
p-valor. Se o valor do p-valor for menor que o nível de significância estipulado
(normalmente de 5%), assume-se o erro tipo I e rejeita-se a hipótese nula. Ao
contrário, se o p-valor for maior, não é assumido o erro tipo I e se aceita a
hipótese nula.
Erro Tipo I
Erro Tipo II
99
COMPONENTES DE UM TESTE DE HIPÓTESES
HIPÓTESES DE PESQUISA
H0 : = 7 dias
H1 : 7 dias
H0 : A = B
H1 : A > B
ESTATÍSTICA DO TESTE
100
REGRA DE DECISÃO
CONCLUSÃO EXPERIMENTAL
Concluir
101
TESTE DE HIPÓTESES PARA UMA MÉDIA (TESTE T – STUDENT)
Hipóteses
Ho : o (referência)
Ha : o (referência)
Estatística do teste
X 0 = valor de referência
o
t cal s = desvio-padrão da amostra
s
n = tamanho da amostra
n
Regra de decisão
102
Para o caso do valor calculado na estatística estar localizado na região
crítica deveremos então rejeitar a hipótese nula H0 que representa a decisão
de que SIM, existe diferença significativa dos dados amostrais com os
parâmetros populacionais.
0
(-) Valor tabelado (+) Valor tabelado
103
EXEMPLO 1
H0 : µ = 18 dias
H1 : µ ≠ 18 dias
t calc - 0,196
104
Passo 4 – Regra de Decisão
105
Regra de Decisão
0
-2,045 +2,045
0
-2,045 +2,045
-0,196
106
Ao aceitar a hipótese nula H0 estaremos aceitando a seguinte afirmação:
H0 : µ = 18 dias
Passo 5 – Conclusão
EXEMPLO 2
107
= 5,6
182meses (desvio-padrão
gramas da amostra)
(média da amostra)
s = 12 gramas (desvio-padrão da amostra)
α = 0,05 (nível de significância do teste: p=5%)
H0 : µ = 190 gramas
H1 : µ ≠ 190 gramas
x - μ0 182 - 190 -8 -8
t calc = = = = - 9,41
s 12 12 0,85
n 200 14,14
t calc - 9,41
108
Tabela de valores críticos da distribuição t de Student.
Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
18 2,101 2,552 2,878
19 2,093 2,539 2,861
20 2,086 2,528 2,845
21 2,080 2,518 2,831
22 2,074 2,508 2,819
23 2,069 2,500 2,807
24 2,064 2,492 2,797
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
29 2,045 2,462 2,756
30 2,042 2,457 2,750
39 2,023 2,426 2,708
40 2,021 2,423 2,704
49 2,010 2,405 2,680
50 2,009 2,403 2,678
59 2,001 2,391 2,662
60 2,000 2,390 2,660
99 1,984 2,365 2,626
100 1,984 2,364 2,626
120 1,980 2,358 2,617
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576
Regra de Decisão
0
-9,41 -1,972 +1,972
109
Este valor (t=-9,41) está localizado, na nossa regra de decisão, FORA
da região de aceitação, ou ainda, ele localiza-se na REGIÃO CRÍTICA – então
nossa decisão será REJEITAR H0.
H0 : µ = 190 gramas
H1 : µ ≠ 190 gramas
H1 : µ ≠ 190 gramas
Passo 5 – Conclusão
110
TESTE DE HIPÓTESES PARA COMPARAÇÃO ENTRE DUAS MÉDIAS (T-
STUDENT PARA DUAS AMOSTRAS)
n1 n2
Grupo 1 x1 Grupo 2 x2
s1 s2
Hipóteses:
Ho : 1 2
H1 : 1 2
111
Estatística do teste
Onde:
(desvio-padrão ao quadrado)
(desvio-padrão ao quadrado)
Regra de decisão
Região crítica
Região de Região crítica
Aceitação
112
EXEMPLO 1
Ho : 1 2
H1 : 1 2
113
Passo 3 – Cálculo da Estatística do Teste
Gl: (n1+n2 – 2) = (40+40 - 2) = .78 (Na tabela não temos linha 78, então
iremos para a mais próxima que é a linha 60)
114
O valor de “t” tabelado é então 2,000 – esse valor determinará na regra
de decisão os limites da região crítica.
Regra de Decisão
0
-2,000 +2,000
8,77
Ho : 1 2
H1 : 1 2
H1 : µ1 ≠ µ2
115
médio de duração do fabricante (65 horas) é SUPERIOR ao tempo médio de
duração do concorrente (60 horas).
Passo 5 – Conclusão
EXEMPLO 2
116
α = 0,05 (nível de significância do teste: p=5%)
Ho : 1 2
H1 : 1 2
Gl: (n1+n2 – 2) = (20 + 25 - 2) = 43 (Na tabela não temos linha 43, então
iremos para a mais próxima que é a linha 40)
117
Tabela de valores críticos da distribuição t de Student.
Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
18 2,101 2,552 2,878
23 2,069 2,500 2,807
24 2,064 2,492 2,797
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
29 2,045 2,462 2,756
30 2,042 2,457 2,750
39 2,023 2,426 2,708
40 2,021 2,423 2,704
49 2,010 2,405 2,680
50 2,009 2,403 2,678
59 2,001 2,391 2,662
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576
Regra de Decisão
0
-2,021 0,78 +2,021
118
Ho : 1 2
H1 : 1 2
H1: µ1 = µ2
Passo 5 – Conclusão
119
RECAPITULANDO
120
de duração de 197 horas com um desvio-padrão de 16 horas. Fixado o nível de
significância de 5% conclua sobre o caso.
121
Questão 5. O tempo médio gasto para profissionais da área de Ciências
Contábeis realizarem uma determinada tarefa tem sido de 50 minutos. Um
novo procedimento está sendo implementado. Neste novo procedimento,
retirou-se uma amostra de 25 pessoas, com um tempo médio de execução
desta mesma tarefa de 48 minutos e um desvio-padrão de 11,9 minutos.
Através destes dados, foi realizado o teste t-student resultando um valor de
estatística do teste t=0,84. Ao analisar estes dados, ao nível de significância de
5% você poderia concluir que:
122
GABARITO DAS ATIVIDADES PROPOSTAS
Questão 1. t= 42,25
Conclusão: Rejeita-se H0, logo existe diferença significativa no tempo médio
de deslocamento. Observa-se que com as obras em andamento este tempo de
deslocamento de Porto Alegre a São Leopoldo é significativamente superior a
40 minutos.
Questão 2. t= -4,01
Conclusão: Rejeita-se H0, logo existe diferença significativa para o salário
médio dos profissionais entre os setores público e privado. Observa-se que o
salário médio dos profissionais do setor privado é significativamente superior
ao dos funcionários do setor público.
Questão 3. t= -0,77
Conclusão: Aceita-se H0, logo não existe diferença significativa na média de
consumo entre os dois tipos de automóveis.
123
9. ANÁLISE DE CORRELAÇÃO
Simone Echeveste
124
A existência de uma relação entre as variáveis e a mensuração deste
grau de relação é o que caracteriza o objeto da Análise de Correlação. Esta
ferramenta estatística indica a existência ou não de relacionamento entre duas
variáveis e se este relacionamento é fraco, moderado ou forte.
Diagrama de Dispersão
600
500
400
300
200
100
0
0 2000 4000 6000 8000 10000 12000
Renda (reais)
125
TIPOS DE CORRELAÇÕES
330
280
Vendas (mil reais)
230
180
130
80
1 1,5 2 2,5 3 3,5
Gastos em propaganda (m il reais)
10
Desempenho do aluno
0
0 2 4 6 8 10 12 14 16
Número de faltas
126
C) Ausência de Correlação
200
190
180
170
Altura
160
150
140
130
120
110
85 95 105 115 125
Quociente de Inteligência
As variáveis
O relacionamento
envolvidas devem ser As variáveis
entre as duas
aleatórias e medidas investigadas devem
variáveis deve ser
no mínimo em escala ter distribuição normal.
linear.
intervalar.
127
Sua fórmula é:
n. x. y ( x).( y)
r
[n. x 2 ( x) 2 ] [n. y2 ( y) 2 ]
Como Calcular:
1º) Obtenha a soma dos valores de x : x
2º) Obtenha a soma dos valores de y: y
3º) Multiplique cada valor de x por seu valor y correspondente e obtenha a sua soma: x.y
2
4º) Eleve ao quadrado cada valor de x e obtenha a sua soma: x
2
5º) Eleve ao quadrado cada valor de y e obtenha a sua soma: y
6º) Use essas cinco somas para calcular o coeficiente de correlação.
128
EXEMPLO 1
n = 6 residências
x = Idade do Imóvel
y = Preço de venda dos imóveis
129
Tabela de cálculos:
n. x. y ( x).( y)
r
2 2
[n. x ( x) ] [n. y2 ( y) 2 ]
6 960 - (21)x(355)
r
[6 x 91 - (21)2 ] x [6 x 27.625- (355)2 ]
r 0,8299
Interpretação:
Como r apresenta um valor negativo, indica correlação inversa/negativa entre
a idade do imóvel e o seu preço de venda, ou seja, quanto maior a idade do
imóvel (mais antigo for) menor tende a ser o preço de venda.
130
INTERPRETAÇÃO DA INTENSIDADE DA CORRELAÇÃO
EXEMPLO 2
1 3,5 280
2 3,8 360
3 2,6 200
4 1,9 110
5 3,1 230
6 2,8 210
7 4,2 330
8 4,0 350
131
Para este exemplo temos as seguintes informações:
n = 8 famílias
x = Renda mensal (salários mínimos)
y = Despesa semanal supermercado (reais)
Tabela de cálculos:
Família Renda mensal (x) Despesa superm.(y) x.y x2 y2
1 3,5 280 980 12,3 78400
2 3,8 360 1368 14,4 129600
3 2,6 200 520 6,8 40000
4 1,9 110 209 3,6 12100
5 3,1 230 713 9,6 52900
6 2,8 210 588 7,8 44100
7 4,2 330 1386 17,6 108900
8 4,0 350 1400 16,0 122500
Total (Σ) 25,9 2070 7164 88,2 588500
n. x. y ( x).( y)
r
2 2
[n. x ( x) ] [n. y2 ( y) 2 ]
132
Interpretação:
Como r apresenta um valor positivo, indica correlação direta/positiva entre a
renda mensal e as despesas semanais no supermercado, ou seja, quanto
maior a renda maior tende a ser a despesa semanal no supermercado.
Podemos ainda destacar se esta correlação é muito forte.
RECAPITULANDO
133
Questão 2. Considere as seguintes informações referentes a 15 Municípios do
Rio Grande do Sul:
A. ( ) Pode-se concluir que existe uma correlação direta entre o Índice de Pobreza e o
PIB per capta destes municípios, ou seja, quanto maior o Índice de Pobreza menor
tende a ser o PIB per capta.
B. ( ) Pode-se concluir que não existe diferença significativa entre o Índice de Pobreza
e o PIB per capta destes municípios, ou seja, o PIB não é superior em Municípios mais
pobres.
C. ( ) Pode-se concluir que existe uma correlação inversa entre o Índice de Pobreza e
o PIB per capta destes municípios, ou seja, quanto maior o Índice de Pobreza menor
tende a ser o PIB per capta.
D. ( ) Pode-se concluir que existe uma correlação inversa entre o Índice de Pobreza e
o PIB per capta destes municípios, ou seja, quanto maior o Índice de Pobreza maior
tende a ser o PIB per capta.
134
E. ( ) Pode-se concluir que existe uma correlação inversa extremamente forte entre o
Índice de Pobreza e o PIB per capta destes municípios, ou seja, para todos os
municípios quanto maior o Índice de Pobreza menor foi o PIB per capta.
135
E( ) Existe uma correlação direta muito forte entre a temperatura do dia e as vendas
de refrigerante.
Questão 1. r = 0,857
“Existe uma correlação forte direta entre total de espaço de frente
dedicado a sua linha de produtos na loja e y= total das vendas dos
produtos, em reais, no último mês, ou seja, quanto maior o espaço de
frente dedicado a linha de produtos, maior tende a ser as vendas dos
produtos.
Questão 2.
C. ( x ) Pode-se concluir que existe uma correlação inversa entre o Índice
de Pobreza e o PIB per capta destes municípios, ou seja, quanto maior
o Índice de Pobreza menor tende a ser o PIB per capta.
136
Questão 3. r = 0,801
“Existe uma correlação forte direta entre o número de horas sem dormir
e o número de erros, ou seja, quanto maior o número de horas sem
dormir, maior tende a ser o número de erros cometidos.
Questão 4.
Questão 5. r = 0,911
“Existe uma correlação muito forte direta entre o número de horas de
estudo e a nota na prova, ou seja, quanto maior o número de horas de
estudo, maior tende a ser a nota na prova.”
137
10. ANÁLISE DE REGRESSÃO
Simone Echeveste
138
MODELO DE REGRESSÃO LINEAR
F(X) = Y = a + bX
Variável Variável
"x" "y"
Variável Variável
Independente Dependente
Y = a + bX
139
Os valores de a e b serão determinados, através do Método dos
Mínimos Quadrados (MMQ), aplicado na amostra selecionada, utilizando-se
as seguintes fórmulas:
INFORMAÇÕES IMPORTANTES
A magnitude da inclinação da regressão pode ser lida como segue: para cada acréscimo
unitário na variável (X), a variável dependente aumentará/diminuirá b unidades de y .
140
EXEMPLO 1
141
CÁLCULOS DA EQUAÇÃO DA RETA DE REGRESSÃO
n = 10 meses
x = Preço (reais)
y = Demanda (unidades vendidas)
142
Cálculo do Coeficiente b
Cálculo do Coeficiente a
143
Neste caso, estamos determinando o valor de x= 100 reais e desejamos
estimar qual será valor de y = demanda (unidades vendidas), para isso basta
substituirmos os dados na Equação da Reta obtida:
Conclusão
Estima-se que para um preço de 100 reais sejam vendidas em torno de 196,76
unidades do produto.
EXEMPLO 2
144
Para este exemplo temos as seguintes informações:
n = 8 administradores
x = Tempo de experiência (anos)
y = Renda mensal (salários mínimos)
Tabela de cálculos:
Cálculo do Coeficiente b
145
Cálculo do Coeficiente a
QUESTÃO:
Qual será a renda mensal estimada de um Administrador com 15 anos
de experiência?
Para x = 15 anos
Conclusão
Estima-se que para um tempo de experiência de 15 anos o salário mensal de
um Administrador seja em torno de 13,27 salários mínimos.
146
RECAPITULANDO
a. ( ) Inexistente
b. ( ) Direta/positiva
c. ( ) Inversa/Negativa
d. ( ) Direta/Negativa
e. ( ) Inversa/Positiva
a. ( ) 1,62 relatórios
147
b. ( ) 74 relatórios
c. ( ) 58 relatórios
d. ( ) 10 relatórios
e. ( ) 120 relatórios
148
Questão 4. Um corretor do mercado de ações, visando prever o número de
negócios fechados por dia, decidiu utilizar o número de chamadas telefônicas
recebidas como variável independente. Os resultados obtidos para uma
amostra de 10 dias foram:
149
GABARITO DAS ATIVIDADES PROPOSTAS
Questão 1.
b. ( X ) Direta/positiva
b. ( X ) 74 relatórios
Questão 2.
R: R$ 1.300,00
Questão 3.
a) R: Y = 885,57 + 21,36 X
b) R: R$ 1.099,17
Questão 4.
a) R: Y = 20,42 + 0,08 X
b) R: 60,42 negócios fechados
.
Questão 5.
a) R: Y = 15,20 + 149,66 X
b) R: 1.137,65 reais
150
Referências Bibliográficas
MOORE, D. A Estatística Básica e sua prática. Rio de Janeiro: Ed. LTC, 2000.
151