Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
franfreitasjunior@hotmail.com
Lição nº 1
Objecto da estatística
Estatística é uma ciência exacta que visa fornecer subsídios ao analista para colectar,
organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da
população, tais como média ou desvio padrão.
Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser
utilizados mesmo antes de se recolher a amostra, isto é, deve-se planejar a experiência
que nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o
máximo de informação relevante para o problema em estudo, ou seja para a população
de onde os dados provêm.
Quando de posse dos dados, procura-se agrupá-los e reduzi-los, sob forma de amostra,
deixando de lado a aleatoriedade presente.
População e amostra
Recenseamento
Lição nº 2
Sondagem
Por vezes, não é viável nem desejável, principalmente quando o número de elementos
da população é muito elevado, inquirir todos os seus elementos sempre que se quer
estudar uma ou mais características particulares dessa população.
Estudo científico de uma parte de uma população com o objectivo de estudar atitudes,
hábitos e preferências da população relativamente a acontecimentos, circunstâncias e
assuntos de interesse comum.
Nos próximos tópicos, estudaremos a amostragem e logo após as duas fases que se
distinguem em uma análise estatística: a estatística "descritiva" e a "indutiva".
Amostragem
Intencional
Quotas ou proporcional
Desproporcional
Probabilística
Aleatória Simples
Aleatória Estratificada
Conglomerado
Não probabilística
Acidental ou conveniência
Intencional
Quotas ou proporcional
Desproporcional
Probabilística
Para que se possa realizar inferências sobre a população, é necessário que se trabalhe
com amostragem probabilística. É o método que garante segurança quando investiga-se
alguma hipótese. Normalmente os indivíduos investigados possuem a mesma
probabilidade de ser seleccionado na amostra.
Aleatória Simples
Quando se trabalha com sorteio de quadras de casas por exemplo, há uma regra
crescente para os números das casas. Em casos como este, divide-se a população pela
amostra e obtém-se um coeficiente (y). A primeira casa será a de número x, a segunda
será a de número x + y; a terceira será a de número x + 3. y.
Supondo que este coeficiente seja 6. O primeiro elemento será 3. O segundo será 3 + 6.
O terceiro será 3 + 2.6. O quarto será 3 + 3.6, e assim sucessivamente.
Aleatória Estratificada
Conglomerado
Dimensionamento da amostra
A proporção (q) será sempre 1 - p. Neste exemplo q, será 0,4. O erro é representado por
d.
Para casos em que não se tenha como identificar as proporções confere-se 0,5 para p e
q.
Lição nº 3
Objectivo: que os alunos conheçam os tipos de dados e saibam fazer a sua divisão.
Quando fala-se em valores discretos, aborda-se um valor exacto, tal como quantidade
de peças defeituosas. Comummente utiliza-se este tipo de variáveis para tratar de
número de filhos, satisfação e escalas nominais no geral.
A tipologia dos dados determina a variável, ela será portanto contínua ou discreta. Isto
quer dizer que ao definir-se uma variável com contínua ou discreta, futuramente já
definiu-se que tipo de tratamento se dará a ela.
No entanto, ao contrário das proposições deduzidas, não podemos dizer que são falsas
ou verdadeiras, já que foram verificadas sobre um conjunto restrito de indivíduos, e
portanto não são falsas, mas não foram verificadas para todos os indivíduos da
População, pelo que também não podemos afirmar que são verdadeiras.
Considerando o que foi dito anteriormente sobre a Estatística Indutiva, precisamos aqui
da noção de Probabilidade, para medir o grau de incerteza que existe, quando tiramos
uma conclusão para a população, a partir da observação da amostra.
Lição nº 4
Distribuição de frequência
Quando da análise de dados, é comum procurar conferir certa ordem aos números
tornando-os visualmente mais amigáveis. O procedimento mais comum é o de divisão
por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada
classe.
2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente
inferior ao menor valor das observações.
3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente
superior ao maior valor das observações.
Distribuições simétricas
Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando
de dados que distribuem-se em forma de sino.
Distribuições assimétricas
Lição nº 5
Objectivo: que os alunos saibam o que são medidas de tendência central bem como a
importância das mesmas
Medidas Fórmula
Média aritmética
Média aritmética
ponderada
1) Se n é impar, o valor é central, 2) se n é par, o valor é a
Mediana
média dos dois valores centrais
Moda Valor que ocorre com mais frequência.
Média geométrica
Média harmónica
Quartil
Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua
utilização, pois pode dar uma imagem distorcida dos dados.
Pode-se mostrar que, quando a distribuição dos dados é "normal", então a melhor
medida de localização do centro é a média.
A distribuição normal é uma das mais importantes e que surge com mais frequência nas
aplicações (esse fato justifica a grande utilização da média).
A média tem uma outra característica, que torna a sua utilização vantajosa em certas
aplicações: quando o que se pretende representar é a quantidade total expressa pelos
dados, utiliza-se a média.
Moda e Mediana
Moda
Define-se moda como sendo: o valor que surge com mais frequência se os dados são
discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos.
Mediana
Como medida de localização, a mediana é mais robusta do que a média, pois não é tão
sensível aos dados.
Como já vimos, a média ao contrário da mediana, é uma medida muito influenciada por
valores "muito grandes" ou "muito pequenos", mesmo que estes valores surjam em
pequeno número na amostra. Estes valores são os responsáveis pela má utilização da
média em muitas situações em que teria mais significado utilizar a mediana.
Lição nº 6
Objectivo: que os alunos saibam como medir a variabilidade presente num conjunto de
dado através das medidas de dispersão.
Supondo ser a média, a medida de localização mais importante, será relativamente a ela
que se define a principal medida de dispersão - a variância, apresentada a seguir.
Variância
Define-se a variância, como a medida que se obtém somando os quadrados dos desvios
das observações da amostra, relativamente à sua média, e dividindo pelo número de
observações da amostra menos um.
Desvio-padrão
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime
não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou
dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância
e obtemos o desvio padrão.
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto
maior for, maior será a dispersão dos dados.
Quanto maior for a variabilidade entre os dados, maior será o desvio padrão.
exemplo 7:
7 7,5
8 10
9 7,5
10 6,3
11 8
12 5,5
13 9,7
14 9,3
15 7,5
Total 109,8
Média 7,32
Desvio Padrão 1,77
Observamos no exemplo, que a média das provas, foi estimada em 7,32 com desvio
padrão em 1,77. Concluímos que a maioria das notas concentrou-se em 9,09 e 5,55.
Lição nº 7
Já vimos que esse tipo de distribuição apresenta-se em formato de sino, uni modal,
simétrica em relação a sua média.
Considerando a probabilidade de ocorrência, a área sob sua curva soma 100%. Isso quer
dizer que a probabilidade de uma observação assumir um valor entre dois pontos
quaisquer é igual à área compreendida entre esses dois pontos.
68,26%=>1desvio
95,44%=>2desvios
99,73%=>3desvios
Propriedade 1
Propriedade 2
f(x) possui um máximo para z=0, e nesse caso sua ordenada vale 0,39.
Propriedade3
Propriedade 4
f(x) tem dois pontos de inflexão cujas abcissas valem média + DP e média - DP, ou
quando z tem dois pontos de inflexão cujas abcissas valem +1 e -1.
Para se obter a probabilidade sob a curva normal, utilizamos a tabela de faixa central.
exemplo 8:
As alturas de grupo de criancinhas são tidas como normais em sua distribuição, com
desvio padrão em 0,30m e média em 1,60. Qual a probabilidade de um aluno medir (1)
entre 1,50 e 1,80, (2) mais de 1,75 e menos de 1,48?
(1)z1=(1,50-1,60)/0,30=-0,33
z2=(1,80-1,60)/0,30=0,67
Então,z1(0,1293)+z2(0,2486)=37,79%
(2)z1=(1,75-1,60)/0,30=0,30
0,500-0,1915=30,85%
(3)Z1=(1,48-1,50)/0,30=-0,4
0,500-0,1554 = 34,46%
Lição nº 8
4. Foi encomendado um estudo para avaliação de uma entidade de ensino superior. Para
isso, aplicou-se um questionário e obteve-se respostas de 110 alunos.
Indique:
a)a variável em estudo;
c) a população em estudo;
b) a amostra escolhida;
5. Indique abaixo quais amostras são consideradas boas:
a) Em um cinema, desejou-se verificar quais eram as intenções de voto para a próxima
eleição. As pessoas entrevistadas, eram as que estavam presentes
b) Para saber a opinião a respeito de métodos contraceptivos, resolveu-se aplicar um
estudo em uma escola de ensino fundamental, junto aos alunos.
(1)idade
(2)anos de estudo
(3)ano de escolaridade
(4)renda
(5)sexo
(6)local de estudo
(7)conceito obtido na última prova de biologia
(8)Quantidade de livros que possui
Lição nº 9
8. Ao procurar emprego, um determinado cidadão teve que optar por duas ofertas
dispostas em um classificado. Qual delas representa a melhor opção? Por que?
Oferta 1 Oferta 2
Média Salarial 890,00 950,00
Mediana 800,00 700,00
Desvio Padrão 32,00 38,00
Lição nº 10
Objectivo: que os alunos saibam que o mundo dos negócios, em qualquer que seja a
área, de Recursos Humanos a Marketing, não pode mais embasar as tomadas de
decisões e assumir risco simplesmente no feeling e no bom senso dos executivos e
gerentes organizacionais.
Introdução
O barateamento exponencial destes recursos nos últimos anos tem feito que muitas
empresas invistam neste hardware (computadores, pacotes estatísticos, Internet, bases
de dados) mas uma menor atenção tem sido dada ao “humanware” ou seja aos
indivíduos que efectivamente extrairão deste arsenal tecnológico a informação e o
conhecimento que possibilitarão conduzir estas organizações à liderança em seus
segmentos. Sem este aprimoramento do “humanware” de muita pouca valia será o
investimento feito no aparato tecnológico.
Lição nº 11
Objectivo: que os alunos saibam que a Estatística é uma ciência exacta que visa fornecer
subsídios ao analista para colectar, organizar, resumir, analisar e apresentar dados. Trata
de parâmetros extraídos da população, tais como média ou desvio padrão.
Estatística é uma ciência exacta que visa fornecer subsídios ao analista para colectar,
organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da
população, tais como média ou desvio padrão.
Muitas vezes ela está tão presente nas actividades rotineiras que não se dá conta que a
mesma encontra-se ali. Por exemplo, em um jogo de futebol, tomando-se a guarda-redes
e seu espaço vizinho, tem-se uma distribuição normal. Sim, afinal ao longo do jogo, os
chutes a golo, tendem à área delimitada e defendida pelo guarda-redes.
Colecta de dados
Toda e qualquer acção estatística deve estar centrada em objectivos claros. O primeiro
passo para um procedimento estatístico é o trabalho que envolve os dados de um estudo.
Estando estes objectivos definidos, buscam-se os dados que os satisfaçam, sejam eles
primários ou secundários. Dados primários são aqueles que foram prospectados sem que
não tenha havido um estudo preliminar acerca da amostra em específico, ou seja, são
dados originais.
Dados secundários são aqueles que estão a nossa disposição oriunda de outros estudos.
São fontes de dados secundários; Internet, bancos de dados, cadastros, jornais, revistas,
filmes, entre muitas outras fontes.
População e amostra
Amostras relacionadas
Amostragem
Não Probabilística
1. Acidental ou conveniência
2. Intencional
3. Quotas ou proporcional
Tipos de amostragens 4. Desproporcional
Probabilística
1. Aleatória Simples
2. Aleatória Estratificada
3. Conglomerado
Este tipo de amostra, é determinada por ordem do pesquisador, ou seja não há uma
aleatoriedade para a escolha de um elemento da população.
Acidental ou conveniência
Intencional
Quotas ou proporcional
Desproporcional
Objectivando obter os pesos a serem atribuídos a cada marca de telefone celular, para
uma análise conjunta de todas as marcas no exemplo acima, obteve-se os seguintes
coeficientes:
Amostra probabilística
Para que se possa realizar inferências sobre a população, é necessário que se trabalhe
com amostragem probabilística. É o método que garante segurança quando investiga-se
alguma hipótese.
Aleatória Simples
Quando se trabalha com sorteio de quadras de casas por exemplo, há uma regra
crescente para os números das casas. Em casos como este, divide-se a população pela
amostra e obtém-se um coeficiente (Ħ). A primeira casa será a de número x, a segunda
será a de número x + Ħ; a terceira será a de número x + 3. Ħ.
Supondo que este coeficiente seja 6. O primeiro elemento será 3. O segundo será 3 + 6.
O terceiro será 3 + 2.6. O quarto será 3 + 3.6, e assim sucessivamente.
Aleatória Estratificada
Conglomerado
Lição nº 12
A proporção (q) será sempre 1 - p. Neste exemplo q, será 0,4. O erro é representado por
d.
Para casos em que não se tenha como identificar as proporções confere-se 0,5 para p e
Tipos de dados
Quando fala-se em valores discretos, aborda-se um valor exacto, tal como quantidade
de peças defeituosas. Comummente utiliza-se este tipo de variáveis para tratar de
número de filhos, satisfação e escalas nominais no geral.
A tipologia dos dados determina a variável, ela será portanto contínua ou discreta. Isto
quer dizer que ao definir-se uma variável com contínua ou discreta, futuramente já
definiu-se que tipo de tratamento se dará a ela. Por exemplo, a variável dependente em
uma análise envolvendo Anova, não poderá ser discreta.
Ordinal: objectiva criar como o próprio nome diz, uma ordem de valor, segundo a
preferência do respondente. Por exemplo, em um escala, A é preferido a B, mas não
identifica-se o quanto A é menor que B.
Intervalar: são questões que visam comparar intervalos e medir o quanto uma
preferência encontra-se distante de outra. Actualmente são objecto de infindáveis
discussões entre estatísticos e académicos de marketing quando da aplicação de testes
estatísticos, afinal são consideradas discretas mas podem passar por um processo de
aproximação e tornarem-se contínuas.
Um processo semelhante, é descrito por Cunha (1997), quando o autor aborda a técnica
de Análise de Correspondência (AC) e comenta que as variáveis de melhor emprego
para tal técnica são as qualitativas ou as que passaram por processo de categorização.
Exemplo de escalas intervalares: 1;2;3;4;5, muito insatisfeito; insatisfeito; indiferente;
satisfeito; muito satisfeito.
Razão: são as variáveis contínuas. Peso, idade, renda, são exemplos de questões de
razão.
Distribuição de frequências
Quando da análise de dados, é comum procurar conferir certa ordem aos números
tornando-os visualmente mais amigáveis. O procedimento mais comum é o de divisão
por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada
classe.
2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente
inferior ao menor valor das observações:
LI: 5,1
3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente
superior ao maior valor das observações:
LS:15
7.
Lição nº 14
Há várias medidas de tendência central, entretanto neste material será realizado o estudo
apenas daquelas que forem as mais significativas para a teoria de pesquisa
mercadológica.
Média
harmônica
Quartis
13,3 13,5 17,2 13,8 12,3 12,7 13,0 14,5 14,9 15,8 13,1 13,3 14,1
12,3 12,7 13,0 13,1 13,3 13,3 13,5 13,8 14,1 14,5 14,9 15,8 17,2
X (i) I
12,3 01 0,038
12,7 02 0,115
13,0 03 0,192
13,1 04 0,269
13,3 05 0,346
13,3 06 0,423
13,5 07 0,500
13,8 08 0,577
14,1 09 0,654
14,5 10 0,731
14,9 11 0,808
15,8 12 0,885
17,2 13 0,962
2) Valores imediatamente acima e abaixo de 0,25 (13,0 e 13,1), associados com p (inf) =
0,192 e p (sup) = 0,269
Valores imediatamente acima e abaixo de 0,75: x(inf) = 14,5 e x (sup) = 14,9, associados
com p(inf) = 0,731 e p(sup) = 0,808:
Variabilidade
Amplitude total: Definida como a diferença entre o maior e o menor valor das
observações
A média da idade da amostra foi de 15,00 anos, com desvio-padrão de 1,05 anos, o que
indica a maioria dos respondentes entre 14 e 16 anos.
...
Lição nº 15
Objectivo: que os alunos saibam que Uma hipótese estatística é uma afirmativa a
respeito de um parâmetro de uma distribuição de probabilidade. Através dos elementos
amostrais faz-se um teste que indicará a aceitação ou rejeição da hipótese formulada.
A contrapartida para uma hipótese alternativa (H1) é a hipótese nula (H0). A primeira
sempre é expressa por uma desigualdade e a segunda sempre por uma igualdade.
Segundo Fonseca (1996), os testes não paramétricos são muito interessantes para os
dados qualitativos quando se trabalha com amostras pequenas, (inferiores a 30).
Aplica-se quando se quer estudar a dependência entre duas variáveis, através de uma
tabela de dupla entrada ou também conhecida como tabela de contingência.
Observações independentes;
Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os
dados segundo um critério em específico.
Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1.
Exemplo
A partir deste estudo o gerente poderia então elaborar uma estratégia comercial para
cada bairro ou manter uma para todos.
Bairro 1 2 3 4 5 Total
Valores Observados 9 11 25 20 15 80
Valores Esperados 16 16 16 16 16 80
µ = 0,05
Χ2 = (9-16)2 + (11 – 16) 2 + (25-16) 2 + (20 – 16) 2 + (15 – 16) 2/16
Conclui-se que o Qui quadrado calculado (10,75) é maior do que o tabelado (9,49),
rejeita-se H0 em prol de H1.
Lição nº 17
Objectivo: que os alunos saibam que a utilização do presente teste em pesquisa visa
verificar se as distribuições de duas ou mais amostras não relacionadas diferem
significativamente em relação à determinada variável.
Observações independentes;
Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os
dados segundo um critério em específico.
Determinar a região de rejeição de H0. Determinar o valor dos graus de liberdade (φ),
sendo φ = (L – 1) (C – 1), onde L = números de linhas da tabela e C = ao número de
colunas.. Encontrar portanto, o valor do Qui-quadrado tabelado;
Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1.
Exemplo
µ = 0,05
0,11+0,49+3,61+13,39+0,02+4+0,25+2,62+0,21+1,45+12+3,11+0,85+0,32+0,99+0,29
= 43,72
Conclui-se que o Qui quadrado calculado (43,72) é maior do que o tabelado (12,6),
rejeita-se H0 em prol de H1.
Lição nº 18
Objectivo: que os alunos saibam que O teste t é muito utilizado em pesquisa para
verificar se a diferença observada entre duas médias obtidas nas amostras é considerada
grande para ser significativa
Supondo que dois estabelecimentos discutem qual possui clientes mais satisfeitos. Para
mensurar o grau de satisfação junto aos clientes, resolve-se realizar uma pesquisa de
satisfação aplicando um questionário com questões intervalares de 5 pontos.
O cliente A obteve média geral 2,85 e o cliente B obteve média geral 3,45.
Supostamente, conclui-se que o cliente B possui clientes mais satisfeitos que A.
Quando trabalha-se com amostras pequenas, existe uma tendência para que as médias
das amostras sejam realmente diferentes, mesmo que originem-se da mesma população.
Neste caso o teste t, objectiva justamente verificar se o grau de diferença entre os dois
conjuntos pode ser devido a factores outros que não o erro de amostragem.
Procedimento de execução
A fórmula acima pode divergir em alguns livros de estatísticas que abordem amostras
desiguais, no entanto, a mesma contempla amostras de tamanhos iguais ou não.
Exemplo
A B
1 3 2 3
2 4 4 3
3 3 5 4
2 2 3 5
4 1 3 3
3 3 4 2
3 4 2 1
3 2 5 3
4 4 4 4
4 2 5 2
T = 57 T = 69
n = 20 n = 20
X = 2,85 X = 3,45
SQ = 18,55 SQ = 24,95
Sendo t tabelado igual a 2,02 com 38 graus de liberdade e t calculado igual a 1,77,
rejeita-se a hipótese nula em prol da hipótese verdadeira.
Lição nº 19
Haja visto que trata-se de um teste bastante difundido e inúmeros bons softwares
estatísticos e planilhas electrónicas possuem o recurso disponível, não haverá
aprofundamento desta técnica neste capítulo, sendo recomendada literatura
especializada.
Existem dois tipos de problemas a serem resolvidos através da Anova: a níveis fixos ou
a níveis aleatórios. A aleatoriedade determinada a questão do problema.
Na grande maioria dos casos trata-se de níveis fixos, afinal o segundo tipo de problema
(aleatório) somente surgirá quando ocorrer um estudo envolvendo uma escolha aleatória
de factores (em 10 lotes de produção, escolhe-se apenas 5, entre 15 máquinas de um
total de 20, por exemplo).
- SQR soma dos quadrados dos resíduos, devidos exclusivamente ao erro aleatório,
medida dentro dos grupos.
f = MQG
MQR
N – 1=(K – 1) + (N – K)
MQG = SQG (K – 1)
A hipótese nula sempre será rejeitada quando f calculado for maior que o valor
tabelado. Da mesma forma, se MQG for maior que MQR, rejeita-se a hipótese nula.
Quadro
Francisco de Freitas Pá gina 45
ESTATÍSTICA I
franfreitasjunior@hotmail.com
Fonte de variação SQ (soma dos quadrados) GDL (g.l) MQ (quadrados médio) Teste
F
Entre Grupos
Dentro dos grupos
Total
3 x Sx
Um pesquisador realizou um estudo para verificar qual posto de trabalho gerava mais
satisfação para o funcionário. Para isso, durante um mês, 10 funcionários foram
entrevistados. Ao final de um mês os funcionários responderam um questionário
gerando uma nota para o bem-estar do funcionário.
Postos
Funcionários 1 2 3
1 7 5 8
2 8 6 9
3 7 7 8
4 8 6 9
5 9 5 8
6 7 6 8
7 8 7 9
8 6 5 10
9 7 6 8
10 6 6 9
Resumo
Grupo Contagem Soma Média Variância
1 10 73 7,3 0,9
2 10 59 5,9 0,544444
3 10 86 8,6 0,488889
ANOVA
3 x Sx
5,9
7,3
8,6
x1 – x2 = - 1,4
x1 – x3 = - 2,7
x2 – x3 = - 1,3
As três diferenças são menores que o Ld, conclui-se portanto que as médias diferem
entre si.
Lição nº 20
Esta previsão pode ser alcançada através de um estudo que envolve a equação da recta
de regressão, concebida através das variáveis critério (y, dependente ou de resposta) e a
independente (x, também conhecida como prognóstico).
Equação da recta
Y = a1 + a2.x
A relação linear entre as duas variáveis é medida pelo coeficiente de correlação (R).
Y X
Gastos com combustível Km rodados
Renda Pessoal Anos de estudo
Números de defeitos de peças Horas de treinamentos em qualidade
Um R2 igual a 0,80, tem-se que 80% da variabilidade decorre de x. Inversamente, pode-
se dizer que 20% da variância de Y não é atribuível às diferenças em x.
H0 :p = 0
H1: p ≠ 0
Exemplo
Um motorista deseja prever seus gastos com seu automóvel em função dos quilómetros
que roda por mês.
QUILÔMETROSGASTOS (R$)
3203 400
3203 400
2603 340
3105 400
1305 150
804 100
1604 200
2706 300
805 100
1903 200
3203 400
3702 450
3203 400
3203 400
803 100
803 100
1102 130
3202 400
1604 150
1603 200
3203 400
3702 450
3403 440
Estatística de regressão
R múltiplo 0,993064678
R-Quadrado 0,986177454
R-quadrado ajustado 0,985519237
Erro padrão 127,508336
Observações 23
Observando a tabela acima, percebe-se uma forte correlação entre as variáveis, onde R
está muito próximo de 1.
Lição nº 21
Objectivo: que os alunos saibam que em Muitos problemas de regressão envolvem mais
de uma variável regressora. Por exemplo: a satisfação geral poder ser composta por
diversas variáveis independente tais como preço, prazo de entrega, embalagem, entre
outras.
Exemplo:
Variáveis Coeficiente
Prazo de entrega 0,154
Envolvimento da equipe na solução de problemas 0,135
Preço praticado -0,002
Trabalho de pós venda 0,134
Embalagem 0,065
Neste exemplo real, objectiva-se mensurar o grau de satisfação dos clientes de uma
empresa distribuidora de software, onde a variável de resposta era a satisfação geral e as
regressoras eram as acima citadas (para um grupo de factores).
Lição nº 22
Tema: Exercícios
1. Uma empresa possui quatro equipes de vendedores e deseja avaliar os resultados
abaixo discriminados. As vendas deveriam ser as mesmas. Para testar essa hipótese
foram feitas medições nas equipes. Analise os resultados e conclua a respeito de
possíveis diferenças entre as equipes.
20,4 22,3 23,1 23,5 23,8 24,1 24,3 24,3 24,6 24,8
24,9 25,0 25,1 25,3 25,3 25,4 25,6 25,7 25,8 26,0
26,0 26,1 26,2 26,2 26,3 26,5 26,6 26,7 26,8 26,9
27,1 27,1 27,3 27,5 27,7 27,9 28,0 28,3 28,7 29,6
6. Um gerente geral de determinada rede de lojas de varejo deseja saber se a estação
climática do ano interfere no volume de artigos vendidos. Teste a hipótese da estação do
ano interferir no volume vendido.
SP AM RN RS
5,2 5,9 5,2 6,9
5,9 6,3 5,9 6,8
6,6 6,7 6,6 6,7
7,3 7,1 7,3 6,6
8,0 7,5 8,0 6,5
8,7 7,9 8,7 6,4
9,4 8,3 9,4 6,3
7,9 8,7 9,7 6,2
8,3 9,1 5,2 6,1
Bibliografia
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
-4.00.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002
-3.90.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
-3.80.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
-3.70.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
-3.60.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
-3.50.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
-3.40.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
-3.30.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
-3.20.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
-3.10.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
-3.00.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00103 0.00100
-2.90.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
-2.80.00256 0.00248 0.00240 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
-2.70.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.00280 0.00272 0.00264
-2.60.00466 0.00453 0.00440 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
-2.50.00621 0.00604 0.00587 0.00570 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480
-2.40.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
-2.30.01072 0.01044 0.01017 0.00990 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
-2.20.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101
-2.10.01786 0.01743 0.01700 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426
-2.00.02275 0.02222 0.02169 0.02118 0.02067 0.02018 0.01970 0.01923 0.01876 0.01831
-1.90.02872 0.02807 0.02743 0.02680 0.02619 0.02559 0.02500 0.02442 0.02385 0.02330
-1.80.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938
-1.70.04456 0.04363 0.04272 0.04181 0.04093 0.04006 0.03920 0.03836 0.03754 0.03673
-1.60.05480 0.05370 0.05262 0.05155 0.05050 0.04947 0.04846 0.04746 0.04648 0.04551
-1.50.06681 0.06552 0.06425 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592
-1.40.08076 0.07927 0.07780 0.07636 0.07493 0.07353 0.07214 0.07078 0.06944 0.06811
-1.30.09680 0.09510 0.09342 0.09176 0.09012 0.08851 0.08691 0.08534 0.08379 0.08226
-1.20.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09852
-1.10.13566 0.13350 0.13136 0.12924 0.12714 0.12507 0.12302 0.12100 0.11900 0.11702
-1.00.15865 0.15625 0.15386 0.15150 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
-0.90.18406 0.18141 0.17878 0.17618 0.17361 0.17105 0.16853 0.16602 0.16354 0.16109
-0.80.21185 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
-0.70.24196 0.23885 0.23576 0.23269 0.22965 0.22663 0.22363 0.22065 0.21769 0.21476
-0.60.27425 0.27093 0.26763 0.26434 0.26108 0.25784 0.25462 0.25143 0.24825 0.24509
-0.50.30853 0.30502 0.30153 0.29805 0.29460 0.29116 0.28774 0.28434 0.28095 0.27759
-0.40.34457 0.34090 0.33724 0.33359 0.32997 0.32635 0.32276 0.31917 0.31561 0.31206
-0.30.38209 0.37828 0.37448 0.37070 0.36692 0.36317 0.35942 0.35569 0.35197 0.34826
-0.20.42074 0.41683 0.41293 0.40904 0.40516 0.40129 0.39743 0.39358 0.38974 0.38590
-0.10.46017 0.45620 0.45224 0.44828 0.44433 0.44038 0.43644 0.43250 0.42857 0.42465
-0.00.50000 0.49601 0.49202 0.48803 0.48404 0.48006 0.47607 0.47209 0.46811 0.46414