Você está na página 1de 27

Anlise Estatstica com Excel

Prof. Dr. Evandro Marcos Saidel Ribeiro


E-mail: esaidel@usp.br Home page: www.fearp.usp.br/~saidel

Mdulo 1 Teste t de varincia agrupada para a diferena entre duas


mdias (populaes independentes)
1 Introduo Teste t em pares (populaes dependentes)

1.1 Apresentao geral dos tpicos do curso 2 5 Anlise Multivariada de dados


1.2 Estatstica e Excel na empresa 3
5.1 Introduo anlise multivariada de dados 15
2 Estatstica descritiva 5.2 Correlao 16
Coeficiente de correlao linear de Pearson
2.1 Histograma, Grfico de Pareto, Frequncia 4 Matriz de Correlao
2.2 Distribuio de frequncia 4 5.3 Covarincia 16
2.3 Medidas de Centro, Variao, Distribuio 5 Matriz de Covarincia
Mdia, mediana, moda Risco de uma carteira de aes (Modelo de Markowitz)
Amplitude, desvio padro, varincia, coef. de variao 5.4 Anlise de Regresso 17
Escore-z, quartis, percentis Regresso Linear Simples
2.4 Boxplot 6 Equao da Reta
Coeficiente linear, Coeficiente Angular (beta)
3 Probabilidade Coeficiente de determinao R2
Regresso no Linear
3.1 Introduo probabilidade 7 Regresso Linear Mltipla
3.2 Distribuies discretas: Binomial, Poisson 7
3.3 Distribuio contnua: Normal 8 Mdulo 3
3.4 Simulao 8
6 Anlise de Sries Temporais
Mdulo 2
6.1 Ajuste de srie temporal 20
4 Estatstica Inferencial Mdias mveis
Ajuste Exponencial
4.1 Amostragem 10 Modelo de tendncia linear (regresso linear)
Amostras aleatrias simples Modelos de tendncia: Quadrtica, Exponencial
Amostragem com reposio Desvio Mdio Absoluto, Erro Quadrtico Mdio
Amostragem sem reposio 6.2 Anlise de sries para dados sazonais 21
Distribuies de amostragens Modelo exponencial com dados trimestrais
4.2 Intervalos de confiana 12 6.3 Nmeros-ndice 22
Intervalo de confiana para mdias ( conhecido) ndice de Preos Simples
Intervalo de confiana para mdias ( desconhecido) ndice de Preos Agregados
Intervalo de confiana para proporo
4.3 Testes de Hipteses 13 7 Controle Estatstico de Processos
Procedimento para teste de hipteses
Testes para uma amostra 7.1 Gesto da qualidade Seis Sigma 23
Teste z para mdias ( conhecido) 7.2 Grficos de Controle 23
Teste t para mdias ( desconhecido) O Grfico p
Teste z para proporo O Grfico R
Testes para duas amostras O Grfico X
7.3 Variabilidade de Processos 25

1
Mdulo 1 confiana, testes de hipteses, descrio de associao entre
dados (correlao), modelagem entre os dados (anlise de
1 Introduo regresso). Em geral so considerados valores com certa
probabilidade de ocorrncia, estudamos as distribuies de
1.1 Apresentao geral dos tpicos do curso amostras e voltamos a ateno para os valores mais frequentes
(ver Figura 1.3).
Tpico 2 Mdulo 1: Estatstica Descritiva
O estudo de estatstica descritiva importante para conhecer as
principais medidas estatsticas, bem como os recursos de
apresentao grfica de dados. Obtemos informaes a partir
dos dados. Um recurso interessante o boxplot (Figura 1.1), que
informa medidas de centro, de variao e ainda proporciona
uma visualizao da distribuio dos valores. Valores de preos,
receitas, tempos, etc. podem ser analisados atravs do Boxplot.
Figura 1.3 Intervalos de confiana e nveis de significncia
estatstica so baseados em distribuies de amostras.

mv Q1 ~
x Q3 Mv
Tpico 5 Mdulo 2: Anlise Multivariada de dados
A anlise multivariada refere-se a mtodos estatsticos que
Figura 1.1 Boxplot tornam possvel a anlise simultnea de medidas mltiplas para
cada indivduo (CORRAR, PAULO, DIAS FILHO, 2007). Modelos de
Tpico 3 Mdulo 1: Probabilidade anlise de risco, anlise de crdito empregam cada vez mais
A chance ou possibilidade de que um evento venha a acontecer tcnicas de anlise multivariada de dados.
importante para a tomada de deciso. Assim, o estudo de A Eq (1) ilustra o modelo de regresso mltipla: a varivel Y pode
probabilidade est diretamente relacionado ao conhecimento ou ser explicada em termos das variveis x1, x2, ..., xr.
histrico dos eventos que ocorrem na empresa. Por exemplo, se Y = 0 + 1 x1 + 2 x2 + K + r xr + (1)
a taxa de faltas num determinado setor igual a 20%, ento A base para muitas tcnicas de anlise multivariada a matriz de
podemos estimar a probabilidade de mais de 5 funcionrios covarincias que pode ser utilizada na anlise de risco.
faltarem num determinado dia, ou em geral mais de x
funcionrios faltarem num determinado dia (ver figura 1.2). Tpico 6 Mdulo 3: Anlise de Sries Temporais
Atravs da anlise de sries temporais estudamos tendncias,
1,0
variaes sazonais, variaes cclicas, (Figura 1.4). Nesta reviso
0,9 vamos estudar modelos de previso; analisar como escolher um
0,8 modelo de previso mais apropriado; estudar ndices de preos.
0,7
Probabilidade

0,6 DEL VALLE TOTAL


350.000
0,5
300.000
0,4
250.000

0,3 200.000

0,2 150.000

100.000
0,1
50.000
0,0
0
0 5 10 15 20 25 30 35 40 jan/11 abr/11 jul/11 out/11 jan/12 abr/12 jul/12 out/12 jan/13

x (nmero de funcionrios) Figura 1.4 Srie temporal de quantidades de um produto.


Figura 1.2 Probabilidade de faltar mais de x funcionrios de um
setor com 40 funcionrios, num determinado dia. A taxa de
faltas de 20% ao dia. Tpico 7 Mdulo 3: Controle Estatstico de Processos
Alguns mtodos para melhoria contnua de produtos tm sido
O conhecimento de distribuies de probabilidade permite desenvolvidos com nfase cada vez maior na estatstica, na
diversos tipos de anlise, incluindo simulao. melhoria de processos e na otimizao do sistema como um
todo. Neste treinamento iremos estudar grficos de controle,
Tpico 4 Mdulo 2: Estatstica Inferencial (veja exemplo na Figura 1.5) um tipo especial de srie temporal
A Estatstica Inferencial utiliza padres observados em amostras utilizada principalmente na gesto da qualidade. Os grficos de
para fazer inferncias sobre a populao da qual a amostra foi controle, alm de fornecer uma exposio visual dos dados que
retirada. Estas inferncias podem ser estimativas de intervalo de

2
representam os processos, tm o objetivo de separar as causas 2 Estatstica Descritiva
especiais de variao das causas comuns de variao.
A Estatstica Descritiva permite ao pesquisador uma melhor
compreenso dos dados por meio de tabelas, grficos e medidas-
0,30 resumo, identificando tendncias, variabilidade e valores
Proporo Operaes no-desejadas

extremos. Observem medidas de centro, variao e distribuio.


0,25

0,20 Tabela Excel1. Funes Excel, parte 1.


Funo Descrio
0,15
PROCV(valor; matriz; coluna; Procura na matriz o valor e
0,10 [tipo] ) retorna o contedo da
coluna especificada.
0,05
PROCH(valor; matriz; linha; Procura na matriz o valor e
0,00 [tipo] ) retorna o contedo da linha
0 5 10 15 20 25 30 especificada.
Dias NDICE(matriz; lin; col ) Examina a matriz e retorna
o contedo da linha e
Figura 1.5 Grfico de controle para anlise da proporo de itens coluna.
no-conformes. MNIMO(matriz) Retorna o valor mnimo.
MXIMO(matriz) Retorna o valor mximo.
CONT.VALORES(matriz) Nro de clulas no vazias.
1.2 Estatstica e Excel na empresa CONCATENAR(texto1;texto2; ...) Agrupa contedos.
O Microsoft Excel fornece um bom suporte para aplicar FREQNCIA (matriz1;matriz2) Frequncia de valores em
mtodos estatsticos na tomada de deciso empresarial matriz1 que ocorrem de
(LEVINE, 2008). acordo com os limites
definidos na matriz2.
O Excel uma escolha atrativa pois MDIA(valor1; valor2;..) Mdia aritmtica
no incorre custos adicionais para aquisio de softwares MED(valor1; valor2;..) Mediana
estatsticos; MODO(valor1; valor2;..) Moda
a maior parte dos usurios em empresas conhecem o Excel DESVPAD(...; ...; ...) Desvio-padro
fcil de utilizar e aprender; VAR(...; ...; ...) Varincia
as funes grficas e estatsticas utilizam dados de planilhas QUARTIL(...; k) Quartil k
com de diversas aplicaes na empresa; PERCENTIL(...; k/100) Percentil k
alguns grficos produzem resultados visuais mais atraentes DISTRBINOM(x; n ; p ;FALSO) Distribuio binomial: x
do que vrios programas estatsticos. sucessos, n tentativas; p
prob. de sucesso em 1 tent.
Evidentemente, ao utilizar o Excel, voc deve ser cauteloso em POISSON(x; L ;FALSO) Distribuio de Poisson; x
relao aos dados e ao mtodo que ser utilizado. O Excel possui observaes; L a mdia
ferramentas de anlise de dados com as principais tcnicas e por intervalo.
mtodos de inferncia estatstica. Neste curso vamos explorar a DIST.NORM(x; ; ;FALSO) Distribuio Normal p(x),
inferncia estatstica com funes do Excel e tambm utilizar as com mdia e desvio-
ferramentas de anlise de dados. Um resumo das principais padro . Para P(x < x0)
funes so apresentadas na Tabela Excel1 (a seguir) e na Tabela utilizar Verdadeiro
Excel2 (pgina 26). Alm das funes de Estatstica, as Funes DIST.NORMP(z) Distribuio normal padro,
de Procura e Referncia e as Funes Matemticas, so bastante P(z < z0)
utilizadas. INV.NORM(P; ; ) Para uma probabilidade P
retorna o valor de x.
O software Excel possui vrias verses, sendo que uma grande INV.NORMP(P) Para uma probabilidade P
mudana foi observada no Excel 2007 com o conceito da faixa de retorna o valor de z.
opes. Este curso foi desenvolvido com os detalhes da verso ALEATRIO() Sorteio de um nmero
do Office 2007, mas os recursos gerais podem ser utilizados nas aleatrio entre 0,0 e 1,0.
outras verses. Alguns detalhes apresentados aqui j foram ALEATRIOENTRE(N1;N2) Sorteio de um nmero
atualizados para o Excel 2010. aleatrio entre N1 e N2. O
resultado um nmero
O arquivo EstatisticaExcel.xlsm contm os vrios exemplos e inteiro.
exerccios desenvolvidos neste curso.

3
No arquivo EstatisticaExcel.xlsm considere a planilha Empresas. Grfico Ogiva
Vamos estudar como transformar os dados das empresas em Ogiva um grfico que representa frequncias acumuladas.
informaes teis para eventual tomada de deciso. Ogiva utiliza as fronteiras da classe ao longo da escala horizontal.

2.1 Histograma, Grfico de Pareto, Polgono Frequncia, Ogiva 1,2


Para construir um grfico que resuma os dados, primeiramente 1,0
devemos estudar as frequncias de ocorrncia das observaes.

Probabilidde
0,8
0,6
Histograma
0,4
Um grfico de barras (colunas) no qual a escala horizontal
0,2
contm classes e a vertical contm frequncias.
0,0

0,7 0,0 2,0 4,0 6,0 8,0 10,0

0,6 Renda (R$ 1.000,00)


Frequncia

0,5
Figura 2.4 Grfico Ogiva.
0,4
0,3 2.2 Distribuio de frequncia
0,2
0,1 Uma distribuio de frequncia a listagem dos valores dos
0 dados (individualmente ou por classes), juntamente com suas
1 2 3 4 frequncias correspondentes (ou contagens).
Renda (R$ 1.000,00)
Figura 2.1 Histograma Construo de uma distribuio de Frequncia
Nomear regies no Excel que contenham os valores a serem
Grfico de Pareto analisados uma boa prtica. Utilize a Caixa de Nome. Ou
um grfico de barras para dados qualitativos, com barras (ou selecione uma regio com os nomes na primeira linha e digite:
colunas) dispostas em ordem pela frequncia. Ctrl + Shift + F3.
45 a) Decida sobre o nmero de classes nc . Geralmente entre 5 e
40 20 (ou utilize a regra de Sturges nc = 1 + 3,3 log n ).
35
b) Calcule a amplitude de cada classe,
M v mv
Frequncia

30
25 Ac = , sendo: Ac a amplitude da classe, Mv o
20 nc
15 maior valor (arredondado para cima), mv o menor valor
10
(arredondado para baixo) e nc o nmero de classes.
5
Arredonde o resultado.
0
c) Ponto inicial do primeiro intervalo de classes: mv
d) O primeiro intervalo de classes ter o limite inferior mv e o
limite superior mv + Ac.
Figura 2.2 Grfico de Pareto. a
e) Usando Limite Superior da 1 classe e amplitude de classe,
prossiga e liste os outros limites superiores.
Polgono Frequncia f) Calcule os outros limites inferiores considerando os limites
O Polgono Frequncia utiliza segmentos de retas ligados a superiores das classes anteriores mais uma pequena
pontos localizados nos pontos mdios das classes. Veja Figura variao (Ex. 0,0000001).
2.3. g) Encontre a frequncia total para cada classe. No Excel utilize
0,7 o comando FREQNCIA(matriz_dados;matriz_bin):
0,6 I. a matriz de dados a regio com os valores da varivel
0,5 II. a matriz bin a regio com os limites superiores do
Frequncia

0,4 intervalo de classes


0,3
III. o comando digitado para a primeira classe
0,2
IV. para obter as frequncias em cada classe selecione a
0,1
coluna inteira que deseja obter a frequncia e digite a
0
tecla F2 e em seguida: [Ctrl] + [Shift] + [Enter]
0,0 2,0 4,0 6,0 8,0 10,0

Renda (R$ 1.000,00) Pode ser que a variabilidade dos dados seja muito grande (isto
Figura 2.3 Polgono Frequncia. ocorre muito em cincias sociais, em geral para dados

4
financeiros). Neste caso conveniente considerar intervalos de Desvio-padro: Uma disperso mdia dos dados em torno da
classes logartmicos. Para tanto considere o menor e o maior mdia.

(x x )
valor e calcule o LOG10 destes valores. Considere estes novos 2
valores como sendo mv e Mv. Construa os limites das classes s= = DESVPAD(...; ...; ...)
(Lim) de acordo com os passos (b) at (f). Antes de calcular a n 1
frequncia volte os valores dos limites das classes para o valor da Varincia: Tambm uma medida de disperso mdia dos dados
varivel fazendo, numa coluna, os novos limites =10^(Lim). em torno da mdia, o desvio padro ao quadrado.
Retome o item (g) e calcule as frequncias em cada classe.
(x x )
2

s 2
= = VAR(...; ...; ...)
Exerccios no Excel (EstatisticaExcel.xlsm; Planilha Aula1) n 1
2.2.1 Intervalo de classes, distribuio de frequncias. Com base Coeficiente de variao: Diferentemente das outras medidas de
nos dados de Ativo Total (AT) das empresas da planilha variao, o coeficiente de variao uma medida relativa de
Empresas, defina intervalos de classes (lineares e depois variao, expressa na forma de porcentagem.
logartmicos) e faa uma tabela com Frequncia Total, s
Frequncia Relativa, Frequncia Relativa Acumulada, em cada CV = 100 %
intervalo. Com base na tabela que melhor representa a x
distribuio, construa o grfico Polgono Frequncia e o Grfico
Ogiva. Exerccios no Excel (EstatisticaExcel.xlsm; Planilha Aula1)
2.3.2 Obtenha as medidas de variao, Amplitude, desvio-
2.2.2 Histograma e Grfico de Pareto. A planilha Frequencia, padro, varincia, coeficiente de variao, para a varivel renda
apresenta dados de clientes de uma concessionria. Construa um dos clientes da concessionria.
histograma para a varivel ND (nmero de dependentes).
Construa um grfico de Pareto para esta mesma varivel. Alguns valores de estatsticas descritivas que vimos podem ser
2.2.3 Exerccios adicionais na planilha Frequencia. obtidos para intervalos com filtros, mas devemos utilizar outra
funo, pois mesmo que o filtro seja aplicado no intervalo os
2.3 Medidas de Centro, Variao, Distribuio resultados das funes que vimos no se alteram. Para esta
Nesta seo vamos estudar como obter medidas teis de questo veja a planilha Subtotal.
estatstica descritiva.
Arquivo de recuperao EstatisticaExcel_01.xlsm
Medidas de centro: Mdia, mediana, moda
Estas so as medidas de centro mais conhecidas e que Medidas de distribuio (disperso):
geralmente atraem mais ateno, pois resumem todo o conjunto
de dados em um nico valor: Escore-z Diferena entre o valor x e a mdia aritmtica, dividida
pelo desvio-padro. Informa quantos desvios a observao x est
Media: Mdia aritmtica (x-barra) a partir da mdia dos valores.
x =MDIA(...; ...; ...) (x x)
z=
s
Mediana: Valor do meio para dados ordenados (x-til) Valores comuns observados em amostras costumam ter um
~
x =MED(...; ...; ...) escore-z entre -2 e 2, ou seja: 2 < z < 2.
Moda: Valor mais frequente Quartis Valores que divide os dados ordenados em 4 partes
M =MODO(...; ...; ...) ou MODO.NICO(...; ...; ...) =QUARTIL(Intervalo;quarto)
Exemplo: Q1 = QUARTIL(...; 1) valor que separa 25% dos dados
Exerccios no Excel (EstatisticaExcel.xlsm; Planilha Aula1) inferiores dos 75% superiores.
2.3.1 Obtenha as medidas de centro, (Mdia, Mediana e Moda)
para a varivel Renda dos clientes da concessionria (do Percentis Valores que divide os dados ordenados em 100 partes
exerccio 2.2.2). Obtenha as medidas para AT (Ex. 2.2.1) percentil k =PERCENTIL(Intervalo;k/100)
Utilize tambm a funo MDIASE: Exemplo: P68 = PERCENTIL(...; 68/100) valor que separa 68% dos
=MDIASE(intervalo condio; critrio; intervalo para mdia) dados inferiores dos 32% superiores.

Medidas de Variao: Amplitude, desvio-padro, varincia,


coeficiente de variao Exerccios no Excel (EstatisticaExcel_01.xlsm; Planilha Aula1)
2.3.3 Obtenha as medidas de distribuio: Quartis Q1, Q2 e Q3,
Amplitude: Diferena entre o maior valor e o menor valor dentre e os percentis P18, P50 , P85, para a varivel Renda dos clientes
o conjunto de dados. da concessionria. Transforme os valores obtidos para Escore-z.
A = M v mv

5
2.4 Boxplot (ou diagrama de caixa)
Boxplot um grfico com um resumo de cinco nmeros que Formate as cores de cada coluna (a de baixo fica sem cor).
fornecem uma boa descrio da distribuio dos valores. 9,0
8,0
7,0
6,0
5,0

mv Q1 ~
x Q3 Mv 4,0
3,0
2,0
Figura 2.5 Boxplot 1,0
0,0
Exerccios no Excel (EstatisticaExcel_01.xlsm; Planilha Aula1) ST=0 ST=1
2.4.1 Faa um Boxplot para a varivel renda dos clientes da
concessionria. (Boxplot no Excel no automtico) Figura 2.8 Boxplot no Excel, formatao final.

BoxPlot procedimento no Excel (A) Este procedimento s aplicado para variveis com valores
maiores ou iguais a zero. Para variveis que assumem valores
Obtenha, para cada amostra, os cinco nmeros necessrios.
negativos podemos utilizar o procedimento mais geral a seguir.
Por exemplo, nmeros para duas amostras de clientes
inadimplentes (ST=1) e adimplentes (ST=0).
BoxPlot, procedimento no Excel (B)
Obtenha valores adicionais como indicado abaixo
Vamos verificar um procedimento alternativo obter Boxplots
ST=0 ST=1
- O primeiro passo obter o resumo dos cinco nmeros na
Max 8,2 4,5
Q3 4,6 2,4
ordem indicada abaixo (diferente do procedimento anterior):
Mediana 3,8 2,1 ST=0 ST=1
Q1 3,0 1,7 Q1 3,0 1,7
Min 1,3 1,2 Min 1,3 1,2
Mediana 3,8 2,1
Erro (+): Max - Q3 3,6 2,1 Max 8,2 4,5
Q3-Mediana 0,8 0,3 Q3 4,6 2,4
Mediana-Q1 0,8 0,4 - Selecione as duas colunas com as estatsticas, incluindo os
Q1 3,0 1,7 rtulos de dados.
Erro (-): Q1-Min 1,7 0,5 - Selecione Inserir > Grfico > Linhas > Linha com marcadores.
- Sries em: Linhas (ou Alternar entre Linha/Coluna).
Selecione: Inserir > Grficos Colunas > 2D empilhadas 9,0
Alterne entre Linha/Coluna e acerte a ordem das sries 8,0
5,0 7,0
4,5
4,0
6,0
3,5 5,0
3,0
2,5 4,0
2,0 3,0
1,5
1,0 2,0
0,5
1,0
0,0
ST=0 ST=1 0,0
ST=0 ST=1
Figura 2.6 Boxplot no Excel? Grfico Colunas/Barras
- Selecione a rea de plotagem e depois:
Ferramentas de Grfico > Layout >
Na coluna de baixo [de cima] adicione barras de erros
Linhas > Linhas de mximo/mnimo
negativas [positivas]: Ferram. de grficos > Layout > Anlise >
Barras superiores/inferiores
barra de erros > mais opes >
Resultado:
(x) Menos (x) Personalizado > 9,0
valor do erro negativo [positivo] 8,0
- selecionar clulas Erro(-) [Erro(+)] 7,0
9,0 6,0
8,0
5,0
7,0
6,0 4,0
5,0 3,0
4,0
3,0
2,0
2,0 1,0
1,0
0,0
0,0
ST=0 ST=1
ST=0 ST=1

- Remova as linhas:
Figura 2.7 Boxplot no Excel: adio de barras de erros.

6
- Clique com o boto direito na linha e depois em: d. seja obtido ou uma telha ou um produto sem defeito.
Formatar sries de dados > Cor da linha > Sem linha
- Clique em outra linha de clique em [F4], (F4 repete o comando) Tabela 3.1 Resultado da produo de Tijolos e Telhas.
- Altere os smbolos de acordo com a preferncia. Produto Com defeito Sem Defeito
9,0
Tijolo 6.000 84.000
8,0
Telha 3.000 27.000
7,0
Renda (R$ 1000)

6,0
5,0
4,0
3.2 Distribuies de probabilidades - variveis discretas
3,0
Distribuio Binomial (Discreta)
2,0
1,0
Neste caso, P(x) probabilidade de se obter exatamente x
0,0
ST=0 ST=1 sucessos em n tentativas.
Figura 2.9 Boxplot a partir de grfico de Linha, serve para P(x) = DISTRBINOM(x; n ; p ;FALSO)
qualquer conjunto de dados.
x o nmero especfico de sucessos em n tentativas
Exerccios no Excel (EstatisticaExcel_01.xlsm; Planilha Aula1) n um nmero fixo de tentativas
2.4.2 Faa um Boxplot para a varivel ROA (Return On Assets) e p Probabilidade de um sucesso em uma nica tentativa
para o Ativo Total das Empresas na planilha Empresas. q Probabilidade de um fracasso eu uma nica tentativa
q=1p
Arquivo de recuperao EstatisticaExcel_02.xlsm
mdia: np
varincia: npq
3 Probabilidade
Exerccios no Excel
3.1 Introduo probabilidade 3.2.1 Se a taxa de faltas num setor , em mdia, 20% ao dia e o
setor tem 40 funcionrios, ento determine a probabilidade de
Probabilidade: um valor numrico entre zero e um que faltar num mesmo dia mais do que x funcionrios, sendo x um
representa a chance, eventualidade ou a possibilidade de que nmero de 0 a 40. O resultado o grfico apresentado na Figura
um determinado evento venha a ocorrer. 1.2 (pgina 2).
Probabilidades podem ser determinadas da seguinte maneira: Distribuio de Poisson (Discreta)
a. a priori: baseada na contagem de possveis eventos
b. de forma emprica: baseada na observao Neste caso, P(x) probabilidade de se obter x ocorrncias num
c. de forma subjetiva: estimativa que muda de pessoa para determinado intervalo (pode ser intervalo de tempo, lugar, ...)
pessoa
P(x) = POISSON(x; L ;FALSO)
Probabilidade de ocorrncia de um evento A: 0 P(A) 1
Evento complementar : P() + P(A) = 1 x o nmero de ocorrncias
Regra da adio P(A ou B) = P(A) + P(B) P(A e B) L a taxa mdia de ocorrncias por intervalo
Regra da multiplicao: P(A e B) = P(A) P(B | A)
mdia: L
Tabelas de contingncia varincia: L
Existem vrias maneiras de apresentar resultados de contagens,
um mtodo a tabela de contingncia. Uma tabela de Aplicaes: Teoria de filas; Ordens de servio
contingncia apresenta os resultados de duas variveis
categricas em tabulao cruzada. 3.2.2 Se um processo de produo de cookies est sob controle
espera-se que a o nmero mdio de gotas de chocolates por
Exerccios no Excel (EstatisticaExcel_02.xlsm; Planilha Aula1) cookie seja 6,0. Determine a probabilidade de que, numa
3.1.1 Considere a Tabela 3.1 como resultado da observao da inspeo, um determinado cookie apresente
produo de Tijolos e Telhas. Determine a probabilidade de que a. cinco ou seis gotas de chocolate;
num sorteio aleatrio b. menos de cinco gotas de chocolate;
a. seja obtido um produto com defeito c. mais de oito gotas de chocolate;
b. seja obtido um tijolo d. Quais seriam as respostas dos itens a, b e c se o nmero mdio
c. seja obtido um tijolo com defeito de gotas de chocolates por cookie fosse igual a 4,5?

7
3.3 Distribuies de probabilidades - variveis contnuas normal*, com mdia igual a 80.500 Km e um desvio-padro igual
a 19.300 Km.
Para variveis contnuas, as distribuies so densidades de a. Que proporo desses caminhes se pode esperar que viaje
probabilidades p(x). A probabilidade P definida para um entre 55.000 Km e 80.500 Km no ano?
intervalo de valores. b. Que porcentagem de caminhes pode ser esperada que viaje
abaixo de 48.000 Km ou acima de 96.500 Km no ano?
Distribuio Normal (contnua) c. Quais seriam as respostas de a e b se o desvio-padro fosse
Para a distribuio Normal: a densidade de probabilidade dada igual a 13.000 Km?
no Excel: p(x) = DIST.NORM(x; ; ;FALSO)
Sendo que: a mdia e o desvio padro * Este exerccio foi retirado de um livro texto, na prtica
distncias viajadas seguem distribuies que se desviam muito
A probabilidade determinada a partir de p(x), para uma faixa da distribuio normal. Apresentam leis de potncia.
ou regies de valores de x. por exemplo, a probabilidade de x
assumir valores menores do que um determinado valor x0 dada Arquivo de recuperao EstatisticaExcel_03.xlsm
por:
P(x < x0) = DIST.NORM(x0; ; ;VERDADEIRO) 3.4 Simulao (Nmeros aleatrios e VBA no Excel)

Considerando desvios-padro a partir da mdia obtemos A soluo de problemas gerenciais pode ser viabilizada por vrias
intervalos com reas sob a curva. A probabilidade de obter tcnicas quantitativas. A simulao uma tcnica que pode ser
valores de x em determinada regio igual a rea sob a curva empregada quando vrias outras apresentam limitaes.
nesta regio. Na Figura 3.1 apresentado um esboo da
distribuio normal, p(x), e as probabilidades, P, de se obter um Por exemplo:
valor de x entre determinados valores de desvios-padro em Determinar a probabilidade de um produto ser lucrativo de
torno da mdia. acordo com vrios cenrios;
Determinar uma quantia em estoque para que a demanda
no atendida no ultrapasse determinado percentual;
Conhecer o nmero mnimo de telefonistas para que apenas
3% das solicitaes no sejam atendidas de imediato;
Programar a produo, definir nveis de estoque, nmero de
funcionrios, planejar investimentos, ...

A base para a tcnica de simulao est no conhecimento das


probabilidades de ocorrncia de diversos cenrios.
Figura 3.1 Distribuio Normal e probabilidades.
Assim, um determinado evento pode ser simulado atravs de um
A distribuio Normal, ou Gaussiana uma das mais utilizadas na
sorteio aleatrio. O sorteio feito de acordo com as
estatstica. Os dados podem ser padronizados em termos da
probabilidades de ocorrncia de cada varivel. Realizando
mdia e do desvio-padro para que possam ser comparados aos
milhares de sorteios os diversos cenrios so revelados e uma
valores tpicos da distribuio normal.
estatstica descritiva de todas as possibilidades revela a
frequncia dos diversos cenrios.
Esta padronizao feita transformando os valores de x em
Escore-z, como o esquema abaixo.
Esta forma de realizar a simulao conhecida como Simulao
de Monte Carlo.

Exerccios no Excel (EstatisticaExcel_03.xlsm; Planilha Simulacao)


3.4.1 Utilize uma tabela de frequncia de demanda diria e a
gerao de nmeros aleatrios para simular a demanda diria.
Utilize a funo ALEATRIO() e PROCV.

Figura 3.2 Qualquer distribuio normal pode ser transformada 3.4.2 Um analista est realizando uma simulao para investigar
em distribuio normal padronizada, na qual a mdia zero e o o comportamento do lucro nos prximos 12 meses. Para tanto
desvio-padro um. ele precisa simular valores para vendas. Ele sabe que a varivel
vendas tem uma distribuio normal com mdia $ 10.000,00 e
Exerccios no Excel (EstatisticaExcel_02.xlsm; Planilha Aula1) desvio padro $ 800,00. Utilize a funo ALEATRIO() para gerar
3.3.1 Uma empresa observou que a distncia viajada por uma Probabilidade P(vendas), ou seja um nmero entre 0 e um.
caminho, a cada ano, distribuda nos moldes da distribuio Depois utilize a funo INV.NORM para obter o valor de vendas.

8
3.4.3 A indstria de confeces VP quer determinar o lucro Selection.Copy
Cells(57 + i, 16).Select
provvel de seu produto principal (cala jeans) para o prximo
ano. Aps pesquisas de mercado e anlises financeiras fez a Selection.PasteSpecial Paste:=xlPasteValues,
seguinte estimativa: Operation:=xlNone,
Preo de venda (PV): $ 25,00 por unidade SkipBlanks _:=False,
Transpose:=False
Custos e despesas fixos (CDF): $ 100.000,00. Application.CutCopyMode = False
Next i
O Lucro dado por: End Sub
Lucro = [ ( PV - CMP - CMO) x Demanda ] CDF
Sendo que Sendo que
- o custo de mo de obra (CMO) pode variar de $8,00 $12,00 - Para obter 350 simulaes o For deve ir at 350, isto obtido
por unidade de acordo com uma distribuio uniforme. atravs da clula (57,8) ou seja clula H57.
- o custo da matria prima (CMP) depende do fornecedor de - G55 neste caso o resultado de uma simulao, que muda a
acordo com uma tabela de frequncia a seguir. cada atualizao da planilha. Para outras simulaes altere este
Range para a clula correspondente (D142 na simulao 3.4.4)
Tabela 3.2: Frequncia de CMP. - Cells(57 + i, 16) indica a clula na qual os resultados sero
Fornecedor Frequncia $/Unid registrados. Linha (57 + i), Coluna 16 (ou P58, P59, ...).
A 0,1 3,00
B 0,2 4,00 3.4.4 As perdas de vendas de pneus por falta de estoque tm
C 0,4 5,00 sido constantes. Abaixo segue uma tabela de frequncias
D 0,2 6,00 observadas para a demanda diria de pneus, bem como uma
E 0,1 7,00 tabela de frequncias observadas de prazos de entrega.
- a demanda tem uma distribuio normal com mdia igual a
13.000 unidades e um desvio padro 3.800. Demanda de pneus
a. Faa uma simulao para o lucro anual Demanda diria Frequencia Observ.
b. Obtenha vrios valores para a simulao do lucro anual. (quantidade de pneus) em 300 dias
Considere a macro para copiar e colar os valores simulados 21 30
descrita no final deste exerccio. 22 60
c. Faa uma anlise estatstica descritiva destes possveis valores. 23 120
24 60
Copiar e colar resultados de simulaes utilizando MACROS. 25 30
Para criar uma macro que copie e cole um determinado valor
podemos utilizar o gravador de macros e depois inserir alguns Prazo de entrega
comandos no cdigo VBA. Prazo de entrega Frequencia Observ.
Passo 1: Verifique se a guia Desenvolvedor aparece na faixa de (dias) em 210 dias
opes do Excel. Se no aparece ento, no Excel 2010, selecione: 1 30
> Arquivo > Opes > Personalizar Faixa de Opes 2 60
(x) Desenvolvedor 3 120
Crie a macro pelo gravador de macros: Na guia Desenvolvedor:
Passo 2: Clique em Gravar macro; - Elabore um modelo de simulao da administrao de estoques
Passo 3: Copie o resultado da simulao (clula G55); para os prximos 30 dias, levando em conta os dados histricos
Passo 4: Cole Valores na clula P58; levantados.
Passo 5: Pare de gravar; - Calcule o percentual de satisfao da demanda do produto.
Passo 6: Aba o VBA e edite a macro para fazer o nmero de - Considere um estoque inicial igual a 40 unidades e o nmero de
simulaes indicadas na clula H57 pedidos a receber igual a zero.
> Desenvolvedor > Macros > NomeMacro > Editar - Sero realizados pedidos de 50 unidades sempre que o estoque
atingir um nmero de 30 unidades.
A macro final fica com o seguinte cdigo:
Sugesto: Faa a simulao de cada dia numa linha.
Sub NomeMacro() - Inicie o dia indicando qual o dia que est sendo
'
' valores Macro simulado, 1, 2, ... (col A, lin 110 da planilha Simulacao)
' - Na coluna seguinte verifique o nmero de unidades recebidas
' Atalho do teclado: Ctrl+s neste dia e na prxima coluna coloque o estoque inicial;
'
Nmaximo = Cells(57,8) - Na prxima coluna (col D) simule da demanda para este dia.
- Analise o estoque e a demanda. Na prxima coluna indique a
For i = 1 To Nmaximo demanda atendida.
Range("G55").Select

9
- Na prxima coluna indique o estoque final. Mdulo 2
- Considere uma coluna com Estoque provisionado que
indicar se j existe pedido juntamente com o estoque final. 4 Estatstica Inferencial
- Considere uma coluna com a informao se necessria ou no
a realizao do pedido. A Estatstica Inferencial utiliza padres observados em amostras
- Faa uma coluna (coluna I) com a simulao do prazo de para fazer inferncias sobre a populao que a amostra
entrega se neste dia houve pedido. representa. Estas inferncias podem ser estimativas de intervalo
- Uma coluna (coluna J) para especificar o dia de entrega. de confiana, testes de hipteses, descrio de associao entre
dados (correlao), modelagem entre os dados (anlise de
Resoluo da simulao 3.4.4 regresso).

Considere inicialmente: O Excel possui ferramentas de anlise de dados com as principais


D101 = 40; Estoque inicial tcnicas e mtodos de inferncia estatstica. Nesta aula vamos
D102 = 0; Nmero de pedidos a receber explorar a inferncia estatstica com funes do Excel e utilizar as
D104 = 50; Quantidade considerada em cada pedido ferramentas de anlise de dados.
D105 = 30; Estoque exigido para realizar pedido
E83:G87 = tabela de frequncia para simular a demanda 4.1 Amostragem
E92:G94 = tabela de frequncia para simular o prazo
A finalidade da amostragem permitir fazer inferncias e
Primeira Linha ou Dia 1 (linha 110 da planilha Simulacao): generalizaes acerca de caractersticas de uma populao com
B110 = D102 base na anlise de apenas alguns de seus elementos (CORRAR e
C110 = D101 THEPHILO, 2008).
D110 = PROCV(ALEATRIO();$E$83:$G$87;3;VERDADEIRO)
E110 = SE(D110>C110;C110;D110) Caso Oxford Cereals (OC) (LEVINE p208):
F110 = C110-E110 A Oxford Cereals abastece milhares de caixas de cereais durante
G110 = F110 um turno de oito horas. Aqui, voc responsvel por monitorar
H110 = SE(G110<=$D$105;"Sim";"No") a quantidade de cereal em cada caixa. Para serem coerentes com
I110 = SE(H110="Sim";PROCV(ALEATRIO();$E$92:$G$94;3; o contedo especificado na embalagem de cada caixa, as caixas
VERDADEIRO);"") devem conter uma mdia aritmtica de 368 gramas de cereal.
J110 = SE(H110="Sim";A110+I110;"") Em razo da velocidade do processo, a quantidade de cereal em
cada caixa varia fazendo com que algumas caixas fiquem mal
Segunda linha ou Dia 2 (linha 111) abastecidas enquanto outras hiperabastecidas. Se o processo
B111 = CONT.SE($J$110:J110;A111)*$D$104 no estiver funcionando de maneira apropriada, o peso mdio
C111 = F110+B111 das caixas pode se desviar demasiadamente do valor
G111 = G110-E111+SE(H110="Sim";$D$104;0) especificado no rtulo.
A pesagem de todas as caixas consumiria muito tempo, pode
ser extrada uma amostra de caixas. Para a amostra selecionada
Demais linhas voc planeja pesar cada caixa e calcular a mdia aritmtica para
Cpia da linha 2 com o cuidado de fixar ou no algumas clulas a amostra. preciso determinar a probabilidade de que essa
mdia tenha sido extrada aleatoriamente de uma populao
Uma vez feita a simulao para 30 dias verificar a demanda cuja mdia igual a 368 gramas.
atendida nestes 30 dias, por exemplo nas clulas D140:D142. O Com base em sua anlise voc deve decidir entre manter,
valor obtido se refere uma simulao, deve ser repetido muitas alterar ou interromper o processo.
vezes.
O processo de amostragem comea pela definio da grade.
A simulao ter sentido quando muitos resultados possveis A grade uma lista de itens que compem a populao.
forem registrados e a partir destes resultados uma analise
estatstica descritiva for realizada.
Utiliza-se n para representar o tamanho da amostra e N
para representar o tamanho da grade.
Para este problema desenvolvemos uma macro da mesma forma
da macro anterior e copiamos valores simulados.
Amostras aleatrias simples
Cada item de uma grade tem a mesma chance de ser
Veja a anlise estatstica na planilha completa. Altere valores
selecionado em comparao com cada um dos outros itens. A
para pedidos, estoque limite para pedidos...
chance de selecionar qualquer membro da grade em particular
Arquivo de recuperao EstatisticaExcel_04.xlsm
na primeira seleo 1 / N .

10
Amostragem com reposio: Depois de selecionar um Os itens selecionados mudam muito de uma amostra para
determinado item atravs de um sorteio, voc devolve este item outra, assim natural selecionarmos amostras com diferentes
para a grade onde ele passa a ter a mesma probabilidade de vir a mdias. Ou seja, temos uma distribuio de mdias para as
ser selecionado novamente. O processo de seleo repetido amostras.
at se obter o tamanho desejado da amostra, n . O erro padro da mdia aritmtica, X , igual ao desvio
padro na populao dividido pela raiz quadrada do tamanho da
EXCEL: No Excel o sorteio pode ser feito com o comando
amostra:
ALEATRIOENTRE(i;j), sendo i = nmero do item inicial e j =

nmero do item final na grade. Por exemplo, para itens X = .
numerados de 187 433, realizar uma amostra de tamanho 15 n
com reposio.
Caso Oxford Cereals (OC) (LEVINE p230):
EXCEL soluo. Em 15 clulas diferentes digite: Considerando que o desvio padro do processo de
=ALEATRIOENTRE(187;433) abastecimento de cereais seja 15 gramas, calcule o erro padro
da mdia se voc selecionar aleatoriamente uma amostra de 25
Exerccios no Excel (EstatisticaExcel_04.xlsm; Planilha Aula2) caixas sem reposio, dos milhares de caixas abastecidas durante
4.1.1 Obtenha uma amostra aleatria simples com reposio, de determinado turno.
tamanho n = 40 para uma grade de itens de 1 a 3000.
15 15
X = = = = 3 g.
Amostragem sem reposio: Uma vez selecionado um n 25 5
determinado item voc no pode selecion-lo novamente. Na
primeira seleo a chance de selecionar um determinado item A variao das mdias (para amostras de tamanho 25) bem
1 / N , na segunda seleo 1 /( N 1) e assim por diante. O menor do que a variao nas caixas individuais.
processo continua at selecionar uma amostra desejada, com
tamanho n . Se voc selecionar aleatoriamente uma amostra, que tipo de
resultado voc espera para a mdia?
EXCEL: Para realizar amostragem sem reposio necessrio
desenvolver uma macro. A planilha AmostragemSR, contm uma A mdia de todas as mdias amostrais possveis igual mdia
macro desenvolvida neste curso, para esta finalidade. da populao, chamamos esta mdia de X . Ento X = .

TEOREMA DO LIMITE CENTRAL


Mesmo que a distribuio de valores individuais na populao
no seja normal (gaussiana) a distribuio das mdias amostrais
ser descrita aproximadamente por uma normal, medida que o
tamanho da amostra fique grande o suficiente.

A partir da distribuio normal podemos encontrar a rea abaixo


de qualquer valor de x fazendo a converso para valores de Z.
EXCEL soluo. Para obter uma amostra aleatria sem
reposio informe os limites da grade nas clulas B4 e C4. Digite Assim, podemos analisar o quanto um valor especfico de mdia
o tamanho da amostra n na clula B7 de forma a no ser maior
obtido, X , est prximo ou no da mdia da populao, em
do que N (valor calculado em D4). Para executar obter a termos do erro padro amostral:
amostra digite Ctrl+t. A amostra (valores sorteados ao acaso sem
repetio) obtida na coluna F, a partir da clula F7.
X X X
Z= =
Exerccios no Excel (EstatisticaExcel_04.xlsm; Planilha Aula2) X
4.1.2 Obtenha uma amostra aleatria simples sem reposio, de
tamanho n = 40, para uma grade de itens de 1 a 3000. Utilize a n
planilha Aula2, B36:E45 para copiar os 40 valores obtidos na
planilha AmostragemSR.
Caso Oxford Cereals (OC) (LEVINE p231):
Distribuies de amostragens Se voc selecionar aleatoriamente uma amostra de 25 caixas, o
Em muitas aplicaes queremos fazer estimativas a partir de que voc acha da mdia aritmtica do peso de 25 caixas ser 200
amostras, por exemplo, estimar a mdia da populao a partir gramas? e 365 gramas? O desvio padro e mdia da populao
da mdia de uma amostra. so 15 g e 368 g respectivamente.

11
4.2 Intervalos de confiana Exerccios no Excel (EstatisticaExcel_04.xlsm; Planilha Aula2)
A inferncia estatstica o processo que utiliza resultados de 4.2.2 A partir da amostra obtida no exerccio 4.1.2 utilize os
amostras para extrair concluses sobre as caractersticas de uma valores de pesos de caixas de cereais (planilha OxfordCereals) e
populao. determine um intervalo de confiana para a mdia da populao.
Considere desconhecido o desvio padro da populao.
Suponha que no sabemos o valor da mdia da populao,
podemos a partir da mdia amostral, estimar um intervalo de 4.2.3 Refaa os exerccios 4.2.1 e 4.2.2 com as funes do Excel:
confiana para a mdia da populao. O intervalo est baseado INT.CONFIANA.NORM(alfa; desv. pad. ; tamanho)
na distribuio de mdias amostrais. O nvel de confiana est INT.CONFIANA.T(alfa; desv. pad. ; tamanho)
baseado no percentual de valores de mdias amostrais includas Estas funes fornecem o Erro estatstico a partir do nvel de
no intervalo. simbolizado por NC = (1 ) 100% , sendo confiana alfa, do desvio padro desv. pad. e do tamanho
a proporo de valores que se encontra fora do intervalo de da amostra, especificados no argumento da funo.
confiana.
Intervalo de confiana para proporo
Uma extenso de intervalo de confiana para dados categricos.
Intervalo de confiana para mdias ( conhecido)
Vamos estimar a proporo de itens que tm certa caracterstica
Quando se conhece o desvio padro da populao, o intervalo de
de interesse. A proporo desconhecida da populao
confiana para a mdia da populao dado por:
representada pela letra grega , e a proporo da amostra por
p = X / n , sendo X o nmero de itens que apresentam a
X E X +E
caracterstica de interesse e n o tamanho da amostra. A
estimativa do intervalo de confiana para a proporo da
sendo E = Z / 2 o erro de amostragem e Z / 2 valor
n populao dada por:
correspondente a uma rea acumulada de (1 / 2 ) a partir p E p+ E
da distribuio normal padronizada. O tamanho da amostra pode p(1 p)
ser estimado com base no nvel de confiana e no erro mximo: sendo E = Z / 2 .
n
2 O nmero de elementos para realizar uma amostragem pode ser
n = Z 2 / 2
E2 definido em termos do nvel de confiana e do erro mximo
o valor obtido deve ser arredondado para o nmero inteiro desejado:
acima. Quando temos uma populao finita (ou seja de (1 )
tamanho N), o tamanho da amostra para um determinado erro n = Z2 / 2
E2
ser definido por
e neste caso a expectativa da proporo da populao. Para
z2 / 2 2 N garantir uma amostra com erro mximo igual a E , utiliza-se
n=
( N 1) E 2 + z2 / 2 2 = 0,5 na expresso acima. Para uma populao finita de
e o erro definido por tamanho N, o tamanho da amostra ser definido por
N n z2 / 2 (1 ) N
E = Z / 2 n=
n N 1 ( N 1) E 2 + z2 / 2 (1 )
Exerccios no Excel (EstatisticaExcel_04.xlsm; Planilha Aula2) e o erro definido por
4.2.1 A partir da amostra obtida no exerccio 4.1.1 utilize os p(1 p) N n
valores de pesos de caixas de cereais (planilha OxfordCereals) e E = z / 2
determine um intervalo de confiana para a mdia da populao,
n N 1
sabendo que o desvio padro para a populao de caixas igual
a 15 g. Interprete o resultado obtido. Intervalo unilateral para proporo:
Ex. Para estimar taxas de no-conformidade com o controle
Intervalo de confiana para mdias ( desconhecido) interno, auditores extraem uma amostra aleatria de faturas de
Quando no se conhece o desvio padro da populao, o vendas e determinam a frequncia com que as mercadorias
intervalo de confiana para a mdia da populao dado por: foram retiradas sem uma guia de autorizao de sada de
material do almoxarifado. Comparam os resultados com uma
s s
X t / 2 X + t / 2 taxa tolervel previamente estabelecida, que corresponde a
n n proporo mxima permitida de itens na populao que esto
sendo s o desvio padro da amostra e t / 2 o valor fora dos padres de conformidade. comum utilizar um
intervalo de confiana unilateral. Ou seja, o auditor obtm a
correspondente a uma rea acumulada de (1 / 2 ) a partir proporo p de itens em no conformidade e calcula o limite
da distribuio t de Student com n 1 graus de liberdade. superior dado por

12
p (1 p ) N n
Limite superior = p + Z / 2
n N 1
onde N o nmero de elementos na populao. Caso este
limite superior seja maior do que a taxa de exceo tolervel, o
auditor conclui que a taxa de controle para no-conformidade
est demasiadamente elevada.

Exerccios no Excel (EstatisticaExcel_04.xlsm; Planilha Aula2)


4.2.4 Suponha que, em uma auditoria mensal, voc selecione
400 faturas de vendas de uma populao de 10.000 faturas.
Na amostra de 400 faturas de vendas, 20 delas esto violando o
controle interno. Caso a taxa de exceo tolervel para esse
controle interno seja 6%, o que voc deveria concluir? Utilize um
nvel de confiana de 95%.
Fig. Esquema para estabelecer concluso no teste de hipteses.
Qual o limite de violao permitidas, nesta amostra de 400
faturas de forma a no violar o controle interno?
Exerccios no Excel (EstatisticaExcel_05.xlsm; Planilha Aula2)
4.3.1-b Utilize a amostra obtida em 4.1.2 e a funo do Excel:
Arquivo de recuperao EstatisticaExcel_05.xlsm
=TESTE.Z(B48:E57;E74;15)
4.3 Testes de Hipteses
Teste t para mdias ( desconhecido)
Teste de hipteses um mtodo de inferncia estatstica. A
Estatstica teste:
partir de uma amostra procura-se examinar a validade de uma
declarao sobre um parmetro da populao que investigada. X
tteste =
s
Exerccios no Excel (EstatisticaExcel_05.xlsm; Planilha Aula2) n
4.3.1-a A Oxford Cereals deseja determinar se o processo de
abastecimento de cereais est operando adequadamente (ou tteste o valor obtido a partir da distribuio t de Student com
seja, se a mdia permanece dentro dos 368 g especificados). n 1 graus de liberdade.
Suponha que uma amostra de 25 caixas de cereais indique uma
mdia aritmtica da amostra, X igual a 372,5 g, e o desvio Teste z para proporo
padro da populao seja pressuposto como igual a 15 g. Estatstica teste:
p X n
Z teste = ou Z teste =
Procedimento para teste de hipteses (1 ) n (1 )
1 Etapa da pesquisa: Escreva a afirmativa original em smbolos
matemticos utilize =, , >, <, , . n
2 Etapa da pesquisa: Escreva o oposto da afirmativa original em sendo X o nmero de sucessos na amostra.
smbolos matemticos.
3 Etapa estatstica: A hiptese nula, H0, (entre 1 e 2) a Testes para duas amostras
afirmativa que contm a igualdade, mas utilize somente o
smbolo de igual para H0. Nesta etapa estendemos o teste de hipteses para
4 Etapa estatstica: A hiptese alternativa H1, a outra. procedimentos que comparam estatsticas oriundas de duas
5 Etapa estatstica: Calcule a Estatstica teste e determine o amostras, extradas de duas populaes.
valor-P (P-value): Probabilidade associada estatstica teste.
6 Etapa estatstica: Se valor-P < rejeite H0; caso contrrio, no Caso BLK Alimentos (BLK) (LEVINE p324):
rejeite H0. O tipo de disposio de mercadorias utilizado em um
7 Etapa da pesquisa: Retome a afirmativa original e estabelea supermercado afeta as vendas dos produtos? Voc deseja
uma concluso. comparar o volume de vendas de refrigerantes da marca BLK
Testes para uma amostra quando o produto exposto em uma localizao normal de
prateleira com o volume de vendas quando o produto exposto
Teste z para mdias ( conhecido) em posies especiais de ponta de corredor. Para testar a
Estatstica teste: eficcia da exposio em ponta de corredor voc seleciona 20
X filiais da cadeia de supermercados que apresentam volumes de
Z teste = vendas similares. Depois designa aleatoriamente 10 dentre as 20
para um grupo (grupo 1) e as outras 10 para outro grupo (grupo
n 2). Os gerentes das 10 lojas do grupo 2 passam a utilizar a

13
exposio em locais especiais em ponta de corredor. Ao final de nos dois tipos de teste de direo. Determine se existe alguma
uma semana so registradas as vendas do refrigerante da marca diferena entre a mdia da milhagem de combustvel de acordo
BLK. De que modo voc determinaria se as vendas do com os dois tipos de testes de direo. Utilize os dados de milhas
refrigerante BLK nas lojas que fizeram uso da exposio por galo na planilha Aula2, clula B129.
promocional de ponta de corredor so iguais quelas ocorridas
quando o refrigerante exposto em prateleiras com localizao Os testes de hipteses tambm esto disponibilizados na anlise
regular? Como utilizar esta informao para incrementar as de dados do Excel. Para habilitar a anlise de dados:
vendas dos refrigerantes BLK? Arquivos > Opes > Suplementos
Suplementos do Excel [ ir ]
Teste t de varincia agrupada para a diferena entre duas [ x ] Ferramentas de Anlise
mdias (populaes independentes) [ x ] Solver
Hipteses: H0: 1 = 2 ou 1 2 = 0 Com isto a faixa de opes exibe, na aba Dados a categoria
Anlise com as opes Anlise de Dados e Solver.
H1: 1 2 ou 1 2 0
Estatstica teste: Arquivo de recuperao EstatisticaExcel_06.xlsm

tteste =
(X 1 X 2 ) (1 2 )
Exerccios adicionais (na planilha Aula2, clula A147)
1 1
s +
2
p
n1 n2 4.2.5 (LEVINE 8.78) Um auditor precisa estimar a percentagem
de vezes em que a empresa deixa de seguir um procedimento de
(n1 1) s12 + (n2 1) s22 controle interno. selecionada uma amostra de tamanho 50, de
sendo s = e gl = n1 + n2 2 .
2
p
(n1 1) + (n2 1) uma populao de 1000 itens, e em sete casos o procedimento
de controle interno no foi seguido.
No Excel obtenha diretamente o valor-P para este teste:
a. Construa uma estimativa para o intervalo de confiana
=TESTE.T(Dados1;Dados2; 2 opo bi-caudal; 2 tipo de teste)
unilateral de 90% correspondente proporo da populao
de itens na qual o procedimento de controle interno no foi
Exerccios no Excel (EstatisticaExcel_05.xlsm; Planilha Aula2)
seguido.
4.3.2 Caso BLK: Uma amostra com volumes de vendas semanais
b. Se a taxa de exceo tolervel for 0,15, o que o auditor deve
de refrigerantes BLK a partir de 10 filiais que utilizam exposio
concluir?
em prateleiras regulares. Outra amostra a partir de 10 filiais que
4.2.6 (LEVINE 8.80) Uma loja que vende mveis de quarto est
utilizam exposio em pontas de corredor. Teste a afirmativa de
realizando um inventrio de artigos para cama (colches,
que as vendas semanais de refrigerantes BLK a mesma quando
estratos de molas e estruturas) em estoque. Uma auditora da
utilizada uma localizao regular e quando utilizada uma
loja deseja estimar a mdia aritmtica do valor das camas em
localizao em ponta de prateleira. Os registros de volumes de
estoque naquele momento. Ela deseja ter 99% de confiana de
vendas esto no arquivo Excel.
que sua estimativa para a mdia aritmtica do valor est correta,
dentro dos limites de $100. Com base em experincias
Teste t em pares (populaes dependentes)
passadas, ela estima que o desvio-padro para o valor de uma
Hipteses: H0: D = 0 , onde D = 1 2 cama seja igual a $200,00.
H1: D 0 a. Que tamanho de amostra ela deve selecionar?
Estatstica teste: b. Utilizando o tamanho de amostra selecionado em (a), uma
auditoria foi conduzida, com os seguintes resultados:
D D
tteste = x = $1654,27 S = $184,62
sD
Construa uma estimativa para o intervalo de confiana de 99%
n do valor total das camas em estoque ao final do ms, no caso de
sendo D a mdia das n diferenas observadas e s D o desvio existirem 258 camas em estoque.
padro das n diferenas observadas.
4.2.7 LEVINE (8.81) Uma caracterstica importante da qualidade
No Excel obtenha diretamente o valor-P para este teste:
em um processo de enchimento de saquinhos de ch o peso do
=TESTE.T(Dados1;Dados2; 2 opo bi-caudal; 1 tipo de teste)
ch em cada saquinho. Neste exemplo, o peso no rtulo da
embalagem indica que a mdia aritmtica da quantidade
Exerccios no Excel (EstatisticaExcel_05.xlsm; Planilha Aula2)
correspondente a 5,5 gramas de ch em um saquinho. Se os
4.3.3 A Associao Automobilstica da Amrica (AAA) conduziu
saquinhos tiverem seu peso inferior ao especificado, surgem dois
um teste de milhagem para comparar a milhagem de
problemas. Em primeiro lugar, os consumidores podem no
combustvel em testes de direo realizados por membros da
conseguir que o ch fique to forte quanto desejam. Em segundo
AAA na vida real com testes de direo feitos na cidade e em
lugar, a empresa pode estar violando normas de peso e medidas.
auto-estradas conforme o padro do governo. So obtidos
Por outro lado, se a mdia aritmtica da quantidade de ch em
resultados, para um mesmo carro, da milhagem de combustvel

14
um saquinho exceder o peso especifico no rtulo, a empresa 36,15 31,00 35,05 40,25 33,75 43,00
estar desperdiando produto. Conseguir uma quantidade exata a. Utilizando o nvel de significncia de 0,05, existem evidncias
de ch em cada saquinho uma questo problemtica, em razo de que a mdia aritmtica do preo seja diferente de $35,00?
da variao da temperatura e da umidade dentro da fbrica, de b. Determine o valor-P e interprete o seu significado.
diferenas na densidade do ch e da operao extremamente c. Qual pressuposto sobre a distribuio da populao
rpida de abastecimento da mquina (aproximadamente 170 necessrio em (a) e (b)
saquinhos por minuto). Os dados a seguir correspondem aos d. Voc acredita que o pressuposto declarado em (c) est sendo
pesos, em gramas, de uma amostra de 50 saquinhos de ch seriamente violado?
produzidos em uma hora por uma nica mquina:
5,65 5,44 5,42 5,40 5,53 5,34 5,54 4.3.7 (LEVINE 9.60) Os dados a seguir representam a quantidade
5,45 5,52 5,41 5,57 5,40 5,53 5,54 de refrigerante abastecido em uma amostra de 50 garrafas de
5,55 5,62 5,56 5,46 5,44 5,51 5,47 dois litros consecutivas. Os resultados, apresentados
5,40 5,47 5,61 5,53 5,32 5,67 5,29 horizontalmente na ordem em que as garrafas esto sendo
5,49 5,55 5,77 5,57 5,42 5,58 5,58 abastecidas, foram (em litros):
5,50 5,32 5,5 5,53 5,58 5,61 5,45 2,109 2,086 2,066 2,075 2,065 2,057 2,052
5,44 5,25 5,56 5,63 5,50 5,57 5,67 2,044 2,036 2,038 2,031 2,029 2,025 2,029
5,36 2,023 2,020 2,015 2,014 2,013 2,014 2,012
a. Construa uma estimativa para o intervalo de confiana de 2,012 2,012 2,012 2,005 2,003 1,999 1,996
99% para a mdia aritmtica da populao relativa ao peso 1,997 1,992 1,994 1,986 1,984 1,984 1,973
dos saquinhos de ch. 1,975 1,971 1,969 1,966 1,967 1,963 1,957
b. A empresa est atendendo aos requisitos estabelecidos no 1,951 1,951 1,947 1,941 1,941 1,938 1,908
rtulo, de que a mdia aritmtica da quantidade de ch em 1,894
um saquinho igual a 5,5 gramas?
a. no nvel de significncia de 0,05, existem evidncias de que a
4.3.4 (LEVINE 9.55) Um artigo declarou que uma ida tpica a um mdia aritmtica da quantidade de refrigerante abastecida
supermercado leva uma mdia aritmtica de 22 minutos. seja diferente de 2 litros?
Suponha que, para testar essa afirmativa, voc selecione uma b. Determine o valor-P em (a) e interprete o seu significado.
amostra de 50 consumidores em um supermercado local. A
mdia aritmtica do tempo de compra para uma amostra de 50
consumidores de 25,36 minutos, com um desvio-padro de
7,24 minutos. Utilizando o nvel de significncia de 0,1, existem
evidncias de que a mdia aritmtica do tempo de compra no
supermercado seja diferente do valor alegado de 22 minutos? 5 Anlise Multivariada de Dados

4.3.5 (LEVINE 9.57) Um fabricante de chocolate utiliza mquinas 5.1 Introduo anlise multivariada de dados
para embalar as barras medida que elas se movimentam ao A anlise multivariada refere-se a mtodos estatsticos que
longo de uma linha de produo. Embora as embalagens tornam possvel a anlise simultnea de medidas mltiplas para
apresentem no rtulo 227 gramas, a empresa deseja que as cada indivduo (CORRAR, PAULO, DIAS FILHO, 2007).
embalagens contenham 232 gramas, de modo tal que Anlise multivariada de dados uma extenso natural das
efetivamente nenhuma das embalagens contenha menos de 232 anlises univariadas e bivariadas. A anlise multivariada
gramas. Uma amostra de 50 embalagens selecionada utilizada para estudar modelos em que todas as variveis sejam
periodicamente, e o processo de embalagem interrompido aleatrias e inter-relacionadas, de modo que seus diferentes
caso existam evidncias de que a mdia aritmtica da efeitos no possam ser interpretados de forma separada
quantidade embalada seja diferente de 232 gramas. Suponha (FAVERO et. al. 2009).
que em uma determinada amostra com 50 embalagens a mdia
aritmtica da quantidade contida seja 231,3 gramas, com um Qualquer procedimento para anlise de dados depende de
desvio-padro amostral igual a 1,45 gramas. pelo menos quatro definies iniciais:
a. Existem evidncias de que a mdia aritmtica da populao Nmero de variveis a serem analisadas ao mesmo tempo
seja diferente de 232 gramas? (Utilize um nvel de Nvel de mensurao das variveis de interesse. As variveis
significncia de 0,05). podem ser mtricas (quantitativas) ou no-mtricas
b. Determine o valor-P e interprete o seu significado. (qualitativas)
Interesse descritivo ou inferencial da anlise. Mdias,
4.3.6 (LEVINE 9.58) Considerando uma amostra (feita em seis frequncias, disperso, testes de hipteses.
cadeias de cinemas) de preos (em dlares) para dois ingressos, Interesse na inter-relao ou relao de dependncia das
includa a taxa de servios de emisso pela Internet, uma variveis em estudo. Exemplos tcnicas de inter-relao:
embalagem grande de pipocas e dois refrigerantes mdios, os anlise de agrupamentos, fatorial, escalonamento
resultados obtidos foram

15
multidimensional. Exemplos de tcnicas de dependncia: deseja maximizar o efeito dos seus planos de marketing. Em
regresso linear e no linear, discriminante, regresso particular, precisa saber o efeito que o preo e as promoes
logstica, anlise de sobrevivncia. internas da loja tero sobre as vendas de OmniPower. Trata-se
de uma anlise multivariada.
A base para a anlise multivariada de dados est na
correlao entre variveis e/ou observaes. Desta forma, no Exerccio no Excel
prximo tpico estudamos correlaes entre variveis e algumas 5.2.2 Considere uma amostra de 34 lojas para um estudo de
aplicaes. teste de mercado para a barra OmniPower. Veja na planilha
AnaliseMultivariada as variveis volume de vendas, preo de
5.2 Correlao uma barra medido em centavos e o oramento mensal para
A anlise de correlao investiga a relao entre duas despesas com promoes internas da loja. Determine uma
populaes de duas ou mais variveis. Assim, existe uma matriz de correlao e analise os valores dos coeficientes de
correlao entre duas variveis quando uma delas est correlao linear de Pearson para cada par de variveis.
relacionada com a outra de alguma maneira. Utilize tambm a ferramenta de anlise de dados.

Coeficiente de correlao linear de Pearson 5.3 Covarincia


A correlao linear entre duas variveis pode ser expressa A covarincia tambm uma medida da fora de uma relao
numericamente atravs do coeficiente de correlao linear de linear entre duas variveis numricas ( X e Y ). A covarincia da
Pearson, r . Considerando duas variveis, x e y , o coeficiente amostra dada por
de correlao de Pearson dado por:
(X X )(Yi Y )
n

n( xy ) ( x )( y ) cov( X , Y ) = s X ,Y = i =1
.
r= n 1
( ) ( )
[n x 2 ( x ) ] [n y 2 ( y ) ]
2 2
No Excel: =COVARIAO.S(valores_x; valores_y)

A covarincia para Y = X a varincia de X , ou seja s X2 .


sendo n o nmero de pares de observaes na amostra
analisada. No Excel: = VAR.A(valores_x)

No Excel: r = PEARSON(valores_x;valores_y) O valor da covarincia tem uma deficincia como medida da


r = CORREL(valores_x;valores_y) relao linear entre duas variveis. Como ela pode assumir
qualquer valor, fica difcil de fazer comparaes. Para
Para a populao o coeficiente denominado (rho). comparaes melhor utilizar o coeficiente de correlao de
Pearson, que uma covarincia com valores entre -1 e 1.
O coeficiente de correlao de Pearson pode assumir valores de -
Porm, a covarincia tem aplicaes em anlise de risco e
1 +1. Quando r se aproxima de -1 ou +1 a relao linear entre
retorno de aes. Considere X e Y como retorno de aes, se
as variveis numricas passa a ser mais forte. Prximo de zero a
relao linear fraca. O sinal indica se as variveis esto quando X estiver abaixo (acima) da mdia Y tambm estiver
positivamente correlacionadas (maiores valores de x ento a covarincia ser positiva. Se quando X estiver abaixo
geralmente fazem par com maiores valores de y ), ou (acima) da mdia Y estiver acima (abaixo) da mdia ento a
negativamente correlacionadas (maiores valores de x covarincia ser negativa.
geralmente fazem par com menores valores de y ). A existncia
Matriz de Covarincia
de forte correlao no implica um efeito de causalidade. Indica
somente tendncias nos dados. Exerccio no Excel
5.3.1 Considere uma amostra Taxas de retorno trimestral de
Exerccios Excel (EstatisticaExcel_06.xlsm; AnaliseMultivariada) quatro ttulos, planilha AnaliseMultivariada. Calcule uma matriz
5.2.1 Considere os dados do exerccio 4.3.3. Calcule o coeficiente de Covarincia
de correlao r para analisar a correlao entre a milhagem 2
S RA S RA, RB S RA, RC S RA, RD
calculada pelos proprietrios e a milhagem de acordo com os 2
padres do governo americano.
~ S S RB S RB , RC S RB, RD
COV = RB, RA 2
S RC , RA S RC , RB S RC S RC , RD
2
Matriz de Correlao S RD, RA S RD, RB S RD, RC S RD
Observe os elementos da matriz.
Caso Omni Foods (LEVINE p499):
A Omni Foods, uma empresa de produtos alimentcios, planeja Risco de uma carteira de aes (Modelo de Markowitz)
lanar uma nova barra energtica a OmniPower. O mercado j
contm diversas barras de sucesso, o gerente de marketing O Risco da Carteira dado pelo valor esperado da varincia.

16
Coeficiente linear, Coeficiente Angular (beta)
O retorno mdio de cada investimento pode ser agrupado numa O intercepto b0 o coeficiente linear, no Excel obtido
matriz de retornos:
~ atravs da funo INTERCEPO:
R = R1 R2 R3 R4
b0 = INTERCEPO(valores_y; valores_x)
Da mesma forma as participaes em cada investimento podem
ser escritas como uma matriz: A inclinao b1 o coeficiente angular (beta). No Excel
~ obtido atravs da funo INCLINAO:
P = p1 p2 p3 p4
b1 = INCLINAO(valores_y; valores_x)
Exerccio no Excel
5.3.2 Considere a matriz de covarincia obtida em 5.3.1 e Coeficiente de determinao R
2

determine o Retorno Esperado definido como Uma medida que informa a qualidade do modelo o
~~
R( E ) = R P T 2
coeficiente de determinao, o R . numericamente igual ao
e a Varincia da Carteira, definida por: quadrado do coeficiente de correlao de Pearson. Quanto mais
~ ~ ~
VarCart = P COV P T prximo de 1 melhor o modelo.
Altere os valores da matriz de participaes e observe o valor da
varincia da carteira.
Funo Excel: =MATRIZ.MULT(matriz_A;matriz_B) Ferramentas de Anlise de Dados no Excel:
Entre as ferramentas estatsticas disponveis no Excel temos a
Para completar o comando de Matriz no Excel, selecione as anlise de regresso. Lembre, para utiliz-las devemos habilitar
clulas para obter a resposta (matriz inteira) e digite: os suplementos de Ferramentas de Anlise. Para o Excel 2007:
[F2] e depois [ctrl]+[Shift]+[Enter] Clique no Boto do Office (localizado na parte superior
esquerda da planilha);
Clique em Opes do Excel;
5.4 Anlise de Regresso Clique em suplementos;
Clique em [ir] no campo Gerenciar [suplementos do Excel]
A anlise de regresso possibilita desenvolver um modelo para Selecione a ferramenta de anlise.
prever valores de uma varivel numrica com base em valores de
outras variveis.

Na regresso a varivel que se deseja prever chamada varivel


dependente. As variveis utilizadas para fazer a previso so
chamadas variveis independentes.

Arquivo de recuperao EstatisticaExcel_07.xlsm

Regresso Linear Simples

Exerccios Excel (EstatisticaExcel_07.xlsm; AnaliseMultivariada)


5.4.1 Examine a relao entre tamanho de uma loja e as vendas A aba Dados da faixa de opes apresenta a categoria de
anuais com base numa amostra de 14 lojas filiais da Sunflowers Anlise, com os suplementos selecionados.
Roupas. Faa um diagrama de disperso para analisar
visualmente uma possvel relao linear entre os dados. Calcule
o coeficiente de correlao de Pearson. Desenvolva um modelo
de regresso linear simples, utilize os conceitos a seguir.

Equao da Reta Clique em Anlise de Dados para acessar as ferramentas de


O valor previsto de Y igual ao intercepto de Y somado anlise disponibilizadas.
inclinao vezes o valor de X :
A seguir so indicadas as ferramentas estatsticas que podem ser
Y = b0 + b1 X , utilizadas para o contedo visto at este ponto.
b0 o intercepto e b1 a inclinao.
Descriptive Statistics: Centro, Variao, Intervalo de Confiana
A previso
Histogram (Histograma): Distribuio.
A forma mais rpida de se obter um valor previsto
Rank and Percentile (Rank e Percentil): Medidas de posio
utilizando a funo PREVISO(X; DadosY;DadosX)
relativa.

17
Random Number Generator (Gerador de nmeros aleatrios): Regresso no Linear
Simulao, Amostragem com reposio.
Sampling (Amostragem): Amostragem com reposio. Atravs de um diagrama de disperso podemos visualizar se a
t-Test: Two-Sample Assuming Equal Variances: Teste t de relao entre duas variveis pode ser ajustada por um modelo
varincia agrupada para a diferena entre duas mdias linear ( Y = b0 + b1 X ) ou se existe indcios de no-linearidade,
(populaes independentes)
t-Test: Paired Two-Sample for Means: Teste t em pares ou seja, outro tipo de funo diferente da linear.
(populaes dependentes)
Considere os dados de volume de venda ( v ) e gastos com
Correlation (correlao): Matriz de correlao de Pearson.
Covariance (covarincia): Matriz de covarincia. propaganda ( p ) registrados nos ltimos anos, informados na
Regression (regresso): Regresso linear simples e mltipla. tabela abaixo.

Anos Gastos com Volume de


propaganda (p) vendas (v)
O quadro a seguir apresenta as ferramentas de anlise ($ 1.000,00) (1.000 un.)
disponveis.
1 7,0 7,0
2 6,0 5,0
3 4,5 3,0
4 3,0 1,5
5 2,0 1,0
6 1,0 0,5
7 8,0 7,0
8 8,0 9,0

Exerccios Excel (EstatisticaExcel_07.xlsm; AnaliseMultivariada)


5.4.3 Faa um diagrama de disperso para os dados informados
na tabela acima. Atravs do ajuste de linha de tendncia
obtenha uma regresso linear e informe o coeficiente de
2
determinao R . Explore outras formas funcionais
disponibilizadas no Excel conforme a figura abaixo. Para cada
2
tipo de tendncia informe o coeficiente de determinao R .

Exerccios Excel (EstatisticaExcel_07.xlsm; AnaliseMultivariada)


5.4.2 Considere, para um determinado produto, os dados de
preos e quantidades vendidas em vrios anos conforme a tabela
abaixo.

Encontre a funo linear que melhor se ajusta aos dados ou seja


os valores de b0 e de b1 para o caso 5.4.2.
Faa uma previso para quantidade (Q) quando o preo (P) for
igual a 3,5.

18
Regresso Linear Mltipla Como resultado o Excel Fornece todos os coeficientes da funo
linear que relaciona as variveis ALOPER, ALFIN, LUPRE, MARVEN
Quando o problema apresentado tem por objetivo prever uma e RENTAT com a varivel dependente RENTPL:
varivel dependente a partir do conhecimento de mais de uma
varivel independente, a tcnica estatstica denominada No Resumo dos resultados temos o quadro abaixo, no qual pode
2
Regresso Mltipla. ser visto que o modelo tem um R ajustado igual a 0,8005. Ou
Considerando n variveis independentes, a varivel dependente seja, variaes de ALOPER, ALFIN, LUPRE, MARVEN e RENTAT
escrita como uma funo linear das outras variveis da conseguem explicar 80,05% das variaes de RENTPL.
seguinte forma: Estatstica de regresso
Y = b0 + b1 X 1 + b2 X 2 + b3 X 3 + ... + bn X n R mltiplo 0,8966
A anlise de regresso mltipla realiza estimativas das R-Quadrado 0,8039
R-quadrado ajustado 0,8005
constantes bi s.
Erro padro 8,4374
Observaes 297
Como visto na pgina anterior, existe no Excel a ferramenta
Regresso, nas opes de ferramentas de anlise de dados,
Ainda, no quadro abaixo obtemos os coeficientes (betas) da
utilize esta ferramenta de anlise para o exerccio que segue.
regresso. As variveis ALOPER e ALFIN apresentaram baixo
poder de explicao (o valor-P alto), no devem ser
Exerccios Excel (EstatisticaExcel_07.xlsm; AnaliseMultivariada)
consideradas no modelo.
5.4.4 Uma base de dados extrada da revista EXAME 500
Coeficientes Erro padro Stat t valor-P
Melhores & Maiores de 2001 contm indicadores financeiros de
Interseo 1,63928 0,975 1,682 0,094
referentes a empresas brasileiras de diversos setores
ALOPER -0,01153 0,046 -0,252 0,801
econmicos. Considere na planilha Indicadores as seguintes
variveis: ALFIN -0,02955 0,089 -0,334 0,739
LUPRE -3,66001 1,079 -3,391 0,001
RENTAT (Rentabilidade do Ativo)
MARVEN -5,79801 0,669 -8,668 0,000
RENTPL (Rentabilidade do Patrimnio Lquido)
RENTAT 28,42287 0,887 32,028 0,000
ALOPER (Alavancagem Operacional)
MARVEN (Margem Lquida de Vendas)
Arquivo de recuperao EstatisticaExcel_08.xlsm
ALFIN (Alavancagem Financeira)
LUPRE (Lucro = 1 ou Prejuzo = 0)
Mdulo 3
O exerccio consiste em testar estatisticamente as relaes de
anlise de rentabilidade. A amostra contm 297 observaes
6 Anlise de Sries Temporais
vlidas.
- Correlao: Analise a matriz de correlao linear de Pearson.
Sries temporais so formadas por dados registrados ao longo
- Regresso Linear Mltipla: Considere a RENTPL como sendo a
do tempo.
varivel dependente e escreva a equao que relaciona RENTPL
com as outras variveis.
Atravs da anlise de sries temporais estudamos tendncias,
variaes sazonais, variaes cclicas, ... Nesta reviso vamos
Comece pela planilha Indicadores:
estudar diferentes modelos de previso; analisar como escolher
Analise a correlao entre os dados
o modelo de previso mais apropriado; estudar ndices de
Obtenha a matriz de correlao na clula B119 da planilha
preos.
AnaliseMultivariada
Formate a matriz obtida. Utilize recursos da categoria Estilo, na
Existem muitos modelos matemticos para estudo de sries
aba Pgina Inicial, Ex. Formatao condicional.
temporais. Talvez o mais fundamental seja o modelo clssico
multiplicativo que identifica fatores de tendncia, variaes
Obtenha um modelo de Regresso Linear para explicar RENTPL
sazonais, cclicas e irregulares.
- Selecione a aba Dados e na categoria Anlise de Dados
Escolha: Regresso
Componentes de uma srie temporal:
- Para Intervalo Y: Escolha a varivel RENTPL
Tendncia (T): Movimento geral, ascendente ou descendente, de
- Para Intervalo X: Escolha as variveis:
longo prazo.
ALOPER; ALFIN; LUPRE; MARVEN; RENTAT
Componente Cclico (C): Oscilaes peridicas ao longo da srie,
(Escolha a partir da linha com rtulos)
geralmente de 2 a 10 anos. Correlacionado ao ciclo do negcio.
- Marque [x] Rtulos na primeira linha
Componente Irregular (I): Dados que no seguem a tendncia
- Intervalo de sada, na planilha AnaliseMultivariada, escolha a
modificada pelo componente cclico so considerados aleatrios
clula B128.
ou irregulares.

19
Componente Sazonal (S): Quando os dados so mensais ou Ano Receitas $bi t Ano t Receitas $bi
trimestrais as oscilaes tm perodo mais curto de acordo com 1975 0 2,9
data no ano. 1976 1 3,1 1991 16 11,6
1977 2 3,6 1992 17 13,0
Modelo Clssico multiplicativo 1978 3 4,3 1993 18 14,0
1979 4 4,5 1994 19 16,2
Yi = Ti Si Ci I i 1980 5 5,3 1995 20 18,0
1981 6 5,5 1996 21 18,5
6.1 Ajuste de srie temporal 1982 7 5,9 1997 22 18,9
1983 8 6,6 1998 23 18,8
O primeiro passo em uma anlise de sries temporais desenhar 1984 9 7,2 1999 24 19,8
o grfico para os dados e observar quaisquer padres que 1985 10 7,9 2000 25 20,5
ocorram ao longo do tempo. 1986 11 7,0 2001 26 20,1
1987 12 7,7 2002 27 19,6
Ajuste de uma srie temporal anual 1988 13 8,3 2003 28 21,0
1989 14 9,0 2004 29 21,9
Considere os valores de receita operacionais lquidas anuais (em 1990 15 10,2 2005 30 23,1
bilhes de dlares) da Coca-Cola Company de 1975 a 2005 1991
Tabela 16 Coca-Cola 11,6
6.1 Company: Receitas Operacionais Lquidas
(LEVINE et al. 2008) apresentados na Tabela 6.1. Os anos foram anuais em bilhes de dlares.
codificados de forma que t = 0 corresponde ao ano 1975. O
grfico de srie temporal pode ser obtido no Excel pelo grfico
de disperso de dados com linhas retas e marcadores. O eixo x
25,0
o tempo (que pode ser codificado ou no).
20,0
Uma anlise grfica (veja Figura 6.1) revela que os valores
Receita ($ bi)

15,0
apresentam uma tendncia ascendente. Tambm apresentam
variaes cclicas e variaes irregulares. Vamos estudar alguns 10,0
modelos de ajustes de tendncias: Mdias mveis, Tendncias
Linear, Quadrtica, Exponencial. Pretende-se descrever a srie 5,0
atravs de um modelo matemtico, onde, a partir de valores
0,0
observados Yi fazemos estimativas (ou ajustes) Yi . 0 5 10 15 20 25 30
Ano (codificado)

Mdias mveis Figura 6.1 Coca-Cola Company: Receitas Operacionais Lquidas


Mdias mveis para um perodo L consistem em uma srie de anuais em bilhes de dlares.
mdias calculadas ao longo do tempo para uma sequncia de L
valores observados. So representadas pelo smbolo MM(L). Por
exemplo, para uma srie como a da Tabela 6.1 com 31 anos, o Assim, ao invs de chamar a estimativa final de Y28 a chamamos
ajuste MM (5) ou estimativas, so dadas por de Y30 , mas o valor o mesmo. Podemos assim verificar se o
Y + Y + Y3 + Y4 + Y5 valor atual (real da srie) est acima ou abaixo da mdia dos
Y3 = 1 2
5 ltimos perodos, ou ainda, podemos analisar datas nas quais
Y + Y + Y4 + Y5 + Y6 ocorrem inverses.
Y4 = 2 3
5
Y + Y + Y5 + Y6 + Y7
Exerccios Excel (EstatisticaExcel_08.xlsm; A3Series)
Y5 = 3 4
6.1.1 Considere os valores da Tabela 6.1
5
(a) faa um ajuste de mdia mvel MM (5) .
M
Y + Y27 + Y28 + Y29 + Y30 (b) faa um ajuste de mdia mvel MM (9) .
Y28 = 26 (c) faa grficos com os resultados.
5
Cada estimativa escrita como Yi , sendo i um ndice que
Ajuste Exponencial
representa o perodo para o qual a estimativa est sendo A equao desenvolvida para ajustar exponencialmente uma
realizada. Na forma como descrito anteriormente, obtemos uma srie em qualquer perodo de tempo, i, baseada somente em
srie que suaviza as variaes aleatrias bruscas permitindo
trs termos o valor corrente na srie temporal, Yi ; o valor
observar variaes cclicas e tendncia. Mas o ajuste de MM
pode ser til para realizar comparaes, basta considerar que o exponencialmente ajustado calculado anteriormente, Ei 1 ; e um
clculo representa estimativa para o perodo atual. peso atribudo, ou coeficiente de ajuste, W . O ajuste

20
exponencial chamado E (W ) e o valor da srie ajustada, para n

um tempo i, dado por: Y i Yi


DMA = i =1
Ei = WYi + (1 W ) Ei1 i =2, 3, 4, ... n
E1 = Y1 . Obtenha esta grandeza para as sries apresentadas na planilha
em comparao com os ajustes e modelos.
O coeficiente de ajuste W assume valores entre 0 e 1. Para W
Observe as sries temporais na planilha A3Series do arquivo
pequeno, o ajuste considera peso maior para observaes
EstatisticaExcel.xlsx. Verifique a anlise de componentes da srie
passadas e para W prximo a 1 as observaes recentes
a partir da linha 66.
recebem maior peso.
Componente Tendncia: Altere o valor de F67 e observe o efeito
da tendncia. O valor corresponde inclinao. Por exemplo,
Exerccios Excel (EstatisticaExcel_08.xlsm; A3Series)
digite 2.
6.1.2 Faa um ajuste exponencial na srie de receitas da
Componente Cclica: Altere o valor de F69 e observe a variao
empresa Cabot Corporation (Figura 6.2). Veja arquivo Excel
Cclica dada por uma funo seno. O perodo dado em F70.
EstatisticaExcel.xlsx, planilha A3Series, linha 38.
Componente Sazonal: Tem a mesma forma da cclica, mas com
perodos menores.
2500
Componente Irregular: Adicione uma amplitude aleatria
alterando o valor em F75.
2000

Sugesto de sries:
Receita ($ bi)

1500
Clula Incio Srie1 Srie2 Srie3
1000 F67 0 2 10 5
F69 0 20 20 50
500
F70 40 40 40 40
0 F72 0 10 20 20
1980 1985 1990 1995 2000 2005 F73 4 4 4 4
Ano (codificado) F75 0 15 30 100
Figura 6.2 Cabot Corporation: Receitas em bilhes de dlares. 500,0
450,0
Modelo de tendncia Linear, Quadrtica, Exponencial 400,0
O fator mais frequentemente estudado em uma srie temporal 350,0
Receita ($ bi)

a tendncia. O intuito realizar projees de mdio e longo 300,0


prazos. O mtodo mais aplicado o de mnimos quadrados. O 250,0
Excel possui uma ferramenta com os principais modelos. 200,0
150,0
Modelo de tendncia linear: Yi = 0 + 1 X i 100,0
Modelo de tendncia quadrtica: Yi = 0 + 1 X i + 2 X i2 50,0
0,0
Modelo de tendncia exponencial: Yi = 0 1 i
X
0 5 10 15 20 25 30 35 40

Neste modelo exponencial ( 1 1) 100% a taxa de Trimestre

crescimento anual composta (em %).

Exerccios Excel (EstatisticaExcel_08.xlsm; A3Series)


6.1.3 Desenvolva modelos de tendncia (linear, quadrtica e
6.2 Anlise de sries para dados sazonais
exponencial) para a srie de receitas da Coca-Cola Company
Inmeras sries temporais so coletadas trimestralmente ou
(Tabela 6.1). Utilize a linha de tendncia do Excel, e verifique
2 mensalmente. Ou ainda semanalmente, diariamente e de hora
qual modelo se ajusta melhor atravs do valor de R .
em hora. Um modelo para extrair informaes de tendncia e
sazonalidade pode ser obtido considerando variveis dummy
Resduos e Desvio Mdio Absoluto
para sazonalidade.
Os resduos so diferenas entre os valores observados e os
valores previstos. Obtenha resduos e analise os seus grficos. O
Modelo Exponencial com dados trimestrais:
melhor modelo aquele no qual os resduos so aleatrios.
Yi = 0 1 i 2 1 3 2 4 3
X T T T

A escolha quantitativa do modelo de previso apropriado pode Para resolver utiliza-se uma equao transformada:
ser feita com base no desvio mdio absoluto, dado por: yi = b0 + b1 X i + b2T1 + b3T2 + b4T3

21
sendo: 6.3 Nmeros-ndice
y i = log(Yi ) , ou seja, uma vez obtido yi , a estimativa Nmeros-ndice medem o valor de um item (ou grupo de itens)
de um ponto especfico no tempo sob a forma de uma
da receita dada por Y = 10 yi ; i percentagem do valor de um item (ou grupo de itens) em outro
bk = log(k ) e assim k = 10b ; k ponto no tempo.

Interpretao: ndice de Preos Simples


Um ndice de preos simples rastreia o preo de uma nica
0 = o ajuste para o primeiro trimestre da srie.
mercadoria num determinado perodo de tempo com o preo
(1 1) 100% = a taxa de crescimento trimestral estimada dessa mesma mercadoria em um determinado ponto no tempo
composta das receitas. no passado.
i corresponde ao multiplicador sazonal para o trimestre Tj . O perodo-base corresponde ao ponto no tempo no passado em
relao ao qual esto sendo feitas todas as comparaes. Assim,
se possvel deve-se escolher um ponto no qual exista certa
Observe que para obter os s necessrio resolver um
estabilidade econmica.
regresso linear mltipla. Esta regresso pode ser feita pela
Pi
ferramenta de anlise de dados do Excel mas pode tambm ser Ii = 100
obtida programando a expresso para os s na planilha de Pbase
acordo com a expresso: Ii = ndice de preos para o ano i;
= (X X ) 1
( X Y ) Pi = preo para o ano i;
Sendo: Pbase = preo para o ano-base.
- X a matriz formadas pelas variveis independentes em cada I antiga
coluna, porm a primeira coluna tem os elementos iguais a 1; Deslocando a base: I novo = 100
- Y a matriz coluna formada pela varivel dependente; I nova base
- A notao X significa transposta de X ; I novo = novo ndice de preos;
- O menos 1 significa inversa da matriz. I antiga = antigo ndice de preos;
Este desenvolvimento est apresentado na planilha
RegressMatriz. Em resumo, as matrizes so tais que o modelo I nova base = valor do antigo ndice de preos no novo ano-base.
seja descrito por:
Y1 1 x11 x12 K x1r 0 1 ndice de Preos Agregados Ponderados
Y 1 x Um ndice de preos agregados rastreia o preo de um grupo de
2 = x22 K x2 r 1 2 mercadorias (cesta de mercadorias) num determinado perodo
21
+ de tempo com o preo pago por esse mesmo grupo de
M M M M O M M M
mercadorias em um determinado ponto no tempo no passado.
Yn 1 xn1 xn 2 K xnr r n
No exerccio abaixo utilizaremos a anlise de dados do Excel. ndices de preos agregados ponderados consideram diferentes
ponderaes. Por exemplo, o ndice de preo de Laspeyres ( I L )
Exerccios Excel (EstatisticaExcel_08.xlsm; A3Series) (pronncia Laspr) utiliza quantidades consumidas associadas ao
6.2.1 Considere os valores de Receitas trimestrais do Wal-Mart ano-base no clculo de todos os ndices de preo na srie:
na planilha A3Series A110 (grfico abaixo). Desenvolva uma n

equao de previso de tendncia exponencial com P i


(t )
Qi( 0)
componentes trimestrais. Faa uma previso para os prximos 4 I L( t ) = i =1
n
100
trimestres. Pi (0) Qi(0)
i =1
100
em que
80
t = perodo de tempo (0, 1, 2, ...)
Receita ($ bi)

60 i = item (1, 2, ..., n)


40 n = nmero total de itens que so considerados
Qi0 = quantidade do item i no perodo de tempo 0.
20
Pi (t ) = preo pago pela mercadoria i no perodo de tempo t;
0
0 5 10 15 20 25 30 Pi ( 0) = preo pago pela mercadoria i no perodo de tempo 0.
Trimestre
Figura 6.3 Wal-Mart: Receitas trimestrais. Exerccios Excel (EstatisticaExcel_09.xlsm; Cesta)
6.3.1 A planilha Cesta contm o preo de uma cesta de itens de
Arquivo de recuperao EstatisticaExcel_09.xlsm alimentao, de 1992 a 2006. Esto includos os preos, em

22
dlares, de uma bisnaga com peso de uma libra (454 g) de po Diferentes tipos e grficos de controle permitem que se analisem
branco, uma libra de carne moda, uma dzia de ovos grandes tipos diferentes de variveis Crticas Para a Qualidade (CPQ):
tipo A e uma libra de alface. variveis categricas (proporo de itens em no-conformidade)
(a) Calcule os ndices de preos simples ao longo do perodo e variveis contnuas (tempo de operao, dinheiro, peso, ...).
1992-2006 para po, carne, ovos e alface. Utilize o ano de 1992
como ano-base. Os grficos de controle, alm de fornecer uma exposio visual
(b) Recalcule os ndices utilizando o ano de 1996 como ano-base. dos dados que representam os processos, tem o objetivo de
(c) Calcule o ndice de preos de Laspeyres de 2006 para a cesta separar as causas de variao especiais das causas de variao
desses quatro itens de alimentao para uma famlia que tenha comuns.
consumido em 1992, 50 bisnagas de po, 22 libras de carne, 24 - Causas de variao especiais: Grandes oscilaes ou padres
dzias de ovos e 28 libras de alface. que no so inerentes ao processo, geralmente causadas por
problemas a serem solucionados ou oportunidades a serem
Arquivo de recuperao EstatisticaExcel_10.xlsm exploradas. Podem ser chamadas causas de variaes
identificveis.
- Causas de variao comuns: Variabilidade inerente que existe
num processo. Podem ser chamadas causas de variao do
acaso.

7 Controle Estatstico de Processos Vrios tipos de grficos de controle so utilizados para monitorar
processos. Nesta seo vamos estudar os seguintes grficos:
A partir dos anos 80, tem ocorrido nos Estados Unidos, um Grfico p, utilizado para variveis categricas.
interesse renovado pela qualidade e pela produtividade. Alguns Grfico R, controle da amplitude.
mtodos para melhoria contnua de produtos tm sido Grfico X , grfico de controle para a mdia.
desenvolvidos com nfase cada vez maior na estatstica, na
melhoria de processos e na otimizao do sistema como um Construo de Limites de Controle
todo. A forma mais comum estabelece que os limites de controle para
uma medida num processo esto a uma distncia de 3 desvios-
7.1 Gesto da qualidade Seis Sigma padro da mdia estatstica de interesse, veja figura abaixo.

A metodologia de gesto Seis Sigma representa o sistema de


melhoria da qualidade originalmente desenvolvido pela
Motorola, em meados da dcada de 1980 (LEVINE et al.2008).

A metodologia foi projetada para criar processos que resultem


em no mais do que 3,4 defeitos por milho (ROTONDARO,
2002). A abordagem dos Seis Sigma pressupe que o processo
pode se desviar no mximo 1,5 desvios-padro no longo prazo.
Seis desvios-padro (6 ) menos uma variao de 1,5 produzem Figura 7.1 Ilustrao de um grfico de controle.
uma meta de 4,5 desvios-padro. A rea sob a curva normal fora
de 4,5 desvios de 3,398E-06. Assim, a metodologia projetada Devemos assim determinar os Limites de controle:
para criar processos que resultem em no mais do que 3,4 Limite de controle
defeitos por milho. Mdia do Processo 3 desvios-padro
sendo:
A implementao da metodologia de gesto Seis Sigma requer Limite de controle superior (LCS) = Mdia + 3 desvios-padro
uma abordagem orientada para dados fortemente baseada na Limite de controle inferior (LCI) = Mdia - 3 desvios-padro
utilizao de ferramentas estatsticas tais como grficos de
controle e experimentos projetados. Envolve o treinamento das Grficos de Controle especficos
pessoas da organizao nas etapas do programa Seis Sigma.
O Grfico p
7.2 Grficos de Controle O grfico p utilizado para variveis categricas. O grfico p
apresenta a proporo de itens em uma amostra.
Um Grfico de Controle monitora a variao em uma
caracterstica de um produto ou servio ao longo do tempo. Limites de controle para o Grfico p:
Pode ser utilizado para estudar o desempenho passado, avaliar p (1 p ) p(1 p )
as condies presentes ou para prever resultados no futuro.
LCS = p + 3 e LCI = p 3
n n
sendo

23
k k Tabela 7.2 Fatores para grficos de controle.
n i X i
d2 d3 D3 D4 A2
n= i =1 e p= i =1 , Observaes
k k 2 1,128 0,853 0 3,267 1,880
n
i =1
i 3 1,693 0,888 0 2,575 1,023
4 2,059 0,880 0 2,282 0,729
em que 5 2,326 0,864 0 2,114 0,577
X i = nmero de itens no-conformes na amostra i. 6 2,534 0,848 0 2,004 0,483
7 2,704 0,833 0,076 1,924 0,419
ni = tamanho da amostra (subgrupo) i. 8 2,847 0,820 0,136 1,864 0,373
k = nmero de amostras selecionadas. 9 2,970 0,808 0,184 1,816 0,337
10 3,078 0,797 0,223 1,777 0,308
n = mdia do tamanho das amostras.
11 3,173 0,787 0,256 1,744 0,285
p = mdia da proporo de itens no-conformes 12 3,258 0,778 0,283 1,717 0,266
Se LCI for negativo ento LCI no existe. 13 3,336 0,770 0,307 1,693 0,249
14 3,407 0,763 0,328 1,672 0,235
15 3,472 0,756 0,347 1,653 0,223
16 3,532 0,750 0,363 1,637 0,212
Exerccios Excel (EstatisticaExcel_10.xlsm; ControleProcesso, 17 3,588 0,744 0,378 1,622 0,203
CP1e2) 18 3,640 0,739 0,391 1,609 0,194
7.2.1 Durante a fase de anlise do modelo dos Seis Sigma, foram 19 3,689 0,733 0,404 1,596 0,187
coletados dados de no-conformidade de uma amostra de 200 20 3,735 0,729 0,415 1,585 0,180
quartos de hotel. A Tabela 7.1 apresenta a lista do nmero e de 21 3,778 0,724 0,425 1,575 0,173
quartos no-conformes para cada dia no perodo de quatro 22 3,819 0,720 0,435 1,565 0,167
23 3,858 0,716 0,443 1,557 0,162
semanas. Construa um Grfico p de controle com base nesses
24 3,895 0,712 0,452 1,548 0,157
dados. (Veja na pgina 26 como fazer grficos de controle). 25 3,931 0,708 0,459 1,541 0,153

Tabela 7.1 Nmero de quartos no-conformes (ni = 200).


Limites de controle para o Grfico R:
Dia Quartos no-conformes Dia Quartos no-conformes
d3 d3
1
2
16
7
15
16
18
13
LCS = R + 3R e LCI = R 3R
d2 d2
3 21 17 15
k

R
4 17 18 10
5 25 19 14 i

6 19 20 25 sendo R= ,
i =1

7 16 21 19 k
8 15 22 12 onde Ri a amplitude da amostra i. Os clculos podem ser
9 11 23 6
10 12 24 12 simplificados utilizando as constantes D3 e D4 da Tabela 7.2:
11 22 25 18
LCS = D4 R e LCI = D3 R .
12 20 26 15
13 17 27 20
14 26 28 22
Exerccios Excel (EstatisticaExcel_10.xlsm; ControleProcesso,
CP1e2)
7.2.2 Qualidade de servio de um hotel. O tempo de entrega de
bagagens foi definido como o tempo desde o momento que o
O Grfico R hspede completa os procedimentos de entrada at o momento
em que a bagagem chega ao quarto do hspede. As amostras
O Grfico R o mais simples para monitorar a variabilidade ao foram de tamanho cinco em cada dia, durante 28 dias. Faa um
lidar com dados numricos (ao invs de propores de Grfico R a partir dos valores da Tabela 7.3.
categorias). Monitora a amplitude. Para desenvolver os limites Observaes = 5.
necessrio ter uma estimativa para a mdia e para o desvio-
padro da amplitude. O Grfico X
Estes limites dependem de duas constantes que esto
tabeladas, d 2 e d3 . Os valores de d 2 e d3 dependem do Como a amplitude est sob controle, agora ser examinado o
grfico de controle para a mdia do processo, o Grfico X . Para
nmero de observaes na amostra. A Tabela 7.2 apresenta
controlar os limites de controle para a mdia, calcula-se a mdia
valores at 25 observaes na amostra (tambm na planilha
aritmtica de cada amostra ( X i ) e depois a mdia das mdias,
TabelaControle).
denominada X .

24
Limites de controle para o Grfico X : 7.2.4.a Construa um grfico de controle para a Amplitude
R 7.2.4.b Construa um grfico de controle para a Mdia
LCS = X + 3 e LCI = X 3 R
d2 n d2 n 7.2.4.c O processo est sob controle?
k

R i
7.3 Variabilidade de Processos
em que X a mdia das mdias de amostras e R= i =1 , Os pontos devem ser investigados de forma a observar se as
k variaes existentes so de causa comum ou se existe algum
onde Ri a amplitude da amostra i e k, o nmero de amostras. ponto fora dos limites ou ainda se uma srie de pontos est
Os limites podem ser obtidos utilizando o fator A2 da Tabela 7.2: abaixo ou acima da mdia. Na figura 7.2 abaixo o processo est
sob controle.
LCS = X + A2 R e LCI = X A2 R .

Tabela 7.3 Tempos de entrega de bagagens.


Dia Tempos de Entrega em Minutos Mdia Amplitude
1 6,7 11,7 9,7 7,5 7,8 8,68 5,0
2 7,6 11,4 9,0 8,4 9,2 9,12 3,8
3 9,5 8,9 9,9 8,7 10,7 9,54 2,0
4 9,8 13,2 6,9 9,3 9,4 9,72 6,3
5 11,0 9,9 11,3 11,6 8,5 10,46 3,1
6 8,3 8,4 9,7 9,8 7,1 8,66 2,7
7 9,4 9,3 8,2 7,1 6,1 8,02 3,3
8 11,2 9,8 10,5 9,0 9,7 10,04 2,2
9 10,0 10,7 9,0 8,2 11,0 9,78 2,8 Figura 7.2 Processo sob controle: Variao comum.
10 8,6 5,8 8,7 9,5 11,4 8,80 5,6
11 10,7 8,6 9,1 10,9 8,6 9,58 2,3 As figuras 7.3 a 7.5 so exemplos de processos fora do controle.
12 10,8 8,3 10,6 10,3 10,0 10,00 2,5 Na Figura 7.3 um valor ultrapassou o limite de controle superior,
13 9,5 10,5 7,0 8,6 10,1 9,14 3,5 a variao no comum. Na Figura 7.4, embora todos os valores
14 12,9 8,9 8,1 9,0 7,6 9,30 5,3 estejam entre os limites, ocorre uma srie de pontos abaixo da
15 7,8 9,0 12,2 9,1 11,7 9,96 4,4 mdia e uma srie de pontos acima da mdia sendo apresentada
16 11,1 9,9 8,8 5,5 9,5 8,96 5,6 uma forte tendncia. Na Figura 7.5 ocorrem pontos consecutivos
17 9,2 9,7 12,3 8,1 8,5 9,56 4,2 abaixo da mdia
18 9,0 8,1 10,2 9,7 8,4 9,08 2,1
19 9,9 10,1 8,9 9,6 7,1 9,12 3,0
20 10,7 9,8 10,2 8,0 10,2 9,78 2,7
21 9,0 10,0 9,6 10,6 9,0 9,64 1,6
22 10,7 9,8 9,4 7,0 8,9 9,16 3,7
23 10,2 10,5 9,5 12,2 9,1 10,30 3,1
24 10,0 11,1 9,5 8,8 9,9 9,86 2,3
25 9,6 8,8 11,4 12,2 9,3 10,26 3,4
26 8,2 7,9 8,4 9,5 9,2 8,64 1,6
27 7,1 11,1 10,8 11,0 10,2 10,04 4,0
28 11,1 6,6 12,0 11,5 9,7 10,18 5,4

Figura 7.3 Processo fora de controle: variao de causa especial.


Exerccio Excel (EstatisticaExcel_10.xlsm; ControleProcesso,
CP1e2)
7.2.3 Construa um Grfico X para o processo de entrega de
bagagens. Verifique atravs do Grfico R e do Grfico X se o
processo est sob controle estatstico.

Exerccio Excel (EstatisticaExcel_10.xlsm; ControleProcesso, CP3)


7.2.4 Um artigo apresenta uma anlise sobre uma operao de
envasamento de gua mineral. Uma das caractersticas de
interesse a quantidade de magnsio, medidas em partes por
milho (ppm), existente na gua. Os dados a representam o nvel
de magnsio de 30 subgrupos de 4 garrafas (Observaes = 4) Figura 7.4 Processo fora de controle: variao de causa especial -
coletadas ao longo de um perodo de 30 horas. Pontos consecutivos, tendncia.

25
Grfico de controle Excel:
Grfico de disperso com pontos de dados conectados por
linha.
Incluir LCS, LCI. x: menor dia, maior dia
y: LCS ou LCI
Incluir p barra. x: menor dia, maior dia
Figura 7.5 Processo fora de controle: Variao de causa especial - y: p barra
pontos consecutivos abaixo da mdia. Incluir os dados x: de 1 a 30
y: p_i
0,30

Proporo Operaes no-desejadas


0,25
Grfico de controle no Excel:
0,20

No Excel no existe um modelo especfico para Grficos de 0,15

Controle, mas eles podem ser feitos com grficos de disperso 0,10
com pontos de dados conectados por linhas.
0,05

0,00
0 5 10 15 20 25 30
Exerccio Excel (EstatisticaExcel_10.xlsm; ControleProcesso, CP4)
Dias
7.4 A gerente de uma filial de uma corretora de valores est
preocupada com o nmero de operaes no-desejadas (com Figura 7.6 Resultado para grfico de controle no Excel
erro no recibo da operao), realizadas pela equipe de vendas. Causas especiais de variao: O dia 4 est acima do LCS, o dia 24
As operaes com erros so canceladas e refeitas. Na Tabela 7.4 est abaixo do LCI, portanto o processo est fora de controle.
so apresentados dados coletados ao longo de 30 dias
As causas especiais devem ser investigadas para melhorar o
Tabela 7.4 Registro de operaes no desejadas. processo.
Op. no Op. no
Dia Desejadas Total Dia Desejadas Total Arquivo completo EstatisticaExcel_11.xlsm
1 2 74 16 3 54
2 12 85 17 12 74 Tabela Excel2. Funes Excel, parte 2.
3 13 114 18 11 103 Funo Descrio
4 33 136 19 11 100 MDIASE(interv;crit;intev. md) Mdia condicionada
5 5 97 20 14 88 SUBTOTAL(Funo; Referencia) Para dados com filtro
6 20 115 21 4 58 INT.CONFIANA.T(alfa;desvp;n) Erro estatstico p/ IC
7 17 108 22 10 69 INT.CONFIANA.NORM(a;dp;n) Erro estatstico p/ IC
8 10 76 23 19 135 DISTT(x; graus de lib.; caudas) Distribuio t-student
9 8 69 24 1 67 INVT(P; graus de liberdade) Distribuio t-student
10 18 98 25 11 77 VARP(v_1) Varincia populao
11 3 104 26 12 88 TESTE.Z(Amostra;x;sigma) Teste z, mdia 1 amostra
12 12 98 27 4 66 TESTE.T(Am1;Am2;caudas;tipo) Teste t, par, indep, ...
13 15 105 28 11 72 COVAR(v_1; v_2) Covarincia
14 6 98 29 13 118 PEARSON(v_1; v_2) Correlao linear
15 21 204 30 15 138 CORREL(v_1; v_2) Correlao linear
INTERCEPO(v_y; v_x) Coeficiente linear da reta
INCLINAO(v_y; v_x) Coeficiente angular da reta
PREVISO(x; v_y; v_x) Previso linear a partir de x
A gerente deseja saber se a proporo de operaes no
MATRIZ.MULT(matr_A; matr_B) Multiplicao de Matrizes
desejadas est em um estado de controle estatstico, de modo
MATRIZ.INVERSO(MatrizA) Inverte a MatrizA
que ela possa planejar a etapa subsequente em um processo de
TRANSPOR(MatrizA_nxm) Obtm transposta mxn
melhoria de qualidade.
7.4.1 Construa um grfico de controle para esses dados
7.4.2 O processo est sob controle?
7.4.3 Com base nos resultados, o que deveria ser feito para
melhorar o processo?

26
BIBLIOGRAFIA

BRUNI A.L. Estatstica aplicada gesto empresarial, 2a ed. So Paulo: Atlas, 2008.

CORRAR L.J., PAULO E, DIAS FILHO J.M. Anlise multivariada para cursos de administrao, cincias contbeis e economia,
So Paulo: Atlas, 2007.

CORRAR L.J., THEPHILO C.R. Pesquisa operacional para deciso em contabilidade e administrao: contabilometria, 2a ed.
So Paulo: Atlas, 2008.

FVERO L.P. et. al. Anlise de dados: modelagem multivariada para tomada de deciso, Rio de Janeiro: Elsevier, 2009.

LEVINE, STEPHAN, KREHBIEL, BERENSON. Estatstica: teoria e aplicaes usando o Microsoft Excel, 5a ed. Rio de Janeiro:
LTC, 2008.

ROTONDARO, R.G (coordenador) Seis Sigma: Estratgia gerencial para a melhoria de processos, produtos e servios, 1a ed.
So Paulo: Atlas, 2002.

TRIOLA, M.F. Introduo Estatstica, Rio de Janeiro: LTC, 2005.

27