Você está na página 1de 118

Estatstica e Anlise de

Dados
Professor Leandro Morilhas

Agenda
Conceito e origem da
Estatstica.
reas de Estudo.
Medidas de posio central.
Medidas de disperso.
Probabilidade.
Correlao e regresso linear.

Um passeio pela histria

3000 AC Censos no Egito

Outras cenas ...

Na Babilnia tambm

Na Bblia

Quarto livro do velho


testamento
Instruo a Moiss
Fazer um
levantamento dos
homens de Israel que
estivessem aptos a
guerrear

Augusto Csar
dito para que se
fizesse o censo em
todo o imprio romano
Censere em latim = taxar

Maria e Jos

Em funo do
dito, Maria e
Jos viajaram
para Belm

Inglaterra
1085
Levantamento
estatstico
Terras
Propriedades
Empregados
Animais

Base de clculo de
impostos

Domesday = Dia do juzo fnal

Guilherme o conquistador

Um livro para os impostos

Sc XVII - Tbuas de
Mortalidade
John Graunt

Anlises de
nascimentos e mortes
% de homens
ligeiramente superior
a de mulheres

Palavra Estatstica

Cunhada pelo
acadmico alemo
Gottfried Achenwall
por volta da metade
do sculo XVIII
O verbete
statistics
apareceu pela
primeira vez na
Enciclopdia
Britnica em 1797

Para entender a ...

Estatstica
Status

Estado

Poder pblico
Caracterizao
dos dados

Uma origem controversa


Estatstica
para cobrar
IMPOSTOS

E depois .

Facilitar a
anlise
de
DADOS

A Estatstica dividida em:

Anlise de dados:
Coleta,
organizao e
resumo dos dados

Probabilidade:
Necessria para tirar
concluses a partir de
amostras
Inferncia estatstica: Tirar
concluses estatsticas de
dados especficos usando os
conhecimentos de
probabilidade

Definies:
Populao
o conjunto de todos os elementos de
interesse em um determinado estudo

Amostra
uma parte da populao selecionada para
anlise

Dados
Dados: so observaes (tais como
medidas, sexo, respostas de pesquisa) que
tenham sido coletados
Qualitativos:
Representam a
informao
que identifica alguma
qualidade, categoria
ou caracterstica

Quantitativos:
Quando possvel
atribuir um valor
numrico

Campos de Aplicao
Estudos de mercado
O gerente de uma fbrica de detergentes pretende lanar um novo produto para
lavar a loua, pelo que, encarrega uma empresa especializada em estudos de
mercado de "estimar" a percentagem de potenciais compradores desse produto.
Populao: conjunto de todos as famlias do pas
Amostra: conjunto de algumas famlias, pesquisados pela empresa
Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre
os entrevistados sobre a compra do novo produto, obter uma estimativa do nmero
de compradores na Populao.

Campos de Aplicao
Controle de qualidade
O administrador de uma fbrica de parafusos pretende assegurar-se de que a
percentagem de peas defeituosas no excede um determinado valor, a partir do
qual determinada encomenda poderia ser rejeitada.
Populao: conjunto de todos os parafusos fabricados ou a fabricar pela fbrica,
utilizando o mesmo processo.
Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de
produzidos.
Problema: pretende-se, a partir da percentagem de parafusos defeituosos
presentes na amostra, "estimar" a percentagem de defeituosos em toda a
produo.

Analisando ...

Frequncias
Mdia
Mediana
Desvio-Padro

Medidas de
Posio Central

Medidas teis para a


deciso
Medidas de posio central:
Mdia ou Valor Esperado
Moda
Mediana

Mdia Aritmtica Simples


Mais
usual
das
medidas
estatsticas
Relao entre soma e contagem
Centro
geomtrico
de
um
n
conjunto
soma de dados
mdia

contagem

ou x

x
i 1

Exerccios
1 Em maro de 2009, os vendedores da
Empresa Equilibrada Ltda. tiveram um
aumento de 44% sobre os respectivos
salrios mensais. Ao final de junho, tendo
em vista o considervel aumento das
vendas da empresa, foi concedido um
novo aumento a cada vendedor, de US$
200 que comeou a ser pago a partir de
julho. Sabendo-se que, ao final do ano de
2009, o salrio mdio mensal dos
vendedores da empresa passou a ser de
US$ 1.100, pede-se calcular o salrio
mdio mensal dos vendedores da empresa
em fevereiro de 2009.

Exerccios
2 O salrio mdio mensal pago aos funcionrios
da Empresa ABC, foi de US$ 199 no primeiro
semestre de 2009. Sabendo-se que a partir de
julho houve um aumento que fez com que a
mdia, ao final dos doze meses do ano subisse
para US$ 217, pede-se calcular:
A - O volume total gasto com o pagamento dos
salrios no ms de julho.
B Mantendo-se os valores do primeiro semestre
e o valor encontrado para o ms de julho, caso a
empresa queira reduzir os gastos com pessoal,
de tal modo que a mdia ao final do ano de
2009 atinja US$ 180, qual deve ser a mdia
mensal entre agosto e dezembro?

Mdia aritmtica ponderada


preciso considerar as frequncias
n

xw

x
.
f
x
i
i
i 1

i 1

f xi

Exerccios
3 Um caminho cujo peso vazio de 3.200 kg
ser carregado com 470 caixas de 11 kg cada,
360 caixas de 9 kg cada, 500 caixas de 4 kg cada
e 750 caixas de 6 kg cada. O motorista do
caminho pesa 75 kg e a lona de cobertura da
carga pesa 48 kg.
A Sabendo-se que esse caminho tem que passar
por uma balana que s permite passagens a
veculos com peso mximo de 16 toneladas,
pergunta-se: ele passar pela balana?
B Qual o peso mdio das caixas carregadas no
caminho?

Exerccios
4 O capital da Empresa Maguary Ltda. formado
pelo aporte dos acionistas, por financiamento de
longo prazo e pela emisso de debntures. Cada
tipo de capital possui um custo anual diferente
dado por uma taxa de juros anual, conforme o
quadro:
Forma de
Capital

Participao em
US$

Taxa de Juros

Acionistas

2.400

12%

Financiamentos
de Longo Prazo

1.200

8%

Debntures
400
14%
Calcular
a taxa mdia do
capital da empresa.

Cuidado com as mdias!!!

Aparncias
podem enganar!

Maior problema da
mdia

Maldio
dos
extremos
ou outliers

Extremos distorcem
algumas medidas

Soluo para o problema


Remover
os extremos!!

Pesquisa sobre
remunerao
Empresa paga $400,00 aos

estagirios de Administrao
Quer saber

muito ou pouco?
Coletou amostra de dados
Dados:
{300; 350; 6000; 340; 310; 380}

soma
7680
mdia

$1.280,00
contagem
6

Pouqussimo!!!

Organizando os dados

Dados:
{300; 350; 6000; 340; 310; 380}
Rol:
{300; 310; 340; 350; 380; 6000}

$400,00
Extremo distorce a mdia!
Rol sem extremo:
{300; 310; 340; 350; 380}
Mdia = 1680/5 = $336,00

Alto!

O centro dos dados


ordenados

Onde
est o
centro
???

Mediana
Valor central de uma srie ordenada de
dados (Rol)

{3; 7; 9; 10; 4; 8; 2}
Ordenando no Rol
3 maiores

{2; 3; 4; 7; 8; 9; 10}
3 menores n par?
mediana = 6

{2; 3; 4; 8; 9; 10}

O que mais frequente


Ser que est
na

moda??
?

Moda
Valor que se repete com
maior frequncia

{2; 3; 4; 7; 7; 9; 10}
unimodal

{2; 2; 4; 7; 7; 9; 10}
bimodal ou multimodal

{2; 3; 4; 7; 8; 9; 10}
amodal

Medidas de Localizao No
Centrais

Quartis
Dividem os dados ordenados em quatro partes:

Primeiro Quartil (Q1): valor que faz com que 25% das observaes
sejam menores e 75% sejam maiores que Q1

Segundo Quartil (Q2): a MEDIANA 50% das observaes so


menores que Q2 e 50% so maiores

Terceiro Quartil (Q3): valor que faz com que 75% das observaes
sejam menores e 25% sejam maiores que Q3

Dados no agrupados
Q1 = valor que corresponde posio:

N 1
4

Q2 = valor que corresponde posio:

2( N 1)
4

Q3 = valor que corresponde posio:

3( N 1)
4

Regras usadas para obter os valores do


quartil
Se o ponto de posicionamento for um nmero inteiro, s usar
o nmero correspondente quela posio
Se o ponto de posicionamento estiver na metade entre 2
nmeros inteiros, a mdia dos dois nmeros direita e
esquerda ser o quartil
Se o ponto de posicionamento no for a metade do caminho
entre dois nmeros inteiros, usamos o que estiver mais prximo.

Exerccios
5 - Os salrios mensais para uma amostra de 12 administradores so:
2.350
2.390

2.450
2.630

2.550
2.440

2.380
2.825

2.255
2.420

2.210
2.380

Determine os trs quartis.


6 - Para estimar a quantidade de gua que seria necessria para
abastecer uma cidade na prxima dcada, a prefeitura precisa
descobrir a quantidade de gua que uma amostra de famlias utiliza
atualmente. As famlias da amostra utilizaram o seguinte volume de
gua, em milhares de litros:
11,1
13,1

21,5
23,8

16,4
18,3

Encontre os trs quartis.

19,7
15,5

14,6
18,8

16,9
22,7

32,2
14,0

18,2

Exerccios
7 - Considere uma populao constituda de profissionais liberais que
foram, questionados sobre o nmero de revistas e/ou jornais que os
mesmos so assinantes, obteve-se a seguinte tabela:
N de
Publicaes

N de
Profssionais

12

15

10

16

Quais so os trs quartis?

Exerccios
8 - Uma empresa produz caixas de papelo para embalagens e afirma
que o nmero de defeitos por caixa de distribui conforme a tabela da
populao:
No de
defeito

No de
caixas

32

28

11

Determine o valor da moda, da mediana e da mdia

Medidas de disperso

Medidas de
Disperso
Amplitude
Desvio mdio
Varincia
Desvio padro

Encontrando os extremos dos


dadoscom retornos: {7, 3
Fundo de investimento,

e 2}
Amplitude
Maior menos menor
Range ou intervalo

R
R

Maior
=
Menor
= 7- 2 = 5

Desvio mdio
Desvio mdio ou
afastamento mdio em
DM
relao
mdia
Mdia
=4

Srie Desvios
2
-2
3
-1
7
3
Soma 0
Mdia 0

x x
i 1

preciso
calcular os
desvios
ABSOLUTOS

Desvio mdio
absoluto
Desvio mdio absoluto ou
afastamento
mdio
absoluto em relao
Mdia = 4
mdia

DMA

x x
i 1

Srie Desv Abs


2
2
Calculamos os
3
1
MDULOS
7
3
Soma 6
Mdia 2

Exerccios
9 A produo de manteiga dos ltimos seis meses do
Laticnio Sabor do Leite Ltda. est apresentada a
seguir. Com base nos nmeros apresentados, calcule:
A- Mdia.
B O desvio mdio absoluto
Produo mensal de manteiga em toneladas:
{ 11; 8; 4; 10; 9; 12}

Varincia
Dispensa o uso do MDULO
Usa o desvio ao quadrado

Mdia = 4
Srie Desvio2
2
4
3
1
7
9
Soma 14
Mdia 4,67

x x
i 1

Desvio padro
Resolve o problema
dimensional
da
varincia
Raiz da varincia

x x
i 1

Desvio = Raiz (4,67) = 2,16

Exerccios
10 Considerando o enunciado do
exerccio 9, calcule a varincia e o
desvio padro.

Frmulas
Amostral

Populacional

Varincia

Desvio
Padro

( Xi X )

2
(
Xi

X
)

s2

2
(
Xi

X
)

n 1

2
(
Xi

X
)

n 1

Coeficiente de variao

s
CV ou

Exerccios
11 - A U.S. Energy Information Administration monitora todas as
usinas de energia nuclear operando nos Estados Unidos. A
tabela a seguir lista o nmero de usinas ativas operando em
Nmero de Usinas

13

Estado

Alabama

Arizona

California

Florida

Georgia

Illinois

Kansas

Louisiana

Mass

Miss

NewHamp

NewYork

NCarolina

Ohio

Penn

SCarolina

Tennessee

Texas

Vermont

Wisconsin

cada um dos 20 estados da amostra.

A - Encontre a amplitude, a varincia e o desvio-padro desse conjunto de


dados.
B - Elimine o maior valor dos dados e repita a alternativa a.
C - Que efeito a retirada dessa medio tem nas medidas de variao
encontradas na letra a?
D - Elimine o maior e o menor valor do conjunto de dados e repita a alternativa
a. Que efeito a retirada de ambas as medies tem sobre a variao58

Exerccios
12 - Uma amostra aleatria de 15 empresas dentre as que
pediram concordata no ltimo ms em So Paulo foi
selecionada por um analista. As idades das empresas, em anos,
foram registradas:
1.4 10.1
5.1

5.7
2.4

22.4
3.1

7.4

8.3

6.3

3.9
4.5 11.4
2.9
17.2
A - Encontre a mdia, a amplitude, a varincia e o desvio-padro desse
conjunto de dados.
B - Calcule o valor da mdia menos o desvio-padro; calcule tambm o
valor da mdia mais o desvio-padro.
C - Quantos valores esto entre o intervalo definido pela mdia menos o
desvio-padro e a mdia mais o desvio-padro?
D - O que voc pode inferir com estes resultados?

59

Exerccios
13 - Um fbricante de baterias automotivas alega que a durao
mdia da vida til de uma bateria tipo A de 60 meses.
Entretanto, a garantia dessa marca de apenas 36 meses.
Suponha que o desvio-padro da vida til seja de 10 meses e a
distribuio de freqncia dos dados da vida til tenda a ter um
formato numrico, conforme os dados a seguir.
45

57

65

51 74

58

68

57

68 64

40

63

54

59 77

A - Qual a porcentagem das baterias tipo A desse fbricante iro durar mais
de 50 meses?
B - Qual a porcentagem das baterias tipo A desse fbricante iro durar menos
de 41 meses?
60
C - Suponha que sua bateria dure 37 meses. O que voc pode inferir sobre a

Estudo de Caso:
1 - Consolidated Foods

Estudo de Caso:
Consolidated Foods
A

Consolidated
Foods
opera
uma
rede
de
supermercados no Novo Mxico, no Arizona e na
Califrnia. Os dados na Tabela 1 mostram as quantias
em dlar e os mtodos de pagamento para uma
amostra de 100 clientes. Os gerentes da Consolidated
solicitaram a amostra para descobrirem as prticas de
pagamento dos clientes da loja. Em particular, os
gerentes esto interessados em saber como uma
nova opo de pagamento por carto de crdito est
relacionada com as quantias gastas pelos clientes.

Estudo de Caso:
Consolidated Foods

Estudo de Caso:
Consolidated Foods
Relatrio Gerencial:
Use os mtodos de estatstica descritiva para sintetizar os
dados da amostra. Fornea separadamente sumrios das
quantias gastas para clientes que pagaram vista, clientes
de cheque pessoal e clientes de carto de crdito. Seu
relatrio deve conter os seguintes sumrios e discusses.
1 Uma comparao e interpretao das mdias e das
medianas.
2 Uma comparao e interpretao das medidas de
variabilidade tais como a amplitude e o desvio-padro.
3 A identificao e interpretao da regra de cinco itens
para cada mtodo de pagamento.
4 Grficos de pontos para cada mtodo de pagamento.

Estudo de Caso:

2 Empresa Platox

Estudo de Caso: Empresa


Platox

A empresa Platox, S.A. fabrica e comercializa celulares. A empresa tem


sede administrativa e fbrica na cidade de Curitiba e filiais em mais
cinco cidades do Brasil.
As empresas Platox-Rio, Platox-Braslia, Platox-So Paulo, Platox Belo
Horizonte e Platox-Salvador, foram criadas com o objetivo de
descentralizar a comercializao de celulares e para responder de
forma mais eficiente s necessidades dos trs tipos de clientes-alvo
da empresa: adolescentes, executivos e pessoas fanticas por novas
tecnologias.
A empresa atua no mercado desde 2000, mas as filiais de So Paulo,
Belo Horizonte e Salvador s foram criadas em 2003.
A capacidade produtiva da fbrica de 500.000 celulares por ano, mas
at agora a utilizao dessa capacidade no ultrapassou os 70%: at
2002 foram produzidos 200.000 celulares por ano; e a partir de
2003, com a abertura das trs novas filiais, esse nmero elevou-se
para 350.000 unidades.

Estudo de Caso: Empresa


Platox

Para aproveitar o efeito sinrgico que pode resultar do forte crescimento que
se esperava para a economia nacional, e atendimento evoluo
favorvel das margens de comercializao que se tem verificado nos
ltimos anos, os responsveis pela empresa pretendem aumentar a
produo de celulares para 450.000 unidades por ano.
Assim, e antes de decidir pela maior utilizao da capacidade produtiva, a
Administrao da empresa deu instrues no sentido da diretoria de
planejamento apresentar um relatrio completo sobre as vendas de todas
as filiais ao longo dos ltimos anos. Paralelamente foi encomendado um
estudo de marcado a uma empresa de consultoria, com o objetivo de
saber qual o posicionamento competitivo da empresa no mercado de
celulares, tanto em nvel nacional como em nvel regional. Do estudo de
mercado devero resultar tambm algumas idias sobre a estratgia de
marketing a ser implementada em cada uma das filiais.
Portanto, cabe diretoria de planejamento da empresa, a realizao de um
estudo do qual possam ser extradas algumas concluses importantes
sobre o comportamento das vendas de todas as filiais ao longo dos
ltimos anos.

Estudo de Caso: Empresa


Platox
Para a Administrao da empresa importa saber em cada
filial:
1 Os nveis mdio e mediano das vendas;
2 O comportamento das vendas em relao ao nvel
mdio, para se poder concluir sobre o grau de risco em
aumentar a produo;
3 A forma como as vendas se distriburam ao longo do
tempo;
4 O grau de concentrao das vendas dentro da prpria
empresa, para saber se as vendas se repartiram de
forma mais ou menos equitativa por todas as filiais;
5 Que aes devem ser realizadas tendo em vista o
aumento das vendas para fazer face maior utilizao
da capacidade produtiva.

Estudo de Caso: Empresa


Platox
Observao: No quadro seguinte apresentam-se as vendas (em reais) das
seis filiais da empresa ao longo dos ltimos anos. Os dados foram j
introduzidos planilha para que os clculos possam ser feitos pelo Excel.

Probabilidade

Distribuio Normal

Curva normal
dos erros

Mdias, desvios e
sinos
Uso da curva normal
Freqncia
Alta frequncia

Baixa
frequncia

Mdia Varivel X
rea sob a curva permite obter
as probabilidades

Caractersticas da curva
Na teoria, prolonga-se de
infinito a + infinito
rea sob toda a curva
igual a 100%

Simtrica
rea de cada lado igual a
50%

reas sob a curva normal


68%

95%
> 99%
3

+1 +2 +3

Probabilidade

68%
95%
99%

Para sempre
lembrar!
Uma indstria de cosmticos

analisa a
sua produo de frascos de esmalte de
unha que apresenta uma produo
normalmente distribuda, com mdia
igual a 12g e desvio 4g.
Freqncia

=4

= 12

Varivel X

A gerncia industrial quer


saber
a) Qual a probabilidade de um
frasco

escolhido

ao

acaso

apresentar um peso entre 12


e 14,56 g?

Assinalando a rea no
grfco
Freqncia

=4

12

Varivel X

14,56

Convertendo a varivel
original

Nmero de
desvios de
afastamento em
relao
mdia

x
Z

Calcule a
probabilidade ...

Freqncia

=4

Probabilidad
em tabela Z
x
Z

14,56 12
Z
4

12

Varivel X

14,56

0 0,64

Z = +0,64

Tabelas facilitam os
Para Z =0,64clculos
Z

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,00

0,0040

0,0080

0,0120

0,0160

0,0199

0,0239

0,0279

0,0319

0,0359

0,10

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,0636

0,0675

0,0714

0,0753

0,20

0,0793

0,0832

0,0871

0,0910

0,0948

0,0987

0,1026

0,1064

0,1103

0,1141

0,30

0,1179

0,1217

0,1255

0,1293

0,1331

0,1368

0,1406

0,1443

0,1480

0,1517

0,40

0,1554

0,1591

0,1628

0,1664

0,1700

0,1736

0,1772

0,1808

0,1844

0,1879

0,50

0,1915

0,1950

0,1985

0,2019

0,2054
0,2088
0,2389

0,2123

0,2157

0,2190

0,2224

0,60

0,2257

0,2291

0,2324

0,2357

0,2389

0,2422

0,2454

0,2486

0,2517

0,2549

0,70

0,2580

0,2611

0,2642

0,2673

0,2704

0,2734

0,2764

0,2794

0,2823

0,2852

0,80

0,2881

0,2910

0,2939

0,2967

0,2995

0,3023

0,3051

0,3078

0,3106

0,3133

0,90

0,3159

0,3186

0,3212

0,3238

0,3264

0,3289

0,3315

0,3340

0,3365

0,3389

1,00

0,3413

0,3438

0,3461

0,3485

0,3508

0,3531

0,3554

0,3577

0,3599

0,3621

1,10

0,3643

0,3665

0,3686

0,3708

0,3729

0,3749

0,3770

0,3790

0,3810

0,3830

1,20

0,3849

0,3869

0,3888

0,3907

0,3925

0,3944

0,3962

0,3980

0,3997

0,4015

1,30

0,4032

0,4049

0,4066

0,4082

0,4099

0,4115

0,4131

0,4147

0,4162

0,4177

1,40

0,4192

0,4207

0,4222

0,4236

0,4251

0,4265

0,4279

0,4292

0,4306

0,4319

Exerccios
.
14 - Calcule a probabilidade
entre 12 e 17 g, entre 6 e
12g e entre 11 e 15g.
Freqncia

=4

12
0

Varivel X

17

Probabilida
de
em tabela
x
Z Z

Exerccios

15 Calcule o valor de Z para a rea central igual a 90%.

Frequncia

90%
mdia

Varivel X

Exerccios
16 Latas de conserva so fabricadas
por uma indstria com mdia de 990g
e desvio padro de 10g. Uma lata
rejeitada pelo controle de qualidade
dessa indstria se possuir peso menor
que
975g.
Assim,
qual

a
probabilidade de uma lata de conserva
ser
rejeitada
pelo
controle
de
qualidade?

Anexos

Distribuio
Normal
Padronizada

Tabelas de Z (1)
Z

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,00

0,0040

0,0080

0,0120

0,0160

0,0199

0,0239

0,0279

0,0319

0,0359

0,10

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,0636

0,0675

0,0714

0,0753

0,20

0,0793

0,0832

0,0871

0,0910

0,0948

0,0987

0,1026

0,1064

0,1103

0,1141

0,30

0,1179

0,1217

0,1255

0,1293

0,1331

0,1368

0,1406

0,1443

0,1480

0,1517

0,40

0,1554

0,1591

0,1628

0,1664

0,1700

0,1736

0,1772

0,1808

0,1844

0,1879

0,50

0,1915

0,1950

0,1985

0,2019

0,2054

0,2088

0,2123

0,2157

0,2190

0,2224

0,60

0,2257

0,2291

0,2324

0,2357

0,2389

0,2422

0,2454

0,2486

0,2517

0,2549

0,70

0,2580

0,2611

0,2642

0,2673

0,2704

0,2734

0,2764

0,2794

0,2823

0,2852

0,80

0,2881

0,2910

0,2939

0,2967

0,2995

0,3023

0,3051

0,3078

0,3106

0,3133

0,90

0,3159

0,3186

0,3212

0,3238

0,3264

0,3289

0,3315

0,3340

0,3365

0,3389

Tabelas de Z (2)
Z

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

1,00

0,3413

0,3438

0,3461

0,3485

0,3508

0,3531

0,3554

0,3577

0,3599

0,3621

1,10

0,3643

0,3665

0,3686

0,3708

0,3729

0,3749

0,3770

0,3790

0,3810

0,3830

1,20

0,3849

0,3869

0,3888

0,3907

0,3925

0,3944

0,3962

0,3980

0,3997

0,4015

1,30

0,4032

0,4049

0,4066

0,4082

0,4099

0,4115

0,4131

0,4147

0,4162

0,4177

1,40

0,4192

0,4207

0,4222

0,4236

0,4251

0,4265

0,4279

0,4292

0,4306

0,4319

1,50

0,4332

0,4345

0,4357

0,4370

0,4382

0,4394

0,4406

0,4418

0,4429

0,4441

1,60

0,4452

0,4463

0,4474

0,4484

0,4495

0,4505

0,4515

0,4525

0,4535

0,4545

1,70

0,4554

0,4564

0,4573

0,4582

0,4591

0,4599

0,4608

0,4616

0,4625

0,4633

1,80

0,4641

0,4649

0,4656

0,4664

0,4671

0,4678

0,4686

0,4693

0,4699

0,4706

1,90

0,4713

0,4719

0,4726

0,4732

0,4738

0,4744

0,4750

0,4756

0,4761

0,4767

Tabelas de Z (3)
Z

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

2,00

0,4772

0,4778

0,4783

0,4788

0,4793

0,4798

0,4803

0,4808

0,4812

0,4817

2,10

0,4821

0,4826

0,4830

0,4834

0,4838

0,4842

0,4846

0,4850

0,4854

0,4857

2,20

0,4861

0,4864

0,4868

0,4871

0,4875

0,4878

0,4881

0,4884

0,4887

0,4890

2,30

0,4893

0,4896

0,4898

0,4901

0,4904

0,4906

0,4909

0,4911

0,4913

0,4916

2,40

0,4918

0,4920

0,4922

0,4925

0,4927

0,4929

0,4931

0,4932

0,4934

0,4936

2,50

0,4938

0,4940

0,4941

0,4943

0,4945

0,4946

0,4948

0,4949

0,4951

0,4952

2,60

0,4953

0,4955

0,4956

0,4957

0,4959

0,4960

0,4961

0,4962

0,4963

0,4964

2,70

0,4965

0,4966

0,4967

0,4968

0,4969

0,4970

0,4971

0,4972

0,4973

0,4974

2,80

0,4974

0,4975

0,4976

0,4977

0,4977

0,4978

0,4979

0,4979

0,4980

0,4981

2,90

0,4981

0,4982

0,4982

0,4983

0,4984

0,4984

0,4985

0,4985

0,4986

0,4986

Correlao e Regresso
Linear

X
Y

Duas variveis
quantitativas
independente

dependente

Sem relao
Anlise de regresso:
ajuste de reta aos pontos
Sem relao aparente

Com relao

Anlise de regresso:
ajuste de reta aos pontos
Com relao aparente

Erros quadrticos mnimos


Y

Erros2 devem ser mnimos!!!

Definindo a equao
da reta
Equao da reta

Y = a + b.X

y b x

a
n

xy x y
n x x

Uma aplicao
didtica
Anlise e separao de gastos

Fixos: no oscilam conforme


produo e vendas
Variveis: oscilam conforme
produo e vendas

Uma anlise de vendas e


gastos
Ms

Vendas

Gastos

jan

18

fev

39

mar

30

abr

15

mai

12

jun

45

Uma anlise grfica


Vendas

Gastos

18

39

30

15

12

45

X Y

Calculando os
somatrios
Vendas
X

Gastos
Y

X2

Y2

XY

18

324

54

39

81

1.521

351

30

36

900

180

15

225

45

12

144

24

45

81

2.025

405

220

5139

1059

32

159

Calculando b
n

X2

Y2

XY

32

159

220

5.139

1.059

x
6n
220
32x

xy
y
6n
159
1059
32x
2

b = 4,27703

Calculando a
n

X2

Y2

XY

32

159

220

5.139

1.059

y b4,42770
x
32
159

a
n6

a = 3,6892

No grfico

Assim
Equao obtida

y = 3,6892 + 4,277x
Para vendas previstas iguais a 10
unidades

y = 3,6892 + 4,277(10)
y = 46,4592

Anlise de
correlao

Estuda a qualidade do ajuste


linear feito para os pontos

Diferentes nveis de
Positiva Perfeita
Positiva aproximao
r>0
Negativa

r=1
Negativa perfeita

r<0

r = -1

Correlao inexistente

r=0

Coeficiente de
determinao
Variao exp licada
r
Variao total
2

r
2

y
i 1
n

y
i 1

Coeficiente de
Pearson

n x

n xy x. y
2

x . n y y
2

Exerccios
17 As exportaes da castanha in natura,
processadas pela Empresa Castanheira Ltda., no
perodo 2002 a 2008, encontram-se na tabela a
seguir
Ano
200 200 2004 2005 2006 2007 2008
Quantid
ade

50

46

36

31

25

11

18

Onde a varivel quantidade est expressa em


toneladas. Pede-se:
A- a equao de regresso linear da quantidade
sobre o tempo.
B O coeficiente de correlao linear.
C A quantidade estimada para exportao em
2009.

Exerccios
18 A Empresa Squadrus Ltda., fabricante de implementos agrcolas de
alta tecnologia, realizou um levantamento do custo total de um de seus
produtos (Y), expresso em US$ 1.000,00, em funo do nmero total de
peas produzidas (X), expresso em unidades, durante cinco meses, com
o objetivo de montar uma regresso linear simples, entre essas
variveis, obtendo os somatrios:
x = 440
y = 120 xy = 12.300
x = 49.450
y = 3.200
Nessas condies, pede-se:
A A reta que melhor se ajuste a esses dados.
B O valor do coeficiente de correlao linear.
C O valor mais provvel dos custos fixos.
D O valor estimado do custo varivel para uma produo de 500
unidades.
E Admitindo-se um preo de venda de US$ 3.000,00, por unidade,
estimar a quantidade mnima que se deve produzir para se obter um
lucro de US$ 80.000,00

Estudo de Caso:
U. S. Department of
Transportation

Estudo de Caso: U.S.


Department of
Transportation

Como parte de um estudo de segurana no transporte, o U. S.


Department of Transportation levantou dados do nmero de
acidentes fatais por 1.000 carteiras de habilitao, e a
porcentagem de motoristas licenciados abaixo de 21 anos
que possuem habilitao em uma amostra de 42 cidades. Os
dados obtidos so apresentados na tabela 2.
Relatrio Gerencial:
A-) Desenvolva sumrios grficos e numricos dos dados.
B-) Use anlise de regresso para investigar a relao entre o
nmero de acidentes fatais e a porcentagem de motoristas
abaixo da idade de 21 anos. Discuta suas concluses.
C-) Quais concluses e/ou recomendaes voc pode derivar de
suas anlises?

Estudo de Caso: U.S.


Department of Transportation

ANEXO: Anlise de Regresso Linear Simples - Excel

Fonte: Prof. Canton (FEA USP)

ANEXO: Anlise de Regresso Linear Simples - Excel

Fonte: Prof. Canton (FEA USP)

ANEXO: Anlise de Regresso Linear Simples - Excel

Fonte: Prof. Canton (FEA USP)

ANEXO: Anlise de Regresso Linear Simples - Excel

RESUMO DOS RESULTADOS


Estatstica de regresso
R mltiplo
0.964564633
R-Quadrado
0.93038493
R-quadrado ajustado
0.921683047
Erro padro
4.609772229
Observaes
10
ANOVA
Regresso
Resduo
Total

gl
1
8
9

Coeficientes
Interseo
80
Tempo de Experincia (Anos) 4

SQ
2272
170
2442

MQ
2272
21.25

F
F de significao
106.9176
6.60903E-06

Erro padro
Stat t
valor-P
3.075344937 26.01334 5.12E-09
0.386843492 10.3401 6.61E-06

Fonte: Prof. Canton (FEA USP)

95% inferiores 95% superiores


72.90823727
87.09176273
3.107936731
4.892063269

ANEXO: Anlise de Regresso Linear Simples - Excel

RESUMO DOS RESULTADOS


Estatstica de regresso
R mltiplo
0.964564633
R-Quadrado
0.93038493
R-quadrado ajustado
0.921683047
Erro padro
4.609772229
Observaes
10

Coeficiente de Correlao Linear de Pearson


Coeficiente de Determinao : Neste exemplo 93 % da variabilidade
da varivel das vendas explicada pelo modelo
Nmero de observaes utilizadas no clculo dos coeficientes do modelo
de regresso

ANOVA
Regresso
Resduo
Total

gl
1
8
9

Coeficientes
Interseo
80
Tempo de Experincia (Anos) 4

SQ
2272
170
2442

MQ
2272
21.25

Erro padro
Stat t
3.075344937 26.01334
0.386843492 10.3401

F
106.9176471

valor-P
5.12002E-09
6.60903E-06

Coeficientes do modelo
Vendas = 80 + 4 anos de experiencia

F de significao
6.60903E-06

Testa a hiptese de que existe


relao linear entre as variveis.
Quando este valor for < 0,10
conclumos que existe relao
linear entre as variveis

95% inferiores
95% superiores
72.90823727
87.09176273
3.107936731
4.892063269

Quando esse valor for menor do que 0,10 a constante


deve fazer parte do modelo.

Valor = 0,000006609 Quando esse valor for menor do que 0,10 existe relao linear entre as variveis

Fonte: Prof. Canton (FEA USP)

Referncias
Bibliogrficas

Anderson, D; Sweeney, D e Williams, T;


ESTATSTICA APLICADA ADMINISTRAO E
ECONOMIA. So Paulo: Pioneira Thomson Learning,
2003.
Bruni, A. L. ESTATSTICA APLICADA GESTO
EMPRESARIAL. So Paulo: Atlas, 2007.
Kazmier, L. ESTATSTICA APLICADA ECONOMIA E
ADMINISTRAO. So Paulo: Mc Graw-Hill, 1982.
Oliveira, F. E. M. ESTATSTICA E PROBABILIDADE:
Exerccios Resolvidos e Propostos. 2 ed. So Paulo:
Atlas, 1999.
Smailes, J e Mc Graine, A. ESTATSTICA APLICADA
ADMINISTRAO COM EXCEL. So Paulo: Atlas,
2002.

Muito Obrigado!
Professor Leandro Morilhas
ljmorilhas@ig.com.br

Você também pode gostar