Você está na página 1de 41

Estatstica Aplicada

Prof. Jos Csar Cruz Jnior


Economista
Doutor em Economia Aplicada
ESALQ - USP
1

Retorno do IBOVESPA 17/03/2006 a 12/03/2008


8,00%

Quais informaes extramos simplesmente olhando este grfico?


6,00%

4,00%

2,00%

0,00%

-2,00%

-4,00%

-6,00%

-8,00%

Estas informaes so suficientes?


Retorno mdio no
perodo

0,12%

Risco

1,92%
2

Rendimento em ATR (kg/ton) para 25 coletas em 4 talhes

Qual talho proporcionou


maior rendimento?

Qual talho proporcionou


pior rendimento?

Qual o talho com


rendimentos mais estveis?

Grficos
ATR (kg/ton) para 4 talhes em 25 coletas
160,00

155,00

ATR (kg/ton)

150,00

145,00

140,00

135,00

130,00

125,00
1

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

Coleta

Talho 1

Talho 2

Talho 3

Talho 4

Estatsticas descritivas
Mdia

Desvio

Talho 1

142,50

3,09

Talho 2

143,25

3,17

Talho 3

146,00

4,50

Talho 4

145,30

4,02
5

Histogramas

Como representar melhor todas as


informaes?

Construo de tabelas
Construo de grficos
Histograma

Construo do histograma
uma representao grfica dos resultados
da distribuio de freqncias construda
por colunas cujas alturas so representadas
pelas freqncia de cada classe.

Exemplo:
Arquivo: Producao Unica.xls
8

O que necessrio?
70,00%
60,00%
50,00%
40,00%
30,00%
20,00%
10,00%
0,00%
1

1 Selecionar os dados a serem utilizados


2 Determinar o critrio de agrupamento
3 Definir o nmero de blocos
4 Determinar a amplitude (tamanho) de cada bloco
5 Definir as freqncias de cada bloco
6 Construir o grfico

Selecionando os dados
1 AutoFiltro
Selecione a linha de cabealho e marque a opo AutoFiltro

10

Selecionando os dados
2 Classifique os dados em ordem decrescente pelo
critrio da produo

3 Selecione, copie e cole as usinas com produo de


cana superior a 1.500 toneladas
4 Inserir frmulas auxiliares na tabela
11

Inserindo frmulas auxiliares


- SOMA(_ ; _)  soma os valores em um intervalo de
clulas
- MDIA(_ ; _)  soma dividido pelo nmero de clulas
no vazias no intervalo (definio a seguir)
- DESVAP(_ ;_)  desvio padro (definio a seguir)
- MXIMO(_ ;_)  valor mximo em um intervalo
- MNIMO(_ ;_)  valor mnimo em um intervalo
- CONT.NUM(_ ;_)  conta o nmero de clulas em um
intervalo que contm nmeros.
12

Determinao do nmero de blocos


Regra da raiz quadrada

n
Regra de Scott
3

2n
13

Determinao da amplitude da
cada bloco
- Sendo o nmero de blocos igual a 5, divida a
Amplitude Total (Mximo Mnimo) por 5 para
obter a Amplitude de cada bloco.
- Some o valor da amplitude ao valor Mnimo para
obter a limite superior do bloco 1.
- Some o valor da amplitude ao limite superior do
bloco 1 para obter o limite superior do bloco 2 e
assim por diante at o bloco 5.
14

Definindo as freqncias dos blocos

Insira a funo FREQNCIA, selecione as 5


linhas de cada bloco e aperte:
F2, CTRL + SHIFT + ENTER
TUDO JUNTO!!!!

15

Construindo o grfico...
Selecionar grfico em colunas
Na ltima etapa 
Posicionar grfico
como nova planilha

Freqncia
relativa ou
absoluta

16

Estatstica descritiva

17

Medidas de Tendncia Central


Mdia aritmtica
Produtividade por talho
Talho 1

Talho 2

Talho 3

Talho 4

70,00

78,00

85,00

80,00

70 + 78 + 85 + 80
4
313
X=
4
X = 78,25
X=

No Excel:
= MDIA( )

Arquivo de trabalho:
Estatistica descritiva.xls

18

Medidas de Tendncia Central


Mdia ponderada
Apropriada quando a importncia relativa das
observaes diferente
Talho 1

Talho 2

Talho 3

Talho 4

Produo

70,00

78,00

85,00

80,00

rea (ha)

60,00

40,00

70,00

30,00

70 x 60 + 78 x 40 + 85 x 70 + 80 x 30
60 + 40 + 70 + 30
15670
XP =
200
X P = 78,35

No h funo
pronta no Excel

XP =

19

Medidas de Tendncia Central


Mdia Geomtrica
Ex: Uma ao rendeu 10% no primeiro
semestre do ano e 30% no segundo. Qual o
rendimento mdio obtido?
Resposta: No foi 20%!

X G = n X 1 x X 2 x ... x X n
No Excel:
= MDIA.GEOMTRICA( )

XG =

1,10 x 1,30 1

X G = 1,43 1
X G = 19,58%
20

10

Medidas de Tendncia Central


Mediana
Sendo os valores de X ordenados em ordem crescente (X1 X2 ... Xn)
a mediana o valor tal que metade dos dados so iguais ou inferiores a
esse valor e a outra metade so iguais ou superiores ao mesmo.

A mediana o valor que ocupa a posio...

n +1
2

mdia entre

Se n mpar

n
n
e +1
2
2

Se n par

prefervel mdia quando existem valores discrepantes na


amostra de dados

21

Medidas de Tendncia Central


Moda
o valor que ocorre com maior freqncia, ou seja, o valor que
mais se repete na amostra de dados
Na ltima reunio do COPOM, uma entrevista apurou a opinio
de 9 economistas a respeito da reduo da taxa Selic. Os
valores por eles anunciados foram:
0,25

0,25

0,50

0,50

0,10

0,25

0,75

0,25

0,25

0,25

0,25

0,50

0,50

0,75

Calcule a mediana e a moda.


0,10

0,25

0,25

No Excel:
= MED( )

0,25

Mediana = Moda

No Excel:
= MODO( )

22

11

Medidas de Tendncia Central e


Medidas de Disperso

-1%

0%

1%

2% 3%

4%

5%

6%

7%

23

Medidas de Disperso
Amplitude total
a diferena entre o maior e o menor dos valores da amostra de
dados.
Amplitude total (AT) = Valor Mximo Valor Mnimo
til como forma de verificar o maior desvio e possibilita
verificar possveis erros na coleta ou de digitao dos dados.
No Excel:
= MXIMO( ) MNIMO( )
24

12

Medidas de Disperso
Varincia e desvio padro
A varincia de uma varivel X mede a disperso dos valores em
torno da mdia

(X
n

s =
2
X

i =1

X)

n 1

No Excel:
= VAR( )

Para se retornar unidade original da varivel X e obter uma


medida de melhor interpretao, calculamos a raiz quadrada da
varincia, ou seja, o desvio padro.

s X = s X2

No Excel:
= DESVPAD( )

25

Medidas de Disperso
Coeficiente de variao e erro padro da mdia
O CV expresso em
porcentagem da mdia de X.

CV (%) = 100

sX
X

til para comparar


variabilidades de diferentes
amostras, com mdias muito
desiguais ou unidades de
medida diferentes.

O erro padro da mdia d


idia da preciso ou da
representatividade da
estimativa obtida para mdia.

sX
sX =
n
26

13

Medidas de Disperso
Covarincia
Determina a relao entre dois conjuntos de dados.
Por exemplo, avalia se aumentos no preo de uma
ao A so acompanhados por aumentos no preo
da ao B.
a mdia do produto dos desvios de cada par de
ponto de dados

1 n
Cov( X , Y ) = ( X i X )(Yi Y )
n i =1

No Excel:
= COVAR(_;_ )
27

Medidas de Disperso
Correlao
Mede a intensidade com que se manifesta uma
associao linear entre duas variveis (adimensional).
Varia entre -1 a 1.

X ,Y =

Cov ( X , Y )
s X . sY

No Excel:
= CORREL(_;_ )

Valores positivos indicam a tendncia de uma varivel


aumentar quando a outra aumenta.
Valores negativos indicam que valores altos de uma
varivel esto associados a valores baixos da outra.
28

14

2 Dicas
Arquivo de trabalho: Estatstica descritiva.xls
1 - No Menu Ferramentas  Suplementos
selecione a opo Ferramentas de Anlise
Retorne ao Menu Ferramentas e selecione a
opo Anlise de dados
 Opo Histograma (semelhante funo
Freqncia)
29

2 Dicas
2 No menu Ferramentas selecione a opo Anlise de
dados.
 Opo Estatstica descritiva
No se esquea de selecionar a opo Resumo
estatstico

30

15

Aplicao em Finanas
Exerccio no EXCEL
A partir das mdias e varincias do Ibovespa e da soja, obtenha a
fronteira eficiente de investimentos, sabendo que:

X p = W A X A + WB X B

p = WA2 A2 + WB2 B2 + 2WAWB COVAB


Realize a mesma anlise com o Ibovespa e o fundo Sparta.

Arquivo de trabalho:
risco x retorno.xls

31

Noes de
probabilidade e
algumas aplicaes

32

16

Varivel aleatria
X uma varivel aleatria se a cada um de seus possveis
valores se associa uma probabilidade P(X)

X
Discreta
Contnua

f(X)

P(X)

Interesse: especificar a probabilidade dos


valores numricos assumidos pela
v.a., ou seja, representar a v.a. pela sua
distribuio de probabilidades. 33

O jogo do topa ou no topa


Escolha uma maleta na qual voc supe ter R$ 1.000.000,00. Elimine as
outras maletas, uma por vez. Quando o banqueiro fizer uma oferta, voc
pode ver a quantia oferecida e pode aceitar ou no.

34

17

Definies
Espao amostral (S): o conjunto formado por
todos os possveis e diferentes resultados
(eventos) de um experimento aleatrio. Estes
eventos devem ser mutuamente excludentes.

1.000.000,00

0,01
50,00

1,00

25.000,00
Diagrama de Venn do sorteio de uma mala
35

Algumas definies
P(A) = 0  o evento A nunca ocorrer
P(A) = 1  o evento A sempre ocorrer
P(A) sempre maior ou igual a 0
A soma das probabilidades de todos os resultados
sempre igual a 1
A probabilidade de um evento no ocorrer igual a
um menos a probabilidade do evento ocorrer

P( Ai ) =

1
n
36

18

P (0) = 0

P( A ) = 1 P( A)
P ( A B ) = P ( A) P ( A B )

P( A B ) = P( A) + P( B) P( A B )
Se A e B so eventos independentes ento:

P ( A B ) = P ( A) P ( B )
37

Topo ou no topo?

38

19

A Teoria da Utilidade
Esperada
Restam apenas 6 maletas!
O valor da utilidade esperada com a aposta dado
pela soma ponderada dos prmios pelas suas
respectivas probabilidades de ocorrncia. Como os
eventos so mutuamente excludentes:
E(U) = (100 x 0,1667)

E(U) = R$ 138.541,67

+ (400 x 0,1667)
+ (750 x 0,1667)
+ (5.000 x 0,1667)

Valor oferecido pelo


banqueiro =

+ (75.000 x 0,1667)

R$ 130.688,00

+ (750.000 x 0,1667)

39

Quanto havia na maleta 7?

Caso tivesse continuado no jogo, qual seria a


probabilidade de tirar, consecutivamente, as maletas
com os dois maiores valores (750.000 e 75.000)? Qual
seria a utilidade esperada do jogo aps a excluso
dessas 2 maletas?

40

20

Probabilidade condicional
A probabilidade condicional P(X|Y) entre os
eventos X e Y, pode ser obtida como o
resultado da diviso da probabilidade conjunta
P(X e Y) pela probabilidade do evento Y:

P( X | Y ) =

P( X Y )
P(Y )

41

Exerccio
Utilize o arquivo de trabalho precos.xls para responder s
seguintes perguntas:
Com base nos dados passados, determine qual a
probabilidade de subida e queda de preos.
Com base na resposta anterior, seria melhor assumir
uma posio comprada ou vendida no mercado futuro?
Determine a probabilidade condicional de que um dia de
elevao de preos seja seguido por outro dia de
elevao de preos, ou seja:

P[X t +1 1 X t 1] =

P[( X t +1 1) ( X t 1)]
P[ X t 1]
42

21

A Distribuio Normal

43

Distribuio Normal
Algumas caracterstica
importantes
Definida pela mdia e
desvio padro
Simtrica ao redor da
mdia
Funo densidade se
parece com um sino
Notao: X ~N(,2)

Funo densidade
1 X


1
2
f (X ) =
e
2

f(X)

44

22

Distribuio Normal

45

Para que serve?


Sabendo-se que a amostra possue distribuio normal, a
partir do clculo da mdia e desvio padro da amostra
(estimativas dos verdadeiros valores da populao), pode-se
construir a funo densidade e, para quaisquer valores
especficos, determina-se a rea sob a curva entre esses
dois valores. Ou seja, pode-se determinar a probabilidade
de uma varivel aleatria estar entre um intervalo de valores
f(X)

A rea total abaixo da


curva igual a 1

X
46

23

Um exemplo...
Sabendo que a varivel aleatria altura dos
alunos nesta sala (40 alunos) possui distribuio
normal com mdia 1,70 m e desvio padro igual a
0,10 m. Qual a probabilidade de encontrar uma
pessoa com altura entre 1,70 m e 1,75 m?
f(X)

?
1,70

1,75

47

Resposta
1, 75

P (1,70 < X < 1,75) =

1, 70

Tranqilo?

1
e
0,02

( X 1, 70 ) 2

0 , 02

NO!!!
NO!!!
NO!!! NO!!!
NO!!!
48

24

Resposta
Para resolver este tipo de problema
necessrio usar uma transformao 
padronizao
Se

Ento

X ~ Normal(,2)

Z ~ Normal(0,1)

Z=

Existem valores tabelados para Z, mas no para os Xs

49

Resposta
1,75 1,70
1,70 1,70
P (1,70 < X < 1,75) = P
<Z<

0,1
0,1

P (0 < Z < 0,5) = 0,1915 = 19,15%


Tabela Normal.pdf

50

25

Outro exemplo...
Sabendo que a varivel aleatria altura dos
alunos nesta sala (40 alunos) possui distribuio
normal com mdia 1,70 m e desvio padro igual a
0,10 m. Qual a probabilidade de encontrar uma
pessoa com altura superior a 1,90?
f(X)

ATENO!!
TABELA

?
X
1,70

1,90
51

Soluo
X 1,90 1,70
P( X > 1,90) = P
>
= P(Z > 2)
0,10

f(X)

0,5

?
1,70

1,90

Pela Tabela:

P ( Z > 2) = 0,5 0,4772 = 0,0228 = 2,28%


52

26

Na planilha eletrnica...
possvel criar uma distribuio normal em
laboratrio.
Informando os valores da mdia e desvio
padro possvel simular valores para uma
distribuio normal.

53

Gerao de nmeros aleatrios


Ferramentas  Anlise de dados  Gerao
de nmero aleatrio

200
180
160
140
120
100
80
60
40
20
0
1

10

11

12

13

54

27

Um exerccio prtico
Um grupo que desconhece o setor resolveu
investir em uma nova rea na cidade de
Piracicaba para plantao de cana de acar.
A produo ser vendida para uma das usinas
da regio. Foi solicitado ao engenheiro
agrnomo que ser o responsvel pelo novo
empreendimento que apresentasse ao grupo
investidor qual seria a receita bruta em um
cenrio pessimista. O que pode ser feito com
o que j aprendemos?
55

ETAPAS...
1. ETAPA  Identificao dos riscos
Produtividade da cana
Produtividade do ATR
Preo pago pela usina

2. ETAPA  Simular as variveis aleatrias


3. ETAPA  Determinar o cenrio pessimista
4. ETAPA  Determinar a receita bruta com certo
nvel de probabilidade
Arquivo de trabalho: Simulao receita.xls

56

28

AJUDA: a funo DIST.NORM


A funo DIST.NORM
informa qual o valor da rea
da funo de distribuio
normal acumulada abaixo
de um valor estabelecido
(X)

Simulao de produtividade
100,00%
80,00%

75.000 kg

60,00%
40,00%
20,00%
0,00%
1

10

11

57

12

AJUDA: a funo INV.NORM


A funo INV.NORM
informa qual o valor da
amostra (X) que separa as
reas de valor e (1-
) na
funo densidade normal.

Simulao de ATR
25,00%
20,00%

142,69

15,00%
10,00%
5,00%

84,22%

15,78%

15
5,
23

15
3,
53

15
1,
84

14
8,
45
15
0,
15

14
6,
76

14
5,
07

14
1,
68
14
3,
37

13
9,
99

13
8,
29

13
6,
60

0,00%

58

29

Teste de hipteses

59

Teste de Hipteses
O que ?
uma regra de deciso que permite rejeitar
ou no uma hiptese estatstica a respeito
dos parmetros de uma
populao, baseado em resultados de uma
amostra

60

30

Teste de Hipteses
Uma vez que tomar decises utilizando-se dados
da populao muito oneroso (tempo e dinheiro),
as decises so tomadas com base em dados
amostrais. Assim, no possvel afirmar com
100% de certeza qual das hipteses realmente a
verdadeira.

 nvel de significncia
Probabilidade de se cometer um erro ao
rejeitar a hiptese de igualdade ou nulidade
(H0) quando ela for verdadeira

61

Teste de Hipteses
No dia a dia, procuramos fazer hipteses
sobre o valor da mdia ou comparao
entre duas mdias. Por exemplo:
Verificar se as mdias das produtividades de dois
talhes so iguais
Verificar se as produtividades mdias de duas
usinas do mesmo grupo so as mesmas.

62

31

Teste t
Sendo X uma varivel com distribuio normal, podemos
testar hipteses a respeito do valor de sua mdia quando
a varincia da populao de X desconhecida utilizando
o teste t com (n -1) graus de liberdade

t=

estimador de

X
sX
n

sX

estimador de

X
63

Teste t para duas mdias


t=

X1 X 2
s12 s22
+
n1 n2
2

Graus de liberdade:

s12 s22
+
n n
GL = 12 2 2
s12 s22

n1 + n2
n1 1 n2 1

No ser preciso
calcular a
frmula no
brao!!!

64

32

Hipteses
Hiptese nula (H0)
Quando enunciada em termos quantitativos,
necessariamente uma igualdade.

1 = E(X1)  produtividade mdia do talho 1


2 = E(X2)  produtividade mdia do talho 2

H0 : 1 = 2
65

Hipteses
Hiptese alternativa (HA)
- 2 tipos
HA : 1 2

Teste bilateral

HA : 1 > 2
ou

Teste unilateral

HA : 1 < 2
66

33

Exemplo 1
Um produtor afirma a uma seguradora que sua
produtividade mdia em dez anos-safra de 83 t/ha cana
e desvio padro de 5 t/ha. No final da safra deste ano, o
agrnomo contratado pela seguradora recolhe 20 amostras
de cada um dos 20 talhes da propriedade e conclui que a
produtividade mdia amostral foi de 77 t/ha. Supondo que
a produtividade siga uma distribuio Normal, pode-se
confirmar o valor estimado pelo agrnomo ao nvel de
significncia de 1%?

67

Soluo
Mdia informada = 83 t/ha
Desvio padro = 5 t/ha
Atual = 77 t/ha
n = 20  GL = 19
a = 1%

t=

H0 : = 83 t/ha
HA : < 83 t/ha

77 83
6
=
= 5,3665
5
1,11803
20

Comparar com valor tabelado ao


nvel de 1% de significncia
68

34

Concluso
Como o valor da estatstica t tabelado (-2,8609)
para o nvel de significncia de 1% e 19 graus
de liberdade menor (em valor absoluto) que o
valor calculado (-5,3665), rejeita-se a hiptese
nula, ou seja, a produtividade mdia atual
inferior informada pelo produtor.

69

Organizando as idias...

Escreva todas as informaes disponveis


Monte as hipteses nula e alternativa
Calcule o valor do teste
Compare com o valor calculado com o
tabelado utilizando a Tabela ou a planilha
eletrnica
Conclua rejeitando ou no rejeitando a
hiptese nula.
70

35

Exemplo
Utilizando os dados do arquivo de trabalho
Estatistica descritiva.xls, crie testes de
hipteses comparando a mdia do talho
1 com as mdias dos demais talhes
(devem-se realizar, portanto, 3 testes).
Utilize um nvel de significncia de 5%.
Sugesto  Anlise de dados
No preciso calcular nada no brao
71

72

36

Intervalo de confiana para


mdia
Quando a mdia e o desvio padro so
conhecidos, o IC 100(1-)% dado por:

X t
2

sX
s
s
= X t X , X + t X
2
2
n
n
n

73

Regresso Linear

74

37

Regresso Linear Simples


Procura descrever a existncia de uma relao
funcional entre duas variveis por meio de um
modelo linear de 1. grau

Yi = a + bX i + ui
As estimativas dos parmetros a e b so
obtidas atravs do mtodo conhecido como
Mnimos Quadrados Ordinrios

75

O que queremos?
Consumo (R$)
FRA: Yi = 1 + 2 X i
FRP: E (Y | X i ) = 1 + 2 X i

Renda (R$)
76

38

Como os clculos so feitos?


Minimizando a soma do quadrado dos
resduos, chega-se seguinte expresso
na forma matricial:

= (XX ) (XY )
1

= Y X
=

cov(X , Y ) XY X Y
=
var(X )
X2
77

Um exemplo...
Qual o percentual ideal da produo que deve
ser usada para se fazer o hedge?
Diferena dos preos fsicos (S = St St-1)

Yt

Diferena dos preos futuros (F = Ft Ft-1)

Xt

Forma funcional

St = + Ft
Arquivo de trabalho: Razao de hedge.xls

78

39

Grfico
Razo de hedge tima por MQO - Passo Fundo/RS
4,00

y = 0,4407x + 0,2069
R2 = 0,5103

3,00

Variao no preo spot

2,00

1,00

(6,00)

(4,00)

(2,00)

2,00

4,00

6,00

8,00

(1,00)

(2,00)

(3,00)

(4,00)
Variao no preo futuro

S isto no suficiente!!!
79

Na planilha eletrnica...
Ferramentas  Anlise de dados  Regresso

O que preciso analisar?

Razo de
hedge tima

80

40

Obrigado!
Bom final de semana!
cesarcjr@usp.br

81

41