Escolar Documentos
Profissional Documentos
Cultura Documentos
QUANTITATIVOS
APLICADOS À
CONTABILIDADE I
Contato: lucasschwarz@usp.br
ESTATÍSTICA DESCRITIVA: MEDIDAS NUMÉRICAS
RESUMINDO CONJUNTOS DE DADOS POR MEIO DE MEDIDAS NUMÉRICAS.
ESTATÍSTICA DESCRITIVA COM MEDIDAS NUMÉRICAS
Medidas
numéricas
Dispersão/
Posição Forma Associação
Variabilidade
Forma da
Média Amplitude Covariância
distribuição
Coeficiente de
Mediana Variância Escores-z
correlação
Teorema de
Moda Desvio padrão
Chebyshev
Detecção de
Percentis e Coeficiente de
outliers e
Quartis variação
boxplots
CONJUNTO DE DADOS: POPULAÇÃO
Aluno Idade Altura Nota final Localização
A 20 170 9,5 Urbano
B 22 175 9,4 Urbano
C 23 174 9,8 Rural
D 21 163 10,00 Urbano
Se uso dados populacionais =
E 26 169 8,9 Rural Parâmetros populacionais
F 22 170 10,00 Urbano
G 30 179 7,4 Urbano
H 41 185 9,2 Urbano
I 21 163 8,7 Rural
J 20 167 4,7 Urbano
CONJUNTO DE DADOS: AMOSTRA
Se as medidas calculadas
referem-se para a dados de
uma amostra, são chamadas
estatísticas da amostra
NOTAÇÃO ESTATÍSTICA
Média
Mediana
Moda
Percentis
Quartis
MÉDIA
𝑥=
∑ 𝑥𝑖
𝑛
Número de observações
na amostra
MÉDIA POPULACIONAL (𝜇)
𝜇=
∑ 𝑥𝑖
𝑁
Número de observações
da população
MÉDIA AMOSTRAL
Arquivo: Apartamentos
MÉDIA AMOSTRAL
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
14
MÉDIA AMOSTRAL
𝑥=
∑ 𝑥𝑖 34.356
= =𝟒𝟗𝟎 ,𝟖𝟎
𝑛 70
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
15
575 575 580 590 600 600 600 600 615 615
MÉDIA PONDERADA
A média ponderada considera que cada observação tem um peso que reflete sua
importância relativa.
MÉDIA PONDERADA
Exemplo:
Média ponderada das notas de n turmas, com o Número de alunos como ponderação.
MÉDIA PONDERADA
5 8 40
3 5 15
2 7,5 15
=
MÉDIA PONDERADA
Uma delas é que a taxa representa a remuneração requerida sobre o capital investido
em uma determinada empresa, seja na forma de debt ou de equity;
O custo médio ponderado de capital nada mais é do que uma média ponderada baseada na
proporção de equity e dívida.
MÉDIA PONDERADA: RELEVÂNCIA
MÉDIA PONDERADA
https://www.investidorpetrobras.com.br/resultados-e-comunicados/c
entral-de-resultados/
(DFP)
https://investors.coca-colacompany.com/ (Form 10-K)
MÉDIA GEOMÉTRICA
Suponha que queremos calcular quanto R$100 investidos no fundo no início do ano
1 valeriam no final do ano 10.
O saldo do ano 1 então se torna o saldo inicial do ano 2. No ano 2, o retorno foi de 28,7%.
R$100(0,779)(1,287) = 100,26
MÉDIA GEOMÉTRICA
Podemos generalizar isso para os demais anos. Para os 10 anos, teríamos que o
saldo final do investimento seria de:
R$100(0,779)(1,287)(1,109)(1,049)(1,158)(1,055)(0,630)(1,265)(1,151)(1,021)
=
R$100*(1,334493) = R$133,4493
MÉDIA GEOMÉTRICA
Se trata do valor central quando os dados são organizados em ordem crescente (menor valor para
o maior valor);
Quando o número de observações é impar, a mediana é o valor que ocupa a posição central;
Quando o número é par, a mediana é a média dos valores correspondents às duas
observações centrais.
MEDIANA
Para um número ímpar de observações
26 18 27 12 14 27 19 7 observações
12 14 18 19 26 27 27 em ordem crescente
Mediana = 19
40
MEDIANA
26 18 27 12 14 27 30 19 8 observações
12 14 18 19 26 27 27 30 em ordem crescente
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
42
MEDIANA
Passo a passo:
?
SE EXISTEM MUITOS VALORES EXTREMOS, A MEDIANA É MAIS
ADEQUADA DO QUE A MÉDIA
Arquivo: MediavsMediana
MODA
1, 1, 1, 3, 4, 5, 6, 10 – variável unimodal
MODA
450 ocorre mais frequentemente (7 vezes)
Moda = 450
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 51
PERCENTIS
O p-ésimo percentil é um valor tal que pelo menos p por cento das
observações são menores ou iguais a esse valor e pelo menos (100 – p)
por cento das observações são maiores ou iguais a esse valor.
i = (p/100)n
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570 56
575 575 580 590 600 600 600 600 615 615
90º PERCENTIL
“Pelo menos 90% “Pelo menos 10%
dos itens possuem um dos itens possuem um
valor de 585 ou menos" valor de 585 ou mais"
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570 57
575 575 580 590 600 600 600 600 615 615
PERCENTIS
3710 3755 3850 3880 3880 3890 3920 3940 3950 4050 4130 4325
Posição 1 2 3 4 5 6 7 8 9 10 11 12
Aproximadamente 80% dos salários estão abaixo do salário de quem recebe 4050
Aproximadamente 20% dos salários estão acima do salário de quem recebe 4050.
PERCENTIS
Aproximadamente 80% dos salários estão abaixo do salário de quem recebe 4082
Aproximadamente 20% dos salários estão acima do salário de quem recebe 4082.
E O 50º PERCENTIL?
= 6,5
25% dos dados 25% dos dados 25% dos dados 25% dos dados
3710 3755 3850 3880 3880 3890 3920 3940 3950 4050 4130 4325
Posição 1 2 3 4 5 6 7 8 9 10 11 12
575 575 580 590 600 600 600 600 615 615
QUINTIS, DECIS...
Decis (10º, 20º, 30º, 40º, 50º, 60º, 70º, 80º, 90º percentis)
FIXANDO
2) Considere uma amostra com os valores 10, 20, 21, 17, 16 e 12.
Calcule a média e a mediana.
FIXANDO
5) Considere uma amostra com os valores 27, 25, 20, 15, 30, 34, 28 e
25. Calcule o 20º, 25º, 65º e 75º percentis.
6) Considere uma amostra com os valores 53, 55, 70, 58, 64, 57, 53,
69, 57, 68 e 53. Calcule a média, a mediana e a moda.
MEDIDAS DE VARIABILIDADE
(DISPERSÃO)
MEDIDAS DE VARIABILIDADE
Amplitude
Amplitude Interquartil
Variância
Desvio Padrão
Coeficiente de Variação
AMPLITUDE
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570 75
575 575 580 590 600 600 600 600 615 615
AMPLITUDE INTERQUARTIL
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570 77
575 575 580 590 600 600 600 600 615 615
VARIÂNCIA
78
VARIÂNCIA
2
𝑠=
∑ (𝑥 ¿ ¿𝑖− 𝑥)
¿
2
2
𝜎=
∑ (𝑥 ¿ ¿𝑖− 𝜇)
¿
2
𝑛− 1 𝑁
Para Amostra Para População
79
VARIÂNCIA
∑ (𝑥 𝑖 − 𝑥 )
A variância e o desvio padrão são dois conceitos que costumam
andar juntos.
DESVIO PADRÃO
81
DESVIO PADRÃO
𝑠= √ 𝑠
2
𝜎 =√ 𝜎 2
Expressamos em porcentagem.
COEFICIENTE DE VARIAÇÃO
( 𝑠
𝑥
× 100 % ) ( 𝜎
𝜇
× 100 % )
Para Amostra Para População
84
VARIÂNCIA, DESVIO PADRÃO E COEFICIENTE DE VARIAÇÃO
Variância
𝑠=
∑2
2
(𝑥 ¿ ¿ 𝑖 − 𝑥)
=2.996,16 ¿
𝑛− 1
𝑠= √ 𝑠 =√ 2996,16=54,74
2 padrão é de
cerca de 11%
da média
Coeficiente de Variação
( 𝑠
𝑥
×100 %= ) (
54,74
490,80 )
×100 %=11,15 % 85
FIXANDO
7) Considere uma amostra com os valores de dados de 10, 20, 12, 17 e 16. Calcule a
amplitude.
8) Considere uma amostra com os valores de dados de 10, 20, 12, 17 e 16. Calcule a
variância e o desvio padrão.
9) Considere uma amostra com os valores de dados de 27, 25, 20, 15, 30, 34, 28 e
25. Calcule a amplitude, a variância e o desvio padrão.
MEDIDAS DE FORMA
MEDIDAS DE FORMA
Formas de distribuição;
Escores-z;
Teorema de Chebyshev;
Regra Empírica;
Detecção de pontos fora da curva (outliers).
MEDIDAS DE FORMA
Já vimos que um histograma fornece uma apresentação gráfico que mostra a forma
de uma distribuição (altura das pessoas por país, por ex.);
( )
𝟑
𝒏 𝒙𝒊 − 𝒙
𝑨𝒔𝒔𝒊𝒎𝒆𝒕𝒓𝒊𝒂=
(𝒏 −𝟏)(𝒏−𝟐)
∑ 𝑺
FORMA DE DISTRIBUIÇÃO: ASSIMETRIA
Moderadamente inclinado
Assimetria = -0,31
para a esquerda: 0,35
0,30
Frequência Relativa
0,25
Assimetria é negativa 0,20
91
FORMA DE DISTRIBUIÇÃO: ASSIMETRIA
Frequência Relativa
0,25
Assimetria = 0
Simétrico 0,35
0,30
Frequência Relativa
0,25
Assimetria é zero 0,20
0,15
Média e mediana são iguais
0,10
0,05
0
93
FORMA DE DISTRIBUIÇÃO: ASSIMETRIA
Fortemente inclinado para a direita
Assimetria é positiva (acima de 1,0)
A média tende a ser maior que a mediana
0,35
Assimetria = 1,25
Frequência Relativa
0,30
0,25
0,20
0,15
0,10
0,05 94
0
FORMA DE DISTRIBUIÇÃO: ASSIMETRIA
Aluguel de Apartamentos;
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 96
FORMA DE DISTRIBUIÇÃO:
ASSIMETRIA
0,25
0,20
0,15
0,10
0,05
0 97
MEDIDAS DE FORMA
ESCORES-Z
Observações menores que a média da amostra terão um escore-z menor que zero;
Observações maiores do que a média da amostra terão um escore-z maior que zero;
1,54 1,54 1,63 1,81 1,99 1,99 1,99 1,99 2,27 2,27
ESCORES-Z
Esse teorema nos permite fazer afirmações sobre a proporção dos valores de
dados que devem estar contidos em um número específico de desvios padrão da
média.
Por exemplo:
Seja = 1,5 com = 490,80 e = 54,74
Pelo menos (1 – 1/(1,5)2) = 1 – 0,44 = 0,56 ou 56% dos aluguéis devem estar entre
= 490,80 – 1,5(54,74) = 409
e
= 490,80 + 1,5(54,74) = 573
Atualmente, 86% dos aluguéis estão entre 409 e 573
108
REGRA EMPÍRICA
109
REGRA EMPÍRICA
99,72%
95,44%
68,26%
m
x
m – 3s m – 1s m + 1s m + 3s 110
m – 2s m + 2s
REGRA EMPÍRICA
Arquivo: Altura.
REGRA EMPÍRICA
REGRA EMPÍRICA
POR QUÊ IMPORTA?
1,54 1,54 1,63 1,81 1,99 1,99 1,99 1,99 2,27 2,27
FIXANDO
a) 20 a 40
b) 15 a 45
c) 25 a 35
ANÁLISE EXPLORATÓRIA DE DADOS
ANÁLISE EXPLORATÓRIA DE DADOS
129
REGRA DE CINCO ITENS
425 430 430 435 435 435 435 435 440 440
Menor Valor = 425 440 440 440 445 445 445 445 445 450 450
Primeiro Quartil = 445 450 450 450 450 450 460 460 460 465 465
Mediana = 475
Terceiro Quartil = 525 465 470 470 472 475 475 475 480 480 480
Maior Valor = 615 480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
130
DESENHOS ESQUEMÁTICOS (BOX PLOTS)
O retângulo é delimitado pelo primeiro e terceiro quartil;
Uma linha vertical é desenhada no retângulo na localização da
mediana (segundo quartil);
375 400 425 450 475 500 525 550 575 600 625
Q1 = 445 Q3 = 525
131
Q2 = 475
DESENHOS ESQUEMÁTICOS (BOX PLOTS)
132
DESENHOS ESQUEMÁTICOS
(BOX PLOTS)
Não existem outliers (valores abaixo de 355 ou acima de 645) nos dados de
aluguéis de apartamentos
133
DESENHOS ESQUEMÁTICOS
(BOX PLOTS)
Limite Limite
Inferior Superior
375 400 425 450 475 500 525 550 575 600 625
𝑠 𝑥𝑦 =
∑ ( 𝑥 𝑖 − 𝑥 )( 𝑦 𝑖 − 𝑦 )
Para Amostra
𝑛 −1
A covariância é calculada da seguinte forma
𝜎 𝑥𝑦 =
∑ ( 𝑥𝑖 − 𝜇 𝑥 ) ( 𝑦 𝑖 −𝜇 𝑦 ) Para População
𝑁
139
COVARIÂNCIA
Um valor positivo para indica uma associação linear positiva entre x e y; quanto
maior x, maior o y.
Um valor negativo para indica uma associação linear negativa; quanto maior o x,
menor o y.
Um valor para próximo a zero indica que não há associação linear entre x e y.
COVARIÂNCIA
O problema de usar a covariância é que ela mede a intensidade de uma relação linear com base
nas unidades de medida entre x e y;
Imagine uma relação entre altura (x) e peso (y). Eu teria uma covariância bem maior ao utilizar
altura em centímetros ao invés da altura em metros – a intensidade da relação, entretanto, é a
mesma.
Solução?
COEFICIENTE DE CORRELAÇÃO
𝑠 𝑥𝑦
𝑟 𝑥𝑦 = Para Amostra
Onde é o coeficiente de correlação amostral;
é a covariância amostral;
𝑠𝑥 𝑠𝑦
é o desvio padrão amostral de x;
é o desvio padrão amostral de y. 𝜎 𝑥𝑦
𝜌 𝑥𝑦 = Para População
𝜎𝑥 𝜎 𝑦
144
COEFICIENTE DE CORRELAÇÃO
146
COEFICIENTE DE CORRELAÇÃO
Regra de bolso:
x y
Média Total
Desv. Pad. 149
COEFICIENTE DE CORRELAÇÃO
Total = 99
COVARIÂNCIA E COEFICIENTE DE CORRELAÇÃO
Covariância da Amostra
𝑠 𝑥𝑦 =
∑ ( 𝑥 𝑖 − 𝑥 )( 𝑦 𝑖 − 𝑦 )
=
99
=11
𝑛 −1 10 − 1
Coeficiente de Correlação da Amostra
𝑠 𝑥𝑦 11
𝑟 𝑥𝑦 = = =0,9305
𝑠 𝑥 𝑠 𝑦 (1,49)(7,93)
151
COMBINANDO VARIÂNCIA, COVARIÂNCIA E DESVIO PADRÃO
NO MUNDO REAL: UM PRÊMIO NOBEL COMO RESULTADO
COMBINANDO VARIÂNCIA, COVARIÂNCIA E DESVIO PADRÃO
NO MUNDO REAL: UM PRÊMIO NOBEL COMO RESULTADO
A carteira ideal seria aquela que apresenta a melhor relação risco x retorno
Arquivo em R: Markowitz
FIXANDO
4 6 11 3 16
50 50 40 60 30