Escolar Documentos
Profissional Documentos
Cultura Documentos
I – OBJETIVO
Com a atual disponibilidade dos recursos computacionais e a partir do aprofundamento do estudo
das ciências matemática e estatística, inúmeros são os avanços evidenciados na análise de dados e
modelagem de fenômenos, sejam estes de natureza comportamental, na área de saúde, econômica ou
atuarial, diferenciando estas ciências das demais, ao permitir que se testem empiricamente arcabouços
e modelos, por exemplo.
Em suma, em um estudo empírico o pesquisador se depara com o usual problema de analisar e
entender um determinado conjunto de dados relevante ao seu objetivo particular. Assim, o primeiro
passo em estudos aplicados consiste em sujar as mãos com os dados, visando transformá-los em
informações, de forma que possam fundamentar comparações e conclusões.
Os objetivos serão: (i) propiciar ao aluno não somente um maior contato com métodos quantitativos
per si, mas sim familiarizá-lo com as técnicas, fazendo-o reconhecer sua relevância e aplicação quando
da solução de modelos econômicos e (ii) conjugar conhecimentos acadêmicos e profissionais através
de uma exposição clara, didática e objetiva, abordando conceitos teóricos que norteiam a análise e o
raciocínio analítico, como também propondo casos e exercícios, dos mais simples e usuais aos mais
complexos e específicos.
II – EMENTA
Introdução; Análise dos dados; Métricas estatísticas; Análise bidimensional.
IV – REFERÊNCIAS BIBLIOGRÁFIAS
Bibliografia Básica:
[B&M] Bussab, Wilson e Morettin, Pedro, “Estatística básica”. Ed. Saraiva, 6ª edição, 2010
[FBS&C] Fávero, L. Belfiore, P., Silva, F. e Chan, B., “Análise de dados”. Ed. Campus, 1ª ed, 2009
V – METODOLOGIA
Aulas presenciais teóricas
Apresentação de estudos de caso
Resolução de exercícios
Utilização de softwares (Excel)
VI – AVALIAÇÃO
A nota final será determinada pela média ponderada das seguintes notas parciais:
80% referentes a avaliações individuais
20% referentes ao trabalho em equipe
1. Introdução ............................................................................................................................................................................ 5
A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se a amostra é confiável
e proporciona inferir sobre a população, chamamos de inferência estatística. Neste contexto, mesmo não
sendo pertencendo ao escopo desta seção, é importante que venhamos a saber que os parâmetros são valores
singulares que existem na população e que servem para caracterizá-la, sendo necessário examinar toda a
população, enquanto, estimativa é um valor aproximado do parâmetro, calculado com o uso apenas de uma
amostra.
Neste contexto, devemos ainda definir o que seria uma estatística. Ainda com o objetivo de resumir,
ou descrever o conjunto de dados, usaremos algumas medidas características, usadas para representar, de uma
forma ou de outra, a própria distribuição do conjunto de dados. Qualquer medida obtida a partir das
informações dos dados é chamada estatística.
O objetivo de se calcular estatísticas é resumir as informações obtidas em um único valor, de modo
que esse valor dê uma característica da amostra, que possa nos levar a ter uma idéia de uma característica da
população. Exemplos básicos de estatísticas seriam, por exemplo, a soma dos anos de estudo dos funcionários
pertencentes á amostra, ou mesmo, o valor de peso do aluno mais “magro” desta sala.
Para que a inferência seja válida, é necessário que haja um bom uso da técnica de amostragem,
determinando corretamente a população, dimensionando precisamente o tamanho da amostra e primando
pela aleatoriedade, sendo esta última característica extremamente relevante para que venhamos a garantir,
tanto quanto possível, o acaso na escolha.
Um último aspecto a ser analisado é disposição dos dados em questão, se estes se encontram
identificados pelo caráter variável ao longo do tempo ou se dentre diferentes elementos.
Para melhor entendermos o primeiro caso, observemos a tabela 1.2. a seguir.
Nela, possuímos valores coletados de várias características, como por exemplo, receita operacional,
exportações, etc., para apenas um elemento, ou seja, a Empresa XXX. Claramente os valores para cada uma
dessas características estão sofrendo alteração de uma observação para outra em razão do efeito temporal.
Estamos diante, portanto de séries temporais de características de uma mesma empresa.
Para segundo caso, voltemos a observar a tabela 1.1. Nela não há efeito temporal influenciando os
valores, uma vez que foram todos coletados em um mesmo período. O que faz com que haja diversos valores
para uma mesma característica, como salário, por exemplo, são os diversos elementos observados, ou seja, os
diversos funcionários da amostra. Dizemos comumente que estamos diante de dados cross-section, ou em corte
transversal. Este detalhamento será explorado na seção seguinte.
Em softwares como o Statistical Package for the Social Sciences (SPSS), ou ainda o Microsoft Access, é
possível criar rótulos (labels) de variáveis qualitativas, sejam estas nominais ou ordinais, assim como planilhas
ricas em macros para variáveis quantitativas.
Com relação à obtenção direta dos dados a partir de questionários, é preciso que este seja estruturado
tendo em vista o tratamento a ser realizado nos dados, assim como o objetivo final da pesquisa. Em teoria da
amostragem, assim como nas disciplinas aplicadas, são abordadas práticas úteis na elaboração de
questionários.
“Utilizam-se 155 observações de retornos mensais de índices de bolsas de valores dos BRICs entre janeiro/1998
e novembro/2010 (fontes: CMA e Bloomberg). São eles Índice Bovespa (São Paulo, Brasil), Shanghai Composite (Xangai,
China), SENSEX-30 (Bombaim, Índia) e o Russian Trading System Index (Moscou, Rússia).
As características e códigos dos índices são descritas na tabela 2.1., enquanto as principais estatísticas descritivas
estão na Tabela 2.2.”
Tabela 2.1.
O interessante nestas tabelas é que na primeira, há somente dados cadastrais, ou seja, qualitativos
sobre os índices das bolsas, enquanto na segunda tabela, constam apenas dados numéricos, os quais não
foram exatamente coletados de alguma fonte, mas sim calculados pelos autores. Trata-se de estatísticas
descritivas associadas aos 4 momentos da distribuição de probabilidade, objeto de estudo da seção 3.
Dispersão X vs. Y: Pode ser útil para a análise que se consiga visualizar em um locus gráfico, possíveis
padrões de relação entre duas variáveis distintas, sendo neste caso aconselhável o uso de um gráfico de
dispersão nos eixos X e Y. A título de ilustração, observemos os diagramas a seguir na figura 2.3.
Figura 2.3: Gastos com Previdência Social e proporção da população com 65 anos ou mais
Perfazendo a análise de variáveis abordadas no estudo de Giambiagi et al. (2007), seria acertado esperar que
a proporção de pessoas acima de 65 anos na população do país e o percentual do PIB gasto com benefícios previdenciários
apresente uma correlação positiva. A Figura 5 traz esta realidade, em que se observa que países com populações mais
idosas gastam mais com previdência, o que os coloca no quadrante direito superior. Por outro lado, países considerados
jovens tendem a permanecer no quadrante esquerdo inferior. Já no quadrante direito inferior, apesar da população mais
velha, situam-se nações que registram gastos modestos, geralmente explicado por questões culturais, sistemas eficientes
alcançados por reformas prévias ou forte crescimento do PIB. O Brasil é o único país da análise que se encontra deslocado
de sua realidade demográfica, mas com dispêndios em níveis semelhantes a de países como Holanda e Reino Unido.
Diante deste cenário, verifica-se que o Brasil é um país fora do padrão internacional, com regras generosas,
incompatibilidade demográfica, baixo esforço contributivo ao mesmo tempo em que repõe parcelas elevadas da renda. Um
panorama tão custoso do ponto de vista fiscal exige a adoção mandatória de medidas em esforço mútuo por parte do
Estado e da sociedade.”
Distribuição de freqüência: quando da análise de dados, é comum procurar conferir certa ordem
aos números tornando-os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes
Figura 2.4: Histograma e possíveis distribuições (fitting) de operações descobertas de aquisição de títulos
públicos do governo americano de curto prazo
Normalmente, as operações com ativos financeiros possuem retornos brutos em torno de 1,0, sendo
possível observar neste histograma (statigraphics ou easyfit) que há uma maior frequência de retornos entre
0,93 e 1,03, com poucas observações a partir de 1,15 ou abaixo de 0,89. É possível ainda observar que
distribuições melhor fitam o histograma.
Figura 2.5: Retorno acumulado nominal mensal dos índices dos BRIC´s.
0
Dec-97 Dec-98 Dec-99 Dec-00 Dec-01 Dec-02 Dec-03 Dec-04 Dec-05 Dec-06 Dec-07 Dec-08 Dec-09
Mapa: o uso de mapas com cores diferentes para variáveis quantitativas ou qualitativas é menos comum,
mas igualmente útil quando da necessidade em se observar muitas observações ao mesmo tempo, todas elas
sobre uma mesma variável, a qual assume diferentes valores em um mesmo instante de tempo para várias
economias.
Observe o exemplo da figura 2.6.
A partir de 1995, o aumento do universo de beneficiários, a crise econômica e a política de concessão de ganhos
reais do salário mínimo serviram como catalisadores do déficit. Quando se registrou o primeiro resultado previdenciário
negativo, iniciaram-se as tentativas de combate à sua expansão. Como reflexos desta necessidade, foram aprovadas a
Emenda Constitucional n.º 20 de 1998, que estabeleceu, em linhas gerais, a relação entre a fonte de custeio e os benefícios,
e a Lei n.º 9.876/99, normativo que instituiu o fator previdenciário com objetivo de desestimular a aposentadoria precoce.
300.000 8%
7%
250.000
6%
200.000
5%
150.000 4%
Milhões
3%
100.000
2%
50.000 1%
0%
0
1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010
-1%
-50.000
-2%
-100.000 -3%
Saldo previdenciário/ PIB Arrecadação líquida/ PIB Despesa com benefícios/ PIB
2.3. Exercícios
Exercício #1. Observe a base de dados contida na Tabela 2.3.
a) Construa um histograma para o saldo previdenciário. Comente.
b) Construa um gráfico de dispersão (eixos X e Y) para as variáveis arrecadação líquida e despesas
com benefícios. Comente se há algum padrão entre estas duas grandezas.
Exercício #2. Observe os dados contendo índices de variação de preço (inflação) de diversas
economias em vários continentes na Tabela 2.4.
a) Identifique a melhor forma de representar graficamente estes dados.
b) Monte um histograma para as inflações de 2007 e outro para as inflações de 2011. Compare e
comente.
Tabela 2.4.
Exercício #4. Observe os Patrimônios líquidos das empresas registradas junto à ANS como
filantrópicas nos anos de 2008 a 2010 (Tabela 2.6.). Monte um histograma de cada cross-section para cada ano.
É possível inferir algo sobre a crise financeira de 2008 sobre este segmento? Seria necessário ou recomendável
retirar algumas das observações, em razão do seu comportamento extremo na amostra?
IRMANDADE DA SANTA CASA DE MISERICORDIA DE LIMEIRA 6.221 4.876 5.612 SBH SANTA CASA DE MISERICORDIA DE RIBEIRAO PRETO -21.270 -17.861 -17.889,00
IRMANDADE DA SANTA CASA DE MISERICÓRDIA DE MAUÁ 1.021 2.511 2.436 SOCIEDADE BENEFICENTE UNIÃO OPERÁRIA DE ARARAQUARA 1.755 1.217 1.021,00
PL de filantrópicas
IRMANDADE DA SANTA CASA DE MISERICÓRDIA DE MUZAMBINHO 1.669 1.918 2.145 SOCIEDADE DE BENEFICÊNCIA E FILANTROPIA SÃO CRISTOVÃO 51.674 45.197 45.650,00
IRMANDADE DA SANTA CASA DE MISERICÓRDIA DE OSVALDO CRUZ 809 778 706 SOCIEDADE ESPANHOLA DE BENEFICENCIA 6.546 6.160
IRMANDADE DA SANTA CASA DE MISERICÓRDIA DE PIRACICABA 35.032 31.359 27.535 SOCIEDADE ITALIANA DE BENEFICÊNCIA E MUTUO SOCORRO -3.341 -2.744 945,00
IRMANDADE DA SANTA CASA DE MISERICÓRDIA DE RIO CLARO 13.110 10.497 7.423 SOCIEDADE LITERÁRIA E CARITATIVA SANTO AGOSTINHO 53.810 54.824 54.545,00
IRMANDADE DA SANTA CASA DE MISERICÓRDIA DE SÃO JOSÉ DO RIO PRETO 28.620 24.779 21.108 SOCIEDADE OPERÁRIA HUMANITÁRIA 2.857 3.779 3.713,00
IRMANDADE DA SANTA CASA DE MISERICÓRDIA DE SÃO ROQUE 2.728 2.994 1.916 STA CASA MIS N SRA FÁTIMA E BENEF PORTUGUESA DE ARARAQUARA 7.650 -729 -1.140,00
IRMANDADE DA SANTA CASA DE MISERICÓRDIA DE SOROCABA 30.991 23.471 28.238
Tabela 2.7.
PL de filantrópicas
BOGOTÁ BUENOS AIRESCARACAS LIMA SANTIAGO SÃO PAULO
Data
IGBC MERVAL IBVC IGBVL IPSA IBOVESPA
𝑛
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 𝑥𝑖
𝑋̅ = =∑
𝑛 𝑛
𝑖=1
Quando do cálculo de algumas estatísticas, passa a ser relevante que venhamos a definir se estamos
trabalhando com toda a população ou se apenas com uma amostra desta. Sendo a média a estatística em
questão, quando do estudo de uma população e não de uma amostra, o que muda é apenas a letra que
denota a média populacional aritmética (𝝁), apesar de 𝝁 e 𝑿 ̅ possuírem exatamente a mesma fórmula.
Exemplo 3.1: Calcule o a receita operacional média e o lucro líquido médio da empresa XXX, com
base na amostra de tempo durante 2003 a 2006. Compare estes valores. Ver Tabela 3.1., a seguir.
Tabela 3.1.
Indicadores financeiros selecionados da Empresa XXX (quadriêncio 2003 – 2006)
1
Algumas das outras medidas de posição existentes são as separatrizes, as quais que englobam: os decis, os quartis e os percentis.
2
Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e biquadrática.
𝑛
𝑛
𝑛
𝐺 = √𝑥1 . 𝑥2 … . 𝑥𝑛 = √∏ 𝑥𝑖
𝑖=1
𝑛
𝑛 1
𝐻= = 𝑛. ∑
1 1 1 𝑥𝑖
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 𝑖=1
Exemplo 3.2: Em uma certa situação, a média harmônica provê a correta noção de média. Por
exemplo, se metade da distância de uma viagem é feita a 40 km por hora e a outra metade da distância a 60
km por hora, então a velocidade média para a viagem é dada pela média harmônica, que é 48; isso é, o total
de tempo para a viagem seria o mesmo se se viajasse a viagem inteira a 48 quilômetros por hora. Note,
entretanto que se a viagem fosse metade do tempo em uma velocidade e a outra metade na outra velocidade,
a média aritmética, nesse caso 50 km por hora, proveria a correta noção de média.
Exemplo 3.3: Em finanças, a média harmônica é usada para calcular o custo médio de ações
compradas durante um período. Por exemplo, um investidor compra $1000 em ações todo mês durante três
meses. Se os preços na hora de compra forem de $8, $9 e $10, então o preço média que o investidor pagou
por ação é de $8,926. Entretanto, se um investidor comprasse 1000 ações por mês, a média aritmética seria
usada. Outras utilizações são em previsões do tempo que é o campo estudado pelos meteorologistas.
Exemplo 3.4: Se um investimento rende 50% no primeiro ano e 90% no segundo ano, qual o
rendimento médio desse investimento?
𝐴𝑇 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
Nesta relação, 𝑥𝑚á𝑥 e 𝑥𝑚í𝑛 são as observações de maior e menor valor na amostra, respectivamente.
Observemos o exemplo básico a seguir, para melhor compreendermos tal medida, a única estatística
de dispersão que não faz uso de nenhuma medida de posição como ponto de referência.
Exemplo 3.13: Observemos novamente a tabela 3.1. Qual a amplitude do investimento da empresa
XXX, ao longo do período compreendido entre 2003 e 2006?
Observando os dados e aplicando a definição de a amplitude, obtemos o valor de dado por 25.324
– 1988, em US$ milhões.
O mais sério inconveniente em se usar apenas a amplitude total como medida de dispersão em uma
análise consiste no fato de que esta estatística só leva em conta os dois valores extremos da série,
desconsiderando todo o conjunto de valores intermediários. Porém, por mais simples e pouco informativa
que possa parecer, fazemos uso da amplitude total diariamente, quando, por exemplo, queremos determinar
a amplitude da temperatura ao longo de um dia, ou mesmo no controle de qualidade ou como uma medida
de cálculo bem rápido, sem muita exatidão.
Inconveniências e limitações a parte, passamos agora ao estudo de medidas de dispersão mais
relevantes, as quais fazem uso da média aritmética como referência, por a considerarem a mais importante
das medidas de tendência. Neste contexto, novamente passa a ser relevante que venhamos a definir se estamos
trabalhando com toda a população ou se apenas com uma amostra desta.
Variância: A variância populacional, 𝜎 2, é uma medida dada pela razão entre soma dos quadrados
dos desvios de todas as observações (relativamente à sua média) e quantidade total de observações dessa
população. A razão dos desvios elevados ao quadrado se dá, pois, de acordo com a propriedade 4 da média,
caso fizéssemos uso apenas dos desvios, esta soma seria nula!
A priori, tida como complicada e de difícil determinação, estamos diante de uma medida
extremamente relevante e de fácil manuseio, como veremos a partir dos exemplos e exercícios.
3
Para casos bem específicos de análise de dispersão, poderia vir a ser útil ainda o uso da distância interquartílica.
𝑛
2
(𝑥1 − 𝜇)2 + (𝑥2 − 𝜇)2 + ⋯ + (𝑥𝑛 − 𝜇)2 (𝑥𝑖 − 𝜇)2
𝜎 = =∑
𝑛 𝑛
𝑖=1
Novamente, temos que na maioria das aplicações estatísticas, os dados que estão analisados são para
uma amostra apenas, em razão da dificuldade ou mesmo da inviabilidade de se observar toda a população.
Assim, como nas demais estatísticas, quando calculamos uma variância amostral, 𝑆 2 , estamos na realidade
interessados em usá-la para inferir algo sobre a variância populacional. Sendo esse o caso, podemos assegurar
que para que tenhamos uma estimativa não viesada de 𝜎 2, a fórmula da variância amostral terá que sofrer
uma “curiosa” modificação, passando a ser dada pela seguinte relação:
𝑛
2
(𝑥1 − 𝑋̅)2 + (𝑥2 − 𝑋̅)2 + ⋯ + (𝑥𝑛 − 𝑋̅)2 (𝑥𝑖 − 𝑋̅)2
𝑆 = =∑
𝑛−1 𝑛−1
𝑖=1
Não iremos nos ater à a explicação detalhada deste resultado, uma vez que a demonstração
matemática do mesmo “foge” do escopo desta disciplina. A mesma será dada em inferência estatística.
Definição 2 (Viés): Um conceito desejável para toda estatística é que esta seja não viesada, ou seja,
o valor esperado desta é igual ao respectivo parâmetro populacional. Ou seja, dado que 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛
compõem uma amostra aleatória de tamanho n de uma população função de distribuição de probabilidade
𝑓𝑋 (𝑥|𝜃1 , 𝜃2 , … , 𝜃𝑘 ), um estimador 𝑊1 do parâmetro 𝜃1 será não viesado, se satisfizer a seguinte relação:
𝔼(𝑊1 ) = 𝜃1 .
Exemplo 3.14: Calcule a variância da receita operacional bruta e do lucro líquido da empreza XXX,
com base nos valores de 2003 a 2006 contidos na tabela 3.1. Em termos de que unidade você expressaria esse
resultado? Qual a intuição desse resultado? Estamos diante de um conjunto de observações que constitui toda
a população ou apenas uma amostra? Compares os valores e diga qual das duas amostras parece ser mais
dispersa. Agora coloque ambas em um gráfico e veja se o resultado anterior, com relação à amostra mais
dispersa se mantém.
O exemplo anterior ilustra bem duas das principais desvantagens da variância com medida de
dispersão: i) o fato de não ser tão intuitiva ou informativa, em razão da própria unidade em que a expressamos
e ii) a sensibilidade da variância à ordem de grandeza dos dados em questão, limitando a comparação entre
duas amostras. 4
Desvio padrão: De forma bastante objetiva, definimos o desvio padrão populacional (amostral)
como sendo a raiz quadrada da variância populacional (amostral). Dessa forma, denotamos os desvios
populacional e amostral, respectivamente por 𝜎 e 𝑆.
4
Por envolver a soma de quadrados, a unidade em que se exprime a variância não é a mesma dos dados.
𝜎
𝐶𝑉𝑃 =
𝜇
A relação amostral é análoga, porém com base nos momentos amostrais e não populacionais.
Alguns especialistas consideram:
· Baixa dispersão: CVP ≤ 15%
· Média dispersão: 15% < CVP < 30%
· Alta dispersão: CVP ≥ 30%
Por fim, lembremos ainda que em alguns casos, nos quais, a média possa não ser tão informativa,
em razão, por exemplo, da presença de outliers, então a mediana poderia ser considerada como uma medida
de tendência central mais adequada. Neste contexto, podemos passar a usar o coeficiente de variação de
Thorndike, o qual é semelhante ao coeficiente de Pearson, sendo a única alteração o uso da mediana, em
substituição à média.
Exemplo 3.17: Caso a companhia tivesse interesse em obter algum índice que mensurasse a
redistribuição salarial, que índice você aconselharia ao setor de Recursos Humanos? Caso a amostra de
Tabela 3.2.
Amostra dos funcionários da CVRD com suas respectivas características5
Pós- Anos de Salário Altura
Funcionário Formação Peso (Kg)
graduação estudo (R$) (cm)
Antônio Filho Administração Sim 24 5.500,00 156 65,8
Bernardo Aguiar Contabilidade Não 21 3.650,00 175 80,9
Carlos Smitch Economista Não 22 3.650,00 202 99,9
Ciro Alcântara Engenharia Sim 25 35.000,00 180 79,1
Débora Lima Psicologia Não 20 5.500,00 145 46,1
Eduardo Rossi Marketing Sim 24 7.800,00 180 85,1
Flavio Gomes Economista Não 23 2.800,00 165 67,7
Ingrid Paes Engenharia Não 20 3.650,00 180 76,9
João Mendonça Jornalista Sim 23 5.120,00 178 75,5
Marcelo Vilar Direito Não 21 8.930,00 161 60,9
Mirian Carvalho Comunicação Sim 24 4.500,00 168 65,1
Noraide Mendes Direito Sim 22 8.930,00 150 54,7
Orlando Moraes Odontologia Não 22 6.500,00 179 80,8
Pedro Malta Engenharia Não 21 3.650,00 190 89,9
Rodrigo Broa Nutrição Não 22 2.800,00 187 78,9
5
Tal amostra é completamente fictícia, sendo usada apenas para auxílio na compreensão da teoria e como base de dados para exemplos
e exercícios.
Tabela 3.3.
Métricas Alternativas de dispersão mensurando risco
𝑛
1
𝐷𝑜𝑤𝑛𝑠𝑖𝑑𝑒 𝑟𝑖𝑠𝑘(𝑟𝑖,𝑡 ) = √ ∑[𝑀í𝑛(𝑟𝑖,𝑡 − 𝑇𝑀𝐴𝑡 ; 0)]2
𝑇
𝑡=0
Estas métricas podem ser modificadas, substituindo-se a elevação ao quadrado e o respectivo uso da
raiz quadrada, pela simples média aritmética dos desvios absolutos em relação à média ou ao benchmark.
Apesar de a métrica desvio padrão não satisfazer as características teóricas desejáveis no sentido de
Artzner et al (1999), tais como alocação, subatividade, monotonicidade e homogeneidade de grau 1, a crítica
aqui feita está mais associada ao caráter pscilógico do investidor não captado por esta métrica. Um exemplo
interessante reportado em Castro e Baydia (2009) consiste na Figura 3.14, a seguir, em que há duas
𝜇 = 𝑓1 𝑥1 + 𝑓2 𝑥2 + ⋯ + 𝑓𝑛 𝑥𝑛
Nestes casos, não há exatamente 𝑛 observações, mas sim 𝑛 tipos de observações diferentes!
Exemplo 3.18: Suponha assim, que várias taxas de retorno nas ações VALE5 sejam possíveis
dependendo do estado da economia, da própria companhia e demais companhias concorrentes ou que
possuam algum tipo de sinergia. Simplificando, vamos nos ater apenas a três estados possíveis da economia:
forte, normal e fraco. No estado forte, as vendas da companhia devem sofrer uma boa influência, sendo o
retorno das ações VALE5 nesse caso de 20%.
No estado normal, esse retorno será de 10%, enquanto no pior dos estados da economia, em razão
de um enfraquecimento generalizado tal retorno será negativo, -15%. Observemos as tabelas 3.4. a 3.6, nas
quais há a distribuição de probabilidade do retorno na VALE5, PETR4 e BBDC4.
Tabela 3.4.
Distribuição de probabilidade do retorno da VALE5 (2009.2)
Estado da Taxa de retorno Probabilidade
economia da VALE5 de ocorrência
Forte 20% 0,20
Normal 10% 0,70
Tabela 3.5.
Distribuição de probabilidade do retorno da PETR4 (2009.2)
Estado da Taxa de retorno Probabilidade
economia da VALE5 de ocorrência
Forte 35% 0,20
Normal 10% 0,70
Fraco -45% 0,10
Tabela 3.6.
Distribuição de probabilidade do retorno da BBDC4 (2009.2)
Estado da Taxa de retorno Probabilidade
economia da VALE5 de ocorrência
Forte -15% 0,20
Normal 15% 0,70
Fraco 20% 0,10
De posse destes dados, calculemos o retorno médio e o desvio padrão dos retornos para as 3 ações.
Qual delas você compraria. E se mudassem as médias obtidas, como proceder para escolher?
6
Amplamente utilizado por acadêmicos e também no mercado financeiro, este índice Inicialmente foi chamado de reward‐to-variability
ratio, e somente em 1994 intitulado com o nome de William Forsyth Sharpe.
onde, 𝑟𝑖,𝑡 significa o retorno nominal real líquido do ativo 𝑖 no período 𝑡, 𝐸(𝑟𝑖,𝑡 ) corresponde ao valor
esperado incondicional para o retorno do ativo em questão, 𝜎(𝑟𝑖,𝑡 ) consiste no desvio padrão incondicional
deste retorno e 𝑟𝑓 denota o retorno nominal líquido da taxa livre de risco. Elemento central da moderna
Teoria de Finanças desenvolvida em Markowitz (1952), por consistir na própria função objetivo a ser
maximizada quando da composição de uma carteira com um portfolio arriscado e uma ativo livre de risco, este
índice possui limitações associadas à métrica de risco utilizada. Em finanças, a variável aleatória em questão,
comumente o retorno de um ativo financeiro, é tal que, sua dispersão não é sentida pelos agentes econômicos
interessados de forma simétrica.
Neste contexto, surgem críticas quanto à capacidade desta estatística captar o comportamento dos
investidores, os quais normalmente reagem de forma diferente a informações boas e ruins de mesma
magnitude ou importância, ou a ganhos e perdas de mesmo valor. Os investidores estão preocupados com
oscilações, quando estas implicam em perda de dinheiro, não em ganho, de forma que nem todas as oscilações
sejam necessariamente ruins. Nem toda incertza é compreendida como risco. Assim, diversos autores vêm
propondo medidas de risco e consequentemente de performance risco-retorno mais consistentes com a
distribuição esperada de ganhos observadas na prática, isto é, distribuições não normais e com a racionalidade
de investidores. Assim, apesar de a métrica desvio padrão não satisfazer as características teóricas desejáveis
no sentido de Artzner et al (1999), tais como alocação, subatividade, monotonicidade e homogeneidade de
grau 1, a crítica aqui feita está mais associada ao caráter psicológico do investidor não captado por esta métrica.
Mais recentemente, especificamente na década de 80, foi proposto o Índice de Sortino, com
aplicação em Sortino e Lee (1994). Esta métrica de performance oferece um valor para a compensação do
ganho adicional relativo a um benchmark tido como minimamente atrativo (TMA) por unidade de risco
assimétrica, a qual penaliza apenas desvios abaixo da média ou do referencial definido, diferentemente do
desvio padrão que penaliza desvios oriundos de boas e más surpresas.
Este índice para o ativo 𝑖 é expresso através da seguinte relação:
𝐸(𝑟𝑖,𝑡 ) − 𝑇𝑀𝐴𝑡
𝐼𝑆𝑂(𝑟𝑖,𝑡 ) =
√ 1 ∑𝑛𝑡=0[𝑀í𝑛(𝑟𝑖,𝑡 − 𝑇𝑀𝐴𝑡 ; 0)]2
𝑇
Neste caso, o denominador é conhecido como downside risk e será definido neste artigo a poupança
como Taxa Mínima de Atratividade.
O Índice de Calmar (ICA), foi proposto em Young (1991), menos usado e conhecido, cuja aplicação
é mais restrita para hedge funds e operações envolvendo commodities. A diferença consiste somente na métrica
de risco, a qual capta através do drawdown a queda acumulada na série de retorno do ativo financeiro em
questão. Esta métrica evolui lentamente com o tempo, mas reage mais rapidamente aos movimentos dos
ativos citados que métricas mais tradicionais. O Índice de Calmar do ativo 𝑖 é definido por:
𝐸(𝑟𝑖,𝑡 ) − 𝑟 𝑓
𝐼𝐶𝐴(𝑟𝑖,𝑡 ) =
𝑑𝑟𝑎𝑤𝑑𝑜𝑤𝑛(𝑟𝑡𝑖 )
Parece que ambas são bem distintas, hein? Enquanto a vermelha apresenta-se como simétrica, em
formato bem comportado de sino, a verde apresenta dois picos, comportamento bem assimétrico!
Assimetria: Quando do estudo de distribuições de observações, uma característica relevante a ser
analisada e mensurada, tanto analítica, como graficamente, consiste na simetria. Definimos formalmente que
uma distribuição é simétrica, quando: média = mediana = moda.
Figura 3.4: Gráficos ilustrativos de distribuições simétricas e assimétricas para direita e esquerda.
Figura 3.5: Gráfico ilustrativo de distribuições com caudas leves, moderadas e pesadas.
A curva normal, tida como base referencial, possui curtose de valor 3, de forma que distribuições
com cauda grossa ou pesada (fina ou leve) possuem curtose acima de 3 (abaixo de 3).
Observe a figura a seguir.
Figura 3.6: Best fitting distribution for returns on trading with foreign government bonds.
3.6. Outliers
3.6.1. Aspectos teóricos
Possivelmente, uma das melhores frases sobre um oulier é esta, de Nassim Taleb: “O fato de você ainda não ter
visto um cisne negro, não lhe permite afirmar que este não exista!”
Um “outlier” pode ocorrer por acaso em qualquer amostra ou população, indicando um erro de
medição ou sinalizando que a população tem uma distribuição de cauda pesada.
No primeiro caso, ou seja, esses pontos aberrantes podem indicar dados defeituosos, procedimentos
errados ou áreas onde uma determinada teoria poderá não ser válida normalmente. Assim, sugere-se o
descarte desta observação distante, aberrante, ou ao menos, sugere-se o uso de estatísticas que sejam robustas
à presença de valores extremos.
No segundo caso, principalmente em amostras maiores de dados, a presença de alguns pontos de
dados mais distantes da média da amostra do que o que é considerado razoável pode ser verdadeira mesmo,
típica dos doados em questão. Ou seja, em grandes amostras, um pequeno número de valores aberrantes é
de se esperar (e não devido a qualquer condição anômala).
Os outliers, sendo as observações mais extremas, podem incluir o máximo de amostra ou amostra
mínimo ou ambos, dependendo se eles são extremamente de alta ou de baixa. No entanto, o exemplo máximo
e mínimo, nem sempre são "outliers" porque eles podem não ser invulgarmente longe de outras observações.
Interpretação ingênua de estatísticas derivadas de conjuntos de dados que incluem valores atípicos pode ser
enganosa, pois valores extremos podem ser indicativos de pontos de dados que pertencem a uma população
diferente do que o resto do conjunto de amostras.
No caso de dados distribuídos normalmente, cerca de 1 em 22 observações serão diferentes por duas
vezes o desvio padrão ou mais da média, e 1 em 370 irá desviar-se três vezes o desvio padrão. Em uma amostra
de 1000 observações, a presença de até cinco observações distantes da média em mais de três vezes o desvio
padrão está dentro do intervalo de que se pode esperar, sendo inferior a duas vezes o número esperado e,
portanto, dentro de um desvio padrão de o número esperado. Se o tamanho da amostra é de apenas 100, no
entanto, apenas três valores extremos já são motivo de preocupação, sendo mais de 11 vezes o número
esperado.
3.7. Separatrizes
3.7.1. Aspectos teóricos
Apesar de extremamente úteis e de forte capacidade informativa sobre a base de dados, muitas das
métricas usuais vista até aqui, associadas a qualquer um dos momentos da distribuição, possuem o defeito
generalizado de serem muito sensíveis a valores extremos, uma vez que levam em consideração todos os valores
coletados. Outra limitação já abordada consiste em se ater somente aos dois primeiros momentos, o que não
permite visualizar aspectos associados à simetria ou caudas.
Neste contexto, uma análise adicional pode ser relevante em casos pontuais. Essa análise se baseia
em um conceito alinhado ao da mediana, ou seja, dividir os dados já disposto em ordem crescente ou
decrescente em grupos. Não somente em dois grupos, como faz a mediana, mas em 5, 10, 100 grupos...
Assim, os quintis, decis e percentis são muito similares à mediana, uma vez que também subdividem
a distribuição de medidas de acordo com a proporção das frequências observadas.
De forma geral, podemos definir um quantil de ordem p ou ainda p-quantil, indicado por q(p),
onde p é a proporção entre 0 e 100% tal que, p(%) dos dados sejam menores que q(p).
Mais comumente, temos os quartis, que dividem um conjunto de dados em quatro partes iguais,
isto é, 25% por parte:
Observe que o primeiro quartil considera os 25% dos menores elementos, enquanto o segundo
quartil, cujo limite Q2 coincide com a mediana, observa a metade inferior dos dados e o terceiro quartil
observa até 75% dos dados.
Analogamente, os decis dividem um conjunto de dados em dez partes iguais, isto é, 10% por parte.
Já, os percentis permitem dividir o conjunto de dados em 100 partes, sendo e 1% em cada parte.
Para determinar o valor correspondente a um certo quartil, decil ou percentil, deve seguir a seguinte
sequência: (i) Ordenar os dados do menor para o maior e (ii) Localizar a desejada posição L na amostra, dado
por L = k. n, onde k corresponde ao percentual desejado e n é o número de valores do conjunto de dados.
Caso esse valor seja quebrado, não inteiro, então com bom senso, é feito o arredondamento para o inteiro
mais próximo, uma vez que não faz sentido observar um número ordinal não inteiro!
Uma vez identificados as separatrizes de interesse, cuja escolha depende fundamentalmente do
objetivo em questão e do tamanho da base de dados em questão, um passo comum e muito informativo
consiste em obter o cálculo dos momentos, atendo-se a cada separatriz, ou seja, dentro de cada quartil, ou
decil...
70.000
60.000
50.000
40.000
30.000
20.000
Ibovespa
Neste caso, temos o Box plot feito na vertical para cotações do Ibovespa, de 03.01.05 a 30.12.2010,
em um total de 1482 observações (dias úteis). O q1 consiste na 371ª observação e o q3 na 1112ª, cujos valores
respectivamente são: 36.792 e 63.046. A mediana, q2, é dado por 49.672, ou seja, a distância entre os quartil
q1 e q2 é apenas um pouco menor que a distância entre o q2 e o q3. Porém, em sinal de leve assimetria para
esquerda, a distância entre o mínimo valor e o q1 é de aproximadamente 13.180, enquanto a distância entre
q3 e o máximo é inferior a 10.200. A amplitude é de 49.907, quase o dobro da distância interquantílica (q3
– q1), de exatos 26.254, sinalizando uma certa cauda pesada, ou seja, curtose elevada. Definindo um k=1,2,
definimos os limites mínimo e máximo aceitáveis para identificação de um outlier: 5.287,2 e 94.550,8,
respectivamente. Não temos assim outliers, pois o mínimo e o máximo observados neste período para a
cotação do Ibovespa são 23.609 e 73.516, respectivamente. Para tal, relembre que:
Tabela 3.7.
PL de entidades filantrópicas
PL (R$ mil)
Operadora filantrópica
2010 2009 2008
SANTA CASA DE MISERICORDIA DA BAHIA 0 105.657 104.233,00
SANTA CASA DE MISERICÓRDIA DE ARAÇATUBA 9.002 11.692 18.800,00
SANTA CASA DE MISERICORDIA DE BARRA MANSA 17.147 4.879 7.503,00
SANTA CASA DE MISERICÓRDIA DE BARRETOS 6.393 1.602 4.687,00
SANTA CASA DE MISERICORDIA DE CASA BRANCA -6.684 -5.683 -4.182,00
SANTA CASA DE MISERICORDIA DE ITABUNA 38.084 2.091 3.244,00
SANTA CASA DE MISERICÓRDIA DE ITAPEVA 22.214 22.647 19.293,00
SANTA CASA DE MISERICORDIA DE JOSE BONIFACIO 2.246 2.160
SANTA CASA DE MISERICÓRDIA DE JUIZ DE FORA 81.954 52.111 50.957,00
SANTA CASA DE MISERICÓRDIA DE LORENA -851 -2.271 -8.492,00
SANTA CASA DE MISERICÓRDIA DE MARINGÁ 7.114 5.408,00
SANTA CASA DE MISERICÓRDIA DE PASSOS 26.121 23.805 19.639,00
6.517
SANTA CASA DE MISERICORDIA DE SÃO JOSÉ DO RIO PARDO - HOSPITAL SÃO VICENTE 6.546 6.630,00
SANTA CASA DE MISERICÓRDIA DE TUPÃ 4.314 3.502 2.630,00
SANTA CASA DE MISERICORDIA DE VITÓRIA DA CONQUISTA 18.182 1.553 706,00
SANTA CASA DE MISERICÓRDIA DE VOTUPORANGA 40.598 26.438 20.206,00
SANTA CASA DE MISERICORDIA DONA CAROLINA MALHEIROS 19.552 22.102 23.615,00
SANTA CASA DE MISERICÓRDIA E ASILO DOS POBRES DE BATATAIS 17.271 18.131 18.697,00
a) Em razão das 5 métricas de tendência central vistas na subseção 3.3., calcule o valor para cada um
dos 3 anos.
b) A distribuição parece ser simétrica em algum dos anos?
c) Seria confiável usar a métrica média aritmética em todos os anos? Por que razão?
d) Faria sentido usar a média geométrica ou harmônica?
Exercício #3. Observe a seguinte base (tabela 3.8.) de dados acerca de variáveis macroeconômicas
das unidades federativas da União.
a) Calcule as médias aritmética, geométrica, harmônica, além de mediana e moda para o crédito per
capita e para a renda per capita. Qual destas você usaria como métrica de tendência central? Justifique
b) Visando melhorar a renda média per capita brasileira, seria melhor uma transferência lump sun,
ou um aumento homogêneo proporcional?
c) Como um pesquisador deve proceder para calcular a participação do crédito pessoa física em todo
o território nacional? Identifique qual seria a relação e se dispomos nesta tabela de todos os dados necessários
para este cálculo.
Norte
Rondônia 10.898,70 6,58% 24,40% 11,10% 0,76 0,52 1.490,08 1,90% 4,06% 63,76%
Roraima 11.055,88 5,45% 31,70% 14,94% 0,76 0,54 2.099,55 1,20% 2,95% 44,46%
Tocantins 9.391,42 4,89% 28,95% 20,27% 0,76 0,54 1.487,01 1,40% 3,77% 58,04%
Alagoas 6.206,70 2,60% 45,69% 15,74% 0,68 0,59 996,69 1,28% 4,39% 44,59%
Bahia 8.381,32 2,76% 37,04% 13,55% 0,74 0,56 1.360,04 1,02% 3,80% 39,09%
Ceará 6.741,56 4,21% 38,29% 20,53% 0,73 0,56 985,85 1,16% 4,01% 39,23%
Maranhão 5.561,02 6,85% 44,63% 22,50% 0,69 0,56 665,05 1,74% 7,18% 58,82%
Paraíba 6.445,09 5,78% 38,54% 9,74% 0,72 0,59 852,46 1,51% 4,45% 59,16%
Nordeste
Centro-Oeste
Mato Grosso do Sul 13.261,05 3,75% 12,11% 10,66% 0,80 0,54 3.460,72 1,35% 3,08% 60,53%
Espírito Santo 18.662,43 6,715% 12,35% 13,20% 0,80 0,54 3.005,31 0,84% 2,46% 34,90%
Minas Gerais 13.477,91 4,02% 12,47% 13,39% 0,80 0,52 2.383,81 1,21% 4,06% 40,68%
Rio de Janeiro 21.093,94 3,104% 13,17% 7,56% 0,83 0,55 4.036,51 1,45% 3,56% 28,16%
Sudeste
São Paulo 23.792,83 3,897% 11,05% 9,82% 0,84 0,51 4.906,38 0,92% 2,57% 32,42%
Paraná 16.600,75 2,075% 13,37% 16,80% 0,82 0,52 3.726,03 1,15% 2,63% 44,93%
Santa Catarina 19.300,08 3,938% 6,72% 6,53% 0,84 0,46 4.531,97 1,22% 2,40% 36,73%
Sul
Rio G. do Sul 17.847,07 2,484% 12,91% 12,48% 0,83 0,51 3.890,62 0,93% 2,49% 45,06%
a
PIB per capita ao ano da unidade federativa a preços constantes (base: ano de 2000). Período compreendido: 2004 - 2008. Fonte: Instituto Brasileiro de Geografia e Estatística (IBGE)
b
Taxa de crescimento do PIB per capita ao ano da unidade federativa a preços constantes (base: ano de 2000). Período compreendido: 2004 - 2008. Fonte: Instituto Brasileiro de Geografia e Estatística (IBGE)
c
Proporção de pobres na população da unidade federativa. Período compreendido: 2004 - 2009. Fonte: Instituto de Pesquisa Econômica Aplicada (IPEA).
d
Variação do Índice de bem estar de Sen da unidade federativa. Período compreendido: 2006 - 2008. Fonte: Relatório nº 06 do LEP/CAEN, cujos dados primários são microdados da PNAD/IBGE.
e
Índice de de Desnvolvimento Humano da unidade federativa. Período compreendido: 2004 - 2008. Fonte: Programa das Nações Unidas para o Desenvolvimeno (PNUD).
f
Índice de Gini da unidade federativa. Período compreendido: 2004 - 2009. Fonte: Instituto de Pesquisa Econômica Aplicada (IPEA).
g
Série real de crédito per capita mensal da unidade federativa. Período compreendido: 2004 - 2009. Fonte: Banco Central.
Exercício #7: Questão 3, pág. 40, capítulo 3 do livro texto Bussab, Wilson e Morettin, Pedro,
“Estatística básica”. Ed. Saraiva, 6ª edição, 2010.
Para responder às questões 8 a 15, abaixo, observar os dados da tabela 3.11, contendo os dados de
retorno líquido real mensal de vários índices financeiros mundiais sob a ótica do investidor brasileiro.
Exercício #8: Plote os gráficos dos índices abaixo, dividindo-os por continente levando-se em
consideração o retorno acumulado. Obs.: Lembre que o retorno acumulado consiste no produto dos
retornos brutos, os quais são o retorno líquido acrescido da unidade. Ou seja, se há um retorno líquido de
3%, então o retorno bruto é de 1 + 3% = 1,03. Fazendo isso pra todos os períodos da amostra em questão,
basta multiplicar até o mês desejado e você terá o retorno acumulado até este mês.
Exercício #9: Faça o histograma de cada um dos índices para a amostra de todo o período.
Exercício #10: Calcule o retorno médio, geométrico e acumulado de todos os índices durante todo
o período e durante apenas o ano de 2008. Quais índices você compraria?
Exercício #11: Calcule o desvio padrão de todos os índices durante todo o período e durante apenas
o ano de 2008. Quais índices você compraria?
Exercício #12: Calcule agora a semivariância, o downside risk e o drawdown de todos os índices
durante todo o período e durante apenas o ano de 2008. Quais índices você compraria?
Exercício #14: Calcule os índices de Sharpe, Sortino e Calmar de todos os índices durante todo o
período e durante apenas o ano de 2008. Para tal, considere como TMA a poupança, a qual rendeu
constantemente 0,25% ao mês.
Exercício #15: Você concorda com um puzzle intitulado home bias puzzle para o caso de um
investidor brasileiro?
Exercício #16: Observando as respostas dos itens anteriores, seria possível obter maiores níveis de
ganho esperado e menores níveis de risco? Qual a sua intuição sobre essa possibilidade? Que aspectos
precisariam ser observados visando este objetivo? Que ativos você colocaria na sua cesta internacional para
atingir este objetivo?
Exercício #17: Calcule o Coeficiente de assimetria de todos os índices durante todo o período e
durante apenas o ano de 2008. Quais índices você compraria? Esse resultado corrobora sua prévia impressão
obtida com o histograma?
Exercício #20: Construa o gráfico de Box plot para todos os índices durante todo o período e
durante apenas o ano de 2008. Esse resultado corrobora sua prévia impressão obtida nos itens 16, 17 e 18,
sobre assimetria, curtose e outliers??
𝑛
(𝑥1 − 𝑋̅). (𝑦1 − 𝑌̅)+. . … + (𝑥𝑛 − 𝑋̅). (𝑦𝑛 − 𝑌̅) (𝑥𝑖 − 𝑋̅). (𝑦𝑖 − 𝑌̅)
𝑆𝑋,𝑌 = =∑
𝑛−1 𝑛−1
𝑖=1
Obviamente, assim como na variância, a qual consiste num caso particular da covariância em que X
= Y, temos que a covariância populacional se dá pela divisão por n, em vez de n - 1.
Olhando a fórmula acima, observemos que o sinal da covariância será influenciado por uma maior
frequência de desvios mais representativos em ambas as variáveis, os quais podem ser na mesma direção,
implicando numa covariância positiva, ou em direção contrária, gerando covariância negativa. Para melhor a
compreendermos, observemos o exemplo a seguir.
𝑆𝑋,𝑌
𝑟𝑋,𝑌 =
𝑆𝑋 . 𝑆𝑌
𝜎𝑋,𝑌
𝜌𝑋,𝑌 =
𝜎𝑋 . 𝜎𝑌
Em geral, pode-se demonstrar que se todos os pontos em um conjunto de dados, tais como os
dispostos no gráfico anterior, estão sobre uma linha reta tendo ima inclinação positiva (negativa), o valor do
coeficiente de correlação é 1 (-1), correspondendo a uma perfeita associação linear positiva (negativa). Em
casos menos extremos, independente da unidade adotada para ambas as variáveis em questão, teremos que
quanto mais os pontos se desviarem uma relação linear perfeita, mais o valor do coeficiente de correlação irá
se aproximar de zero.
C2 D2 D2 (1 D ) 2 E2 2 D (1 D ) D E D , E