Você está na página 1de 41

IBMEC Faculdades IBMEC-MG Departamento de Economia

Renato Moreira Byrro

1
1

GOOGLE TRENDS E VARIÁVEIS ECONÔMICAS:

Um teste para aperfeiçoamento de erros de previsão econométrica

Belo Horizonte, 2010

Renato Moreira Byrro

ECONÔMICAS: Um teste para aperfeiçoamento de erros de previsão econométrica Belo Horizonte, 2010 Renato Moreira Byrro

2

GOOGLE TRENDS E VARIÁVEIS ECONÔMICAS:

Um teste para aperfeiçoamento de erros de previsão econométrica

Monografia apresentada ao curso de graduação da Faculdade Ibmec/MG como requisito à obtenção do título de bacharel em Ciências Econômicas, sob orientação do Prof. Dr. Cláudio Djissey Shikida.

BELO HORIZONTE, 2010

RENATO MOREIRA BYRRO

3
3

GOOGLE TRENDS E VARIÁVEIS ECONÔMICAS:

Um teste para aperfeiçoamento de erros de previsão econométrica

Monografia apresentada à Faculdade de Economia IBMEC-MG como requisito para graduação em Ciências Econômicas.

EXAMINADORES

Prof. Cláudio Djissey Shikida

Orientador

Prof. Ari Francisco de Araújo Júnior

Examinador

Prof. Márcio Antônio Salvato

Examinador

4
4

Sumário

1.

INTRODUÇÃO

7

2.

REVISÃO DA LITERATURA

10

3.

METODOLOGIA

13

4.

DADOS

16

5.

ESTIMAÇÕES E RESULTADOS

19

5.1.

EMPLACAMENTOS DE AUTOMÓVEIS

21

5.2.

TAXA DE DESEMPREGO

31

5.3.

SEGURO DESEMPREGO

32

5.4.

CARTÃO DE CRÉDITO

34

5.5.

CRÉDITO IMOBILIÁRIO

35

6.

CONCLUSÕES

38

7.

REFERÊNCIAS BIBLIOGRÁFICAS

41

34 5.5. C RÉDITO I MOBILIÁRIO 35 6. CONCLUSÕES 38 7. REFERÊNCIAS BIBLIOGRÁFICAS 41

Sumário de Tabelas

5
5

Tabela 4.1 - Descrição das variáveis utilizadas neste trabalho

 

17

Tabela 5.1 - Resultado dos testes ADF para estacionariedade das séries

 

20

Tabela 5.1.1 - Série mensal de emplacamentos da montadora Fiat

 

21

Tabela 5.1.2 - Série quinzenal de emplacamentos da Fiat (1ª quinzena)

 

23

Tabela 5.1.3 - Série quinzenal de emplacamentos da Fiat (2ª quinzena)

 

24

Tabela 5.1.4 - Série mensal de emplacamentos da GM

 

25

Tabela 5.1.5 - Série quinzenal de emplacamentos da GM (1ª quinzena)

 

26

Tabela 5.1.6 - Série quinzenal de emplacamentos da GM (2ª quinzena)

 

27

Tabela 5.1.7 - Série quinzenal de emplacamentos da Volks (2ª quinzena)

28

Tabela 5.1.8 - Série quinzenal de emplacamentos da Ford (2ª quinzena)

 

29

   

31

Tabela 5.2.1 - Taxa de Desemprego Tabela 5.3.1 - Requerimentos do Seguro Desemprego (por data de requerimento)

 

33

Tabela 5.4.1 - Concessões de crédito em operações de cartão de crédito

 

34

Tabela 5.5.1 - Crédito imobiliário

 

36

Tabela 6.1 - Percentual de domicílios com acesso à internet nos EUA, Alemanha e Brasil

 

39

Tabela 6.2 - Percentual de domicílios brasileiros com acesso à internet total e segregado por renda, mensurada em nº de SM (salários mínimos)

39

Sumário de Gráficos

6
6

Gráfico 5.1.1 - Emplacamentos de automóveis Fiat (série mensal)

 

22

Gráfico 5.1.2 - Emplacamentos de automóveis Fiat (série 1ª quinzena)

24

 

27

Gráfico 5.1.3 - Emplacamentos de automóveis GM (série 1ª quinzena) Gráfico 5.1.4 - Emplacamentos de automóveis Volkswagen (série 2ª quinzena)

29

Gráfico 5.1.5 - Emplacamentos de automóveis Ford (série 2ª quinzena)

30

Gráfico 5.2.1 - Taxa de desemprego

 

32

Gráfico 5.3.1 - Requerimentos de benefício do seguro desemprego

 

34

Gráfico 5.4.1 - Volume de operações de crédito com cartão de crédito

35

Gráfico 5.5.1 - Volume de operações de financiamento imobiliário

 

37

7

1. Introdução

O Google Trends é uma ferramenta do sistema de pesquisas do Google que, grosso modo,

informa o volume de pesquisas com uma dada palavra-chave num certo período de tempo e região específica. Através dele, é possível, por exemplo, saber a evolução das pesquisas que os usuários de internet fizeram no Google sobre os candidatos de uma eleição a cargos públicos, sobre um novo produto lançado no mercado, um clube de futebol, ou qualquer outro tema. Os índices do Google Trends são calculados pela a razão entre o volume de pesquisas com uma dada palavra-chave e o volume total de pesquisas com todas as palavras-chave pesquisadas na mesma região e mesmo período de tempo. O índice é semanal e calculado em relação à média observada no mês de janeiro de 2004 (igual a um), quando as séries do Trends têm início. O Google também disponibiliza uma ferramenta denominada “Insights for Search”, que utiliza a mesma base de dados do Google Trends e possui agregadores de informações. O Insights agrupa automaticamente, através de algoritmos, as palavras-chave da base de dados em categorias e subcategorias como “Alimentos e bebidas”, “Finanças e Seguros”, etc. No entanto, não são informadas ao usuário final quais palavras-chave compõem cada categoria. Neste trabalho serão utilizados tanto os índices do Trends quanto do Insights.

A idéia de que estes índices poderiam servir para a observação, previsão e análise da

economia surgiu no início de 2009 no Nepom (Núcleo de Estudos de Política Monetária),

composto por alunos das Faculdades Ibmec Minas Gerais entre eles o autor deste trabalho e coordenado pelo professor Cláudio Djissey Shikida. Criado em 2008, o núcleo tem por objetivo realizar estudos sobre a conjuntura macroeconômica brasileira e internacional, com vistas a prever os movimentos do Banco Central do Brasil acerca da meta para a taxa básica

de juros Selic, com apresentações periódicas abertas ao público.

Na apresentação do dia 9 de março de 2009 1 , foi realizada a primeira apresentação do Nepom incorporando informações do Google Trends como base para nossas análises. Ainda não haviam sido realizados estudos econométricos e o índice não serviu como variável para um modelo de previsão. À época, a economia brasileira passava por um período de grande instabilidade e incerteza, contaminada pelo agravamento da crise financeira internacional de 2008. Apesar de não haver dados oficiais disponíveis naquela apresentação (devido à

1

Os

slides

da

apresentação

podem

ser

acessados

no

seguinte

endereço:

8

defasagem nas publicações estatísticas), os índices de pesquisas no Google com as palavras- chave “seguro desemprego” e “vagas emprego” sugeriam um quadro negativo no mercado de trabalho brasileiro no primeiro trimestre de 2009. Posteriormente, os dados do IBGE (Instituto Brasileiro de Geografia e Estatística) confirmaram o que o Google Trends antecipava.

Um mês depois daquela apresentação, o departamento de economia do Google publicou um artigo intitulado “Predicting the present with Google Trends(CHOI; VARIAN, 2009A), no qual é destacado o potencial desta ferramenta para a previsão de variáveis econômicas e são apresentados alguns ensaios econométricos, o que deu ainda mais força à aplicação do Google Trends nas análises do Nepom, estimulando, também, o propósito da realização do presente trabalho.

A internet é um dos principais meios de acesso a informação na sociedade atual 2 , sendo o mecanismo de busca do Google o mais popular para busca de dados dispostos na rede mundial 47% 3 , 49% 3 e 63% 4 de market-share nas buscas mundiais em 2005, 2006 e 2008, respectivamente. Hipoteticamente, se um indivíduo busca na internet, por exemplo, informações sobre um modelo de automóvel, há uma boa chance de que ele esteja interessado em adquirir aquele bem num futuro próximo 5 ; ou, se são buscadas informações sobre o requerimento de benefício do seguro-desemprego, há probabilidade de que o indivíduo tenha sido demitido recentemente. Os índices de buscas no Google ofereceriam, assim, informações sobre as ações dos agentes econômicos numa defasagem muito pequena se comparada aos índices oficiais , tendo em vista a publicação semanal dos dados do Google Trends.

Este trabalho tem por objetivo replicar os testes de Choi & Varian (2009A) para dados da economia brasileira e testar estatisticamente a hipótese apresentada acima, comparando modelos de previsão de séries temporais ARMA e avaliando se a inclusão dos índices de pesquisas do Google Trends aos modelos pode reduzir os erros de previsão. Para isto, foram utilizadas séries relacionadas ao mercado de trabalho, de crédito e automobilístico. No caso da previsão das séries de emplacamentos de automóveis, o Google Trends foi capaz de reduzir substancialmente os erros de previsão para a montadora Fiat, enquanto nas séries das outras três montadoras analisadas, Chevrolet, Ford e Volkswagen, não foram obtidas melhorias

2 No Brasil, entretanto, o acesso à internet é bem mais restrito que em países desenvolvidos, onde já houve pesquisas com o Google Trends, como EUA e Alemanha, que possuíam, em 2007, 62% e 71% dos domicílios com acesso à internet, respectivamente, contra 17% no Brasil (vide Tabela 6.1).

3 Pesquisa Nielsen Online, 2006. Disponível em: <http://searchenginewatch.com/2156451>. Acesso em: 25 jun. 2010.

4 Pesquisa Nielsen Online, 2008. Disponível em: <http://searchenginewatch.com/3632382>. Acesso em: 25 jun. 2010.

5 Para o caso brasileiro, a hipótese tem maior validade se considerarmos bens de alto valor agregado, mais consumidos pelas classes de renda elevada e com maior acesso à internet (vide Tabela 6.2).

9

substanciais com a introdução dos índices de pesquisas. Para o mercado de trabalho, foi aprimorada a previsão da série de requerimentos de benefícios do seguro-desemprego a partir da inclusão do Google Trends aos modelos, o que não foi possível para a previsão da taxa de desemprego. Já no mercado de crédito, foram testadas duas séries: concessão de financiamentos vinculados a cartões de crédito e de financiamentos imobiliários, sendo que nenhuma delas teve a previsão aprimorada pelo Google Trends.

10

2. Revisão da Literatura

O

estudo de Choi & Varian (2009A) foi o primeiro com o intuito de testar a hipótese de que

os

dados de pesquisas do Google Trends estão correlacionados com atividades dos agentes

econômicos e que, portanto, podem ser utilizados como auxiliares em previsões econométricas para variáveis econômicas reais. O título „Predicting the Present‟ se refere à

proposta dos autores de se usar termos de pesquisa do Google Trends como uma espécie de indicadores das atividades econômicas no presente, antecipando movimentos que seriam publicados posteriormente (com defasagem maior) por estatísticas oficiais sobre os mesmos eventos. O primeiro exemplo usado pelos autores foi a série de vendas de automóveis da marca Ford nos EUA (Estados Unidos da América), entre janeiro/2004 e agosto/2008. A metodologia aplicada é bastante simples, e consiste em comparar dois modelos para a mesma série:

a) O primeiro, um modelo AR sazonal, em logaritmo (retornando a elasticidade), que usa as vendas no mês passado e 12 meses atrás para prever o mês presente de uma dada série (y). Basicamente:

(1)

b) O segundo modelo incorpora termos de pesquisa do Google Trends relacionados à variável estudada (no exemplo, vendas da Ford nos EUA):

(2)

Em que X é o índice de pesquisas do Google Trends com a palavra-chave escolhida e (1) é a primeira semana do mês 6 .

A comparação entre os modelos foi feita utilizando o erro absoluto médio das previsões

realizadas dentro da amostra com cada modelo. Ficou constatado que a inclusão da variável

do Google Trends no modelo reduz o erro de previsão em apenas 3%. Vários outros exemplos

são analisados ao longo do artigo, seguindo a mesma metodologia. Para o setor de varejo automobilístico, os pesquisadores estimaram dois modelos e conseguiram reduções de 15% e 18% nos erros, mas as previsões permaneceram muito otimistas em relação à variável real a partir do início de 2008, indicando que os modelos não foram capazes de captar o arrefecimento que a economia norte-americana experimentava. Também conseguiram

6 Os dados do Trends são semanais.

11

melhorias nos erros de previsão com modelos de previsão de vendas de outras montadoras além da Ford. No segmento de vendas de imóveis nos EUA, os autores alcançaram redução do erro absoluto médio em 12% com a incorporação do Google Trends.

Em um segundo estudo (CHOI; VARIAN, 2009B), os mesmos autores realizaram uma pesquisa sobre o mercado de trabalho norte-americano. Utilizando a mesma metodologia apresentada no primeiro estudo, foi analisada a eficácia do Google Trends na redução dos erros de previsão de pedidos de seguro-desemprego. Os autores apresentam constatações de outros pesquisadores indicando que a série de pedidos de seguro-desemprego funciona como um bom leading-indicator para períodos de recessão nos EUA, destacando a importância desta variável. Foram estimados dois modelos com períodos de tempo distintos: desde janeiro/2004, cobrindo toda a série disponível no Trends, e desde dezembro/2007, assumindo a hipótese de que houve quebra estrutural no mercado de trabalho norte-americano a partir desta data, devido à recessão econômica, ambas seguindo até junho/2009. Utilizando duas categorias de agrupamento de palavras-chave do Google Trends, Jobs‟ e „Welfare & Unemployment‟, os autores conseguiram reduzir os erros de previsão, considerando os últimos seis meses dentro da amostra, em 15,74% para o modelo de período mais longo e em 12,9% para o modelo com período desde dezembro/2007.

Analisando também o mercado de trabalho, neste caso o da Alemanha, Askitas e Zimmermann (2009) aplicaram uma metodologia diferente de Choi & Varian (2009A), utilizando modelos de causalidade de Granger ao invés de modelagem de séries de tempo ARIMA. Os pesquisadores levantam um aspecto importante a ser analisado no estudo deste tema: a metodologia e período de coleta das variáveis que se está analisando. No caso do mercado de trabalho alemão, o índice de desemprego é medido ao longo de um mês cheio e divulgado quase sempre ao final de cada mês, e então os autores optaram por utilizar os índices do Trends nas duas últimas semanas do mês (imediatamente anteriores ao anúncio) e as duas primeiras do mês seguinte (imediatamente posteriores ao anúncio). Analisando o índice de desemprego alemão no período entre janeiro/2004 e abril/2009, os pesquisadores concluíram, pelo critério BIC, que a utilização das duas últimas semanas imediatamente anteriores à divulgação do índice oficial é estatisticamente aceitável como previsão. Isto torna os dados do Trends úteis, pois permitem antecipar os movimentos que serão publicados pelo governo a respeito do mercado de trabalho alemão. Os autores, no entanto, não utilizam nenhum critério para avaliar a melhoria nos erros de previsão dos modelos com o Google Trends.

12

No estudo de Suhoy (2009), do Banco Central Israelense, também é utilizado o teste de causalidade de Granger como metodologia para avaliar a existência de relação entre o Trends e as variáveis econômicas reais. A autora ressalta que “Granger causality tests provide evidence that corresponding indices contain cyclical components which conform with cycles of economic growth(SUHOY, 2009, p. 29). Além disso, foi estimado no artigo um modelo indicador de probabilidade de recessão, utilizando os dados do Google Trends como leading indicator. Também são feitas referências a outros estudos, na área de marketing, segundo os quais as intenções de compra dos consumidores podem explicar as visitas a websites na

intentions are transformed into purchases within a short time horizon

internet, e que “[

(SUHOY, 2009, p. 7). A autora conclui que “israeli data support the hypothesis that Google query indices may be helpful in drawing inferences about the state of current economic growth, given the fact that official data are released with a delay” (SUHOY, 2009, p. 29).

]

A metodologia do presente trabalho se aproxima da que foi utilizada nos estudos de Choi & Varian (2009A), mas a especificação dos modelos não será ad hoc e seguirá critérios de avaliação (Akaike e Schwarz). Além disso, a comparação entre a qualidade de previsão dos modelos será feita através do Erro Absoluto Médio e também o Coeficiente de Desigualdade de Theil, sendo este último decomposto em três componentes: viés, variância e erro não- sistemático.

13

3. Metodologia

Neste estudo, será utilizada modelagem de séries temporais ARMA para comparar previsões

de variáveis econômicas e avaliar se a inclusão do Google Trends como variável nos modelos

ajuda a reduzir os erros de previsão. Os modelos dependerão de cada série analisada. Um exemplo seria o modelo utilizado por Choi & Varian (2009A), para vendas de automóveis da

Ford, nos EUA, entre 2004 e 2008:

Onde:

vendas da Ford nos EUA, no mês t

termo aleatório (ruído branco)

(3)

A este modelo, foi incorporada a variável de um índice do Google Trends que, espera-se,

esteja relacionado à série analisada:

Onde:

vendas da Ford nos EUA, no instante mês t

índice do Google Trends referente à semana s do mês t, sendo

assumindo valores inteiros neste intervalo 7

termo aleatório (ruído branco)

(4)

,

A comparação entre os modelos foi feita através dos critérios Erro Absoluto Médio (EAM) e

Coeficiente de Desigualdade de Theil (CDT):

(5)

(6)

7 Também podem ser utilizadas as médias dos índices semanais em cada mês; neste caso, será indicado com a letra „m‟ no

14

Onde:

: previsão da série para o instante de tempo t

: série de tempo original no instante de tempo t

T: número de períodos previstos dentro da amostra

O EAM é utilizado mais frequentemente, e foi o critério adotado pelos estudos anteriores

sobre o Google Trends. No presente estudo, também será feito uso do CDT, pois permite a decomposição do erro de previsão e análise da participação proporcional do viés (U B ), variância (U V ) e erro não-sistemático (U S ), da seguinte maneira (PINDICK; RUBINFELD,

2009):

Onde:

(7)

são a média e o desvio-padrão das séries y* e y, respectivamente, e ρ é o

coeficiente de correlação entre ambas as séries 8 .

As proporções do erro podem ser definidas como:

(8)

(8)

(9)

(9)

 

(10)

A

proporção do viés (U B ) é um indicador de erro sistemático do modelo previsor, já que mede

o

desvio entre a média de y* e y. A proporção de variância (U V ) indica a capacidade do

modelo em replicar o grau de variância da série analisada. O último componente (U S ), como o

próprio nome diz, mede o erro não-sistemático. A soma dos três indicadores deve ser igual a um e, idealmente, espera-se que U B e U V sejam iguais a zero e que, consequentemente, U S seja igual a 1, para qualquer valor de U. (PINDYCK; RUBINFELD, 2009)

8 Isto é:

15

A decomposição permitida pelo CDT é interessante para o presente estudo, pois será possível

analisar se o Google Trends melhora o ajustamento do modelo para fins de previsão reduzindo o erro sistemático e/ou de variância. O erro de variância poderia aumentar em

períodos de maior volatilidade, como em crises econômicas. Se o Google Trends puder captar

as mudanças na variabilidade das séries estudadas, seria um instrumento muito interessante de auxílio a previsões em períodos voláteis, notadamente mais difíceis para se trabalhar.

16

4. Dados

O Google Trends não retorna o volume absoluto de pesquisas realizadas com uma dada

palavra-chave. O que esta ferramenta nos fornece é um índice que representa a razão entre o

volume de pesquisas com uma palavra-chave e o volume total de pesquisas com todas as palavras-chave pesquisadas na mesma região e mesmo período de tempo. O índice é semanal e calculado em relação à média observada no mês de janeiro de 2004 (igual a um), quando as séries do Trends têm início. Se for observada, por exemplo, uma semana indicando valor 1,5, significa que a participação do volume de pesquisas com aquela palavra-chave, naquela semana, foi 50% maior que a média de janeiro de 2004.

A tabela abaixo mostra os dados a serem utilizados neste trabalho (o período amostral para

todas as séries é de Janeiro/2004 a Dezembro/2009):

17

Tabela 4.1 Descrição das variáveis utilizadas neste trabalho

Variável

Descrição

 

Número automóveis emplacados (total do mercado e montadoras:

Fiat, Ford, Chevrolet e Volkswagen) Fonte: Renavam/Fenabrave

Emplacamentos

Google Insights for Search: categorias “Setor Automotivo” → “Marcas de Veículos” → “Fiat”; “Ford”; “Chevrolet”; “VW”

 

Número de requerimentos de indenização do Seguro Desemprego (tendo como referência o mês de demissão do requerente)

Seguro-Desemprego

Número de requerimentos de indenização do Seguro Desemprego (tendo como referência o mês de requerimento do benefício)

Fonte: Ministério do Trabalho e Emprego (SAEG.net)

Google Trends: palavra-chave “seguro desemprego”

 

Taxa de desocupação (% da população economicamente ativa)

Taxa de Desemprego

Fonte: Pesquisa Mensal de Emprego (IBGE)

Google Insights: categorias “Sociedade” → “Trabalho e Sindicatos”

 

Volume de concessões de crédito em operações de Cartão de Crédito (recursos livres)

Cartão de Crédito

Fonte: Banco Central do Brasil

Google Insights: categorias “Finanças e Seguros” → “Crédito e empréstimo” → “Cartões de Crédito”

 

Operações de crédito imobiliário com recursos livres

Crédito Imobiliário

Fonte: Banco Central do Brasil

Google Insights: categoria “Imobiliário” → “Financiamento de imóveis residenciais”

Fonte: elaboração própria

18

O Google também disponibiliza uma ferramenta denominada “Insights for Search”, que utiliza a mesma base de dados do Google Trends e possui agregadores de informações. O Insights agrupa automaticamente, através de algoritmos, as palavras-chave da base de dados em categorias e subcategorias como “Alimentos e bebidas”, “Finanças e Seguros”, etc. No entanto, não são informadas ao usuário final quais palavras-chave compõem cada categoria. Neste trabalho, serão utilizados dados tanto do Google Trends quanto do Insights for Search.

19

5. Estimações e Resultados

Para cada série analisada, foram estimados seis modelos de séries temporais: utilizando a própria série e, em seguida, incorporando a média dos índices semanais do Google Trends no mês e o índice da primeira, segunda, terceira e quarta semanas do mês, individualmente. No caso das séries de emplacamentos de automóveis, há doze modelos para cada montadora, uma vez que dispomos de dados mensais e também das duas quinzenas de cada mês.

A especificação dos modelos seguiu o seguinte esquema:

1. Verificação de estacionariedade das séries;

2. A definição dos termos AR e MA dos modelos foi realizada com auxílio do algoritmo de otimização de modelos do pacote econométrico Easyreg, com base nos critérios Akaike e Schwarz;

3. Algumas alterações na especificação dos modelos foram realizadas posteriormente, utilizando o pacote econométrico Eviews, seguindo a metodologia Box-Jenkins, para melhor adequação dos termos AR e MA ao correlograma (autocorrelação e autocorrelação parcial) das séries;

Espera-se que o sinal do coeficiente estimado para a variável Google Trends seja positivo, ou seja, que um aumento no volume de pesquisas com a palavra-chave “seguro-desemprego” esteja associado a uma elevação nos requerimentos de benefícios do seguro desemprego, por exemplo. Os modelos cujos coeficientes apresentaram sinal negativo foram desconsiderados e não terão detalhes apresentados nas tabelas a seguir. Após a estimação dos modelos, foram geradas previsões dentro da amostra para um período de 12 meses (janeiro/2009 a dezembro/2009), e então foram comparados os resultados entre o modelo original, sem o Google Trends, e os demais. Para cada série analisada, foi selecionado o melhor modelo com Google Trends, pelo critério de EAM e CDT, e traçado um gráfico entre a previsão deste modelo, a previsão do modelo sem Google Trends e a série original.

As séries de taxa de desemprego, cartão de crédito e crédito imobiliário apresentaram raiz unitária no teste Augmented Dickey-Fuller 9 (ADF) e, desta forma, os modelos relacionados a

9 A hipótese nula do teste ADF é de presença de raiz unitária; para valor-p menor que 0,01, rejeitamos a hipótese nula com 99% de confiança.

20

estas três séries foram estimados em primeira diferença, mas as previsões para o ano de 2009 e os critérios de comparação EAM e CDT foram calculados para as séries em nível. Os testes ADF, com a série em nível, foram realizados com intercepto e tendência; com a série em primeira diferença, foram realizados somente com intercepto. Os resultados dos testes estão dispostos na Tabela 5.1.

Tabela 5.1 Resultados dos testes ADF para estacionariedade das séries

 

Valor-p ADF

Séries

 
 
 

Em nível

Fiat (mensal)

0,0006

Fiat (1ª quinz.)

0,0003

Fiat (2ª quinz.)

~ 0

Ford (mensal)

~ 0

Ford (1ª quinz.)

~ 0

Ford (2ª quinz.)

~ 0

Volks (mensal)

~0

Volks (1ª quinz.)

0,0003

Volks (2ª quinz.)

~ 0

GM (mensal)

~ 0

GM (1ª quinz.)

~ 0

GM (2ª quinz.)

~ 0

Taxa de desemprego

0,1065*

Seguro Desemprego

~

0

Cartão de Crédito

0,7273*

Crédito Imobiliário

0,3469*

Fonte: cálculos próprios

* Em primeira diferença, o valor-p do teste ADF foi menor que 0,001

Todos os resultados estão dispostos em tabelas, da seguinte forma: a primeira coluna se refere ao modelo original estimado para a série, sem a variável do Google Trends. Os resultados de EAM e CDT se referem à previsão dentro da amostra. As colunas seguintes se referem aos resultados do mesmo modelo, mas agora incorporando a variável do Google Trends indicada na primeira linha, que pode ser: a média das semanas do mês, a primeira, segunda, terceira ou quarta semana do mês. Na segunda e terceira linhas apresentamos o valor-p e o sinal de cada coeficiente do Google Trends, respectivamente. Nas linhas seguintes, seguem os resultados para o EAM e CDT, bem como seus componentes (viés, variância e erro não-sistemático). A numeração das equações apresentadas nesta seção será modificada para facilitar a sua

21

identificação. Para a montadora Fiat, por exemplo, teremos a sigla „fiat‟ seguida do número

do modelo dentre os doze estimados no total para esta montadora; por exemplo: „fiat1‟.

5.1.Emplacamentos de Automóveis

As séries de dados da montadora Fiat foram as que apresentaram os melhores resultados deste

trabalho. Todos os modelos para a série mensal e para a 1ª quinzena apresentaram coeficientes

do Google Trends significativos a 99% de confiança e sinal positivo. Para a série mensal, o

modelo „fiat6conseguiu reduzir o EAM em 62,5% e o CDT em 68,1% (Tabela 5.1.1). A

participação do viés no erro de previsão apresentou queda de 60 p.p. e do erro não-sistemático

um aumento de quase 40 p.p. A variância, no entanto, aumentou em 21 p.p., sugerindo que o

Google Trends auxiliou mais na redução do viés, relativamente à variância.

Tabela 5.1.1 Série mensal de emplacamentos da Fiat

Modelos:

fiat1

fiat2

fiat3

fiat4

fiat5

fiat6

   

média

       

Trends

mensal

semana 1

semana 2

semana 3

semana 4

P-valor

           

Trends

~0

~0

~0

~0

~0

Sinal Trends

 

+

+

+

+

+

EAM

18788,5

7435,35

8944,643

10032,6

8696,92

7042,53

CDT

0,24027

0,079817

0,102689

0,113207

0,097973

0,076618

Viés

0,838532

0,250184

0,514757

0,546403

0,438339

0,235672

Variância

0,013087

0,429629

0,120484

0,104692

0,142225

0,225561

Não-sistem.

0,148381

0,320187

0,364759

0,330906

0,419405

0,538768

Fonte: cálculo próprio

Abaixo seguem os dados do modelo original (fiat1) e do modelo com Google Trends que

apresentou melhor desempenho de previsão (fiat6):

p-valor

(~0)

(~0)

(~0)

(~0)

(fiat1)

22

(fiat6)

p-valor:

(0,0260)

(~0)

(0,1449)

(~0)

(~0)

R²: 0,80

Akaike: 19,95

Schwarz: 20,11

Onde:

= nº estimado de automóveis Fiat emplacados no mês t = média do índice Google Trends no mês t

no mês t = média do índice Google Trends no mês t Gráfico 5.1.1 – Emplacamentos

Gráfico 5.1.1 Emplacamentos de automóveis Fiat (série mensal) Fonte: Renavam/Fenabrave (série original); cálculo próprio (modelos)

No caso da série de dados referentes à 1ª quinzena do mês, também foram obtidos resultados satisfatórios: redução acima de 50% no EAM e no CDT, além de queda na participação do viés, da ordem de 48 p.p. e aumento na participação do erro não-sistemático, da ordem de 47 p.p., com participação da variância praticamente estável (Tabela 5.1.2).

23

Tabela 5.1.2 Série quinzenal de emplacamentos da Fiat (1ª quinzena)

Modelos:

fiat7

fiat8

fiat9

Trends

 

semana 1

semana 2

P-valor

     

Trends

~0

~0

Sinal

     

Trends

+

+

EAM

9121,68

3890,64

4698,07

CDT

0,228533

0,106344

0,11504

Viés

0,8763

0,394945

0,624137

Variância

0,061508

0,067278

0,099931

Não-sistem.

0,062192

0,537777

0,275932

Fonte: cálculo próprio

Seguem as equações do modelo original (fiat7) e do melhor modelo (no critério EAM e CDT)

com Google Trends (fiat8):

(fiat 7)

p-valor

(~0)

(~0)

(~0)

(~0)

(0,009)

(~0)

R²: 0,78

Akaike: 18,68

Schwarz: 18,88

 

(fiat8)

p-valor

(0,05)

(~0)

(0,0001)

(0,1911)

(0,6270)

(~0)

(~0)

R²: 0,72

Akaike: 18,96

Schwarz: 19,19

Onde:

= nº estimado de automóveis Fiat emplacados no mês t

= índice Google Trends na primeira semana do mês t

24

24 Gráfico 5.1.2 – Emplacamentos de automóveis Fiat (série 1ª quinzena) Fonte: Renavam/Fenabrave (série

Gráfico 5.1.2 Emplacamentos de automóveis Fiat (série 1ª quinzena)

Fonte: Renavam/Fenabrave (série original); cálculo próprio (modelos)

Para os modelos da série referente à 2ª quinzena do mês, apesar de termos obtido coeficientes

significativos a 94% e com sinal positivo para o Google Trends, não houve melhorias nos

erros de previsão. Além disso, a inclusão das variáveis de pesquisa de internet no modelo

aumentou significativamente a participação da variância no CDT.

Tabela 5.1.3 Série quinzenal de emplacamentos da Fiat (2ª quinzena)

Modelos:

fiat10

fiat11

fiat12

Trends

 

semana 3

semana 4

P-valor

     

Trends

0,053

0,0577

Sinal

     

Trends

+

+

EAM

2446,17

2864,87

2713,26

CDT

0,065537

0,072395

0,068338

Viés

0,25189

0,213651

0,169103

Variância

0,102877

0,188658

0,240225

Não-sistem.

0,645234

0,597691

0,590672

Fonte: cálculo próprio

25

Para a montadora General Motors, no caso da série mensal de emplacamentos, apenas os

coeficientes dos índices do Google Trends referentes à primeira e terceira semanas do mês

apresentaram sinal positivo, e mesmo assim tiveram baixa significância estatística e não

contribuíram para a melhora dos indicadores de erro de previsão.

Tabela 5.1.4 Série mensal de emplacamentos da GM

Modelos:

gm1

gm2

gm3

gm4

gm5

gm6

   

média

       

Trends

mensal

semana 1

semana 2

semana 3

semana 4

P-valor

           

Trends

0,8802

0,2274

0,2729

0,9376

0,4495

Sinal

           

Trends

-

+

-

+

-

EAM

5625,27

 

5831,36

 

5635,18

 

CDT

0,084241

 

0,085219

 

0,084238

 

Viés

0,107071

 

0,128631

 

0,108843

 

Variância

0,098397

 

0,130444

 

0,099469

 

Não-sistem.

0,794553

 

0,740925

 

0,791688

 

Fonte: cálculo próprio

Na série de dados referentes à 2ª quinzena do mês obtivemos resultados semelhantes. Apenas

na série da 1ª quinzena do mês o modelo „gm8‟, que inclui o índice do Google Trends

referente à primeira semana, trouxe alguma melhoria aos indicadores de erro de previsão, mas

ainda assim pouco expressiva.

26

Tabela 5.1.5 Série quinzenal de emplacamentos da GM (1ª quinzena)

Modelos:

gm7

gm8

gm9

Trends

 

semana 1

semana 2

P-valor

     

Trends

0,3139

0,7614

Sinal

     

Trends

+

-

EAM

2105,82

2096,4

 

CDT

0,073669

0,073557

 

Viés

0,03807

0,029956

 

Variância

0,755189

0,682264

 

Não-sistem.

0,206741

0,287781

 

Fonte: cálculo próprio

 

(gm7)

p-valor

(~0)

(0,0276)

(~0)

(~0)

R²: 0,63

Akaike: 18,24

Schwarz: 18,38

 

(gm8)

p-valor

(0,1964)

(0,8098)

(~0)

(~0)

(0,3139)

R²: 0,64

Akaike: 18,26

Schwarz: 18,43

Onde:

= nº estimado de automóveis GM emplacados no mês t

= índice Google Trends na primeira semana do mês t

27

27 Gráfico 5.1.3 – Emplacamentos de automóveis GM (série 1ª quinzena) Fonte: Renavam/Fenabrave (série

Gráfico 5.1.3 Emplacamentos de automóveis GM (série 1ª quinzena)

Fonte: Renavam/Fenabrave (série original); cálculo próprio (modelos)

Tabela 5.1.6 Série quinzenal de emplacamentos da GM (2ª quinzena)

Modelos:

gm10

gm11

gm12

Trends

 

semana 3

semana 4

P-valor

     

Trends

0,4876

0,8525

Sinal

     

Trends

+

+

EAM

4266,86

4298,73

4290,7

CDT

0,109673

0,109735

0,109868

Viés

0,023413

0,023198

0,022593

Variância

0,401079

0,383103

0,39497

Não-sistem.

0,575509

0,593699

0,582437

Fonte: cálculo próprio

Em relação à Volkswagen, também não obtivemos bons resultados: todos os modelos para a

série mensal e da 1ª quinzena apresentaram o coeficiente do Google Trends com sinal

negativo. Apenas no modelo para a série da 2ª quinzena, „volks11‟, que incorpora o índice do

Google Trends da terceira semana do mês, apresentou uma pequena melhoria nos erros de

28

previsão: queda de 1,5% no EAM e de 1,1% no CDT, com participações do viés, variância e

erro não-sistemático praticamente inalteradas.

Tabela 5.1.7 Série quinzenal de emplacamentos da Volks (2ª quinzena)

Modelos:

volks10

volks11

volks12

Trends

 

semana 3

semana 4

P-valor

     

Trends

0,5753

0,6008

Sinal

     

Trends

+

+

EAM

3777,96

3718,72

3888,71

CDT

0,088704

0,087714

0,089962

Viés

0,14491

0,144127

0,139192

Variância

0,42311

0,412151

0,438186

Não-sistem.

0,43198

0,443722

0,422622

Fonte: cálculo próprio

As equações do modelo original para a 2ª quinzena (volks10) e o modelo que incorpora o

Google Trends (volks11) estão listadas abaixo:

(volks10)

p-valor

(0,9783)

(~0)

(0,0044)

(0,0005)

(0,4675)

R²: 0,60

Akaike: 19,70

Schwarz: 19,87

 

(volks11)

p-valor

(0,9876)

(~0)

(0,0051)

(0,0004)

(0,4919)

(0,5753)

R²: 0,61

Akaike: 19,72

Schwarz: 19,93

 

Onde:

= nº estimado de automóveis Volks emplacados no mês t

= índice Google Trends na terceira semana do mês t

29

29 Gráfico 5.1.4 – Emplacamentos de automóveis Volkswagen (série 2ª quinzena) Fonte: Renavam/Fenabrave (série

Gráfico 5.1.4 Emplacamentos de automóveis Volkswagen (série 2ª quinzena)

Fonte: Renavam/Fenabrave (série original); cálculo próprio (modelos)

Por último, as séries de dados referentes à montadora Ford apresentaram resultados muito

semelhantes às da Volkswagen: apenas um modelo para a 2ª quinzena e incorporando o

Google Trends da terceira semana apresentou queda no EAM (1,8%). Ainda assim, o CDT

aumentou em 1,6% e as participações do viés e da variância no erro de previsão foram

maiores do que no modelo original.

Tabela 5.1.8 Série quinzenal de emplacamentos da Ford (2ª quinzena)

Modelos:

ford10

ford11

ford12

Trends

 

semana 3

semana 4

P-valor

     

Trends

0,8098

0,8503

Sinal

     

Trends

+

-

EAM

1649,69

1619,46

 

CDT

0,099205

0,10078

 

Viés

0,002453

0,012139

 

Variância

0,850434

0,901809

 

Não-sistem.

0,147114

0,086052

 

Fonte: cálculo próprio

30

Apresentamos as equações abaixo:

 

(ford10)

p-valor

(0,2784)

(~0)

(~0)

R²: 0,27

Akaike: 18,89

Schwarz: 18,99

 

(ford11)

p-valor

(0,1964)

(~0)

(~0)

(0,8098)

R²: 0,27

Akaike: 18,92

Schwarz: 18,05

Onde:

= nº estimado de automóveis Ford emplacados no mês t = índice Google Trends na terceira semana do mês t

mês t = índice Google Trends na terceira semana do mês t Gráfico 5.1.5 – Emplacamentos

Gráfico 5.1.5 Emplacamentos de automóveis Ford (série 2ª quinzena) Fonte: Renavam/Fenabrave (série original); cálculo próprio (modelos)

Das quatro montadoras analisadas, como o leitor pôde observar, somente as séries de emplacamentos de automóveis Fiat tiveram resultado satisfatório na redução dos erros de previsão a partir da inclusão do Google Trends aos modelos estimados. A seguir são apresentados os resultados das estimações com duas variáveis do mercado de trabalho Taxa de Desemprego e Requerimentos do Seguro Desemprego.

31

5.2. Taxa de Desemprego

Todos os coeficientes do Google Trends tiveram sinal positivo nos modelos estimados para a

série da taxa de desemprego, mas o nível de significância estatística foi baixo. O modelo

„txdes5‟, que incorporou o índice do Google Trends da terceira semana foi o que apresentou

os melhores resultados: queda de 8% no EAM e no CDT. A decomposição do CDT

permaneceu praticamente inalterada.

Tabela 5.2.1 Taxa de Desemprego

Modelos:

txdes1

txdes2

txdes3

txdes4

txdes5

txdes6

Variável

 

média

semana 1

semana 2

semana 3

semana 4

Trends

mensal

P-valor

           

Trends

0,5024

0,8359

0,7616

0,1969

0,596

Sinal Trends

 

+

+

+

+

+

EAM

0,861288

0,833167

0,863537

0,856509

0,788249

0,847756

CDT

0,059103

0,057464

0,05931

0,058822

0,054358

0,058432

Viés

0,902407

0,890083

0,901071

0,9004

0,88513

0,892981

Variância

0,07411

0,084968

0,075392

0,075877

0,087251

0,08401

Não-sistem.

0,023484

0,024948

0,023537

0,023723

0,027619

0,023009

Fonte: cálculo próprio

As equações do modelo original (txdes1) e do modelo com Google Trends que apresentou

melhor desempenho (txdes5) seguem detalhadas abaixo:

 

(txdes1)

p-valor

(~0)

(~0)

R²: 0,72

Akaike: 0,23

Schwarz: 0,30

 

(txdes5)

p-valor

(~0)

(~0)

(0,1969)

32

Onde:

= nº estimado da taxa de desemprego no mês t = índice Google Trends na terceira semana do mês t

t = índice Google Trends na terceira semana do mês t Gráfico 5.2.1 – Taxa de

Gráfico 5.2.1 Taxa de desemprego Fonte: IBGE (série original); cálculo próprio (modelos)

Das variáveis ligadas ao mercado de trabalho, o desempenho do Google Trends foi melhor na série de requerimentos do seguro desemprego, conforme os dados apresentados a seguir.

5.3. Seguro Desemprego

Para a série de requerimentos do seguro desemprego por data de demissão, em nenhum dos modelos estimados obtivemos coeficientes com sinal positivo para os índices de pesquisas. Já para a série calculada pela data de requerimento do benefício, o modelo „segdes6‟, que utiliza o índice do Google Trends referente à quarta semana do mês, proporcionou uma queda de 18% no EAM e de 21% no CDT. Apesar disto, observamos um aumento de 6,5 p.p. e de 1,3 p.p. , respectivamente, na participação do viés e da variância, simultaneamente a uma queda de quase 8 p.p. no erro não-sistemático.

33

Tabela 5.3.1 Requerimentos do Seguro Desemprego (por data de requerimento)

Modelos:

segdes1

segdes2

segdes3

segdes4

segdes5

segdes6

Variavel

 

média

semana 1

semana 2

semana 3

semana 4

Trends

mensal

P-valor

           

Trends

0,0288

0,4822

0,0962

0,0788

0,0052

Sinal Trends

 

+

+

+

+

+

EAM

58520,91

51218,08

55067,51

54613,57

50541,45

48031,27

CDT

0,055278

0,047776

0,052403

0,051608

0,048318

0,043431

Viés

0,008139

0,039516

0,000135

0,012601

0,023367

0,073081

Variância

0,638676

0,70509

0,705447

0,669719

0,703795

0,652177

Não-sistem.

0,353185

0,255395

0,294418

0,317679

0,272838

0,274742

Fonte: cálculo próprio

As equações dos modelos „segdes1‟ e „segdes6‟ seguem abaixo:

 

(segdes1)

p-valor

(0,6021)

(0,0003)

(~0)

(0,0521)

R²: 0,76

Akaike: 24,13

Schwarz: 24,27

 
 

(segdes6)

p-valor

(~0)

(0,0397)

(~0)

(0,2564)

(0,0052)

R²: 0,79

Akaike: 24,03

Schwarz: 24,20

Onde:

= volume estimado de requerimentos de seguro desemprego no mês t

= índice Google Trends na quarta semana do mês t

34

34 Gráfico 5.3.1 – Requerimentos de benefício do seguro desemprego Fonte: Ministério do Trabalho (série original);

Gráfico 5.3.1 Requerimentos de benefício do seguro desemprego

Fonte: Ministério do Trabalho (série original); cálculo próprio (modelos)

5.4. Cartão de Crédito

O modelo „cartao3‟, que incorpora o índice do Google Trends referente à primeira semana do

mês, trouxe queda de 4% no EAM e de 2,4% no CDT, sem modificações expressivas na

participação do viés, variância e erro não-sistemático.

Tabela 5.4.1 Concessões de crédito em operações de cartão de crédito

Modelos:

cartao1

cartao2

cartao3

cartao4

cartao5

cartao6

Variável

 

média

semana 1

semana 2

semana 3

semana 4

Trends

mensal

P-valor

           

Trends

0,4249

0,2731

0,4577

0,7404

0,6425

Sinal

           

Trends

+

+

+

+

+

EAM

706858

693234,7

677875,7

702889,4

702830,4

698842,4

CDT

0,036459

0,036069

0,035596

0,36266

0,036415

0,036159

Viés

0,138498

0,151495

0,144228

0,150385

0,143916

0,144536

Variância

0,453166

0,435075

0,459413

0,446854

0,441506

0,430004

Não-sistem.

0,408336

0,41343

0,396359

0,402761

0,414578

0,425459

Fonte: cálculo próprio

35

 

(cartao1)

p-valor

(~0)

(~0)

R²: 0,35

Akaike: 29,44

Schwarz: 29,51

 

(cartao3)

p-valor

(~0)

(~0)

(0,2731)

R²: 0,36

Akaike: 29,45

Schwarz: 29,55

Onde:

= volume estimado de operações de financiamento com cartão de crédito no mês t = índice Google Trends na primeira semana do mês t

t = índice Google Trends na primeira semana do mês t Gráfico 5.4.1 – Volume de

Gráfico 5.4.1 Volume de operações de crédito com cartão de crédito Fonte: Banco Central do Brasil (série original); cálculo próprio (modelos)

Nos testes para a série de crédito imobiliário, cujos resultados são apresentados na subseção a seguir, foram obtidos resultados superiores à série de cartão de crédito.

5.5. Crédito Imobiliário

O modelo „credimob2‟ trouxe pequena contribuição para a previsão da série de concessão de empréstimos habitacionais: queda de quase 10% no EAM e no CDT. No entanto, podemos

36

observar que a participação da variância aumentou em 10 p.p., acompanhada de uma queda

pela metade da participação do erro não-sistemático.

Tabela 5.5.1 Crédito imobiliário

Modelos:

credimob1

credimob2

credimob3

credimob4

credimob5

credimob6

Variável

 

média

semana 1

semana 2

semana 3

semana 4

Trends

mensal

P-valor

           

Trends

0,4457

0,4747

0,4675

0,4703

0,4596

Sinal Trends

 

+

+

+

+

+

EAM

51702,77

46707,91

47139,8

47044,69

47135,69

47046,09

CDT

0,182106

0,164135

0,165751

0,165403

0,165747

0,165435

Viés

0,530144

0,510774

0,513092

0,512801

0,513542

0,513588

Variância

0,31011

0,412659

0,404437

0,40641

0,404626

0,406446

Não-sistem.

0,159746

0,076567

0,08247

0,080789

0,081831

0,079966

Fonte: cálculo próprio

 

(credimob1)

p-valor

(0,0014)

(~0)

(~0)

R²: 0,50

Akaike: 22,66

Schwarz: 22,76

 
 

(credimob2)

p-valor

(0,0027)

(~0)

(~0)

(0,4457)

R²: 0,51

Akaike: 22,68

Schwarz: 22,81

 

Onde:

= volume estimado de operações de financiamento com cartão de crédito no mês t

= índice Google Trends na primeira semana do mês t

37

37 Gráfico 5.5.1 – Volume de operações de financiamento imobiliário Fonte: Banco Central do Brasil (série

Gráfico 5.5.1 Volume de operações de financiamento imobiliário Fonte: Banco Central do Brasil (série original); cálculo próprio (modelos)

Apesar da queda de aproximadamente 10% nos erros de previsão, o coeficiente estimado da variável Google Trends foi estatisticamente significativo a um nível de confiança de apenas 45% no modelo „credimob2‟.

38

6. Conclusões

Os resultados obtidos demonstram que, em alguns casos como nas séries de emplacamentos

de automóveis Fiat e de requerimentos do seguro desemprego , a inclusão do Google Trends

nos modelos de previsão ARMA traz melhorias do ponto de vista do erro de previsão, mas em muitos não há um ganho expressivo. No caso da montadora Fiat, por exemplo, foram alcançados resultados muito positivos, com redução de 62,5% no EAM e de 68% no CDT, além de aumento da ordem de 40 p.p. na participação do erro não-sistemático, indicando uma melhoria no ajuste do modelo. Para a série de requerimentos do seguro desemprego, foi observada queda do EAM e CDT em torno de 20%, mas com queda relativa de 8 p.p. na participação do erro não-sistemático.

No caso das demais montadoras (Ford, Volks e GM), as reduções nos erros de previsão foram pequenas, não passando de 2%, além de ganhos pouco expressivos na participação do erro não-sistemático. Para a série da taxa de desemprego, alcançou-se redução de 8% nos erros de previsão, associada a uma queda de 0,5 p.p. na participação do erro não-sistemático. Na série de concessões de financiamentos imobiliários, houve redução de 10% nos erros de previsão, mas com queda de 8 p.p. na participação do erro não-sistemático, e para a série de financiamentos em cartão de crédito houve queda de apenas 4% nos erros de previsão.

Analisando a decomposição do coeficiente CDT, foi possível observar que a inclusão do Google Trends, para as séries e períodos analisados neste trabalho, tende a contribuir mais na redução do viés do que da variância na composição do erro de previsão, em termos relativos. Esperava-se que, por captar melhor as oscilações dos mercados em períodos mais voláteis, como o do ano estudado, de 2009 10 , seria possível obter uma redução proporcionalmente maior na participação da variância.

O fato de o Brasil possuir uma renda mais baixa e distribuída de forma mais desigual, em

comparação a outros países em que o Google Trends já foi estudado, como EUA e Alemanha (Tabela 6.1), e ter uma penetração menor da internet nas camadas da população de baixa renda (Tabela 6.2), faz com que o potencial do Google Trends para previsão de séries brasileiras fique prejudicado. No entanto, para as variáveis de emplacamentos de automóveis, podemos descartar este limitador, por se tratar de um bem de alto valor agregado e consumido

10 A economia brasileira viveu um período mais volátil durante o ano de 2009, devido à quebra do banco Lehman Brothers, nos EUA, e o consequente agravamento da crise financeira internacional no final do ano de 2008.

39

pelas classes de renda média e alta. Apesar disto, a inclusão dos índices de pesquisa só trouxe resultados satisfatórios, no Brasil, para o caso da montadora Fiat.

Tabela 6.1 Percentual de domicílios com acesso à internet nos EUA, Alemanha e Brasil

Ano

EUA

Alemanha

Brasil

2004

 

- 60,0%

12,2%

2005

 

- 61,6%

12,9%

2006

 

- 67,1%

14,5%

2007

61,7%

70,7%

17,0%

Fonte: OCDE (Organização para Cooperação e Desenvolvimento Econômico)

Tabela 6.2 Percentual de domicílios brasileiros com acesso à internet total e segregado por renda, mensurada em nº de SM (salários mínimos)

Ano

Total

Até 10 SM

Entre 10 e 20 SM

Mais de 20 SM

2004

12,1%

5,8%

49,5%

71,9%

2005

13,6%

7,6%

54,3%

76,5%

2006

16,7%

10,5%

64,1%

83,0%

2007

20,0%

14,1%

68,3%

82,0%

2008

23,8%

17,3%

74,2%

87,0%

Fonte: IBGE

Concluímos que a maior limitação reside nos próprios índices do Google Trends, pelo fato de ser divulgada a razão entre as buscas com uma palavra-chave e o volume total de buscas na mesma região e período, e não o volume absoluto de pesquisas com a palavra-chave. O índice de pesquisas sobre um tema qualquer pode ter caído num determinado período não porque há menos pessoas pesquisando a respeito, mas porque houve um aumento atípico no volume total de pesquisas na mesma região e período analisados, seja por qualquer causa. Nestes casos, a informação que o Google Trends antecipa aos modelos econométricos é de que há uma menor procura por aquele tópico, quando na realidade isto pode não estar acontecendo.

Apesar do desempenho do Google Trends ter sido satisfatório em algumas séries, para este trabalho, na maioria dos casos foi obtida uma performance ruim. A ferramenta parece ter um potencial muito expressivo e espera-se que ainda poderá contribuir bastante para a análise, observação e acompanhamento dos movimentos dos mercados e dos agentes econômicos, mas

40

carece de mais testes comprobatórios. A modificação na forma de cálculo dos índices divulgados, como mencionado acima, seria fundamental para a exploração do potencial do Google Trends.

41

7. Referências Bibliográficas

Askitas, N., Zimmermann, K. (2009). Google econometrics and unemployment forecasting. Discussion Paper nº 4201, IZA Institute for the Study of Labor.

Choi, H., Varian, H. (2009A). Predicting the present with Google Trends. Technical Report, Google.

Choi, H., Varian, H. (2009B). Predicting inicial claims for unemployment benefits. Technical Report, Google.

Efron, N., Matias, Y., Shimshoni, Y. (2009). On the predictability of search trends. Google, Israel Labs.

Ginsberg, J. et al. (2009). Detecting influenza epidemics using search query data. Nature, v. 457, p. 1012-1014.

Pindyck, Robert S.; Rubinfeld, Daniel L. Econometric models and economic forecasts. ed. Boston: McGraw-Hill, 1991.

3.

Suhoy. T. (2009). Query indices and 2008 downturn: Israeli data. Discussion Paper nº 2009.06, Research Department, Bank of Israel.