Você está na página 1de 2

Situe-se na Grande Londres entre os anos de 1665 e 1666.

Na sua memória, assim


como dos seus amigos está a nítida lembrança da guerra civil inglesa que aconteceu em 1642,
mas também da efervescência política do retorno da monarquia. Ocorre, todavia, que a maior
preocupação sua é com a súbita inflamação dos gânglios linfáticos e inchaços na pele. Isso
trouxe o caos não só para a sua saúde, mas para a sociedade inglesa em geral. A peste
bubônica havia chegado sem convite.

Nasce então um desafio para o data scientist da época: o que causara a epidemia?

A primeira hipótese foi que aonde havia mais gatos na região, o surto da doença era
maior. A conclusão que se seguiu foi exterminar os inocentes gatos.

No segundo momento, percebeu-se que o extermínio dos gatos agravou a situação.


Ficou claro que o que causou a peste foram as pulgas que se encontravam em ratos. A
correlação que existe entre a peste e os gatos eram positivas. Porém, esse fato isolado
escondia os mecanismos de contágio. Muitos ratos aumentavam a população de gatos e, no
mesmo momento, aumentava o número de pulgas que continham as bactérias da doença.
Quando os gatos foram eliminados, os ratos se proliferaram ainda mais e as pulgas
dominaram.

A história estava certa, mas não completa. Nesse momento, milhões de gatos foram
culpados injustamente.

Dados em painel são úteis e sua necessidade é ubíqua. Dados em painel são
simplesmente dados em que temos algumas observações e as acompanhamos ao longo do
tempo. Uma observação seria um distrito e em cada mês do ano de 1665, uma linha com
quantidade de gatos, ratos e infectados.

Aplicações de dados em painel são vistos em finanças, políticas públicas, ajuda


humanitária, ciências políticas.

Correlação não implica causalidade. O exemplo foi claro. O arcabouço de dados em


painel tem o poder de isolar os ruídos de certas variáveis que não nos importam no momento
e nos permitir concentrar em poucas variáveis.

Um dos modelos possíveis é o estimador de efeitos fixos. Este tem o poder de eliminar
variáveis não observáveis que são fixas ao longo do tempo. Quiçá dentro da relação de ratos e
infectados nas cidades londrinas, outros fatores podem importar que importam, mas não
temos dados para eles. Se termos sorte, serão fixas no tempo. Quiçá Londres tem
características específicas que influenciam o número de infectados (talvez a renda das
pessoas) que seja diferente de Westminster. Contanto que isso seja fixa – ou mais
realisticamente, não aumente muito ao longo do tempo – podemos eliminá-la com os efeitos
fixos.

\begin{equation}

Y_{it} = \beta_X_{it} + \alpha_i + u_{it}

\end{equation}
\begin{equation}

\overline{Y}_i = \beta_1\overline{X}_{i} + \alpha_i + \overline{u}_i

\end{equation}

\begin{equation}

Y_{it} - \overline{Y}_{i} = \beta(X_{i}-\overline{X}_{i}) + u_it-\overline{u_i}

\end{equation}

Você também pode gostar