Você está na página 1de 2

PROBLEMA 1

PARTE A
● Pergunta Central: Diferença entre Correlação e Causalidade
● Ideia central: correlação não implica causalidade
○ Intuição: diferença entre correlação espúria (aleatória) e causalidade
● Como identificar quando a correlação implica causalidade? Qual a diferença entre correlação e
causalidade?
○ Trazer exemplos e linkar com políticas públicas
● Gatos:
○ A amostra de fotos de gatos pode não ser suficiente (a amostra não é representativa).
○ Não existe causalidade. O gato é atraído pelo buraco, e por isso fica dentre nele.
○ Podemos apenas concluir que o gato gosta de ficar no buraco, e não que ele causa o buraco.
○ Não podemos concluir que gatos são incrivelmente densos, por não ser possível concluir a
causalidade.
○ É apenas uma correlação.
● Divórcios e Margarina:
○ Provação do professor: Podemos inferir causalidade apenas por um gráfico?
○ Não é possível inferir causalidade apenas por correlação. Para inferir causalidade necessita-se
de experimento.
○ Para inferir causalidade precisamos entender o que impacta as variáveis. Para ser
causalidade, a variável deve ser influenciada unicamente pelo outra variável estudada.
■ Não podemos isolar o impacto da margarina nos casamentos. Pode haver o impacto de
outras variáveis, o que impede a inferência de causalidade.
○ O que não é causalidade, é correlação.

PARTE B
● VER O DICIONÁRIO NO TEAMS
● Pergunta Central: Diferença entre os tipos de estrutura de dados
● Que tipos de perguntas podemos responder com as variáveis dessa base?
● 3 tipos de estrutura de dados: corte transversal (gatos), série temporal (margarina) e dados em painel.
○ Corte Transversal: analisa as variáveis de um indivíduo em um período específico
■ Intuição: é uma foto.
○ Série Temporal: analisa o indivíduo em diversos períodos.
■ Intuição: é um filme.
○ Em Painel: junção das duas estruturas.
● Cada linha representa uma pessoa, e as colunas uma informação sobre essa pessoa (características
observáveis).
○ Característica observável: variáveis.
○ Dados faltantes não são características não observáveis (variáveis omitidas ou não
quantificáveis).
● Todos os dados estão relacionados de alguma forma: são dados socioeconômicos.
○ Diferente da margarina e divórcios, as variáveis são relacionadas.
● A a base principal é a PNAD, e essa amostra é possivelmente uma amostra aleatória retirada dela.
○ A base é representativa do Brasil
○ A estrutura dessa base de dados é um corte transversal.

Você também pode gostar