Você está na página 1de 12

Introdução a Estatística

Widemberg S. Nobre
Professor Adjunto

UFRJ

20 de outubro de 2023

1/12
Estatística × Probabilidade

A estatística é o ramo da ciência onde conjecturas, das mais diversas áreas


da ciência (matemáticas, física, química, biológica, etc.), são avaliadas em
contextos experimentais e/ou probabilísticos.

Definição
Uma conjectura é uma afirmação (matemática/lógica) que não foi
demonstrada. Conjecturas não demonstradas são denominadas hipóteses.

Toda e qualquer estrutura físico/química em algum momento da história


já foi uma conjectura, e se demonstrada, tal demonstração derivou de
hipóteses mais “suaves”.

2/12
Estatística × Probabilidade

Nos mais diversos contextos, a análise de fenômenos físicos envolve


reconhecer a existência de um oráculo conhecedor da “verdade”.
▶ No problema de lançar uma moeda, conhecer a “verdade” equivale a
dizer que o oráculo conhece a probabilidade de sair cara.
▶ No problema de casos sintomáticos de uma dada doença, conhecer a
“verdade” equivale a dizer que, dentre os infectados, o oráculo conhece
quem serão os sintomáticos.
O maior objetivo da metodologia estatística envolve construir mecanismos
(estatísticos) que permitam concluir probabilisticamente sobre o objeto
“verdade”.

3/12
Teoria de Amostragem

Teoria da Amostragem
▶ Amostragem probabilística: procedimento de seleção no qual todos os
indivíduos de uma população tem a chance (mesmo que heterogênea)
de pertencer à amostra (ser selecionado).

▶ Amostragem não-probabilística: todo procedimento amostral que não


segue uma estrutura probabilística.
OBSERVAÇÃO: Todo método probabilístico pode ser adaptado ao
contexto não-probabilístico.

4/12
Teoria de Amostragem
▶ Amostragem Aleatória Simples: todas as unidades populacionais têm
a mesma probabilidade de serem selecionadas na amostra.
▶ Amostragem por Conglomerado: a população está dividida em grupos
(homogêneos em algum sentido) e somente parte desses grupos são
selecionados na amostra.
▶ Amostragem Estratificada: Estratos são construídos e cada unidade
da população alvo é associada a um único estrato. Em seguida,
unidades são selecionadas dentro de cada estrato via amostragem
aleatória simples.
▶ Amostragem por bola de neve: um participante com as características
de interesse é identificado na população alvo, e esse indica outros
participantes para a pesquisa.

5/12
Erros amostrais e não-amostrais

Toda metodologia estatística esta sujeita a erros. Em geral, temos erros de


dois tipos:
▶ Erro amostral: Diferença entre o resultado obtido na amostra e o valor
verdadeiro populacional.
▶ Erro não-amostral: todo erro inerente ao procedimento de seleção de
unidades para compor a amostra. Exemplo mais comum: VIÉS DE
SELEÇÃO

6/12
Viés de Seleção

Suponha que um pesquisador conduza um experimento aleatório onde o


interesse é responder a questão:
Um pedestre olhar para o céu faz com que outro também olhe?
Observa-se uma forte associação entre um pedestre olhar para cima e
outros pedestres também olharem, podemos afirmar que essa é uma
relação causal?
Suponha que a análise incluiu somente pedestres que, após terem
participado do experimento, deram consentimento para seus dados serem
usados.

7/12
Viés de Seleção

Sob este contexto, pedestres tímidos (aqueles menos propensos a olhar


para cima) ou aqueles que consideram o estudo uma farsa são mais
propensos a não participar do estudo.
Isso garante que o processo de seleção de indivíduos para o estudo garante
que o olhar de alguém esta associado ao olhar de outros pedestres.
Uma associação criada como resultado do processo pelo qual os
indivíduos são selecionados para a análise é chamada de viés de seleção
(Selection Bias).

8/12
Viés de Seleção
Suponha que a Figura 1 represente um estudo para estimar o efeito de
suplementos de ácido fólico A dado a mulheres grávidas logo após a
concepção sobre o risco do feto desenvolver uma má formação cardíaca Y
(1: sim, 0: não) durante os primeiros dois meses de gravidez.
Seja C uma variável indicando a morte do feto antes nascimento. Uma má
formação cardíaca aumenta a mortalidade (seta de Y a C), e a
suplementação de ácido fólico diminui a mortalidade, reduzindo o risco de
má formações além das cardíacas (seta de A a C). Um estudo restrito a
fetos que sobreviveram até o nascimento resulta em viés de seleção.

C
A Y
Figura 1: Viés de Seleção: Caso geral.

9/12
Exemplos de Viés de Seleção

Viés de dados ausentes ou viés de não resposta


Exemplos incluem cenários onde indivíduos relutam a fornecer informações
ou se ausentam do estudo por motivos diversos. Independentemente das
razões pelas quais os dados em estão ausentes, restringir a análise a
indivíduos com dados completos pode resultar em viés de seleção.

10/12
Exemplos de Viés de Seleção

Viés de auto-seleção ou viés de voluntário


Suponha um estudo onde C é a concordância em participar (1: não, 0:
sim), A indica se o indivíduo é fumante (1: sim, 0: não), Y é uma doença
cardíaca coronária, U é o histórico familiar de doença cardíaca, e W é
estilo de vida saudável. O viés de seleção pode estar presente se o estudo
for restrito àqueles que se voluntariam ou se elegem para participar
(C = 0).
Exemplos de Viés de Seleção

Seleção afetada por um tratamento recebido antes da


entrada no estudo
Suponha um estudo onde C representa a seleção para o estudo (1: não, 0:
sim) e que o tratamento A ocorre antes do início do estudo. Se o
tratamento afetar a probabilidade de um indivíduo ser selecionado para o
estudo, então espera-se que haja viés de seleção. Esse cenário pode ser
visto como uma generalização do caso de Viés de auto-seleção.

Você também pode gostar