Você está na página 1de 22

4/5/2022

Estatística Básica

4ª) Aula – Amostragem e


Planejamento de Experimentos
Prof. Dr. Evaldo Silva
1

Por que Planejar Experimentos e Amostragem ?

O método para a coleta (amostragem) de dados e


planejamento de experimentos são absoluta e
criticamente importantes!!!!

São exigidos, portanto, muito pensamento e muito


cuidado para se garantirem resultados válidos

Os métodos estatísticos são direcionados pelo tipo e


qualidade dos dados

1
4/5/2022

Planejamento de Experimentos e Amostragem


Obtemos dados de duas maneiras:

Estudo observacional, observamos e medimos características específicas,


mas não tentamos modificar os sujeitos objeto do estudo

Estudo experimental, aplicamos algum tratamento e passamos, então, a


observar seu efeito sobre os sujeitos (os sujeitos em um experimentos são
chamados unidades experimentais
Exemplo:
- Um pesquisa do VOX POPULI, IBOPE ou DATAFOLHA é um bom exemplo de estudo observacional
- Um teste clínico da droga Lipitor (controla o colesterol) é um bom exemplo de um experimento

Método experimental e método estatístico


Método experimental
Consiste em manter constantes todas as causas (fatores), menos uma, e variar
esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.
É o preferido em Física e Química
Método estatístico
Diante da impossibilidade manter as causas constantes, admite todas essas causas
presentes variando-as, registrando essas variações e procurando determinar, no
resultado final, que influências cabe a cada uma delas.

A Metodologia estatística

2
4/5/2022

OBSERVAÇÃO DE
FENÔMENO BIOLÓGICO, QUÍMICO, FÍSICO, ETC

QUESTÃO DE INTERESSE
BIOLÓGICO, ETC

POSSÍVEIS RESPOSTAS

HIPÓTESE DE PESQUISA

PLANEJAMENTO DE EXPERIMENTO OU ESCOLHA DO MODELO ESTATÍSTICO E


PROGRAMA DE AMOSTRAGEM ESTATÍSTICA DE TESTE

HIPÓTESES NULA E ALTERNATIVA

DISTRIBUIÇÃO DE AMOSTRAGEM

NÍVEL DE SIGNIFICÂNCIA

VALOR(ES) CRÍTICO(S)

FAÇA EXPERIMENTO ou COLETE


AMOSTRA

CALCULE A ESTATÍSTICA DE TESTE

COMPARE COM O VALOR CRÍTICO

ACEITE A HIPÓTESE REJEITE A HIPÓTESE


NULA NULA

Tipos de estudos Estatísticos


Estudos
Estatísticos

Estudo observacional Estudo Experimental:


Observa e mede, mas não modifica Você faz Aplica algum tratamento
observações
apenas ou
modifica o
sujeito

Longitudinal Quando as Transversal


observações
são feitas? Elementos-chave no planejamento
de Experimentos:
1. Controla efeitos de variáveis
Estudo através de planejamentos:
Estudo Prospectivo
retrospectivo(ou Estudo - experimentos cegos, blocos,
(ou de coorte):
de controle de Transversal: Os planejamento experimental
avança no tempo e
caso): retorna no dados são completamente aleatorizado,
observa grupos com
tempo para medidos em planejamento experimental
fatores em comum,
coletar dados de algum ponto no rigorosamente controlado
tais como fumantes e
algum período tempo 2. Replicação
não fumantes
passado 3. Aleatorização

3
4/5/2022

Estudos Transversais
• Estudo Transversal: É um estudo epidemiológico que se caracteriza pela observação
direta da população em estudo em uma única oportunidade
• Não há relação de causalidade, não se sabe a
priori o que é causa de que
 Suponha uma população a ser estudada, então
medimos várias variáveis e queremos medir algum
desfecho (alguma doença)
 Variáveis e o desfecho serão medidos em uma única
oportunidade. É como tirar uma fotografia dessa
população, sem saber o passado ou o futuro Pessoas doentes e não doentes
 Exemplo: tabagismo e câncer de pulmão

Doentes Não-doentes

Expostos a b a+b
Peixes maduros e não-maduros sexualmente
Não-expostos c d c+d Epidemiologia: a ciência das epidemias, propõe-se a estudar
quantitativamente a distribuição dos fenômenos de saúde/doença, e seus
a +c b + d n total fatores condicionantes e determinantes, nas populações humanas.

Estudos Transversais

 Vantagens: rápido, barato, útil como estudo inicial para levantamento de


hipótese

 Desvantagens: não consegue mostrar relação temporal, ruim para


doenças raras (pode não ter nenhum individuo com aquela doença na
sua população)

4
4/5/2022

Estudos Longitudinais

COORTE CASO-CONTROLE
 Ponto de Partida: fator de exposição  Ponto de Partida: desfecho / doença
(variável independente) (variável dependente)
 Seleciona a população a partir da  Seleciona a população baseando-se
exposição ou não ao fator (Ex.: no fato de ter ou não determinada
Fumantes e não-fumantes) doença

Doentes Não-doentes

Expostos a b a+b
COORTE
Não-expostos c d c+d
a +c b +d n total

CASO-CONTROLE

Estudos Longitudinais

COORTE CASO-CONTROLE
 Cronologia  Cronologia

Volta no tempo, p/ conhecer o


Acompanha a evolução com o tempo passado da População: fumaram?

Coorte prospectiva

0 tempo 0 tempo

Coorte reprospectiva

0 tempo
Busca no passado se as pessoas tinha exposição
e se no presente tem a doença
Passado Pressente

5
4/5/2022

Estudos Longitudinais

COORTE CASO-CONTROLE
 Vantagens:  Vantagens
 Consegue avaliar incidência (avalia  Bom para doenças raras
casos novos)  Barato
 História natural da doença  Rápido
 Forte relação de causalidade

 Desvantagens  Desvantagens
 Caro  Sujeito a vieses (informação, seleção,
 Demanda muito tempo ....)
 Perda de follow-up (desistências)  Relação temporal pouco precisa
 Ruim para doenças raras
 Sujeito a confundidores

Planejamento de Experimentais
Um dos importantes aspectos a ser levado em conta pelo pesquisador ao
delinear um experimento é o confundimento. Resultados de experimentos são algumas
vezes destruídos por causa do confundimento de efeitos de variáveis
Confundimento ocorre em um experimento quando você não é capaz de
distinguir entre os efeitos de diferentes fatores.

Fatores Controláveis Resposta


x1 y1
Entrada Saída
y2
X2 Processo
...

... ym
xp z1 z2 zq
Fatores Incontroláveis (ruído,
confundimento) 12

6
4/5/2022

Planejamento de Experimento

Considerações no planejamento de experimentos:


1. Controlar os efeitos das variáveis
2. Usar a replicação e um tamanho de amostra adequado
3. Aleatorização e outras estratégias amostrais

1. Controlando os efeitos das variáveis


Experimentos Cegos
Planejamento em blocos aleatorizados
Planejamento experimental completamente aleatorizado
Planejamento rigorosamente controlado

13

Planejamento de Experimento
Experimento Cego
 São experimentos em que se tenta evitar a interferência dos sujeitos e, às vezes
do observador, nos resultados do experimentos. Isso é feito através de
ocultação de informações.

 Por exemplo, nos experimentos que envolvem placebo, há sempre um efeito


placebo, que ocorre quando um sujeito não tratado relata melhora nos
sintomas

 Esse efeito placebo pode ser minimizado ou contabilizado através do uso de um


experimento cego, uma técnica em que o sujeito não sabe se está recebendo
tratamento ou o placebo

14

7
4/5/2022

Planejamento de Experimento
Experimento Cego
O experimento da pólio foi do tipo duplo-cego, o que significa que a
ocultação ocorreu em dois níveis:

1) As crianças que recebiam a injeção não sabiam se estavam


recebendo a vacina Salk ou um placebo, e

2) Os médicos que aplicavam as injeções e avaliavam os resultados


também não sabiam

15

Planejamento de Experimento

Planejamento em blocos aleatorizados


Um bloco é um grupo de sujeitos que são semelhantes, mas os blocos são
diferentes nos modos como podem afetar os resultados de um experimento.

Por exemplo, ao planejar um experimento para testar a eficácia de um novo


fertilizante sobre o crescimento de árvores, sabemos que o conteúdo de umidade no
solo (seco ou úmido) pode afetar o crescimento. Neste caso, devemos usar blocos

Bloco de árvores no terreno seco


X
Bloco de árvores no terreno úmido

Depois de formado os blocos, passa-se à associação aleatória dos


tratamentos aos sujeitos de cada bloco
16

8
4/5/2022

Planejamento de Experimento
Planejamento em blocos aleatorizados
Planejamento em bloco aleatorizado: se tiver realizando um experimento de teste
de um ou mais tratamento diferentes, e houver grupos diferentes de sujeitos
semelhantes, sendo os grupos diferentes em modos como podem afetar as
respostas aos tratamentos, use este planejamento experimental:

1. Forme blocos (ou grupos) de sujeitos com características semelhantes

2. Associe, aleatoriamente, os tratamentos aos sujeitos dentro de cada bloco

17

Planejamento de Experimento
Exemplo de Planejamento em blocos aleatorizados
Por exemplo, suponha que tenhamos que testar a eficácia de um
fertilizante sobre o peso de 12 álamos e que tenhamos dois pedaços de
terra: um deles é seco enquanto o outro é úmido.

a) Planejamento experimental ruim:


Usar fertilizante para tratar todas as 6 árvores
em solo úmido e não usa fertilizante para as árvores
em solo seco.
Não há como saber se os resultados podem
ser atribuídos ao tratamento ou ao tipo de solo

18

9
4/5/2022

Planejamento de Experimento
b) Planejamento em bloco aleatorizado
(BOM):

- Forme um bloco de árvores no solo úmido


e outro no solo seco. Em cada um dos
blocos, use a aleatoriedade para determinar
quais árvores serão tratadas com
fertilizantes e quais não serão

Sorteio de papéis numerados de 1 a 6

1 2 3

4 5 6

19

Planejamento de Experimento
Planejamento experimental completamente aleatorizado Ou
Delineamento Inteiramento Casualizado (DIC)

Neste tipo de planejamento, os sujeitos são


associados a diferentes tratamentos através de um
processo de seleção aleatória

Exemplo: Tratamento de árvores com fertilizantes


 Entre as 12 árvores, 6 são selecionadas
aleatoriamente para o tratamento com o fertilizantes
 Processo com duplo sorteio, sendo um sorteio para
uma das 12 árvores, e outro para saber se usa ou não
fertilizantes (COM ou SEM).

Possível resultado de um sorteio

20

10
4/5/2022

Delineamento de experimentos em Aquicultura


Delineamento Inteiramento Casualizado (DIC)
A A A
1 2 3  Neste tipo de planejamento, as unidades
experimentais são associados a diferentes
tratamentos através de um processo de seleção
N A N
aleatória
4 5 6  Entre 12 tanques-redes, 6 são selecionados
aleatoriamente para o tratamento com uma a
nova ração (N) e 6 com a ração atual (A)
N A N
7 8 9
 Processo com duplo [,1] [,2] [,3]
sorteio, sendo um sorteio [1,] "A" "A" "A"
A N N para um dos 12 tanques, e [2,] "N" "A" "N"
10 11 12 outro para saber se usa ou [3,] "N" "A" "N"
não a nova ração. [4,] "A" "N" "N"

Delineamento de experimentos em Aquicultura


DBC: Delineamento em Bloco Casualizado
N A N  Um bloco é um grupo de sujeitos que são semelhantes, mas os
1 2 3 blocos são diferentes nos modos como podem afetar os
resultados de um experimento.
 Por exemplo, ao planejar um experimento para testar a eficácia
A N A de uma nova ração sobre o crescimento de peixes, sabemos que
4 5 6 a temperatura da água pode afetar o crescimento. Neste caso,
devemos usar blocos

A N N Bloco de Tanques-rede na parte


7 8 9 Quente do reservatório
X
Bloco de tanques-rede na Parte
Fria do Reservatório
A A N
10 11 12

11
4/5/2022

Planejamento de Experimento
Exemplo de DIC em Aquicultura
 Por exemplo, se quisermos comparar quatro tipos de alimento (ração) com 5
repetições, nós teremos 4 x 5 = 20 tanques uniformes (ou quaisquer outras unidades
experimentais).
 Os tratamentos são codificados como T1, T2, T3, e T4, e de forma semelhante as
replicatas são R1, R2, R3, R4, R5.
 A combinação de tratamentos e repetições é codificada como T1R1, T1R2 ... ,
T4R5, como mostrado na Tabela abaixo:

Planejamento de Experimento
 Todos os tanques são assinalados com um número (1-20) para a randomização.

Com o método de sorteio, todas estas


combinações de tratamento-replicação
são escritas em 20 pedaços uniformes de
papel e mantidos em um saco.
Da mesma forma, os números de tanque
são escritos em outro conjunto de 20
unidades uniformes de papel e mantidos em
outro saco
Atribuição do tanque para cada combinação
tratamento-replicação pode ser feita ao
escolher aleatoriamente o tratamento-
repetição (com uma mão) e o número do
tanque (com a outra
mão) de ambos os sacos simultaneamente.

12
4/5/2022

Planejamento de Experimento
Planejamento Rigorosamente Controlado

 A destinação dos sujeitos ao tratamento é feita de uma forma rigorosa. Os


sujeitos são escolhidos cuidadosamente de modo que aqueles que recebem cada
um dos tratamentos sejam similares em relação ao que é importante para o
experimento.

 Exemplo: em um experimento que testa a eficácia de uma droga feita para baixar
a pressão sanguínea, se o grupo placebo inclui um homem de 30 anos, com
excesso de peso, fumante e que consome sal e gordura em abundância, o grupo
tratamento deve incluir também uma pessoa com características semelhantes.

25

Planejamento de Experimento
Replicação e tamanho da Amostra
 Além do controle dos efeitos das variáveis, outro elemento fundamental do
planejamento experimental é o tamanho da amostra e a replicação.

 As amostras devem ser grandes para que o comportamento errático não disfarce
(mascare) os verdadeiros efeitos dos diferentes tratamentos.

 A repetição de um experimento em grupos suficientemente grandes de sujeitos é


chamada de replicação.

 Em outro contexto, replicação se refere à repetição ou duplicação de um


experimento para que os resultados possam ser confirmados ou verificados

 Com replicação, tamanhos amostrais grandes aumentam a chance de


reconhecimento de efeitos de diferentes tratamentos.
26

13
4/5/2022

Planejamento de Experimento
Replicação e tamanho da Amostra
 Use um tamanho de amostra grande o bastante para que se possa ver a
verdadeira natureza de quaisquer efeitos e obtenha a amostra usando um
método apropriado, por exemplo, um método baseado na aleatoriedade.

Exemplo:

200.000 crianças receberam a verdadeira vacina

200.000 crianças receberam um placebo

27

Amostragem e aleatorização
Aleatorização e Outras Estratégias Amostrais
 Na estatística, como na vida, um dos piores erros consiste na coleta de dados de
uma maneira não apropriada. Não podemos deixar de enfatizar esse ponto
importante:
 Se os dados amostrais não forem coletados de maneira adequada, eles podem ser
de tal modo inúteis que nenhuma manipulação estatística poderá salvá-los!!!

“Chamar um especialista em estatística depois que o


experimento foi feito pode ser o mesmo que pedir a ele para
fazer um exame post-mortem. Talvez ele consiga dizer de que foi
que o experimento morreu”
(R. A. Fisher)
28

14
4/5/2022

Planejamento de Experimento
Aleatorização
Vamos definir os métodos de aleatorização de amostragem mais comuns:

 Em uma amostra aleatória, membros de uma população são selecionados de tal


modo que cada membro individual tenha chance igual de ser selecionado

 Uma amostra aleatória simples de tamanho n é selecionada de tal modo que


toda amostra possível de mesmo tamanho n tenha mesma chance de ser
escolhida.

 Uma amostra probabilística envolve a seleção de membros de uma população de


tal modo que cada membro tenha uma chance conhecida (mas não
necessariamente igual ) de ser selecionado

29

Planejamento de Experimento
Exemplo de Aleatorização e Outras Estratégias Amostrais
Exemplo de Amostra aleatória, Amostra aleatória simples, Amostra probabilística.
Imagine uma sala de aula com 60 alunos, arrumados em seis filas de 10 alunos cada.
Suponha que a professora selecione uma amostra de 10 alunos jogando um dado e
selecionando a fila correspondente ao resultado da jogada. O resultado é uma amostra
aleatória ? É amostra aleatória simples? É amostra probabilística?

1 2 3 4 5 6
1 11 21 31 41 51
2 12 22 32 42 52
3 13 23 33 43 53
4 14 24 34 44 54
5 15 25 35 45 55
6 16 26 36 46 56
7 17 27 37 47 57
8 18 28 38 48 58
9 19 29 39 49 59
10 20 30 40 50 60 30

15
4/5/2022

Amostragem e aleatorização
Aleatorização e Outras Estratégias Amostrais

SOLUÇÃO:

• A amostra é uma amostra aleatória porque cada estudante em si tem a mesma


chance (uma chance em seis) de ser sorteado.

• A amostra não é uma amostra aleatória simples porque nem todas as amostras de
tamanho 10 tem a mesma chance de serem escolhidas. Por exemplo, por esse
planejamento amostral, ao usar um dado para selecionar uma fileira, torna impossível
selecionar 10 estudantes que estejam em filas diferentes (mas há um a chance em 6
de que sejam selecionados os 10 estudantes da primeira fila)

• A amostra é uma amostra probabilística porque cada estudante tem uma chance
conhecida (uma chance em seis) de ser selecionado.
31

Amostragem e aleatorização
Exemplo com as conchas de sapequara

[1] 1 2 3 4 5 7 8 10 11 14
[11] 16 17 19 22 24 25 26 27 31 34
[21] 36 37 40 41 43 48 49 51 53 55
[31] 56 57 59 60 61 62 63 64 65 67
[41] 68 70 71 72 76 77 78 81 82 83
[51] 90 91 92 93 95 96 97 98 99 100

16
4/5/2022

Amostragem e aleatorização
Amostragem ou Censo?
Problema: quanto pesa, em média, uma folha de eucalipto?
1 kg? 1 g? 1 g
Quantas folhas tem, em média, um eucalipto?
2? 1.000? 1.000.000.000?

Por que fazer amostragem?


• população infinita
• diminuir custo
• aumentar velocidade na caracterização (medidas que
variam no tempo)
• aumentar a representatividade
• melhorar a precisão (mais cuidado na obtenção dos
dados)
Folhas de eucalipto
• minimizar perdas por medidas destrutivas

 Por que fazer censo?


• população pequena ou amostragem muito grande em relação a população
• precisão completa (não se permite erros)
• a observação já é completa 33

Amostragem e aleatorização
 Quanto amostrar? Depende:

• da variabilidade original dos dados (maior variância  maior n)


• da precisão requerida no trabalho (maior precisão  maior n)
• do tempo disponível (menor o tempo  menor n)
• do custo da amostragem (maior o custo  menor n)

Como amostrar?
amostragem probabilística X não probabilística

34

17
4/5/2022

Amostragem e aleatorização
 Amostragem Aleatória Simples
• É o método mais simples e pressupõe população homogênea
• Escolhe-se n elementos de uma população de tamanho N
• amostra = {X1, X2, ..., Xn}
• Cada amostra de tamanho n terá uma probabilidade de ser sorteada de:
n ( n  1) 1 n! 1
P ( X 1  X 2  ...  X n )     (sem reposição)
N ( N  1) ( N  n  1) PNn C Nn
n (n  1) 1 n!
   n (com reposição)
N N N N

 Exemplo: escolher 10 pontos de coleta de pixels de uma imagem 13x17

Etapas:
• rotular cada pixel com um código único
• sortear aleatoriamente 10 códigos (tabelas ou geradores de números
aleatórios no computador)
• identificar os pixels selecionados

Amostragem e aleatorização
 Amostragem Sistemática: Escolhe-se algum ponto inicial (por exemplo o 2º de 1 a 3)
e a seguir seleciona-se cada k-ésimo elemento da população:

36

18
4/5/2022

Amostragem e aleatorização
 Amostragem Sistemática
Se os elementos da população já se encontram ordenados segundo algum critério,
pode-se selecionar um elemento qualquer e escolher um “passo” que definirá
qual será o próximo elemento escolhido.
1 10 20

passo = 5

Exemplo: - escolher pixels de uma imagem 13x17 com passos 5 em x e 4 em y


etapas:
- escolher aleatoriamente um pixel na janela 5x4 superior esquerda
- com base nesse pixel, definir uma grade com espaçamento de 5x4 elementos
- identificar os pixels selecionados

OBS:
amostra-se uniformemente todo o espaço

Amostragem e aleatorização

Amostragem de Conveniência: Usa resultados que são fáceis de coletar

38

19
4/5/2022

Amostragem e aleatorização
 Amostragem Estratificada: subdivida a população em pelo menos dois subgrupos
diferentes (ou estratos), de modo que os sujeitos dentro do mesmo subgrupo tenha as
mesmas características (como sexo, faixa etária, tipo de embarcação, bairro de uma
cidade, etc) e a seguir extraia uma amostra de cada subgrupo

Sortear 30 embarcações entre um total de 180 pertencentes a 3


categorias de embarcações:
• CM (Canoa Motorizada): 90
• BPP (Barco de Pequeno Porte): 60
• BMP (Barco de Médio Porte) : 30
A fim de se obter uma produção média desembarcada num
determinado porto.

39

Amostragem e aleatorização
 Amostragem Aleatória Estratificada
Primeiramente a população (N) é dividida em L sub-populações (estratos) com N1, N2, ..., NL elementos.
Para cada estrato, escolhe-se ni elementos aleatoriamente, totalizando n elementos.
n
todos iguais: ni 
L
ni Ni
proporcionais a Ni: ni  n
N
Ni si
tamanho ótimo (considera a variabilidade): ni  n L

N s
i 1
i i

Exemplo: escolher 10 pixels de uma imagem 13x17


etapas: - selecionar um estrato
- rotular cada pixel com um código único
- sortear aleatoriamente ni códigos
- identificar os pixels selecionados
- repetir o processo para todos os estratos
OBS: usado para população heterogênea (estratos homogêneos)

20
4/5/2022

Amostragem e aleatorização

 Amostragem por conglomerados: Distrito


Divida a população em seções (ou
conglomerados), a seguir selecione
aleatoriamente alguns desses
conglomerados e escolha todos os
membros desses conglomerados
selecionados

 Não confunda: a amostragem por conglomerados usa todos os membros de uma


amostra de conglomerados, enquanto que a amostragem estratificada usa uma
amostra de membros de todos os estratos

41

Amostragem e aleatorização
Amostragem em múltiplos estágios
Um planejamento amostral em múltiplos estágios inclui as amostragens aleatória,
estratificada e por conglomerados, em diferentes estágios

Amostragem em múltiplos estágios:


Amostragem sistemática
dentro do talhão

talhões

42

21
4/5/2022

Resp: Observacional

Resp: Experimento

Resp: Observacional
Resp: Experimento

Resp: Prospectivo

Retrospectivo

Resp: Transversal

Resp: Retrospectivo
43

Resp: Sistemática

Resp: Estratificada

Resp: Conglomerado

Resp: De conveniência

44
Resp: Aleatória

22

Você também pode gostar