Você está na página 1de 33

Métodos e Técnicas de Investigação:

Amostragem e Inquérito:

Conhecimento científico como construção:


- Conhecimento científico como construção-seleção que pretende tornar a realidade
inteligível, neste caso, a realidade social.
- Conhecimento científico como processo (não é dado, mas construído pelo
investigador) e produto (resultado de uma prática)
- Implica intervenção no processo e responsabilidade na produção do resultado.

“Facto científico é conquistado, construído e verificado”, G. Bachelard, A formação do


espírito científico
Conquistado… aos preconceitos -> Rutura
Construído… pela razão -> Construção ------> Três atos epistemológicos
Verificado… nos factos -> Verificação

Questões epistemológicas preliminares:


Questão epistemológica de base: como se produz conhecimento científico válido?
- Resposta depende dos paradigmas científicos adotados
Várias estratégias de investigação possíveis
- Intensivas/Extensivas; qualitativas/quantitativas

Estratégia de investigação extensiva:


- Recolha e análise de dados sobre população de grandes dimensões, na sua totalidade
(observação censitária) ou, mais geralmente, sobre uma amostra (representativa).
- Privilegia a extensão e a generalização dos resultados
Conceito de população: conjunto universo das unidades de análise pertinentes para a
investigação: entidades, documentos (notícias de jornal) , situações (aulas; consultas
médicas; compras/vendas num mercado…).
Esta estratégia utiliza-se para:
- descrever distribuições de características (variáveis da população);
- explorar padrões regulares de relações entre variáveis na população (generalizações
empíricas)
Estratégia extensiva por amostragem usa-se quando…
- a população para a investigação empírica é demasiado ampla para ser inteiramente
observada;
- se pretende obter resultados generalizáveis ao conjunto da população

Amostra representativa: subconjunto de elementos da população-universo,


selecionados de modo a que o conjunto da amostra seja representativo do conjunto da
população.
Representatividade da amostra: grau de confiança demonstrável em que os resultados
da observação de uma amostra são idênticos aos que seriam observados na população
Amostragem: método e procedimentos técnicos de definição da amostra, de que
depende a sua representatividade

Estratégia extensiva procede por:


- recolha de indicadores padronizados sobre a população, ou sobre a amostra, para
facilitar a sua agregação e generalização (e.g., questionários; entrevistas diretivas;
instrumentos pré-formatados para recolha documental ou de observações presenciais)
- tipicamente, emprega métodos quantitativos de análise de dados (técnicas
estatísticas) para:
_ resumir as características observadas da amostra (estatísticas descritivas);
_ analisar as relações entre essas características (estatísticas inferenciais, bivariadas e,
também, multivariadas)

Estratégia Quantitativa:
- Usa os dados quantitativos ou quantificados para:
_ resumir e descrever características da população ou da amostra com valores
numéricos (e.g. percentagens, medidas de concentração e dispersão)
_ medir e testar relações de covariação entre variáveis (e.g., medidas de associação ou
correlação; medidas de significância estatística das relações)
Portanto, estuda a realidade através de variações e relações numéricas:
- usando dados quantitativos:
_ observações de indicadores primários de natureza numérica (e.g. idade, rendimento,
anos de escolarização)
_ recolha de indicadores previamente quantificados em fontes documentais
(estatísticas oficiais, resultados de inquéritos publicados)
- quantificando dados qualitativos:
_ observação de indicadores primários de natureza qualitativa
Implica a utilização de dados quantitativos ou padronizados para permitir a
quantificação:
- recolha de dados quantitativos
- recolha de dados qualitativos de modo “fechado”, categorizado a priori (e.g., escalas
pré-definidas de respostas a perguntas “fechadas” de questionário ou entrevista)
- categorização padronizada do conteúdo de dados qualitativos recolhidos de modo
“aberto” (e.g. análise de conteúdo com grelha de categorias pré-definidas, sobre
respostas a perguntas “abertas” de questionário ou de entrevistas)

Inquérito por questionário no processo da investigação:


- Pressupostos subjacentes à utilização de questionários no contexto de investigação:
_ o investigador define claramente a informação que pretende;
_ os inquiridos dispõe dessa informação;
_ os inquiridos podem disponibilizar a essa informação nos moldes em que a pesquisa
se realiza
Observação indireta conta com dois tipos de intermediários entre a informação
pretendida e a informação obtida: o sujeito e o instrumento de recolha de informação
(questionário):

Informação pretendida Intermediários


Sujeito Informação obtida
Instrumento
O inquérito está presente em várias fases do modelo do processo de investigação, tal
como na fase exploratória (descrever distribuições, explorar padrões), ou na
observação (testar hipóteses e modelos de análise).

Porque realizamos inquéritos?

Características da população  descrever características da nossa população alvo Erro associado


De que modo a amostra reflete a população à amostra

Amostra  descrever as características de uma amostra como forma de chegar à


população. Erro
Associado
Em que medida as respostas medem adequadamente as características que se querem
descrever às
respostas
Respostas obtidasRespostas obtidas são usadas para descrever as características dos
(erro de
inquiridos
medida)

Conceitos fundamentais
População, universo: Conjunto das unidades de análise (elementos) pertinentes para
investigação (também designado por “população alvo”)
- A população é definida pela Delimitação do objeto do estudo
 Delimitação conceitual (características definidoras dos objetos de análise);
 Delimitação espacial (local ou área a considerar);
 Temporal (momento ou período a considerar).
- Amostra: subconjunto de população contendo as unidades de análise (elementos)
 A observar (“amostra planeada”; “amostra-alvo”)
 Ou já observadas (“amostra realizada/efetiva/ observada)
- Amostragem: conjunto dos procedimentos usados para selecionar os elementos da
amostra. Porém, nem sempre existem porque…
(a) A amostra realizada pode rer resultado da observação sem método de seleção,
logo, sem amostragem
p. ex. – Se, a um inquérito todos os elementos da população, responder apenas uma
parte desta, esse subconjunto constitui uma amostra realizada de facto, não tendo
sido selecionada para tal por qualquer procedimento de amostragem
(b) Idem, se um inquérito visando todos os elementos de uma população for efetuado
de modo que não restrinja o acesso á resposta, apenas a elementos dessa população,
ou acesso de cada elemento apensas uma vez;
(c ) Idem, se um inquérito for realizado pretendendo observar uma amostra, mas sem
ter definido previamente ou sem ter aplicado quaisquer, critérios para a seleção dessa
amostra (“acidental”)
Representatividade da amostra: grau de confiança demonstrável em que os resultados
da observação de uma amostra são, ou serão, idênticos aos que seriam observados na
população
Depende de as características dos elementos do subconjunto “amostra” serem
o mais possível idênticas às dos elementos do conjunto “população”
 Princípio da diversidade: ter os diversos valores de um dado conjunto de
características (variáveis) e das suas combinações entre os elementos da
amostra, com diversidade qualitatividade idêntica à existente entre os
elementos da população;
 Princípio de proporcionalidade: ter a distribuição, qualitativa dos valores de um
dado conjunto de características e das suas combinações entre os elementos
da amostra, em proporções idênticas às existentes entre os elementos da
população;
 Cumulatividade: desses princípios: se se verificar o primeiro, não se verificam
necessariamente os outros; se se verificar o 2º verifica-se o primeiro, mas não
necessariamente o terceiro…

Erro, a incerteza e probabilidade


Afirmações sobre a população a partir de amostra comportam erro; erro
implica incerteza
Incertezanoção de probabilidade: proporção de ocorrências de determinado
acontecimento sobre um total
(P=probabilidade) P=Casos favoráveis = Sucessos ou ocorrências
Cassos possíveis nº de tentativas

Afirmações comportam probabilidade de acertar e probabilidade de errar

População
Amostra

Inferência
Parâmetro=fixo Estimativa Estatística=variável

Grau ou nível de confiança


o É um grau de confiança, não é uma certeza: todas as amostras têm uma
margem de erro.
-há amostras não representativas: intencionalmente, ou por erro de
amostragem, ou por defeito de realização da amostra na observação
⎻ há amostras mais representativas do que outras
⎻ em algumas amostras a margem de erro provável pode ser determinada,
noutras não
• depende
– do modo de seleção da amostra planeada, a observar (amostragem)
– da amostra realizada na observação
Atenção: a amostra realizada pode ser menos representativa do que a
planeada!
• extrapolação dos resultados: generalização dos resultados obtidos por
observação da amostra ao conjunto-universo da população
⎻ só é credível na medida em que a amostra for representativa
⎻ só é válida para o universo de onde foi selecionada a amostra (mesmo que
existam
unidades de análise concetualmente idênticas, noutras delimitações espaciais e
temporais)

Tipologia: as grandes “famílias” de procedimentos


de amostragem
1) Amostras aleatórias (sorte, acaso; também designadas como probabilísticas, ou
casuais)
• baseiam-se no princípio de probabilidade: cada elemento da população tem (ou
teve) uma probabilidade calculável, não nula (i.e., maior do que zero), de ser
selecionado para a amostra
• o método de amostragem aplica sempre alguma forma de sorteio, em condições que
garantam
o acaso e o cálculo da probabilidade de cada elemento da população ser sorteado, o
que implica:
– a existência prévia de uma base de sondagem: lista exaustiva de todos os elementos
da população
– a definição e aplicação de um método de sorteio
• o cálculo matemático de probabilidades permite determinar a margem de erro
provável
dos resultados a obter pela observação da amostra planeada, ou dos obtidos pela
amostra realizada

Amostras aleatórias dependem da base de


sondagem
– Existência (de lista adequada)
– Qualidade (exaustividade, ausência de erros)
– Acessibilidade (à lista pretendida)
Tipologia: as grandes “famílias” de procedimentos
de amostragem (cont.)
2) Amostras não aleatórias
• Baseiam-se nos princípios:
⎻ de proporcionalidade (amostragem por quotas)
⎻ de diversidade (amostragens “intencionais”, “bola de neve”, “teóricas”, etc.)
• Não garantem que todos os elementos da população tenham uma probabilidade não
nula e conhecida de serem incluídos na amostra
• Não permitem calcular a margem de erro provável da amostra, pelo que o grau de
representatividade é indeterminável
• Frequentemente, não pretendem ser representativas

Tópicos:

• Aleatória simples
• Sistemática
• Estratificada
• Por clusters, ou “cachos”, e multe etapas
• Multifásica
Métodos probabilísticos  sorte
 Procuram garantir o princípio de probabilidade: cada um dos elementos
da população tem a mesma probabilidade (ou uma probabilidade
conhecida e não nula) de vir a ser incluído na amostra.
 Implicam
o Dispor de (pelo menos) uma base de sondagem (lista exaustiva
dos elementos da população).
o Aplicar (pelo menos) um procedimento de sorteio que respeita o
princípio de probabilidade referido
Amostragem aleatória simples

 A seleção dos indivíduos que compõem a amostra efetua-se através de uma


operação de tiragem simples por sorteio numérico
o A cada elemento da base de sondagem é atribuído um número de 1 a
“N” (N= número total de elementos da base de sondagem)
o Sorteiam-se “n” números (n= número de elementos pretendidos na
amostra)
 Por lotaria (do tipo “bolas tiradas do saco”) pouco utilizado;
 Usando uma tabela de números aleatórios;
 Usando software para gerar números aleatórios.
o A amostra é construída pelos “n” elementos da base de sondagem
correspondentes ao número de sorteados.
 Garante a constituição de uma amostra aleatória em absoluto
o Cada elemento tem a mesma probabilidade (1/N) de ser sorteado para
a amostra do que qualquer outro
o Cada elemento é sorteado para a amostra independentemente de
qualquer outro ter sido, ou não, sorteado.
 Para uma amostra pretendida de “n” elementos na base de sondagem com N
elementos, calcula-se o quociente:
K=N/n
 A seleção dos indivíduos que compõem a amostra começa pela tiragem por
sorteio de um primeiro elemento “j”, em que “j” representa um número de 1 a
k
 Começando pelo elemento sorteado nº j sorteado, constituem a amostra os
elementos j, j+k j+2k+(1-n)k
 Ex., pretendemos uma amostra de n=200 estudantes de uma base de
sondagem de N=3000
K=3000/200=15
Supondo que fizemos o sorteio entre 1 e 15 e obtivemos o nº4
A amostra é composta pelo 4º estudante na ordem de base de sondagem ,
(4+15)=19 (4+2*15)=14 sucessivamente até ao (4+(200-1)*15)=2989º

Não requer que se numerem um a um os elementos de sondagem


Exige o sorteio de um numero de elementos primeiro
Cada elemento na base de sondagem tem a mesma probabilidade (1/N) de ser
selecionado para amostra do que qualquer outro.
Mas cada elemnto não é sorteado independentemente de qualquer outro
(todos dependem do 1º)
Amostra estratificada
 Numa amostragem através do procedimento aleatório simples ou do
sistemático devido à margem de erro da amostra, corre-se riscos
1) De nem todas as características serem representadas pela amostra na exata
proporção em que existem na base da sondagem;
2) De conjuntos pouco numerosos de elementos com características
importantes para o estudo em caos não serem suficientemente
representadas na amostra para podermos extrapolar resultados a seu
respeito
Completa o princípio da probabilidade com o de proporcionalidade
Divide a base de sondagem, total em subconjuntos complementares de elementos
(“estratos”), segundo as características de que interessa controlar as proporções na
amostra
Todos os elementos da base de sondagem pertencem a um estrato
Cada elemento pertence a um só estrato
Cada estrato é usado como uma sub-base de sondagem, de que é sorteada uma
subamostra
Amostragem estratificada
A proporção entre o “n” da amostra e o “N” da população é a taxa de sondagem “t” da
amostra
T=n/N*100
Ex. anterior, t=200/3000*100=6,6667%
Corresponde à percentagem (6,6667%) ou proporção (0,0667%)

 Solução comum, implica sortear de cada estrato uma sub-amostra com a taxa
fixa “t” pretendida para a amostra toral, garante-se que todos os estratos
estarão representados na amostra na mesma proporção que têm na base de
sondagem total:
t=n/N*100

Estrato 1 N1=1000 n1= 1000*0.667=67


Estrato 2 N2=300 n2=300*0.667=20
Estrato 3 N3=800 n3=800*0.667=53
Estrato 4 N4=900 n4=800*0.667=60
Estrato 5 N5= 300 n=200
A amostra total +e representativa da população
Nota: o “n”L de cada subamostra por estrato L pode não ser suficiente
para esta ser representativa do estrato, o que poderá ser resolvido
criando estratos não proporcionais.
A definição de estratos pode ser:
a) A um único critério:
a. Sexo, definindo 2 estratos, M e F
b. Subsistema de ensino superior, definindo 3 estrados (universitário
publico, politécnico público, privado)
b) A uma combinação de 2 ou + critérios
a. Idade x sexo definindo 6 estratos, se a idade se encontrar dividida em 3
intervalos (15-24M; 14-24F etc)
b. Subsistema de ensino superior e ano de frequência do 1º ciclo,
definindo 9 estratos, se se considerarem 3 de frequência.
Critério único: subsistema de ensino
População do ensino superior: 300 000(N) Amostra: 5000(N)

N % n
U. Público 135000 45 2250
Pol. Público 60000 20 1000
Privado 105000 35 1750
Total 300000 100 5000

Ex. 135000300000
X 5000
X= (135000*5000)/300000=2250

OU usando taxa de sondagem:


n/N= 5000/300000=0,016666667
0,016666667…

Subsistema Ano N % n
U. Pública inicial 48000 16 800
Privado Inicial 33000 11 550
Politécnico Inicial 24000 8 400
U. Pública intermédio 51000 17 850
Privado Intermédio 36000 12 600
Politécnico Intermédio 21000 7 350
U. Pública Final 36000 12 600
Privado Final 27000 9 450
Politécnico final 24000 8 400
300000 100 5000
Ex., 48000300000
X 5000
X=800

Amostra a vários graus, níveis ou etapas


 Vários desenhos de amostragem resultam de uma combinação de
procedimentos aleatórios;
 Podem utilizar-se processos de amostragem aleatórios sucessivos até chegar à
amostra final
 Quando não existe (não se encontra disponível) uma lista adequada de
indivíduos numa população ou uma maneira de chegar diretamente a esta,
então chamada amostragem multietapas fornece uma boa alternativa
 Quando não existe ou não se encontra disponível uma lista adequada dos
elementos da população de unidades de análise, é uma boa alternativa a
amostragem por clusters (cachos)
 Um cluster é um agregado real identificável de elementos da população de
unidades de análise (ex., estabelecimento de ensino é um cluster dos
estudantes
A estratégia é a de identificar os agrupamentos ou agregados mais amplos (unidades
de sondagem) (1.) de elementos da população (unidade de análise) (2.), os quais
possam ser identificados e observados através de um processo de amostragem
aleatória.
1. Clusters ou cachos: unidades para as quais existe uma base de sondagem
2. Unidade sobre as quais se incide o objeto de estudo
3. Exemplo alunos e escolas
a. Não coincidência
Unidades de análise (alunos) (não é igual) Unidades de sondagens (escolas)
b. Coincidência
Unidades de análise (alunos) = Unidades de sondagens (alunos)
Foi feita uma primeira estratificação da amostra por…

A escolha dos cursos foi, portanto, feita por área de estudo


Os enviesamentos da amostra:
Inquérito  composição da amostra -> qualidade conclusões

A base de sondagem não ser exaustiva


Base de sondagem correta  amostra ‘perfeita’ no plano teórico, mas na prática há
que contar com:
a) Pessoas inacessíveis por diversos motivos (ausência temporária, doença,
mudança residencial, etc.)
b) As recusas em responder ao inquérito
Enviesamentos: desvio entre unidades de análise (indivíduos, famílias, empresas,
etc.) que deveriam ser inquiridas e as que são inquiridas.
Erro amostral:
O erro nasce da diferença entre o que esperamos encontrar na amostra e aquilo
que encontraríamos na população.
P. ex. uma média amostral (X com linha em cima) muito provavelmente não será
igual à média populacional h ao contrário). Do mesmo modo, o desvio padrão
amostral (S) dificilmente será igual ao desvio padrão populacional (o estranho).
Para compreendermos o erro amostral é importante fazer a distinção entre três
tipos de distribuições dos valores de uma variável:
1) Na população (distribuição populacional)
2) Na amostra (distribuição amostral)
3) No modelo teórico (distribuição amostral teórica)
Erro padrão:
Como é possível estimar o valor populacional de uma variável com base num único
valor amostral, tendo em conta a diferença inevitável entre amostra e população?
Levando em conta o erro: Erro-padrão da estimativa:
- de um número total;
- de um número médio (média dos valores de uma variável);
- de um número proporcional (proporção, o peso relativo face ao total de um dado
valor de uma variável)
O erro-padrão corresponde ao desvio-padrão estimado de uma distribuição
amostral teórica da varável (a distribuição que existiria se pudéssemos dispor os
valores de todas as amostras possíveis).
A distribuição teórica será uma “distribuição normal”.
Para facilitar, vamos trabalhar com a fórmula para a população, pois os resultados
variam muito pouco em amostras grandes.
Níveis de confiança, intervalos de confiança e margens de erro:
O nível de confiança é a probabilidade que admitimos de que um valor estimado está
próximo do valor real. O valor do nível de confiança é arbitrário (somos nós que o
decidimos à partida).
É convencional não aceitar níveis e confiança inferiores a 95% (para o qual a
probabilidade de acertar é de 95 vezes em 100 e a probabilidade de errar é de 5 em
100).
É comum expressar esta probabilidade em termos do intervalo de valores entre os
quais temos esse nível de confiança de que situarão os valores reais (intervalo de
confiança).

65% por de baixo da primeira à direita


95% por de baixo da segunda à direita
O problema da dimensão da amostra:
- Qualidade e validade dos resultados dependem da dimensão da amostra.
Contudo, nunca é possível conhecer a população completamente.
Rigor da amostra não aumenta proporcionalmente com o aumento da mesma.
Variáveis que intervêm na determinação da dimensão da amostra:
- Variância populacional (isto é, a sua heterogeneidade);
- Tipo de amostragem (p. ex. a amostra por cachos é menos precisa do que a amostra
estratificada);
- Nível de confiança pretendido ( que pode ser definido através de distribuições
amostrais…)
Amostras não Probabilísticas:
Ao contrário dos procedimentos de amostragem aleatórios, os procedimentos de
amostragem não probabilísticos:
- não garantem que todos os elementos da população tenham probabilidade
conhecida e não nula de serem representados na amostra, pelo que;
- não produzem amostras aleatórias, no sentido estatístico do termo;
- em rigor, não lhes são aplicáveis as técnicas de inferência estatística.
Amostragem por quotas:
- Baseia-se no princípio da proporcionalidade;
- O objetivo é idêntico ao da amostragem probabilística: constituir uma amostra que
seja um modelo reduzido da população;
- O modo de concretizar este objetivo é distinto:
_ não parte de uma base de sondagem exaustiva;
_ parte das proporções previamente conhecidas na população, de diferentes
características ou combinações de características (como a amostragem estratificada);
_ não sorteia elementos da população (ao contrário da amostragem estratificada);
_ a dimensão da amostra é definida por nós sem cálculo em função intervalo de
confiança, pois não podemos estimá-lo.
Amostragem: métodos não probabilísticos e procedimento misto de “random route”:

Amostras não aleatórias ou não probabilísticas:


• Ao contrário dos procedimentos de amostragem aleatórios, os procedimentos de
amostragem não probabilísticos Não garantem, …
• Formas menos sistemáticas de amostragem não probabilística são adequadas em
pelo menos 3 situações
1. Quando se pretende inquirir grupos muito específicos, difíceis de identificar e
encontrar;
2. Em estudos piloto ou exploratórios, para preparar inquéritos maiores (e,g., para
testar a compreensão de questionários);
3. Em investigação intensiva e qualitativa.
• Frequentemente, não pretendem ser representativos;
• Quando pretendem algum tipo de representatividade, é apenas da “diversidade
social”, sem preocupação…
Depende do tipo de práticas (mais imprevisíveis, fluídas, fora da norma, desviantes.

Amostra “acidental”:
É o tipo mais simples, implica uma escolha acidental dos casos considerados na
amostra.
• Ex., Estudo sobre população do ensino superior, inquirindo “ao calhas” (NÂO é o
mesmo que aleatoriamente!) pessoas numa rua qualquer escolhida sem critério)
• …
Amostra de conveniência:
- Consiste na seleção de um grupo de indivíduos com determinadas características que
nos interessam, e que estão prontos e disponíveis ara serem inquiridos.
- Não é representativa, mas pode ser utilizada em situações de estudo exploratório.
- Tem a vantagem de ser rápida, fácil e implicar custos reduzidos, p. ex., inquirir
pessoas numa paragem de autocarro; pessoas num jardim público; etc.
Amostragem intencional:
- Pressuposto básico: recorrendo à intuição e à estratégia adequada, é possível
selecionar (ou ir selecionando, em função de resultados anteriores) elementos
relevantes para incluir a amostra.
- É escolhida mediante os interesses do investigador, racionalmente estabelecidos em
função da população e do objeto/problema de investigação, p.ex.:
_ elementos qualitativamente típicos de determinados grupos e subgrupos
identificados nessa população.
_ elementos da população extremos ou contrastantes (neste caso, precisamente por
não serem típicos) quanto a determinadas características teoricamente relevantes.
- Uma amostra assim obtida não será representativa da população, mas será
teoricamente significativa por permitir fazer comparações relevantes.

Você também pode gostar