Você está na página 1de 26

CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 1

Red CLACSO de Posgrados em Ciencias Sociales


Seminario Virtual nº 2025
Técnicas de Análisis Estadístico

Aula Dois
Carxs Colegas,
Com este texto, iniciamos o estudo de Técnicas de Análise
Estatística. Para que você tenha uma idéia clara do nosso percurso ao longo
desta semana, apresentamos a seguir um resumo dos temas que serão
abordados. A aula divide-se em quatro seções. Na primeira seção, vamos
discutir o ato de observar. Parece evidente, mas você verá que a noção de
observação nos reserva algumas surpresas. Passo a passo, você
compreenderá em que consiste o ato de observar. Em seguida, vamos
conversar um pouco mais sobre as pesquisas qualitativas e quantitativas, com
a intenção de identificar aquilo que as distingue e o muito que tem em comum.
A nossa expectativa é de que você compreenda que, com independência de
método, toda ciência empírica da sociedade se impõem os mesmos rigores
Na segunda seção, trataremos do ato de medir. Discutiremos como
a observação nos traz informações sobre a realidade, proporcionando uma
descrição sintética do mundo. Veremos também como estas observações
podem ser vistas através de gráficos, tabelas, equações e cálculos e tais
apresentações nos proporcionam um “retrato” do mundo muito útil para a
compreensão das sociedades. Por fim, você aprenderá a noção de modelo
como representação da realidade e como isso interage com a prática da
investigação científica. O objetivo central da seção é aprender os fundamentos
de modelos para investigação empírica.
Vamos então começar: o que é observar e medir?
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 2

1. Observação e ciência
Toda ciência empírica faz-se a partir da observação, seja ela a
física, a sociologia, a economia, a química ou qualquer outra. Todavia, como
também sabemos desde Platão, a observação não é um fato tão simples
quanto somos tentados a acreditar: nossas observações são menos sólidas
do que parecem. Um exercício simples e interessante é repetir a experiência
do ponto cego. Podem encontra-la facilmente na internet 1. Os sentidos e nossa
própria percepção nos traem. Os modelos numéricos, por vezes, ameaçam
“adquirir vida própria”, como se apresentassem ontologicamente um caráter
estável e intrínseco ao objeto. Entretanto, números são atribuídos à realidade
pelo observador. Assim, sempre corremos o risco de nos enganamos com as
nossas observações e, consequentemente, levar a análises equivocadas
acerca dos fenômenos que queremos compreender e explicar.
Por isso, aprender a observar, com suas potencialidades, limites e
cuidados, é um exercício fundamental. Toda boa pesquisa surge da
capacidade de produzir observações acuradas que forneçam a base empírica
para análises consistentes. A experiência do ponto cego, além de um alerta
contra a tentação ingênua de se dotar os números de poderes especiais,
também serve ao nosso propósito de associar dois termos que nem sempre
andam juntos: observação e reflexão.
O que faz um observador? Distingue objetos, entidades, no
ambiente que o rodeia. Em uma fazenda, um observador poderia dizer:
– Ali está um pato e lá, mais adiante, vejo um marreco.
Uma pessoa que nunca tivesse visto patos e marrecos poderia muito
bem argüir o primeiro observador:
– Os dois têm penas e bicos muito parecidos. Não fosse você um bom
conhecedor dessas aves, eu continuaria acreditando que são dois
patos: um menor que o outro.
O primeiro observador poderia apresentar seus motivos para
distinguir patos de marrecos. Certamente não seriam as mesmas razões de um
biólogo. Mas não precisou fazer isso. Para o segundo observador, bastou a
autoridade do fazendeiro. Toda nossa aprendizagem começou, em vários
momentos de nossas vidas, desta mesmíssima maneira: alguém nos dizia o
que ver! Há, por certo, diferentes modos de ver a mesma cena. Costuma-se
mencionar, vez e outra, que os esquimós possuem uma variedade de palavras
para distinguir tonalidades de branco. O que para nós seria pura e
simplesmente branco, para eles encontra várias designações. Não é para
menos: se o esquimó não aprender a distinguir o branco da neve do branco do
urso polar, o final da história pode ser trágico.
Aprende-se a observar. Quando crianças, alguém nos ensinou a
distinguir animais, utensílios domésticos, ferramentas. É impossível separar a
nossa capacidade de observar e comunicar nossas observações da

1
Vide: https://www.youtube.com/watch?v=8NqEf1WEajg ou http://ciencianet.com/puntociego.html
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 3

experiência concreta de fazer coisas e interagir com outras pessoas. Todos nós
observamos o que, juntos, aprendemos a observar. Por esta razão, a nossa
experiência tende a aparecer com a força do óbvio e do inquestionável.
Daí a importância da reflexão. Refletir sobre alguma coisa que
acreditamos saber é nos perguntarmos como conhecemos aquilo que dizemos
conhecer. Esta atitude, tão importante na vida cotidiana, base para o
reconhecimento de que as nossas certezas são vulneráveis e devem ser
justificadas, também é fundamental para uma correta apreciação do
empreendimento científico. A pesquisa baseia-se na observação e no
cuidadoso treinamento deste observador profissional – o cientista. Mas é a
reflexão que introduz a dúvida sobre a realidade do que estamos apenas
acostumados a ver e isso fez surgir a ciência, como uma aventura de
permanente redescoberta da realidade. Nas Ciências Sociais, há muitas formas
de se fazer pesquisa e de outro lado muitos objetivos diversos a serem
alcançados. Para alcançar cada tipo de objetivo, há métodos que se mostram
mais apropriados que os demais. Segundo Charles Ragin e Lisa Amoroso
(2011)2, a pesquisa social apresenta de modo geral sete objetivos:
1. Identificar padrões gerais e relações
2. Testar e refinar teorias
3. Produzir diagnósticos e previsões
4. Interpretar histórica ou culturalmente fenômenos significativos
5. Explorar a diversidade
6. Dar voz a grupos minoritários
7. Avançar em novas teorias
A pesquisa quantitativa para eles está ligada principalmente aos três
primeiros objetivos, quais sejam: identificar padrões gerais e relações, testar e
refinar teorias e produzir diagnósticos e previsões. Secundariamente, métodos
quantitativos estão ligados também a explorar a diversidade e avançar em
novas teorias. Essas características estão intimamente ligadas a duas
características das Pesquisas Sociais que são inversamente proporcionais: o
número de casos pesquisados e o volume de características desses casos que
serão analisadas. Métodos qualitativos tem condições de se aprofundar em
poucos casos, são adequados a dar voz a grupos minoritários e explorar
profundamente a diversidade social, entretanto são incapazes de produzir
diagnósticos sociais amplos e informar sobre eficácia de política social que se
aplica a vários contextos. Ela pode entretanto apontar, a partir da análise
aprofundada de um contexto, quais características de um fenômeno tem
maiores implicações sobre os resultados sociais que se pretende alcançar,
sinalizando para pesquisadores que lidam com métodos quantitativos quais
características merecem mais atenção ao investigar um determinado
fenômeno.
Por outro lado, quando se observa numa pesquisa ampla que
determinados grupos ou ambientes apresentam comportamento diverso do

2
RAGIN, Charles C.; AMOROSO, Lisa M. Constructing social research: The unity and diversity
of method. Pine Forge Press, 2011.
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 4

padrão, a observação de uma exceção pode sinalizar para investigações


qualitativas que se aprofundem nesse ambiente para compreender o que o faz
diferente, uma exceção. Para formular e refletir sobre padrões sociais e sua
transformação, incluindo políticas públicas, os métodos quantitativos são os
que oferecem a possibilidade de se investigar ao mesmo tempo quais são os
elementos centrais para o funcionamento de determinado fenômeno e como
tais elementos se comportam em diferentes situações. Para tanto, é preciso se
ter em mente, com clareza, exatamente o que se quer avaliar, para, enfim,
poder se produzir um tipo de informação referenciada ao fenômeno, ou seja, ao
objeto adequado de pesquisa.
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 5

2. Medir e Comparar
Taxas: proporção e temporalidade
Ao longo dos próximos parágrafos, queremos construir, com você,
um exercício de interpretação social através de números. Para esta construção
conjunta, utilizaremos indicadores com três objetivos principais: refletir sobre
sociedade; observar a longa trajetória que vai da observação e produção do
dado até a formulação do indicador; desenvolver a capacidade de extrair
informação de gráficos e tabelas. Nesta seção exercitaremos formas de
organização de informações. Iniciaremos pedindo que você pense no que
significa observar, e nas armadilhas que uma percepção ingênua desta ação
pode oferecer. Para isso, introduzimos um conceito muito importante para lidar
com números: taxas.
A comparação é uma ferramenta central da pesquisa quantitativa em
Ciências Sociais. A pesquisa quantitativa não está ligada somente à produzir
dados ou refletir a realidade em números. Esses são procedimentos
metodológicos e técnicos importantes, mas não estão neles a essência da
pesquisa. Está no olhar do pesquisador. É ele (ou ela) quem desenha, planeja,
pensa e produz a pesquisa. Dessa forma, é ele ou ela quem estabelece as
propriedades que sua pesquisa vai ter ao pensar seu modelo. Esse modelo
será capaz de sintetizar informações da realidade e comparar essas
informações proporcionando análises, explicações, interpretações para o
fenômeno que despertou nossa curiosidade e nos motivou a estudá-lo.
Comparar significa também ser capaz de analisar processos e seu
desenvolvimento: se algo melhorou, piorou ou está do mesmo jeito. Ao
compararmos o que acontece com países em condições socioeconômicas
semelhantes na América Latina, conseguimos vislumbrar quais países
avançam mais, quais mostram-se estagnados, e quais não conseguem
progredir ou até regridem em relação ao demais. Suponhamos que nosso
objeto de pesquisa seja, por exemplo, a remuneração ou o salário. Podemos
comparar os rendimentos de um trabalhador em ano com o seu rendimento no
ano anterior. Perceberemos que, provavelmente, houve um ligeiro aumento.
Esse dado em si já nos indica algo para nossa análise? Sim! Contudo, essa
informação por si só é suficiente para dizermos que a situação desse
trabalhador melhorou de um ano para o outro? Talvez fosse interessante
comparar com um conjunto de preços de produtos em um ano e no outro para
saber se o salário teve seu poder de compra aumentado ou diminuído.
Podemos ainda comparar com outras categorias profissionais, por exemplo
bancários, ou operários, ou agricultores, para saber se “nosso trabalhador”
melhorou de situação em relação aos outros ou não. Essa é uma forma de
estabelecer parâmetros de controle para a análise.
Por hora vamos entender que o controle é um nível inicial com o
qual desejamos comparar o contexto que estudamos. No exemplo do salário do
operário, foram estabelecidos dois controles: 1) conjunto de preços de produtos
e sua variação de um ano para o outro (ou inflação); 2) salários de outras
categorias profissionais e de outros setores econômicos. Para comparar,
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 6

entretanto, temos que saber se as informações são comparáveis. Por exemplo,


não se deve comparar o preço de algo em dólares em um ano com o valor em
pesos em outro. Isso parece bem óbvio, mas quando pesquisamos opinião das
pessoas sobre um tema ou comportamentos sociais, as fronteiras entre o que
podemos e devemos comparar tornam-se menos claras.
Suponhamos que estejamos comparando a população afetada pela
pandemia de Covid-19 na América Latina. Nosso objetivo seria verificar a
incidência da doença e a gravidade da situação em cada contexto. Estamos
diante de uma série de dilemas. O primeiro é a que nós estamos nos referindo:
se a toda a população, aos indivíduos testados, às internações hospitalares
relacionadas a problemas respiratórios ou a outro critério. Essa opção não é
imposta pela realidade, mas é um critério a ser definido pelo pesquisador a
partir de seu referencial teórico e a disposição de suas categorias de análise.
Seguindo, então, com nosso exercício, abaixo mostramos algumas formas de
apresentação de informações: tabelas de frequência e gráficos de colunas.
Note que é a mesma informação, organizada sob formas diferentes. No dia 23
de abril, o México, um dos países mas populosos, apresentava 9501 casos
confirmados e 857 mortes. Equador apresentava 10850 casos confirmados e
537 mortes. A Argentina, por sua vez, registrava 3197 casos e 152 mortes.
Todavia, as populações desses países são também muito diferentes. As
diferenças ficam mais claras no gráfico, por causa do efeito visual, mas fica
mais preciso na tabela, que também pode incorporar mais informações.

Tabela 1: Casos confirmados de Covid-19 por país


País Casos confirmados
Argentina 3197
Equador 10850
México 9501
Fonte: WHO, acessados em 23 de abril de 2020.

Gráfico de colunas
Gráfico 1: Casos confirmados de covid19

Fonte: WHO, acessados em 23 de abril de 2020.


CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 7

Atividade: Localize e anote o número de casos confirmados e mortes


relacionadas à covid-19 em seu país e compare com outros países 3

Ao compararmos, devemos considerar que as populações são muito


distintas. Segundo dados da CEPAL4, a Argentina tem uma população
estimada de 45,2 milhões de pessoas, enquanto o Equador teria 17,6 milhões e
o México: 129 milhões. A população mexicana é muito superior à população
equatoriana e, também, à argentina. Há mais casos confirmados no México do
que na Argentina, mas também há mais pessoas expostas ao fenômeno lá.
Falamos em taxas quando relacionamos a população que experimentou
determinado fenômeno (casos confirmados de covid-19) com toda a população
que poderia experimentá-lo.
Neste caso, além da população total, deveríamos considerar a
população que foi testada. A comparação seria adequada se toda as
populações fossem testadas, de forma censitária, num mesmo período de
tempo e isso retornasse, como resultado, três status: “contágio positivo” (caso
confirmado), “contágio negativo” ou “imune” (já desenvolveu defesas que
inibem o contágio). No entanto, infelizmente, não temos acesso a essa
informação. Por isso, fenômenos sociais exigem sempre muito cuidado ao
serem comparados e é isso que torna o rigor científico tão relevante e valioso
para a sociedade. Temos sempre que comparar o que é comparável. Se
compararmos os casos confirmados com a população estimada, perceberemos
que a incidência no México e na Argentina eram de aproximadamente 0,07 por
mil cidadãos, enquanto no Equador era muito maior: 0,6 por mil. No entanto, se
compararmos os óbitos com os casos confirmados, a letalidade no México é
maior: 9%. Qual a principal lição que devemos apreender com as taxas?
Devemos comparar o que é comparável, sempre!
O mesmo acontece com o desemprego numa cidade ou país. As
taxas de desemprego são calculadas não sobre a população total, mas sobre a
População Economicamente Ativa (PEA) que está procurando emprego. Um
recém nascido não pode ser considerado um desempregado. Uma pessoa que
declaradamente não está procurando emprego, porque está estudando ou não
quer trabalhar, não pode também ser considerada desempregada. Por isso a
taxa de desemprego é calculada entre aqueles que são ativos economicamente
e estão procurando emprego, mas não estão conseguindo, dividido por todos
que estão empregadas ou procurando emprego, ou seja, suscetíveis ao
fenômenos de “estar ocupada”.
Na pesquisa quantitativa, além de informações num dado momento,
é interessante poder observar fenômenos ao longo do tempo. Não seria
possível voltar aos anos 1950 e observar diretamente como era a América
Latina. Mas houve pessoas que estavam lá, observaram e anotaram. Isso
permite uma pequena viagem no tempo. Além de viajar no tempo, é possível
viajar pelo mundo. É possível verificar outro dado de saúde 5: a Mortalidade

3
Consulte: https://covid19.who.int/
4
Vide: https://estadisticas.cepal.org/cepalstat/PerfilesNacionales.html?idioma=spanish
5
Vide: https://estadisticas.cepal.org/cepalstat/PerfilesNacionales.html?idioma=spanish
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 8

infantil (IGME), que é medida pela proporção de mortes a cada mil nascidos
vivos. No México, em 1951 a taxa de mortalidade infantil era de 170 e passou a
11 em 2018. Na Argentina, em 1969, a mesma taxa era de 59,6 e passou a 8,8
em 2018. Já no Equador, passou de 139,9 em 1955 para 12,2 em 2018.
Organizar dados coletados em diversas regiões, sejam da América Latina ou
do mundo ou de seu país ou cidade. Depois disso é possível compará-las e
descobrir coisas incríveis, o que é fantástico! Só nos é permitido esse tipo de
viagem porque as informações foram observadas e coletadas de formas
similares. Essa é uma das funções da pesquisa quantitativa – possibilitar
viagens no tempo e no espaço para fazer comparações, estimar progressos
(ou não!) e conhecer caminhos e diferenças entre nosso rumo e outros.
Uma forma comum para se fazer isso é usar a mesma informação
em dois momentos no tempo. A noção básica é a de proporcionalidade.
Suponhamos que a escola em que você estudou tivesse 200 alunos
matriculados em 2010 e, em 2020, 300. Divide-se o valor em 2020 (300), pelo
valor em 2010 (200) = 300/200 = 1,5. Como o patamar inicial (2010) tem que
ser considerado como ponto de partida, subtrai-se 1. Porque se deseja um
valor percentual, multiplica-se por 100. O crescimento do número de alunos em
10 anos foi de 100 alunos, que proporcionalmente representa um crescimento
de 50%, que pode ser um tipo de taxa. Tem-se um tipo de taxa de crescimento,
intimamente ligado à progressão no tempo, de 2010 a 2020.
Um outro tipo de taxa pode ser ligado à algo que ocorre em
determinado grupo. Numa sala de aula, com 40 alunos (como nosso grupo),
quantos são afetados pela evasão ao longo do curso? Se 5 alunos evadem,
divide-se 5 por 40 e obtém-se 0,125. Se o valor percentual auxilia na
compreensão, multiplica-se por 100 e obtém-se 12,5% como sendo um tipo de
taxa de evasão na turma que estamos estudando. Nesse caso, não há
preocupação com a definição de um patamar inicial como ponto de partida
igual a zero uma vez que não se objetiva verificar crescimento, mas um
fenômenos dentro de um grupo definido.
A palavra taxa é usada em muitos sentidos. Taxa de crescimento, de
desemprego, de natalidade, de fertilidade, de alfabetização, de crescimento
econômico e outras. Normalmente, o que se deseja é descrever o
desenvolvimento histórico de um fenômeno (crescimento da população, da
matrícula), ou saber o quanto um fenômeno (reprovação, fertilidade) ocorre em
determinado grupo. Além disso, as taxas podem ter bases diferentes, diferente
das porcentagens - que sempre usam uma base 100. Por exemplo, a taxa de
mortalidade infantil é expressa para cada 1.000 crianças nascidas vivas.
Importa sempre que se calcule a taxa considerando em sua base apenas
aqueles que podem ser sujeitos ao fenômeno. No caso da evasão, qualquer
aluno matriculado pode evadir de sua escola em algum momento do ano, por
um motivo qualquer. Isso é mais simples. Mas pensemos nos casos de
gravidez na escola. Todos os alunos da escola podem engravidar? Não,
somente pessoas do sexo feminino podem ser sujeitas a engravidar.
Entretanto, todas as alunas são suscetíveis a serem sujeitas desse fenômeno?
Não, somente aquelas que estão em idade fértil e são sexualmente ativas.
Caberia ao pesquisador definir qual a idade fértil e outras conceituações
pertinentes ao seu modelo. No nosso caso, vamos adotar que a idade fértil
inicia-se em média aos 15 anos. Outros poderiam dotar outras idades, como 13
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 9

anos, e isso afetaria os resultados, mas o que importa no momento é


compreender a noção de taxa.
Numa escola de ensino médio, há 500 alunos, 250 homens e 250
mulheres, sendo que das 250 alunas, 200 tem mais de 15 anos. Em 2003, 10
alunas ficaram grávidas e foram mães. A “taxa de fertilidade” na população
discente dessa escola é calculada pela proporção entre o grupo que foi afetado
pelo fenômeno (10 alunas) e o número total de pessoas que poderiam ter sido
afetadas pelo mesmo fenômeno (200). O resultado é 0,05 – que em termos
percentuais significa 5%.
Qual a lição aprendemos com tabelas e gráficos? Há mais de uma
forma de apresentar os dados, mas eles são os mesmos. Cabe ao pesquisador
escolher qual a forma é mais adequada para visualizar o fenômeno que ele
deseja que seja visto. Em geral é sempre bom poder apresentar na forma de
texto, em tabelas e também em gráficos ou figuras. A visualização em gráficos
ou figuras é mais rápida e mais fácil de se compreender, mas o volume de
informações tem que ser menor para que seja agradável de ser vista. Já
tabelas permitem a inclusão de mais informações, mas são mais difíceis de
analisar e entender (você já percebeu isso).
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 10

3. Modelos
Para refletirmos sobre modelos, podemos primeiro perceber que
eles sempre fizeram parte de nossas vidas. É um exercício elementar de
abstração e representação. Nós observamos o mundo ao nosso redor e
produzimos formas de representa-lo. Isso vale para as formas como
nomeamos e classificamos os objetos, para os símbolos que criamos e o que
eles representam, para os códigos de comunicação e uma vasta gama de
ações que realizamos cotidianamente.
Um exemplo simples pode ser baseado nas experiências escolar,
como professores e alunos. Imaginemos uma professora de educação primária
na Colômbia chamada Ana. Ela trabalha com crianças que ingressaram na
escola há poucos tempo. A maioria tem oito ou nove anos de idade e, entre
eles, há ainda alguns que não desenvolveram adequada proficiência em leitura.
Para acompanhar o desenvolvimento de seus alunos, ela dividiu a turma em
três grupos. No primeiro, estavam os alunos que, a seu critério, precisavam de
uma atenção especial, pois apresentavam mais dificuldades no processo de
alfabetização. No segundo, estavam as crianças que já começaram a ler e
escrever e que precisavam exercitar suas competências básicas. Já o terceiro
grupo era formado pelas crianças que ela acreditava que deveriam se dedicar a
atividades mais avançadas no campo da escrita e da leitura. Ao final de maio,
as anotações no caderno de acompanhamento de Ana tinha a seguinte
aparência. Para simplificar o nosso exemplo, vamos colocar apenas dez alunos
na turma.

Quadro 1: Amostra de alunos da Professora Ana por estágio de desempenho e mês


Nome Março Abril Maio
Teresa 1 1 2
Pablo 2 2 3
María 3 3 3
Alberto 2 3 3
Valentina 2 2 2
José 1 2 2
Daniela 1 2 2
Juan 1 1 1
Natália 3 3 3
Sebastián 2 3 3

Ana estava satisfeita com o seu sistema de acompanhamento, ela


compreendia claramente o que cada número queria dizer e, desta forma,
conseguia planejar com facilidade as atividades pedagógicas. Percebemos que
ela desenvolveu um modelo numérico em que os números representam
estágios de letramento e isso auxilia o desenvolvimento das atividades
cotidianas, a reflexão sobre a realidade em que está inserida, a tomada de
decisões e a comunicação com outras profissionais com competências
similares e que conhecem o modelo de Ana. Uma das formas de organizar
essas informações é uma tabela de frequência, como pode ser visto abaixo:
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 11

Tabela 2: Distribuição da amostra de alunos da Prof. Ana por nível de desempenho, em março
Nível de desempenho Frequência Percentual Percentual acumulado
1 4 40% 40%
2 4 40% 80%
3 2 20% 100%
Total: 10 100%

Muitos profissionais constroem modelos para facilitar o seu trabalho.


A planta de uma casa apresenta a localização e as dimensões de paredes,
portas e janelas e serve para que os operários se orientem durante a
construção. Neste caso, tem-se um modelo gráfico. O que a nossa professora
colombiana construiu foi um modelo numérico para representar, de uma
maneira adequada aos seus objetivos, as diferenças observadas no
aprendizado de seus alunos. Vamos olhar um pouco mais de perto, o que Ana
fez:
1. Ela observou diferenças no desenvolvimento de seus alunos
2. Ela compreendeu essas diferenças e as interpretou baseada em
seus conhecimentos técnico-científicos.
3. Ela criou categorias de análise para diferenciar os níveis de
desenvolvimento e atribuiu um número a cada uma delas.
4. Ela observou mais atentamente seus alunos e relacionou cada um
a um estágio de desenvolvimento.
5. Ela anotou em seu caderno de acompanhamento, na linha
correspondente a cada aluno e na coluna correspondente a cada
mês, o número correspondente ao estágio daquele aluno naquele
mês.
Temos, nesse exemplo, um modelo, construído com três números,
que representa as diferenças de desempenho dos alunos de uma turma. O
número 1 foi atribuído aos alunos de desempenho mais baixo. O número 2 foi
relacionado aos alunos que se encontram em uma situação intermediária. O
número 3 foi ligado àqueles com desempenho adequado na leitura e na escrita.
Esta pequena história contém todos os elementos necessários a uma
discussão rigorosa sobre o conceito de medida.

Medir é atribuir números a sujeitos e objetos de uma forma que seja


significativa para o observador.

Um outro exemplo pode ser derivado da observação astronômica.


Ao olhar o céu noturno, um observador atento pode, usando um telescópio,
identificar corpos celestes (pontos esféricos brilhantes, como bolas) de
diferentes tamanhos. Pode então compará-los e fazer anotações sobre eles em
seu caderno. Pode atribuir números às bolas que viu e esses números tem
significado para ele. Suponhamos que ele viu bolas pequenas, intermediárias e
grandes. Ele atribuiu o número 3 para as menores, o número 5 para as
intermediárias e o número 8 para as maiores. O modelo parece, ao observador,
bem ajustado: as bolas 8 são maiores que as bolas 5, e as bolas 5 maiores que
as bolas 3. Entendeu a relação entre realidade, modelo e medida? O modelo é
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 12

uma representação da realidade, que no nosso caso, é traduzida ou codificada


em números (medidas). Já vimos que medir consiste em atribuir números a
objetos de uma maneira significativa. Podemos então refletir sobre níveis de
medida e depois voltemos a pensar sobre modelos.
1) A primeira parte desta definição – “atribuir números a objetos” -
identifica o procedimento de observar, comparar e “medir” com a
proposição de uma relação entre um conjunto de números reais e
um conjunto de objetos empíricos, de forma que suas diferenças
em uma dimensão sejam traduzidas pelas representações
numéricas.
Vimos isso no exemplo da professora Ana. Os alunos se diferenciam
em várias dimensões: tamanho, idade, peso, distância que moram da escola,
classe social, gênero, etc. No entanto, para o modelo de Ana, interessa apenas
uma dimensão: o estágio de desenvolvimento da leitura / escrita. Seu modelo,
portanto, diferencia os alunos em função desta dimensão, relacionando
números a cada estágio. Assim, um conjunto de números é atribuído a um
conjunto de sujeitos empíricos.

2) A segunda parte desta definição – “... de uma maneira


significativa” - diz que as relações entre os números devem
retratar aspectos essenciais das relações substantivas
observadas entre os sujeitos em uma dimensão.

Ana produziu diversos instrumentos (atividades, exercícios, testes...)


para diagnosticar sua turma. A partir desses instrumentos, Ana conseguiu
produzir um diagnóstico de cada sujeito. Ela tem convicção de que (1) os
alunos têm desempenhos diferentes e (2) que esses desempenhos pode ser
ordenado em três categorias conforme descrito acima. Daí o fato de o conjunto
de números refletir, ainda que de forma simples (também imperfeita e limitada),
o que ocorre entre os objetos:
1, 2 e 3 estabelecem uma ordem que encontra correspondência na
realidade. Todavia, 1 + 2 não é igual a 3. A distância entre 1 e 2 não é a
mesma entre 2 e 3. Importa que as diferenças entre os números atribuídos aos
objetos reflitam, em algum modo útil e claro para o observador, as diferenças
entre os objetos com respeito àquela dimensão. Medir envolve, portanto, a
construção de um modelo formal de um conjunto de dados, usando como
componentes um conjunto dos números reais, com uma ou todas as
propriedades dos números reais.
O desafio de medir apresenta três fases e três aspectos distintos:
escolha da unidade, comparação com a unidade; expressão do resultado
dessa comparação por um número. Para esse assunto ficar mais claro, vamos
falar sobre as propriedades dos números, por meio das quais definem-se os
níveis de medida. As relações entre os números reais caracterizam-se por três
propriedades, que você já deve conhecer por meio dos seus estudos de
Matemática, mas vale a pena recordá-las aqui. Essas propriedades estão
dispostas na figura a seguir:
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 13

Quadro 2: Propriedades dos números reais


Propriedades dos Descrição da propriedade Ilustração
números reais
Identidade Todo número é igual a si mesmo e 1 = 1 e 1  2
somente a si mesmo.

Ordem Qualquer conjunto de números reais, 1 < 2 < 3 < 4


diferentes entre si, pode ser disposto
de forma ordenada, em uma seqüência
crescente, do menor ao maior número.
Aditividade Os números podem ser somados. 1+2=2+1=3
Divisibilidade Os números podem ser fracionados e
multiplicados, sempre encontrando 2 x 3 = 6
entre dois deles um terceiro com 6 / 3 = 2
significado proporcional

Podemos conceber o nível de medida como uma função que associa


observações empíricas a valores numéricos. Para formalizar essas definições,
vamos considerar:

C, um conjunto de objetos {c1, c2, ... cN } que variam em uma dimensão da realidade.
N, um conjunto de números reais
N(c1), o número atribuído ao objeto c1
f, a função que associa os elementos do conjunto C com os elementos do conjunto N

Medida nominal
O questionário pergunta: Sexo: (0) Masculino (1) Feminino
Teremos uma medida nominal se apenas a propriedade da identidade é
preservada: (S1=S2)  M(S1)=M(S2)
S1 = S2 diz apenas que esses dois objetos pertencem à mesma categoria
nesta dimensão. Não são iguais em nenhum outro senso numérico: A
igualdade possui significado matemático, tal como a diferença, mas a distância,
a ordem, a proporcionalidade e outros atributos numéricos não se aplicam
neste caso.
Em outras palavras, 0 é diferente de 1 e vice versa. Todavia, neste caso, a
categoria (0) não é menor nem maior que (1) – apenas são diferentes.
Poderiam ser usadas letras ou cores – que também apresentam a propriedade
da identidade. Usam-se números por apresentarem vantagens operacionais,
mas eles devem ser interpretados apenas como diferenciadores.
Não devem ser utilizados procedimentos baseados nas demais propriedades,
como ordem, aditividade e divisibilidade.
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 14

Medida ordinal
Um exemplo são os estratos econômicos (de 1 a 5)
Fo: (S1=S2)  M(S1) = M(S2)
(S1<S2)  M(S1) <= M(S2) ou M(S1)>=M(S2)
Logo, preserva assimetrias empíricas entre as categorias observadas. Tais
assimetrias são relacionadas à ordem.
O sinal de < deve ser interpretado com cuidado, pois indica apenas uma
assimetria substantiva entre S1 e S2 relativa à ordem. Não há uma relação
matemática na distância entre dois números. Sua ordem é apenas o resultado
do modo como o analista resolveu interpretar a observação.
Assim, a distância entre os estratos 3 e o 4 não é a mesma entre os estratos 1
e 2 e assim para todos. Importa apenas que os estratos são diferentes entre si
e que o 1 vem antes do 2, que vem antes do 3, que vem antes do 4...
Devem ser evitados procedimentos que mobilizem aditividade e divisibilidade.

Medida intervalar
Alguns exemplos são a temperatura (em ºC) e a proficiência (ie. PISA)
F deve ser uma função numérica específica relacionando S e M. No caso mais
simples, uma relação linear.
Fi: M(S1) = a + b(S1)
Há diferenciação: 10ºC são diferentes de 20ºC.
Há ordem: 5ºC são mais frios que 10ºC que são mais frios que 20ºC.
As distâncias são equivalentes. A diferença na oscilação do mercúrio e seu
volume é similar entre 5ºC e 10ºC e entre 10ºC e 15ºC e assim
sucessivamente.
No entanto, 10ºC não é o dobro de 5ºC. Como o início da escala é arbitrado
(logo, não é absoluto), suas proporções são não fixas – apenas seus intervalos.
Basta comparar com a escala Fahrenheit (ºF).
05ºC = 41ºF
10ºC = 50ºF (+5ºC = +9ºF) (10ºC não é o dobro de 5ºC // 50ºF não é o dobro de 41ºF)
15ºC = 59ºF (+5ºC = +9ºF) (15ºC não é o triplo de 5ºC // 59ºF não é o triplo de 41ºF)
Os intervalos são estáveis, mas as proporções não são. Em qualquer dos
casos, o zero não reflete total ausência de calor ou de qualquer dos atributos
medidos. O zero foi arbitrado. Uma escala intervalar pode ser facilmente
convertida em ordinal, embora seja mais adequada mantê-la com suas
propriedades. Podem ser feitas adições e subtrações, mas não devem ser
feitas diretamente multiplicações, divisões, frações, proporções e outras
operações matemáticas.
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 15

Boa parte das operações e análises com variáveis intervalares acaba por
utilizar procedimentos que mobilizam divisibilidade. No entanto, é preciso ter
consciência dos limites dessas variáveis e não extrapolar as análises para além
de suas propriedades.

Medida de razão (ou escalares)


Exemplo: idade, peso, altura, renda
Fr: a=0
A localização da origem é substantivamente significativa, ou seja, seu zero tem
existência real: o início de sua escala (sua origem) é absoluta, denotando
ausência da característica medida. A escala se origina num ponto em que não
há presença do elemento que se deseja aferir: seu gradiente de concentração
é zero. Uma conta bancária com saldo zero tem significado substantivo e claro:
há ausência de recursos. O mesmo para altura = zero ou peso = zero.

Para cada nível de medida, se associam ferramentas matemáticas e


estatísticas adequadas à sua operacionalização. As variáveis nominais e
ordinais, muitas vezes, são também chamadas de variáveis (ou escalas)
qualitativas. As variáveis podem também ser classificadas como discretas ou
contínuas. São contínuas as variáveis que sempre podem assumir um valor
entre dois outros, ou seja, são infinitas em seus pontos. Variáveis discretas
apresentam pontos finitos e não é possível sempre encontrar um valor
intermediário entre dois outros. Variáveis qualitativas são discretas. Há no
entanto variáveis de razão que são também discretas, com o número de filhos
ou de alunos matriculados numa instituição. Várias outras são de razão (ou
escalares) e também contínuas, como altura, peso, renda, velocidade, tempo.
O nível de medida se reflete nas análises mais adequadas a serem
empreendidas entre variáveis. As análises podem ser univariadas, como
tabelas de frequência e as estatísticas descritivas. Referem-se a análises que
consideram apenas uma única variável e a descrevem. Há as análises
bivariadas, como as tabelas de contingência ou tabelas cruzadas, as médias
comparadas e as medidas de associação. São análises que envolvem duas
variáveis. As análises podem ainda ser multivariadas, como as regressões, as
path analysis, as matrizes de distância multidimensionais e outras técnicas.
Nesse último caso, os modelos empíricos incorporam mais de duas variáveis.
As principais técnicas de análise estatística de dados sociais
referem-se a amostras independentes, ou seja, àquelas cujas observações são
independentes umas das outras. Uma variável pode estar associada a outra,
mas as observações não são condicionadas entre si, ou seja, são
independentes entre si. Assim, espera-se não haver viés na observação que
leve a uma análise equivocada em função de resultados pré-determinados
decorrentes de vícios na produção das observações.
As principais análises univariadas são as tabelas de frequência, as
medidas de tendência central (média, mediana e moda), as medidas de
dispersão (desvio padrão, amplitude) e seus respectivos gráficos, como o
histograma. As frequências são muito importantes para variáveis discretas /
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 16

qualitativas. Para essas variáveis, é preciso muito cuidado com as medidas de


tendência central e dispersão pois elas fazem sentido nas variáveis
dicotômicas ou binárias, que são aquelas que variam apenas entre dois valores
(ie. 0 e 1). Para os outros casos com mais categorias discretas, como sequer
as distâncias são equivalentes, nem sempre há um significado empírico
pertinente para interpretação dessas medidas. De ouro lado, as tabelas de
frequência não são adequadas para variáveis contínuas, para as quais as
medidas de tendência central e dispersão são mais utilizadas, juntamente com
gráficos de dispersão, como o histograma.
Para análises bivariadas, o nível de medida também deve receber
atenção especial. O quadro abaixo sintetiza alguns dos principais
procedimentos estatísticos utilizados nesses casos, em função do nível de
medida. Não se preocupem: você não precisam decorar todos e nem sequer
vamos tratar de todos eles neste curso! As informações estão dispostas aqui
para que você saiba e possa, se quiser, se aprofundar no futuro:

Quadro 3: Medidas de tendência central plausíveis por nível de medição


Nível de medida Moda Mediana Média
Nominal X - -
Ordinal X X -
Intervalar X X X
/ de razão

Quadro 4: Procedimentos usuais em análises bivariadas

Nível de medida Nominal Ordinal Intervalar / de razão


Nominal Tabela cruzada Médias comparadas
Qui-quadrado Análise de variância
Odds ratio Manova e Mancova
Clusters
Ordinal Tabela cruzada Tabela cruzada Médias comparadas
Qui-quadrado Rô de Spearman Eta e Testes t
Kolmogorov-Smirnov K de Cohen Análise de (co)variância
Clusters
Análise discriminante
Intervalar R de Pearson
/ de razão Análise fatorial
Regressão
Path analysis

Modelos

Para que a noção de modelo fique clara para você, vamos dar um
exemplo de um modelo de uso corrente: o mapa de uma cidade. Todos sabem
que há muitas maneiras diferentes de representar a organização espacial de
uma cidade. Podemos ter um mapa que contém apenas as ruas e avenidas,
com seus nomes. Quando você está em uma cidade pela primeira vez, ele é
imprescindível para a sua orientação. Neste caso, temos um modelo que não é
numérico, é gráfico e espacial. Da mesma forma que os modelos numéricos,
mapas procuram representar alguma característica dos objetos ou algum
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 17

atributo dos sujeitos que observamos. Os mapas dispõem em duas dimensões


as relações entre objetos. O exemplo dos mapas também deixa claro outro
aspecto muito relevante: modelos não reproduzem a realidade, são abstrações
que representam algum aspecto da realidade que observamos e nos interessa
modelar.
Da mesma forma que um mapa rodoviário de uma cidade
representa as ruas apenas com o objetivo de orientar o motorista, tendo em
vista o meu interesse, os números usados para caracterizar o desempenho dos
alunos em uma disciplina devem ser capazes de guiar o professor: o aluno com
conceito 1 deve se encontrar em uma situação de desenvolvimento cognitivo
diferente do aluno de conceito 2, uma diferença que seja relevante para o
observador, no caso o professor responsável por organizar as atividades
pedagógicas em conformidade com as necessidades e possibilidades de seus
alunos. O rigor na ciência não significa a capacidade de reproduzir a realidade
em seus mínimos detalhes.
Se um modelo deve proporcionar um reflexo próximo de um sistema
empírico, então as suas implicações lógicas devem ser trabalhadas e
comparadas com o comportamento observável dos objetos empíricos em
questão. Se as observações empíricas são consistentes com as previsões
baseadas no modelo, podemos concluir que o modelo proporciona uma
descrição adequada de tal segmento da realidade. Comparar modelos
abstratos com o mundo empírico é o foco central da construção de teorias.

Atividade:
- Produza uma tabela de frequência referente ao nível de
desempenho da amostra de alunos da professora Ana no mês de abril,
seguindo o exemplo da Tabela 2 (página 11)
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 18

II. Modelar, Ajustar e Avaliar.


Nesta segunda parte, avançamos nossa aventura junto aos dados, e
instrumentos de pesquisa quantitativa. Já vimos o que é o ato de observar e
como ele, na pesquisa, se distingue da prática cotidiana. Percebemos diálogos
e diferenças entre pesquisa qualitativa e quantitativa, identificando aquilo que
as distingue e muito do que compartilham. Refletimos sobre o ato de medir e
como ele é afetado pela observação. Vimos que dados nos proporcionam um
“retrato” do mundo muito útil para a tomada de decisões sociais, e assim
chegamos ao processo de construção de modelos. Ao final, aprendemos a
articular modelos numéricos a diferentes objetivos e tipos de associação.
Continuamos neste tópico a estudar como modelar. Isso significa,
primeiramente, traduzir a realidade em informações relevantes e estas em
códigos passíveis de tratamento científico.
Um aprendizado importante é a produção dos instrumentos de
pesquisa, logo, estratégias de investigação que nos proporcionam aplicar o
modelo abstrato aos fatos e gerar números, ou medidas. Os itens de um
questionário são utilizados para a produção de dados categóricos e escalas de
diversos tipos. Para aprender a lidar com dados, precisamos entender sua
lógica de produção e elaboração de instrumentos. O dado resulta da
observação criteriosa em função de dois parâmetros envolvidos no fenômeno
em análise: o caso (sujeito) e uma de suas característica específicas (variável).
Esses são pré-requisitos para iniciar nosso aprendizado sobre
índices e escalas. Veremos que este tipo de informação é capaz de tornar
compreensível um fenômeno ou um determinado aspecto da realidade, como o
nível sócio econômico, que não é derivado apenas de uma observação isolada,
mas carece de tratamento para poder traduzir algo abstrato em numérico e
passível de estudo, comparação e reflexão. Somente é possível elaborar
indicadores confiáveis se os dados foram observados de forma rigorosa e
adequada ao fenômeno investigado. Ao final deste tópico, queremos que cada
um de vocês se sinta capaz de compreender a lógica da construção de índices
e escalas e da elaboração de itens para um instrumento de pesquisa.
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 19

1. Comparar
O que é um dado?
Um estudioso6 da pesquisa científica propôs uma interessante teoria
sobre o dado. Para ele, todo dado resulta da comparação de duas entidades.
Falando assim parece complicado, mas fazemos isso todo dia e nem
parecemos estar fazendo coisas complicadas. Para este estudioso, um dado é
uma representação mental da realidade. Uma forma como nós, seres
humanos, organizamos, em nossas mentes, as nossas experiências cotidianas.
Ele pensou assim: temos informações sobre uma entidade, e informações
sobre outras, mas não operamos mentalmente apenas informações isoladas.
Quando comparamos, produzimos algo que nos permite instruir ações. Se sei a
informação sobre a altura de Ana, sei informações individuais, mas isso pouco
me ajuda a tomar decisões. Quando posso compará-las, reflito melhor para
tomar série de decisões.
Pouco importam as informações isoladas em si, ou mesmo padrões
de medida. Ele se referia a métricas ou medidas prévias, como o metro ou o
quilo. Importam-nos as comparações entre duas referências. Ao comparar a
altura de Ana com a altura de Pablo temos um dado = “maior”! Podemos fazer
comparações de outros tipos. Se ele compara uma gostosa maçã com a idéia
de sabor ele tem o dado: “doce”. Quando comparamos Pedro, um aluno de
ensino fundamental, com uma questão de matemática, poderíamos então ter
um dado: “acertou” ou então “errou”.
Quando comparamos Ana com uma régua de 1 metro, temos outro
tipo de dado acerca de sua altura: “1,70m”, por exemplo. Não precisamos de
“réguas” para obter informações relevantes e úteis para nossa investigação,
mas temos necessariamente que comparar uma entidade com outra. Essa
tentativa visa à melhor representação da realidade, ou seja, desenhar um
modelo que se ajusta adequadamente à nossa investigação e à nossa
realidade.
Temos sempre em mente que os dados são representações
limitadas da realidade e que nos possibilitam uma visão sintética e muito útil de
um fenômeno ou contexto, mas que certamente não esgotam em si toda a
realidade – mas reúne as suas qualidades ou características que são mais
importantes para nós naquele momento. Alguns problemas ou contextos
indicam para nós que a pesquisa quantitativa pode ser uma ferramenta
poderosa de produção de informações, sua análise e interpretação, como
fenômenos complexos demais, em grande escala ou com muitas pessoas,
como a natalidade no América Latina. Já imaginou alguém individualmente ter
que acompanhar todos os partos e cesarianas em toda a América Latina? E
ainda se lembrar de cada detalhe e de cabeça analisar tudo isso junto? É
impossível! Como então tratar desse assunto ou de outros que são muito
relevantes para a Ciência e para a Sociedade? Produzindo ou recolhendo

6
JACOBY. William G. Data Theory and Dimensional Analysis. Newbury Park, CA: Sage
Publications, 1991.
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 20

informações objetivas, capazes de serem observadas, registradas e


sistematizadas para serem depois analisadas.

Dado como comparação

Desde o início deste estudo, várias vezes a observação foi mostrada


como uma ação elementar da pesquisa quantitativa. Como já dito, isso não é
algo simples ou natural. A observação não é um exercício natural em que
coletamos a informação na realidade como se ele estivesse “pronto para ser
colhido”. A informação é uma abstração. A informação é produzida por nossa
observação em um exercício de comparação, logo é relativa.
Quando observamos que uma folha é verde, estamos relacionando a
folha à cor. Estamos ao mesmo tempo comparando a cor verde com outras
cores, o que possibilita diferenciá-la e defini-la como sendo “verde”. Além disso,
estamos comparando a folha com outros tipos de classes de objetos e estamos
classificando-a como folha e depois como verde. Quando relacionamos a folha
ao verde (“folha verde”), estamos realizando o primeiro passo para comparar
este objeto com outros tipos ou características de outros objetos: folhas
amarelas, frutas verdes. Ao observarmos o mundo, classificamos a realidade
em uma série infinita de categorias e podemos compará-las para melhor
compreendê-las e assimilá-las em nossa inteligência. Assim se produz o dado.
Quando comparamos, classificamos os sujeitos da comparação em
grupos cujos membros, para nós, são comparáveis entre si e em
características que, além de serem comparáveis, apresentam variação. Não há
sentido em comparar o que não varia ou que varia pouco (como o número de
dedos em cada pé). Contudo, faz sentido comparar a altura ou a renda de
indivíduos de diferentes grupos sociais. Um grupo é passível de comparação
quando apresenta características similares. Outra condição essencial também
foi cumprida: a renda varia e é uma dimensão relevante do fenômenos social
que investigamos. O conceito de dimensão é muito mais complexo, mas
inicialmente trataremos de sua descrição como uma característica de um
fenômeno que afeta um grupo definido e que é passível de variação e medição.
A dimensão não é encontrada pronta na realidade, é algo derivado
de nossa observação. Um exemplo melhor para entender o quanto isso é
importante e, às vezes, complexo é o nível sócio econômico. Nós sabemos que
a vida social apresenta uma dimensão econômica e que ela varia entre as
pessoas. Todavia, como capturá-la em dados? Uma forma é pelo nível de
consumo, por exemplo, uma pessoa ter TV, geladeira, carro. É a minha
observação que está construindo uma comparação entre pessoas pelo nível de
consumo (dimensão). Quando encontramos uma dimensão que nos permite
comparar sujeitos (ou casos), podemos então produzir os dados de acordo com
essa dimensão e organizar os dados em uma matriz, com uma série de
informações sobre os casos que serão comparados. Essa matriz é um resumo,
uma síntese da realidade, e ela é a base material para o desenvolvimento e
testagem de nosso modelo.
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 21

2. Indo além do dado inicial


Como vimos, a pesquisa quantitativa tem enorme poder de síntese e
pode ajudar muito na tomada de decisão. Baseia-se na informação extraída da
observação criteriosa, rigorosa e sistemática da realidade e sua posterior
codificação analítica em números, com base nas teorias que apoiam cada
estudo em curso. Sabemos também que algumas informações (dados) são
mais fáceis de mensurar. Por vezes, uma única informação já diz muito sobre
nosso objeto de investigação. Em outras situações, são necessárias mais
observações das manifestações de uma mesma dimensão latente para que se
possa mensurar de forma adequada um objeto de estudo.
Para tanto, devemos reunir múltiplas observações unidimensionais
para traduzir um aspecto da realidade. O objetivo dessa tarefa é produzir um
dado, relativo a uma características (dimensão) da realidade, que melhor
representa o fenômeno que estudamos. Esse dado não é observado
diretamente, mas é calculado a partir da reunião de múltiplas observações.
Trata-se então de um dado secundário, derivado de dados primários
diretamente observáveis. Podemos lembrar de vários fenômenos sociais que
nos afetam e que não são observados diretamente, como o desenvolvimento, a
desigualdade, o poder, a riqueza / pobreza, entre tantos outros.
Ao nos recordarmos da inflação, lembraremos que comparar os
preços de produtos atualmente, com o preço desses mesmos produtos
anteriormente, somos capazes de estimar uma taxa de variação média de
preços. Ainda mais interessante é comparação com outros dados sociais, como
a renda média de diferentes categorias ou classes. Se o poder de compra do
salário de um operário aumenta, ele tende a ficar feliz. Todavia, se os vizinhos
dele, que tem outras profissões, tem seus salários aumentados mais ainda,
aquele operário pode ter a sensação de que ele “perdeu renda”, pois numa
hierarquia salarial entre ocupações, sua situação piorou.
Vamos por enquanto deixar de lado a questão dessas hierarquias de
ocupações, comparações entre salários e vamos voltar ao poder de compra.
Quando reunimos um conjunto de informações que são comparáveis entre si e
dizem respeito a um mesmo tema ou característica, normalmente somos
capazes de produzir um índice ou escala. Professores conhecem esses
princípios elementares. Ao aplicar mais de uma avaliação ao longo do ano (de
uma mesma disciplina) e depois realizar uma operação para obter um resultado
final sintético, operou-se o fundamento de uma escala.
Uma escala é produto de uma coleção de informações sobre um
mesmo tema: preços ou rendimento em avaliações. A escala nos ajuda muito,
porque ela agrega muitas informações dispersas e nos permite comparar o
desenvolvimento de um mesmo sujeito (aluno) ou fenômeno (inflação), e ainda
comparar entre os sujeitos (entre alunos de uma turma) ou entre os elementos
do fenômeno (arroz, vestuário, salários). A escala é construída de acordo com
o que se pretende investigar, sendo muito útil, mas também, imperfeita.
Algumas de suas caraterísticas são:
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 22

a) Ela é secundária e latente: não é observável diretamente na


realidade. É estimada a partir de suas manifestações observáveis.
b) Ela é sintética: reúne muitas informações sobre uma mesma
dimensão, permitindo uma visão global do fenômeno através da
produção de um indicador
c) Ela ordena os sujeitos (casos): a escala é produzida a partir de um
conjunto variável de observações que possam ser comparadas.
Isso permite à escala que ela expresse uma hierarquia, permitindo o
ordenamento de casos.
d) Ela apresenta algum tipo de seleção de dados relevantes, logo há
um viés na escala que é gerado por essa seleção. Entre as
informações que compõem a escala também pode haver algumas
com maior peso por serem consideradas mais importantes.
e) Há sempre mais de uma maneira de ser calculada. Observe que há
mais de um índice de inflação, seus resultados para um mesmo
período podem ser ligeiramente diferentes, mas todos “medem” o
mesmo fenômeno.
Para montar uma escala, alguns cuidados devem ser tomados. O
primeiro é que todas as informações que comporão a escala devem versar
sobre uma mesma dimensão, portanto, são comparáveis. Como a escala
estabelece uma gradação, e deseja uma hierarquia (classificação entre os
casos) é importante que as informações tenham variação para diferentes casos
observados. Um terceiro cuidado refere-se à métrica da escala e sua
ponderação. Cada informação é codificada em números. Se uma informação
varia de 0 a 10 e outra de 0 a 20, a segunda terá maior peso na formação da
escala. Observe ainda que se há outra que varie de 20 a 30, embora a
distância entre o mínimo e o máximo (ou a amplitude) seja de 10 pontos, a
métrica da informação faz com que ela tenha um peso também maior. Há uma
série de cuidados a serem tomados para a produção de uma escala 7.
Como dito, há mais de uma forma de calcular uma escala. O
procedimento mais simples é (1) selecionar as variáveis para compor a escala,
respeitando sua (uni)dimensionalidade; (2) ajustar a métrica das variáveis a
serem utilizadas na produção da escala (padronizar), para que sejam
compatíveis e adequadamente comparáveis, (3) somar os dados das variáveis
selecionadas numa nova variável que expresse esse resultado (score); além de
outros os cuidados, tal como alertado acima. Nessas situações, todas as
manifestações da dimensão latente, observadas e codificadas em variáveis,
tem a mesma importância, o mesmo peso, e portanto são os casos que são
ordenados – mas não as características do fenômeno (variáveis).
Babbie (1999) diferencia escalas de índices. Esses últimos implicam
em hierarquizar tanto casos quanto variáveis, a partir de seu “valor de
escassez”, ou raridade, ao assumir que umas mostram-se mais “relevantes” do
que outras. Um exemplo simples é uma lista de exercícios de matemática com
questões com diferentes níveis de dificuldade. Mais do que atribuir notas,
importa descobrir as habilidades que os alunos já desenvolveram e quais estão

7
Vide Babbie (1999) e Jacoby (1991).
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 23

ainda em desenvolvimento. Numa lista com 10 exercícios, em que o mais fácil


era o primeiro e o mais complexo era o décimo, os itens estão também
ordenados. Em cada exercício, era adicionado uma tarefa a mais que seria
necessária para resolver o exercício, de tal forma que o décimo continha todas
as 9 tarefas anteriores mais uma. Quem acertasse o décimo teria demonstrado
que é capaz de resolver todos os demais. Uma outra vantagem é que o
professor saberia o nível de desenvolvimento de habilidades matemáticas de
cada aluno, a partir do último exercício realizado corretamente.
Quando as variáveis guardam entre si uma hierarquia implícita, essa
gradação torna-se mais significativa que a soma simples deles ou sua média.
Ao resultado desse tipo de procedimento, Babbie (1999) chama de índice, e
não de escala. Contudo, os termos índices e escalas são popularmente usados
em situações similares, ambos sendo capazes de ordenar casos a partir da
reunião de uma série de observações (variáveis) relativas a um mesmo
fenômeno (dimensão latente), mas apenas os índices sendo também capazes
de ordenar tanto os casos quanto as variáveis.
Observe que uma simples lista de exercícios também contém um
modelo implícito. Este modelo prevê que quem acerta uma questão mais
complexa, provavelmente terá acertado todas as anteriores, ou pelo menos
mostra-se capaz de fazê-lo. Isso guarda uma série de nexos lógicos que fazem
sentido neste modelo. Entretanto nem sempre é assim. Ao recordar dos
parágrafos anteriores, lembraremos do salário, do poder de compra e do
consumo, que pode ser comparável em relação a bens móveis: rádio portátil,
TV, geladeira, carro. Neste exemplo, pode-se esperar que quem tem carro, que
é mais caro, teria também condições de comprar geladeira, TV e rádio portátil,
que são mais baratos. Todavia, a realidade pode contrariar a lógica implícita no
modelo, e devemos nesses casos repensar nosso modelo e ajustar o modelo
aos dados.
Embora uma pessoa que tenha carro tenha quase sempre condições
de ter todos os outros bens citados, uma pesquisa pode observar que a maioria
das pessoas com carro não tem rádios portáteis e vice versa, a maioria das
pessoas que tem rádios portáteis não tem carros. Isso pode acontecer não por
questões estritamente econômicas, mas porque quem tem carro pode não ter
rádio portátil por optar por um aparelho de som mais avançado e não querer
(nem precisar) de um rádio. Sendo assim, a observação sobre rádio portátil
pode não ser útil em seu modelo o que deve indicar que o modelo pode ser
ajustado, excluindo informações sobre rádio portátil e mantendo as demais.
A construção de índices e escalas não é um exercício rígido mas
uma tarefa de reflexão sobre a dimensionalidade de um fenômeno, expressa e
sintetizada pelo indicador, seja escala ou índice. Em outras palavras, deve-se
estar atento para verificar se a maneira como está pensada a escala é uma boa
representação, se a dimensão está ajustada e se os dados se comportam de
maneira adequada, de acordo com os padrões definidos pelo modelo. Por
conta disso, deve-se refletir também sobre o ajuste do modelo aos dados, de
forma a corrigir distorções e refletir sobre o comportamento dos dados dentro
dos limites previstos desde o modelo.
Cabe ressaltar que os índices e escalas nem sempre são simples
em sua construção. Às vezes, queremos reunir informações diversificadas
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 24

sobre um mesmo tema, mas tais informações não estão tão claramente
organizadas e dispostas. Alguns exemplos são a saúde de uma pessoa, ou a
qualidade de vida de uma cidade. Para alguns, a resposta a esta pergunta é
muito simples: somente observar a renda. Quanto mais dinheiro, melhor a vida
das pessoas.
Há contudo outras formas de enxergar o mundo e isso nos levaria a
observar “as coisas de um outro jeito”. Um economista indiano, Amartya K.
Sen8 propôs ver as “coisas de um outro jeito”. Para ele, renda é um elemento
da qualidade de vida porque mostra o que as pessoas tem condições de
adquirir a partir de informações do mercado internacional, como câmbio.
Entretanto, a vida cotidiana é regulada por outras coisas, como se alimentar
bem, habitar em locais com boas condições de higiene, ter acesso a serviços
de saúde e educação e, portanto, ter mais chances de viver mais e melhor. Ele
definiu um conjunto de características ligadas à qualidade de vida, como
informações sobre mortalidade infantil, expectativa de vida, educação e outras,
e quis aglutiná-las em um único indicador, o que ele chamou do Índice de
Desenvolvimento Humano, o IDH, que passou a ser usado por muitos
organismos internacionais, como a ONU, por melhor representar o fenômeno e
isso lhe rendeu também o Prêmio Nobel.

8
SEN, A. K. On economic inequality. Clarendon Press. 1973.
ANAND, Sudhir; SEN, Amartya. Human Development Index: Methodology and Measurement.
1994.
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 25

3. Questionários ou instrumentos
A pesquisa parte de um exercício de representação da realidade.
Um de seus passos iniciais é a criação de instrumentos de pesquisa e de
mensuração. Por vezes, essa se torna a etapa mais decisiva e complexa de
uma pesquisa quantitativa, pois envolve múltiplos desafios. A observação (e
registro) dos dados deseja ser muito bem planejada, sintética, ajustada à
realidade, ampla e padronizada, para permitir posterior comparação e análises.
Para tanto tem que saber exatamente o que observar e como observar, para
depois traduzir tais observações em números e processar a análise. Se houver
falha no instrumento, todo o resto estará fatalmente comprometido. A
formulação do questionário ou instrumento de pesquisa é uma tarefa muito
importante. Nele, o modelo já aparece desenhado em linhas gerais, que depois
serão completadas pelo cruzamento de informações da organização e análise
dos dados (como a construção de escalas). O modelo é uma forma de
representar a realidade através de informações centrais, consideradas as mais
relevantes, e que devem ser obtidas através do instrumento de pesquisa. Logo,
uma regra básica é que toda informação relevante para o modelo deve
aparecer no questionário e, por questão de síntese e inteligência, só devem
aparecer no instrumento os itens dedicados a produzir informações
previamente definidas no modelo. Ainda que uma informação for curiosa ou
interessante ou até importante, mas não estiver prevista no modelo analítico,
não deve fazer parte do instrumento. Perceba que a análise já nasce junto do
instrumento, pois na verdade análise e instrumento são inerentes ao seu
modelo de representação da realidade.
Outro passo muito importante diz respeito à métrica das
informações. As observações podem ser mensuradas em nível nominal (sexo,
raça), ordinal (preferências, opiniões, rankings), intervalar (temperatura,
proficiência), ou de razão (idade, altura, saldo). Quanto mais precisa a medida,
mais detalhada e coerente com a realidade, melhor ela é. O mesmo vale para
seu nível: quanto mais alto, melhor. Todavia, NUNCA se deve forçar uma
expressão real de um fenômeno a assumir valores ou medidas que não são
“naturais” dele. Você não quer criar outro mundo, com medidas ideais, mas
apenas traduzir o mundo real em um modelo numérico de representação
coerente com a realidade.
Agora que já sabemos o quanto os instrumentos são importantes e
que temos noção sobre a relação entre modelo, métrica, instrumento e análise,
podemos partir para algumas orientações para elaboração de instrumentos de
pesquisa ou questionários. O instrumento está intimamente ligado ao modelo, e
não deve conter perguntas redundantes nem supérfluas. Todos os itens devem
ser ajustados ao fenômenos real e devem conter uma proposta de tradução do
fenômeno em uma métrica criada pelo pesquisador, como expresso no modelo,
ou seja, sua codificação adequada para inserção no modelo analítico.
As perguntas devem ser dirigidas somente a quem de fato conhece /
experimentou o fenômeno. Se o sujeito não viveu ou não conhece o conteúdo a
que está sendo questionado, sua eventual resposta não contribui para a
pesquisa – só introduz mais ruído e distorce os dados. Antes de formular os
CLACSO Seminário Virtual nº 2025 – Técnicas de Análisis Estadístico 26

itens, procure ler e aprender com outras pesquisas que investigaram o mesmo
tema. As formulações devem ser claras, diretas, evidenciando objetivamente o
que se deseja saber. De outro lado, evite termos tendenciosos ou dúbios, que
podem induzir o entrevistado a um tipo de resposta. Evite frases negativas,
como: “Qual alternativa NÃO descreve sua preferência”, ou “Todas as opções
são válidas, EXCETO”. Evite também assertivas com formulações absolutas,
como “sempre”, “nunca”, “jamais”.
Cada pergunta deve se dirigir a uma única informação. Não junte
perguntas nem reúna duas perguntas em uma. Pergunte uma questão de cada
vez, procurando ser conciso, claro e direto. Um fenômeno em geral apresenta
várias manifestações das dimensões latentes envolvidas. Identifique as
principais para cada dimensão, organize-as em conjunto e padronize sua
mensuração (codificação) de forma a viabilizar a construção de um indicador
sintético posteriormente, como uma escala, um índice ou uma tipologia.
Ao formular alternativas nos campos de respostas, lembre-se de ser
exaustivo, ou seja, todas as respostas possíveis devem encontrar alguma
alternativa que as contemple. Uma forma de se precaver é incluir ao final a
opção “nenhuma das alternativas acima” ou “outro(a)s”. Ao montar uma
sequência ordinal de opções, por exemplo sobre opinião (concorda
plenamente, concorda parcialmente, discorda parcialmente, discorda
totalmente), observe se você deseja ou não uma opção de centro (“nem
concorda nem discorda”. Essas opções podem atrair muitas respostas de
indivíduos com pressa ou que não querem dedicar muita atenção à entrevista
ou indecisos. No entanto, essa opção pouco te auxiliar a identificar o lado mais
propenso de a pessoa se identificar – que é exatamente o objetivo deste tipo
de bloco. Uma alternativa é a seguinte sequência: “concorda integralmente”,
“concorda mais que discorda”, “discorda mais que concorda”, “discorda
integralmente”.
Por fim, devem ser evitadas / excluídas as perguntas que porventura
possam causar constrangimento ou fira algum princípio ético. O mesmo vale
para a confidencialidade, o anonimato, o sigilo dos dados e seu uso
estritamente acadêmico dos dados. Submeta sua pesquisa ao Conselho de
Ética em Pesquisa de sua Instituição. Siga suas orientações. Deve tomar
cuidado ainda em não oferecer nenhum tipo de prêmio ou punição por qualquer
tipo de resposta, seja material ou simbólico. A resposta tem que ser livre e
espontânea. Muito sucesso no curso e nas suas pesquisas.

Você também pode gostar