Você está na página 1de 10

MODELOS DE RESPOSTA ALEATORIZADA PARA VARIVEIS

QUANTITATIVAS: MODELO DE GREENBERG

Olga Lidia Solano DVILA1


RESUMO: Neste trabalho estudamos alguns modelos de resposta aleatorizada (MRA),
comumente usados em pesquisas nas quais esto envolvidas perguntas delicadas. O Modelo de
Resposta Aleatorizada para variveis quantitativas Modelo de Greenberg foi aplicado em uma
pesquisa realizada na Faculdade de Cincias Matemticas da Universidade Nacional Maior de
So Marcos no Peru, para investigar o gasto mdio em bebidas alcolicas (pergunta delicada) e o
gasto mdio em materiais de estudo (pergunta no relacionada). A populao em estudo
compreende os alunos matriculados no semestre 96 II.
PALAVRAS CHAVES: Modelos de resposta aleatorizada, no-resposta, mecanismo aleatrio,
modelo de Greenberg, pergunta delicada.

1 Introduo
Em pesquisas realizadas no passado, nas quais esto envolvidas perguntas altamente
delicadas ou pessoais, detecta-se que muitas vezes as pessoas no esto inclinadas a
responder com honestidade ou simplesmente assinalam uma negativa por resposta. Isto ,
a no-resposta, respostas evasivas e respostas falsas so to comuns na prtica que
dificilmente podem ser medidas e controladas. Para solucionar esse problema possvel
utilizar procedimentos alternativos, se nossa inteno obter dados confiveis nessa
classe de investigao, em vez de realizar pesquisas pela modalidade de entrevista direta.
A primeira tcnica de Resposta Aleatorizada foi introduzida por Warner (1965), com
o objetivo de obter dados confiveis; para isto projetam-se habilmente as perguntas de tal
maneira que no se revela a identidade do entrevistado no decorrer da pesquisa. O
entrevistador deve utilizar um mecanismo aleatrio (urna com bolas, flecha giratria, uma
moeda etc.) para selecionar uma de duas perguntas (Perteno ao grupo A ou no perteno
ao grupo A), cada uma das quais requer uma resposta Sim ou No por parte do
entrevistado, sem revelar ao entrevistador sua posio pessoal com respeito pergunta.
O modelo estima a proporo de elementos da populao que pertence ao grupo A a
partir de uma amostra aleatria com reposio.
Greenberg et al. (1969) modificou o modelo original de Warner com a finalidade de
que o entrevistado tenha maior disposio a colaborar, substituindo o segundo enunciado
No Perteno ao grupo A por uma pergunta referente a uma caracterstica B, no
relacionada com A.
1

Departamento de Estadstica, Universidad Nacional Mayor de San Marcos, Av. Venezuela s/n, Lima, Per. Email: solano_olga@yahoo.com.br.

Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

47

O entrevistado deve selecionar por meio de um mecanismo aleatrio uma das


seguintes proposies a que se supe responde corretamente.
1. Perteno ao grupo A.
2. Perteno ao grupo B.
Os parmetros que se deseja estimar so:

A - proporo de elementos da populao que pertence a A .


B - proporo de elementos da populao que pertence a B .

Esses dois parmetros so estimados com base em duas amostras aleatrias


independentes de tamanho n 1 e n2 respectivamente.
Greenberg et al. (1971) sugerem uma extenso do modelo da pergunta no
relacionada para caractersticas quantitativas.
Nesse modelo utilizam-se duas variveis quantitativas; a primeira varivel X, cujo
valor resulta comprometedor ao entrevistado (gasto em bebidas alcolicas, nmero de
abortos, salrios-familia etc.); a segunda varivel Y no relacionada a X; g(.) funo
de densidade de X e h(.) funo de densidade de Y.
O entrevistado utiliza um mecanismo aleatrio para selecionar a pergunta delicada
com probabilidade P e a pergunta no relacionada com probabilidade (1-P).
Os parmetros que se deseja estimar so:
X - mdia populacional da varivel X, associada pergunta delicada.

Y - mdia populacional da varivel Y, associada pergunta no relacionada.


Esses dois parmetros so estimados com base em duas amostras aleatrias
independentes de tamanho n 1 e n2 , e o estimador est relacionado varivel aleatria
associada resposta, chamada Z, que a mistura de X e Y segundo P e (1-P).
O Modelo de Resposta Aleatorizada para variveis quantitativas Modelo de
Greenberg foi aplicado em uma pesquisa realizada na Faculdade de Cincias
Matemticas da Universidade Nacional Maior de So Marcos no Peru, para investigar o
gasto mdio em bebidas alcolicas (pergunta delicada) e o gasto mdio em materiais de
estudo (pergunta no relacionada). A populao em estudo compreende os alunos
matriculados no semestre 96 II.

Modelo de resposta aleatorizada para variveis quantitativas


Greenberg et al. (1971) sugere uma extenso do modelo da pergunta no
relacionada para caractersticas quantitativas.
Seja X a varivel quantitativa cujo valor resulta comprometedor ao entrevistado
(gasto em bebidas alcolicas, nmero de abortos, salrios familiares, etc.), e g (.) funo
de densidade de X.
Seja Y a varivel quantitativa no relacionada a X; e h(.) a funo de densidade
de Y.
O entrevistado utiliza um mecanismo aleatrio para selecionar a pergunta delicada
com probabilidade P e a pergunta no relacionada com probabilidade (1-P).

48

Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

Estimao da mdia populacional X , com Y conhecida


Suponhamos que selecionamos uma amostra simples com reposio, de tamanho n.
As probabilidades de selecionar a pergunta aleatorizada na amostra so:
P: Probabilidade de que a pergunta delicada associada a X seja selecionada pelo
entrevistado.
Q =1- P: Probabilidade de que a pergunta no relacionada associada a Y seja
selecionada pelo entrevistado.
Ento a resposta aleatorizada Z, tem funo de densidade:
f (z ) = Pg (z ) + Qh(z )

(2.1)

Por ser g(.) funo de densidade de X, utilizando a definio de esperana


matemtica e varincia, obtemos:

Z = PX + QY

(2.2)

Z2 = P X2 + Q Y2 + PQ( X Y )

(2.3)

A mdia e varincia amostral so:


n

Z =

i =1

Zi

Estimador no-viciado de X

X =

S2 =

i =1

(Z i Z )
n 1

(Z QY )
P

(2.4)

Estimador no-viciado da varincia de X


Var ( X ) =

S2
nP 2

(2.5)

Estimao da mdia populacional X , com Y desconhecida


Suponhamos que sejam selecionadas duas amostras independentes simples com
reposio de tamanhos n1 e n2. As probabilidades de selecionar a pergunta aleatorizada em
cada amostra so:
P1: Probabilidade de que a pergunta delicada associada a X seja selecionada pelo
entrevistado na amostra 1.
P2: Probabilidade de que a pergunta delicada associada a X seja selecionada pelo
entrevistado na amostra 2.
Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

49

Q1: Probabilidade de que a pergunta no relacionada associada a Y seja


selecionada pelo entrevistado na amostra 1.
Q2: Probabilidade de que a pergunta no relacionada associada a Y seja
selecionada pelo entrevistado na amostra 2.

E as Respostas Aleatorizadas Z1 e Z2 na amostra 1 e 2, respectivamente, tm funo


de densidade:
f1 (z1 ) = P1g (z1 ) + Q1h(z1 ) e

f2 ( z2 ) = P2 g(z2 ) + Q2h(z2 )

(2.6)

Por ser g(.) funo de densidade de X, utilizando a definio de esperana


matemtica e varincia, obtemos:

Z = P1 X + Q1 Y
1

, Z

= P2 X + Q2 Y

V (z1 ) = P1 X2 + Q1 Y2 + P1Q1 ( X Y )

(2.7)

V (z2 ) = P2 X2+Q2Y2 + P2Q2 (X Y )

As mdias e varincias amostrais so:


n1

Z1 =

i =1

Zi

n1

n2

Z2 =

i =1

Zi

n1

S =
2
1

n2

i =1

n2

(Z i Z 1 )

, S 2=
2

n1 1

i =1

(Z

Z2)

n2 1

(2.8)

onde
Z 1 : mdia amostral de Z1 na amostra 1,
Z 2 : mdia amostral de Z2 na amostra 2,
S 12 : Varincia amostral de Z1 na amostra 1 e
S 22 : Varincia amostral de Z2 na amostra 2.

Estimador no-viciado de X e Y
X =

[(1 P )Z (1 P )Z ] e = [P Z
2

P1 P2

1 P1 Z 2
, sempre que P1 P2
P2 P1

(2.9)

Estimador no viciado da varincia de X e Y

(1 P2 )2 S12 (1 P1 )2 S 22
Var ( X ) =

n1

(P1 P2 )

n2
2

e V a r ( ) =
Y

P22 S 12 P12 S 22
+
n1
n2

(P2

P1 )

, sempre

(2.10)

que P1 P 2
50

Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

Escolha de P1 , P1, n1 e n2
No trabalho de Greenberg et al. (1971) so apresentadas as seguintes consideraes:
1. Na escolha de P1 e P2 deve-se levar em considerao a diminuio da varincia e
tambm a disposio da colaborao por parte do entrevistado. Para isso, propem
P1+P2=1 e elege-se P1 to longe de 0,5 quanto seja factvel. Em experincias
anteriores obtiveram-se resultados satisfatrios com P1 entre 0,70 e 0,80 ou o seu
complemento.
2. Escolha da pergunta no relacionada associada a Y. Uma regra fundamental que a
pergunta no relacionada deve estar na mesma unidade de medida que a pergunta
delicada, por exemplo, reais, cm, ou nmero de vezes da ocorrncia de um evento.
Em geral recomenda-se que:
Y2 to perto quanto possvel de X2

Y perto de X
Y2 to pequeno quanto possvel.

3. Determinao tima de n1 e n 2 , a fim de minimizar V a r ( X

) , sujeita condio

n1 + n2 = n . Essa determinao tima dada por:


n1
Q
= 2 1,
n 2 Q1 2

onde 12 : varincia de Z na amostra 1

(2.11)

22 : varincia de Z na amostra 2.

Tamanho da amostra n
Para achar o tamanho da amostra e determinao tima da mesma, usaremos a
condio n1 + n2 = n , e a determinao tima mencionada anteriormente, Var ( X ) , a
normalidade assinttica de x , e, aps manipulaes algbricas temos o tamanho da
amostra calculada por:
n=

Z
E

[ 2 + P1 ( 1 2 )]2 ,
(2 P1 1)2

(2.12)

para um erro mximo de estimao prefixado E e um nvel de confiabilidade (1- ).

Aplicao do Modelo de Greenberg


Pesquisa de estudantes sobre o gasto mdio em bebidas alcolicas
O modelo de Resposta Aleatorizada de Greenberg, da pergunta no relacionada para
variveis quantitativas, foi utilizado em uma pesquisa sobre o gasto em bebidas
alcolicas. Sua aplicao foi feita na Faculdade de Cincias Matemticas da Universidade
Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

51

Nacional Maior de So Marcos (UNMSM), considerando duas amostras aleatrias


independentes selecionadas da listagem de alunos matriculados no semestre 96-II.
O propsito desta investigao foi mostrar a utilidade da tcnica de Resposta
Aleatorizada para obter uma estimativa do gasto por bebidas alcolicas, reduzindo
principalmente o vcio de resposta (por respostas deliberadamente falsas) e obter taxas de
resposta maiores.

Escolha das variveis


As variveis escolhidas para este estudo foram as seguintes:
1. Gasto em bebidas alcolicas (varivel associada pergunta delicada)
2. Gasto em materiais de estudo (varivel associada pergunta no relacionada)

Escolha do mecanismo aleatrio e da probabilidade de seleo das perguntas


O mecanismo aleatrio que serviu para selecionar um de dois enunciados, cada um
dos quais requer uma resposta expressa em moeda nacional (novos soles), por parte do
entrevistado, sem revelar ao entrevistador sua posio pessoal com respeito pergunta, foi
uma caixa de plstico transparente e selada, de aproximadamente 38 cm de comprimento,
25,5 cm de largura e 10,5 cm de altura, que continha bolas vermelhas e brancas.

Escolas de Computao e Operativa


1.Quanto gastou em bebidas alcolicas no
ms passado? (cerveja, vinho etc.)
2.Quanto gastou em materiais que utiliza
para estudar, no ms passado?
(livros cadernos, xerox, disquete, etc.)

Escolas de Estatstica e Matemtica


1.Quanto gastou em bebidas alcolicas no
ms passado? (cerveja, vinho etc.)
2.Quanto gastou em materiais que utiliza
para estudar, no ms passado?
(livros cadernos, xerox, disquete, etc.)
FIGURA 1 Mecanismo aleatrio usado na pesquisa.
52

Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

A caixa continha dois enunciados localizados na tampa e identificados com uma cor
de bola cada um (ver Figura 1).
Os enunciados foram:
1. Quanto gastou em bebidas alcolicas no ms passado? (cerveja, vinho, rum, etc.)
2. Quanto gastou em materiais que utiliza para estudar no ms passado? (livros,
cadernos, xerox, disquete, impresses etc.).
A primeira pergunta estava identificada com uma bola vermelha. Na parte esquerda
desta estava desenhado um crculo de cor vermelha.
A segunda pergunta estava identificada com uma bola branca. Na parte esquerda
desta estava desenhado um crculo de cor branca.
Ao entrevistado foi solicitado que remexesse a caixa e removesse as bolas com o
propsito de que uma das bolas ficasse na janela da caixa, que era visvel ao entrevistado.
A cor da bola que aparecia na janela determinava qual das duas perguntas teria de
responder.
Se uma bola vermelha ficasse na janela, o entrevistado respondia primeira pergunta
(gasto em bebidas alcolicas); se uma bola branca ficasse na janela, respondia segunda
pergunta (gasto em materiais de estudo).
O entrevistador encontrava-se de costas para o entrevistado, de tal maneira que no
se informava que pergunta havia sido selecionada pelo entrevistado. Para evitar o
conhecimento de qual pergunta havia respondido o entrevistado, a caixa era removida
novamente de tal maneira que nenhuma bola ficasse perto da janela da caixa.
O total de bolas e a probabilidade de seleo por tipo de varivel a ser pesquisada
mostrado a seguir:
Para realizar a entrevista utilizaram-se duas caixas.
A caixa utilizada para a amostra 1 (Escola de Computao e Operativa) continha 51
bolas vermelhas e 9 bolas brancas. Logo, a probabilidade (P1) de selecionar a pergunta 1
de 0,85 e a probabilidade (1- P1) de selecionar a pergunta 2 de 0,15.
A caixa utilizada para a amostra 2 (Escola de Estatstica e Matemtica) continha 34
bolas brancas e 6 bolas vermelhas. Logo, a probabilidade (P2 ) de selecionar a pergunta 1
de 0,15 e a probabilidade (1-P2) de selecionar a pergunta 2 de 0,85.

Tamanho da amostra
O tamanho da amostra foi calculado com base em uma amostra piloto de tamanho
30, para o qual se formaram dois estratos. No primeiro estrato estava a Escola de
Computao e Operativa e no segundo, a Escola de Matemtica e Estatstica. Da amostra
piloto obtiveram-se os seguintes resultados:
1 = 39,77 , 2 = 43,47, = 37,45,
onde : Gasto mdio em bebidas alcolicas de um aluno na Faculdade de Cincias
Matemticas.
Calcularam-se vrios tamanhos de amostra para diferentes erros de estimao (E) e
para diferentes valores de P1.
Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

53

Exemplo:
E = 15 % ,

Z 5% = 1,96,

z 5%
E

E = 15 % 37 ,45 = 5,6175 ,

1,96
=
5,6715

= 0,12 .

Substituindo em 2.12, obtemos n = 404 .


Tabela 1 - Tamanho de amostra

Probabilidade de selecionar a
pergunta 1 ( P1 )

Erro de estimao E

0,70

0,75

0,80

Tamanho de amostra no
mtodo convencional

0,85

0,90

10%

2.861 1.814 1.248 909

690

479

15%

1.272

806

555 404

306

213

20%

715

454

312 227

172

120

Para a aplicao do trabalho utilizou-se uma amostra de tamanho 227, com um erro
de estimao de 20% e 95% de confiabilidade.

Tamanho da amostra para cada estrato


Usando a equao (2.11) e substituindo os resultados obtidos no teste piloto,
n1 Q21
=
,
n2 Q12

n1 0,85 39,77
=

= 5,18 n1 = 5,18 n2.


n2 0,15 43,47

n1 + n2 = n = 227

Alm disso, sabe-se que:


Utilizando os resultados obtidos anteriormente obtemos que:
n1 = 190

n2 = 37.

Ento, selecionamos um tamanho de amostra de 190 nas Escolas de Computao e


Operativa (estrato 1) e 37 nas Escolas de Estatstica e Matemtica (estrato 2).

Aplicao do Mtodo convencional


De um total de 1.667 alunos matriculados no semestre 96-II, com idades entre 16 e
57 anos, selecionamos uma amostra aleatoria sim reposio de 227 alunos. A entrevista
realizou-se de 27 a 30 de novembro do ano 1996. Os resultados esto na Tabela 2.

54

Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

Tabela 2 - Resultados da pesquisa segundo o mtodo

Mtodo

No-Resposta

Taxa de
Resposta

Freq.

Taxa

MRA
Greenberg

0,00%

n = 227
100,00%

Entrevista
Direta

13

5,73%

n = 227
94,27%

Gasto mdio
em bebidas
alcolicas
20,50

17,81

Error de
Estimao E
6,12

4,98

Observa-se que a taxa de resposta no modelo de resposta aleatorizada foi de 100%,


enquanto o mtodo de entrevista direta implicou uma taxa de resposta de 94,27% e uma
taxa de no resposta de 5,73%.
O gasto mdio em bebidas alcolicas de um aluno da Faculdade de Cincias
Matemticas foi de 20,50 novos soles, enquanto no mtodo de entrevista direta foi de
17,81 novos soles, no ms de outubro de 1996, o que implica uma provvel reduo do
vcio de resposta ao aplicar o modelo de Greenberg.
Intervalos de confiana de 95%, para X e Y

X < 14,39; 26,61 >

Y < 12,71; 36,27 >

Concluses
A aplicao do MRA Modelo de Greenberg permitiu pr em prtica uma tcnica
de amostragem que eficiente em pesquisas com perguntas delicadas.
O MRA mais eficiente quando utilizado em pesquisas nas quais o problema
muito delicado, para o qual se requer um tamanho de amostra maior que o convencional.
A desvantagem da tcnica que o gasto na capacitao dos entrevistadores (o
treinamento da tcnica) e o tempo gasto na entrevista para explicar a tcnica ao
entrevistado maior que o mtodo tradicional.
A tcnica de resposta aleatorizada mais eficiente quando utilizada em pesquisas em
que o problema altamente sensvel e para o qual se requer um tamanho de amostra maior
que o mtodo tradicional (ver Tabela 1).
DVILA, O. L. Randomized response models for quantitative characters: Greenberg
model. Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004.
ABSTRACT: In this study we described some randomized response models (RRM) for
quantitative characters. RRM for quantitative characters Greenberg Model were applied in a
survey conducted at the Faculty of Mathematical Science of Universidad Nacional Mayor de San
Marcos in Peru in order to estimate the average monthly expenditure on alcoholic drinks
(sensitive question) and the average monthly expenditure on textbooks (unrelated question). The
population under study consisted of students registered in the 96-II school term.
Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

55

KEYWORDS: Randomized response models; no response; randomization device; Greenberg


model; sensitive question.

Referncias
CHAUDHRI, A.; MUKERJEE, R. Randomized response: theory and techniques. New
York: Marcel Dekker, 1983. 161p.
COCHRAN, G. W. Tcnicas de muestreo. Mxico: Continental, 1977. 513p.
DES, R. Teora del muestreo. Mxico: Fondo de Cultura Econmica, 1980. 305p.
GREENBERG, B. G. et al. The unrelated question randomized response model:
theoretical frame work. J. Am. Stat. Assoc., Alexandria, v.64, p.520-539, 1969.
GREENBERG, B. G. et al. Aplication of the randomized response technique in obtaining
quantitative data, J. Am. Stat. Assoc., Alexandria, v.66, n.334, p.243-250, 1971.
LANKE, S. On the choice of the unrelated question in Simmons version of randomized
response model. J. Stat. Assoc., New York, v.70, p.80-83, 1975.
LIU, P. T.; CHOW, L. P. A new discrete quantitative randomized response model. J. Am.
Stat. Assoc., Alexandria, v.71, n.353, p.72-73, 1976.
MAHMOOD, M.; SINGH, S.; HORN, S. On the confidentiality guaranteed under
randomized response sampling: A comparison with several new techniques. Biom. J.,
Berlin, v.40, n.2, p.237-242, 1998.
MOORS, J. J. A Optimization of the unrelated question randomized response model. J.
Stat. Assoc., New York, v.66, n.361, p.627-629, 1971.
SHIMIZU, I. M.; BONHAM, G. S.Randomized response technique in a national survey.
J. Am. Stat. Assoc., Alexandria, v.73, n.361, p.35-39, 1978.
SOLANO, O. L. Modelos de respuesta aleatorizada para variables cuantitativas. 1997.
98f. Tese (Licenciada en Estadstica) Facultad de Ciencias Matemticas, Universidad
Nacional Mayor de San Marcos, Lima, 1981.
WARNER, S. L. Randomized response: A survey technique for elimination evasive
answer bias. J. Stat. Assoc., New York, v.60, p.63-69, 1965.
Recebido em 09.02.2004.
Aprovado aps reviso em 22.12.2004.

56

Rev. Mat. Estat., So Paulo, v.22, n.3, p.47-56, 2004

Você também pode gostar