Você está na página 1de 15

Universidade de So Paulo

Biblioteca Digital da Produo Intelectual - BDPI


Departamento de Matemtica Aplicada e Estatstica - ICMC/SME

Artigos e Materiais de Revistas Cientficas - ICMC/SME

2015-01

Funcionamento diferencial do item no


Inventrio de Depresso Beck
Revista Brasileira de Epidemiologia,So Paulo : Associao Brasileira de Ps-Graduao em Sade
Coletiva - ABRASCO,v. 18, n. 1, p. 54-67, jan/mar 2015
http://www.producao.usp.br/handle/BDPI/50036
Downloaded from: Biblioteca Digital da Produo Intelectual - BDPI, Universidade de So Paulo

DOI: 10.1590/1980-5497201500010005

ARTIGO ORIGINAL / ORIGINAL ARTICLE

Funcionamento Diferencial do Item no


Inventrio de Depresso Beck
Differential Item Functioning in the Beck Depression Inventory
Stela Maris de Jezus CastroI, Mariana CriII, Vanessa Bielefeldt Leotti TormanI, Joo RiboldiI

RESUMO: Introduo: Diversos estudos mostram o Funcionamento Diferencial do Item (DIF) em itens do
Inventrio de Depresso Beck (BDI), ao compararem homens e mulheres. A presena de um grande nmero
de itens com DIF no BDI uma severa ameaa validade da medida da intensidade de sintomas depressivos
obtida pela Teoria da Resposta ao Item (TRI) e s concluses baseadas nos escores derivados dos itens com e
sem DIF. Objetivo: Os objetivos deste estudo foram identificar esses itens do BDI, ajustar o modelo de TRI para
itens constrangedores (modelo 2), o qual acomoda itens com a presena de DIF, e comparar esses resultados
com os do ajuste do modelo logstico de dois parmetros tradicional da TRI (modelo 1). Mtodos: Os resultados
obtidos com ambos os modelos foram comparados. Resultados: Os itens que apresentaram DIF foram: tristeza,
sentimento de fracasso, insatisfaes, culpa, punio, choro, fatigabilidade e perda da libido. Os resultados
do ajuste dos dois modelos so similares quanto discriminao, gravidade ( exceo dos itens com DIF)
e no clculo de escores para os indivduos. Apesar disso, o modelo 2 vantajoso, pois mostra as diferenas
em gravidade do sintoma depressivo para os grupos avaliados, trazendo, dessa forma, mais informao ao
pesquisador sobre a populao estudada. Concluso: Esse modelo, que tem um alcancemaisamplo em termos
de populao-alvo, pode ser uma tima alternativa na identificao e acompanhamento de indivduos com
potencial depressivo.
Palavras-chave: Teoria da Resposta ao Item. Funcionamento Diferencial do Item. Intensidade de Sintomas
Depressivos. Inventrio de Depresso Beck. Trao latente. Modelo TRI para itens constrangedores.

Universidade Federal do Rio Grande do Sul Porto Alegre (RS), Brasil.


Universidade de So Paulo So Carlos (SP), Brasil.
Autor correspondente: Stela Maris de Jezus Castro. Rua Joo Mendes Ouriques, 650, Ipanema, CEP: 91760-450, Porto Alegre,
RS, Brasil. E-mail: stela.castro@ufrgs.br
Conflito de interesses:nada a declarar Fonte de financiamento: nenhuma.
I

II

54
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

FUNCIONAMENTO DIFERENCIAL DO ITEM NO INVENTRIO DE DEPRESSO BECK

ABSTRACT: Introduction: There are several studies showing the presence of Differential Item Functioning (DIF)
in some items of the Beck Depression Inventory (BDI), when comparing men and women. The presence of a large
number of items with DIF in BDI is a severe threat to the validity of measurement of the intensity of depressive
symptoms obtained by Item Response Theory (IRT) and to the conclusions based on the scores derived from
the items with or without DIF. Objective: The objectives of this study were to identify these items from the BDI,
adjust the IRT model for embarrassing items (model 2), which accommodates items with the presence of DIF, and
compare these results with the fit of the traditional two-parameter logistic IRT model (model 1). Methods: The
results obtained with the both models were compared. Results: Items with DIF were: sadness, feeling of failure,
dissatisfaction, guilty, punishment, crying, fatigability and loss of libido. The results of the adjustment of the
two models are similar in discrimination, gravity (except for items with DIF), and in the calculation of scores for
individuals. Nevertheless, model 2 is beneficial because it shows the differences in gravity of depressive symptoms
for groups evaluated, thus providing more information to the researcher on the study population. Conclusion: This
model, which has a broader scope in terms of target population, may be a good alternative to the identification
and follow-up of individuals with potential depression.
Keywords: Item Response Theory. Differential Item Functioning. Intensity of Depressive Symptoms. Beck Depression
Inventory. Latent trait. IRT Model for embarrassing items.

INTRODUO
Um trao latente uma varivel que no pode ser observada diretamente. Na tentativa
de medi-lo, faz-se necessria a utilizao de um instrumento composto por itens que
presumivelmente o refletem. Estabelecer equivalncia de medidas entre grupos que diferem
em caractersticas como educao, gnero e raa, por exemplo, importante em avaliao
de sade mental, para que esses grupos possam ser comparados em termos de suas medidas
dos traos de interesse, tais como intensidade de sintomas depressivos, funcionamento
fsico ou satisfao com cuidado, por exemplo1. Sendo assim, antes de comparar grupos
de respondentes (em relao a idade ou gnero, por exemplo) em termos do trao latente
a ser medido, deve-se estar confiante de que os itens que compreendem a medida operam
equivalentemente entre os diferentes grupos1. Em outras palavras, existe a possibilidade de
que itens, em especial em medidas psicolgicas e/ou psiquitricas, funcionem diferentemente
ou de forma enviesada para diferentes grupos de respondentes2. Se um item tem uma funo
de resposta diferente para dois grupos, esse item dito viesado3.
Na literatura sobre Teoria da Resposta ao Item (TRI), o termo vis do item tem sido
essencialmente substitudo pela expresso Funcionamento Diferencial do Item (DIF, do
ingls Differencial Item Functioning). O DIF ocorre quando a probabilidade de determinada
resposta a um item do instrumento no tem a mesma relao com o trao latente em dois
55
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

CASTRO, S.M.J. ET AL.

ou mais grupos de respondentes, ou seja, quando a probabilidade de se escolher como


resposta uma categoria de um item no depende apenas do trao latente do indivduo, mas
tambm do fato de ele pertencer a um determinado grupo (por exemplo, a probabilidade
de escolher uma categoria de resposta diferente entre homens e mulheres com o mesmo
nvel do trao latente). Mais concretamente, o DIF ocorre quando um item apresenta uma
Curva Caracterstica do Item (CCI) diferente para cada grupo ou, equivalentemente, quando
qualquer parmetro do item difere entre os grupos. Se um item est livre desse vis, as
respostas para esse item sero relacionadas somente com o nvel do trao latente que o item
est procurando medir. Se o item apresenta vis, as respostas ao mesmo sero relacionadas
a algum outro fator alm do nvel do trao latente.
Muitos instrumentos de medida, em especial na rea da psiquiatria, apresentam itens
que podem funcionar de maneira diferente nos diversos grupos. Entre eles, pode-se citar
o Inventrio de Depresso Beck (BDI, do ingls Beck Depression Inventory), um instrumento
que estima o trao latente Intensidade de Sintomas Depressivos. Alguns estudos relatam a
presena de itens com DIF no BDI em relao ao gnero4-6. A diferena entre as distribuies
das respostas de homens e mulheres se deram em itens referentes a choro, sentimento de
fracasso, punio, perda da libido, insatisfao, culpa e fatigabilidade.
A presena de um grande nmero de itens com DIF no BDI uma severa ameaa
validade da medida da intensidade de sintomas depressivos obtida pela TRI e s concluses
baseadas nos escores derivados dos itens com e sem DIF. Uma possvel soluo para esse
problema poderia ser a eliminao dos mesmos do instrumento de medida. No entanto,
isso poderia comprometer a medida do trao latente, pois os itens provavelmente contm
informao relevante medida do mesmo, j que o BDI foi construdo para abranger todos
os sintomas depressivos observveis7. O uso de um modelo que permita a manuteno de
todos os itens no instrumento e, ao mesmo tempo, contemple as diferenas entre os grupos
trabalhados vem a ser uma tima alternativa para a anlise de dados oriundos do BDI.
O Modelo TRI para itens constrangedores, proposto por Cri etal.8, insere-se dentro
dessa perspectiva, pois preserva tais caractersticas. Sendo assim, este estudo teve por
objetivos identificar itens do BDI que apresentem DIF para gnero, isto , que apresentem
vis comparando-se homens e mulheres, por meio da anlise diferencial do item, ajustar o
modelo para itens constrangedores para a amostra de sujeitos considerada e comparar esses
resultados com os do ajuste do modelo logstico de dois parmetros tradicional da TRI.

MTODOS
AMOSTRA
Os indivduos so provenientes de um estudo transversal conduzido para realizar a
adaptao, a normatizao e a validao para o portugus das Escalas Beck, em um estudo
conduzido pela Dra. Jurema Alcides Cunha e publicado em 20019.
56
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

FUNCIONAMENTO DIFERENCIAL DO ITEM NO INVENTRIO DE DEPRESSO BECK

A escala do BDI, originalmente com 4 pontos, para os objetivos do presente trabalho, foi
dicotomizada de modo que a resposta assume o valor 1 (Xij = 1) quando o indivduo j relata
apresentar o sintoma descrito no item i (isto , escolhe uma das categorias com escores 1,
2 ou 3 do determinado item) e 0 (Xij = 0) caso no apresente aquele sintoma.

MODELOS CONSIDERADOS
Foram adotados dois modelos de TRI para variveis dicotmicas (aqui sendo do tipo
ausncia ou presena de sintoma depressivo).

Modelo logstico unidimensional de 2 parmetros (Modelo 1)


Este um modelo de TRI para resposta dicotmica, apropriado para medidas nas quais
os itens no discriminam igualmente os nveis do trao latente2,10. O modelo de 2 parmetros
prediz a probabilidade de o indivduo j apresentar o sintoma medido no item i, condicionado
1
a sua intensidade de sintomas depressivos, isto , P(Xij = 1 | j, j)=
, como-asegue:
1+e i(j, j)
P(Xij = 1 | j, j)=

1
1+e-ai(j, j) (1)

onde: i = 1, ..., 21 itens, j = 1, ..., n indivduos, j=(ai, bi)t, j a intensidade de sintomas


depressivos (trao latente) do indivduo j (parmetro de indivduo); bi o parmetro de
gravidade (posio) do item i e representa a gravidade do sintoma depressivo descrito pelo
item i (quando j = bi , a probabilidade de presena do sintoma i 0,5); ai o parmetro de
discriminao (ou inclinao) do item i.

Modelo TRI para itens constrangedores (Modelo 2)


Este modelo para itens dicotmicos, proposto por Cri etal.8, possibilita diferenciar
a gravidade da presena do sintoma depressivo entre indivduos constrangidos e no
constrangidos por um determinado item de forma a apresentarem comportamentos
diferenciados frente respectiva CCI. A probabilidade de o indivduo j apresentar ou no o
sintoma medido no item i (Xij = 1 ou 0, respectivamente) e constranger-se ou no pelo item
i (Cij = 1 ou 0, respectivamente) :
P(Xij = xij, Cij = cij | j, i)= P(Xij = xij | Cij = cij, j, i) P(Cij = cij | j, i)
=[(P*ij)xij (1-P*ij)(1-xij)i]cij [Pijxij (1-Pij)(1-xij)(1-i)](1-cij)
57
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

(2)

1
+e-ai(j, b1i)

CASTRO, S.M.J. ET AL.

onde:
i
1
= P(Xij = 1 | Cij = 1, j, j) ; Pij=
i=(aij,b1j,b2j,i,i)t ; P*ij=
= P(Xij = 1 | Cij = 0, j, j)
1+e-ai(j, b2i)
1+e-ai(j, b1i)
= P(Xij = 1 | Cij = 0, j, j); j =
abintensidade
de sintomas depressivos (trao latente) do indivduo j (parmetro
i
de indivduo); b1i o parmetro de gravidade do item i para indivduos no constrangidos,
denominados a partir de agora como grupo com comportamento padro (mulheres); b2i
o parmetro de gravidade do item i para indivduos constrangidos, denominados a partir
de agora como grupo com comportamento diferenciado (homens); ai o parmetro de
discriminao (ou inclinao) do item i; i a probabilidade de o indivduo do grupo com
comportamento diferenciado afirmar que tem o sintoma depressivo, isto , probabilidade de o
indivduo constrangido dizer que tem o sintoma dado que realmente o apresenta (repare que,
no grupo no constrangido, assume-se que essa probabilidade 1); i a probabilidade de um
indivduo apresentar comportamento diferenciado com relao ao sintoma i. Neste estudo,
se assumir que a classificao dos indivduos como constrangidos ou no constrangidos
ser dada pelo sexo, ou seja, Cij = 1, se homem, ou 0, se mulher.
Esse modelo, alm do parmetro de discriminao do item, comum aos demais modelos
de TRI, estima outros parmetros que contemplam o funcionamento diferencial daqueles
itens que apresentam DIF. Para esses itens, os grupos so comparveis entre si, mas no se
pode fazer isso olhando para os parmetros de gravidade. Os parmetros b1i e b2i expressam
probabilidades diferentes de o indivduo apresentar o sintoma. A comparao correta entre
gravidades deve ser feita entre b1i e j*0,5=. bi
Repare que b1i, como no modelo logstico de 2 parmetros, pode ser interpretado como a
intensidade dos sintomas depressivos de um indivduo com comportamento padro, tal que
a probabilidade de presena do sintoma i igual a 0,5 (quando j ==bbi i, Pij = 0,5). Por outro
lado, para indivduos com comportamento diferenciado, quando j ==bbi 2i, Pij* = i/2. Por
essa razo, no faz sentido comparar b1i e b2i. Neste trabalho, a interpretao da gravidade
do sintoma avaliado por um item com DIF ser feita pela comparao das intensidades de
sintomas depressivos de indivduos de cada um dos 2 grupos para os quais a probabilidade
de presena do sintoma igual a 0,5. No grupo com comportamento padro, equivale a
=b
) ln[(i - 0,5) / 0,5] + b2i
j =
bi i e, no grupo com comportamento diferenciado, j ==b-(1/a
i
i
(cuja estimativa denotada por j*0,5=).bi

ESTRATGIA DE ANLISE
A anlise de funcionamento diferencial do item foi realizada por meio da tcnica
conhecida como Razo de Verossimilhanas em Teoria da Resposta ao Item11 (IRTLR, do
ingls Item Response Theory Log-Likehood Ratio, verso 2.0b), utilizando o software IRTLRDIF,
desenvolvido por Dave Thissen e disponibilizado em sua homepage12. Esse procedimento
parte da definio de Frederic Lord sobre DIF (ento chamado de vis do item) e usa o teste
da razo de verossimilhana como um teste de significncia para a hiptese de nulidade de
que os parmetros de uma funo de resposta de um item no diferem entre grupos um
58
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

FUNCIONAMENTO DIFERENCIAL DO ITEM NO INVENTRIO DE DEPRESSO BECK

resultado significativo aponta a deteco de DIF. Como, para modelos de TRI paramtricos,
o grupo de parmetros do item isomorfo (tem a mesma forma) com a funo de resposta
do item, o exame das diferenas entre os parmetros do item equivalente ao exame da
diferena nas funes de resposta do item. O software IRTLRDIF tem implementado dois
dos modelos de TRI mais comumente usados: o modelo logstico de 3 parmetros e o
modelo politmico de resposta gradual de Samejima13. O modelo logstico de 2 parmetros
(utilizado para a identificao de itens com DIF) um caso especial de ambos os modelos
anteriores e, nesse software, est implementado como um modelo de resposta gradual com
duas categorias de resposta. Em funo do tamanho da amostra, o nvel de significncia
adotado para a identificao dos itens com DIF foi de 1%.
O ajuste dos modelos de TRI logstico de 2 parmetros (modelo 1) e para itens constrangedores
(modelo 2) foi realizado por meio de rotinas elaboradas no WinBUGS, verso 1.4.314. As rotinas
referentes a ambos os modelos utilizam um mtodo bayesiano de estimao de parmetros
por meio de simulao de Monte Carlo via Cadeia de Markov (MCMC).
Este estudo foi submetido e aprovado pelo Comit de tica em Pesquisa da Universidade
Federal do Rio Grande do Sul (UFRGS), na reunio n 37, ata n 117, de 30 de outubro de 2008.

RESULTADOS
As caractersticas demogrficas da amostra podem ser encontradas no artigo Teoria da
resposta ao item aplicada ao Inventrio de Depresso Beck15, onde o modelo de Resposta
Gradual de Samejima foi ajustado a esses dados. importante ressaltar que os indivduos
da amostra esto divididos quase que igualmente entre homens e mulheres, com pequena
vantagem para as ltimas.
Os itens que apresentaram DIF, de acordo com a tcnica da Razo de Verossimilhana,
foram: tristeza, sentimento de fracasso, insatisfaes, culpa, punio, choro, fatigabilidade e
perda da libido. Os resultados do ajuste do modelo 1 encontram-se na Tabela 1 e os resultados
do ajuste do modelo 2, considerando-se os 8 itens que apresentaram DIF e o grupo masculino
como o grupo com os indivduos constrangidos pelos mesmos, na Tabela 2.
As estimativas dos parmetros de discriminao nos modelos 1 e 2 (Tabelas 1 e 2,
respectivamente) indicam que praticamente todos os itens podem ser considerados apropriados
quanto a essa caracterstica (ai > 18,10), exceo de perda de peso e autoacusaes. Os itens
com maior poder de discriminao so os relacionados a sintomas de sentimento de fracasso
e insatisfaes.
A partir das estimativas de gravidade (bi) dos sintomas depressivos (Tabela 1), observa-se
que os sintomas autoacusaes e irritabilidade so os menos graves e os sintomas perda de
peso e ideias suicidas, os mais graves. interessante ressaltar que perda de peso o sintoma
depressivo mais grave e, ao mesmo tempo, o que menos discrimina a populao (19=0,93).
^ =1,20) e discrimina bem a
No entanto, o sintoma ideias suicidas o segundo mais grave (b
9
populao quanto ao nvel de intensidade de sintomas depressivos (9=1,71).
59
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

CASTRO, S.M.J. ET AL.

Tabela 1. Mdia e desvio padro da distribuio a posteriori dos parmetros do modelo logstico
de 2 parmetros (modelo 1).
ai (DP)

bi (DP)

1 Tristeza

2,38 (0,09)

0,16 (0,02)

2 Pessimismo

2,41 (0,10)

0,76 (0,03)

3 Sentimento de fracasso

2,90 (0,12)

0,71 (0,03)

4 Insatisfaes

2,79 (0,11)

0,10 (0,02)

5 Culpa

1,98 (0,08)

0,57 (0,03)

6 Punio

1,48 (0,06)

0,66 (0,04)

7 Autoaverso

2,50 (0,10)

0,51 (0,02)

8 Autoacusaes

0,97 (0,05)

-1,19 (0,06)

9 Ideias Suicidas

1,71 (0,08)

1,20 (0,04)

10 Choro

1,69 (0,06)

0,36 (0,03)

11 Irritabilidade

1,07 (0,05)

-0,65 (0,04)

12 Retraimento Social

1,51 (0,06)

0,71 (0,03)

13 Indeciso

1,99 (0,08)

0,13 (0,03)

14 Mudana na autoimagem

1,72 (0,07)

0,52 (0,03)

15 Dificuldade de trabalhar

1,94 (0,07)

0,30 (0,03)

16 Insnia

1,44 (0,06)

0,06 (0,03)

17 Fatigabilidade

1,41 (0,06)

-0,25 (0,03)

18 Perda de apetite

1,22 (0,06)

0,96 (0,04)

19 Perda de peso

0,93 (0,06)

2,00 (0,11)

20 Preocupaes somticas

1,19 (0,05)

0,35 (0,04)

21 Perda da libido

1,43 (0,06)

0,74 (0,04)

Item

ai: parmetro de discriminao do item i; bi: parmetro de gravidade do item i; DP: desvio padro.

Quanto gravidade dos sintomas, os resultados so os mesmos do modelo 1 para


todos os itens do BDI que no apresentam DIF. As diferenas ocorrem apenas nos
oito itens restantes. Observa-se que a presena de culpa tem maior probabilidade de
ser observada em nveis mais altos de intensidade de sintomas depressivos (b^1,5=0,58)
nas mulheres e mais baixos nos homens ( j*0,5
==
bi 0,53) Isso se inverte para os sintomas
tristeza, sentimento de fracasso, insatisfaes, punio, perda da libido, choro e
fatigabilidade. Por exemplo, a presena de perda da libido tem maior probabilidade de
ser observada em nveis mais baixos de intensidade de sintomas depressivos (b^1,21=0,48)
60
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

FUNCIONAMENTO DIFERENCIAL DO ITEM NO INVENTRIO DE DEPRESSO BECK

Tabela 2. Mdia e desvio padro da distribuio a posteriori dos parmetros do modelo para itens
constrangedores (modelo 2).
Item

ai (DP)

b1i (DP)

b2i (DP)

*
0,5

i (DP)

i (DP)

1 Tristeza

2,37 (0,12) 0,07 (0,03)

0,16 (0,07)

0,28

0,88 (0,04)

0,45 (0,008)

2 Pessimismo

2,34 (0,10) 0,76 (0,03)

3 Sentimento de fracasso

2,94 (0,15) 0,68 (0,03)

0,70 (0,06)

0,76

0,92 (0,06)

0,45 (0,007)

4 Insatisfaes

2,87 (0,14) 0,04 (0,03)

0,06 (0,05)

0,14

0,90 (0,04)

0,45 (0,007)

5 Culpa

2,06 (0,09) 0,58 (0,03)

0,50 (0,05)

0,53

0,97 (0,03)

0,45 (0,007)

6 Punio

1,53 (0,07) 0,65 (0,04)

0,54 (0,10)

0,67

0,91 (0,06)

0,45 (0,007)

7 Autoaverso

2,53 (0,10) 0,51 (0,02)

8 Autoacusaes

0,99 (0,05) -1,17 (0,06)

9 Ideias suicidas

1,71 (0,08) 1,20 (0,04)

10 Choro

1,62 (0,07) 0,29 (0,04)

0,42 (0,07)

0,49

0,95 (0,04)

0,45 (0,008)

11 Irritabilidade

1,08 (0,05) -0,65 (0,04)

12 Retraimento social

1,51 (0,06) 0,71 (0,03)

13 Indeciso

1,99 (0,08) 0,13 (0,03)

14 Mudana na autoimagem 1,71 (0,07) 0,52 (0,03)

15 Dificuldade de trabalhar

1,91 (0,07) 0,30 (0,03)

16 Insnia

1,43 (0,06) 0,06 (0,03)

17 Fatigabilidade

1,38 (0,06) -0,33 (0,05) -0,25 (0,07) -0,19 0,96 (0,03)

18 Perda de apetite

1,21 (0,06) 0,96 (0,05)

19 Perda de peso

0,93 (0,06) 2,00 (0,10)

20 Preocupaes somticas

1,18 (0,05) 0,35 (0,03)

21 Perda da libido

1,19 (0,06) 0,48 (0,04)

1,39 (0,11)

1,50

0,94 (0,05)

0,45 (0,007)

0,45 (0,007)

ai: parmetro de discriminao do item i; b1i: parmetro de gravidade do item i para indivduos do grupo feminino;
DP:desvio padro; b2i: parmetro de gravidade do item i para indivduos do grupo masculino; *0,5: nvel de intensidade
de sintomas depressivos de um indivduo do grupo com comportamento diferenciado, em que a probabilidade de
presena do sintoma 0,5; i: probabilidade de um indivduo do grupo masculino dizer que tem o sintoma depressivo,
isto , probabilidade de presena de sintoma em homens com um alto nvel de intensidade de sintomas depressivos;
i: probabilidade de um indivduo apresentar comportamento diferencial com relao ao sintoma i.

nas mulheres e mais altos nos homens ( j*0,5


==
bi 1,50). Ainda como um resultado do
modelo 2, estima-se que a probabilidade de um homem com alta intensidade de
sintomas depressivos expressar a presena dos sintomas relativos a tristeza, sentimento
de fracasso, insatisfaes, culpa, punio, choro, fatigabilidade e perda da libido
^
maior ou igual a 88% ( i 0,88 ). A Figura 1 mostra as CCIs produzidas pelos modelos
61
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

CASTRO, S.M.J. ET AL.

Probabilidade de presena do sintoma

Modelo 1

0,9

Modelo 2 feminino

0,8

Modelo 2 masculino

0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-2,5

-2

-1,5

-1

-0,5

0,5

1,5

2,5

Nivel de intensidade de sintomas depressivos

Figura 1. Curva Caracterstica do Item (CCI) para o sintoma perda da libido (item 21) segundo o
modelo logstico de 2 parmetros (1) e o modelo para Itens Constrangedores (2) para os sexos
feminino e masculino.

1 e 2 para o item 21, relativo perda da libido. Aqui, fica evidente a vantagem do uso
do modelo 2 em relao ao modelo 1, pois as diferenas no comportamento de um
item com DIF, em relao sua gravidade, so mostradas claramente para os dois
grupos comparados.
Os nveis de intensidade de sintomas depressivos estimados sob os modelos de TRI
esto na mesma escala da gravidade do sintoma estimada para cada item do BDI; logo,
so comparveis. Os percentis 95 dos nveis de intensidade de sintomas depressivos
so 1,598 e 1,593 para os modelos 1 e 2, respectivamente. Dos 201 indivduos com
intensidade de sintomas depressivos acima do percentil 95 para cada modelo, 194 so
classificados de forma igual pelos dois modelos. As caractersticas (Tabela 3) desse
grupo mostram que quase 80% so oriundos do grupo psiquitrico, aproximadamente
68% so mulheres, a maioria (mais de 58%) no tem um companheiro(a) e tem, em
mdia, 37 anos de idade.
As estimativas de intensidade de sintomas depressivos obtidas segundo os modelos
1 e 2 apresentam alta associao, com coeficiente de correlao igual a 0,99.

62
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

FUNCIONAMENTO DIFERENCIAL DO ITEM NO INVENTRIO DE DEPRESSO BECK

Tabela 3. Descrio dos indivduos com nvel alto de sintomas depressivos, estimado como um
valor acima do percentil 95.
Varivel

Psiquitrica

Clnica

Populao geral

Total

Modelo 1

n = 157

n = 18

n = 26

n = 201

Mdia

39,18

34,67

29,76

37,60

Desvio padro

12,5

13,26

13,83

13,08

Mnimo

15

18

18

15

Mximo

75

64

67

75

Menos de 5 anos

54

12

38,1%

Ensino Fundamental Completo

43

25,9%

Ensino Mdio Completo

43

26,9%

Ensino Superior Completo

11

7,7%

Solteiro

45

19

36,2%

Casado

74

41,7%

Desquitado, divorciado ou vivo

36

22,1%

Masculino

36

11

16

31,3%

Feminino

121

10

68,7 %

n = 155

n = 17

n = 29

n = 201

Mdia

39,03

34,12

28,64

37,15

Desvio padro

12,46

13,45

13,48

13,16

Mnimo

15

18

15

15

Mximo

75

64

67

75

Menos de 5 anos

53

13

37,6%

Ensino Fundamental Completo

43

26,4%

Ensino Mdio Completo

43

26,9%

Ensino Superior Completo

10

7,1%

Solteiro

47

22

38,7%

Casado

72

40,2%

Desquitado, divorciado ou vivo

34

21,1%

38
117

10
7

18
11

32,8%
67,2 %

Idade (n = 200)

Escolaridade (n = 194)

Estado Civil (n = 199)

Sexo (n = 201)

Modelo 2
Idade (n = 200)

Escolaridade (n = 194)

Estado Civil (n = 199)

Sexo (n = 201)
Masculino
Feminino
^

: trao latente (nvel de sintomas depressivos) estimado a partir dos dados da amostra.
^
^
=1,598 para o modelo 1 e =1,593 para o modelo 2.
63
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

CASTRO, S.M.J. ET AL.

DISCUSSO
Utilizou-se o modelo logstico de dois parmetros (modelo 1) visando comparao
com o modelo para itens constrangedores (modelo 2) porque ambos incluem parmetros
de discriminao e gravidade do sintoma depressivo. Outros estudos j utilizaram o modelo
logstico de 2 parmetros a dados psiquitricos: Schaeffer16, em 1988, ajustou esse modeloa
respostas para 11 sintomas de depresso para os quais existiam 4 categorias de resposta
(nunca, uma vez at agora, com relativa frequncia e muitas vezes) e Kessler etal.17
aplicaram-no na construo de 2 escalas (uma com 10 itens e outra com 6) sobre sade mental.
Os achados em relao ao modelo 1, quanto presena de DIF em oito itens do
BDI, mostram que homens e mulheres com o mesmo nvel de intensidade de sintomas
depressivos responderam de modo diferente aos itens tristeza, sentimento de fracasso,
insatisfaes, culpa, punio, choro, fatigabilidade e perda da libido. Diversos estudos4-6,18-24
corroboram esses achados; entretanto, o funcionamento diferencial (DIF) do item choro
em relao ao gnero o que aparece na maioria deles. Boa parte dos estudos que
mostram a diferena de gnero em relao ao choro salienta que mulheres tendem a
chorar mais que homens5,6,21. Isso pode ser mais um reflexo da bem conhecida tendncia
das mulheres chorarem mais prontamente e mais intensamente que os homens em uma
variedade de situaes angustiantes do que um indicador de uma diferena de gnero na
prevalncia da depresso18. Essa constatao sugere que o choro em resposta angstia
, em grande medida, determinado pelo gnero; logo, homens e mulheres com o mesmo
nvel de intensidade de sintomas depressivos provavelmente no respondero ao item
choro da mesma forma, o que se confirma neste estudo. Originalmente, a escala do
BDI tem quatro categorias, sendo que, em especial no item sobre choro, a categoria de
ordem mais alta afirma que o indivduo perdeu a capacidade de chorar, mesmo que tenha
vontade, enquanto as trs primeiras categorias determinam um crescente na quantidade
de vezes que se costuma chorar. De todos os homens que receberam o valor 1 na escala
dicotomizada, mais da metade respondeu a categoria 3, o mesmo ocorrendo quando se
observa apenas os homens que pertencem ao grupo dos 5% maiores valores estimados
para nvel de intensidade de sintomas depressivos, mostrando que so srios candidatos
a um diagnstico positivo para depresso. Essa perda da capacidade de chorar masculina
tambm aparece no estudo de Hammen e Padesk4, no qual se trabalhou com o BDI na
escala original.
Comparando-se os resultados encontrados para os modelos 1 e 2 em relao discriminao
dos sintomas depressivos medidos pelos itens, pode-se perceber que, considerando-se
itens com valores de ai 18,10 como tendo razovel discriminao, os mesmos 19 itens nos
2 modelos esto nessa categoria, com exceo apenas de perda de peso e autoacusaes.
Noestudo de Cri etal.8, no qual foi ajustado um modelo logstico de trs parmetros a
dados do BDI, apenas perda de apetite obteve estimativa para discriminao abaixo desse
ponto de corte, porm o sintoma perda de peso est muito prximo dessa regio. J entre os
sintomas que mais discriminam, sentimento de fracasso e insatisfao, so os que aparecem
64
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

FUNCIONAMENTO DIFERENCIAL DO ITEM NO INVENTRIO DE DEPRESSO BECK

nos modelos 1, 2 e no ajustado por Cri etal.8, mostrando que estes so sintomas importantes
na discriminao da populao quanto intensidade de sintomas depressivos.
Um resultado que aparece no modelo 2 a maior gravidade do sintoma perda
da libido para os homens do que para as mulheres, pois a maior probabilidade da
presena do mesmo ocorre em nveis de intensidade de sintomas depressivos mais
altos para homens do que para as mulheres. A importncia da perda da libido para
os homens aparece em diversos estudos. Em um ensaio clnico randomizado sobre
os efeitos sexuais (tais como melhora na perda da libido e na disfuno ertil) da
reposio de testosterona em homens com diagnstico de depresso maior 25, os
autores pretendiam verificar se o tratamento seria eficaz nessa populao da mesma
forma que o na populao geral. No entanto, a reposio de testosterona no surtiu
o efeito j conhecido, indicando que talvez o impedimento tenha sido a condio de
depresso da populao-alvo.
Os grupos formados pelos 5% de indivduos com maiores estimativas de intensidade
de sintomas depressivos (trao latente sendo medido), obtidas a partir dos modelos 1 e
2, evidenciam a superioridade feminina no grupo psiquitrico, pois mais de 75% desses
grupos formado por mulheres. Esses dados so consistentes com a evidncia de que a
depresso de duas a trs vezes mais comum em mulheres adolescentes e adultas do que
em homens adolescentes e adultos26, pois essas mulheres tm os nveis de intensidade de
sintomas depressivos mais altos, sendo fortes candidatas a terem um diagnstico positivo
para depresso.
importante ressaltar que os modelos 1 e 2 rastreiam praticamente os mesmos indivduos
como pertencentes a esses grupos com as maiores estimativas de intensidade de sintomas
depressivos. Dos 201, apenas 7 mulheres e 7 homens apresentam classificaes discordantes,
sendo que o modelo 1 rastreia mais mulheres como acima do percentil 95 e o modelo 2
rastreia mais homens como acima do seu respectivo percentil 95. Essas diferenas parecem
ocorrer devido ao fato de que os nveis de intensidade de sintomas depressivos estimados
para esses indivduos esto no limite de seu respectivo valor do percentil 95.

CONCLUSO
Foram ajustados dois modelos de TRI aos dados dicotomizados do BDI: o modelo logstico
de 2 parmetros (modelo 1) e o modelo de TRI para itens constrangedores (modelo 2), o
qual acomoda a presena de itens que apresentam DIF.
Os resultados encontrados entre os modelos 1 e 2 so bastante similares, especialmente no
caso das estimativas de intensidade de sintomas depressivos para cada indivduo, comprovado
pela alta correlao entre os escores de TRI. Apesar disso, o modelo 2 ainda vantajoso, pois
mostra as diferenas em gravidade do sintoma depressivo para os grupos avaliados, trazendo,
dessa forma, mais informao ao pesquisador sobre a populao estudada. A utilizao de
um modelo de alcance mais amplo em termos de populao-alvo pode ser uma alternativa
65
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

CASTRO, S.M.J. ET AL.

bastante til tambm na rea clnica, onde a existncia de modelos validados pode contribuir
para a identificao de indivduos com potencial depressivo.
Uma limitao deste trabalho a de que ele consiste de uma comparao emprica,
fazendo-se necessrio um estudo mais amplo, valendo-se, por exemplo, de dados simulados.
Ainda, como Cri etal.8 comentam, faz-se necessria a extenso do modelo 2 a itens com
resposta ordinal, pois, assim como o BDI, inmeros instrumentos de medidas psiquitricas
contemplam itens de resposta ordinal, e a sua transformao em itens dicotmicos (do tipo
ausncia ou presena, por exemplo) no aproveita totalmente a informao disponvel,
podendo produzir resultados com alguma inconsistncia.

REFERNCIAS
1. Teresi JA, Fleishman JA. Differential item functioning and
health assessment. Qual Life Res 2007; 16(Suppl1): 33-42.
2. Embretson SE, Reise SP. Item Response Theory
for Psychologists. New Jersey: Lawrence Erlbaum
Associates; 2000.
3. Lord F. Applications of item response theory to practical
testing problems. Hillsdale: Routledge; 1980.
4. Hammen CL, Padesky CA. Sex differences in the
expression of depressive responses on the Beck Depression
Inventory. J Abnorm Psychol 1977; 86(6): 609-14.
5. Santor D, Ramsay J, Zuroff D. Nonparametric item
analyses of the Beck Depression Inventory: evaluating
gender item bias and response option weights. Psychol
Assess 1994; 6: 255-70.
6. Salokangas RK, Vaahtera K, Pacriev S, Sohlman B,
Lehtinen V. Gender differences in depressive symptoms.
An artefact caused by measurement instruments? J
Affect Disord 2002; 68(2-3): 215-20.
7. Beck AT, Steer RA. Beck Depression Inventory. Manual.
San Antonio, TX: Psychological Corporation; 1993.
8. Cri M, Singer JM, Andrade DF. A model for psychiatric
questionnaires with embarrassing items. Stat Methods
Med Res 2001; 20(5): 451-70.
9. Cunha JA. Manual da verso em portugus das Escalas
Beck. So Paulo: Casa do Psiclogo; 2001.
10. Andrade DF, Tavares HR, Valle RC. Teoria da Resposta
ao Item: conceitos e aplicaes. In: Anais do 14
SINAPE; 2000 jul 28; Caxambu (MG).
11. Teresi JA, Ocepek-Welikson K, Kleinman M, Cook KF,
Crane PK, Gibbons LE, etal. Evaluating measurement
equivalence using the item response theory loglikehood ratio (IRTLR) method to assess differential
item functioning (DIF): applications (with illustrations)
to measure of physical functioning ability and general
distress. Qual Life Res 2007; 16(Suppl 1): 43-68.

12. Thissen D. Dave Thissens Front Page. Disponvel em


www.unc.edu/~dthissen/dl.html. (Acessado em 26
de julho de 2008).
13. Samejima F. Estimation of latent ability using a
response pattern of graded scores. Madison (WI):
Psychometric Society; 1969.
14. Lunn DJ, Thomas A, Best N, Spiegelhalter D. Winbugs
a Bayesian modeling framework: concepts, structure,
and extensibility. Stat Comput 2000; 10: 325-37.
15. Castro SMJ, Trentini C, Riboldi J. Teoria da resposta
ao item aplicada ao Inventrio de Depresso Beck.
Rev Bras Epidemiol 2010; 13(3): 487-501.
16. Schaeffer NC. An application of item response theory
to the measurement of depression. Sociol Methodol
1988; 18: 271-307.
17. Kessler RC, Andrews G, Colpe LJ, Hiripi E, Mroczek
DK, Normand SLT, etal. Short screening scales to
monitor population prevalence and trends in nonspecific psychological distress. Psychological Medicine
2002; 32: 959-76.
18. Romans SE, Tyas J, Cohen MM, Silverstone T. Gender
differences in the symptoms of major depressive
disorder. J Nerv Ment Dis 2007; 195(11): 905-11.
19. Stommel M, Given BA, Given CW, Kalaian HA, Schulz R,
McCorkle R. Gender bias in the measurement properties
of the Center for Epidemiologic Studies Depression
Scale (CES-D). Psychiatry Res 1993; 49(3): 239-50.
20. Wilhelm K, Parker G, Asghari A. Sex differences in
the experience of depressed mood state over fifteen
years. Soc Psychiatry Psychiatr Epidemiol 1998;
33(1): 16-20.
21. Carter JD, Joyce PR, Mulder RT, Luty SE, McKenzie
J. Gender differences in the presentation of depressed
outpatients: a comparison of descriptive variables. J
Affect Disord 2000; 61(1-2): 59-67.
66

REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67

FUNCIONAMENTO DIFERENCIAL DO ITEM NO INVENTRIO DE DEPRESSO BECK

22. Gelin M, Zumbo B. Differential item functioning results


may change depending on how an item is scored: an
ilustration with the Center for Epidemiologic Studies
Depression Scale. Educ Psychol Meas 2003; 63: 65-74.
23. Wenzel A, Steer RA, Beck AT. Are there any gender
differences in frequency of self-reported somatic symptoms
of depression? J Affect Disord 2005; 89(1-3): 177-81.
24. Angst J, Gamma A, Gastpar M, Lepine JP, Mendlewicz
J, Tylee A; Depression Research in European
Society Study. Gender differences in depression.
Epidemiological findings from the European DEPRES
I and II studies. Eur Arch Psychiatry Clin Neurosci
2002; 252(5): 201-9.

25. Seidman SN, Roose SP. The sexual effects of testosterone


replacement in depressed men: randomized, placebocontrolled clinical trial. J Sex Marital Ther 2006; 32(3):
267-73.
26. Beyer JL, Nash J, Shelton R, Loosen PT. Transtorno
depressivo maior. In: Jorge MR. Manual diagnstico
e estatstico de transtornos mentais. 4 edio. Porto
Alegre: Artmed; 2000. p. 288-324.

Recebido em: 13/12/2012


Verso final apresentada em: 29/03/2013
Aceito em: 05/06/2013

67
REV BRAS EPIDEMIOL JAN-MAR 2015; 18(1): 54-67