Escolar Documentos
Profissional Documentos
Cultura Documentos
PMCID: PMC2846587
Publicado online no inverno de 2008. doi: 10.1007 / BF03391722 PMID: 22477682
Autor correspondente.
Address correspondence to Timothy R. Vollmer, Psychology Department, University of Florida, 32611 (email:
vollmera@ufl.edu).
Resumo
A confiabilidade dos dados e a integridade do tratamento têm implicações importantes para a prática
clínica porque podem afetar a capacidade dos médicos de julgar com precisão a eficácia das
intervenções comportamentais. Os dados de confiabilidade e integridade também permitem que os
médicos forneçam feedback aos cuidadores e ajustem as intervenções conforme necessário.
Apresentamos as razões pelas quais as medidas de confiabilidade e integridade são fundamentais no
trabalho clínico, discutimos eventos que podem resultar em confiabilidade ou integridade diminuídas e
fornecemos vários meios eficientes para coletar dados e calcular medidas de confiabilidade e
integridade.
Vários tipos de medidas de confiabilidade podem ser tomadas, mas neste artigo estamos nos referindo
especificamente à extensão em que dois observadores concordam sobre a ocorrência ou não ocorrência
de eventos. Por exemplo, se a pessoa A registra uma ocorrência de agressão entre 14h30 e 14h35, a
pessoa B também registra uma ocorrência de agressão durante esse período? Os observadores
concordam que o episódio ocorreu ou não ocorreu? Por integridade do tratamento, queremos dizer até
que ponto os procedimentos comportamentais são conduzidos de acordo com um plano de mudança de
comportamento ( Gresham, Gansle, Noell, Cohen e Rosenblum, 1993 ). Por exemplo, se o plano de
comportamento estabelece que um reforçador deve ser aplicado após alguma instância específica de
comunicação vocal, o reforçador é realmente aplicado?
Esses exemplos são relativamente diretos porque não é difícil entender a necessidade de (a) monitorar
com precisão uma condição médica que está sendo tratada por meio de medicamentos e (b) administrar
medicamentos com precisão. É bastante simples inserir o comportamento e os procedimentos
comportamentais em exemplos paralelos, como segue:
A pessoa C apresenta autolesão grave e, portanto, recebe uma avaliação comportamental
completa por uma equipe qualificada. Um procedimento baseado no reforço diferencial é
prescrito como resultado do resultado da avaliação. Os pais da pessoa C recebem instruções para
conduzir o procedimento e registrar os dados sobre automutilação antes e depois da
implementação do tratamento. Os pais são diligentes e razoavelmente precisos na coleta de dados
antes do tratamento, mas eles relaxam um pouco após o início do tratamento e se esquecem de
registrar muitos casos de automutilação. Na próxima reunião da equipe profissional
interdisciplinar, a equipe conclui que o tratamento comportamental foi eficaz com base nos dados
dos pais, e nenhuma alteração é feita. Na verdade, as verificações de confiabilidade dos dados
teriam mostrado que o tratamento comportamental foi ineficaz.
Nestes exemplos, os erros de confiabilidade dos dados resultaram em resultados de tratamento “falsos
positivos” (mostrando falsamente um bom efeito de tratamento) e os erros de integridade de tratamento
resultaram em resultados “falsos negativos” (apresentando falsamente nenhum efeito de tratamento).
Esses exemplos pretendiam destacar algumas das implicações da confiabilidade dos dados e do
monitoramento da integridade do tratamento. Nossa tese geral é que medir a confiabilidade e a
integridade é inerentemente importante. Além disso, há várias vantagens em tal abordagem que podem
ter utilidade prática no dia-a-dia. A seguir, apresentaremos alguns usos práticos da confiabilidade dos
dados e do monitoramento da integridade do tratamento.
Uso prático
Um uso prático da confiabilidade dos dados e do monitoramento da integridade do tratamento é
fornecer feedback imediato ao coletor de dados e implementador do procedimento. O feedback deve
assumir duas formas: (a) feedback positivo para o registro correto de dados e / ou implementação de
procedimento e (b) feedback corretivo para registro de dados incorreto e / ou implementação de
procedimento ( DiGennaro, Martens, & Kleinmann, 2007 ; Sulzer-Azaroff & Mayer, 1991) É claro que
os dados incorretos ou a implementação de procedimentos podem não ser a "falha" do coletor de dados
ou implementador de tratamento, como quando há definições comportamentais deficientes. Nesses
casos, o coletor de dados / implementador do procedimento não deve receber feedback positivo ou
corretivo, mas deve ser convidado a ajudar a revisar as definições e outras fontes de erro. Quando o
feedback é fornecido, recomendamos que qualquer oportunidade para feedback positivo seja
aproveitada. Por exemplo, a pessoa que monitora os dados deve evitar afirmações como “Bem, isso foi
uma perda de tempo, o comportamento nem ocorreu, então não pudemos comparar nossos dados”. Em
vez disso, se ambos os observadores não registraram uma instância de comportamento, o monitor pode
dizer: “Ótimo, ambos registramos que o comportamento não ocorreu. Isso é um acordo e hoje tivemos
sucesso.
Verificamos que se o feedback corretivo ocorrer com grande frequência em relação ao feedback
positivo, o monitor pode se tornar um estímulo aversivo condicionado. Ou seja, coletores de dados e
implementadores de tratamento podem começar a escapar ou evitar sessões de monitoramento. Por
outro lado, quando o monitor freqüentemente aponta o registro correto de dados e a implementação de
procedimentos, as sessões devem ser favoráveis para o coletor de dados / implementador de
procedimento primário. Pode ser importante agendar observações durante os períodos em que o
comportamento é mais provável de ocorrer, a fim de fornecer mais oportunidades de comparação e
feedback. Por exemplo, se o comportamento do alvo é mantido por fuga das instruções, a observação
deve ser agendada para sessões de instrução.
Um segundo uso prático é fornecer feedback de desempenho atrasado e cumulativo para coletores de
dados / implementadores de procedimento ( Noell et al., 2000) Essa função é semelhante ao feedback
imediato discutido acima, mas depende do recurso adicional de tendências de desempenho de longo
prazo. Com as mesmas advertências discutidas acima (como outras razões para baixa confiabilidade e
integridade, incluindo definições mal formuladas), o feedback atrasado pode assumir duas formas
gerais: (a) feedback positivo na forma de reconhecimento, promoção e elogio, ou (b ) feedback
corretivo na forma de treinamento adicional ou detalhamento adicional de procedimentos ou reuniões
de supervisor (Noell et al.). Alguns usos excelentes de feedback positivo atrasado para desempenho
cumulativo incluem reconhecimento público em uma reunião de equipe ou de pais (por exemplo, “A
Sra. Smith tem cuidado de uma criança com comportamento muito perigoso; Estou feliz em informar
que suas pontuações de confiabilidade de dados ultrapassaram 90% nos últimos três meses e suas
pontuações de implementação de tratamento foram de 100% no mês passado! ”); reconhecimento
público por meio de prêmios; reconhecimento em um site ou em um boletim informativo ou jornal; e
assim por diante, incluindo reconhecimento privado em uma avaliação de desempenho escrita ou oral.
Um terceiro uso prático está relacionado à tomada de decisão clínica. Mudanças nos procedimentos
comportamentais devem ser informadas por dados de confiabilidade e integridade do tratamento,
conforme exemplificado pelos casos hipotéticos apresentados anteriormente. Por exemplo, se houver
um aumento nas taxas de comportamento problemático simultaneamente com melhores pontuações de
confiabilidade de dados, é possível que os coletores de dados estejam simplesmente melhorando na
coleta de dados e, portanto, as taxas aumentadas de comportamento problemático podem não
apresentar a necessidade de procedimentos alterados. No caso da integridade do tratamento, é possível
que os efeitos do tratamento insatisfatório não sejam devidos a um tratamento inadequado em si, mas
sim a um tratamento que não está sendo implementado suficientemente.figura 1mostra um exemplo
hipotético do uso de medidas de integridade para determinar a necessidade de treinamento de reforço
(para um exemplo real, consulte Vollmer, Marcus, & LeBlanc, 1994 ). Portanto, um analista do
comportamento deve estar equipado com dados de confiabilidade e integridade do tratamento sempre
que decisões clínicas críticas estiverem sendo tomadas. Se as medidas de confiabilidade e integridade
forem sólidas, boas decisões clínicas podem ser feitas com base em uma avaliação adequada dos
efeitos do tratamento ou na falta deles.
figura 1
Dados hipotéticos que mostram a interação entre a porcentagem de etapas corretas concluídas (integridade
do tratamento, mostrada nos círculos preenchidos) e o comportamento problemático da criança (mostrado
nos círculos abertos). O comportamento problemático da criança aumenta à medida que a integridade do
tratamento diminui; um treinamento de reforço (mostrado pela seta) resulta no aumento da integridade do
tratamento e na recuperação dos efeitos do tratamento.
Uma regra prática pode ser concluir que a confiabilidade dos dados e os escores de integridade do
tratamento devem ser considerados cuidadosamente em um contexto a partir do qual esses dados são
coletados. Quão conservadora ou liberal é a medida de confiabilidade? Quão importante é registrar
todas as ocorrências de comportamento? Qual procedimento de tratamento está sendo usado? Qual é o
efeito provável de um erro de integridade do tratamento dado o procedimento usado?
Com uma ou duas exceções, escrevemos até agora pressupondo que um erro de confiabilidade ou
integridade foi cometido pelo observador / implementador primário. Isso pode ser verdade, mas pode
não ser "falha" do observador / implementador em si. Nas seções a seguir, discutiremos alguns tipos
comuns de erros e, a seguir, alguns motivos comuns para (ou origens) desses erros.
Alguns erros de confiabilidade e integridade podem ser mais sutis do que os descritos acima. Por
exemplo, dois observadores podem registrar a mesma resposta, mas em momentos ligeiramente
diferentes. Para ilustrar, suponha que dois observadores estejam registrando ocorrências de autolesão e
a confiabilidade seja avaliada minuto a minuto. Se o observador A registrar uma ocorrência de
automutilação no final do minuto 5 e o observador B registrar uma ocorrência de automutilação no
início do minuto 6, haverá uma falta de acordo dentro desses respectivos intervalos. Se essa
discrepância ocorrer com frequência ao longo da coleta de dados, esses erros podem resultar em
escores de baixa confiabilidade e resultados de dados diferentes. Da mesma forma, erros de integridade
podem ocorrer a qualquer momento em que houver discrepâncias entre o protocolo prescrito e a
implementação real de eventos (Peterson et al., 1982 ). Ou seja, os erros de integridade podem incluir
aplicação inadequada de reforço, bem como pequenas alterações no protocolo. Por exemplo, os erros
podem incluir a entrega de reforçadores após um atraso e a apresentação de dicas sociais, como acenos
de cabeça ou sorrisos do terapeuta.
Um quarto fator possível que influencia os erros de confiabilidade e integridade foi referido como um
“desvio” no desempenho (por exemplo, Kazdin, 1977 ). Ou seja, os indivíduos inicialmente executam
as habilidades conforme prescrito, mas depois desviam ou alteram seu comportamento em relação ao
protocolo original. O monitoramento cuidadoso dos observadores e daqueles indivíduos que
implementam programas combinados com sessões periódicas de treinamento de reforço pode ajudar a
prevenir a ocorrência de desvios.
Um quinto fator possível que influencia a confiabilidade e os erros de integridade podem ser
contingências ambientais concorrentes. Mais especificamente, pode haver reforços para desvios do
protocolo, punidores no local para a adesão ao protocolo, ou ambos. Por exemplo, um estudo de
O'Leary, Kent e Kanowitz (1975)mostraram que os observadores que receberam informações
específicas sobre a sessão (por exemplo, o comportamento deve diminuir na fase de tratamento) e
feedback (por exemplo, elogios por pontuar baixas taxas de comportamento e repreensões por pontuar
taxas mais altas de comportamento) foram tendenciosos em sua coleta de dados. Da mesma forma,
relatórios imprecisos de baixas taxas de comportamento problemático por cuidadores podem ser
acidentalmente reforçados por elogios e incentivos de um analista do comportamento, especialmente se
o analista do comportamento não estiver presente quando a coleta de dados estiver ocorrendo. Por
outro lado, os relatórios podem ser mais precisos apenas quando o cuidador está ciente de que um
analista do comportamento estava atualmente coletando dados de confiabilidade (por exemplo,
Brackett, Reid, & Green, 2007) Assim, seria importante, nessas circunstâncias, enfatizar e elogiar a
precisão da coleta de dados e abster-se de mencionar mudanças específicas de comportamento.
Erros de integridade também podem ocorrer devido a esquemas concorrentes de reforço. Por exemplo,
um analista do comportamento pode recomendar que a atenção dos pais seja dada para o
comportamento apropriado, e não para acessos de raiva. No entanto, o pai pode estar em um ambiente
(por exemplo, uma mercearia) no qual a adesão ao programa não é reforçada e pode até ser punido (por
exemplo, outros compradores olhando feios). Portanto, a prestação de atenção dos pais para acessos de
raiva é negativamente reforçada e erros de integridade futuros tornam-se mais prováveis. Enfatizar a
precisão, fornecer feedback consistente sobre o nível de integridade e fornecer reforço para altos níveis
de integridade pode ser necessário para manter altos níveis de integridade ( DiGennaro, Martens, &
Kleinmann, 2007 ).
As medidas de confiabilidade variam de pelo menos duas maneiras: o tamanho da janela de tempo e o
tipo de dados. Janelas de tempo maiores podem tornar os cálculos mais fáceis do que as menores. Uma
das maneiras mais simples de calcular a confiabilidade é contar o número total de respostas marcadas
(ou o número total de intervalos contendo respostas, dependendo do sistema de coleta de dados) por
cada observador ao longo do período de observação, para dividir o número menor pelo maior número e
multiplicar por 100. Isso resulta em uma porcentagem geral de concordância para essa observação. As
medidas de toda a sessão são simples de entender e calcular, mas fornecem apenas uma estimativa
liberal da confiabilidade da coleta de dados. Para um exemplo extremo, um observador poderia marcar
10 ocorrências da resposta alvo e, em seguida, se distrair ou adormecer. O segundo observador pode
perder essas 10 respostas iniciais, mas depois registrar 10 outras respostas (enquanto o primeiro
observador dorme). Uma medida de confiabilidade de toda a sessão para esses dois conjuntos de dados
seria de 100%, porque ambos os observadores pontuaram 10 respostas, mas essas respostas teriam
ocorrido em momentos totalmente diferentes.
Usar intervalos mais curtos dentro de um período de observação mais longo torna os cálculos de
confiabilidade mais rigorosos e melhora a confiança de que ambos os observadores estavam
registrando a mesma instância de comportamento. O uso de intervalos mais curtos dentro da sessão é às
vezes chamado de método proporcional. Para calcular a concordância proporcional, o tempo total de
observação é dividido em unidades discretas (intervalos). Por exemplo, uma observação de 10 minutos
pode ser dividida em intervalos de 60, 10 s. Os registros dos dois observadores são comparados a cada
intervalo de 10 s. Por exemplo, se um observador registrou duas ocorrências de comportamento no
primeiro intervalo de 10 s e um segundo observador registrou três ocorrências de comportamento no
primeiro intervalo, a confiabilidade para esse intervalo seria de 66,7% (duas ocorrências divididas por
três ocorrências e multiplicadas por 100). Uma vez que a confiabilidade foi calculada para todos os
intervalos na observação, as pontuações são calculadas para obter a confiabilidade média para toda a
observação. Embora intervalos de 10 s sejam comuns em pesquisas, intervalos maiores, como 1 minuto
ou 5 minutos, podem ser mais práticos na aplicação diária.
A confiabilidade proporcional tem várias vantagens possíveis sobre a confiabilidade da sessão inteira.
Em primeiro lugar, as medidas proporcionais são mais rigorosas do que as medidas de toda a sessão.
Dividindo a sessão em unidades menores, os cálculos de intervalo por intervalo reduzem a
probabilidade de obter boa confiabilidade quando dois observadores registram respostas totalmente
diferentes (como no exemplo dado para confiabilidade da sessão inteira acima).
Outro método é o método de concordância exata, para o qual os intervalos de observação são
pontuados como uma “concordância” se ambos os observadores contaram exatamente o mesmo
número de ocorrências de comportamento. Se eles não concordarem exatamente, o intervalo é
classificado como uma "discordância". O número de acordos é então dividido pelo número total de
intervalos e convertido em uma porcentagem. Este método é ainda mais conservador do que o método
proporcional, mas às vezes pode ser excessivamente conservador. Por exemplo, quando os
observadores estão ligeiramente errados em seu tempo, o comportamento pontuado em um intervalo
para um observador e em outro intervalo para um segundo observador produz dois intervalos de
desacordo, embora ambos os observadores estivessem pontuando o mesmo evento comportamental.
Outro método de confiabilidade é usado quando o registro de intervalo parcial ou de intervalo inteiro
está em vigor. O intervalo parcial refere-se à pontuação do intervalo se o comportamento ocorrer em
qualquer ponto desse intervalo. A gravação de intervalo inteiro refere-se à pontuação do intervalo se o
comportamento ocorrer durante o intervalo. Assim, não há “contagem” de comportamento; o intervalo
é simplesmente classificado como “ocorrência” ou “não ocorrência”. No caso de registro de intervalo, a
confiabilidade pode ser calculada denotando cada intervalo como uma concordância (ambos os
observadores registraram o comportamento ou não registraram o comportamento) ou uma discordância
(um observador registrou o comportamento enquanto o outro não). O número total de concordâncias
para a sessão é então dividido por concordâncias mais discordâncias e multiplicado por 100 para
produzir a confiabilidade média de toda a observação.
Infelizmente, os cálculos de intervalo por intervalo às vezes são impraticáveis ou impossíveis. Esse é o
caso se o sistema de coleta de dados não permitir a quebra dos registros em unidades menores. Por
exemplo, suponha que um professor colete dados sobre o número de vezes que um aluno levanta a mão
durante a aula fazendo marcações em um pedaço de papel. Para algumas classes, um segundo
observador (por exemplo, um consultor comportamental) também registra ocorrências de levantamento
de mãos usando contadores. Nesse caso, a confiabilidade intervalo a intervalo seria difícil de calcular
porque os registros não podem ser facilmente divididos em unidades menores; é impossível dizer
quando o professor registrou a primeira vez de levantar a mão e comparar com os dados do consultor.
Figura 2
Folha de dados em branco de amostra para monitorar a integridade do tratamento; a intervenção envolve
prestar atenção dentro de 10 s após levantar a mão e não atender (ou seja, ignorar) dentro de 30 s após
gritar.
Figura 3
Folha de dados de amostra para monitorar a integridade do tratamento que mostra dados hipotéticos; a
integridade do tratamento é calculada dividindo o número de respostas corretas do professor (entregando e
retendo a atenção após levantar a mão e gritar, respectivamente) pelo número de respostas dos alunos e
multiplicando por 100; a integridade geral é obtida pela média da integridade ao longo dos intervalos de 1
minuto.
Figura 4
Folha de dados de amostra para monitorar a confiabilidade que mostra dados hipotéticos coletados por um
observador secundário; a confiabilidade é calculada usando um método de concordância proporcional.
Os dados de breves sessões de monitoramento também podem ser usados para verificar a
confiabilidade da coleta de dados do cuidador. A comparação do registro do profissional com o registro
do cuidador pode permitir um feedback imediato ao cuidador quanto à confiabilidade da coleta de
dados e integridade da intervenção. No exemplo descrito acima, as “oportunidades” registradas
também são as contagens de levantar as mãos e gritar. O profissional pode usar uma medida de
confiabilidade de toda a sessão (conforme descrito na seção sobre medição de confiabilidade),
dividindo o menor número de respostas registradas pelo maior e multiplicando por 100, ou usar um
método de concordância proporcional. NoFigura 4, a confiabilidade é calculada usando um método de
concordância proporcional. A concordância usando este método é em média entre 78% e 85%. Se um
método menos rigoroso de cálculo de confiabilidade fosse mais apropriado, uma medida de sessão
inteira poderia ser usada, o que resultaria em pontuações médias de concordância entre 88% e 93%.
Usar folhas de dados como essas pode ser útil porque os cuidadores podem ser alertados imediatamente
se a confiabilidade for baixa. Assim, breves sessões de monitoramento poderiam ser conduzidas usando
materiais relativamente simples. Apesar da coleta de dados simplista, essas medidas fornecem
oportunidades para calcular a confiabilidade e integridade e para fornecer feedback imediato aos
cuidadores sobre o registro contínuo do comportamento e implementação de procedimentos de
mudança de comportamento.
Conclusões
A confiabilidade dos dados e a integridade do tratamento devem ser medidas na prática cotidiana da
análise do comportamento. Deixar de fazer isso pode ser perigoso e é quase impossível julgar a eficácia
dos procedimentos comportamentais sem esses dados. Além disso, a capacidade de fornecer feedback
aos coletores de dados e implementadores de procedimentos é fundamental. Erros de confiabilidade de
dados e erros de integridade de tratamento podem ser evitados por meio de um bom treinamento,
descrições sólidas de definições e procedimentos, treinamento de generalização e manutenção e
tornando os procedimentos o mais simples e parcimonioso possível. O monitoramento também deve
ser simples e parcimonioso, usando métodos eficientes, como amostragem intermitente, em vez de
monitoramento contínuo.
Referências
Os artigos da Behavior Analysis in Practice são fornecidos aqui como cortesia da Association for Behavior
Analysis International