Você está na página 1de 48

Machine Translated by Google

COMENTÁRIO DE PESQUISA

PROCEDIMENTOS DE MEDIÇÃO E VALIDAÇÃO DE CONSTRUÇÃO


EM PESQUISA DE MIS E COMPORTAMENTO : INTEGRANDO
TÉCNICAS NOVAS E EXISTENTES1

Scott B. MacKenzie
Departamento de Marketing, Kelley School of Business, Indiana University,
Bloomington, IN 47405 USA {mackez@indiana.edu}

Philip M. Podsakoff
Departamento de Administração, Kelley School of Business, Indiana
University, Bloomington, IN 47405 USA {podsakof@indiana.edu}

Nathan P. Podsakoff
Departamento de Gestão e Organizações, Eller College of Management,
Universidade do Arizona, Tucson, AZ 85721 EUA {podsakoff@email.arizona.edu}

Apesar de validar as medidas de construtos ser fundamental para a construção de conhecimento cumulativo em MIS e
nas ciências comportamentais, o processo de desenvolvimento e validação de escalas continua sendo uma atividade
desafiadora. Sem dúvida, parte do problema é que muitos dos procedimentos de desenvolvimento de escala defendidos
na literatura são limitados pelo fato de que (1) falham em discutir adequadamente como desenvolver definições conceituais
apropriadas do construto focal, (2) muitas vezes falham em especificar o modelo de mensuração que relaciona o construto
latente aos seus indicadores e (3) subutilizar técnicas que forneçam evidências de que o conjunto de itens usados para
representar o construto focal realmente mede o que se propõe a medir. Portanto, o objetivo do presente artigo é integrar
técnicas novas e existentes em um conjunto abrangente de recomendações que podem ser usadas para fornecer aos
pesquisadores em MIS e nas ciências comportamentais uma estrutura para o desenvolvimento de medidas válidas.
Primeiro, elaboramos brevemente algumas das limitações das práticas atuais de desenvolvimento de escala. Em seguida,
discutimos cada uma das etapas do processo de desenvolvimento de escala, prestando atenção especial às diferenças
que são necessárias quando se tenta desenvolver escalas para construtos com indicadores formativos em oposição a
construtos com indicadores reflexivos. Finalmente, discutimos várias coisas que devem ser feitas após o desenvolvimento
inicial de uma escala para examinar sua generalização e aumentar sua utilidade.

Palavras-chave: Procedimentos de validação de construto; Desenvolvimento e validação da escala; validade de


conteúdo, convergente, discriminante e nomológica; modelos de indicadores formativos e reflexivos

1
Detmar Straub foi o editor sênior aceitante para este jornal. Thomas Os apêndices deste documento estão localizados na seção “Suplementos
Stafford atuou como editor associado. Online” do site da MIS Quarterly (http://www.misq.org).

MIS Trimestral Vol. 35 Nº 2 pp. 293-334/ junho de 2011 293


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Introdução artigo provou ser tão útil para os pesquisadores é que ele delineou
um conjunto organizado de atividades que definem prioridades para o
Já se passaram mais de 20 anos desde que Straub (1989) fez a que precisa ser feito no processo de desenvolvimento e avaliação da
seguinte observação sobre a literatura MIS: escala. Portanto, no espírito de Churchill, o objetivo desta pesquisa é
fornecer um conjunto atualizado de recomendações que podem ser
A validação do instrumento foi inadequadamente abordada usadas para fornecer aos pesquisadores uma estrutura para o
na pesquisa do MIS. Apenas alguns pesquisadores desenvolvimento de escalas válidas.
dedicaram atenção séria às questões de medição nas
últimas décadas... e enquanto a conveniência de verificar Acreditamos que há várias razões pelas quais um conjunto atualizado
os resultados por meio de verificações de validade interna de recomendações seria útil. Primeiro, muitos dos procedimentos de
foi argumentada por Jarvenpaa, et al. (1984), o valor desenvolvimento de escala defendidos na literatura falham em discutir
primário e prévio da validação do instrumento ainda não foi adequadamente como desenvolver definições conceituais apropriadas
amplamente reconhecido (p. 147). de um construto focal. Em segundo lugar, muitas das recomendações
são baseadas em uma especificação imprópria do modelo de
Aproximadamente doze anos depois, em uma retrospectiva do artigo medição2 que relaciona a variável latente que representa um construto
de Straub, Boudreau et al. (2001) pesquisou a literatura MIS às suas medidas . nas literaturas de gestão e MIS. Nas seções a
novamente para avaliar se houve alguma melhoria no uso de técnicas seguir, detalharemos brevemente cada uma das limitações identificadas
de validação de construto e concluiu que seus “achados sugerem que acima.
o campo avançou em muitas áreas, mas, em geral, parece que a
maioria dos estudos publicados ainda não estão validando
suficientemente seus instrumentos”. (pág. 1). Preocupações Em seguida, discutiremos cada uma das etapas do processo de
semelhantes em relação às práticas usadas para validar construtos desenvolvimento de escala, prestando atenção especial às diferenças
também foram expressas no campo da gestão por Scandura e Williams que são necessárias quando se tenta desenvolver escalas para
(2000), que compararam as práticas metodológicas relatadas em três construtos com indicadores formativos em oposição a construtos com
principais periódicos em dois períodos diferentes (1985-1987 e indicadores reflexivos. Finalmente, discutimos várias etapas que
1995-1997). ), e concluíram que realmente houve uma diminuição na devem ser tomadas após o desenvolvimento inicial de uma escala
proporção de estudos que relataram informações sobre validade de para examinar sua generalização e aumentar sua utilidade.
construto e relatos de validade discriminante, convergente e preditiva.
Portanto, a observação que Bagozzi e Phillips (1982, p. 468) fizeram
há mais de 25 anos ainda soa verdadeira: “Os cientistas acharam
muito difícil traduzir essa noção aparentemente simples [de validade
de construção] em termos operacionais”. Limitações da Escala Atual
Procedimentos de Desenvolvimento

Falha em definir adequadamente o


A razão para a aparente falta de progresso nesta área certamente Construir domínio
não se deve à escassez de artigos escritos sobre os procedimentos
técnicos que devem ser usados para validar escalas (por exemplo, Embora praticamente todas as discussões sobre o processo de
Anderson e Gerbing 1988; Anderson et al. 1987; Bagozzi et al. al. validação de construto ou desenvolvimento de escala assumam que
1991; Diamantopoulos e Winklhofer 2001; Edwards 2001; Fornell e ele começa com uma articulação clara do domínio do construto, o
Larcker 1981; Gerbing e Anderson 1988; Nunnally e Bernstein 1994;
Straub et al. 2004). No entanto, uma possibilidade é que os
2
pesquisadores que lêem esses artigos absorvam apenas uma parte Para os propósitos de nosso artigo, usamos o termo modelo de medição para nos
referirmos a um modelo que especifica as relações entre um construto latente e seus
do que é dito, porque muitos desses artigos são complexos e exigem
indicadores. Observe que alguns (por exemplo, Borsboom 2005) preferem usar o termo
um conhecimento técnico bastante bem desenvolvido dos
modelo de medição em um sentido mais restrito para se referir apenas a instâncias em
procedimentos de modelagem de equações estruturais. que um construto latente tem um impacto causal em seus indicadores.
O resultado é que os leitores podem não entender como implementar
as recomendações feitas nesses artigos. Uma possibilidade ainda
3
mais provável é que simplesmente haja tanto trabalho no tópico de Para os propósitos de nosso artigo, usamos o termo medida para nos referirmos a um
padrão usado para determinar ou avaliar a magnitude de um atributo possuído por uma
desenvolvimento e avaliação de escala que seja difícil para os
entidade. Este termo às vezes será usado de forma intercambiável com os termos item
pesquisadores priorizar o que precisa ser feito.
e indicador dependendo do contexto, porque um item é uma medida de um atributo e
De fato, acreditamos que uma das razões pelas quais Churchill (1979) uma resposta a ele pode ser usada como um indicador de um construto latente.

294 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

a literatura não faz um trabalho muito bom em descrever as as construções focais não estão realmente capturando o que
características de uma boa definição de construto e as implicações pretendem capturar.
dessa definição para a especificação do modelo de medição. Isso
é importante porque, como observa DeVellis (1991, p. 51), Dada a importância de definir claramente o domínio conceitual do
construto, é surpreendente que tantos pesquisadores negligenciem
essa etapa do processo ou não a implementem adequadamente.
muitos pesquisadores acham que têm uma ideia clara do Uma razão pela qual isso pode acontecer é porque é difícil de
que desejam medir, apenas para descobrir que suas fazer. Escrever boas definições de construto requer pensamento e
ideias são mais vagas do que pensavam. Frequentemente, organização conceitual claros, cuja falta se torna aparente assim
essa percepção ocorre após um esforço considerável ter que o pesquisador tenta escrever uma definição conceitual rígida
sido investido na geração de itens e na coleta de dados do construto. Além disso, é difícil encontrar uma descrição
- uma época em que as mudanças são muito mais caras detalhada do que um pesquisador precisa fazer para definir
do que se descobertas no início do processo. adequadamente um construto. Mesmo aqueles artigos que
enfatizam a importância de desenvolver uma definição conceitual
De acordo com Nunnally e Bernstein (1994, 86-87), adequada nem sempre dizem aos pesquisadores como fazer isso.
De fato, como lamentado por Nunnally e Bernstein, “nenhum
Existem três aspectos principais da validação de método preciso pode ser declarado para delinear adequadamente
construto: (1) especificar o domínio dos observáveis o domínio das variáveis para um construto... o processo de
relacionados ao construto; (2) determinar até que ponto teorização é necessariamente intuitivo” (p. 88). No entanto, mesmo
os observáveis tendem a medir a mesma coisa... a partir que isso possa ser um processo intuitivo, acreditamos que existem
de pesquisas empíricas e análises estatísticas; e (3) maneiras de estruturar e orientar essa teorização e discutiremos
realizar estudos e/ou experimentos de diferenças isso em uma seção posterior do artigo.
individuais subsequentes para determinar até que ponto
as supostas medidas do construto são “melhores
suposições” consistentes sobre o construto. Falha ao especificar corretamente o
Modelo de medição
Desses aspectos, Nunnally e Bernstein argumentam que
especificar o domínio do construto é o mais importante porque A maioria dos procedimentos de desenvolvimento de escala
recomendados até hoje (por exemplo, Anastasi e Urbina 1997;
Bagozzi et al. 1991; Hinkin 1995; Nunnally e Bernstein 1994;
não há como saber testar a adequação com que um Schwab 1980; Spector 1992) são baseados na suposição de que
construto é medido sem um domínio bem especificado. a pontuação de uma pessoa em uma medida de um construto
Em outras palavras, o aspecto 1 (especificar o domínio) latente é uma função de sua verdadeira posição no construto
é importante para dizer o que fazer no aspecto 2 latente, mais o erro. De acordo com essa abordagem de medição,
(investigar as relações entre as diferentes medidas a causalidade flui do construto latente para as medidas no sentido de que cada me
propostas de um construto (p. 88). visto como um reflexo imperfeito da construção latente subjacente
(ver Bollen 1989; Nunnally e Bernstein 1994).
De fato, acrescentaríamos que não há como saber o que fazer no Embora este tipo de modelo de medição seja conceitualmente
aspecto 3 sem uma definição conceitual clara do construto. apropriado em muitos casos, Bollen e Lennox (1991) notaram que
não faz sentido para todos os construtos.
De fato, eles argumentam que os indicadores nem sempre refletem
Deixar de definir adequadamente o domínio conceitual de um construtos latentes subjacentes, mas às vezes eles se combinam
construto causa vários problemas (MacKenzie 2003). Primeiro, para formá -los. Isso é consistente com os pontos de vista de vários
uma definição pobre de construto leva a (1) confusão sobre o que outros pesquisadores (por exemplo, Blalock 1964; Borsboom 2005;
o construto faz e não se refere, e as semelhanças e diferenças Edwards e Bagozzi 2000; Goertz 2006; Law e Wong 1999;
entre ele e outros construtos que já existem no campo; (2) MacCallum e Browne 1993; MacKenzie et al. 2005), que
indicadores que podem ser deficientes porque a definição do argumentam que para alguns construtos, faz mais sentido ver o
construto focal não está adequadamente desenvolvida, ou significado como emanando dos indicadores para o construto em
contaminados porque a definição se sobrepõe a outros construtos um sentido de definição, em vez de vice-versa.
já existentes no campo; e (3) conclusões inválidas sobre
relacionamentos com outros construtos que posteriormente devem A distinção entre modelos de medição formativa e reflexiva é
ser rejeitados porque os indicadores de criticamente importante por várias razões. Primeiro, há

MIS Trimestral Vol. 35 nº 2/ junho de 2011 295


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

são razões conceituais sólidas para acreditar que muitas das natureza metodológica que pudesse explicar de forma plausível as
medidas mais amplamente utilizadas em marketing (Jarvis et al. relações observadas entre as medidas do construto focal e as
2003), gestão (Podsakoff et al. 2003b) e MIS (Petter et al. 2007) medidas de outros construtos incluídos na rede nomológica. Essas
provavelmente devem ser vistas como indicadores formativos de os desvantagens decorrem do fato de que os dados são de natureza
construtos que representam, e não como indicadores reflexivos. Em correlacional. Consequentemente, uma maneira de eliminar ou
segundo lugar, as recentes simulações de Monte Carlo relatadas reduzir a plausibilidade dessas explicações rivais seria manipular
por Jarvis et al. (2003), MacKenzie et al. (2005), e Petter et al. diretamente algo que o pesquisador espera influenciar o construto
(2007) sugerem que as estimativas de parâmetros estruturais podem focal para ver se isso afeta os escores nas medidas do construto.
ser tendenciosas quando indicadores que deveriam ser modelados
como tendo relações formativas com um construto são modelados Isso é consistente com a visão de Borsboom (2005) de que “um
como tendo relações reflexivas. Por fim, a maioria dos procedimentos teste é válido para medir um atributo [de um construto] se e somente
de desenvolvimento de escalas recomendados na literatura se se a) o atributo existe, e b) variações no atributo produzem variações
aplicam apenas a construtos latentes com indicadores reflexivos e, nos resultados da medida. procedimento de avaliação” (p. 150).
se aplicados a construtos latentes com indicadores formativos , Outra maneira de obter evidências de validade de construto seria
podem comprometer a validade do construto. Por exemplo, a maioria identificar grupos conhecidos por serem altos ou baixos no construto
dos artigos e textos sobre processos de desenvolvimento de escala focal e então comparar as pontuações desses grupos nas medidas
(ver Churchill 1979; DeVellis 1991; Schwab 1980; Spector 1992) do construto focal que você está tentando avaliar. Embora esses
recomendam que os itens que possuem baixas correlações item- dois métodos alternativos de obtenção de evidências de validade de
total sejam retirados de uma escala para aumentar a confiabilidade construto tenham uma longa história de uso em pesquisa
da consistência interna. Embora esta recomendação seja adequada comportamental (ver Cronbach e Meehl 1955), essas técnicas não
no caso de indicadores reflexivos, porque se supõe que todos os são usadas com muita frequência nas literaturas de MIS e
itens são amostrados do mesmo domínio de conteúdo, se esta administração. Portanto, neste artigo vamos discutir essas técnicas
recomendação for seguida para construtos com indicadores subutilizadas e como elas se comparam ao método comumente
formativos, pode resultar na eliminação precisamente dos itens que usado para testar a validade nomológica.
são mais relevantes. provavelmente alterará o significado empírico
e conceitual do construto. Assim, como observado por Bollen e
Lennox (1991), a sabedoria convencional sobre seleção de itens e
desenvolvimento e avaliação de escalas deve ser qualificada pela
Visão geral da escala
consideração da natureza da relação entre os indicadores e o
construto latente que eles pretendem representar. Em uma seção Processo de desenvolvimento
posterior do artigo, discutimos as implicações dessa distinção para
os procedimentos de validação de construto. A Figura 1 fornece uma visão geral das etapas do processo de
desenvolvimento de escala. Conforme mostrado na figura, esse
processo envolve uma série de etapas que começam com a
conceituação do construto (ou reconceituação de um construto
Subutilização de algumas técnicas que são existente) e culminam no desenvolvimento de normas para a escala.
Útil no estabelecimento da validade do construto Cada uma dessas etapas será discutida nas seções a seguir. Em
nossa discussão, tentaremos focar mais nas etapas que não
Depois que um construto foi definido conceitualmente e medidas receberam tanta atenção na literatura. Isso não sugere que as outras
provisórias foram desenvolvidas, um dos próximos passos é testar etapas do processo de validação sejam menos importantes.
se as medidas se comportam como seria de esperar se fossem
válidas. Normalmente, isso é avaliado testando se as medidas do
construto focal se relacionam com medidas de outros construtos na Além disso, é importante ter em mente duas advertências sobre as
rede nomológica especificada pelo pesquisador (Cronbach e Meehl etapas que descrevemos na Figura 1. Primeiro, tentamos encontrar
1955). Embora esta seja certamente uma forma de avaliar a validade um equilíbrio entre a profundidade do tratamento e a amplitude da
das medidas de um construto, a desvantagem dessa técnica é que cobertura. Sem dúvida, há leitores que discordarão das trocas que
ela não pode descartar causas espúrias como explicação para os fizemos, e reconhecemos que pode haver outras técnicas valiosas
achados. que podem ser utilizadas durante algumas das etapas do processo
Por exemplo, vieses metodológicos não podem ser descartados de validação mostrado na Figura 1 que não conhecemos ou optou
como uma explicação potencial, a menos que o pesquisador por excluir. No entanto, sentimos que descrever todas as técnicas
possíveis que podem ser úteis em cada etapa do construto
implemente controles procedimentais ou estatísticos (Podsakoff et al. 2003a).
Da mesma forma, pode haver outras construções de um não

296 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Conceituação Desenvolva um conceito Passo 1


Definição da construção

Gerar itens para


Desenvolvimento de Passo 2
Representar
Medidas a construção

Avalie a validade do conteúdo


dos itens
etapa 3

Especificação modelo Especificar formalmente o


Modelo de medição Passo 4

Avaliação e Colete Dados para Conduzir


Etapa 5
Refinamento da Escala Pré-teste

Purificação de Escala e
Etapa 6
Refinamento

Reúna dados de novos


Validação
Amostra e Reexaminar Etapa 7
Propriedades da escala

Avaliar a validade da escala Etapa 8

Validação cruzada da escala Etapa 9

Elaborar Normas para o


Desenvolvimento de Normas Etapa 10
Escala

Figura 1. Visão geral do procedimento de desenvolvimento de escala

processo de validação prejudicaria nosso objetivo principal de Etapa 1. Desenvolva um Conceitual


delineando um conjunto organizado de atividades que definem prioridades para Definição da construção
o que precisa ser feito no desenvolvimento da escala e
Processo de avaliação. Em segundo lugar, é importante ter em mente De acordo com Nunnally e Bernstein (1994, p. 85),
que pode haver limitações práticas que impedem os pesquisadores
de poder seguir todas as recomendações Na medida em que uma variável é abstrata e latente
discutido neste artigo em um único estudo, seja por uma em vez de concreto e observável (como o
falta de tempo ou recursos, ou ambos. Ainda assim, como notado por classificação em si), é chamado de “construção”. Tal variável
Vince Lombardi, o treinador do Hall da Fama da NFL, perseguindo é literalmente algo que os cientistas “construem”
a perfeição serve a um propósito útil: “A perfeição não é alcançável, (reunidos a partir de suas próprias imaginações) e
mas se perseguirmos a perfeição podemos alcançar a excelência”. que não existe como uma dimensão observável de

MIS Trimestral Vol. 35 nº 2/ junho de 2011 297


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

comportamento... Quase todas as teorias dizem respeito a afirmações Conforme indicado na Tabela 1, a primeira coisa que o pesquisador precisa
sobre construtos e não sobre variáveis específicas e observáveis, fazer é examinar como o constructo focal foi definido em

porque os construtos são mais gerais pesquisas anteriores e para realizar entrevistas com profissionais
do que comportamentos específicos por definição. e/ou especialistas no assunto. O objetivo da revisão da literatura é identificar
usos anteriores do termo, rudimentares ou
A primeira etapa do processo de desenvolvimento e validação da escala definições de dicionários, construções intimamente relacionadas, etc. Sartori
envolve a definição do domínio conceitual do construto. (1984) recomenda que os pesquisadores coletem um conjunto representativo de
Conforme observado por vários autores (Nunnally e Bernstein 1994; definições, extrair suas características e construir matrizes que organizam tais
Schwab 1980; Spector 1992), este estágio de desenvolvimento de escala características de forma significativa. o
não requer apenas a identificação do que é o construto objetivo na realização de entrevistas com profissionais ou especialistas é
pretende representar ou capturar conceitualmente, mas também uma identificar os principais aspectos (ou atributos) do construto
discussão de como o construto difere de outros construtos relacionados. Mais domínio.

especificamente, nesta etapa, o pesquisador


deve especificar a natureza do construto e sua Em seguida, os pesquisadores precisam especificar formalmente a natureza do
tema em termos inequívocos e de forma consistente com pesquisas anteriores construto, incluindo (1) o domínio conceitual para o qual o
(MacKenzie 2003). Cada um desses construção focal pertence e (2) a entidade à qual ela se aplica.
elementos é essencial. É importante nesta fase do processo de desenvolvimento Isso é consistente com Sartori, que argumentou que ao definir
e validação do construto que os investigadores construtos, os pesquisadores devem especificar os fenômenos aos quais
ser o mais claro e conciso possível em sua definição o construto se refere (ou seja, a intenção) e os referentes a
(Churchill 1979; Hinkin 1995). Por exemplo, em sua discussão sobre o qual a construção se aplica (ou seja, a extensão). Por domínio conceitual,
processo de desenvolvimento de escala, Clark e Watson queremos dizer que a definição deve especificar o
(1995, p. 310) afirmam que tipo geral de propriedade a que o construto focal se refere.
Por exemplo, a definição deve especificar se o construto se refere a um
Um primeiro passo crítico é desenvolver um método preciso e pensamento (por exemplo, cognição, valor, intenção,
concepção detalhada do construto alvo e sua norma subjetiva), um sentimento (por exemplo, atitude, emoção, atitude
contexto teórico. Descobrimos que escrever para o compartilhamento de conhecimento), uma percepção (por exemplo, facilidade percebida

uma breve descrição formal do construto é muito de uso da tecnologia, utilidade percebida da tecnologia, percepções de
útil para cristalizar o modelo conceitual de alguém... pensar sobre justiça), uma ação (por exemplo, comportamento, atividade), um resultado
essas questões teóricas antes do (por exemplo, grau de uso, retorno sobre o investimento, preço de uma ação,
processo real de construção em escala aumenta a desempenho), ou uma característica intrínseca (p.
probabilidade de que a escala resultante faça uma contribuição habilidade, estrutura, velocidade, consciência). A importância
substancial para a literatura psicológica. de especificar o tipo geral de propriedade para o qual um constructo
refere foi previamente reconhecido por Schwab (1980), que
Esses pontos são válidos e importantes de serem lembrados. No entanto, argumentou que, ao definir construtos, é importante
mesmo em nossa própria experiência, esta etapa do processo de validação especificar se uma construção representa um
de construto é a que muitas vezes é negligenciada ou tratada
de forma superficial (por exemplo, assumindo que a rotulagem ou propriedade estrutural das organizações, percepções de
nomear a construção é equivalente a defini-la). Isso leva a propriedade (e em caso afirmativo, por quem), ou empregado
para uma quantidade significativa de problemas mais tarde na validação afetar para a propriedade... Muita confusão tem
processo. De fato, como observado por MacKenzie (2003, p. 323), foi criado porque o referente de construção não foi
ficou claro na definição e/ou na mudança
a falha em especificar adequadamente o conceito da definição à medição (pp. 12-13).
significado dos constructos focais de um estudo...
sequência de eventos que prejudica a validade do construto Por entidade queremos dizer o objeto ao qual a propriedade se aplica
(principalmente devido à deficiência de medida), estatística (por exemplo, uma pessoa, uma tarefa, um processo, um relacionamento, uma díade, um

validade de conclusão (devido aos efeitos de viés de grupo/equipe, uma rede, uma organização, uma cultura). Como observado
especificação incorreta do modelo de medição) e, em última por Kozlowski e Klein (2000, p. 27), a falha em especificar
análise, validade interna (devido a uma combinação de a entidade à qual um construto se aplica é um problema comum:
fatores).
Esse problema, observamos, uma vez atormentou a literatura
Por esta razão, vamos detalhar brevemente cada um dos principais climática. Pesquisadores e críticos perguntaram

fatores a ter em mente na conceituação do construto se o clima deveria ser conceituado e medido como um construto
estágio (ver Tabela 1). organizacional (unidade) ou como um

298 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Tabela 1. Resumo dos Fatores a Considerar na Conceituação do Construto


Fator Considerações

Examine como o foco • Revisão da literatura de pesquisas teóricas e empíricas anteriores sobre o construto focal • Revisão da
construção foi literatura sobre o significado de construtos relacionados • Realizar pesquisas preliminares usando
usado em pesquisas abordagem indutiva com especialistas no assunto ou
anteriores ou por profissionais praticantes
Especifique a natureza Identifique o tipo de propriedade que o construto representa e a entidade a que se aplica • Satisfação
do domínio conceitual do no trabalho: Entidade = pessoa; propriedade geral = sentimentos positivos sobre o trabalho • Satisfação
construto do usuário final: Entidade = pessoa; propriedade geral = sentimentos positivos sobre o computador
tecnologia
• Facilidade de uso da tecnologia percebida: Entidade = pessoa; propriedade geral = percepção ou crença sobre o
uso da tecnologia • capacidades de TI: Entidade = organização; propriedade geral = habilidades e competências
de TI • Justiça processual: Entidade = pessoa; propriedade geral = percepção de justiça dos procedimentos •
Ambiguidade de papéis: Entidade = pessoa; propriedade geral = clareza de percepção dos requisitos do papel •
Medo de avanços tecnológicos: Entidade = pessoa; propriedade geral = medo de tecnologia

mudanças
• Desempenho no cargo: Entidade = pessoa; propriedade geral = resultados do
trabalho • Desempenho da empresa: Entidade = organização; propriedade geral = resultados
organizacionais • Capital social: Entidade = organização; propriedade geral = recursos provenientes da rede
relacionamentos

Especifique o tema Descreva os atributos/características necessários e suficientes da forma mais restrita possível • Atributos/
conceitual da construção características comuns
• Atributos/características únicas •
Amplitude/inclusão

Dimensionalidade
• Unidimensional
• Multidimensional

Estabilidade
• Ao longo do tempo

• Em todas as situações
• Entre casos
Defina a construção em • Fornecer definição conceitual clara e concisa do construto • Não deve
termos inequívocos ser sujeito a múltiplas interpretações • Não deve ser excessivamente
técnico (termos técnicos com significados restritos) • Deve definir o construto
positivamente, não pela negação de outras coisas; A negação de uma coisa não implica a afirmação de outra

• Não deve ser circular ou tautológico ou autorreferencial

psicológico (individual). Os pesquisadores do clima importante no estágio inicial da conceituação de um construto.


resolveram essa questão, diferenciando explicitamente Por exemplo, de acordo com Doll e Torkzadeh (1988), a definição
entre um clima de unidade consensual e suas origens de satisfação do usuário final deve se concentrar nos sentimentos
no clima psicológico. No entanto, a questão do nível positivos de uma pessoa (entidade) sobre tecnologia de
[entidade] muitas vezes não é feita em outras pesquisas. computador (propriedade geral); e de acordo com Davis (1989) a
definição de facilidade percebida de uso da tecnologia deve focar
Assim, especificar o tipo geral de propriedade a que se refere o na percepção de uma pessoa (entidade) em relação ao uso da
construto focal e a entidade à qual se aplica é tecnologia da informação (propriedade geral). Em contrapartida, segundo

MIS Trimestral Vol. 35 nº 2/ junho de 2011 299


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Bharadwaj (2000), capacidades de TI é um construto que se refere às quando você não está, ou trabalhando em um assunto pessoal durante
habilidades ou competências de uma empresa (entidade) na área de o horário de trabalho são exemplos de desvio no local de trabalho. É
TI (propriedade geral). por isso que definir um construto apenas em termos de exemplos,
sem articular as características comuns que os unem, é um problema.
Em seguida, o pesquisador precisa esclarecer a intenção do construto
focal, descrevendo seu tema conceitual. O tema conceitual de um
construto consiste no conjunto de atributos/características fundamentais Além disso, ao especificar o tema conceitual de um construto, também
que são necessários e suficientes para que algo seja um exemplar do é importante especificar o quanto se espera que ele seja estável ao
construto. Por exemplo, um submarino pode ser definido como um longo do tempo, em todas as situações e em todos os casos (ver
barco (1) capaz de operar sobre ou abaixo da superfície da água; (2) Chaplin et al. 1988). Por exemplo, espera-se que o construto seja
que pode flutuar; (3) possuir um baú de escape de emergência relativamente estável ao longo do tempo como um traço de
subaquático; e (4) feito de aço. Desses atributos/características, personalidade, ou espera-se que varie ao longo do tempo como um
apenas o primeiro é necessário e suficiente; os outros são necessários estado de humor? Espera-se que o construto se aplique apenas em
mas não suficientes, suficientes mas não necessários, ou nem uma situação particular e não em outras, como autoeficácia em tarefas
necessários nem suficientes, respectivamente. específicas, ou espera-se que seja geralmente aplicável em diferentes
situações, como autoestima generalizada? Espera-se que o construto
seja aplicável apenas a casos específicos, como comportamento
Idealmente, cada atributo/característica especificado no tema militar, ou generalizado em casos como comprometimento organizacional?
conceitual seria comum a todos os exemplares do construto e
possuído de forma única pelos exemplares do construto. Por fim, tudo isso deve ser feito com uma linguagem clara e concisa,
No entanto, isso muitas vezes se mostra difícil de fazer, porque requer que não esteja sujeita a múltiplas interpretações e que não seja
uma clareza de pensamento que pode estar faltando nos estágios
excessivamente técnica. Além disso, é importante que a definição (1)
iniciais do desenvolvimento de um construto devido a ambiguidades
não seja tautológica ou auto-referencial, e (2) descreva o construto
na intenção e/ou extensão do construto. Além disso, Goertz (2006)
positivamente em termos do que ele é (e não exclusivamente pela
argumentou que alguns construtos obedecem a uma “estrutura de
negação de outras coisas, ou em termos de sua antecedentes e/ou
semelhança familiar”, que postula uma série de atributos/características
consequências).
suficientes, mas não necessários.
Consequentemente, o tema conceitual às vezes é expresso
exclusivamente em termos de atributos/características que são
Construir Dimensionalidade
comuns, mas não únicos, ou exclusivamente em termos de atributos/
características que são únicos, mas não comuns.
Uma vez que o construto tenha sido cuidadosamente definido, é
importante dar um passo atrás e avaliar se existem múltiplas
No entanto, o perigo de definir um construto apenas em termos de
subdimensões do construto focal e como elas se relacionam com o
características comuns, ignorando sua singularidade, é que outros
construto focal e entre si. Nesta seção, exploraremos cada uma
pesquisadores podem acreditar falsamente que todas as entidades
que possuem essas características se qualificariam como uma dessas questões.

instância do construto. Isso leva a uma definição excessivamente


ampla do construto. Por exemplo, o comprometimento organizacional A primeira questão é se existem múltiplas subdimensões do construto

pode ser definido como um sentimento positivo sobre a organização, focal, ou, em outras palavras, o construto tem mais de uma faceta,
mas a lealdade organizacional e o envolvimento organizacional aspecto ou subdimensão conceitualmente distinguível? Muitos
também são sentimentos positivos sobre a organização. Para distingui- construtos são definidos como tendo múltiplas e distintas
los, suas características ou atributos únicos também devem ser subdimensões. Por exemplo, a confiabilidade foi definida por Serva et
especificados. Por outro lado, o perigo de definir um construto al. (2005) como tendo três subdimensões distintas (integridade,
exclusivamente em termos de características únicas, independentemente benevolência e habilidade); o desempenho da empresa foi definido
da semelhança, é que outros pesquisadores podem acreditar por Rai et al. (2006) em função da excelência operacional,
falsamente que, a menos que um objeto possua essa característica relacionamento com clientes e crescimento da receita; e Yi e Davis
particular, ele não pode se qualificar como um exemplo do construto. (2003) definiram os processos de aprendizagem observacional como
Por exemplo, se o construto de desvio no local de trabalho fosse tendo várias facetas distintas (atenção, retenção, produção e
simplesmente definido como roubar da empresa, assediar sexualmente motivação). Se um construto é multidimensional, é importante definir
um colega de trabalho e consumir álcool ou drogas no trabalho, outros cada uma das subdimensões com o mesmo cuidado que foi usado no
pesquisadores não teriam como saber se sair do trabalho mais cedo caso do próprio construto focal.
sem permissão, ligar para doente

300 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Para determinar se o construto focal é multidimensional, achamos uma mudança no construto focal a ser associada a uma
útil listar as características essenciais do construto e responder às mudança em apenas uma das subdimensões (mas não nas
seguintes perguntas: outras)?

Se as subdimensões são vistas como características definidoras,


(1) Quão distintas são as características essenciais umas das o construto focal é uma função de suas subdimensões, e uma
outras (além de seu tema comum)? mudança em apenas uma das subdimensões pode estar associada
a uma mudança no construto focal, então as subdimensões são
(2) A eliminação de qualquer um deles restringiria o domínio do mais bem pensados como indicadores formativos do construto
construto de forma significativa ou importante? focal de segunda ordem. Por exemplo, a liderança transformacional
é frequentemente conceituada (veja Avolio et al. 1999; Howell e
Se as características essenciais não possuem aspectos únicos, e Hall-Merenda 1999) como tendo múltiplas subdimensões
a eliminação de qualquer uma delas não restringiria o domínio comportamentais (por exemplo, consideração individualizada,
conceitual do construto, então o construto é unidimensional do influência idealizada, estimulação intelectual, etc.) significa ser um
líder transformacional e determinar o nível de liderança
ponto de vista conceitual. Em contraste, se as características
transformacional de um líder. Estes são vistos como indicadores
essenciais descrevem aspectos relativamente únicos do construto,
formativos, e não como indicadores reflexivos, porque parece
e a eliminação de qualquer um deles restringiria o domínio
razoável que um aumento no nível de comportamento de
conceitual do construto, então o construto é multidimensional do
consideração individualizada de um líder possa estar associado a
ponto de vista conceitual. Por exemplo, Bagozzi et al. (1979)
um aumento de seu nível de liderança transformacional, sem
notaram que uma conceitualização tripartite da atitude de uma
necessariamente estar associado a quaisquer mudanças no
pessoa em relação a um objeto vê a construção focal como sendo
comportamento de estimulação intelectual do líder ou
multidimensional e consistindo de componentes afetivos, cognitivos comportamento de influência idealizado.
e conativos; enquanto uma conceituação unidimensional de atitude
vê esse construto como consistindo apenas de afeto.
Em contraste, se as subdimensões são vistas como manifestações
de um construto focal, o construto focal existe separadamente em
um nível mais profundo e mais embutido do que suas subdimensões,
Se o construto é multidimensional, uma segunda questão conceitual
e uma mudança no construto focal deve produzir uma mudança.
que deve ser considerada é a natureza da relação entre as
em todas as suas subdimensões, então as subdimensões são mais
subdimensões e o construto de ordem superior (mais geral). bem pensadas como refletindo a construção focal de segunda
Conforme observado por Edwards (2001), ordem. Por exemplo, a tendência geral de um líder de exibir um
comportamento de recompensa contingente em relação a seus
As relações entre um construto multidimensional e suas subordinados pode ser medida pedindo aos subordinados de um
[sub-]dimensões não são forças causais que ligam líder que respondam em vários momentos diferentes aos seguintes
entidades conceituais separadas, mas representam tipos de itens: “meu supervisor fornece feedback positivo quando
associações entre um conceito geral e as [sub-]dimensões eu fazer bem meu trabalho”, “meu supervisor me elogia quando
que representam ou constituem o construto (p. 146). meu trabalho é especialmente bom”, e assim por diante. As
respostas a esses itens são indicadores reflexivos da tendência do
líder de exibir essa forma de comportamento em um determinado
Ao tomar a decisão sobre como as subdimensões se relacionam momento, e as tendências do líder nesses momentos específicos
com o construto focal mais geral, vários autores (Bollen e Lennox refletem sua tendência geral de exibir essa forma de
1991; Jarvis et al. 2003; Wong et al. 2008) notaram que é útil comportamento. . Mais geralmente, um modelo de medição de
perguntar segunda ordem com múltiplas subdimensões de primeira ordem
como indicadores reflexivos pode ser apropriado quando um
(1) As subdimensões são vistas como manifestações do construto pesquisador (1) está interessado em medir um construto focal
focal ou como características definidoras dele? estável (por exemplo, uma variável de diferença individual) ao
longo do tempo ou entre situações , ou (2) tem vários lotes de itens
(2) O construto focal existe separadamente em um nível mais selecionados aleatoriamente, cada um dos quais reflete um
profundo e mais embutido do que suas subdimensões, ou o construto focal. Observe, no entanto, que este último procedimento
construto focal é uma função de suas subdimensões? não está isento de limitações (ver Bandalos 2002), como discutiremos mais adiant

(3) Uma mudança no construto focal estaria associada a mudanças Para construtos com múltiplas subdimensões como indicadores
em todas as subdimensões, ou é possível que formativos, uma terceira questão que precisa ser considerada é como

MIS Trimestral Vol. 35 nº 2/ junho de 2011 301


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

as subdimensões se combinam para formar a construção focal. Em condições necessárias é uma [subdimensão]: a cola
todos esses modelos, o construto focal é função das subdimensões estrutural que une as [subdimensões] para formar o nível
que o definem em conjunto. A questão é: que tipo de função? É básico é a matemática das condições necessárias e
aditiva ou multiplicativa? suficientes.
Goertz (2006) argumenta que “os conceitos têm teorias causais
embutidas neles” (p. 12) no sentido de que “os atributos centrais de Por exemplo, por mais de 50 anos, os cientistas sociais conceituaram
um conceito constituem uma teoria da ontologia do fenômeno em a credibilidade da fonte como exigindo tanto conhecimento quanto
consideração”. (pág. 27). Para ele, uma parte essencial da confiabilidade (Hovland et al. 1953). Isso implica que uma fonte deve
conceituação de um construto é a especificação da maneira pela ter algum nível mínimo de ambos os atributos para possuir
qual as subdimensões se combinam para dar significado ao construto. credibilidade. Em outras palavras, uma fonte que possui expertise,
mas que não é confiável, não é crível. Da mesma forma, uma fonte
que é confiável, mas não tem experiência, também não é credível.
Para alguns construtos, as subdimensões se combinam de forma Assim, quando um construto é composto por vários atributos
compensatória para produzir o significado do construto focal de tal necessários, o construto deve ser visto como sendo formado pela
forma que o efeito de cada subdimensão no construto focal seja interação entre esses atributos, e deve ser modelado de forma
independente dos efeitos das outras subdimensões. Implicitamente, consistente com essa lógica. É importante notar que, conceitualmente,
essa estrutura sugere que uma mudança em cada subdimensão a credibilidade da fonte não é um construto distinto causado por
individual é suficiente (mas não necessária) para produzir uma confiabilidade e experiência; em vez disso, é definido como sendo o
mudança no significado do construto focal. Essa estrutura pode ser produto de confiabilidade e experiência. Outro exemplo de um
apropriada para um construto como desempenho no trabalho (por construto em que múltiplas e distintas subdimensões interagem para
exemplo, Rotundo e Sackett 2001), se alguém levantar a hipótese formar um construto focal pode ser a força de Vroom (1964) para
de que cada uma de suas subdimensões (desempenho da tarefa, realizar um construto de ato (que é visto como a valência do resultado
comportamento de cidadania organizacional e comportamentos de vezes a força da expectativa de que um determinado ato será
desvio no local de trabalho) contribuem para mudanças no seguido pela obtenção desse resultado). Embora não tenhamos
desempenho no trabalho, a magnitude do efeito de cada subdimensão conhecimento de nenhum exemplo específico do uso dessa estrutura
não está relacionada aos efeitos de qualquer uma das outras multiplicativa para um modelo de medição, acreditamos que esse
subdimensões, e as subdimensões são substituíveis no sentido de tipo de modelo de medição é apropriado para alguns construtos e
que uma pode compensar a outra. Nesse tipo de modelo, as deve ser explorado em pesquisas futuras.
subdimensões são somadas para formar o construto focal. Por
exemplo, um funcionário pode aumentar seu desempenho no trabalho
aumentando o desempenho da tarefa ou aumentando o
comportamento de cidadania organizacional ou diminuindo o Construções não são inerentemente formativas ou
comportamento de desvio no local de trabalho. Conceitualmente, reflexivas
isso significa que o construto focal representa a união de suas
subdimensões. É importante notar que os termos formativo e reflexivo descrevem a
relação entre um indicador e o construto latente ao qual ele está
No entanto, este modelo não é adequado para todos os construtos. associado. Os construtos não são inerentemente formativos ou
Para alguns construtos, as subdimensões representam atributos/ reflexivos por natureza, e a maioria pode ser modelada como tendo
características que são necessárias e conjuntamente suficientes indicadores formativos ou reflexivos, dependendo das expectativas
para o significado do construto. Essa estrutura conceitual sugere que teóricas do pesquisador sobre como eles devem se relacionar com
o construto focal representa a interseção da subdimensão 1 e base na definição conceitual do construto. Por exemplo, a satisfação
subdimensão 2 e subdimensão 3, etc. Na prática, esse tipo de no trabalho foi conceituada tanto como um construto unidimensional
estrutura pode ser representado por uma interação multiplicativa (Cammann et al. 1983) quanto um construto multidimensional com
entre as subdimensões. Isso é consistente com Goertz (2006, p. 7), várias facetas distintas (Smith et al. 1969). No primeiro caso, a
que observou que esse tipo de modelo satisfação no trabalho é medida com três indicadores reflexivos;
enquanto no segundo caso, a satisfação no trabalho tem vários
indicadores formativos, cada um dos quais representa uma das
remonta a Aristóteles e constrói conceitos usando a facetas (por exemplo, Law e Wong 1999). O ponto chave é que a
estrutura de condições necessárias e suficientes. Na lógica forma como o construto e os indicadores estão ligados depende do
filosófica clássica, definir um conceito é dar as condições conteúdo do indicador e de como o construto é conceituado pelo
necessárias e suficientes para que algo se encaixe na pesquisador. Isso é consistente com
categoria. Cada um desses

302 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Borsboom (2005), que argumentou que mesmo um construto como modelos (SEMs) por psicólogos. Não foi possível
status socioeconômico (SES), que é frequentemente usado como relacionar tais eventos e estados mentais de perto com
exemplo prototípico de um construto com indicadores formativos, processos físicos no cérebro ou fazer afirmações sobre
pode ser medido com indicadores reflexivos: como os eventos ou estados mentais funcionam no
sentido físico. De fato, é uma questão em aberto se isso
Pode-se também imaginar que poderia haver será possível, se assumirmos que há algo mais nas
procedimentos para medir construtos como SES atitudes, intenções e assim por diante do que o disparo
reflexivamente – por exemplo, por meio de uma série de de neurônios e outros processos físicos (Bagozzi 2007,
perguntas como “o quão alto você está na escala social?” p. 230).
Assim, o fato de atributos [construtos] como SES serem
tipicamente abordados com modelos formativos não Agora, à afirmação de que a relação entre uma variável
significa que eles não possam ser avaliados reflexivamente (p. 169). latente e suas variáveis manifestas ou medidas é
causal... Parece-me que a relação em questão não é
causal, per se, mas sim de mensuração hipotética. Ou
Problemas Ontológicos seja, a relação é entre um conceito abstrato, não
observado, e uma medida concreta, observada,
Um último ponto a ser destacado é que os modelos de mensuração hipotetizada para medir o conceito; a relação é parte
formativa e reflexiva possuem diferentes pressupostos ontológicos lógica, parte empírica e parte teórica (conceitual), com a
que raramente têm sido discutidos na literatura, mas, no entanto, carga fatorial inferida representando, por si só, apenas
têm implicações importantes. Como observado por Borsboom parte do significado empírico da relação (Bagozzi 2010,
(2005, p. 63), a teoria da variável latente é ontologicamente p. 210).
ambígua dependendo se um modelo de indicador reflexivo ou
formativo é assumido: “a interpretação realista de uma variável
latente implica um modelo reflexivo, enquanto construtivista, Em contraste, os modelos de medição com indicadores formativos
operacionalista, ou interpretações instrumentalistas são mais não precisam assumir que o construto latente composto é uma
compatíveis com um modelo formativo”. entidade real. Normalmente, os construtos com indicadores
formativos são vistos como construções teóricas (em vez de
Vários autores (por exemplo, Borsboom 2005; Howell et al. 2007b) entidades reais) que resumem (e, portanto, dependem) das
raciocinaram que modelos de medição com indicadores reflexivos respostas das pessoas aos itens usados para representar o
implicam que o construto latente (1) é uma entidade real que existe construto. Este ponto foi bem articulado por Borsboom (2005, p.
independentemente de uma pessoa e da maneira como ela 62), que observou que
encontra sobre isso, e (2) causa a variação observada nas
respostas aos itens usados para medi-la. Embora acreditemos que As variáveis latentes do tipo formativo não são
uma interpretação realista seja razoável para muitos construtos conceituadas como determinantes de nossas medidas,
representados por modelos de medição de indicadores reflexivos, mas como um resumo dessas medidas. Essas medidas
suspeitamos que alguns pesquisadores relutariam em endossar podem muito bem ser consideradas determinadas por
essa interpretação estrita no caso de fatores latentes “descobertos” uma série de variáveis latentes subjacentes (o que daria
por meio de análise fatorial exploratória, e talvez no caso de certos origem ao modelo espúrio com múltiplas causas comuns
tipos de construções psicológicas. Por exemplo, Bagozzi questionou de Edwards e Bagozzi 2000), mas não somos forçados
recentemente essas duas suposições amplamente aceitas (ou de forma alguma a fazer tal suposição. Agora, se
seja, a suposição de que um construto latente deve sempre quiséssemos saber como ponderar a importância relativa
representar uma entidade real e independente da mente, e a de cada uma das medidas que compõem o SES na
suposição de que causa as respostas de uma pessoa às suas previsão, digamos, da saúde, poderíamos usar um
medidas): modelo formativo... Nesse modelo, também poderíamos
testar se o SES atua como um variável única na previsão
Uma concepção estritamente realista de variáveis de saúde. De fato, esse valor preditivo seria a principal
latentes torna-se menos sustentável quando consideramos motivação para conceituar o SES como uma única
conceitos abstratos ou teóricos como atitudes, atribuições, variável latente. No entanto, em nenhum lugar neste
crenças, desejos, emoções, objetivos, intenções, desenvolvimento fomos forçados a admitir que o SES
motivação e traços de personalidade. Esses eventos e existe independente de nossas medidas... O modelo
estados mentais são amplamente estudados e formativo, portanto, não requer necessariamente uma
provavelmente constituem a maioria das aplicações da equação estrutural.
interpretação realista do latente.

MIS Trimestral Vol. 35 nº 2/ junho de 2011 303


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

variável que ele invoca. De fato, se fosse dada uma Além disso, existem várias outras considerações sobre os itens que
interpretação realista, seria natural conceituá-la como um devem ser levados em consideração nesta etapa do processo de
modelo espúrio com múltiplas causas comuns no sentido desenvolvimento da escala. Uma consideração diz respeito à maneira
de Edwards e Bagozzi (2000). Isso introduziria novamente como os itens são escritos (Peterson 2000; Podsakoff et al. 2003a;
uma parte reflexiva do modelo no modelo, que corresponderia Spector 1992; Torangeau et al. 2000).
àquela parte do modelo que tem uma interpretação realista. De um modo geral, cada item deve ser escrito de forma que sua
redação seja o mais simples e precisa possível. Itens de duplo sentido
(por exemplo, “Oradores confiáveis possuem experiência e são
confiáveis”) devem ser divididos em duas declarações de ideia única
e, se isso for impossível, o item deve ser eliminado completamente.
Etapa 2: gerar itens para Os itens que contêm termos ambíguos ou desconhecidos devem ser
Represente a construção esclarecidos, e os itens que possuem sintaxe complicada devem ser
simplificados e tornados mais específicos e concisos.
Uma vez que o construto focal tenha sido definido conceitualmente, o Finalmente, esforços também devem ser feitos para refinar ou remover
próximo passo no processo é gerar um conjunto de itens que itens que contenham desejo social óbvio (ver Nederhof 1985).
represente totalmente o domínio conceitual do construto. Esses itens
podem vir de uma variedade de fontes (ver Churchill 1979; Haynes et
al. 1995; Nunnally e Bernstein 1994), incluindo revisões da literatura, Etapa 3: avaliar o conteúdo
dedução da definição teórica do construto, pesquisas teóricas e Validade dos itens
empíricas anteriores sobre o construto focal , sugestões de especialistas
na área, entrevistas ou discussões de grupos focais com representantes Uma vez que os itens tenham sido gerados para representar o
da(s) população(ões) para a qual se espera que o construto focal se construto focal, eles devem ser avaliados quanto à sua validade de conteúdo.
generalize e um exame de outras medidas do construto já existentes. De acordo com Straub e cols. (2004, p. 424), a validade de conteúdo
diz respeito “ao grau em que os itens de um instrumento refletem o
universo de conteúdo para o qual o instrumento será generalizado”.
Da mesma forma, Kerlinger (1973, p. 459), define validade de conteúdo
Independentemente de o construto focal ser unidimensional ou como “a 'representatividade' ou 'adequação da amostragem' do
multidimensional, o objetivo final do processo de geração de itens é conteúdo – a substância, a matéria, os tópicos – de um instrumento
produzir um conjunto de itens que capture totalmente todos os aspectos de medição”. Assim, dois julgamentos relacionados devem ser feitos
essenciais do domínio do construto focal, minimizando a extensão em ao avaliar a validade de conteúdo:
que os itens explorar conceitos fora do domínio da construção focal.
Para construtos multidimensionais, isso significaria desenvolver um (1) O item individual é representativo de um aspecto do domínio de
conjunto de itens para cada subdimensão individual, além de garantir conteúdo do construto?
que as subdimensões incluam todos os aspectos essenciais da
definição do construto focal. É importante ressaltar que isso é verdade (2) Os itens como um conjunto representam coletivamente todo o
independentemente de como as subdimensões se relacionam com o domínio de conteúdo do construto?
construto focal (ou seja, como indicadores formativos ou reflexivos).
Em ambos os casos, o objetivo final na geração do conjunto inicial de Embora haja uma variedade de métodos desenvolvidos para avaliar a
itens é o mesmo. Com efeito, como assinalam Diamantopoulos e adequação do conteúdo de novas medidas (Anderson e Gerbing 1991;
Sigauw (2006, p. 267), Hinkin e Tracey 1999; Lawshe 1975; Schriesheim et al. 1999;
Schriesheim et al. 1993), recomendamos o procedimento sugerido por
Hinkin e Tracey (1999) como ilustrado por Yao et al. (2008). Até onde
Em suma, de acordo com a literatura existente, parece não sabemos, essa técnica não foi utilizada na literatura de MIS. Nesse
haver nenhuma razão convincente para que o conjunto procedimento, o pesquisador constrói uma matriz na qual as definições
inicial de itens difira puramente por causa da escolha da de diferentes aspectos do domínio do construto são listadas no topo
perspectiva de medição. Assumindo que as diretrizes da das colunas e os itens são listados nas linhas (ver Tabela 2). Em
literatura sobre abrangência e inclusão sejam seguidas seguida, os avaliadores são solicitados a avaliar até que ponto cada
diligentemente [por exemplo, Bollen e Lennox 1991; De item captura cada aspecto do domínio do construto usando uma escala
Vellis 1991; Diamantopoulos e Winklhofer 2001; Spector do tipo Likert de cinco pontos, variando de 1 (nada) a 5 (completamente).
1992], não se espera que a geração de itens sob cada Esta informação na Tabela 2 pode ser transposta para produzir uma
perspectiva resulte em pools de itens amplamente matriz
divergentes.

304 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Tabela 2. Exemplo hipotético de tarefa de classificação de itens para avaliar a adequação do conteúdo

Número do avaliador = 001 A capacidade da outra parte de Integridade é a percepção


A benevolência é o grau realizar uma tarefa importante de um trustor de que o
em que o credor acredita ao credor, onde a capacidade é trustee segue valores aceitáveis,
que o síndico tem boa vontade o conjunto de habilidades ou atributos que pode incluir problemas
ou intenções positivas para que permitem ao síndico como consistência,
o confiador (Serva et al. têm influência (Serva et al. honestidade e justiça (Serva
Itens da Escala de Confiabilidade† 2005, pág. 630). 2005, págs. 629-630). et ai. 2005, pág. 630).
1. A equipe de gerenciamento realmente olhou
para o que era importante para o nosso 421
equipe de desenvolvimento.

2. Nossa equipe de desenvolvimento sentiu que o


equipe de gestão foi muito capaz 152
de realizar seu trabalho.
3. Nossa equipe de desenvolvimento acreditava que
a equipe de gestão tentou ser justa 115
no trato com os outros.
4. As necessidades da nossa equipe de desenvolvimento e

desejos eram muito importantes para o 512


time de gerenciamento.
5. Nossa equipe de desenvolvimento tinha
confiança nas habilidades do 152
time de gerenciamento.
6. A equipe de gestão tinha um forte 214
senso de justiça.
7. A equipe de gestão saiu do seu 522
maneira de ajudar nossa equipe de desenvolvimento.

8. Nossa equipe de desenvolvimento acreditava que


a equipe de gestão foi bem 151
qualificado.

9. Nossa equipe de desenvolvimento gostou do


215
valores da equipe de gestão.
† Os itens de confiabilidade utilizados para fins ilustrativos foram retirados de Serva et al. (2005).

Tabela 3. Exemplo de uma matriz de dados para pontuações de adequação de conteúdo

Avaliador Aspectos de
Número Confiabilidade Item #1 Item #2 Item #3 Item #4 Item #5 Item #6 Item #7 Item #8 Item #9
001 Benevolência 411512512
Habilidade 251151251
Integridade 1 2 5 2 2 4 2 1 5
002 Benevolência 521521511
Habilidade 151141152
Integridade 1 1 5 1 2 5 2 1 4
n... Benevolência
Habilidade

Integridade

MIS Trimestral Vol. 35 nº 2/ junho de 2011 305


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

de dados de classificações semelhantes ao mostrado na Tabela 3. Quarto, também é importante evitar sobrecarregar os avaliadores.
Nessa tabela, cada caso consiste em várias linhas de dados (uma Com base em evidências de pesquisas de julgamento psicofísico,
para cada aspecto do domínio do construto). A primeira linha de Schreisheim et al. (1993) sugerem que os avaliadores podem
cada caso consiste nas avaliações do avaliador de cada um dos distinguir de forma confiável entre um máximo de apenas oito a dez
itens no primeiro aspecto do domínio do construto (ou seja, aspectos do domínio de conteúdo por vez. No entanto, mesmo isso
benevolência), a segunda linha contém as avaliações do avaliador pode ser demais quando o número de itens também é grande.
de cada um dos itens no segundo aspecto do domínio do construto Nesses casos, pode ser necessário que os avaliadores avaliem
(ou seja, habilidade), e assim por diante. Uma ANOVA de medidas apenas um subconjunto dos itens para reduzir os encargos gerais da tarefa.
repetidas unidirecionais é então usada para avaliar se a classificação
média de um item em um aspecto do domínio do construto difere de Quinto, o procedimento descrito acima pode ser usado não apenas
suas classificações em outros aspectos do domínio do construto. para determinar se os itens capturam o construto hipotético, mas
Assumindo que a estatística F é significativa, um contraste planejado também se eles capturam construtos não intencionais (ou seja, se
é realizado para testar se a média da classificação para o item no os itens estão contaminados). Isso pode ser feito incluindo definições
aspecto hipotético do domínio do construto é maior do que a de outros construtos nos títulos das colunas da Tabela 2 e pedindo
classificação média para este item em todos os outros aspectos do domínioaos
do construto . que avaliem até que ponto os itens representam
avaliadores
esses outros construtos.
Ao usar a técnica descrita acima, é importante manter várias coisas De fato, como observado por Schreisheim et al. (1993, p. 406), ao
em mente. Primeiro, porque cada avaliador faz várias avaliações construir novas escalas,
para cada item, é essencial usar uma ANOVA de medidas repetidas
unidirecionais, para que seja feito um ajuste no termo de erro (ver o desenvolvedor pode ser aconselhado a empregar não
Winer 1971, p. 270). Só seria apropriado usar uma ANOVA apenas as categorias e definições das escalas ou
unidirecional entre sujeitos para analisar os dados se as classificações subescalas que estão sendo desenvolvidas, mas também
de cada item em cada aspecto do domínio do construto fossem aquelas de construtos relacionados ou de construtos que
fornecidas por avaliadores diferentes. As desvantagens de uma
foram fontes problemáticas de confusão de conteúdo no
abordagem entre sujeitos é que ela exigiria substancialmente mais
passado... O uso dessas categorias de conteúdo adicionais
sujeitos e o teste das diferenças de classificação do item entre os
devem ajudar a garantir que quaisquer novas medidas
aspectos do domínio do construto seria menos poderoso porque as
desenvolvidas tenham conteúdo de item livre de itens de
diferenças individuais entre os avaliadores seriam agrupadas no domínios problemáticos e/ou estranhos.
termo de erro.

Em segundo lugar, é importante lembrar que a eficácia de qualquer


Finalmente, é importante reconhecer que esta técnica não faz
técnica de avaliação de adequação de conteúdo é tão boa quanto as
suposições implícitas sobre a direção da relação entre os itens e
definições do construto (e dos itens) que são desenvolvidas pelo
seus fatores correspondentes ou sobre as correlações entre os
pesquisador em primeiro lugar. Assim, como observamos
próprios itens.
anteriormente, boas definições de construto são um elemento crítico
Por isso, pode ser usado para avaliar a validade de conteúdo de
do processo de validação de construto.
indicadores formativos ou reflexivos. Esta é uma vantagem chave
desta técnica em relação à abordagem do método Q para avaliação
Terceiro, ao selecionar pessoas para atuar como avaliadores, é
de conteúdo discutida por Schriesheim et al. (1993), e é
importante certificar-se de que eles tenham capacidade intelectual
particularmente importante porque Petter et al. (2007) notaram que
suficiente para avaliar a correspondência entre os itens e as
a falta de validade de conteúdo é um problema particularmente sério
definições teóricas. Anderson e Gerbing (1991) argumentaram que,
para construtos com indicadores formativos.
além disso, também é importante que os avaliadores sejam
representantes da principal população de interesse; enquanto
Schriesheim et al. (1993) e Hinkin e Tracey (1999) não consideram
que esta seja uma questão crítica e que os estudantes universitários Etapa 4: Especifique formalmente o
possam ser utilizados para esta tarefa. Em princípio, tendemos a Modelo de medição
concordar com a posição de Anderson e Gerbing, pois acreditamos
ser importante desenvolver itens que sejam conceitualmente Uma vez que um conjunto de itens válidos de conteúdo tenha sido
compreendidos pela população de interesse. No entanto, gerado, o próximo passo é especificar formalmente um modelo de
reconhecemos que, em muitos casos, os estudantes universitários medição que capture as relações esperadas entre os indicadores e
podem ser representativos da população para a qual se deseja generalizar. o construto focal e/ou subdimensão a que se destinam.

306 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

represent.4 Isso é complicado pela necessidade de definir a escala pontos, se o procedimento descrito na etapa 1 do nosso processo
de medição e garantir que os parâmetros do modelo sejam todos de desenvolvimento de escala foi seguido, pode haver casos em
identificados. A escala de medição para um construto de primeira que alguém pode estar disposto a assumir que todas as
ordem com vários indicadores reflexivos ou formativos pode ser subdimensões essenciais dos construtos estão representadas e as
definida (1) fixando um caminho entre o construto latente e um de subdimensões influenciam independentemente o construção latente
seus indicadores em algum valor diferente de zero ou (2) fixando a composta. Nessas circunstâncias, pode fazer sentido fixar o termo
variância do construto em algum valor diferente de zero (Bollen de erro associado ao construto latente composto de segunda ordem
1989; MacCallum e Browne 1993). Em ambos os casos, o valor em zero. Com efeito, como assinala Diamantopoulos (2006, p. 11),
diferente de zero é geralmente 1,0 para auxiliar na interpretação.
Qualquer uma dessas duas soluções é aceitável. Também é
necessário definir a escala de medição para um construto de Será lembrado da discussão anterior que o termo de erro
segunda ordem com múltiplas subdimensões de primeira ordem em um modelo de medição formativo representa o
reflexivas ou formativas como indicadores. Isso pode ser feito (1) impacto de todas as causas restantes além daquelas
fixando um caminho entre a construção de segunda ordem e uma representadas pelos indicadores incluídos no modelo...
de suas subdimensões em algum valor diferente de zero (geralmente Dada essa interpretação do termo de erro, torna-se
1,0) ou (2) fixando a variância da construção de segunda ordem em evidente que ele seria legítimo definir ÿ = 0 desde que
algum valor diferente de zero (novamente, geralmente 1,0). Mais todas as causas possíveis no construto fossem incluídas
uma vez, qualquer uma dessas soluções é aceitável. A vantagem como indicadores no modelo. Isso não é tão absurdo
de fixar o caminho em 1,0 é que ajuda na interpretação, fazendo quanto pode parecer inicialmente. Considere, por
com que a escala de medição para o construto de segunda ordem exemplo, a medida de covisualização de televisão de
seja a mesma de uma de suas subdimensões. A vantagem de fixar Carlson e Grossbart (1988), que indica a frequência de
a variância em 1,0 é que ajuda na interpretação padronizando o construto. assistir televisão com os filhos (1 – “muito raramente” 5
– “muito frequentemente”). Essa medida contém três
Uma segunda questão importante que dificulta a especificação de itens (dias da semana, sábados e domingos,
construtos com indicadores formativos é que, dependendo da respectivamente) que esgotam coletivamente todas as
estrutura do modelo, nem sempre é possível identificar o termo de possibilidades de assistir televisão em uma semana. Se
erro em nível de construto (Bollen e Davis 2009; MacCallum e fôssemos aplicar o modelo... a essa medida, então ÿ teria
Browne 1993). Em casos raros, pode ser apropriado resolver essa que ser definido como zero, pois nenhuma ocasião
indeterminação fixando o termo de erro em nível de construção (ÿ) adicional poderia ser especificada para capturar o
em zero. Por exemplo, no caso de um construto “exógeno” de comportamento de covisualização. Assim, em alguns
segunda ordem com múltiplas subdimensões de primeira ordem casos, a melhor forma de lidar com o termo de erro seria
como indicadores formativos e com vários indicadores reflexivos de simplesmente excluí-lo do modelo.
cada subdimensão de primeira ordem, pode ser apropriado corrigir
o termo de erro associado com o construto latente de segunda No entanto, um termo de erro é necessário sempre que o construto
ordem em zero, desde que se tenha certeza de que (1) os latente composto está na posição endógena, ou quando os
indicadores de primeira ordem do construto latente composto de indicadores formativos não representam totalmente o domínio do
segunda ordem estão livres de erro de medição, (2) todas as construto, como é frequentemente o caso. O último pode ocorrer
subdimensões essenciais do construtos de segunda ordem são quando os indicadores formativos consistem em vários determinantes
representados e (3) as subdimensões não interagem entre si. Com suficientes do construto latente composto (Goertz 2006), mas
relação ao primeiro ponto, neste tipo de modelo pode ser razoável existem outros determinantes conceitualmente apropriados do
supor que os indicadores de primeira ordem estão livres de erro de construto latente composto que não estão incluídos no conjunto de indicadores.
medição, uma vez que o erro de medição aleatório foi parcialmente Bollen e Davis (2009, p. 503) mostraram que para que o termo de
excluído desses indicadores. Em relação ao segundo e terceiro erro em nível de construção seja identificado, “toda variável latente
com variância irrestrita (ou variância de erro) deve emitir pelo
menos dois caminhos direcionados para variáveis quando estas
últimas variáveis têm variâncias de erro irrestritas.” Praticamente
4
Observe que nossa discussão aqui se concentra no uso de SEM baseado em covariância falando, esta condição é satisfeita se o construto latente emite
técnicas em vez de técnicas baseadas em componentes para especificar e testar modelos caminhos para (1) pelo menos dois indicadores reflexivos
de medição (para uma discussão sobre os méritos de cada abordagem, ver Diamantopoulos teoricamente apropriados, (2) pelo menos dois outros construtos
2011). Além disso, nossa discussão não se aplica a construções multidimensionais que
latentes com indicadores reflexivos, ou (3) um indicador reflexivo e
são especificadas como “perfis” ou combinações discretas de vários níveis de suas
pelo menos um outro construto latente com indicadores reflexivos.
dimensões (para uma discussão mais extensa de modelos de perfis multidimensionais, ver
Law et al. 1998). No entanto, porque satisfazer este requisito é necessário, mas não

MIS Trimestral Vol. 35 nº 2/ junho de 2011 307


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

suficiente para identificação, condições adicionais também devem selecionados para refletir a definição conceitual de satisfação no
ser atendidas (por exemplo, satisfazer a regra de escala, a regra t e trabalho, e é difícil imaginar que esses indicadores (“No geral, estou
certas restrições nas covariâncias de erro).5 muito satisfeito com meu trabalho” e “De um modo geral, estou
satisfeito com todas as facetas do meu trabalho”) reflitam diferentes
Sempre recomendamos (ver Jarvis et al. 2003; MacKenzie et al. estruturas. Da mesma forma, se todas as medidas forem
2005) que os pesquisadores resolvam esse problema de identificação operacionalizações válidas de conteúdo do mesmo construto focal,
incluindo dois indicadores reflexivos globais do construto latente não achamos que seja desejável interpretar a estrutura MIMIC como
composto, juntamente com os indicadores formativos. Por exemplo, é mostrada no Painel B. Neste painel, o modelo é interpretado como
consistente com as conceituações multidimensionais de satisfação se houvesse São quatro construtos conceitualmente distintos
no trabalho (Law e Wong 1999; Smith et al. 1969; Spector 1997), representados: cada um dos construtos antecedentes é visto como
vamos supor que a satisfação no trabalho é definida como uma tendo um único indicador reflexivo, o construto consequência tem
construção latente composta composta de três facetas (por exemplo, dois indicadores reflexivos e os construtos antecedentes causam o
satisfação salarial, satisfação no trabalho e satisfação com a construto consequência. Esta interpretação da estrutura MIMIC é a
promoção) e essas três facetas foram medidas com os seguintes preferida por Wilcox et al. (2008, pág. 1226).
itens: “Estou muito satisfeito com meu salário” No entanto, de nossa perspectiva, essa interpretação é indesejável
(X1), “Estou muito satisfeito com a natureza do meu trabalho” (X2) e porque (1) ignora a natureza multidimensional do construto
“Estou muito satisfeito com minhas oportunidades de promoção”
superordenado e requer uma mudança na definição conceitual do
(X3), respectivamente. Nesse caso, o problema de identificação
construto, e (2) trata as subdimensões do construto superordenado
poderia ser resolvido adicionando dois indicadores reflexivos com como causas distintas que são
termos de erro não correlacionados ao modelo de medição: “No
não é diferente conceitualmente de quaisquer outras causas do
geral, estou muito satisfeito com meu trabalho” (Y1) e “De um modo
construto superordenado (por exemplo, de uma perspectiva
geral, estou satisfeito com todas as facetas do meu trabalho” (Y2). A
conceitual, a satisfação salarial não é vista como sendo mais
adição desses dois indicadores reflexivos produz o que Jöreskog e
intimamente relacionada ou parte da satisfação no trabalho do que a
Golberger (1975) chamaram de estrutura de modelo MIMIC
ambiguidade de papéis, conflito de papéis, etc.) . Em vez disso,
(indicadores múltiplos, causas múltiplas).
acreditamos que faz mais sentido interpretar toda essa estrutura
como um modelo de medição para um único construto latente, como
Se a natureza conceitual dos indicadores for ignorada, existem
mostrado no Painel C, porque cada uma das medidas, seja formativa
várias maneiras de interpretar essa estrutura. Uma maneira é como
ou reflexiva, é uma operacionalização válida de conteúdo do mesmo
um construto latente composto (com indicadores formativos) que
foco multidimensional. construir.
causa dois outros construtos conceitualmente distintos (Figura 2,
Painel A). Outra maneira pela qual essa estrutura pode ser
Conforme observado por Jarvis, et al. (2003), existem várias
interpretada é como um construto latente medido reflexivamente que
vantagens importantes para resolver o problema de identificação
é causado por vários construtos antecedentes conceitualmente
adicionando pelo menos dois indicadores reflexivos do construto
distintos (Figura 2, Painel B). Finalmente, essa estrutura pode ser
interpretada como um único construto latente com uma mistura de latente composto (como mostrado na Figura 2, Painel C). Primeiro,

indicadores formativos e reflexivos (Figura 2, Painel C). É importante ele pode ser usado independentemente de o construto focal estar

notar que todas essas três interpretações são empiricamente em uma posição endógena ou exógena, ou mesmo sozinho. Os
indistinguíveis porque produzem matrizes de covariância preditas idênticas. outros métodos para alcançar a identificação (por exemplo, emitir
caminhos para pelo menos dois outros construtos latentes com

No entanto, se for considerada a natureza conceitual dos indicadores, indicadores reflexivos ou emitir caminhos para um indicador reflexivo
nem todas essas interpretações são igualmente plausíveis. Por e pelo menos um outro construto latente com indicadores reflexivos)
exigem que o construto focal cause pelo menos um outro construção latente no
exemplo, não faz sentido interpretar a estrutura MIMIC como é
mostrada no Painel A porque neste painel os dois indicadores modelo. Isso pode não ser conceitualmente apropriado ou desejável
reflexivos (Y1 e Y2) são tratados como se fossem indicadores de em alguns casos. Em segundo lugar, ao contrário dos outros dois

dois construtos diferentes. No caso em questão, isso não faz sentido métodos, adicionar dois indicadores reflexivos do construto focal
porque ambos os indicadores foram permite que ele seja incluído junto com outros construtos em um
modelo de fator confirmatório que poderia ser usado para avaliar
suas propriedades de medida e validade discriminante (ver Anderson
5
Embora Bollen e Davis (2009) tenham notado que “não existe nenhuma condição e Gerbing 1988).
abrangente de identificação necessária e suficiente para modelos de equações
estruturais com variáveis latentes” (p. 501), sua “Regra do X Exógeno” fornece um
Terceiro, Jarvis et al. (2003, p. 213) notaram que este procedimento
conjunto útil de informações suficientes (mas não necessárias) ) condições de
identificação para modelos de indicadores formativos com estruturas do tipo MIMIC. diminui a probabilidade de confusão interpretativa

308 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Painel A Painel B Painel C

Y1 Y2 Y1 Y2 Y1 Y2

Consequência 1 Consequência 2
Consequência Construção focal

Antecedente
Antecedente 1 Antecedente 2 Antecedente 3 Faceta 1 Faceta 2 Faceta 3

X1 X2 X3 X1 X2 X3 X1 X2 X3

Figura 2. Interpretações alternativas de uma estrutura MIMIC

porque, “os parâmetros de medição devem ser mais estáveis Em geral, a confusão interpretativa está presente para o
e menos sensível a mudanças nas relações estruturais medida em que os coeficientes que ligam a forma formativa ou reflexiva
emana da construção formativa”. Interpretação indicadores com uma construção focal mudam significativamente
confusão (Burt 1976) é um problema sério decorrente de uma dependendo das outras variáveis endógenas no modelo
discrepância entre o significado nominal de um construto (ou seja, aqueles causados pela construção focal). Vários pesquisadores
(baseado em sua conceituação) e o significado empírico de (Howell et al. 2007b; Kim et al. 2010; Wilcox et al. 2008)
o construto (com base em sua operacionalização) que pode afetar demonstraram recentemente que a confusão interpretativa
modelos com indicadores formativos ou reflexivos (Anderson e pode ser um grande problema em modelos com indicadores formativos,
Gerb 1988; Bollen 2007; Burt 1976). Howell et ai. quando a identificação do termo de erro de nível de construção é
(2007b, p. 207) descrevem esse problema da seguinte forma: alcançado por meio de relações estruturais com “outros
constrói.” Concordamos (Jarvis et al. 2003), e recomendamos
No contexto da medição reflexiva, Burt que se a identificação for alcançada por meio de relações estruturais
(1976), seguindo Hempel (1970, pp. 654-666), distinguiu com outros construtos, deve-se tentar
entre o significado nominal e o avaliar o grau de confusão interpretativa presente. Como
significado empírico de uma construção. Um construto observado por Bollen (2007), isso pode ser feito de uma maneira que
significado nominal é aquele significado atribuído sem semelhante ao usado para modelos com indicadores refletivos (ou seja,
referência a informações empíricas. Ou seja, é o examinando o efeito no parâmetro de medição
natureza de definição inerente do construto que estimativas de adicionar outras construções latentes ao modelo que
forma a base para a hipótese de ligações com outros são afetados pelo construto focal); a principal diferença é
construtos, desenvolvendo indicadores observáveis, e assim que “verificamos as mudanças nas cargas fatoriais (ÿs) com efeito
adiante. O significado empírico de um construto deriva de indicadores (reflexivos) e mudanças em ÿs para indicadores causais
suas relações com uma ou mais variáveis observadas. (formativos)” (p. 223).
Estas podem ser medidas do próprio construto (epistêmicas)
ou relações com medidas observáveis de No entanto, discordamos de Wilcox et al. (2008, p. 1227)
outras construções em um modelo (estrutural).... generalização não qualificada que
medida em que os significados nominais e empíricos de um
construto divergem, há uma questão de interpretação O significado empírico de uma medida formativamente
confuso. construção depende das variáveis de resultado no

MIS Trimestral Vol. 35 nº 2/ junho de 2011 309


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

modelo, de modo que enquanto o nome de um construto Um último ponto digno de nota diz respeito ao uso de parcelas que
medido formativamente pode permanecer o mesmo, a combinam vários itens em um único índice como indicadores.
realização empírica do construto irá variar de modelo para De um modo geral, as parcelas às vezes são usadas em modelos de
modelo e estudo para estudo. indicadores reflexivos para (1) melhorar a confiabilidade ou propriedades
distributivas dos indicadores, (2) simplificar a interpretação dos
Também discordamos da conclusão geral de Kim et al. (2010, p. 363) parâmetros do modelo de medição ou (3) melhorar a qualidade do ajuste
de que da medição modelo (Bandalos e Finney 2001). No entanto, Bandalos
(2002) argumentou que as parcelas não são recomendadas quando o
O uso de medição formativa, portanto, pode ter repercussões objetivo do estudo é o desenvolvimento, refinamento ou teste de escala.
negativas na qualidade da pesquisa em SI....A reutilização Ela fornece várias razões para isso. Primeiro, usar uma parcela para
do construto pode ser especialmente prejudicada, levando à representar um conjunto de itens só é apropriado quando os itens são
inconsistência nos testes teóricos e barreiras à construção conhecidos como unidimensionais.
Quando itens que não são unidimensionais são combinados em
de conhecimento cumulativo.
parcelas, isso pode enviesar as estimativas dos parâmetros de medição
e obscurecer a verdadeira estrutura fatorial (Hall et al. 1999; West et al.
Quando a identificação do termo de erro em nível de construção é 1995), e enviesar as estimativas dos parâmetros estruturais em alguns casos.

alcançado através do uso de dois indicadores reflexivos válidos de Em segundo lugar, quando as parcelas são usadas, o teste geral do

conteúdo, como recomendamos acima, Bollen (2007, pp. 223-224) ajuste do modelo de medição não é tão rigoroso quanto quando o
conjunto completo de itens individuais é usado, porque menos
demonstrou de forma convincente que é improvável que a confusão
covariâncias devem ser ajustadas. Isso, é claro, torna mais provável
interpretativa seja um problema. De fato, Howell et al. (2007a, p. 243)
que o modelo de medição pareça se ajustar aos dados. Terceiro, o
reconhecem que “o uso de itens reflexivos, de fato, ajuda muito a
parcelamento pode mascarar fontes de desajuste do modelo. Portanto,
resolver o problema da confusão interpretativa, e concordamos
ela recomenda que os pacotes sejam usados apenas se os itens usados
fortemente com essa abordagem”. A razão pela qual a confusão
para criar cada pacote já tiverem demonstrado ser de conteúdo válido e
interpretativa provavelmente não será um problema neste caso é que a
unidimensional.
confusão interpretativa surge principalmente da combinação de
especificação incorreta e subidentificação do modelo, e nossa
recomendação resolve o problema de subidentificação de uma maneira
Etapa 5: coletar dados para realizar o pré-teste
que provavelmente resultará em um modelo corretamente especificado
do ponto de vista teórico. Isso porque, se esse método for utilizado, o
Uma vez que o modelo de mensuração tenha sido formalmente
significado empírico do construto latente será baseado apenas em
especificado, os dados precisam ser obtidos de uma amostra de
relações epistêmicas. Ou seja, o significado empírico será baseado
respondentes para examinar as propriedades psicométricas da escala
apenas nas relações entre o construto latente e um conjunto de variáveis
e avaliar sua validade convergente, discriminante e nomológica. Ao
observadas que são todos indicadores de conteúdo válido do domínio
escolher esta amostra, a questão chave é quão bem a amostra
do construto (ver Figura 2, Painel C).
representa a população para a qual as medidas são desenhadas. Isso
é importante, porque as propriedades de medição podem diferir entre
as subpopulações. Por exemplo, as propriedades da escala podem
diferir culturalmente, entre grupos demográficos, por experiência, por
A próxima decisão que precisa ser tomada ao especificar um construto
nível de educação, por posição dentro de uma organização, etc. Outro
com indicadores formativos é estimar livremente as covariâncias entre
fator que é tradicionalmente considerado nesta fase é o tamanho da
os indicadores formativos e entre esses indicadores e outras variáveis
amostra. Na análise fatorial exploratória (EFA), as recomendações do
exógenas. tamanho mínimo da amostra variam de 100 a 500 (Comrey e Lee 1992;
Embora seja possível restringir todas essas covariâncias para serem Gorsuch 1983), e as recomendações da razão mínima do número de
iguais a zero, MacCallum e Browne (1993) notaram que liberá-las é respondentes para o número de itens na escala variam de 3:1 a 10:1
mais consistente com a prática de modelagem tradicional. Recomendamos (Cattell 1978; Everitt 1975).
estimar as covariâncias entre os indicadores formativos de um construto.
No entanto, antes de liberar as covariâncias entre os indicadores No entanto, MacCallum et al. (1999) apontam que
formativos de um construto e outros construtos ou medidas exógenas,
deve-se considerar o significado teórico e o impacto empírico da Um equívoco fundamental sobre essa questão é que o
estimativa dessas covariâncias (Jarvis et al. 2003; Petter et al. 2007). tamanho mínimo da amostra ou a razão mínima entre o
tamanho da amostra e o número de variáveis é invariável
entre os estudos. Na verdade, o tamanho da amostra necessário é

310 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

depende de vários aspectos de qualquer estudo, incluindo literatura e, ao fazê-lo, daremos especial atenção a (1) métodos
o nível de comunalidade das variáveis e o nível de de avaliação de construtos com indicadores formativos e (2)
sobredeterminação dos fatores (p. 84). critérios para eliminação de indicadores problemáticos.

O Apêndice A fornece um resumo detalhado das etapas do


Mais especificamente, as descobertas de MacCallum et al. 300 a processo de purificação e refinamento da escala, e a Figura 3
500) são necessários quando as comunidades são baixas e os fornece exemplos dos tipos de modelos de medição de primeira e
fatores são fracamente determinados. segunda ordem aos quais essas etapas se aplicam. Os painéis A e
B retratam construtos de primeira ordem com indicadores reflexivos
e formativos (respectivamente). O construto de segunda ordem no
Painel C foi chamado de construto totalmente desagregado por
Bagozzi e Heatherton (1994), um construto superordenado por
Para avaliar a validade convergente, medidas alternativas do Edwards (2001) e um construto Tipo I por Jarvis et al.
mesmo construto devem ser incluídas como parte desse esforço (2003). O construto de segunda ordem no Painel D possui múltiplas
subdimensões de primeira ordem como indicadores formativos e
de coleta de dados. Para avaliar a validade nomológica, devem ser
obtidas medidas de construtos teoricamente relacionados ao as subdimensões possuem múltiplos indicadores reflexivos.
Construções de segunda ordem com esta forma de modelo foram
construto focal. Por fim, para avaliar a validade discriminante,
devem ser obtidas medidas de construtos semelhantes chamadas de modelo espúrio com múltiplas causas comuns por
potencialmente confundidos com o construto focal. Edwards e Bagozzi (2000), uma construção agregada por Edwards
(2001) e uma construção Tipo II por Jarvis et al. (2003). Embora
Uma consideração final na coleta de dados diz respeito à existam outros tipos de construtos de segunda ordem que possuem
expectativa de estabilidade do construto ao longo do tempo ou não. diferentes combinações de indicadores formativos e reflexivos
Por exemplo, espera-se que alguns construtos como traços de (Edwards e Bagozzi 2000; Jarvis et al. 2003), focamos nesses dois
modelos de medição porque há alguma evidência de que eles são
personalidade sejam relativamente estáveis ao longo do tempo e/
ou entre situações, enquanto outros construtos capturam estados os tipos mais comuns. Finalmente, é importante notar que os
modelos nos Painéis B e D não são identificados como mostrado,
que devem variar dependendo do tempo ou local em que são medidos.
mas podem ser estimados após a resolução do problema de
Conforme observado por Baumgartner e Steenkamp (2006), essa
questão pode ser levada em consideração na etapa de coleta de identificação conforme recomendado na Etapa 4 (ou seja,
adicionando 2+ indicadores reflexivos ao construto focal).
dados e especificação do modelo. Isso requer várias ondas de
dados nas quais os mesmos construtos são medidos em vários
pontos no tempo. Embora isso obviamente exija muito esforço
Avaliando a qualidade do ajuste do
adicional por parte do pesquisador, pode ser a melhor maneira de modelo de medição
determinar se as medidas que devem permanecer estáveis (ou
variar) ao longo do tempo e entre as situações por razões teóricas
Independentemente do tipo de modelo de medição estimado (por
realmente o fazem.
exemplo, Figura 3, Painéis A–D), o primeiro passo é determinar se
(1) a solução é adequada, (2) as relações individuais hipotetizadas
são estatisticamente significativas e (3) os relacionamentos (como
Etapa 6: Purificação e refinamento da escala um grupo) são consistentes com os dados da amostra. Uma
solução é adequada se o procedimento de estimativa converge e
Os métodos para avaliar uma escala recém-desenvolvida têm sido nenhuma das estimativas de variância é negativa, ambas as quais
amplamente discutidos na literatura (Anderson e Gerbing 1988; podem ser verificadas examinando a saída. As razões críticas para
Bagozzi 1980; Baggozi et al. 1991; Bollen 1989; Fornell e Larcker as estimativas das relações individuais podem ser avaliadas com
1981; Gefen 2003; MacCallum e Austin 2000; Segars 1997; Spector testes z no nível apropriado de significância (por exemplo, p < 0,05
1992). No entanto, existem duas lacunas nesta literatura. Em ou 0,01). A estatística qui-quadrado pode ser usada para testar se
primeiro lugar, esta pesquisa concentrou-se muito mais nos critérios o modelo considera adequadamente os dados da amostra. No
de avaliação de modelos de medição de indicadores reflexivos do entanto, neste caso, uma estatística qui-quadrado não significativa
que em modelos de medição de indicadores formativos. Uma (p > 0,10) é indicativa de um bom ajuste porque significa que as
segunda lacuna é que há pouca discussão sobre como aplicar covariâncias previstas pelo modelo não são significativamente
esses critérios para tomar decisões sobre quais itens omitir para diferentes das covariâncias da amostra.6 No geral, uma solução adequada, signific
purificar a escala (veja o artigo de Bollen nesta edição para uma
exceção). Portanto, nesta seção vamos resumir os procedimentos 6
Observe que, se uma estrutura média também for incluída no modelo, uma estatística
para avaliação de escala que foram recomendados anteriormente
qui-quadrado não significativa indicaria que as covariâncias e médias previstas pelo
na pesquisa
modelo não diferem das covariâncias e médias da amostra.

MIS Trimestral Vol. 35 nº 2/ junho de 2011 311


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Nota: Os modelos nos Painéis B e D não são identificados como mostrado, mas podem ser estimados após a resolução do problema de identificação conforme
recomendado na Etapa 4.

Figura 3. Exemplos de modelos de medição de primeira e segunda ordem

razões críticas para as relações individuais hipotetizadas e uma O artigo de Bollen e Ting para obter instruções detalhadas sobre
estatística qui-quadrado não significativa são evidências da validade como identificar e testar as tétrades em fuga implícitas em muitos
do modelo de medição hipotetizado. modelos de medição de primeira ordem que incluem indicadores refletivos.

Um meio alternativo de testar o ajuste geral de um modelo de Infelizmente, embora a estatística qui-quadrado forneça o melhor
medição, chamado análise de tetrad confirmatória (CTA), foi proposto teste inferencial de ajuste geral do modelo, sua utilidade é bastante
por Bollen e Ting (2000). Uma tétrade é a diferença entre o produto prejudicada pelo fato de estar relacionada ao tamanho da amostra,
de um par de covariâncias e o produto de outro par de covariâncias complexidade do modelo e não normalidade (ver Hu e Bentler 1999). .
entre quatro variáveis aleatórias. O CTA baseia-se na ideia de que a Consequentemente, é necessário contar com outros índices de
estrutura de um bondade de ajuste para avaliar até que ponto as relações
O modelo muitas vezes implica que certas tétrades de populações hipotetizadas no modelo de medição são consistentes com os dados
específicas devem “desaparecer” (ou seja, ser igual a zero) e, por da amostra. Alguns desses índices alternativos de bondade de ajuste
causa disso, um teste simultâneo das tétrades de fuga implícitas em avaliam o ajuste absoluto de um modelo (por exemplo, GFI, RMSEA,
um modelo pode fornecer um teste útil do ajuste do modelo. Se este SRMR) e alguns avaliam seu ajuste em relação a um modelo de
teste do qui-quadrado indica que as tétrades que deveriam ser iguais comparação adequadamente enquadrado (por exemplo, CFI, NFI,
a zero são significativamente diferentes de zero, é evidência de que TLI). Hu e Bentler (1999) conduziram uma série de simulações de
o modelo é inconsistente com os dados. Um resultado não significativo Monte Carlo que mostraram que, para equilibrar as taxas de erro
indica que as previsões de tétrade de desaparecimento implícitas no Tipo I e Tipo II, é melhor confiar em múltiplas medidas de bondade
modelo são consistentes com os dados e podem ser interpretadas de ajuste de diferentes famílias de índices de ajuste.
como evidência da validade do modelo hipotético. Embora uma Embora observem que é difícil designar um valor de corte específico
descrição completa do CTA não possa ser fornecida aqui, os leitores para cada índice de ajuste, porque o melhor valor depende da
interessados são encorajados a consultar combinação dos índices de ajuste utilizados, em geral

312 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

um valor de corte próximo a 0,95 para CFI, 0,08 para SRMR e 0,06 magnitude do termo de erro no nível do construto para avaliar a
para RMSEA é indicativo de um bom modelo de ajuste e pode ser validade do construto com base no raciocínio de que, “se o conjunto
interpretado como evidência a favor da validade do modelo hipotético. de indicadores é abrangente no sentido de que inclui todas as facetas
importantes do construto, o significado do construto é capturado de
forma válida; consequentemente, a variância residual provavelmente
será pequena.” Isso é consistente com a visão de Williams et al.
Avaliando a validade do conjunto de indicadores no nível (2003, p. 908) que, “à medida que a variância do resíduo aumenta, o
de construção
significado do construto se torna progressivamente ambíguo...
Certamente, o significado de um construto é elusivo quando a maior
Para construtos latentes de primeira ordem com indicadores reflexivos parte de sua variância é atribuível a fatores desconhecidos”. Esse
(ver Figura 3, Painel A), a validade convergente pode ser avaliada raciocínio sugere que a variância do erro no nível do construto deve
calculando a variância média nos indicadores que são contabilizados ser pequena e constituir não mais da metade da variância total do
pelo construto focal. No caso típico em que cada indicador está construto.7 Alternativamente (mas com base em raciocínio semelhante),
relacionado a apenas um construto, a variância média extraída (AVE) Edwards (2001, p. 163) propõe que a força do construto relação entre
pelo construto focal pode ser calculada pela média das cargas fatoriais um conjunto de indicadores formativos e um construto latente composto
ao quadrado completamente padronizadas (ÿ2 ) para os indicadores,
ou pela média do quadrado múltiplas correlações para os indicadores
(ver Fornell e Larcker 1981). Uma AVE maior que 0,50 é desejável pode ser avaliado com o coeficiente de adequação (R2 a),
porque sugere que o construto latente responde pela maioria da que é usado na análise de correlação canônica para avaliar
variância em seus indicadores em média. a relação entre um conjunto de variáveis e sua variável
canônica associada... R2 é calculado
uma

somando as correlações quadradas entre o construto e


Para construtos latentes de segunda ordem com indicadores reflexivos
suas dimensões [ie, indicadores] e dividindo pelo número
(ver Figura 3, Painel C), também é importante examinar a validade de dimensões [ie, indicadores].
convergente do conjunto de subdimensões de primeira ordem como
indicadores reflexivos do construto de segunda ordem. Conforme
observado por Edwards (2001, p. 163), isso pode ser avaliado usando R2 valores superiores a 0,50 significariam que, em média, a maior
uma

o coeficiente de determinação multivariado (R2 m), que é parte da variância dos indicadores é compartilhada com o construto.
No entanto, deve-se reconhecer que há pouca pesquisa usando
calculado tomando o determinante da matriz de covariância qualquer um desses métodos e um consenso não foi alcançado
do construto multidimensional e suas subdimensões,
quanto à sua adequação. Portanto, pode ser prudente usá-los em
dividindo essa quantidade pela variância do construto conjunto com outros métodos de avaliação da validade de construto
multidimensional vezes o determinante da matriz de
(por exemplo, validade nomológica, validade relacionada a critérios,
covariância das subdimensões e subtraindo a quantidade
etc.) até que mais evidências dessas técnicas sejam acumuladas.
resultante da unidade

Para construtos latentes de segunda ordem com subdimensões de


(Para uma fórmula equivalente para R2 , veja
m, Edwards 2003.) primeira ordem como indicadores formativos (veja a Figura 3, Painel
Alternativamente, o AVE pode ser calculado para o construto de D), comece avaliando se a variância média extraída (AVE) para os
segunda ordem, calculando a média das múltiplas correlações indicadores reflexivos de cada subdimensão de primeira ordem
quadradas para as subdimensões de primeira ordem (ou calculando a individual é maior que .50 (como descrito anteriormente para
média do quadrado da carga completamente padronizada de cada construtos de primeira ordem com indicadores reflexivos).
subdimensão no construto de segunda ordem). Em ambos os casos, Em seguida, avalie a validade do conjunto de subdimensões servindo
valores maiores que 0,50 significam que, em média, a maioria da como indicadores formativos do construto latente de segunda ordem
variância nas subdimensões de primeira ordem é compartilhada com
usando o coeficiente de adequação de Edwards (2001) (R2 a), que
o construto latente de segunda ordem.
pode ser calculado pela soma das correlações quadradas entre cada
subdimensão e o construto focal, e então dividindo pelo número de
Para construtos latentes de primeira ordem com indicadores formativos subdimensões. As informações necessárias
(ver Figura 3, Painel B), a validade convergente não é relevante
porque o modelo de construto latente composto não implica que os
indicadores devam necessariamente ser correlacionados. Em vez 7
Observe que esse método se destina a ser usado em modelos em que os únicos
disso, Diaman topoulos et al. (2008, p. 1216) propuseram usar o
antecedentes do construto latente composto são seus próprios indicadores formativos.

MIS Trimestral Vol. 35 nº 2/ junho de 2011 313


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

para este cálculo pode ser obtido a partir da saída completamente Para construções de primeira ordem com indicadores formativos
padronizada relatada pela maioria dos programas SEM (por exemplo, (ver Figura 3, Painel B), a noção tradicional de confiabilidade de
LISREL). consistência interna não se aplica porque o modelo não prevê que
os indicadores serão correlacionados (Bollen 1989; Bollen e Lennox
1991). Os indicadores formativos podem ser correlacionados
Avaliando a confiabilidade do conjunto de indicadores negativamente, positivamente correlacionados ou completamente
no nível de construção
não correlacionados entre si. Consequentemente, medidas de
confiabilidade baseadas na ideia de consistência interna como o alfa
Para construtos de primeira ordem com indicadores reflexivos de Cronbach e o índice de confiabilidade do construto de Fornell e
(Figura 3, Painel A), o alfa de Cronbach tem sido tradicionalmente Larcker não são adequadas, e se aplicadas podem resultar na
utilizado para estimar a confiabilidade da consistência interna das medidas.remoção de indicadores essenciais ao domínio do construto
Isso é apropriado, pois esse tipo de modelo de medição implica (Diamantopolous e Winklhofer 2001; MacKenzie 2003).
consistência interna entre as medidas (ver Bollen e Lennox 1991).
Além disso, Fornell e Larcker (1981) fornecem um índice um pouco
diferente de confiabilidade de construto com base na razão da Para construtos latentes de segunda ordem com subdimensões de
variância contabilizada pelo construto latente para a variância total primeira ordem como indicadores formativos (veja a Figura 3, Painel
nas medidas.8 De modo geral, o padrão aceito para ambos os D), a confiabilidade dos indicadores para cada subdimensão
índices é 0,70 ou superior para medidas recentemente desenvolvidas individual de primeira ordem pode ser avaliada usando o
(Nunnally e Bernstein 1994). No entanto, é amplamente conhecido procedimento descrito para construtos de primeira ordem com
que o alfa aumenta à medida que o número de medidas aumenta, indicadores reflexivos. No entanto, as noções tradicionais de
portanto, um valor mais alto pode ser apropriado nos casos em que confiabilidade de consistência interna não se aplicam ao conjunto
o número de medidas é grande (Cortina 1993). de subdimensões que servem como indicadores formativos de um
construto de segunda ordem porque o modelo de medição de
segunda ordem não prevê que as subdimensões serão
Para construções de segunda ordem com indicadores reflexivos correlacionadas (Bollen e Lennox 1991; Edwards 2003). De fato,
(Figura 3, Painel C), comece examinando a confiabilidade dos Edwards (2001, p. 160) argumenta que “a confiabilidade não é uma
indicadores para cada subdimensão individual de primeira ordem questão de debate quando um construto multidimensional e suas
usando um ou mais dos métodos descritos. Então, se desejado, a dimensões são tratados como variáveis latentes que não contêm erros de medição”.
confiabilidade das subdimensões de primeira ordem como indicadores
do construto de segunda ordem pode ser examinada pelo cálculo do
índice de confiabilidade de construto de Fornell e Larcker para o Avaliando a validade e confiabilidade do
construto de segunda ordem. Isso pode ser feito usando as indicador individual
estimativas completamente padronizadas das cargas fatoriais de
segunda ordem e variâncias de erro associadas às subdimensões Para construtos de primeira ordem com indicadores reflexivos
de primeira ordem. Um procedimento semelhante foi recomendado (Figura 3, Painel A), a validade dos indicadores individuais pode ser
por Baumgartner e Steenkamp (2006), e acreditamos que esta avaliada a partir do modelo de medição, determinando se a relação
técnica faz sentido conceitualmente em alguns casos (por exemplo, entre cada indicador e seu construto latente hipotético é grande e
quando o construto de segunda ordem é um indivíduo estável
estatisticamente significativa. A significância da estimativa (ÿ) de
referência que foi medida com o mesmo conjunto de itens em vários
uma relação entre um indicador e o construto latente pode ser
pontos diferentes no tempo). testada com um teste z da razão crítica da estimativa. O grau de
validade de cada indicador pode ser avaliado examinando a
proporção única de variância no indicador contabilizada pelo
construto latente (Bollen 1989). No caso típico em que cada indicador
é hipotetizado para carregar em apenas um construto, isso será igual
8 ao quadrado do carregamento completamente padronizado do
Um índice alternativo de confiabilidade (coeficiente H) proposto por Hancock e Mueller
indicador (ÿ2 ). Um valor superior a 0,50 sugeriria um nível adequado
(2001) é a correlação quadrada entre o construto latente e o composto linear ótimo
formado a partir dos indicadores medidos. Este índice tem várias propriedades de validade (ver Fornell e Larcker 1981). A confiabilidade de cada
desejáveis: (1) o sinal de uma carga não pode afetar a avaliação da confiabilidade do indicador pode ser avaliada examinando a correlação múltipla ao
construto, (2) o mínimo é 0 e o valor máximo é 1 quando uma única carga padronizada quadrado para o indicador (Bollen 1989). Normalmente, um valor
é 1 (ou -1), e (3) adicionar um indicador adicional nunca diminuirá o valor do coeficiente.
maior que 0,50 é desejado porque sugere que a maior parte da
Ao contrário do índice de confiabilidade de Fornell e Larcker, o valor do coeficiente H
variação em
nunca pode ser inferior à confiabilidade do melhor indicador.

314 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

o indicador se deve ao construto latente. É claro que em modelos onde 222).10 Não existe um padrão mínimo comumente aceito para quanto
cada indicador carrega em apenas um construto, a correlação múltipla da variância no construto latente deve ser contabilizado exclusivamente
ao quadrado e o quadrado do carregamento completamente padronizado por cada indicador formativo. No entanto, é importante reconhecer que
serão iguais. a multicolinearidade entre os indicadores apresenta os mesmos
problemas aqui que em qualquer outro modelo de regressão múltipla,
Para construtos de segunda ordem com subdimensões de primeira porque o construto latente é regredido nos indicadores (e não vice-
ordem como indicadores reflexivos (Figura 3, Painel C), a validade dos versa). Isso implica que o padrão adotado deve, de alguma forma, levar
indicadores das subdimensões de primeira ordem pode ser avaliada em conta o número de indicadores formativos relacionados ao construto
conforme descrito anteriormente. Então, a validade de cada subdimensão latente e a força de suas intercorrelações.
de primeira ordem pode ser testada examinando se ela está
significativamente relacionada ao construto latente de segunda ordem; A confiabilidade de cada indicador individual pode ser avaliada usando
e o grau de validade de cada subdimensão pode ser avaliado (1) confiabilidade teste-reteste (se espera-se que o indicador seja
examinando a proporção única de variância na subdimensão estável ao longo do tempo) e/ou (2) confiabilidade entre avaliadores (se
contabilizada pelo construto de segunda ordem. O último será espera-se que diferentes avaliadores concordem).
normalmente igual ao quadrado da carga completamente padronizada
da subdimensão no construto de segunda ordem (ou seja, quando cada Um método final para avaliar a validade de um indicador formativo pode
subdimensão tem a hipótese de carregar apenas um construto de ser aplicado a modelos que também incluem alguns indicadores
segunda ordem), e seu valor deve ser maior que 0,50 (ver Fornell e reflexivos globais que capturam o significado do construto latente
Larcker 1981). A confiabilidade de cada subdimensão pode ser avaliada “geral” (ver Diamantopoulos e Winkl hofer 2001). Nesses modelos, uma
examinando a correlação múltipla ao quadrado para a subdimensão. estimativa do efeito indireto de cada indicador formativo no indicador
Valores maiores que 0,50 são desejados, pois indicam que o construto refletivo global pode ser obtida multiplicando (1) a estimativa do impacto
latente de segunda ordem é responsável pela maior parte da variância do indicador formativo no construto latente composto e (2) a estimativa
na subdimensão (Fornell e Larcker 1981). do impacto do construto latente composto no indicador refletivo global
(ver Bollen 1989).

A significância estatística deste efeito indireto pode então ser avaliada


Para construtos de primeira ordem com indicadores formativos (Figura usando um teste de Sobel (1982), ou criando um intervalo de confiança
3, Painel B), a validade do indicador é capturada pela significância e usando uma estimativa de erro padrão bootstrap (MacKinnon 2008).
força do caminho do indicador para o construto latente composto Se a estimativa desse efeito indireto for grande e estatisticamente
(Bollen 1989; Bollen e Lennox 1991).9 A significância de a estimativa significativa, sugere que o indicador formativo é válido. Se dois ou mais
de uma relação entre um indicador formativo e um construto latente indicadores reflexivos globais estiverem disponíveis para o construto
pode ser testada com um teste z da razão crítica da estimativa. O grau latente, os efeitos indiretos completamente padronizados de um
de validade de cada indicador formativo pode ser avaliado examinando determinado indicador formativo em cada um dos indicadores reflexivos
a proporção única de variância no construto contabilizada pelo indicador. podem ser calculados para fornecer uma estimativa mais robusta da
Isso é calculado subtraindo a proporção de variância no construto validade do indicador. Duas coisas são dignas de nota sobre este
explicada por todos os indicadores, exceto o de interesse, da proporção procedimento. Primeiro, as estimativas desse tipo de efeito indireto
de variância no construto explicada por todos os indicadores, incluindo podem ser solicitadas como parte do resultado da maioria dos programas
o de interesse (ver Bollen 1989, pág. 200 e de modelagem de equações estruturais. Em segundo lugar, essa
técnica valoriza a validade de conteúdo dos indicadores reflexivos
globais porque eles estão sendo usados essencialmente como medidas
de critério para estabelecer a validade relacionada ao critério dos
indicadores formativos. Consequentemente, esse teste de validade só
fornecerá informações úteis na medida em que os indicadores reflexivos

9
globais capturarem fielmente o domínio conceitual do construto focal.
Uma visão alternativa defendida por Borsboom (2005, p. 169) é que o
conceito de validade não se aplica à relação entre indicadores formativos e
um construto latente composto:

Como a validade diz respeito explicitamente à relação de medição,


pergunta-se se é apropriado ver os modelos formativos como
modelos de medição em primeiro lugar. Eles podem ser mais 10Observe que isso só será igual ao quadrado da correlação entre o indicador
bem conceituados como modelos para indexar ou resumir os formativo e o construto latente quando o indicador de interesse não estiver
indicadores, ou como modelos causais que não envolvem uma correlacionado com os demais indicadores formativos (Bollen 1989, p. 202;
estrutura de mensuração para a qual se pode questionar a validade. Edwards e Bagozzi 2000, p. 165) .

MIS Trimestral Vol. 35 nº 2/ junho de 2011 315


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Para construtos latentes de segunda ordem com subdimensões de os índices e sua magnitude podem ser avaliados comparando-se o
primeira ordem como indicadores formativos (Figura 3, Painel D), a carregamento completamente padronizado (ÿ) do indicador na
validade e confiabilidade dos indicadores individuais das subdimensões subdimensão hipotética com as estimativas de mudança esperadas
de primeira ordem podem ser avaliadas conforme descrito para completamente padronizadas para os carregamentos nas
construtos de primeira ordem com indicadores reflexivos . Em seguida, subdimensões não hipotéticas. Carregamentos cruzados grandes e
a validade de cada subdimensão individual como um indicador do significativos são problemáticos porque sugerem que o item é
construto latente de segunda ordem pode ser testada examinando se conceitualmente confuso devido ao fato de refletir mais de uma
cada subdimensão está significativamente relacionada ao construto subdimensão. Finalmente, deve-se também considerar a eliminação
latente de segunda ordem (Bollen 1989; Bollen e Lennox 1991 ). O de subdimensões de primeira ordem que não tenham cargas
grau de validade de cada subdimensão pode ser avaliado usando a significativas no construto de segunda ordem, ou subdimensões de
proporção única de variância no construto contabilizada pela primeira ordem com cargas fracas (mas significativas) se a variância
subdimensão. Isso pode ser calculado subtraindo a proporção de média extraída pelo construto de segunda ordem construção de ordem
variância no construto de segunda ordem contabilizada por todas as é inferior a 0,50 (Fornell e Larcker 1981). Mais uma vez, é importante
subdimensões, exceto a de interesse, da proporção de variância no lembrar que as subdimensões não devem ser eliminadas a menos
construto de segunda ordem contabilizada por todas as subdimensões que todos os aspectos essenciais do domínio do construto focal sejam
incluindo o de interesse (ver Bollen 1989, pp. 200 e 222). A capturados pelas subdimensões restantes.
confiabilidade de cada subdimensão individual pode ser avaliada Instâncias em que uma subdimensão inteira pode ser descartada sem
usando o índice de confiabilidade de construção de Fornell e Larcker. eliminar um aspecto essencial do domínio de construção provavelmente
serão raras.

Em resumo, argumentamos que indicadores reflexivos com baixa


validade, baixa confiabilidade, covariâncias de erros de medição fortes
Elimine indicadores problemáticos e significativas e/ou cargas cruzadas não hipotéticas que são fortes e
significativas são candidatos à eliminação. No entanto, uma abordagem
As análises anteriores podem ser usadas para começar a identificar alternativa para selecionar o conjunto final de indicadores reflexivos
indicadores problemáticos. Indicadores problemáticos são aqueles foi defendida por Little et al. (1999). Eles argumentam que, do ponto
que têm baixa validade, baixa confiabilidade, covariâncias de erro de de vista de amostragem de domínio, os indicadores reflexivos são
medição fortes e significativas e/ou carregamentos cruzados não amostrados aleatoriamente a partir do universo de possíveis
hipotéticos que são fortes e significativos. Indicadores reflexivos de indicadores que representam o domínio do construto. Alguns desses
um construto de primeira ordem (Figura 3, Painel A) que têm relações indicadores estão mais próximos do significado central do construto
não significativas (z < 1,96) ou fracas ( ÿ2 completamente padronizada (ou seja, seu centroide) do que outros.
menor que 0,50) com o construto latente, ou covariâncias de erro de Sua ideia-chave é que as informações da rede nomológica podem ser
medição fortes e significativas (modificação índice maior que 3,84 e usadas para identificar o melhor subconjunto de indicadores.
grandes estimativas de mudança esperada) são candidatos à Mais especificamente, eles recomendam que (1) com base na teoria e
eliminação, desde que todos os aspectos essenciais do domínio do em pesquisas anteriores, o pesquisador especifique como o construto
construto sejam capturados pelos itens restantes. Carregamentos não focal deve se relacionar com um conjunto de construtos marcadores-
significativos ou fracos são uma indicação de falta de validade, e as chave em sua rede nomológica; (2) usando um amplo conjunto de
covariâncias de erro de medição podem ser um sinal de indicadores potenciais do construto focal, estimar as correlações entre
multidimensionalidade (Gerbing e Anderson 1984). Covariâncias o construto focal e os construtos marcadores-chave com uma análise
significativas de erro de medição podem ser identificadas observando fatorial confirmatória; (3) descartar um dos indicadores do construto
os índices de modificação e sua magnitude pode ser avaliada focal e reestimar o
examinando as estimativas de mudança esperadas completamente construir intercorrelações usando uma análise de fábrica confirmatória;
padronizadas. e (4) comparar as novas intercorrelações com as obtidas da análise
fatorial confirmatória do conjunto completo de indicadores e, se
corresponderem, o indicador poderá ser excluído com segurança. O
Além disso, se os itens são indicadores reflexivos de uma objetivo final deste procedimento é identificar um subconjunto de
subdimensão de primeira ordem de um construto de segunda ordem indicadores parcimonioso que seja capaz de reproduzir as
(Figura 3, Painel C), outra consideração é se os indicadores têm intercorrelações de construtos obtidas a partir da análise fatorial
cargas cruzadas significativas (z > 1,96) em um não- subdimensão confirmatória do conjunto completo de indicadores.
hipotética que são semelhantes em magnitude ao seu carregamento Observe que esse subconjunto “pode ou não ser o mesmo subconjunto
na subdimensão hipotética. Cargas cruzadas significativas podem ser de indicadores que produziria as mais altas consistências internas”
identificadas observando a modificação (Little et al. 1999, p. 208). Os leitores interessados são encorajados

316 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

consultar Little et al. artigo para detalhes adicionais porque, em Etapa 7: coletar dados da nova amostra e
nossa opinião, este procedimento alternativo tem algum mérito.11 Reexaminar as propriedades da escala

Os procedimentos para eliminar indicadores formativos são um Como os itens são frequentemente adicionados, descartados ou
pouco diferentes. Para indicadores formativos de um construto de reformulados no processo de purificação da balança, o próximo
primeira ordem (Figura 3, Painel B), recomendamos que os passo é reestimar o modelo de medição usando uma nova amostra
indicadores que não tenham cargas fortes e significativas no de dados. Isso é importante para avaliar até que ponto as
construto sejam considerados para eliminação. No entanto, como a propriedades psicométricas da escala podem ter sido baseadas em
aridade multicolina pode dificultar a separação da influência distinta idiossincrasias na amostra de dados de desenvolvimento e para
dos indicadores individuais no construto, a redundância nos permitir um teste estatístico válido do ajuste do modelo de medição.
indicadores deve ser examinada usando o fator de inflação de Devido aos objetivos limitados desta etapa no processo de validação
variância (VIF). Indicadores com carga não significativa e VIF maior da escala, isso pode ser feito usando uma amostra semelhante à
que 10 são redundantes e podem ser considerados para eliminação usada para purificar os itens. Nos casos em que os itens foram
(Diamantopoulos et al. 2008; Diamantopoulos e Winklhofer 2001; descartados, mas não adicionados ou reformulados, esta etapa
Neter et al. 1996); embora alguns (por exemplo, Petter et al. 2007) pode usar dados de uma amostra de validação dos dados originais.
tenham recomendado um nível de corte VIF inferior de 3. No entanto, Usando esta nova amostra, o modelo de medição seria reestimado,
é particularmente importante para construtos com indicadores
seu ajuste reexaminado e as propriedades psicométricas reavaliadas.
formativos garantir que todos os aspectos essenciais do domínio do
construto sejam capturados pelos indicadores restantes (Bollen e
Lennox 1991; Diamantopoulos e Winklhofer 2001; MacKenzie 2003).

Etapa 8: avaliar a validade da escala

Finalmente, para construtos de segunda ordem com subdimensões


Assumindo que as propriedades psicométricas da escala purificada
de primeira ordem como indicadores formativos (Figura 3, Painel
são aceitáveis, o próximo passo no processo de validação do
D), elimine indicadores que tenham (1) cargas não significativas na
construto é avaliar se as respostas da escala se comportam como
subdimensão hipotética, (2) cargas cruzadas grandes e significativas
seria de esperar se fossem indicadores válidos do construto focal.
em subdimensões não hipotéticas e/ou (3) grandes e significativas
De um modo geral, o objetivo é avaliar se os indicadores do
covariâncias de erro de medição com indicadores de outras
construto focal (1) são representações precisas do construto
subdimensões. Covariâncias significativas de erro de medição e
subjacente (através de manipulação experimental ou comparação
carregamentos cruzados podem ser identificadas observando os
índices de modificação (MI > 3,84) e sua magnitude pode ser de grupos conhecidos por diferirem no construto), (2) capturam
avaliada examinando as estimativas de mudança esperadas adequadamente a natureza multidimensional de do construto, (3)
completamente padronizadas. Se algumas das subdimensões de são distinguíveis dos indicadores de outros construtos (validade
primeira ordem não tiverem cargas significativas no construto de discriminante) e (4) estão relacionados às medidas de outros
segunda ordem, calcule o VIF para examinar a multicolinearidade construtos especificados na rede teórica do construto (validade
entre as subdimensões. Novamente, o VIF deve ser menor que nomológica). Na seção a seguir, discutiremos como cada um desses
10,0; embora Petter et al. (2007) recomendaram um nível de corte tipos de validade pode ser examinado no contexto de construtos
VIF inferior a 3. No entanto, não podemos enfatizar o suficiente que com indicadores formativos e reflexivos. Um resumo desses tipos
para construtos com indicadores formativos, é importante garantir de validade é fornecido no Apêndice B.
que todos os aspectos essenciais do domínio do construto sejam
capturados pelos indicadores restantes e subdimensões (Bollen e
Lennox 1991; Diamantopoulos et al. 2008; MacKenzie 2003).
Instâncias em que uma subdimensão inteira pode ser descartada Manipulação Experimental do Construto
sem eliminar um aspecto essencial do domínio de construção
provavelmente serão raras. De um modo geral, para os construtos com indicadores reflexivos
(Painéis A e C da Figura 3) é importante estabelecer se as medidas
realmente representam o fenômeno que pretendem representar.
Por exemplo, se uma escala pretende representar o comportamento
de ajuda, então é importante determinar se as pontuações nesta
escala estão correlacionadas com
11De fato, acreditamos que o procedimento de Little et al. também pode ser
adaptado para selecionar o subconjunto de indicadores que maximiza a correlação instâncias reais de comportamento de ajuda. Isso é consistente
entre o construto focal e uma manipulação direta do mesmo. com a observação de Stogdill (1969) de que “A validade implica que um

MIS Trimestral Vol. 35 nº 2/ junho de 2011 317


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

determinada subescala mede o padrão de comportamento que se O desenho do estudo de Stogdill é instrutivo porque incorpora
pretende medir” (p. 153). Mais especificamente, como observado por muitas das etapas que são necessárias para os pesquisadores
Borsboom (2005, p. 150), “um teste é válido para medir um atributo usarem para estabelecer a validade de uma escala usando
[construto] se e somente se a) o atributo existe, e b) variações no procedimentos experimentais, neste caso específico com estímulos de videotape.
atributo [construto] produzem variações causalmente nos resultados De um modo geral, os primeiros passos do processo são decidir
do procedimento de medição”. sobre o roteiro, os atores e o contexto do vídeo. Depois disso, o
Nesse sentido, validade refere-se à medida em que os escores de pesquisador precisa testar o roteiro usando especialistas no assunto
uma escala estão correlacionados com manipulações diretas ou para garantir que os eventos do roteiro retratem com precisão o
medidas do fenômeno que a escala se propõe a medir, e quando construto focal. O próximo passo é filmar e editar a fita de vídeo.
uma escala está altamente correlacionada com o fenômeno que se Finalmente, a fita de vídeo completa deve ser testada com sujeitos
pretende medir, ela pode-se dizer que possui veracidade (ou seja, semelhantes ao público-alvo pretendido.
que as pontuações na escala estão de acordo com as propriedades
reais do objeto). Isso é diferente das avaliações de validade de
conteúdo, que se concentram na medida em que os indicadores O uso de fitas de vídeo pode ser mais apropriado para validar
representam o domínio conceitual do construto. No caso da validade medidas comportamentais/de desempenho (por exemplo,

de conteúdo, a questão é se os indicadores capturam adequadamente comportamentos de liderança, desempenho de tarefas, atendimento
ao cliente, etc.), escalas projetadas para medir interações
todo o domínio do construto. Aqui, a preocupação é se os indicadores
interpessoais (por exemplo, conflito, atração, etc.), processos de
capturam com precisão os fenômenos do mundo real aos quais se
grupo ( por exemplo, comunicação entre os membros da equipe,
referem. Por essa razão, Borsboom argumentou que esse tipo de
encorajamento de outros membros do grupo, etc.), ou demonstrações
evidência é o mais importante para estabelecer a validade das
emocionais (por exemplo, raiva, desgosto, frustração, etc.) etc.) e
medidas de um construto.
traços de personalidade. No entanto, é importante notar que os
traços de personalidade podem ser conceituados de duas maneiras
diferentes (Barrick et al. 2001; Hogan et al. 1996; Johnson 1997).
Embora estabelecer a validade de uma medida pela manipulação
Por um lado, pode-se definir um traço de personalidade
direta do construto focal seja um aspecto frequentemente
genotipicamente como algo que existe dentro de uma pessoa que
negligenciado no processo de desenvolvimento da escala, uma
causa um padrão distinto de comportamento (ao longo do tempo e
exceção é o estudo conduzido por Stogdill. Neste estudo, Stogdill
através das situações). Por outro lado, pode-se definir um traço de
estava interessado em determinar se as subescalas do Questionário
personalidade fenotipicamente como a tendência a exibir um padrão
de Descrição do Comportamento de Liderança (LBDQ) mediam com
precisão (validamente) o padrão de comportamentos que pretendiam de comportamento distinto particular (ao longo do tempo e em todas

medir. Para examinar isso, ele (1) preparou um cenário que mostrava as situações). Assim, independentemente de qual conceituação seja
um líder agindo de acordo com o padrão de comportamento descrito adotada, espera-se que as pessoas com alto traço de “extroversão”
em cada uma das subescalas (ou seja, consideração, estrutura, exibam um padrão de comportamento distintamente extrovertido (ao
ênfase na produção, tolerância à liberdade, influência com os longo do tempo e em todas as situações). No entanto, as duas
superiores e representação). (2) fez um filme de um líder (e diferentes conceituações têm diferentes implicações metodológicas.
seguidores) desempenhando o papel descrito no cenário, (3) mostrou Se a personalidade é definida genotipicamente, então a própria
o filme para observadores que foram solicitados a avaliar o pessoa é a melhor fonte de informação sobre até que ponto a pessoa
comportamento do líder no LBDQ, e (4) testou se o líder no filme foi possui o traço que produz o padrão distintivo de comportamento.
classificado significativamente mais alto no comportamento focal do Mas se a personalidade é definida fenotipicamente, então outros que
LBDQ retratado no filme do que em outras subescalas do LBDQ. conhecem bem a pessoa também podem ser boas fontes de
Para garantir que foram os comportamentos dos líderes retratados informação sobre até que ponto a pessoa exibe o padrão distinto de
nos filmes que causaram as classificações, e não o ator que os comportamento. Isso sugere que, se tomarmos a perspectiva
interpretou, Stogdill treinou dois atores diferentes para interpretar os fenotípica, os cenários de fitas de vídeo podem ser usados para
papéis. Consistente com suas expectativas, ele geralmente descobriu descrever o padrão de comportamento que a escala de personalidade
que os mesmos atores desempenhando papéis diferentes eram pretende representar.
descritos como significativamente diferentes nas subescalas dos dois medir.

papéis, e que os dois atores desempenhando o mesmo papel não


eram descritos como diferentes na subescala para aquele papel. É claro que os vídeos não são o único meio que pode ser usado
Com base nesses resultados, Stogdill argumentou que suas para manipular experimentalmente um construto para validar suas
descobertas “constituem evidência de que as subescalas do medidas. De fato, qualquer representação escrita, em áudio ou
Questionário de Descrição do Comportamento do Líder medem o visual da construção focal também pode ser usada para esse fim.
que pretendem medir” (p. 157). Isso é importante, porque alguns construtos podem ser

318 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

manipulação através de cenários escritos ou histórias de casos, mas Chave validou a Escala de Medição de Atitude
não através de apresentações em vídeo. Por exemplo, medidas de Em direção à Igreja, mostrando diferenças de pontuação
estratégias como o poder de barganha dos compradores (Porter entre os membros da igreja e os que não frequentam a igreja.
1998) pode ser validado pela apresentação de assuntos Ir à igreja não é o critério de atitude, pois o
com uma história de caso fictícia em que os principais eventos e objetivo do teste [escala] é medir algo
fatores situacionais relacionados ao construto são manipulados. além do fato sociológico bruto da igreja
No entanto, a verdadeira chave é que a representação deve ser fielmente comparecimento; por outro lado, a falha em encontrar uma
representar a construção de interesse. diferença teria desafiado seriamente o teste.

A discussão acima refere-se principalmente a construções com Conforme indicado no exemplo de Cronbach e Meehl, essa técnica requer
indicadores refletivos como os Painéis A e C da Figura 3. o uso de grupos com diferenças reconhecidas em
No entanto, para construtos com indicadores formativos, como em o construto de interesse e testando se os níveis médios
Painéis B e D na Figura 3, um procedimento diferente para das medidas diferem entre esses grupos na hipótese
é necessário avaliar a validade experimental. No caso de direção. Embora este método de usar diferenças de grupo conhecidas
Painel B, recomendamos que a validade seja avaliada no nível para avaliar a validade de uma escala não tenha sido amplamente
dos indicadores formativos. Isso envolveria uma manipulação experimental utilizados em pesquisa de gestão e/ou MIS, existem vários
do atributo que é medido pelo exemplos que foram relatados em disciplinas relacionadas, como
indicador formativo, e um teste para saber se essa manipulação como marketing (ver Lastovicka et al. 1999; Netemeyer et al.
influencia as pontuações na medida do atributo. Observação 1995; Tian et ai. 2001) e personalidade e psicologia social
que isso implica que quando o modelo de medição é como o (Greenwald e Farnham 2000; Heimberg e Holaway
uma no Painel D da Figura 3, são as subdimensões que servem 2007; Webster e Kruglanski 1994).
como os indicadores formativos do construto de segunda ordem que
devem ser manipulados individualmente. Essa abordagem é consistente Por exemplo, Webster e Kruglanski (1994) testaram a
com Borsboom (2005), que argumenta que validade de sua necessidade de escala de fechamento (NFCS) comparando
grupos de indivíduos que escolheram carreiras na Holanda
Considere, como exemplo de uma construção tipicamente (1985) domínios convencionais ou artísticos da carreira. Baseado em
abordada com modelos formativos, A tipologia da carreira da Holanda, Webster e Kruglanski raciocinaram
Estado (SES). Um modelo formativo conceitua que as pessoas do tipo convencional, que escolheram carreiras
SES como uma variável latente que é regredida em indicadores caracterizadas por tarefas explícitas, ordenadas e estruturadas,
como renda anual, nível educacional, etc. pontuação mais alta no NFCS do que pessoas do tipo artístico, que escolheram
Agora, seria estranho perguntar se a questão carreiras caracterizadas por tarefas ambíguas e não estruturadas.
"Qual é sua renda anual?" é uma medida válida de Essa expectativa se confirmou, dando suporte para a
SES, pois, de acordo com a teoria proposta validade do NFCS. Outros exemplos do uso dessa técnica incluem o
aqui, essa questão não mede SES; em vez disso, é estudo de Lastovicka et al. (1999), que
mede um dos determinantes do SES, ou seja, validaram sua escala de frugalidade do consumidor comparando um
rendimento anual. E neste nível, pode-se consistentemente amostra aleatória de adultos para uma amostra de adultos assinando
colocar a questão da validade, ou seja, quando alguém uma publicação chamada Tightwad Gazette; Netemeyer et ai.
pergunta se a variação na renda anual tem um efeito causal (1995), que validou o componente de preocupação física de
efeito sobre a variação nas respostas à pergunta sua escala de vaidade comparando uma amostra de pessoas que
(pág. 169). cirurgia estética para uma amostra que não o fez; e Tian et ai.
(2001), que validou os vários subcomponentes da necessidade
para a escala de singularidade comparando uma amostra aleatória de adultos
Comparações de grupos conhecidos a grupos de tatuadores e artistas de body-piercing, proprietários de
automóveis low-rider personalizados, membros da Society for
Outro método, um pouco mais fraco, de avaliar se um Anacronismo criativo, cursos de graduação em arte e recentes
conjunto de indicadores reflexivos mede com precisão o fenômeno de compradores de cartazes de nouveau art.
interesse foi descrito por Cronbach e Meehl (1955,
pág. 287), Conforme indicado pelos exemplos acima, os grupos conhecidos
A técnica de comparação tem uma longa história de uso em
Se nossa compreensão de um construto nos leva a esperar pesquisa em uma variedade de disciplinas diferentes, e fornece
dois grupos diferirem no teste [escala], essa expectativa pode um meio de avaliar até que ponto a escala
ser testada diretamente. Assim, Thurstone e capta o fenômeno de interesse. Embora este método

MIS Trimestral Vol. 35 nº 2/ junho de 2011 319


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

de avaliar a validade é mais fraco do que a abordagem experimental maneira esperada. Segundo Cronbach e Meehl (1955, p. 290), “'tornar
porque fornece apenas evidência correlacional (em vez de causal), claro o que algo é' significa estabelecer as leis em que ele ocorre.
pode ser particularmente útil nas situações em que é difícil manipular Vamos nos referir ao sistema entrelaçado de leis que constituem uma
experimentalmente o atributo, propriedade, etc. de interesse. Assim, é teoria como uma rede nomológica”. Como observado por Bagozzi
surpreendente que este método raramente tenha sido usado em gestão (1980, p. 129), é importante especificar uma rede nomológica porque
e pesquisa de MIS. De fato, não encontramos nenhum exemplo em
nossa revisão da literatura. Consequentemente, este é um método que
a administração e os estudiosos do MIS podem querer adicionar ao seu não é suficiente para determinar a validade de construto
conjunto de ferramentas metodológicas. Por exemplo, Allen e Meyer focar apenas nos critérios semânticos da linguagem utilizada
(1990) identificaram três aspectos do comprometimento organizacional para representar conceitos e na relação entre conceitos e
(afetivo, de continuidade e normativo), mas argumentaram que operacionalizações. Tampouco é suficiente examinar apenas
fundamental para todos eles “é um vínculo entre o funcionário e a os critérios empíricos de consistência interna das
organização que diminui a probabilidade de rotatividade” (p. pág. 3). operacionalizações ou mesmo validade convergente e
Isso pode sugerir que as seguintes diferenças de grupo seriam discriminante. Em vez disso, deve-se também considerar a
observadas: (1) funcionários em tempo integral devem expressar níveis relação do conceito sob investigação com outros conceitos
mais altos de comprometimento organizacional do que funcionários em um contexto geral de uma estrutura teórica. Isso
envolverá ... o uso de critérios sintáticos em combinação com
temporários; (2) os executivos que recebem opções de compra de
ações como parte de sua remuneração devem estar mais comprometidos a modelagem de relações teóricas e empíricas .... A validade
nomológica pode ser interpretada como uma extensão dos
com a organização do que os executivos que não recebem tal
critérios anteriores para validade de construto - dada a
remuneração; (3) as pessoas que se voluntariam ou contribuem para
satisfação do significado teórico e observacional , a
organizações políticas devem estar mais comprometidas com essas
consistência interna das operacionalizações e a validade
organizações do que as pessoas meramente registradas como membros
convergente e discriminante – o significado de um conceito
dessas organizações; e (4) pode-se esperar que os funcionários do
teórico repousa, em parte, em seu papel nas sentenças que
sindicato sejam menos comprometidos com a organização para a qual
compõem as... proposições [teóricas].
trabalham do que os gerentes dessa organização.

Mais uma vez, é importante notar que esse procedimento difere para
Por exemplo, a confiança na validade das medidas de “comprometimento
construtos com indicadores formativos. Neste caso, o primeiro passo é
organizacional” deve aumentar se elas estiverem relacionadas a
identificar grupos de indivíduos, organizações, etc. que são altos ou medidas de outros construtos de maneira consistente com a teoria
baixos no atributo, propriedade, etc. medidos pelo indicador formativo.
anterior. Os demais construtos podem ser antecedentes, correlatos ou
Em seguida, deve ser realizado um teste para verificar se uma variável
consequências do construto de interesse identificado em pesquisas
dummy que representa a participação no grupo está significativamente anteriores. Isso é mostrado na Figura 4. Antecedentes são construções
relacionada às pontuações do indicador. Observe que isso implica que, que são hipotetizadas para causar a construção focal. Consequências
quando o modelo de medição é como o do Painel D da Figura 3, são são construtos que se supõe serem causados pelo construto focal. Cor
as subdimensões individuais que servem como indicadores formativos relaciona são construtos cujas definições conceituais se sobrepõem ao
do construto de segunda ordem em que os grupos devem diferir. Isso
construto focal. Nos estágios iniciais do desenvolvimento de um
significa que diferentes grupos podem ser necessários para estabelecer construto, a especificação da rede nomológica pode incluir apenas
a validade de grupos conhecidos de diferentes subdimensões. alguns outros construtos que deveriam servir como antecedentes,
consequências e/ou correlatos do construto focal, porque nenhuma
pesquisa anterior envolvendo o construto e pouca discussão teórica
sobre por que ele pode estar relacionado a outros construtos. Isso é
ilustrado pelas linhas sólidas na Figura 4.
Avaliar o Critério Nomológico e/ou
Validade Relacionada
No entanto, conforme indicado pelas linhas tracejadas nesta figura,
Além de estabelecer a validade dos indicadores do construto focal pesquisas adicionais sobre o construto muitas vezes resultam em uma
usando os métodos de validade baseados em experimentos ou grupos expansão da rede nomológica para incluir antecedentes, correlatos e
conhecidos, também é importante (1) especificar a natureza das consequências adicionais do construto focal, bem como potenciais
relações legais entre o construto focal e outros construtos e ( 2) testar mediadores e moderadores de seu construto. relações com outras
se os indicadores do construto focal se relacionam com medidas de variáveis. De fato, Cronbach e Meehl (1955, pp. 290-291) argumentam
outros construtos no que

320 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Figura 4. Exemplo de uma rede nomológica de um construto focal nos estágios iniciais e mais avançados do desenvolvimento
do construto

“Aprender mais sobre” uma construção teórica é uma das 8 consequências identificadas por Mathieu e Zajac.
questão de elaborar a rede nomológica na qual ela ocorre, De fato, como este exemplo ilustra, é natural que as redes
ou de aumentar a definição dos componentes. Pelo menos nomológicas se expandam à medida que a pesquisa sobre o
no início da história de um construto, a rede será limitada, construto focal aumenta.
e o construto ainda terá poucas conexões... Quando um
construto é relativamente novo, pode haver poucas Independentemente de se estar avaliando a validade nomológica de
associações especificáveis para definir o conceito. À construtos com indicadores formativos ou reflexivos, o procedimento
medida que a pesquisa avança, o construto lança raízes é o mesmo. Implica estimar os construtos latentes (de modo que o
em muitas direções, que o ligam a mais e mais fatos ou erro de medição seja controlado) e testar se as estimativas de suas
outros construtos. relações com antecedentes, correlatos e consequências hipotéticos
são significativamente diferentes de zero (com o sinal antecipado).
Por exemplo, todos os modelos mostrados na Figura 5 retratam as
Pesquisas adicionais também podem levar a um refinamento do relações entre o construto focal (representado como um construto
construto focal, seja expandindo sua dimensionalidade ou estreitando latente de segunda ordem) e seus antecedentes ou consequências.
sua definição ao longo do tempo, devido a novas descobertas Em cada uma dessas figuras, a relação entre o construto focal e um
empíricas e/ou a uma compreensão teórica mais precisa de como o de seus antecedentes ou consequências é marcada com um
construto focal se relaciona com outros construtos. asterisco (*). A significância estatística dos coeficientes para esses
caminhos fornece o teste-chave da validade nomológica dos
Por exemplo, Mathieu e Zajac (1990) articulam uma rede nomológica indicadores do construto focal. Se esses caminhos forem significativos,
bastante bem desenvolvida para a construção do comprometimento sugere que o construto focal se relaciona com outros construtos
organizacional que inclui antecedentes (por exemplo, características conforme especificado na rede nomológica, aumentando assim a
pessoais, estados de papel, características do trabalho, relações confiança na validade dos indicadores. Além disso, a magnitude do
grupo/líder e características organizacionais), correlatos ( por coeficiente completamente padronizado associado a esses caminhos
exemplo, envolvimento no trabalho) ou consequências (por exemplo, fornece uma indicação da força da relação entre o construto focal e
desempenho no trabalho, rotatividade e assiduidade). No entanto, seus antecedentes ou consequências, que podem ser avaliadas
nos estágios iniciais da pesquisa sobre comprometimento quanto à consistência com as expectativas teóricas. Por exemplo, se
organizacional (Mowday et al. 1979), a rede nomológica era muito a construção focal
mais simples e incluía apenas um dos 26 antecedentes, seis dos 14 correlatos e três

MIS Trimestral Vol. 35 nº 2/ junho de 2011 321


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Painel A Painel B

Antecedente * Focal
Construir
Antecedente
* Focal
Construir

Painel C Painel D

Focal Focal
Construir * Consequência Construir * Consequência

Figura 5. Ilustração das Relações entre um Construto Focal Multidimensional e seus Antecedentes
ou Consequências

espera-se que esteja fortemente relacionado a um dos outros construtos a adequação da estrutura multidimensional do foco
da rede nomológica devido a construir. No caso de uma multidimensionalidade endógena
similaridade, então os coeficientes não devem ser apenas construto focal com indicadores reflexivos (Figura 5, Painel A),
significativamente diferentes de zero, mas também grandes em magnitude. isso pode ser feito avaliando se um construto antecedente
tem um efeito direto nas subdimensões do construto focal além dos
Finalmente, é importante controlar vieses de métodos comuns efeitos indiretos que esse antecedente
ao realizar esses testes (DeVellis 1991). Caso contrário, o O constructo tem nas subdimensões através do próprio constructo focal.
relações observadas em apoio da validade nomológica (Esses efeitos diretos estão representados no Painel A
dos indicadores do construto focal com outros construtos da Figura 5 por linhas tracejadas.) Se os caminhos diretos são
pode ser espúrio. Conforme discutido por Podsakoff et al. (2003a), significativos, significa que o construto antecedente é responsável por
vieses do método podem ser pelo menos parcialmente controlados variação adicional em uma ou mais das subdimensões sobre
processualmente ou estatisticamente usando uma variedade de técnicas. Por e acima daquela explicada pelo construto focal, e é
construtos com indicadores reflexivos, seja um meio de controle provável que a subdimensão tenha alguma variação única que
pode ser usado. Para construtos com indicadores formativos, o não é capturado pela construção focal. Isso pode ser interpretado
meios processuais de controle podem ser prontamente aplicados, mas nem todos como evidência de que a estrutura multidimensional hipotética
dos métodos de controle estatístico pode ser usado em todos os modelos é inconsistente com os dados. No entanto, se as grandezas de
estrutura devido a problemas de identificação. os efeitos indiretos do antecedente nas subdimensões do
os construtos focais são substancialmente maiores do que as magnitudes
dos efeitos diretos do antecedente nas subdimensões, então ainda pode
Usando a Rede Nomológica para Avaliar a ser razoável concluir que
Validade da Estrutura Multidimensional o modelo de medição hipotético é suportado.

Edwards (2001) notou que as relações na rede nomológica também Da mesma forma, no caso de um foco multidimensional exógeno
podem ser bastante úteis para uma avaliação mais aprofundada. construto com indicadores reflexivos (Figura 5, Painel C), este

322 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

pode ser feito avaliando se as subdimensões do construto No caso de um construto focal multidimensional exógeno com
multidimensional têm efeitos diretos significativos em um construto indicadores formativos (Figura 5, Painel D), a adequação da
de consequência além do efeito direto que o construto focal tem estrutura multidimensional hipotética pode ser avaliada testando
na consequência (veja as linhas tracejadas Painel C da Figura 5). se as subdimensões do construto focal multidimensional têm
Em ambos os casos, a significância dos caminhos diretos pode efeitos diretos significativos em uma consequência construto, além
ser testada com um teste de diferença qui-quadrado dos modelos do efeito direto que o construto focal tem na consequência (veja
com e sem esses caminhos, ou examinando os índices de as linhas tracejadas no Painel D da Figura 5).13 Como observado
modificação, que mostram a melhoria esperada no ajuste se um acima, a significância desses caminhos diretos pode ser testada
parâmetro restrito for liberado. No entanto, é importante notar que, com um teste de diferença qui-quadrado de os modelos com e
para que os modelos sejam identificados, todos os caminhos sem esses caminhos, ou examinando os índices de modificação,
tracejados não podem ser somados ao mesmo tempo (Edwards que mostram a melhoria esperada no ajuste se um parâmetro
2001, p. 186). Se os caminhos diretos são significativos, isso restrito for liberado. Mais uma vez, é importante notar que (1) para
significa que as subdimensões do construto levam em conta a que o modelo no Painel D seja identificado, todos os caminhos
variância adicional no construto consequência além daquela tracejados não podem ser adicionados ao mesmo tempo, e
explicada pelo construto focal, e isso sugere que o construto focal consequências adicionais (ou medidas reflexivas gerais) teriam
não captura adequadamente todas as aspectos importantes de que ser adicionadas ( Edwards 2001, p. 186), e (2) se a magnitude
suas subdimensões (Edwards 2001). No entanto, se a magnitude do efeito do constructo focal sobre o constructo consequência for
do efeito do construto focal na consequência for substancialmente substancialmente maior do que as magnitudes combinadas dos
maior do que as magnitudes combinadas dos efeitos diretos das efeitos diretos das subdimensões sobre a consequência, então
subdimensões no construto consequência, então ainda pode ser ainda pode ser razão capaz de concluir que o modelo de medição
razoável concluir que o modelo de medição é suportado. é suportado.

No caso de um construto focal multidimensional endógeno com Avaliar a validade discriminante


indicadores formativos (Figura 5, Painel B), o teste da estrutura
Além de mostrar que os indicadores fornecem uma representação
multidimensional é complicado pelo fato de que esse modelo inclui
precisa do construto focal, e que eles se comportam em
implicitamente relacionamentos entre todos os construtos
exógenos, sugerindo assim que os efeitos diretos de o antecedente
nas subdimensões não pode ser utilizado para testar a adequação
O requisito é muito rigoroso, particularmente se o coeficiente único captura a grande
do modelo de mensuração hipotético. Em vez disso, Edwards maioria do efeito do antecedente em todas as subdimensões do construto. Por
(2001) argumenta que a adequação da estrutura multidimensional exemplo, se 80 a 90 por cento do efeito do antecedente em todas as subdimensões
hipotética pode ser avaliada usando um intervalo de confiança for adequadamente capturado pelo construto focal, isso parece sugerir que o construto
(baseado em erros padrão obtidos de procedimentos de bootstrap) focal é útil. Claro, é verdade que você poderia explicar 100 por cento do efeito do

para avaliar se o R2 para o efeito do antecedente no construto antecedente nas subdimensões tratando cada subdimensão como uma construção
separada, mas esse poder explicativo adicional tem um preço. Teoricamente, seria
focal é igual ao R2 das subdimensões do construto focal. Se ospor m
necessário desenvolver razões teóricas únicas pelas quais cada antecedente influencia
dois são equivalentes, pode ser interpretado como suporte para a cada subdimensão sem referência ao construto focal de ordem superior anteriormente
estrutura multidimensional hipotética do construto focal. pensado para ligar as subdimensões. Da mesma forma, seriam necessários raciocínios
Alternativamente, ele sugere que essa estrutura multidimensional teóricos únicos sobre por que cada subdimensão influencia outros construtos de
pode ser testada examinando se os efeitos diretos do antecedente consequências. Além disso, tratar as subdimensões como construtos não relacionados

em cada subdimensão (sem o construto focal no modelo) são eliminaria qualquer sentido do construto focal de ordem superior. Isso é problemático
porque, como observamos anteriormente neste artigo, muitos dos construtos em
iguais. Se forem, ele raciocina que nenhuma informação é perdida
gestão e MIS são conceituados em um nível de ordem superior.
ao usar o constructo focal para representar as subdimensões no
modelo. Este teste é baseado na suposição de que um único
coeficiente (o coeficiente do efeito do antecedente no construto
focal) deve representar completamente o efeito do antecedente 13Para uma perspectiva alternativa, ver Franke et al. (2008). Eles argumentam que
em todas as subdimensões, ou o construto focal está ocultando uma especificação de modelo de medição formativa implica que o construto latente

informações potencialmente úteis. 12 deve mediar completamente o efeito de seus indicadores em todas as outras variáveis
de resultado (por exemplo, em indicadores reflexivos ou outros construtos de
consequência com indicadores reflexivos) e que, se esse não for o caso , então o
modelo de medição deve ser rejeitado. Mais especificamente, com base em Bollen e
Davis (2009), eles argumentam que, se o construto latente medeia completamente os
efeitos dos indicadores em todas as variáveis de resultado, então certas restrições de
12No entanto, é importante notar que, embora este teste seja razoável, não está proporcionalidade nos coeficientes do modelo devem ser mantidas. Se essas
necessariamente implícito na estrutura do modelo, pelo que a sua adequação depende restrições de proporcionalidade não são válidas para um determinado indicador, há
se faz sentido conceptualmente. Alguém poderia argumentar que este motivos para duvidar de sua validade.

MIS Trimestral Vol. 35 nº 2/ junho de 2011 323


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

de forma consistente com a rede nomológica, também é importante é que ignora o erro de medição, o que pode atenuar a relação entre
mostrar que esses indicadores são distinguíveis dos indicadores de a pontuação da escala que representa o construto focal e outros
outros construtos. Como observado por Campbell e Fiske (1959, p. construtos. Isso é obviamente problemático, uma vez que a
84), “não se pode definir sem implicar distinções, e a verificação atenuação torna mais provável concluir que os construtos são
dessas distinções é uma parte importante do processo de validação”. distintos.
Isso é chamado de validade discriminante. Depois de definir a escala
de medição para cada construto, fixando sua variância em 1,0, a
validade discriminante pode ser avaliada para qualquer par de
Etapa 9: Validação cruzada da escala
construtos (1) restringindo a correlação estimada entre os construtos
a 1,0 e, em seguida, realizando um teste de diferença qui-quadrado
O próximo passo no processo de desenvolvimento da escala é
no valores obtidos para os modelos restrito e irrestrito, ou (2)
validar cruzadamente as propriedades psicométricas usando novas
construindo um intervalo de confiança em torno da estimativa de
amostras. Isso é particularmente importante se as modificações do
correlação e verificando se inclui o valor de 1,0.
modelo foram feitas no processo de desenvolvimento e refinamento
Observe que, embora uma correlação inferior a 1,0 seja uma da escala. As novas amostras devem ser outra população à qual se
condição necessária para demonstrar a validade discriminante, é espera que o construto se aplique. Para construtos com indicadores
melhor não considerá-la uma condição suficiente. Um método mais reflexivos, as estimativas de medidas obtidas da amostra de
rigoroso de avaliação da validade discriminante pode ser testar se a desenvolvimento podem ser comparadas com as estimativas obtidas
intercorrelação do construto é menor que 0,71. das amostras de validação usando os procedimentos recomendados
Embora não tenhamos conhecimento de nenhum uso desse por Steenkamp e Baumgartner (1998) e Vandenberg e Lance (2000).
procedimento na literatura, pode fazer sentido porque testaria se os Esses autores recomendam o uso de análise multigrupo para
construtos têm significativamente menos da metade de sua variância comparar uma série de modelos aninhados com restrições de
em comum. igualdade sistematicamente crescentes entre grupos para testar (1)
a equivalência das matrizes de covariância, (2) a equivalência
Alternativamente, para construtos com indicadores reflexivos, Fornell configural da estrutura fatorial, (3) a equivalência métrica das cargas
e Larcker (1981) sugeriram examinar se a variância média extraída fatoriais e (4) a equivalência escalar dos interceptos dos itens. Em
(AVE) para cada construto é maior que o quadrado da correlação seguida, esses autores apresentam várias opções de como proceder
entre os construtos. no teste da equivalência da variância do fator e da média nas
Conceitualmente, isso requer que cada construto latente seja amostras de desenvolvimento e validação. Steenkamp e Baumgartner
responsável por mais variância em seus próprios indicadores do que observam que muitas vezes a equivalência métrica completa das
compartilha com outro construto. Este teste deve ser realizado para cargas fatoriais não será suportada e, nesses casos, os pesquisadores
um par de construtos de cada vez, calculando a média das múltiplas devem testar se a equivalência métrica parcial é suportada.
correlações quadradas (ou calculando a média de suas cargas
quadradas de itens completamente padronizados) para cada um dos
dois indicadores do construto (separadamente), e então comparando
os valores de AVE ao quadrado da intercorrelação entre os dois Observe que este procedimento se aplica a uma estrutura fatorial
construtos de interesse. Se os dois construtos são distintos, então a de primeira ordem. No entanto, sua lógica pode ser aplicada a uma
correlação múltipla quadrática média para cada um deles deve ser estrutura fatorial de segunda ordem como a representada na Figura
maior que o quadrado de sua intercorrelação. 3 Painel C usando uma variação desse procedimento geral descrito
por Byrne e Stewart (2006). Os leitores interessados são encorajados
Para construtos com indicadores formativos, a validade discriminante a consultar o seu artigo.
pode ser avaliada usando os primeiros procedimentos descritos
acima para construtos com indicadores reflexivos (ou seja, testar se Embora os testes de equivalência discutidos acima tenham sido
os construtos são menos do que perfeitamente correlacionados ou originalmente desenvolvidos para construtos com indicadores
têm menos da metade de sua variância em comum), desde que o reflexivos, procedimentos análogos podem ser usados para
construto latente O construto foi identificado usando dois indicadores construtos com indicadores formativos como o mostrado na Figura
reflexivos e a escala de medição para o construto foi definida fixando 2, Painel C. Com exceção do artigo recente de Diaman topoulos e
a variância do construto em 1,00. Uma alternativa que pode ser Papadopoulos (2010), esta é uma questão que não tem recebido
usada quando essa condição não é atendida (ou seja, quando o muita atenção na literatura. Eles recomendam que os pesquisadores
construto latente não é identificado) é calcular uma pontuação da testem (1) a equivalência configuracional do padrão de relações
escala para o construto focal e testar se ele é menos do que entre os indicadores formativos e reflexivos e o construto latente
perfeitamente correlacionado com uma medida de outro construto composto, (2) a equivalência métrica das estimativas das relações
distinto . No entanto, a desvantagem de usar este procedimento

324 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

entre o construto latente composto e seus indicadores reflexivos, (3) criado estimando primeiro o modelo usando os dados de amostra de
a equivalência das estimativas dos efeitos dos indicadores formativos validação (SVal) para obter a matriz de covariância prevista (ÿ val) e,
^
sobre o construto latente composto e (4) a equivalência do termo de emdiferença
seguida, entre
calculando o valor
os dados mínimo da
de amostra de função de ajuste para
desenvolvimento a e
(SDev)
erro residual. Uma limitação desse procedimento (como o a matriz de covariância prevista da amostra de validação (ÿ val). O
descrevemos) é que ele não permite testar se a relação entre o CVI pode ser multiplicado por n-1 para produzir uma estatística qui-
^
construto latente e a variável usada para definir a escala de medição quadrado que reflete quão bem adematriz
amostra de covariância
desenvolvimento prevista
(ÿ Dev) é da
é equivalente entre os grupos, pois esse parâmetro é fixado em 1. responsável pelos dados da amostra de validação (SVal). Da mesma
Diamantopoulos e Papadopoulos recomendam um procedimento para forma, o índice de validação cruzada dupla pode ser multiplicado por
^
determinar se este parâmetro é equivalente entre os grupos antes de n-1apara produzir
matriz uma estatística
de covariância previstaqui-quadrado que
da amostra de reflete quão
validação bem
(ÿ Val) é
fazer as comparações descritas acima. No entanto, seus detalhes não responsável pelos dados da amostra de desenvolvimento (SDev). Em
são descritos aqui porque outros argumentaram que a equivalência princípio, os valores mínimos das funções de ajuste para as
^
métrica parcial entre grupos é suficiente (Byrne et al. 1989; Reise et comparações de validação cruzada e validação cruzada dupla podem
ser
al. usados para calcular uma variedade de diferentes índices de qualidade
de ajuste, incluindo a estatística qui-quadrado e GFI. Idealmente, seria
1993; Steenkamp e Baumgartner 1998). Mais especificamente, esses desejável que os qui-quadrados não fossem significativos e os GFIs
autores sugeriram que a invariância métrica completa não é necessária fossem acima de 0,90. Embora, até onde sabemos, esse procedimento
para que testes adicionais de invariância e análises substantivas tenha sido aplicado apenas a modelos com construtos com indicadores
sejam significativos, desde que pelo menos um item (além do fixado reflexivos, pode ser aplicável também para construtos com indicadores
na unidade para definir a escala de cada construto latente) seja formativos. Pesquisas futuras devem explorar essa questão.
metricamente invariável.

Mais uma vez, é importante notar que este procedimento se aplica a


uma estrutura fatorial de primeira ordem. No entanto, sua lógica pode
ser adaptada para validar cruzadamente uma estrutura fatorial de
segunda ordem semelhante à representada na Figura 3, Painel D, Passo 10: Desenvolva Normas para a Escala
mas com dois indicadores reflexivos do construto de segunda ordem
adicionados para fins de identificação. Para esse tipo de modelo, A etapa final no processo de desenvolvimento da escala é desenvolver
especulamos que os pesquisadores podem testar (1) a equivalência normas para auxiliar na interpretação dos escores na escala. Este
configuracional da estrutura completa, (2) a equivalência métrica das passo é importante porque, como observado por Spector (1992, p. 67),
estimativas das relações entre os fatores de primeira ordem e seus
indicadores reflexivos, (3) a equivalência métrica das estimativas das Para interpretar o significado dos escores, é útil saber algo
relações entre o construto latente composto de segunda ordem e seus sobre a distribuição dos escores em várias populações. A
indicadores reflexivos, (4) a equivalência das estimativas dos efeitos escala de medição para a maioria dos construtos nas
dos indicadores formativos de primeira ordem no construto latente ciências sociais é arbitrária. O significado de uma pontuação
composto e (5) ) a equivalência do termo de erro residual. Se testes só pode ser determinado em relação a algum quadro de
para diferenças nos interceptos dos indicadores reflexivos e/ou as referência.
médias dos fatores de primeira ordem neste modelo também forem A abordagem normativa, que forma a base para muitas
desejados, a lógica do procedimento de Byrne e Stewart (2006) pode medições das ciências sociais, usa a distribuição de
ser usada para modificar os passos acima. pontuações como esse quadro de referência. Assim, a
pontuação de um indivíduo é comparada com a distribuição
de pontuações. A pontuação é considerada alta se for maior
Outro meio de avaliar até que ponto os parâmetros do modelo de que a maior parte da distribuição, e é considerada baixa se
medição serão validados de forma cruzada com outras amostras é for menor que a maior parte da distribuição.
calculando o índice de validação cruzada (CVI) de Browne e Cudeck
(1983). O processo de cálculo do IVC é o seguinte: (1) dividir a
amostra em amostras de desenvolvimento e de validação; (2) estimar Estimar a distribuição da população requer administrar a escala a uma
o modelo utilizando a amostra de desenvolvimento mental (SDev) amostra representativa de membros da população de interesse
para obter a matriz de covariância prevista (ÿ Dev); e (3) calcular o (Urbina 2004). Se a população de interesse são gerentes em um
^
valor mínimo
amostra deda função de
validação ajuste
(SVal) e apara a diferença
matriz entre os
de covariância dadosda
prevista da determinado nível da hierarquia organizacional, então uma amostra
amostra de desenvolvimento (ÿ Dev). Os índices de validação cruzada representativa dessa população deve ser obtida. Por outro lado, se
dupla podem ser uma escala é projetada para medir atributos ou características dos
^
trabalhadores de TI, então um

MIS Trimestral Vol. 35 nº 2/ junho de 2011 325


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

deve ser obtida uma amostra representativa dessa população. às vezes pode ser desejável usar indicadores formativos para
As normas para uma dada população podem ser obtidas calculando representar fiel e completamente um determinado construto.
a média e o desvio padrão dos escores. Além disso, a forma da No entanto, outros (Howell et al. 2007a, 2007b; Kim et al.
distribuição (por exemplo, assimetria ou curtose) também deve ser 2010; Wilcox 2008) argumentam que o uso de indicadores formativos
examinada. Além do esforço extra associado à coleta desses dados deve ser evitado sempre que possível. Por exemplo, Howell et ai.
(que não é trivial), talvez a maior barreira para o desenvolvimento de (2007b) argumentaram que
normas de escala seja a dificuldade de obter amostras “representativas”
da população para a qual se deseja generalizar. a medida formativa não é uma alternativa igualmente
atraente à medida reflexiva e que sempre que possível, ao
desenvolver novas medidas ou escolher entre medidas
Outra consideração importante no desenvolvimento de normas de alternativas existentes, os pesquisadores devem optar pela
escala é o tamanho das amostras normativas. Conforme observado medida reflexiva (p. 205).

por Urbina (2004), a amostra precisa ser grande o suficiente para


garantir que os escores da escala obtidos sejam estáveis. No entanto,
Eles vão para
o tamanho da amostra normativa necessária varia de acordo com o
tamanho da população para a qual o pesquisador deseja gerar
sugerem fortemente que, ao projetar um estudo, os
normas. Por exemplo, medidas de habilidade generalizadas que são
pesquisadores devem tentar medir seus construtos
usadas para admissão em faculdades podem exigir amostras
reflexivamente com pelo menos três, e de preferência o
normativas que chegam a dezenas de milhares, enquanto amostras
maior número (praticamente) possível, indicadores
normativas para medidas que são aplicáveis apenas a membros de fortemente correlacionados que são unidimensionais para
grupos ocupacionais especializados podem exigir apenas centenas.
o mesmo construto (p. 216).

Uma consideração final no desenvolvimento e uso de normas de


Em nossa opinião, sua recomendação de medir tudo exclusivamente
escala é reconhecer que as normas podem mudar ao longo do tempo.
com indicadores reflexivos pode às vezes levar a problemas. Em
Por exemplo, sabe-se que as normas para o Scholastic Aptitude Test
primeiro lugar, como observado por Bollen (2007), as medidas
(SAT) mudaram ao longo do tempo, e isso é, sem dúvida, verdade
reflexivas apropriadas podem nem sempre estar disponíveis. Esse
para muitos outros tipos de escalas. Isso sugere que as normas pode ser o caso se um pesquisador tiver acesso apenas a dados
precisam ser atualizadas periodicamente e que o prazo durante o secundários e apenas indicadores formativos do construto focal estiverem disponíveis
qual as normas foram estabelecidas precisa ser especificado. Em segundo lugar, para capturar todo o domínio conceitual de um
construto multidimensional complexo, geralmente é necessário que
as medidas reflexivas gerais sejam mais gerais do que os indicadores
Para informações adicionais sobre o desenvolvimento de normas, os formativos usados para representar as subdimensões. Infelizmente,
leitores são encorajados a consultar a extensa literatura sobre este como observado por Converse e Presser (1986),
tópico (por exemplo, Jaeger 1984; Levy e Lemeshow 1999; Sudman
1976). No entanto, devido à dificuldade em obter amostras
representativas de tamanho suficiente, provavelmente é justo dizer Quanto mais geral a questão, mais ampla a gama de
que poucas escalas relatadas na área de sistemas de informação interpretações que ela pode dar. Em contraste, palavras
gerencial possuem normas bem estabelecidas. No entanto, esta é específicas e concretas são mais aptas a comunicar um
uma informação útil e ter alguns dados sobre a distribuição de significado uniforme (p. 31).
pontuações em diferentes amostras pode ser útil, uma vez que ter
algum contexto é provavelmente melhor do que não ter nenhum. Relacionado a isso, outra desvantagem de confiar exclusivamente
em medidas reflexivas geralmente formuladas é que a pesquisa
mostrou que esses tipos de medidas estão mais sujeitos a efeitos de
contexto do que medidas formuladas mais especificamente (Schuman
e Presser 1996). Em quarto lugar, Bollen (2007) observou que confiar
Questões Adicionais Relacionadas a Construções exclusivamente em indicadores reflexivos globais para representar
com Indicadores Formativos um construto que tradicionalmente tem sido medido com indicadores
formativos pode mudar a natureza (ou o significado) do construto:
Nossa discussão das etapas do processo de validação de construto
acima é baseada na suposição de que considerações conceituais
determinam a especificação do modelo de medição para o construto status socioeconômico (SES) pode ser mensurável através
focal. Argumentamos que, por razões conceituais, de avaliações subjetivas de uma pessoa

326 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

ficar com auto-relatos ou relatos de outros. Dois pontos não valem nada. Primeiro, em nenhum dos casos o
Infelizmente, isso confunde o SES subjetivo com o SES significado empírico do construto latente (ou seja, os valores de 5, 4
objetivo, em que o primeiro explora percepções, enquanto e 2) corresponde ao significado nominal do construto conforme
o segundo chega à posição de uma pessoa por meio de definido com base na teoria. Em segundo lugar, nesses casos, as
variáveis mais objetivas, como educação, renda, ocupação diferenças no significado empírico do construto se devem a diferentes
e assim por diante. SES subjetivo e SES objetivo são percepções do significado da pergunta (ou seja, diferentes
construtos diferentes, possivelmente com causas e interpretações do que está sendo medido), e não a quaisquer
consequências diferentes. Posso imaginar medir o SES diferenças no nível geral de desempenho dos respondentes.
subjetivo com indicadores de efeito (reflexivos) mais satisfação no trabalho. Se, em vez disso, essas pessoas tivessem
facilmente do que posso imaginar medir o SES objetivo sido solicitadas a relatar o quão satisfeitas estavam com cada uma
com indicadores de efeito (reflexivos). Ou considere a das facetas incluídas na definição do construto, e esses itens fossem
exposição real à violência na mídia como uma variável usados como indicadores formativos do construto satisfação no
latente. Poderíamos perguntar aos indivíduos suas trabalho, o significado empírico do construto teria correspondido mais
percepções sobre a quantidade total de violência que eles de perto ao significado nominal de construto conforme definido por
normalmente observam na mídia, e indicadores de efeito Smith et al. Assim, em casos como este, confiar exclusivamente em
(reflexivos) poderiam explorar essa percepção de exposição indicadores reflexivos globais do construto focal pode produzir uma
à violência. Mas essas percepções podem diferir da discrepância maior entre o significado nominal do construto e seu
exposição total real à violência na mídia. Esta última significado empírico do que se forem utilizados indicadores formativos,
variável latente pode exigir indicadores causais (formativos) ou uma combinação de indicadores formativos e reflexivos.
que medem a quantidade de tempo gasto assistindo a
filmes violentos, televisão violenta, jogos violentos, revistas
violentas e assim por diante. À primeira vista, pode-se pensar que uma forma de reduzir a
Se a exposição real ou percebida deve ser usada depende discrepância entre o significado empírico e nominal do construto focal
das hipóteses a serem testadas, mas esses conceitos não seria referir-se explicitamente a todas as facetas do indicador reflexivo
são necessariamente intercambiáveis (p. 227). “global”. Por exemplo, uma medida global de satisfação no trabalho
pode ser formulada de tal forma que peça aos respondentes que
pensem explicitamente em quão satisfeitos eles estão com vários
Quinto, usar apenas indicadores reflexivos globais no lugar dos aspectos de seu trabalho quando estão avaliando sua satisfação
indicadores formativos de um construto de ordem superior pode geral (por exemplo, “De um modo geral, quão satisfeitos eles estão?
diminuir a correspondência entre o significado empírico do construto você está com seu trabalho, remuneração, colegas de trabalho,
e seu significado nominal, porque não sabemos se o respondente supervisor e oportunidades de promoção?”). No entanto, a
está considerando todas as subdimensões (facetas) do construto desvantagem dessa abordagem é que (1) ela torna a questão
focal que fazem parte da definição nominal ao responder à questão cognitivamente complexa porque é de duplo, triplo ou quádruplo
global. (Tourangeau et al. 2000), e (2) o pesquisador não tem como dizer
Isso pode ser ilustrado no caso em que a satisfação no trabalho é precisamente como o facetas estão sendo combinadas pelos
nominalmente definida como um construto multidimensional. Por respondentes para gerar sua resposta à pergunta.
exemplo, de acordo com Smith et al. (1969), a satisfação no trabalho Embora isso não sugira que mencionar explicitamente as
pode ser definida como consistindo em cinco facetas distintas subdimensões seja uma má ideia, sugere que não se pode confiar
(satisfação com o trabalho, remuneração, promoção, supervisão e exclusivamente nesse tipo de pergunta para medir o construto.
colegas de trabalho). Se medirmos esse construto exclusivamente
com um item reflexivo global como “No geral, quão satisfeito você
está com seu trabalho”, uma pessoa pode considerar o quanto está Alternativamente, pode-se tentar reduzir a discrepância entre o
satisfeita com a natureza do trabalho e/ou o nível de remuneração significado empírico e nominal do construto medindo cada
que ela recebe e relata um valor de 5 na medida global de satisfação no trabalho de sete pontos.
subdimensão com itens separados e, em seguida, usando o conjunto
Outra pessoa pode considerar o quanto está satisfeita com seus de itens como indicadores reflexivos do construto focal. No entanto,
colegas de trabalho e/ou as oportunidades de avanço na organização neste caso, onde as subdimensões são vistas como características
e relatar um valor de 4 na medida global de satisfação no trabalho. definidoras do construto focal, o uso de medidas formativas como se
Ainda outra pessoa pode avaliar como se sente agora enquanto está fossem medidas reflexivas resultará (1) em erro de especificação do
sentado no trabalho preenchendo um questionário bastante chato de modelo de medição e viés de estimativa (Jarvis et al. 2003; MacKenzie
um pesquisador que ele não conhece e relatar um valor de 2 na et al. 2005; Petter et al. 2007), e (2) causar a
medida global de satisfação no trabalho.

MIS Trimestral Vol. 35 nº 2/ junho de 2011 327


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

o significado do construto deve ser definido em termos de variância (2001). Ele sugere que o coeficiente de determinação total ou R2
comum, ao invés de variância total14 (Law e Wong 1999). multivariado que representa a proporção da variância generalizada em
um conjunto de variáveis dependentes explicadas por uma ou mais
Assim, embora confiar exclusivamente em indicadores reflexivos variáveis independentes pode ser usado como uma estimativa do
possa funcionar bem para alguns construtos, para outros a efeito total de um antecedente em um conjunto de variáveis
representação do construto seria melhorada complementando os independentes. subdimensões de um construto. Da mesma forma,
indicadores reflexivos com indicadores formativos, e para outros ainda uma estimativa do efeito total de um conjunto de subdimensões em
os indicadores formativos podem ser a única escolha do pesquisador. um construto de consequência pode ser avaliada pela soma das
Howell et ai. (2007b) recomendaram que, quando a medição reflexiva correlações quadradas entre o construto de consequência e as
de um construto é inviável ou impossível, os indicadores formativos subdimensões e dividindo pelo número de subdimensões. Observe,
devem ser modelados como construtos unidimensionais separados. A no entanto, que este procedimento assume que todo o efeito das
principal vantagem dessa abordagem é que ela evita os problemas subdimensões em um construto consequência, ou todo o efeito de um
associados ao uso de modelos de medição com indicadores formativos. construto antecedente no conjunto de subdimensões, pode ser
atribuído ao construto superordenado hipoteticamente associado ao
subdimensões. A única maneira de decompor o efeito de (sobre) o
No entanto, essa abordagem apresentaria vários desafios. constructo superordenado sobre (de) um constructo consequência (um
Primeiro, tratar as subdimensões como construtos separados exigiria antecedente), dos efeitos totais de (sobre) as subdimensões sobre (de)
que os pesquisadores esclarecessem o raciocínio teórico para as a consequência (um antecedente) construto seria estimar um modelo
relações entre cada uma das subdimensões individuais e os outros que inclui um construto de segunda ordem.
construtos que elas incluem em seu modelo hipotético. Embora isso
possa levar a teorias mais bem articuladas, pode representar um
desafio considerável para os pesquisadores, particularmente nos Assim, embora tratar as subdimensões de um construto
casos em que existem vários construtos multidimensionais em um multidimensional como construtos separados tenha algumas
modelo ou quando os construtos multidimensionais são novos. Em vantagens, também apresenta algumas desvantagens. Acreditamos
segundo lugar, é importante notar que se um pesquisador trata as que a decisão de incluir explicitamente um construto multidimensional
subdimensões como construtos separados, então ele não pode superordenado em um modelo ou não é uma decisão que os
decompor o efeito total de cada subdimensão em uma variável de pesquisadores terão que decidir com base em suas necessidades
resultado na proporção do efeito que é devido ao superordenado. conceituais. Concordamos com Edwards (2001, p. 152) que ambas as
construto e a proporção que se deve a fatores específicos da abordagens têm mérito:
subdimensão, sem modelar explicitamente o construto superordenado.
Defensores de construções multidimensionais endossam
generalidade, amplitude e simplicidade, enquanto os críticos
Finalmente, talvez o problema mais sério com essa abordagem seja promovem especificidade, precisão e exatidão. Dado que
que ela ignora o fato de que muitos dos construtos mais amplamente ambos os conjuntos de objetivos são louváveis, os
estudados nas áreas de SIG (por exemplo, credibilidade da fonte, pesquisadores seriam mais bem servidos por uma
recursos percebidos pelo usuário, desempenho do vendedor, abordagem integrativa do que por admoestações para adotar um lado do debate.
aprendizado observacional, desempenho da empresa) e gerenciamento
(por exemplo, satisfação no trabalho, comprometimento organizacional,
confiança, desempenho no trabalho, liderança transformacional) são
frequentemente conceituados como multidimensionais ou multifacetados. Discussão Geral e Conclusão
Isso representa um problema porque as construções multidimensionais
são valorizadas por sua generalidade, amplitude e simplicidade Acreditamos que este artigo traz várias contribuições para a literatura.
(Edwards 2001). Quando as subdimensões são modeladas como Primeiro, há pouca orientação na literatura sobre como definir
construtos separados, o modelo empírico testado não reconhece construtos teóricos. Esta é uma omissão grave, porque a falha em
nenhuma conexão conceitual entre essas subdimensões e o construto definir adequadamente um construto cria uma série de problemas que
superordenado. Uma maneira pela qual essa conexão conceitual pode prejudicam não apenas a validade do construto, mas também a
ser levada em consideração foi discutida por Edwards validade interna e a validade estatística da conclusão (MacKenzie
2003). Em segundo lugar, embora existam alguns artigos escritos
sobre processos de desenvolvimento de escala e validação de
construtos nas últimas décadas, esses artigos tendem a se concentrar
14Observe que definir empiricamente o construto latente em termos de
mais em modelos de medição reflexivos do que em modelos de
variância total seria mais consistente com a definição conceitual do
medição formativos.
construto do que definir o construto latente em termos de variância comum.

328 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Portanto, uma das contribuições desta pesquisa é que ela fornece recomendações discutidas neste artigo em um único estudo, seja
um conjunto mais abrangente de recomendações sobre como o por falta de tempo ou recursos, ou ambos. De fato, como observado
processo de desenvolvimento da escala deve levar em conta a por Nunnally e Bernstein (1994),
relação direcional entre os indicadores e o construto latente que se
pretende medir. Em terceiro lugar, este artigo identifica uma limitação Cada cientista pode realizar apenas um número
fundamental dos testes de validade nomológica amplamente relativamente pequeno de grandes estudos durante a vida.
utilizados e discute como as técnicas de comparação de grupos Isso deixa tempo insuficiente para fazer tudo o que é
experimentais e conhecidos podem ser usadas para obter necessário para especificar o domínio de um construto,
informações críticas que não sofrem dessa limitação. Ambas as desenvolver medidas do construto e relacionar essas
técnicas para estabelecer a validade de construto têm uma longa medidas a outras variáveis de interesse (pp. 87-88).
tradição nas ciências sociais (Cronbach e Meehl 1955), mas
raramente são usadas nas áreas de gestão ou MIS. Com isso em mente, gostaríamos de oferecer algumas sugestões
Finalmente, este artigo aborda essas questões e as integra em um para estabelecer prioridades em situações em que não é prático
conjunto abrangente de etapas que os pesquisadores podem usar realizar todas as etapas.
para orientar seu desenvolvimento de escala e construir esforços de
validação. Primeiro, porque muitas coisas dependem de uma definição
conceitual clara, essa é uma etapa do processo que nunca deve ser
Todos os 10 passos que descrevemos são importantes para o negligenciada em um estudo de validação de escala. De maneira
desenvolvimento de escalas válidas. Sem uma definição clara, é mais geral, recomendamos focar mais atenção no front-end do
difícil evitar contaminação e deficiências no conjunto de itens processo - fornecer uma definição conceitual clara e desenvolver
utilizados para representar o construto ou para especificar a relação indicadores que explorem adequadamente o domínio do construto e
entre o construto e seus indicadores. Se os indicadores não especificar adequadamente o modelo de medição - do que na
capturarem adequadamente o domínio do construto, pode haver validação cruzada da escala e no desenvolvimento de normas para
pouco valor em examinar suas propriedades psicométricas ou as isto. Outra maneira de economizar pode ser combinar algumas das
relações entre esses indicadores e os indicadores de outros etapas do processo. Por exemplo, um pesquisador pode coletar
construtos. Se o modelo de medição for especificado de forma dados de uma grande amostra e dividir essa amostra em subamostras
inadequada, pode levar a descartar de forma inadequada itens que de desenvolvimento e validação. A amostra de desenvolvimento
são necessários para capturar o domínio completo do construto, pode então ser usada para purificar e refinar a escala, e a amostra
resultar no uso de índices de avaliação de escala inadequados e de validação pode ser usada para examinar a validade nomológica,
estimativas de viés das relações entre o construto e outros discriminante e convergente. No entanto, como observamos
construtos . Se o pesquisador não testar adequadamente o modelo anteriormente, essa estratégia só funcionará se o pesquisador estiver
de medição e avaliar a escala, é difícil determinar se as relações de retirando itens da escala, em vez de adicionar ou modificar os itens.
medição hipotéticas são consistentes com os dados ou saber como Da mesma forma, os pesquisadores também podem combinar
refinar a escala para melhorar suas propriedades psicométricas. A esforços de validação cruzada com o desenvolvimento de normas
menos que a validade da escala seja avaliada adequadamente de escala porque essas duas etapas são sinérgicas, pois ambas
usando manipulações experimentais, comparando grupos conhecidos exigem a coleta de dados de amostras diferentes. Finalmente, os
por diferirem no construto, testando as relações entre o construto pesquisadores podem optar por omitir algumas das técnicas mais
focal e outros construtos em sua rede nomológica e examinando se sofisticadas, como o procedimento que descrevemos para usar a
o construto focal é distinto de outros semelhantes. construtos, o rede nomológica para avaliar a validade de uma estrutura
pesquisador não terá certeza se as pontuações na escala covariam multidimensional. Dito isto, um conjunto de atividades que achamos
com o fenômeno que a escala pretende medir. que não devem ser omitidas é testar rigorosamente se os escores
da escala covariam com o fenômeno que a escala pretende medir,
seja por meio de manipulações experimentais do construto focal,
A menos que a escala seja validada de forma cruzada entre comparações de grupos conhecidos por diferirem no construto focal,
populações, situações e tempo, será difícil avaliar os limites de sua ou testes das relações entre o construto focal e outros construtos.
generalização ou sua utilidade em outros contextos.
Finalmente, sem normas adequadamente estabelecidas para a
escala, é difícil determinar em sentido absoluto o significado de uma
determinada pontuação na escala. Em resumo, o objetivo deste artigo não era articular todas as técnicas
possíveis que os pesquisadores deveriam usar para validar escalas
Dito isso, reconhecemos que limitações práticas podem impedir os recém-desenvolvidas, mas seguir a liderança de Churchill (1979)
pesquisadores de acompanhar todos os fornecendo um conjunto atualizado de diretrizes que

MIS Trimestral Vol. 35 nº 2/ junho de 2011 329


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

pesquisadores poderiam usar para melhorar a qualidade das medidas Modelagem de Equações”, Modelagem de Equações Estruturais (9:1),
usadas na pesquisa nas ciências comportamentais. Esperançosamente, pp. 78-102.

eles serão úteis para aqueles que realizam pesquisas em MIS e nas Bandalos, DL, e Finney, SJ 2001. “Questões de Parcelamento de Itens em
ciências comportamentais. Modelagem de Equações Estruturais”, em Modelagem Avançada de
Equações Estruturais: Novos Desenvolvimentos e Técnicas, GA Marcou
lides e RE Schumacker (eds.), Mahwah, NJ: Lawrence Erlbaum, pp
269-296.
Referências Barrick, MR, Mount, MK e Judge, TA 2001. “Personalidade e desempenho
no trabalho no início do novo milênio: o que sabemos e para onde vamos
Allen, NJ, e Meyer, JP 1990. “A Medição e Antecedentes do Compromisso
em seguida?”, International Journal of Selection and Assessment (9:1 -2),
Afetivo, de Continuidade e Normativo com a Organização”, Journal of
pp. 9-30.
Occupational Psychology (63:1), pp. 1-18.
Baumgartner, H., e Steenkamp, JB. EM 2006. “Um Paradigma Estendido
para Análise de Medição de Construções de Marketing Aplicáveis a
Anastasi, A., e Urbina, S. 1997. Testes Psicológicos (7ª ed.).
Dados de Painel”, Journal of Marketing Research (43:3), pp. 431-442.
Upper Saddle River, NJ: Prentice Hall.
Anderson, JC, e Gerbing, DW 1988. “Modelagem de Equações Estruturais
Bharadwaj, AS 2000. “A Resource-Based Perspective on Information
na Prática – Uma Revisão e Abordagem Recomendada em Duas Etapas”,
Technology Capability and Firm Performance: An Empiriical Study,” MIS
Psychological Bulletin (103:3), pp. 411-423.
Quarterly (24:1), pp.169-196.
Anderson, JC, e Gerbing, DW 1991. “Prevendo o desempenho de medidas
Blalock, HM, Jr. 1964. Inferências Causais em Não Experimental
em uma análise fatorial confirmatória com uma avaliação pré-teste de
Research, Nova York: WW Norton.
suas validades substantivas”, Journal of Applied Psychology (76:5), pp.
Bollen, KA 1989. Equações estruturais com variáveis latentes, Nova York:
732-740.
John Wiley.
Anderson, JC, Gerbing, DW, e Hunter, JE 1987. “Sobre a avaliação da
medição unidimensional – consistência interna e externa e critérios de Bollen, KA 2007. “Interpretational Confounding Is Due to Mis Specification,
Not to Type of Indicator: Comment on Howell, Breivik e Wilcox (2007)”,
consistência geral”, Journal of Marketing Research (24:4), pp. 432-437.
Psychological Methods (12:2), pp. 219-228.

Avolio, BJ, Bass, BM e Jung, DI 1999. “Reexaminando os Componentes da


Bollen, KA 2011. “Avaliando Efeitos, Compostos e Indicadores Causais em
Liderança Transformacional e Transacional Usando o Questionário de
Liderança Multifatorial”, Journal of Occupational and Organizational Modelos de Equações Estruturais”, MIS Quarterly (35:2), pp. 359-372.

Psychology (72:4), pp. 441- 462.


Bollen, KA e Davis, WR 2009. “Modelos de indicadores causais: identificação,

Bagozzi, RP 1980. Modelos Causais em Marketing, Nova York: John estimativa e teste”, Modelagem de Equações Estruturais (16:3), pp.

Wiley. 498-522.
Bagozzi, RP 2007. “Sobre o significado da medição formativa e como ela Bollen, KA, e Lennox, R. 1991. "Sabedoria Convencional sobre Medição:
difere da medição reflexiva: Comentário sobre Uma Perspectiva de Equação Estrutural", Psychological Bulletin (110:2),
Howell, Breivik e Wilcox (2007),” Psychological Methods (12:2), pp. pp. 305-314.
229-237. Bollen, KA, e Ting, KF. 2000. “A Tetrad Test for Causal Indicators,”
Bagozzi, RP 2010. “Modelos de equações estruturais são ferramentas de Psychological Methods (5:1), pp. 3-22.
modelagem com muitas ambiguidades: comentários reconhecendo a Borsboom, D. 2005. Medindo a Mente: Questões Conceituais em Psicometria
necessidade de cautela e humildade em seu uso”, Journal of Consumer Contemporânea, Cambridge, Reino Unido: Cambridge University Press.
Psychology (20:2), pp. 208-214.
Bagozzi, RP, e Heatherton, TF 1994. “Uma Abordagem Geral para Boudreau, MC., Gefen, D., e Straub, DW 2001. “Validation in Information
Representar Construções de Personalidade Multifacetadas: Aplicação à Systems Research: A State-of-the-Art Assessment”, MIS Quarterly (25:1),
Autoestima do Estado”, Modelagem de Equações Estruturais (1:1), pp. pp. 1-16.
35-67. Browne, MW, e Cudeck R. 1983. "Cross-Validation of Covariance Structures",
Bagozzi, RP, e Phillips, LW 1982. "Representando e Testando Teorias Multivariate Behavioral Research (18:2), pp. 147-167.
Organizacionais: A Holistic Construal," Admin istrative Science Quarterly
(27:3), pp. 459-489. Burt, RS 1976. “Interpretational Confounding of Unobserved Variables in
Bagozzi, RP, Yi, Y., e Phillips, LW 1991. “Avaliando a validade do construto Structural Equation Models”, Sociological Methods and Research (5), pp.
na pesquisa organizacional”, Administrative Science Quarterly (36:3), pp. 3-52.
421-458. Byrne, BM, Shavelson, RI, e Muthen, B. 1989. “Teste para a equivalência de
Bagozzi, RP, Tybout, AM, Craig, CS e Sternthal, B. 1979. covariância de fatores e estruturas médias: a questão da invariância de
“A validade construtiva da classificação tripartida de atitudes”, Journal of medição parcial”, Psychological Bulletin (105:3), pp. 456-466.
Marketing Research (16:1), pp. 88-95.
Bandalos, DL 2002. “Os Efeitos do Parcelamento de Itens na Qualidade de Byrne, BM, e Stewart, SA 2006. “A Abordagem MACS para Teste de
Ajuste e Viés de Estimativa de Parâmetros em Estruturas Invariância Multigrupo de uma Estrutura de Segunda Ordem:

330 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

A Walk Through the Process”, Structural Equation Modeling—A Uma comparação e ilustração empírica”, British Journal of Management
Multidisciplinary Journal (13:2), pp. 287-321. (17:4), pp. 263-282.
Cammann, C., Fichman, M., Jenkins, D. e Klesh, J. 1983. Diamantopoulos, A., e Winklhofer, HM 2001. “Construção de Índices com
“Avaliando as Atitudes e Percepções dos Membros Organizacionais”, Indicadores Formativos: Uma Alternativa ao Desenvolvimento de Escala”,
em Avaliação da Mudança Organizacional: Um Guia para Métodos, Journal of Marketing Research (38:2), pp. 269-277
Medidas e Práticas, S. Seashore, EE Lawler, P. Mirvis e C. Cammann
(eds.), Nova York: John Wiley & Sons, pp. 71-138. Doll, WJ, e Torkzadeh, G. 1988. “The Measurement of End-User Satisfaction”,
MIS Quarterly (12:2), pp. 259-274.
Campbell, DT, e Fiske, DW 1959. “Validação convergente e discriminante Edwards, JR 2001. “Multidimensional Constructs in Organizational Behavior
pela matriz multitraço-multimétodo”, Research: An Integrative Analytical Frame work”, Organizational
Psychological Bulletin (56:2), pp. 81-105. Research Methods (4:2), pp. 141-192.
Carlson, L., e Grossbart, S. 1988. “Parental Style and Consumer Socialization Edwards, JR 2003. “Construir Validação na Pesquisa do Comportamento
of Children”, Journal of Consumer Research (15:1), pp. 77-94. Organizacional”, em Comportamento Organizacional: O Estado da
Ciência, J. Greenberg (ed.), Mahwah, NJ: Lawrence Erlbaum Associates,
Cattell, RB 1978. The Scientific Use of Factor Analysis, New pp. 327-371.
York: Plenum Press. Edwards, JR, e Bagozzi, RP 2000. “Sobre a natureza e a direção das
Chaplin, WF, John, OP e Goldberg, LR 1988. “Concepções de Estados e relações entre construções e medidas”,
Traços: Atributos Dimensionais com Ideais como Métodos Psicológicos (5:2), pp. 155-174.
Protótipos”, Journal of Personality and Social Psychology (54:4), pp. Everitt, BS 1975. "Análise Multivariada: A Necessidade de Dados e Outros
541-557. Problemas", British Journal of Psychiatry (126:2), pp. 237-240.
Churchill, GA, Jr. 1979. “Um Paradigma para o Desenvolvimento de Melhores
Medidas de Construções de Marketing”, Journal of Marketing Research Fornell, C., e Larcker, DF 1981. “Avaliando Modelos de Equações
(16:1), pp. 64-73. Estruturais com Variáveis Inobserváveis e Erro de Medição”, Journal of
Clark, LA, e Watson, D. 1995. “Construindo Validade: Questões Básicas no Marketing Research (18:1), pp. 39-50.
Desenvolvimento de Escalas Objetivas”, Avaliação Psicológica (7:3), pp. Franke, GR, Preacher, KJ e Rigdon, EE 2008. “Efeitos estruturais
309-319. proporcionais de indicadores formativos”, Journal of Business Research
Comrey, AL, e Lee, HB 2002. Um primeiro curso em fator (61:12), pp. 1229-1237.
Análise, Hillsdale, NJ: Lawrence Erlbaum. Gefen, D. 2003. “Validade Unidimensional: Uma Explicação e um Exemplo,”
Converse, JM, e Presser, S. 1996. Perguntas da Pesquisa: Elaboração do Comunicações do AIS (12:2), pp. 23-47.
Questionário Padronizado, Newbury Park, CA: Sage Publications. Gerbing, DW e Anderson, JC 1984. “Sobre o significado dos erros de
medição correlacionados dentro do fator”, Journal of Consumer Research
Cortina, JM 1993. “O que é coeficiente alfa? Um Exame de Teoria e (11:1), pp. 572-580.
Aplicação”, Journal of Applied Psychology (78:1), pp. 98-104. Gerbing, DW e Anderson, JC 1988. “Um Paradigma Atualizado para
Desenvolvimento de Escala Incorporando Unidimensionalidade e sua
Cronbach, LJ, e Meehl, PE 1955. “Construir Validade em Testes Avaliação”, Journal of Marketing Research (25:2), pp. 186-192.
Psicológicos”, Psychological Bulletin (52:4), pp. 281-302.
Davis, FD 1989. "Utilidade percebida, facilidade de uso percebida e Goertz, G. 2006. Conceitos de Ciências Sociais: Um Guia do Usuário,
aceitação do usuário da tecnologia da informação", MIS Quarterly (13:3), Princeton, NJ: Princeton University Press.
pp. 318-346. Gorsuch, RL 1983. Factor Analysis (2ª ed.), Hillsdale, NJ:
DeVellis, RF 1991. Desenvolvimento de Escala: Teoria e Aplicações, Lawrence Erlbum.
Newbury Park, CA: Sage Publications. Greenwald, AG, e Farnham, SD 2000. “Usando o Teste de Associação
Diamantopoulos, A. 2006. “O Termo de Erro em Modelos de Medição Implícita para Medir a Autoestima e o Autoconceito”,
Formativa: Interpretação e Implicações de Modelagem,” Journal of Personality and Social Psychology (79:6), pp. 1022-1038.
Journal of Modeling in Management (1:1), pp. 7-17.
Diamantopoulos, A. 2011. “Incorporando Medidas Formativas em Modelos Hall, RJ, Snell, AF, e Singer-Foust, M. 1999. "Estratégias de Parcelamento
de Equações Estruturais Baseados em Covariância”, MIS Quarterly de Itens em SEM: Investigando os Efeitos Sutis de Construções
(35:2), pp. 335-358. Secundárias Não Modeladas", Métodos de Pesquisa Organizacional
Diamantopoulos, A., e Papadopoulos, N. 2010. “Avaliando a Invariância (2:3), pp. 233-256.
Transnacional de Medidas Formativas: Diretrizes Hancock, GR, e Mueller, RO 2001. “Repensando a Confiabilidade Construída
para Pesquisadores de Negócios Internacionais”, Journal of International em Sistemas de Variáveis Latentes”, em Modelagem de Equações
Business Studies (41:2), pp. 360-370. Estruturais: Presente e Futuro – A Festschrift em homenagem a Karl
Diamantopoulos, A., Reifler, P., e Roth, KP 2008. “Advancing Formative Jöreskog, R. Cudeck, S. du Toit e D. Sörbom (eds.), Lincolnwood, IL:
Measurement Models”, Journal of Business Research (61:12), pp. Scientific Software International Inc., pp. 195-216.
1203-1218.
Diamantopoulos, A., e Siguaw, JA 2006. “Indicadores Formativos Versus Haynes, SN, Richard, DCS e Kubany, ES 1995. “Validade de conteúdo na
Reflexivos no Desenvolvimento de Medidas Organizacionais: avaliação psicológica: uma abordagem funcional

MIS Trimestral Vol. 35 nº 2/ junho de 2011 331


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

a Conceitos e Métodos”, Avaliação Psicológica (7:3), pp. 238-247. Kerlinger, FN 1973. Fundamentos da Pesquisa Comportamental (2º
ed.), Nova York: Holt McDougal.
Heimberg, RG, e Holaway, RM 2007. “Exame da Validade de Grupos Kim, G., Shin, B. e Grover, V. 2010. “Investigando duas visões contraditórias
Conhecidos da Escala de Ansiedade Social de Liebowitz,” de medição formativa na pesquisa de sistemas de informação”, MIS
Depressão e Ansiedade (24:7), pp. 447-454. Quarterly (34:2), pp. 345-365.
Hempel, CG 1970. “Fundamentos da Formação de Conceitos na Ciência Kozlowski, SWJ, e Klein, KJ 2000. “A Multilevel Approach to Theory and
Empírica”, em Fundamentos da Unidade da Ciência (Vol. Research in Organizations: Contextual, Temporal, and Emergent
2), O. Neurath, R. Carnap e C. Morris (eds.), Chicago: University of Processes,” em Multilevel Theory, Research, and Methods in
Chicago Press, pp. 653-740. Organizations: Foundations, Extensions, and New Direction, KJ Klein e
Hinkin, TR 1995. "Uma Revisão de Práticas de Desenvolvimento de Escala SWJ Kozlowski (eds.), San Francisco: Jossey-Bass, pp. 3-90.
no Estudo de Organizações", Journal of Management (21:5), pp. 967-988.

Lastovicka, JL, Betencourt, LA, Hughner, RS, e Kuntze, RJ 1999. “Estilo de


Hinkin, TR, e Tracey, JB 1999. “An Analysis of Variance Approach to
Vida do Apertado e Frugal: Teoria e Medição”, Journal of Consumer
Content Validation”, Organizational Research Methods (2:2), 175-186.
Research (26:1), pp. 85-98.
Law, KS e Wong, CS 1999. “Construções Multidimensionais na Análise de
Hogan, R., Hogan, J., e Roberts, BW 1996. "Medição de Personalidade e
Equações Estruturais: Uma Ilustração Usando a Percepção de Trabalho
Decisões de Emprego", American Psychologist (51:5), pp. 469-477.
e Construções de Satisfação no Trabalho”, Journal of Management
(25:2), pp. 143-160.
Holland, JL 1985. Fazendo Escolhas Vocacionais: Uma Teoria das
Law, KS, Wong, CS e Mobley, WH 1998. “Toward a Taxonomy of
Personalidades Vocacionais e Ambientes de Trabalho, Englewood Cliffs,
Multidimensional Constructs”, Academy of Management Review (23:4),
NJ: Prentice Hall.
pp. 741-755.
Hovland, C., Janis, I., e Kelley, H. 1953. Comunicação e Persuasão, New
Haven, CT: Yale University Press. Lawshe, CH 1975. “A Quantitative Approach to Content Validity”, Personal
Howell, JM, e Hall-Merenda, KE 1999. “The Ties That Bind: The Impact of Psychology (28:4), pp. 563-575.

Leader-Member Exchange, Transformational and Transactional Levy, PS, e Lemeshow, S. 1999. Amostragem de Populações: Métodos e
Leadership, and Distance on Predicter Follower Performance,” Journal Aplicações (3ª ed.), Nova York: John Wiley.
of Applied Psychology (84:5), págs. 680-694. Little, TD, Lindenberger, U., e Nesselrode, JR 1999. “Sobre a seleção de
indicadores para medição multivariada e modelagem de variáveis
Howell, RD, Breivik, E., e Wilcox, JB 2007a. “A medição formativa é latentes: quando indicadores 'bons' são ruins e 'ruins'

realmente medição? Resposta a Bollen (2007) e Bagozzi (2007)”, Indicadores são bons”, Psychological Methods (4:2), pp. 192-211.
Psychological Methods (12:2), pp. 238-245. MacCallum, RC, e Austin, JT 2000. “Aplicações de Modelagem de
Howell, RD, Breivik, E., e Wilcox, JB 2007b. “Reconsidering Formative Equações Estruturais em Pesquisa Psicológica”, Revisão Anual de
Measurement,” Psychological Methods (12:2), pp. 205-218. Psicologia (51:1), pp. 201-226.
MacCallum, RC, e Browne, MW 1993. “O Uso de Indicadores Causais em
Hu, LT e Bentler, PM 1999. "Critérios de corte para índices de ajuste na Modelos de Estrutura de Covariância: Algumas Práticas
análise de estrutura de covariância: critérios convencionais versus novas Questões”, Psychological Bulletin (114:3), pp. 533-541.
alternativas", Modelagem de Equações Estruturais (6:1), pp. 1-55. MacCallum, RC, Widaman, KF, Zhang, S., e Hong, S. 1999.
Jaeger, RM 1984. Amostragem em Educação e Ciências Sociais, “Tamanho da amostra na análise fatorial”, Psychological Methods (4:1),
Nova York: Longman, Green and Co. pp. 84-99.
Jarvenpaa, SL, Dickson, GW, e DeSanctis, GL 1984. MacKenzie, SB 2003. “Os Perigos da Conceitualização de Construções
“Questões Metodológicas na Pesquisa Experimental de SI: Experiências Pobres”, Journal of the Academy of Marketing Science (31:3), pp.
e Recomendações”, em Anais da Quinta Conferência Internacional 323-326.
sobre Sistemas de Informação, Tucson, AZ, pp. 1-30. MacKenzie, SB, Podsakoff, PM e Jarvis, CB 2005. “O problema da
especificação incorreta do modelo de medição em pesquisa
Jarvis, CB, MacKenzie, S B., e Podsakoff, PM 2003. “Uma Revisão Crítica
comportamental e organizacional e algumas soluções recomendadas”,
de Indicadores de Construção e Modelo de Medição
Journal of Applied Psychology (90:4), pp. 710-730.
Erro de especificação em Marketing e Pesquisa do Consumidor”, Journal
MacKinnon, DP 2008. Introdução à Análise de Mediação Estatística, Nova
of Consumer Research (30:2), pp. 199-218.
York: Taylor & Francis Group.
Johnson, JA 1997. "Unidades de Análise para a Descrição e Explicação da
Mathieu, JE, e Zajac, DM 1990. “Uma Revisão e Meta-Análise dos
Personalidade", em Handbook of Personality Psychology, R. Hogan, J.
Antecedentes, Correlatos e Consequências do Compromisso
Johnson e S. Briggs (eds.), San Diego: Academic Press, pp. 73 -93.
Organizacional”, Psychological Bulletin (108:2), pp. 171-194.

Jöreskog, KG, e Goldberger, AS 1975. “Estimativa de um Modelo com


Mowday, RT, Steers, RM e Porter, LW 1979. “A Medição do Compromisso
Múltiplos Indicadores e Múltiplas Causas de uma Única Variável Latente”,
Journal of the American Statistical Association (70:351), pp. 631-639. Organizacional”, Journal of Vocational Behavior (14:2), pp. 224-247.

332 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Nederhof, AJ 1985. “Métodos de enfrentamento com viés de desejo social: Schriesheim, CA, Powers, KJ, Scandura, TA, Gardiner, CC e Lankau, MJ
uma revisão”, European Journal of Social Psychology (15:3), pp. 1993. “Melhorando a Medição de Construto na Pesquisa Gerencial:
263-280. Comentários e uma Abordagem Quantitativa para Avaliar a Adequação
Netemeyer, RG, Burton, S., e Lichtenstein, DR 1995. "Aspectos Traços da Teórica de Instrumentos do Tipo Papel e Lápis de Pesquisa ”, Journal
Vaidade: Medição e Relevância para o Comportamento do Consumidor", of Management (19:2), pp. 385-417.
Journal of Consumer Research (21:4), pp. 612-626.
Neter, J., Kutner, MH, Nachtsheim, CJ, e Wasserman, W. Segars, AH 1997. "Avaliando a Unidimensionalidade da Medição: Um
1996. Modelos Estatísticos Lineares Aplicados (4ª ed.), Boston: Paradigma e Ilustração Dentro do Contexto da Pesquisa de Sistemas
McGraw-Hill. de Informação", Omega (25:1), pp 107-121.
Nunnally, JC, e Bernstein, IH 1994. Teoria Psicométrica Serva, MA, Fuller, MA e Mayer, RC 2005. “A Natureza Recíproca da
(3ª ed.), Nova York: McGraw Hill. Confiança: Um Estudo Longitudinal de Equipes Interagindo”,
Peterson, RA 2000. Construindo Questionários Eficazes, Thousand Oaks, Journal of Organizational Behavior (26:6), pp. 625-648.
CA: Sage Publications. Smith, PC, Kendall, LM e Hulin, CL 1969. A Medição da Satisfação no
Petter, S., Straub, D., e Rai, A. 2007. “Especificando Construções Trabalho e na Aposentadoria: Uma Estratégia para o Estudo das
Formativas na Pesquisa de Sistemas de Informação”, MIS Quarterly Atitudes, Chicago: Rand McNally.
(31:4), pp. 623-656. Sobel, ME 1982. "Intervalos de Confiança Assintóticos para Efeitos
Podsakoff, PM, MacKenzie, SB, Lee, JY e Podsakoff, NP 2003a. “Viés de Indiretos em Modelos de Equações Estruturais", em Metodologia
Método Comum na Pesquisa Comportamental: Uma Sociológica 1982, S. Leinhardt (ed.), Washington, DC: Associação
Revisão Crítica da Literatura e Remédios Recomendados”, Americana de Sociologia, pp. 290-312.
Journal of Applied Psychology (88:5), pp. 879-903. Spector, PE 1992. Construção da Escala de Avaliação Resumida: Uma
Podsakoff, PM, MacKenzie, SB, Podsakoff, NP, and Lee, JY 2003b. “The Introdução, Newbury Park, CA: Sage Publications.
Mismeasure of Management (agement) and its Impli cations for Spector, PE 1997. Satisfação no Trabalho: Aplicação, Avaliação, Causas
Leadership Research,” Leadership Quarterly (14:6), pp. 615-656. e Consequências, Thousand Oaks, CA: Sage Publications.

Porter, ME 1998. Estratégia Competitiva, Nova York: Free Press. Steenkamp, JB. EM, e Baumgartner, H. 1998. "Avaliando a Invariância de
Rai, A., Patnayakuni, R., e Seth, N. 2006. “Impactos no desempenho das Medição na Pesquisa do Consumidor Transnacional",
capacidades de integração da cadeia de suprimentos habilitadas Journal of Consumer Research (25:1), pp. 78-90.
digitalmente”, MIS Quarterly (30:2), pp.225-246. Stogdill, RM 1969. “Validade das Descrições do Comportamento do Líder”,
Reise, SP, Widaman, KF, e Pugh, RH 1993. “Confirmtory Factor Analysis Psicologia Pessoal (22:2), pp. 153-158.
and Item Response Theory: Two Approaches for Exploring Measurement Straub, DW 1989. “Validating Instruments in MIS Research,”
Invariance,” Psychological Bulletin (114:3), pp. 552-566. MIS Quarterly (13:2), pp. 147-169.
Straub, DW, Boudreau, MC, e Gefen, D. 2004. “Diretrizes de validação
Rotundo, M., e Sackett, PR 2001. “A Importância Relativa da Tarefa, para pesquisa positivista de SI”, Comunicações do AIS (13), pp.
Cidadania e Desempenho Contraproducente para Classificações 380-427.
Sudman, S. 1976. Applied Sampling, Nova York: Academic Press.
Globais de Desempenho no Trabalho: Uma Abordagem de Captura de Políticas”,
Journal of Applied Psychology (87:1), pp. 66-80. Tian, KT, Beardon, WO e Hunter, GL 2001. “Necessidade do consumidor
Sartori, G. 1984. “Guidelines for Concept Analysis”, em Social Science de exclusividade: desenvolvimento e validação de escala”,
Concepts: A Systematic Analysis, G. Sartori (ed.), Beverly Hills, CA: Journal of Consumer Research (28:1), pp. 50-66.
Sage Publications, pp. 15-85. Tourrangeau, R., Rips, LJ, e Rasinski, K. 2000. A Psicologia da Resposta
Scandura, TA, e Williams, EA 2000. “Metodologia de Pesquisa em à Pesquisa, Cambridge, Reino Unido: Cambridge University Press.
Administração: Práticas Atuais, Tendências e Implicações para
Pesquisas Futuras”, Academy of Management Journal (43:6), pp. Urbina, S. 2004. Essentials of Psychological Testing, Hoboken, NJ:
1248-1264. John Wiley & Filhos.
Schuman, H., e Presser, S. 1996. Perguntas e Respostas em Pesquisas Vandenberg, RJ, e Lance, CE 2000. “Uma Revisão e Síntese da Literatura
de Atitude: Experimentos em Perguntas Forma, Redação e Contexto, de Invariância de Medição: Sugestões, Práticas e Recomendações
Thousand Oaks, CA: . Sage Publicações. para Pesquisa Organizacional”, Métodos de Pesquisa Organizacional
Schwab, DP 1980. "Construir Validade em Comportamento Organizacional", (3:1), pp. 4-70.
em Pesquisa em Comportamento Organizacional (Vol. 2), BM Staw e Vroom, VH 1964. Trabalho e Motivação, Nova York; John Wiley
LL Cummings (eds.), Greenwich, CT: JAI Press, pp. 3-43. & Filhos.
Webster, DM, e Kruglanski, AW 1994. “Diferenças Individuais na
Schriesheim, CA, Cogliser, CC, Scandura, TA, Lankau, MJ e Powers, KJ Necessidade de Fechamento Cognitivo”, Processos de Personalidade
1999. "Uma comparação empírica de abordagens para avaliar e Diferenças Individuais (67:6), pp. 1049-1062.
quantitativamente a adequação do conteúdo de instrumentos de West, SG, Finch, JF e Curran, PJ 1995. "Modelagem de Equações
medição de papel e lápis", Métodos de Pesquisa Organizacional (2: 2), Estruturais com Variáveis Não-Normais: Problemas e Remédios", em
págs. 140-156. Modelagem de Equações Estruturais: Conceitos, Questões,

MIS Trimestral Vol. 35 nº 2/ junho de 2011 333


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

and Applications, RH Hoyle (ed.), Thousand Oaks, CA: Sage Escola de Negócios da Universidade de Indiana. Sua pesquisa atual se
Publications, pp. 56-75. concentra em metodologia de pesquisa, eficácia da publicidade,
Wilcox, JB, Howell, RD, e Breivik, E. 2008. “Questões sobre Medição desempenho da equipe de vendas, liderança e comportamento de
Formativa”, Journal of Business Research (61:12), pp. 1219-1228. cidadania organizacional. Atualmente, ele atua nos conselhos de revisão
editorial do Journal of Marketing Research, Journal of Marketing, Journal
Williams, LJ, Edwards, JR, and Vandenberg, RJ 2003. of Consumer Research e vários outros periódicos.
“Recentes Avanços em Métodos de Modelagem Causal para
Pesquisa Organizacional e Gerencial”, Journal of Management (29:6), Philip M. Podsakoff (DBA, Universidade de Indiana) é professor de
pp. 903-936. comportamento organizacional e gestão de recursos humanos, e titular
Winer, BJ 1971. Princípios Estatísticos em Projeto Experimental, Nova da cátedra de gestão John F. Mee na Kelley School of Business da
York: McGraw-Hill. Universidade de Indiana. Sua pesquisa atual se concentra nos
Wong, CS, Law KS e Huang, GH 2008. “Sobre a Importância da determinantes da eficácia da liderança, os antecedentes e as
Condução de Análises em Nível de Construto para Construções consequências dos comportamentos de cidadania organizacional, as
Multidimensionais no Desenvolvimento e Teste de Teorias”, Journal relações entre as atitudes e os comportamentos dos funcionários e as
of Management (34:4), pp. 744-764. questões metodológicas nas ciências sociais e comportamentais. Ele
Yao, G., Wu, CH., e Yang, CT. 2008. “Examinando a validade de atualmente atua nos conselhos de revisão editorial do Journal of Applied
conteúdo do WHOQOL-BREF na perspectiva dos entrevistados por Psychology, Organizational Behavior and Human Decision Processes,
métodos quantitativos”, Social Indicators Research (85:3), pp. 483-498. Personnel Psychology e Journal of Management.

Yi, MY e Davis FD 2003. “Desenvolvendo e validando um modelo de Nathan Podsakoff (Ph.D., University of Florida) é professor assistente
aprendizagem observacional de treinamento de software de na Eller College of Management da University of Arizona. Sua pesquisa
computador e aquisição de habilidades”, Information Systems se concentra nos efeitos dos estressores relacionados ao trabalho, os
Research (14:2), pp. 146-169. efeitos dos comportamentos de cidadania no local de trabalho,
identificando e explicando o impacto acadêmico no campo do
comportamento organizacional e questões relacionadas à medição e
sobre os autores modelagem de construtos nas ciências comportamentais. Atualmente,
ele atua nos conselhos de revisão editorial do Academy of Management
Scott B. MacKenzie (Ph.D., University of California, Los Angeles), é o Journal, Journal of Applied Psychology e Organizational Behavior and
Neal Gilliatt Chair e Professor de Marketing na Kelley Human Decision Processes.

334 MIS Trimestral Vol. 35 nº 2/ junho de 2011


Machine Translated by Google

COMENTÁRIO DE PESQUISA

PROCEDIMENTOS DE MEDIÇÃO E VALIDAÇÃO DE CONSTRUÇÃO


EM PESQUISA DE MIS E COMPORTAMENTO : INTEGRANDO
TÉCNICAS NOVAS E EXISTENTES

Scott B. MacKenzie
Departamento de Marketing, Kelley School of Business, Indiana University,
Bloomington, IN 47405 USA {mackez@indiana.edu}

Philip M. Podsakoff
Departamento de Administração, Kelley School of Business, Indiana
University, Bloomington, IN 47405 USA {podsakof@indiana.edu}

Nathan P. Podsakoff
Departamento de Gestão e Organizações, Eller College of Management, Universidade
do Arizona, Tucson, AZ 85721 EUA {podsakoff@email.arizona.edu}

Apêndice A
Resumo das etapas para purificação e refinamento de incrustações

Construções com indicadores reflexivos Construções com Indicadores Formativos

Avalie a Examine a significância do ÿ2 (p > 0,10), CFI (> 0,95), Examine a significância do ÿ2 (p > 0,10), CFI (> 0,95), RMSEA (<
qualidade de ajuste do
RMSEA (< 0,06) e SRMR (< 0,08). Conduza um teste 0,06) e SRMR (< 0,08). Para modelos que incluem 2+ indicadores
medição simultâneo das tétrades de fuga implícitas no modelo (Bollen refletivos, realize um teste simultâneo das tétrades de fuga implícitas
modelo e Ting 2000). no modelo (Bollen e Ting 2000).
Avalie a validade Para construções de primeira ordem (Figura 3, Para construtos de primeira ordem (Figura 3, Painel B): Avalie a
do conjunto de Painel A): Examine se a variância média extraída validade do conjunto de indicadores usando o coeficiente de
indicadores no nível (AVE) para o conjunto de indicadores é maior que 0,50 maior
adequação de Edwards (2001) (R2 a). Valores
uma deque
R2 0,50 seria que,
significam
de construção (Fornell e Larcker 1981). em média, a maioria da variância dos indicadores é compartilhada
com o construto. Alternativamente, se os únicos antecedentes do
construto latente composto são seus próprios indicadores formativos,
a magnitude do termo de erro do nível do construto pode ser usada
para avaliar a validade (Diamantopoulos et al.
2008; Williams et ai. 2003). A variância do erro no nível de construção
deve ser pequena e não constituir mais da metade do total.
variância do construto (quanto menor, melhor).
Para construtos de segunda ordem (Figura 3, Painel Para construtos de segunda ordem (Figura 3, Painel D): Avalie
C): Avalie a validade do conjunto de subdimensões usando a validade do conjunto de subdimensões usando o coeficiente de
o coeficiente de determinação multivariado de Edwards adequação de Edwards (2001) (R2 a). Valores maior
de R2 que
uma 0,50
significariam que,
(2001) (R2 m). Alternativamente, a variância média em média, a maioria da variância no

MIS Trimestral Vol. 35 Nº 2 – Anexos/ Junho de 2011 A1


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Construções com indicadores reflexivos Construções com Indicadores Formativos

extraído (AVE) pode ser calculado para o construto de segunda subdimensões de primeira ordem são compartilhadas com as de segunda ordem

ordem pela média do quadrado múltiplo construção latente. Alternativamente, se os únicos antecedentes do
correlações para os indicadores de primeira ordem. Em ambos construção de segunda ordem são suas próprias subdimensões de primeira ordem,
caso, valores maiores que 0,50 significariam que, em a magnitude do termo de erro de nível de construção de segunda ordem
média, a maioria da variância na primeira ordem poderia ser usado para avaliar a validade (Diamantopoulos et al. 2008;
subdimensões é compartilhada com o latente de segunda ordem Williams et ai. 2003). Uma variância de erro menor que a metade de
construir. A variância total de um construto sugere que a maioria dos
a variância do construto se deve aos indicadores.

Avalie a confiabilidade Para construções de primeira ordem (Figura 3, Painel A): Avalie Para construções de primeira ordem (Figura 3, Painel B): Tradicional
do conjunto de a confiabilidade do conjunto de indicadores examinando noções de confiabilidade de consistência interna não se aplicam a modelos de
indicadores no se (1) a confiabilidade da consistência interna (Cronbach 1951) medição de indicadores formativos, porque o modelo não
nível de construção do conjunto de indicadores é maior que 0,70; não prever que os indicadores serão correlacionados (Bollen 1989;
e/ou (2) o índice de confiabilidade de construção de Fornell e Bollen e Lennox 1991). Consequentemente, nem o Cronbach
Larcker (1981) é maior que 0,70 (Netemeyer et al. alfa nem Fornell e índice de confiabilidade de construto de Larcker são
2003). relevante.

Para construções de segunda ordem (Figura 3, Painel C): A Para construções de segunda ordem (Figura 3, Painel D): As noções
confiabilidade das subdimensões de primeira ordem como tradicionais de confiabilidade de consistência interna não se aplicam a
indicadores da construção de segunda ordem pode ser examinada o conjunto de subdimensões que servem como indicadores formativos de uma
calculando o índice de Fornell e Larcker (1981) de construção de segunda ordem porque o modelo de medição não
construir confiabilidade para o construto de segunda ordem. não prever que as subdimensões serão correlacionadas (Bollen
Isso pode ser feito usando o totalmente padronizado e Lennox 1991; Eduardo 2003). De fato, Edwards (2001, p.
estimativas das cargas fatoriais de segunda ordem e erro 160) argumenta que “a confiabilidade não é uma questão de debate quando um
variações associadas com o sub de primeira ordem construção multidimensional e suas dimensões são tratadas como
dimensões. variáveis latentes que não contêm erros de medição”.

Avalie Para construções de primeira ordem (Figura 3, Painel A): Teste Para construtos de primeira ordem (Figura 3, Painel B): Teste a
Individual validade do indicador examinando se cada indicador validade do indicador examinando se cada indicador está significativamente
validade do indicador está significativamente relacionado com o construto latente. Avaliar relacionado ao construto latente (Bollen 1989; Bollen e
e confiabilidade o grau de validade de cada indicador, examinando Lennox 1991). Avalie o grau de validade de cada indicador
(isso pressupõe a proporção única de variação no indicador usando a proporção única de variância na construção
que cada um explicada pelo construto latente. No típico contabilizado pelo indicador. Isso é calculado subtraindo a proporção
indicador é caso em que cada indicador é hipotetizado para carregar em de variância no construto contabilizado
associado com apenas um construto, este será igual ao quadrado de por todos os indicadores, exceto pelo de interesse de
apenas um fator) o carregamento totalmente padronizado do indicador; e os seus a proporção de variância no construto explicada por todos
valor deve ser maior que 0,50 (veja Fornell e dos indicadores (ver Bollen 1989, pp. 200 e 222). Examinar
Larcker 1981). A confiabilidade de cada indicador pode ser confiabilidade do indicador usando (1) confiabilidade teste-reteste (se
avaliada pelo exame da correlação múltipla ao quadrado para o espera-se que o indicador seja estável ao longo do tempo) e/ou (2) entre avaliadores
indicador; normalmente um valor maior que 0,50 confiabilidade (se espera-se que diferentes avaliadores concordem).
é desejado porque sugere que a maioria dos
a variância do indicador se deve ao construto latente.
(Claro, em modelos onde cada indicador carrega em
apenas um construto, a correlação múltipla ao quadrado
e o quadrado do carregamento completamente padronizado
será igual.)

Para construções de segunda ordem (Figura 3, Painel C): Para construções de segunda ordem (Figura 3, Painel D): teste a validade
Teste a validade de cada subdimensão de primeira ordem por da subdimensão examinando se cada subdimensão
examinar se está significativamente relacionado com o está significativamente relacionado com o construto latente de segunda ordem
construção latente de segunda ordem. Avalie o grau de (Bollen 1989; Bollen e Lennox 1991). Avalie o grau de
validade de cada subdimensão examinando a validade de cada subdimensão usando a proporção única de
proporção única de variação na subdimensão variância no construto explicada pela subdimensão.
explicada pelo construto de segunda ordem. Isso vai Isso é calculado subtraindo a proporção da variância em
ser igual ao quadrado da subdimensão o construto contabilizado por todas as subdimensões
carregamento completamente padronizado na segunda ordem exceto o de interesse da proporção de variância em
construto no caso típico em que cada subdimensão é a construção explicada por todas as subdimensões (ver
hipotetizada para carregar apenas um construto de segunda ordem; Bollen 1989, pp. 200, 222). A confiabilidade de cada subdimensão
e seu valor deve ser maior que pode ser avaliada usando o método de Fornell e Larcker.
0,50 (ver Fornell e Larcker 1981). Avalie o construir índice de confiabilidade.
confiabilidade de cada subdimensão, determinando

A2 MIS Trimestral Vol. 35 Nº 2 – Anexos/ Junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Construções com indicadores reflexivos Construções com Indicadores Formativos

se o construto latente de segunda ordem é responsável por


a maior parte de sua variância; isso será mostrado por um
correlação múltipla ao quadrado para a subdimensão que
é maior que 0,50 (Fornell e Larcker 1981).
Eliminar Para construtos de primeira ordem (Figura 3, Painel A): Desde Para construções de primeira ordem (Figura 3, Painel B): Indicadores
Problemático que todos os aspectos essenciais do construto que têm relações fracas ou insignificantes com o latente
Indicadores domínio são capturados pelos indicadores restantes, considere construto podem ser candidatos para eliminação porque isso pode
eliminar os indicadores que têm (1) sugerem que o indicador carece de validade. No entanto, porque
cargas no construto hipotético, (2) ao quadrado isso também pode ser devido à multicolinearidade, é importante
cargas completamente padronizadas que são menores que calcular o VIF para examinar a multicolinearidade entre os
0,50 e (3) erro de medição grande e significativo indicadores antes de decidir se deve eliminá-los.
covariâncias com outras medidas. Não significativo ou Indicadores com relação não significativa com o latente
cargas fracas são uma indicação de falta de validade, construto e um VIF maior que 10 são redundantes e devem
e as covariâncias de erro de medição podem ser um sinal de ser considerado para eliminação sequencial (Diamantopoulos et
multidimensionalidade (Gerbing e Anderson 1984). al. 2008; Diamantopoulos e Winklhofer 2001; Neter et ai.
Covariâncias de erro de medição significativas podem ser 1996). No entanto, isso só deve ser feito se todos os elementos essenciais
identificados olhando para os índices de modificação e aspectos do domínio de construção são capturados pelos restantes
sua magnitude pode ser avaliada examinando a indicadores (Bollen e Lennox 1991; Diamantopoulos e
estimativas de mudanças esperadas completamente padronizadas. Winklhofer 2001; MacKenzie 2003).

Para construções de segunda ordem (Figura 3, Painel C): O Para construções de segunda ordem (Figura 3, Painel D): A primeira
primeiro passo no processo é eliminar passo no processo é eliminar indicadores problemáticos de
indicadores de cada subdimensão individual de primeira ordem. cada subdimensão individual de primeira ordem. Desde que todos
Desde que todos os aspectos essenciais do domínio da os aspectos essenciais do domínio da subdimensão são
subdimensão sejam capturados pelos demais capturado pelos itens restantes, considere eliminar indicadores que
itens, considere eliminar os indicadores que tenham (1) cargas não significativas nas subdimensões hipotéticas, (2)
(1) cargas não significativas nas subdimensões hipotéticas, (2) quadrados completamente padronizados
quadrados completamente padronizados cargas inferiores a 0,50, (3) covariâncias de erro de medição grandes e
carregamentos inferiores a 0,50, (3) grandes e significativos significativas com outras medidas (especialmente
covariâncias de erro de medição com outras medidas medidas de outras subdimensões) e (4) grandes e significativos
(especialmente medidas de outras subdimensões), e carregamentos cruzados em subdimensões não hipotéticas.
(4) cargas cruzadas grandes e significativas em subdimensões não Cargas não significativas ou fracas são uma indicação de falta de
hipotéticas. Insignificante ou fraco validade, as covariâncias de erro de medição podem ser um sinal de
cargas são uma indicação de falta de validade, covariâncias de multidimensionalidade e cargas cruzadas fortes e significativas
erro de medição podem ser um sinal de multidimensionalidade são uma indicação de confusão conceitual. Significativo
e cargas cruzadas fortes e significativas são uma indicação de covariâncias de erro de medição e carregamentos cruzados podem ser
confusão conceitual. identificados olhando para os índices de modificação e seus
Covariâncias significativas de erro de medição e cargas cruzadas magnitude pode ser avaliada examinando-se completamente
podem ser identificadas observando os índices de modificação e estimativas de mudanças esperadas padronizadas.
sua magnitude pode ser avaliada por
examinando o esperado completamente padronizado Além disso, as subdimensões de primeira ordem que possuem valores fracos ou
alterar as estimativas. relações não significativas com o construto de segunda ordem
podem ser candidatos à eliminação porque isso pode sugerir
Além disso, subdimensões de primeira ordem que têm que a subdimensão carece de validade. No entanto, porque esta
ou cargas não significativas na segunda ordem também pode ser devido à multicolinearidade, é importante calcular o
construto pode ser candidato à eliminação porque VIF para examinar a multicolinearidade entre as subdimensões antes de
isso sugeriria que a subdimensão carece decidir se deve eliminar alguma delas.
validade. No entanto, instâncias em que uma subdimensão Subdimensões com relação não significativa com o
inteira pode ser descartada sem eliminar uma construto de segunda ordem e VIF maior que 10 são redundantes e devem
aspecto essencial do domínio de construção pode ser raro. ser considerados para eliminação sequencial
(Diamantopoulos et al. 2008, Diamantopoulos e Winklhofer
2001; Neter et ai. 1996). No entanto, isso só deve ser feito se
todos os aspectos essenciais do domínio do construto são
capturado pelas restantes subdimensões (Bollen e Lennox
1991; Diamantopoulos e Winklhofer 2001; Mackenzie
2003). Instâncias em que uma subdimensão inteira pode ser
caiu sem eliminar um aspecto essencial da
domínio de construção pode ser raro.

MIS Trimestral Vol. 35 Nº 2 – Anexos/ Junho de 2011 A3


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Apêndice B
Resumo das técnicas para avaliar a validade da escala
Construções com indicadores reflexivos Construções com Indicadores Formativos
Avalie o efeito Desenvolva uma manipulação experimental que teoricamente Desenvolva uma manipulação experimental do atributo/característica que
de deveria causar mudanças no construto focal. é medido pelo indicador formativo e teste se essa manipulação influencia
uma Teste se uma variável dummy representando a as pontuações do indicador. Observe que isso implica que quando o
manipulação manipulação experimental está significativamente relacionada modelo de medição é como o do Painel D da Figura 3, são as subdimensões
experimental sobre a construção
com os escores da escala. que servem como indicadores formativos do construto de segunda ordem
que devem ser manipuladas individualmente.

Avaliar conhecido Identifique grupos de indivíduos, organizações, etc. que Identifique grupos de indivíduos, organizações, etc. que teoricamente
validade de grupo teoricamente deveriam diferir no construto focal. deveriam diferir no atributo/característica medido pelo indicador formativo,
do construto Teste se uma variável fictícia que representa a associação e teste se uma variável fictícia que representa a associação ao grupo está
ao grupo está significativamente relacionada às pontuações significativamente relacionada às pontuações na medida. Observe que
na escala. isso implica que quando o modelo de medição é como o do Painel D da
Figura 3, são as subdimensões individuais que servem como indicadores
formativos do
construção de segunda ordem sobre a qual os grupos devem diferir. Isso
significa que diferentes grupos podem ser usados para estabelecer a
validade de grupos conhecidos de diferentes subdimensões.
Avaliar Teste se o construto focal está significativamente Teste se o construto focal está significativamente relacionado a outros
nomológico e/ relacionado a outros construtos hipotetizados em sua rede construtos hipotetizados em sua rede nomológica.
ou critério nomológica.
validade relacionada
do construto
Use a Para construtos endógenos [Ver Figura 5, Painel Construções endógenas [Ver Figura 5, Painel B]: Teste se o R2
rede A]: Teste se um construto antecedente tem efeitos diretos nas para o efeito do construto antecedente no construto focal é maior que o
nomológica subdimensões do construto focal além dos efeitos indiretos R²m para as subdimensões do construto focal usando um intervalo de
para avaliar a que esse antecessor confiança baseado em erros padrão obtidos usando procedimentos de
validade do cedente tem por meio do construto focal. Isso pode ser testado bootstrap (Eduardo 2001). Se os dois são equivalentes, pode ser interpretado
multidimensional com um teste de diferença qui-quadrado do modelo com e como suporte para a estrutura multidimensional hipotética do construto focal.
estrutura sem os caminhos diretos, ou examinando os índices de
modificação. Este teste é baseado na suposição de que um único coeficiente (ou seja,
o coeficiente do efeito do antecedente no constructo focal), deve
representar completamente o efeito do antecedente em todas as
subdimensões, ou o constructo focal está ocultando informações
potencialmente úteis. Um teste alternativo da estrutura multidimensional
(também baseado nessa suposição) é examinar se os efeitos diretos do
antecedente em cada
subdimensão (sem a construção focal no modelo) são iguais (Edwards
2001). Se os efeitos diretos forem iguais, pode ser interpretado como
suporte para a estrutura multidimensional hipotética do construto focal. No
entanto, é importante notar que, embora este teste seja razoável, ele não
está necessariamente implícito na estrutura do modelo, de modo que sua
adequação depende se faz sentido conceitualmente. Pode-se argumentar
que esse requisito é muito rigoroso; particularmente se o coeficiente único
captura a grande maioria do efeito do antecedente em todas as subdimensões
do construto.

Para construções exógenas [Ver Figura 5, Painel Para construções exógenas [Ver Figura 5, Painel D]: Teste se as
C]: Teste se as subdimensões do construto multidimensional subdimensões da construção multidimensional
têm efeitos diretos significativos no construto de consequência têm efeitos diretos significativos no construto de consequência além dos
além dos efeitos diretos que o construto focal tem neste efeitos indiretos que essas subdimensões
tem através da construção focal. Isso pode ser testado com um chi

A4 MIS Trimestral Vol. 35 Nº 2 – Anexos/ Junho de 2011


Machine Translated by Google

MacKenzie et al./ Procedimentos de Validação em MIS & Pesquisa Comportamental

Construções com indicadores reflexivos Construções com Indicadores Formativos

consequência. Isso pode ser testado com um teste de teste de diferença quadrada do modelo com e sem os caminhos
diferença qui-quadrado do modelo com e sem o diretos, ou examinando os índices de modificação.
caminhos diretos, ou examinando os índices de
modificação.
Avaliar Teste se o construto focal é menos do que perfeitamente Teste se o construto focal é menos do que perfeitamente correlacionado
discriminante correlacionado com construtos conceitualmente semelhantes com construtos conceitualmente semelhantes (Anderson e Gerbing 1988).
validade do (Anderson e Gerbing 1988). Para um teste mais rigoroso, Para um teste mais rigoroso, examine se a correlação é menor que 0,71
construto examine se a variância média explicada (AVE) nos (o que significaria que eles têm menos da metade de sua variância em
indicadores por seu construto latente subjacente é maior do comum).
que a correlação quadrada entre o construto focal e
construtos conceitualmente semelhantes (Fornell e Larcker
1981).

Referências
Bollen, KA 1989. Equações estruturais com variáveis latentes, Nova York: John Wiley.
Bollen, KA, e Lennox, R. 1991. “Sabedoria Convencional sobre Medição: Uma Perspectiva de Equação Estrutural”, Psychological Bulletin
(110:2), pp. 305-314.
Bollen, KA, e Ting, KF. 2000. “A Tetrad Test for Causal Indicators,” Psychological Methods (5:1), pp. 3-22.
Cronbach, LJ, e Meehl, PE 1955. “Construir Validade em Testes Psicológicos”, Psychological Bulletin (52:4), pp. 281-302.
Diamantopoulos, A., Reifler, P., e Roth, KP 2008. “Advancing Formative Measurement Models”, Journal of Business Research (61:12),
págs. 1203-1218.
Diamantopoulos, A., e Winklhofer, HM 2001. “Construção de Índices com Indicadores Formativos: Uma Alternativa ao Desenvolvimento de Escala”,
Journal of Marketing Research (38:2), pp. 269-277
Edwards, JR 2001. “Construções Multidimensionais na Pesquisa do Comportamento Organizacional: Uma Estrutura Analítica Integrativa”,
Métodos de Pesquisa Organizacional (4:2), pp. 141-192.
Edwards, JR 2003. “Construir Validação na Pesquisa do Comportamento Organizacional”, em Comportamento Organizacional: O Estado da Ciência, J.
Greenberg (ed.), Mahwah, NJ: Lawrence Erlbaum Associates, pp. 327-371.
Fornell, C., e Larcker, DF 1981. "Avaliando Modelos de Equações Estruturais com Variáveis Inobserváveis e Erro de Medição", Journal of Marketing Research
(18:1), pp. 39-50.
Gerbing, DW e Anderson, JC 1984. "Sobre o significado de erros de medição correlacionados dentro do fator", Journal of Consumer
Pesquisa (11:1), pp. 572-580.
MacKenzie, SB 2003. “Os Perigos da Conceituação de Construção Pobre”, Journal of the Academy of Marketing Science (31:3), pp.
323-326.
Netemeyer, RG, Burton, S., e Lichtenstein, DR 1995. "Aspectos Traços da Vaidade: Medição e Relevância para o Comportamento do Consumidor",
Journal of Consumer Research (21:4), pp. 612-626.
Neter, J., Kutner, MH, Nachtsheim, CJ, e Wasserman, W. 1996. Applied Linear Statistical Models (4ª ed.), Boston: McGraw-Hill.
Williams, LJ, Edwards, JR, e Vandenberg, RJ 2003. “Avanços Recentes em Métodos de Modelagem Causal para
Management Research”, Journal of Management (29:6), pp. 903-936.

MIS Trimestral Vol. 35 Nº 2 – Anexos/ Junho de 2011 A5


Machine Translated by Google

Os direitos autorais da MIS Quarterly são de propriedade da MIS Quarterly & The Society for Information Management e seu conteúdo

não pode ser copiado ou enviado por e-mail para vários sites ou postado em um listserv sem a permissão expressa por escrito do

detentor dos direitos autorais. No entanto, os usuários podem imprimir, baixar ou enviar artigos por e-mail para uso individual.

Você também pode gostar