Você está na página 1de 9

14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …

Página 1

Journal of Business Research 138 (2022) 266-274

Listas de conteúdos disponíveis em ScienceDirect

Journal of Business Research

página inicial do jornal: www.elsevier.com/locate/jbusres

Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, meio
ponto e preferências do entrevistado

Naia A. de Rezende * , Denise D. de Medeiro s


Engenheiro do Departamento de Produção, Universidade Federal de Pernambuco, Recife, PE, Brasil

ARTICLEINFO RESUMO

Palavras-chave: Este estudo buscou analisar diferentes escalas de classificação utilizadas em pesquisas, incluindo duas escalas ordinais com numerais, e
Análise de item escala ordinal com imagens de rosto e uma escala de proporção. Em primeiro lugar, as análises estatísticas foram realizadas, como média de
Questionário
parison, skewness e curtose. Posteriormente os pontos críticos das escalas, como os níveis extremos e médios
Escala de classificação
pontos, foram analisados. Finalmente, as preferências de escala foram comparadas de acordo com sexo, idade e escolaridade. o
Likert
estudo foi realizado com 595 pessoas, e os resultados mostraram uma tendência para escalas com menos itens de resposta para
Escala Visual Analógica
obter valores mais elevados. Além disso, houve uma maior incidência de respostas em níveis extremos, principalmente em níveis mais elevados
Escala Facial
Número de resposta níveis. Foi possível identificar diferenças entre as preferências de escala dentro dos grupos, e foi observado
que a escala mais fácil não tem necessariamente mais harmonia com os sentimentos do entrevistado.

1. Introdução confiabilidade e validade das escalas, ainda não há concordância entre


sobre qual é a melhor escala (Cabooter, Weijters, Geuens e
Sempre que for necessário realizar uma pesquisa para obter a Vermeir, 2016; Wakita et al., 2012; Weathers, Sharma e Niedrich ,
opinião, algumas questões são levantadas sobre como obter uma opinião clara e 2005; Weijters, Cabooter, & Schillewaert, 2010 ). Além disso, outro fac-
resposta objetiva, que garante uma análise consistente que expressa tores relevantes para este assunto, como a influência da escala na re-
os verdadeiros sentimentos da pessoa e também aquele que é fácil de traduzir em um patrocínios, tendências de resposta e as preferências do entrevistado, têm
linguagem de negócios. Geralmente, os questionários mais comumente usados tem sido pouco pesquisado ( Dawes, 2008; Nadler, Weston, & Voyles, 2015 ;
são aqueles com respostas predefinidas. Isso torna possível comparar Preston e Colman, 2000 ).
e validar os resultados usando análises estatísticas eficazes. Escalas de classificação Com base nessa falta de informação, foi realizado um estudo para analisar
são usados ​para coletar respostas de um grupo de pessoas, porque eles limitam, alguns aspectos relativos às abordagens de quatro escalas amplamente utilizadas em vários
padronizar e traduzir as respostas do indivíduo (Iannario, Manisera , estudos. Este estudo considerou duas escalas ordinais com rótulos numéricos,
um com rótulos textuais em cada item de resposta e outro com textuais
& Zuccolotto, 2017; Norman, 2010; Salzberger e Koller, 2013; Cantado e
Wu, 2018; Wakita, Ueshima e Noguchi, 2012 ). rótulos apenas nos dois itens extremos (nada importante; muito
No entanto, há muito debate sobre qual escala deve ser usada, importante). Essas escalas são amplamente utilizadas e principalmente estudadas na
se existe uma escala ideal, ou se cada pesquisa deve área de marketing. Em algumas pesquisas de mercado, é possível ver diferentes
escolha sua própria escala. Por exemplo, durante nossa pesquisa uma sistemática tipos de classificações, como estrelas, emoticons, cores e outros. Analisar
revisão do Food Choice Questionnaire (FCQ), um questionário usado para essas classificações de imagem, uma escala ordinal com imagens de expressão facial foi
identificar os atributos de escolha em relação aos produtos alimentícios, foi levado em consideração usado para o estudo. Esta escala foi criada especialmente para determinar a dor
contar. Nesse estudo, percebeu-se que, embora a questão original nível em crianças e é conhecido como a escala facial ou Wong e Baker
naire foi formulado com uma escala de 4 pontos totalmente rotulada, apenas 18% de Escala. A quarta escala usada é uma escala de razão sem valores numéricos. Isto é
os estudos analisados ​usaram a escala original (Cunha, Cabral, Moura, & d e chamada de Escala Visual Analógica e foi mencionada pela primeira vez por Hayes e
Almeida, 2018 ) Portanto, esta observação chamou a atenção para a necessidade de Patterson. Embora seja mais usada na área médica, a escala foi
compreender melhor as características da escala. usado nesta pesquisa para contrastar com a característica ordinal do
Vários estudos realizaram uma análise comparativa com a maioria Escalas Likert, assim foi possível comparar esses dois tipos de escala.
escalas populares, especialmente a escala Likert. Embora a maioria confirme o Portanto, este estudo visa auxiliar os pesquisadores a melhor compreender estes

* Autor para correspondência: Departamento de Engenharia de Produção, Av. da Arquitetura, s / n, Cidade Universitária, Recife, PE 50740-550, Brasil.
Endereço de e-mail: naia.rezende@ufpe.br (NA de Rezende).

https://doi.org/10.1016/j.jbusres.2021.09.031

https://translate.googleusercontent.com/translate_f 1/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Recebido em 2 de outubro de 2020; Recebido em forma revisada em 10 de setembro de 2021; Aceito em 12 de setembro de 2021
Disponível online em 22 de setembro de 2021
0148-2963 / © 2021 Elsevier Inc. Todos os direitos reservados.

Página 2
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274

escalas, para efetivamente fazer a melhor escolha em relação ao seu uso, e para escalas ( Dolnicar & Grün, 2013 ); como eles entendem o ponto médio
analisar os valores encontrados de forma correta e objetiva. respostas ( Iannario et al., 2017; Weathers et al., 2005) e como eles
O objetivo do estudo foi analisar as escalas de acordo com estatísticas entender a escala do item (Viswanathan, Sudman, & Johnson, 2004 ).
tendência, examine a frequência de valores extremos, identifique o meio Apesar desses estudos variados, ainda não há consenso sobre qual
apontar relevância em escalas simétricas, examinar a preferência do respondente escala é o melhor, ou que escala é a mais adequada para o uso. Algum
de acordo com a facilidade de uso e expressão de sentimentos, e para determinar pesquisadores sugerem que a escala deve ser escolhida para complementar o estudo
verificar se as preferências diferem de acordo com sexo, idade e conteúdo e propósito ( Shaftel, Nash, & Gillmor, 2012 ). Portanto, estudos
Educação. Portanto, esta pesquisa visa auxiliar acadêmicos não apenas em usaram diferentes tipos de escala para melhorar a validade do questionário
estudos acadêmicos, mas também nas áreas de medicina, marketing e negócios (Sarofim et al., 2018 ). Consequentemente, também é importante abordar o
pesquisa de qualidade. problema de comparar diferentes tipos de escalas sem análise detalhada
(Lim, 2008 ). Para este estudo, a escolha das escalas foi determinada com base em
2. Revisão da literatura seu amplo uso e características diferentes. Portanto, quatro escalas
com resposta diferente e características de análise foram investigados.
Nesta seção, uma breve revisão das pesquisas que estudaram
escalas de resposta são apresentadas. Embora uma revisão sistemática não fosse
conduzida, a revisão incluiu vários estudos com diferentes percepções 2.2. Escalas escolhidas
informações sobre o assunto. Houve a necessidade de selecionar as escalas a serem usadas para
realizar este estudo. Existem vários tipos de escala e cada estudo buscado Existem várias escalas utilizadas em pesquisas acadêmicas e de marketing.
usar a escala que melhor se adapte ao questionário e ao público-alvo. Para desenvolver um questionário conciso e não cansativo para
Portanto, neste estudo, foram escolhidas quatro escalas, cujos motivos respondentes, foi necessário escolher um pequeno intervalo de escalas para ser
são explicados em detalhes na Seção 2.2 . analisados. Portanto, neste estudo, quatro escalas com características diferentes
istics foram usados ​(ver Fig. 1 ), e a razão para escolher cada escala é
2.1. Estudos de escala explicado separadamente.

Muitos estudos de marketing usam o formato de pesquisa para entender o 2.2.1. Escala de 4 pontos
consumidores ( Bruner, 2013; Cena et al., 2017; Fombelle, Sirianni, Gold- A escala de 4 pontos é uma escala de opinião forçada. Não contém um
stein, & Cialdini, 2015; Sarofim, Chatterjee e Rose, 2018) Além disso, ponto neutro e isso força o entrevistado a escolher um ponto positivo ou
questionários com respostas predeterminadas são frequentemente usados ​na medicina opinião negativa. No entanto, alguns estudos apontam a influência
( Harland, Dawkin, & Martin, 2015; Sun et al., 2015; Voutilainen , que o ponto médio tem nas avaliações, o que falta nesta escala.
Pitkäaho, Kvist, & Vehviläinen-Julkunen, 2016 ) e na área acadêmica Por exemplo, os entrevistados podem ser neutros ou indiferentes ao
pesquisa ( Dolnicar & Grün, 2013; Preston & Colman, 2000) Eles são questão, eles podem ser "incertos" ou ambivalentes (depende da situação
também usado para compreender características específicas de grupos ( Adelson & ção), ou mesmo considerar que não há informações suficientes para fazer uma
McCoach, 2010; Hosany e Prayag, 2013; Ro & Olson, 2020) cisãoKulas e Stachowski, 2013; Nadler et al., 2015) Apesar disso,
Escalas são preferidas sempre que a pesquisa busca compreender um escalas com um número menor de opções podem fornecer melhor precisão.
percepções, atitudes ou sentimentos da pessoa. As respostas de classificação podem ser Eles também produzem menos fadiga do respondente, especialmente em perguntas longas.
analisados ​de forma mais objetiva, estatística e com um grande número de naires (Lozano, García-Cueto, & Mu˜niz, 2008; Viswanathan et al., 2004 ;
respostas. Existem vários estudos que compararam as escalas utilizadas em Weathers et al., 2005) A escala Likert é uma das escalas mais utilizadas na
levantamento de pesquisas, principalmente para fins de identificação da dor e outros pesquisar. A escala é ordinal, como é o caso de outras usadas neste
aspectos na área médica ( Cabooter et al., 2016; Funke & Reips, 2012 ; pesquisa, e é usado apesar das preocupações em relação à análise estatística
Funke, Reips e Thomas, 2011; Wakita et al., 2012) de escalas ordinais (Norman, 2010) Esta escala é totalmente rotulada, que
Vários fatores influenciam a escolha de uma escala específica. Por exemplo, auxilia na interpretação das respostas, e possui dois negativos
como os pesquisadores interpretam as respostas aos itens com uma escala Likert rótulos e dois rótulos positivos ( Friedman, Herskovitz, & Pollack, 1993 ;
( Wakita et al., 2012); como eles traduzem e comparam dois diferentes Weijters et al., 2010 ).

Fig. 1. Escalas utilizadas no questionário.

https://translate.googleusercontent.com/translate_f 2/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …

267

Página 3
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274

2.2.2. Escala de 7 pontos Alguns estudos analisaram o índice de resposta para níveis extremos,
A escala de 7 pontos foi escolhida porque (juntamente com a escala de 5 pontos isto é, o primeiro eo último pontos de uma escala. Estes pontos podem ter um
escala) é uma das escalas mais utilizadas para a realização de questionários influência na análise da resposta. De acordo com alguns pesquisadores, o
( Bruner, 2013; Weijters et al., 2010 ). Esta escala também foi escolhida porque quanto menor o número de itens de resposta, maior será o extremo
contém um ponto médio, o que significa que foi possível analisar o frequência de resposta de nível (Cena et al., 2017; Chen et al., 1995; Wakita ,
influência de “nenhum” nas opiniões dos respondentes. Além disso, a escala Ueshima, & Noguchi, 2012; Weathers et al., 2005)
contém rótulos apenas nas extremidades, 1 e 7. Os outros valores variam para
Hipótese 4 . As respostas do ponto médio são distribuídas simetricamente
cada assunto e não têm qualquer valor qualitativo predeterminado (Kula s
em escalas forçadas.
& Stachowski, 2013; Nadler et al., 2015 ).
Há um debate sobre o ponto médio, que é considerado um
2.2.3. Escala Visual Analógica ponto neutro por alguns. De acordo comKulas e Stachowski (2013) , este
A Escala Visual Analógica (VAS) foi desenvolvida por Hayes & Pat- ponto é muitas vezes escolhido por entrevistados que não têm resposta para as perguntas
Terson, 1921. Consiste em uma linha horizontal de 100 mm com extremos ção, não entendeu a questão, ou mesmo não tem interesse em
rótulos. O entrevistado indica nesta linha o local mais adequado respondendo à pergunta. Portanto, este ponto muitas vezes atrapalha o
em relação à sua percepção. Depois que as respostas forem coletadas, análise de respostas (Chen et al., 1995; Nadler, Weston e Voyles ,
o pesquisador mede o comprimento referente à opinião de 0 a 100 2015) Em um estudo em escala Likert, observou-se que houve uma tendência
a fim de observar as opiniões dos entrevistados com base na influência sobre para avaliações negativas com uma escala forçada ( Garland, 1991 ). Por esta
essas classificações ( Cena et al., 2017) Esta é uma escala de intervalo; Portanto, é razão, este estudo analisou se há uma tendência para um lado
possível realizar mais operações estatísticas do que com a escala Likert da escala ou se houver uma distribuição igual da escala.
( Couper, Tourangeau, Conrad, & Singer, 2006; Funke, 2016; Sung &
Hipótese 5 . Preferência escala não diferiu entre os grupos de
Wu, 2018 ).
gênero, idade e escolaridade.

2.2.4. Escala de rosto Preston e Colman (2000) analisaram as preferências de escala entre
A escala de avaliação facial (escala facial) foi desenvolvida por Wong & Baker , entrevistados e apontou que poucos estudos estavam preocupados com o
1988 para identificar a dor em crianças, e é amplamente utilizado na área médica opiniões dos participantes sobre escalas. Eles também apontaram que quando par-
campo. Segundo os autores, esta escala possui a mesma confiabilidade que os participantes apreciam responder ao questionário, há mais
outras escalas, mas é mais aceitável para tais pesquisas, pois torna a avaliação consistência entre as respostas. Por esta razão, este estudo pretende
mais fácil e, portanto, foi usado em um estudo observando a preferência identificar se há preferências escala entre os entrevistados e
erência para ícones positivos (Cena et al., 2017) Embora para o entrevistado se as preferências variam de acordo com alguns grupos.
a escala tem rostos com emoções diferentes, para os pesquisadores, a escala
é analisado por valores ordinais de 1 a 6 (Hicks, von Baeyer, Spafford , 4. Metodologia
van Korlaar, & Goodenough, 2001; Sun et al., 2015; Wong & Baker ,
1988 ). Um fator importante a ser observado é a cultura e idade dos O estudo que inspirou esta pesquisa foi o Cunha et al. (2018)de
respondentes para os quais a escala será usada. Por exemplo, japonês revisão sistemática do Food Choice Questionnaire (FCQ), que mostrou
os entrevistados tendem a selecionar mais emoções positivas do que negativas, que diferentes autores escolheram escalas diferentes para usar nas mesmas questões
cating essas crianças preferem as escalas mais lúdicas ( Chen, Lee, & Ste- questionário: (18%) 4 pontos; (27%) 5 pontos; (54%) 7 pontos. Para apoiar o
Venson, 1995; Gharaibeh e Abu-Saad, 2002; Subhashini, Vatsa, & uso de uma escala diferente da original, os autores revisados ​apresentaram
Lodha, 2008) motivos diferentes: ponto neutro, mais opções de resposta e outros.
Portanto, considerou-se importante analisar essas diferenças em
3. Hipótese tipos de escala usando questionários semelhantes no estudo atual para identificar se
as razões apresentadas variam em uma pesquisa que usou diferentes
A partir da revisão da literatura, foi possível identificar vários inter- escalas de resposta.
avaliar questões sobre os assuntos de escala abordados na Seção 2. Depois de A fim de realizar este estudo, um produto alimentar bem conhecido pela
analisando algumas das questões incluídas nestas, foi possível o público-alvo, pizza, foi usado como base para a pesquisa, e todos os par-
determinar as hipóteses para este trabalho. os participantes confirmaram que já haviam consumido pizza. Como o original
questionário tem 39 questões, ele foi escolhido para trabalhar com apenas alguns
Hipótese 1 . A confiabilidade da escala diminui à medida que o número de respostas
itens do FCQ, já que a intenção era aplicar um não muito extenso
itens diminui.
pesquisa. Assim, cinco questões foram selecionadas aleatoriamente e, considerando
Vários estudos foram realizados sobre a análise de confiabilidade de a mesma pergunta foi feita quatro vezes, as cinco perguntas foram usadas para
escalas diferentes. Em geral, observou-se que menos itens de resposta cada escala ( Fig. 2)
irá fornecer menos confiabilidade para o questionário ( Lozano et al., 2008 ;
Preston e Colman, 2000; Weathers et al., 2005; Weng, 2004) Portanto,
este estudo analisa a afirmação em relação às escalas ordinais e
escalas de razão.

Hipótese 2 . Para escalas diferentes, as tendências de resposta são as mesmas


e eles tendem a atingir o mesmo nível de qualidade.

Dawes (2008) argumenta que há preocupações relacionadas ao questionário


dados como confiabilidade e validade, enquanto outros fatores influenciam os dados
características como média, variância, assimetria e curtose. Assim,
este estudo analisa os aspectos estatísticos de cada uma das escalas escolhidas,
e espera-se que as tendências de resposta sejam semelhantes para cada um dos
eles.

Hipótese 3 . Todas as escalas têm a mesma frequência de nível extremo


respostas.
Fig. 2. Questões escolhidas pelo FCQ.

268

https://translate.googleusercontent.com/translate_f 3/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …

Página 4
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274

Decidiu-se criar um questionário em papel devido às escalas tabela 1


usado; especialmente o VAS, pois para esta escala os respondentes precisam apontar Características demográficas.
em uma linha a resposta e, portanto, neste caso, eles precisavam evitar o Opções Frequência Percentagem
uso de um número específico. O questionário foi apresentado ao alvo
Era De 18 a 25 334 56,1
público na universidade, em outras escolas de graduação e em algumas
De 26 a 35 167 28,1
locais. O questionário foi autoadministrado e a ordem da escala foi Acima de 35 94 15,8
oferecido aleatoriamente, a fim de remover a tendência de relatar mais Nível de educação grupo A 58 9,7
Grupo B 418 70,3
valores nos questionários iniciais do que nos seguintes (Lim, 2008) Isto
Grupo C 119 20,0
foi esclarecido aos entrevistados que eles não deveriam comparar o re-
Frequência de consumo Nunca 0 0
sponses utilizados nos outros questionários. Apenas uma limitação foi colocado Raramente 223 37,5
sobre o público-alvo, ou seja, que os participantes devem ter mais de 18 anos 1 ou 2 vezes por mês 293 49,2

velho; esta assegurada a nossa pesquisa foi realizada de acordo com o 1 vez por semana 67 11,3
2 ou mais vezes por semana 12 2.0
permissões do comitê de ética. O questionário foi organizado e uma
estudo piloto foi realizado com 15 indivíduos com perfis semelhantes a
o público-alvo, a fim de confirmar sua aplicabilidade e corrigir e, para todos os itens do estudo, a hipótese nula (assumindo normalidade) foi
possíveis erros ou mal-entendidos. refutada (valor p < 0,001). No entanto, testes de normalidade são bastante sensíveis
O instrumento de pesquisa foi estruturado em três partes. Na primeira parte, e, portanto, vários autores sugerem outros testes para análise. Portanto,
houve dúvidas sobre o perfil do participante, como seu o teste de assimetria e curtose foram realizados ( Tabela 2) Foi encontrado
sexo, idade, escolaridade e frequência de consumo de pizza. Para o que não houve problemas na distribuição da amostra para os valores de referência:
segunda parte, determinou-se que cada participante deveria responder ao a assimetria foi superior a três e a curtose foi superior a dez
mesmas perguntas usando as quatro escalas diferentes, a fim de comparar o (Kline, 2015 ). Embora nenhuma variável seja considerada normal, a assimetria
resultado de quatro escalas, e eles foram solicitados a escolher uma das escalas em e os testes de curtose mostram que os desvios encontrados não terão resultados negativos
a terceira parte do questionário ( Preston & Colman, 2000) O segundo- efeito na análise de dados.
A segunda parte do questionário foi subdividida em quatro partes. Cada Após a análise da normalidade, foi realizada a análise alfa de Cronbach.
subdivisão tem as mesmas cinco perguntas sobre o produto, e o Para o número de perguntas do questionário (cinco), é desejável que
entrevistados marcaram com um X o nível de importância para cada aspecto em o valor seja maior que 0,5 ( Kehoe, 1995; Tavakol & Dennick,
o questionário. Além dessas perguntas sobre o produto, 2011) O alfa de Cronbach foi menor do que o esperado para a escala de 4 pontos.
existem duas questões sobre a percepção do entrevistado sobre a escala usada: No entanto, de acordo com vários autores, o valor alfa de Cronbach é
“Fácil de usar” e “expressa o que sinto” (de 0 a 10). Na terceira parte, menor quando há menos opções (Preston & Colman, 2000;
o entrevistado deve escolher entre as quatro escalas “Qual escala é a Weathers et al., 2005 ). Outra característica importante a ser observada é que
mais fácil de usar? ”; “Qual escala expressa melhor o que você sente?” E “O que cada item corresponde a uma construção diferente das questões gerais
escala é o melhor? ”. questionário, porque foi decidido avaliar diferentes construtos para
É possível observar uma maior frequência de alunos de graduação. obter respostas diferentes em toda a escala.
dentes, por causa da facilidade de aplicação da pesquisa em um ambiente acadêmico
ronment. A participação foi voluntária, e cada participante assinou um
Termo de Consentimento Livre e Esclarecido conforme Resolução 466/12 5,2 Análise de escala
do Conselho Nacional de Saúde - Brasil. Este termo garante que o
participante tem a liberdade para desistir a qualquer momento e apresenta o Para poder comparar diferentes escalas, todos os valores foram
riscos e benefícios do estudo. O único critério aplicado para participação transformado em uma escala de zero a um ( Dawes, 2008) Com isso
foi que o participante tinha pelo menos 18 anos. abordagem, foi possível comparar as médias da escala para cada questão.
ção NoFig. 3 , é possível observar que todas as escalas possuem o mesmo
5. Resultados padrão de resposta. No entanto, há uma diferença entre eles, que pode
também podem ser observados a partir dos resultados do teste estatístico t-pareado. Para a maioria
Foi obtido um total de 608 respostas. Treze foram descartados comparações calculadas entre escalas, o valor p é menor que 0,05.
por causa da falta de respostas, o que tornou impossível comparar o Portanto, as médias são consideradas estatisticamente diferentes. Um
escalas para os indivíduos. Havia então 595 respostas válidas (311 excepção foi a quarta questão, onde o valor de p era 0,565 para o 4-
mulheres e 284 homens). Ninguém respondeu “Never” em relação ao con- escalas de ponto e escala facial. Neste caso, as respostas médias podem ser
frequência Sumption; Portanto, cada participante poderia analisar o considerados estatisticamente iguais.
características do produto e, portanto, nenhum respondente foi removido do Outro aspecto analisado por este estudo foi a comparação entre
análise. A média de idade dos respondentes foi de 27,49, com um desvio padrão respostas extremas, “nada importante” e “muito importante”. Por esta
ção de 9,4. A maioria dos entrevistados, (56%), tinha entre 18 anos propósito, as frequências de resposta foram calculadas no nível mais baixo de
e 25 anos, seguido pelo grupo de 26 a 35 anos. Esses valores cada escala, valor 1 para escalas de 4, 7 pontos e escala facial. Para VAS,
estão de acordo com os dados demográficos da população do país quando foi definido que um centímetro seria a proporção para diferentes
tendo em consideração a idade mínima de participação de 18 anos. respostas dos participantes; portanto, o nível mais baixo ocorreu para
O nível de escolaridade foi dividido em grupos. Grupo A correspondeu a valores abaixo de 1,0 cm. Pode ser visto na Fig. 4 que todas as escalas têm
graduados do ensino médio ou menos, o Grupo B são alunos de graduação, e mantiveram o mesmo padrão de resposta no nível mais baixo. Observe que o 4-
O grupo C é formado por bacharelado ou superior. Como anteriormente escala de pontos tem os maiores resultados no nível mais baixo, atingindo 23% do
afirmou, o Grupo B teve a maior frequência de resposta, que foi de 70%, respostas na última pergunta. A escala de rosto tem valores mais baixos no
devido ao fato de que a aplicação foi maior nas áreas acadêmicas. Em relação a nível mais baixo, atingindo o máximo de 15,6%, também na última questão.
consumo, a maioria dos entrevistados (62,5%) afirmou que Para as respostas de nível mais alto (Fig. 5 ), os valores são divergentes: 4 em
consumiu o produto pelo menos uma vez por mês (tabela 1) a escala de 4 pontos, acima de 9,0 cm de EAV, 7 no ponto 7, e 6 na cara
Escala. Neste caso, havia uma maior variedade de frequência de resposta,
5.1. Verificações preliminares mantendo um padrão no nível mais alto em todas as escalas, porém com
maior divergências do que o nível mais baixo. Escala da cara e de 4 pontos foram
Antes de iniciar a análise das escalas, alguns testes de normalidade foram realizados as escalas com maior número de respondentes. Na quarta pergunta,
formado. O teste não paramétrico de Kolmogorov-Smirnov foi realizado os valores alcançaram 67,1% para 4 pontos e 62,0% para a Escala Facial.

269

https://translate.googleusercontent.com/translate_f 4/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …

Página 5
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274

mesa 2
Estatísticas da escala.

Alfa de Cronbach Itens* Quer dizer SE Skewness Curtose

Estatisticas SE Estatisticas SE

0,402 4P_Q1 3,05 0,823 0,518 0,100 0,383 0,200


4P_Q2 2,69 0,973 0,167 0,100 0,979 0,200
4P_Q3 3,09 0,879 0,812 0,100 0,035 0,200
4P_Q4 3,62 0,591 1.616 0,100 2.964 0,200
4P_Q5 2,32 1.010 0,318 0,100 0,972 0,200
0,527 VA_Q1 6,561 2,6633 0,647 0,100 0,703 0,200
VA_Q2 5,299 2,9916 0,139 0,100 1.295 0,200
VA_Q3 6,717 2.6492 0,836 0,100 0,245 0,200
VA_Q4 8.066 1,8944 1.626 0,100 2.773 0,200
VA_Q5 4,207 3,1340 0,365 0,100 1.246 0,200
0,575 7P_Q1 5.08 1.729 0,660 0,100 0,546 0,200
7P_Q2 4,30 1.936 0,089 0,100 1.215 0,200
7P_Q3 5,15 1,754 0,740 0,100 0,385 0,200
7P_Q4 6,03 1.286 1.499 0,100 2.084 0,200
7P_Q5 3,59 2.042 0,365 0,100 1,166 0,200
0,561 FS_Q1 4,85 1.223 1.199 0,100 1,004 0,200
FS_Q2 4,29 1.470 0,725 0,100 0,367 0,200
FS_Q3 4,92 1.278 1.388 0,100 1.444 0,200
FS_Q4 5,45 0,866 2.087 0,100 5,678 0,200
FS_Q5 3,59 1.672 0,104 0,100 1,168 0,200

* 4P: 4 pontos; VA: Escala Visual Analógica; 7P: 7 pontos; FS: escala facial.

Fig. 3. Escalas médias após transformação. Fig. 5. Porcentagem de respostas: nível mais alto.

Escala e 15,8% na VAS.


Outro fator analisado neste estudo foi a escala intermediária, também
chamado de ponto médio ou ponto médio. Neste estudo, a escala de 7 pontos
(resposta: 4) e VAS (respostas de 4,5 cm a 5,5 cm) têm esse ponto.
Na escala de 7 pontos, houve mais respostas de ponto médio, alcançando
14,3% na terceira questão. Enquanto isso, o VAS obteve 7,5% de um
responde à mesma pergunta. Como essa diferença é considerada grande,
foi decidido comparar as respostas do ponto médio de 7 pontos com as outras
três escalas. Para cada participante que selecionou o ponto médio, um
foi realizada a análise das respostas das demais escalas. As respostas foram
níveis baixos: 4 pontos, valores 1 e 2; VAS, valores abaixo de 4,5 cm; Escala facial,
valores 1, 2 e 3. As respostas foram de alto nível se; 4 pontos = valores 3 e
4; VAS = valores acima de 5,5 cm; Escala facial = valores 4, 5 e 6. Para VAS,
respostas consideradas iguais, ou seja, entre 4,5 e 5,5 cm também foram
analisado (Fig. 6 ).
Para a escala de 4 pontos, a questão cinco obteve mais respostas em níveis baixos; tudo
outras questões foram levadas a altos níveis. Para VAS, havia vários
Fig. 4. Porcentagem de respostas: Nível mais baixo. resultados. Na quinta questão, houve mais respostas em níveis elevados.
Na primeira questão, houve semelhança entre níveis altos e iguais
Portanto, uma grande diferença foi observada com VAS, que obteve respostas, e para outras questões, respostas iguais foram na maioria.
46,7% das respostas de nível mais alto para a mesma pergunta. O primeiro Para a Escala de Face, a grande maioria das respostas, mais de 80% no total
questão também teve grande divergência com 35,5% de respostas no Face perguntas, foi para níveis elevados.

270

Página 6
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274

https://translate.googleusercontent.com/translate_f 5/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …

Como pode ser visto em Tabela 4 , os homens selecionaram a escala de 4 pontos e a escala facial como
a escala mais fácil de usar. No entanto, o de 4 pontos foi escolhido como o mais fácil
e o melhor por mulheres. Os homens escolheram a escala facial como a melhor escala. Ac-
de acordo com as faixas etárias, há confirmação da preferência de 4 pontos
relacionado à facilidade de uso e a Escala Facial para o problema de "expressar meus sentimentos"
foi escolhido pela maioria. Em relação à melhor escala, houve um
divergência entre o grupo de 18 a 25 anos, que escolheu a Escala de Face,
enquanto o grupo com idade acima de 35 anos optou pelo 4 pontos. Para o grupo de 25
para 35, ambas as escalas foram empatadas como a melhor opção.
Em relação ao nível de escolaridade também houve concordância entre
o de 4 pontos é o mais fácil de usar e a escala de rosto é o que
melhor “expressa meus sentimentos”. Quanto à melhor escala, o Grupo A escolheu 4 pontos
e o Grupo B, alunos de graduação, escolheram a Escala de Face. Houve um empate
entre as duas escalas para o Grupo C.

6. Discussão

Este estudo conduziu um experimento para analisar o impacto que um


escala traz para as respostas do questionário. Para isso, quatro tipos diferentes de
Fig. 6. Comparação do ponto médio. escalas foram estudadas: três com características ordinais: 4 pontos, 7 pontos
e Face Scale, que usava imagens de expressões faciais e uma escala de proporção

5.3. Preferências do entrevistado chamada Escala Visual Analógica (VAS). Com base na revisão da literatura,
foi possível propor cinco hipóteses para analisar alguns aspectos da

Para analisar as percepções dos entrevistados sobre as escalas, duas questões escalas escolhidas. Cada hipótese foi examinada com base na estatística

foram solicitados a cada pessoa que avaliasse de 0 a 10: “Quão fácil foi análise apresentada na Seção 5. O resumo dessas análises é pré-

usa a escala acima? ”, e“ Os níveis expressam bem o que você enviado na Tabela 5 .

sentir?" Depois de usar as quatro escalas, os participantes devem escolher qual escala Para Hipótese 1, o procedimento de análise de confiabilidade foi realizado

foi mais fácil de usar, qual escala expressou melhor os sentimentos, e o melhor e percebeu-se que quanto menos itens de resposta, menor era o Cron-

escala. alfa de Bach, que concorda com outras pesquisas (Kehoe, 1995; Tavako l

Primeiramente, foi analisada a média de percepção da escala; A Tabela 3 apresenta o & Dennick, 2011; Weng, 2004 ). Também foi possível observar que o
média e desvio padrão para cada escala. A média geral era quanto mais itens de resposta houver, maior será o padrão das respostas

maior que 8, o que pode ser considerado alto, uma vez que os valores são de desvios, mostrando que as respostas tendem a ser mais diversas com os

0 a 10. Para ambas as perguntas, mais de 60% das respostas foram notas vinco de itens de resposta. Assim, o maior desvio padrão foi encontrado

8, 9 ou 10; isso mostra boa aceitabilidade pelos respondentes em todas as escalas. em VAS e o menor desvio padrão na escala de 4 pontos ( Dawes,

Para o item “fácil de usar”, foi realizado o teste t pareado e todos


as comparações de valores foram menores que 0,05, indicando que as médias são estáticas
estatisticamente diferentes uns dos outros. Portanto, é possível classificar o Tabela 4

escalas de acordo com a facilidade de uso. A escala de 4 pontos foi considerada Preferências de escala: porcentagem por grupos.

o mais fácil de usar, seguido pela escala de 7 pontos. A escala VAS foi considerada Item 4 pontos VAS 7 pontos Escala Facial
considerado o mais difícil de usar, provavelmente devido à falta de separação
Fácil de usar 37,5 16,3 16,3 29,9
entre as várias respostas possíveis. Em relação ao “expressar o Expressar meus sentimentos 20,0 17,8 15,8 46,4
questão de sentimentos, o teste t-pareado apresentou todas as comparações como > 0,05, Melhor 30,4 17,6 20,3 31,6

portanto, não é possível classificar as escalas de acordo com essa característica. Item Gênero 4 pontos VAS 7 pontos Escala Facial

No entanto, é interessante notar que para este estudo todas as escalas foram capazes Fácil de usar Fêmea 37,6 21,5 17,7 23,2
para expressar a opinião dos respondentes. Masculino 37,3 10,6 14,8 37,3
Expressar meus sentimentos Fêmea 19,0 23,2 19,3 38,6
No final do questionário, cada entrevistado pode escolher qual
Masculino 21,1 12,0 12,0 54,9
foi o mais fácil de usar entre as quatro escalas, escala que melhor expressa
Melhor Fêmea 29,3 24,4 21,9 24,4
seus sentimentos, e qual foi a melhor escala. Em geral, a escala escolhida Masculino 31,7 10,2 18,7 39,4
como o mais fácil de utilização foi a 4-ponto (37,5%); a escala que melhor ex- Item Era 4 pontos VAS 7 pontos Escala Facial

sentimentos pressionados foi a Escala de Face (46,4%); e a melhor escala foi


Fácil de usar 18 a 25 30,8 19,8 20,4 29,0
estatisticamente amarrado entre a escala facial (31,6%) e a escala de 4 pontos (30,4%). 26 a 35 43,7 13,8 9,6 32,9

É importante notar que 62,4% dos entrevistados escolheram o mesmo Acima de 35 50,0 8,5 13,8 27,7
Expressar meus sentimentos 18 a 25 16,2 24,3 16,5 43,1
opção para todas as três questões, confirmando sua preferência. Para o
26 a 35 22,2 9,6 14,4 53,9
outros, 19,3% escolheram a escala mais fácil como a melhor e 9,9% escolheram a
Acima de 35 29,8 9,6 16,0 44,7
escala que melhor expressou seus sentimentos como a melhor; 8,4% escolheram um diferente Melhor 18 a 25 24,6 22,8 23,4 29,3
escala para cada questão. 26 a 35 35,3 12,6 16,2 35,9
Acima de 35 42,6 8,5 17,0 31,9
Item Nível de educação 4 pontos VAS 7 pontos Escala Facial
Tabela 3
Fácil de usar grupo A 48,3 10,3 8,6 32,8
Percepções de escala.
Grupo B 36,1 16,7 17,0 30,1
Escala Fácil de usar Expressar meus sentimentos Grupo C 37,0 17,6 17,6 27,7
Expressar meus sentimentos grupo A 17,2 8,6 17,2 56,9
Quer dizer SE Quer dizer SE
Grupo B 19,4 18,7 15,3 46,7
4 pontos 8,85 1.474 8,13 1.718 Grupo C 23,5 19,3 168 40,3
VAS 8,12 2.016 8,13 1.910 Melhor grupo A 39,7 12,1 12,1 36,2
7 pontos 8,54 1.669 8,09 1.843 Grupo B 29,4 19,1 19,9 31,6
Escala Facial 8,37 1.935 8.02 2.071 Grupo C 29,4 15,1 26,1 29,4

271

Página 7
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274

Tabela 5 O VAS foi considerado menos amigável. Em relação ao problema “ex-


Resultados do teste de hipóteses. pressione meus sentimentos ”, todos obtiveram uma média estatisticamente semelhante. A propósito do

https://translate.googleusercontent.com/translate_f 6/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Hipótese Aceitar escolha das questões da escala, a de 4 pontos foi escolhida como a mais fácil
firmando Viswanathan et al. (2004) conclusões, a Escala de Face foi
H1 A confiabilidade da escala diminui à medida que o número de itens de resposta sim
escolhido como o melhor para expressar os sentimentos dos participantes, e as mesmas escalas
diminui.
H2 Para escalas diferentes, as tendências de resposta são as mesmas e tendem sim foram empatados em relação à melhor escala. Usando escalas diferentes do que no
para atingir o mesmo nível. estudar por Preston e Colman (2000) , os resultados foram diferentes, uma vez que o
H3 Todas as escalas têm a mesma frequência de respostas de nível extremo. Não
7 pontos foram escolhidos mais vezes do que 4 pontos e 6 pontos (Escala de Face
H4 Respostas de ponto médio são distribuídas simetricamente em forçadas Não
neste estudo). Em relação à escala que melhor “expressa sentimentos”, o 7º
escalas.
H5 A preferência de escala não difere entre grupos de gênero, idade e Não
ponto também foi escolhido com mais frequência, diferente do que foi encontrado em
Educação. o estudo anterior. No entanto, é importante ressaltar que prefere
as ocorrências variam de acordo com os aspectos culturais, portanto essa diferença pode ocorrer devido
às diferentes características dos respondentes.
2008; Dolnicar & Grün, 2009 ).
Para avaliar as diferenças entre os grupos neste estudo, o
A fim de verificar a Hipótese 2, foi analisado em relação ao
valores para as preferências foram novamente analisados ​de acordo com grupos de
assimetria negativa para todas as escalas nas primeiras quatro questões, e mostrou
gênero, idade e escolaridade. Não houve grandes diferenças em relação
uma maior tendência de respostas a avaliações positivas. Uma exceção foi o
qual escala foi mais fácil de usar e qual melhor expressou os sentimentos.
última questão, que teve uma ligeira tendência para os valores mais baixos de
Porém, houve diferenças em relação à melhor escala, com o 4-
a escala, exceto para a escala de rosto. Um fator a ser observado é o
ponto sendo escolhido pelas mulheres e a Escala Facial escolhida pelos homens. Enfrentar
maiores valores de assimetria negativa para Escala Facial, mostrando uma maior
A escala também foi escolhida pelo grupo de 18 a 25 anos; no entanto, o 4-
sensibilidade a valores positivos para tal escala. Para valores de curtose, há
ponto foi escolhido pelo grupo acima de 35 anos. Em relação à educação
não estava tão de acordo quanto com os outros testes. No entanto, é
nível, Grupo B (alunos de graduação) Escala Facial preferida, e
possível observar que a quarta questão para todas as escalas possui a maior
O Grupo A (com ensino médio ou menos) escolheu o 4 pontos como o melhor
valores positivos, mostrando uma distribuição nítida. Ou seja, as respostas dez-
escala.
deduzido para indicar o mesmo ponto; no entanto, as pequenas diferenças encontradas
não deve ser descartado (Hipótese 2) Além disso, a escala facial tem
mais perguntas com curtose positiva, mostrando que a maioria das respostas 6.1. Implicações gerenciais
convergem no mesmo ponto (Dawes, 2008; Kline, 2015)
Na análise da escala, foi realizada uma comparação das médias, então Esta pesquisa realizou várias análises de alguns questionários
que todas as escalas foram transformadas em valores de 0 a 1. É possível escalas amplamente utilizadas no mercado. Observou-se que essas quatro escalas
observe que quanto menos itens de resposta, maior será a resposta, são confiáveis ​e têm uma tendência semelhante, independentemente de seu tamanho e do
aumentando os resultados positivos (Dolnicar & Grün, 2013) Estes achados forma como foram apresentados. No entanto, houve um aumento
diferem de um estudo sobre classificações de filmes (Cena et al., 2017), que poderia nas respostas médias para a escala de 4 pontos e a escala de rosto, além disso
ser explicado pelo comportamento diferente dos entrevistados e o
ção, ambas as escalas tiveram uma série de respostas no nível mais extremo
questionário utilizado. ParaHipótese 3 , verificou-se que escalas com menos ("Muito importante"). A escala de rosto, no entanto, teve menos respostas no
itens de resposta também têm valores extremos mais altos devido à falta de op- nível menos extremo (“Nada importante”). Concluiu-se que o 4-
ções. Observou-se também que a escala facial apresenta maior frequência de
escala de pontos obteve valores mais positivos.
valores no nível mais alto e uma frequência mais baixa no nível mais baixo, Outro fator estudado nesta pesquisa foi a utilização do ponto médio,
mostrando que os entrevistados escolhem opções que expressam alegria. O VAS foi observado que este ponto não tem um impacto mediano na força forçada
obteve a menor frequência de valores no nível mais alto, mostrando respostas, ou seja, quando foi fornecida uma escala forçada (sem meio
que os entrevistados tendem a ser mais seletivos na escolha de valores mais altos para ponto), os entrevistados optaram por respostas mais positivas, especialmente quando
uma escala de razão, ao contrário da frequência no nível mais baixo ( Nadler et al., 2015 ; usando a escala de 4 pontos e a escala de rosto.
Weijters et al., 2010) As escalas preferidas dos entrevistados foram a escala de 4 pontos, escolhida por nós
Houve uma análise em relação às escalas focadas no meio habilidade e escala facial, selecionada por ser a escala que melhor expressa
categoria, para a Hipótese 4 . Para isso, os resultados foram analisados ​para re- os sentimentos das pessoas. Portanto, sugere-se que, se o público-alvo for o
espondentes que selecionaram o ponto médio na escala de 7 pontos. Era mesmo, essas escalas devem ser utilizadas para avaliar a opinião do cliente, como o
observaram que tais entrevistados tendiam a responder com níveis mais elevados em
as opiniões seriam mais confiáveis ​e confiáveis ​para refletir o
escalas sem ponto médio, também chamadas de escalas de escolha forçada. Este resultado sentimentos do respondente.
também foi encontrado em outro estudo, onde os autores indicam que o
os entrevistados podem dar uma resposta mais positiva para serem úteis ou para
7. Limitações da pesquisa
por favor, o entrevistador ( Garland, 1991 ). Esse aspecto foi reafirmado por
o aumento de avaliações positivas na escala Face, e também percebido em
Foi proposto analisar algumas características do tipo de escala utilizadas em
outro estudo comparando estrelas, considerado um ícone neutro, e representa
diferentes pesquisas nos contextos de marketing e acadêmico. O estudo foi
ícones sentativos ( Cena et al., 2017 ). Outro fato importante a ser observado é o
realizado no Brasil, pois apresenta características referentes a este
falta de rótulos. Isso leva o entrevistado a colocar o rótulo de acordo com
público e não pode afirmar as mesmas características podem ser vistas em
sua percepção, portanto não é possível determinar se a resposta seria
outra cultura ou contexto. Além disso, a fim de evitar um excesso
neutro ou nenhum. Também foi observado que nas respostas do ponto médio de VAS
número de questões, apenas quatro escalas foram escolhidas para serem utilizadas e a ana-
eram muito mais baixos. Isso mostra que apesar de apresentar um ponto médio, é
lisado, deixando várias escalas igualmente interessantes de lado, como o binário
não tão claro quanto em uma escala ordinal (Friedman et al., 1993; Kulas e Sta-
escala, escala de 5 pontos, escala com ícones de estrelas e escala de cores, entre
Chowski, 2013; Nadler et al., 2015; Weathers et al., 2005; Weijters et al. ,
outros. No entanto, esta foi uma decisão necessária para fornecer uma
2010 ).
uma gama de respostas capaz e relevante. Além disso, também era importante
A fim de analisar a hipótese 5, a última parte do questionário foi
para limitar as escalas para fornecer uma análise mais eficaz.
com base nas preferências dos respondentes. As perguntas feitas depois que eles
Outro fator importante a se observar é o produto alimentício analisado,
usaram as escalas não receberam respostas muito diferentes, com uma média
dadas as diferentes possibilidades de estudo, optou-se por este objeto de estudo
entre 8 e 9 para todas as escalas. No entanto, houve um ligeiro aumento
porque é tangível e bem conhecido do público, portanto, os resultados
valor para os 4 pontos quando as escalas foram comparadas para facilidade de uso, e
poderia ser diferente com outros questionários e objetos de estudo.

272

Página 8
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274

8. Conclusões Declaração de Concorrência de Interesses

Ao desenvolver uma análise de escalas, a intenção do presente estudo foi Os autores declaram não ter conhecimento financeiro concorrente
contribuir para opiniões de medição, comportamento e preferência de escala interesses ou relações pessoais que possam ter parecido influenciar
pesquisar. Dawes (2008) observou especificamente a influência da escala na média o trabalho relatado neste artigo.

https://translate.googleusercontent.com/translate_f 7/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
e variância encontrada na pesquisa. Preston e Colman (2000) analisaram
preferência dos respondentes em relação a várias escalas utilizadas na pesquisa. Sediada Agradecimentos
nesses estudos, esta pesquisa buscou analisar diversos fatores que podem
análise de escala de influência. Portanto, é relevante para pesquisadores que buscam Este estudo foi financiado em parte pela Coordenaç˜ao de Aperfeiçoa-
uma escala que melhor se adapta às suas pesquisas. Código Financeiro 001 do mento de Pessoal de Nível Superior (CAPES) e o
Esta pesquisa comparou as escalas selecionadas de acordo com a média, Conselho Nacional de Desenvolvimento Científico e Tecnológico - Brasil
desvio padrão, assimetria e curtose, e, como em Dawes (2008) , (CNPq).
foi possível observar pontuações mais baixas para escalas com maior número de
itens de resposta. Em relação aos níveis extremos, foi possível observar Referências
que a escala com o menor número de respostas teve maiores respostas em
níveis extremos, especialmente no nível mais alto. O ponto médio, ana- Adelson, JL e McCoach, DB (2010). Medindo as atitudes matemáticas de
alunos do ensino fundamental: os efeitos de uma escala do tipo Likert de 4 ou 5 pontos. Educacional
lisado na escala de 7 pontos, empurra as opções para níveis mais altos quando
and Psychological Measurement, 70 (5), 796–807. https://doi.org/10.1177/
em comparação com escalas forçadas, levando à crença de que o alto nível 0013164410366694 .
as opções são escolhidas com mais frequência quando não há ponto médio, um caracter Wong, DL e Baker, CM (1988). Dor em crianças: comparação de escalas de avaliação.
Enfermagem pediátrica, 14 (1). https://pubmed.ncbi.nlm.nih.gov/3344163/ .
istic também observado por Weijters et al. (2010). Com essas observações, é
Bruner, G. (2013). Manual de escalas de marketing: medidas de vários itens para o consumidor
importante apontar que como Dolnicar e Grün (2013) mostraram, muito Insight Research (Vol. 7).
é necessário cautela ao comparar dois estudos com escalas diferentes. Cabooter, E., Weijters, B., Geuens, M., & Vermeir, I. (2016). Efeitos de formato de escala em
interpretação e uso da opção de resposta. Journal of Business Research, 69 (7),
Em relação à preferência de escala, é possível afirmar que as escalas
2574–2584. https://doi.org/10.1016/j.jbusres.2015.10.138 .
com uma quantidade menor de itens são preferidos pelos participantes do estudo, Cena, F., Gena, C., Grillo, P., Kuflik, T., Vernero, F., & Wecker, AJ (2017). Como escalas
que é diferente do que foi encontrado por Preston e Colman (2000). influenciar o comportamento de classificação do usuário em sistemas de recomendação. Comportamento e Informação
Technology, 36 (10), 985–1004. https://doi.org/10.1080/0144929X.2017.1322145 .
No entanto, como os autores apontaram, é importante ser cauteloso
Chen, C., Lee, S.-Y., & Stevenson, HW (1995). Estilo de resposta e multicultural
porque escalas diferentes são melhores para finalidades diferentes e, como pode ser comparações de escalas de avaliação entre estudantes do Leste Asiático e da América do Norte.
visto, para diferentes públicos-alvo, conforme confirmado pelas descobertas por Psychological Science, 6 (3), 170–175. http://www.jstor.org/stable/40063010 .

Shaftel et al. (2012). Por esse motivo, é importante ressaltar que este Couper, MP, Tourangeau, R., Conrad, FG, & Singer, E. (2006). Avaliando o
eficácia das escalas analógicas visuais: um experimento na web. Ciência Social da Computação
pesquisa focada em uma análise de produto de um país, e é interessante
Review, 24 (2), 227–245. https://doi.org/10.1177/0894439305281503 .
para avaliar como as percepções de diferentes culturas e nacionalidades estão em Cunha, LM, Cabral, D., Moura, AP, & de Almeida, MDV (2018). Aplicação do
relação a essas escalas. Questionário de escolha de alimentos entre culturas: revisão sistemática de cross-cultural e
estudos de um único país. Food Quality and Preference, 64 , 21-36. https://doi.org/
Nesta pesquisa, foi possível observar que escalas com menos
10.1016 / j.foodqual.2017.10.007 .
itens de resposta, como 4 pontos, têm uma maior convergência de respostas, Dawes, J. (2008). As características dos dados mudam de acordo com o número de pontos da escala
o que pode facilitar a visão geral dos respondentes. No entanto, escalas usado? Um experimento usando escalas de 5, 7 e 10 pontos. Jornal Internacional
of Market Research, 50 (1), 61–104. https://doi.org/10.1177/147078530805000106 .
com mais itens de resposta mostram mais detalhes e especificidades de
Dolnicar, S., & Grün, B. (2009). Será que um tamanho serve para todos? A adequação dos formatos de resposta para
opiniões dos respondentes. Portanto, sugere-se que se, na pesquisa, diferentes construtos medidos. Australasian Marketing Journal (AMJ), 17 (1), 58–64.
pretende-se compreender uma opinião mais simples e objetiva, ou mesmo se https://doi.org/10.1016/j.ausmj.2009.04.001 .
Dolnicar, S., & Grün, B. (2013). “Traduzindo” entre os formatos de resposta da pesquisa. Diário de
é o primeiro contato do público-alvo com a pesquisa, então é
Business Research, 66 (9), 1298-1306. https://doi.org/10.1016/j.
interessante fornecer menos itens de resposta para escolha. No entanto, se o jbusres.2012.02.029 .
o pesquisador pretende ver nuances de resposta, como bom, muito bom e Fombelle, PW, Sirianni, NJ, Goldstein, NJ, & Cialdini, RB (2015). Deixe todos eles comerem
Bolo: Fornecimento de serviços VIP sem o custo de exclusão para clientes não VIP.
extremamente bom, e as diferenças entre as respostas próximas são
Journal of Business Research, 68 (9), 1987–1996. https://doi.org/10.1016/j.
importante para a pesquisa, escalas com mais itens de resposta, 7 < , são jbusres.2015.01.018 .
indicado. Friedman, HH, Herskovitz, PJ, & Pollack, S. (1993). Os efeitos de polarização da escala

Outra questão abordada nesta pesquisa foi relacionada ao meio verificar estilos de resposta a uma escala Likert. Em Proceedings of the Joint Statistical
reunião (pp. 793–795) .
apontar; foi observado que a maioria das respostas de ponto médio quando colocadas
Funke, F. (2016). Um experimento da web que mostra os efeitos negativos das escalas do controle deslizante em comparação com
em uma escala forçada tendeu a respostas de alto nível, levando a escalas visuais analógicas e escalas de botão de rádio. Social Science Computer Review, 34 (2),
média para um valor mais alto. Portanto, sugere-se que a escolha de 244–254. https://doi.org/10.1177/0894439315575477 .
Funke, F., & Reips, U.-D. (2012). Por que diferenciais semânticos em pesquisas baseadas na web
usar um ponto médio leva em consideração se há um significado para
deve ser feito a partir de escalas visuais analógicas e não de escalas de 5 pontos. Campo
tal nível ou não, ou seja, os pesquisadores precisam compreender se Methods, 24 (3), 310-327. https://doi.org/10.1177/1525822X12444061 .
a resposta de um item 'nada bom e nada mau' tem um significado específico para eles Funke, F., Reips, U.-D., & Thomas, RK (2011). Controles deslizantes para o Smart: tipo de escala de avaliação
na web interage com o nível educacional. Social Science Computer Review, 29 (2),
pesquisar. Por fim, percebeu-se que existem preferências específicas para
221–231. https://doi.org/10.1177/0894439310376896 .
diferentes grupos de pessoas, tornando mais fácil para o público entender Garland, R. (1991). O ponto médio em uma escala de classificação: é desejável? Boletim de marketing, 2

e consequentemente responder ao questionário com mais confiança. Isto é (1), 66–70. http://marketing-bulletin.massey.ac.nz/V2/MB_V2_N3_Garland.pdf .
Gharaibeh, M., & Abu-Saad, H. (2002). Validação cultural da avaliação da dor pediátrica
acreditava que ao conhecer as preferências do público-alvo, o pesquisador
ferramentas: perspectiva jordaniana. Journal of Transcultural Nursing, 13 (1), 12–18. https: //
poderá escolher a melhor escala a ser usada e obter mais respostas doi.org/10.1177/104365960201300103 .
(ver Tabela 4) Harland, NJ, Dawkin, MJ, & Martin, D. (2015). Utilidade relativa de um análogo visual
escala vs uma escala Likert de seis pontos na medição do resultado global do assunto em
A análise feita neste estudo é um passo em direção a mais pesquisas
pacientes com lombalgia recebendo fisioterapia. Fisioterapia, 101 (1), 50–54.
relacionadas a escalas porque são tão frequentemente usadas na área acadêmica, médica, https://doi.org/10.1016/j.physio.2014.06.004 .
e ambientes de negócios. Portanto, sugere-se que mais Hicks, CL, von Baeyer, Spafford, PA, van Korlaar, I., & Goodenough, B. (2001). o

pesquisas sejam realizadas para que seja possível identificar mais Faces Pain Scale - Revisada: em direção a uma métrica comum na medição da dor pediátrica.
Pain, 93 (2), 173-183. https://doi.org/10.1016/s0304-3959(01)00314-1 .
características de cada escala e finalmente determinar a melhor escala para cada
Hayes, MHS e Patterson, DG (1921). Desenvolvimento experimental do gráfico
objetivo, objeto de estudo e questionário. método de classificação. Psychological Bulletin, 18 , 98-99. https://doi.org/10.1037/
h0064147 .
Hosany, S., & Prayag, G. (2013). Padrões de respostas emocionais, satisfação dos turistas,
e intenção de recomendar. Journal of Business Research, 66 (6), 730-737. https: //
doi.org/10.1016/j.jbusres.2011.09.011 .

273

Página 9
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274

Iannario, M., Manisera, M., & Zuccolotto, P. (2017). Tratamento de “não sei” Sung, Y.-T., & Wu, J.-S. (2018). A escala visual analógica para classificação, classificação e
respostas na percepção dos consumidores sobre a sustentabilidade no setor agroalimentar. Comparação em pares (VAS-RRP): Uma nova técnica para medição psicológica.
Qualidade e quantidade, 51 (2), 765-778. https://doi.org/10.1007/s11135-016-0438-7 . Behavior Research Methods, 50 (4), 1694–1715. https://doi.org/10.3758/s13428-018-
Kehoe, J. (1995). Análise de itens básicos para testes de múltipla escolha. Avaliação Prática, 1041-8 .
Research & Evaluation, 4 (10), 3. https://doi.org/10.7275/07zg-h235 . Tavakol, M., & Dennick, R. (2011). Dando sentido ao alfa de Cronbach. Internacional
Kline, RB (2015). Princípios e prática da modelagem de equações estruturais (4ª ed.). o Journal of Medical Education, 2 , 53–55. https://doi.org/10.5116/ijme.4dfb.8dfd .
Guilford Press . Viswanathan, M., Sudman, S., & Johnson, M. (2004). Máximo versus significativo
Kulas, JT e Stachowski, AA (2013). Justificativa do entrevistado para não concordar nem discriminação na escala de resposta. Journal of Business Research, 57 (2), 108-124.
discordando: contribuintes de pessoas e itens para a intenção de endosso de categoria intermediária em https://doi.org/10.1016/S0148-2963(01)00296-X .
Indicadores de personalidade Likert. Journal of Research in Personality, 47 (4), 254–262. Voutilainen, A., Pitkäaho, T., Kvist, T., & Vehviläinen-Julkunen, K. (2016). Como perguntar
https://doi.org/10.1016/j.jrp.2013.01.014 . sobre a satisfação do paciente? A escala visual analógica é menos vulnerável a

https://translate.googleusercontent.com/translate_f 8/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Lim, H.-E. (2008). O uso de diferentes escalas de avaliação de felicidade: preconceito e comparação fatores de confusão e efeito teto do que uma escala de Likert simétrica. Diário de
problema? Social Indicators Research, 87 (2), 259–267. https://doi.org/10.1007/ Enfermagem Avançada, 72 (4), 946–957. https://doi.org/10.1111/jan.12875 .
s11205-007-9171-x . Wakita, T., Ueshima, N., & Noguchi, H. (2012). Distância psicológica entre
Lozano, LM, García-Cueto, E., & Mu˜niz, J. (2008). Efeito do número de respostas categorias na escala Likert: Comparando diferentes números de opções. Educacional
categorias sobre a confiabilidade e validade das escalas de avaliação. Metodologia, 4 (2), 73–79. and Psychological Measurement, 72 (4), 533-546. https://doi.org/10.1177/
https://doi.org/10.1027/1614-2241.4.2.73 . 0013164411431162 .
Nadler, JT, Weston, R., & Voyles, EC (2015). Preso no meio: o uso e Weathers, D., Sharma, S., & Niedrich, RW (2005). O impacto do número de escala
Interpretação de pontos médios em itens de questionários. The Journal of General pontos, fatores disposicionais e a heurística de decisão do status quo sobre a confiabilidade da escala
Psychology, 142 (2), 71-89. https://doi.org/10.1080/00221309.2014.994590 . e precisão de resposta. Journal of Business Research, 58 (11), 1516–1524. https: // doi.
Norman, G. (2010). Escalas Likert, níveis de medição e as “leis” das estatísticas. org / 10.1016 / j.jbusres.2004.08.002 .
Advances in Health Sciences Education, 15 (5), 625–632. https://doi.org/10.1007/ Weijters, B., Cabooter, E., & Schillewaert, N. (2010). O efeito do formato da escala de avaliação sobre
s10459-010-9222-y . estilos de resposta: o número de categorias de resposta e rótulos de categoria de resposta.
Preston, CC, & Colman, AM (2000). Número ideal de categorias de resposta na classificação International Journal of Research in Marketing, 27 (3), 236–247. https://doi.org/
escalas: confiabilidade, validade, poder discriminante e preferências do respondente. Acta 10.1016 / j.ijresmar.2010.02.004 .
Psychologica, 104 (1), 1-15. https://doi.org/10.1016/S0001-6918(99)00050-5 . Weng, L.-J. (2004). Impacto do número de categorias de resposta e rótulos âncora em
Ro, H., & Olson, ED (2020). Discriminação percebida por clientes gays e lésbicas e coeficiente alfa e confiabilidade teste-reteste. Educacional e psicológico
Gerenciamento de identidade. International Journal of Hospitality Management, 84 , 102319. Medição, 64 (6), 956–972. https://doi.org/10.1177/0013164404268674 .
https://doi.org/10.1016/j.ijhm.2019.102319 .
Salzberger, T., & Koller, M. (2013). Rumo a um novo paradigma de medição em
Naia Antunis de Rezende é Ph.D. estudante do Departamento de Engenharia de Produção,
marketing. Journal of Business Research, 66 (9), 1307–1317. https://doi.org/10.1016/
Universidade Federal de Pernambuco, UFPE - Brasil. Atualmente trabalha no PLANASP
j.jbusres.2012.02.030 .
Grupo com foco no desenvolvimento de escala e implantação da função de qualidade. Sra. Rezende
Sarofim, S., Chatterjee, P., & Rose, R. (2018). Quando os cartões de crédito da loja prejudicam os varejistas:
recebeu seu bacharelado (2012) e mestrado (2015) em Engenharia de Produção da
efeito diferencial do pagamento de taxas de cartão de crédito sobre o comportamento de compra dos consumidores.
Universidade Federal de Itajubá, suas pesquisas incluíram desenvolvimento e ergonomia de produtos.
Journal of Business Research . https://doi.org/10.1016/j.jbusres.2018.08.031 .
nomics. Seus interesses de pesquisa são desenvolvimento de produtos, comportamento do cliente e preferências.
Shaftel, J., Nash, BL, & Gillmor, S. (2012). Efeitos do número de resposta
cias, ergonomia, adaptabilidade.
Categorias nas escalas de classificação. Em mesa redonda apresentada na Conferência Anual do
Pesquisa Educacional Americana. Anais da conferência anual da American
associação de pesquisa educacional (pp. 1-24) . Denise Dumke de Medeiros é doutora. em Engenharia de Produção pelo Institut National
Subhashini, L., Vatsa, M., & Lodha, R. (2008). Comparação de duas escalas de dor na Índia Polytechnique de Grenoble, e ela foi pesquisadora visitante na Université du Québec. Ela
crianças. The Indian Journal of Pediatrics, 75 (9), 891-894. https://doi.org/10.1007/ é professora titular de Engenharia de Produção da Universidade Federal de Pernambuco e é
s12098-008-0096-4 . Chefe do PLANASP. A sua investigação centra-se na Gestão da Qualidade em vários assuntos, tais como
Sun, T., West, N., Ansermino, JM, Montgomery, CJ, Myers, D., Dunsmuir, D.,… como: competitividade, qualidade de serviço, planejamento estratégico. Seu trabalho de pesquisa tem sido
Lonnqvist, P.-A. (2015). Uma versão para smartphone da Faces Pain Scale-Revised e publicado em muitas revistas especializadas e anais de conferências, incluindo International
a Escala Analógica de Cores para avaliação da dor pós-operatória em crianças. Pediatra Journal of Business & Industrial Marketing, Journal of Fuzzy Systems, Quality & Quantity,
Anesthesia, 25 (12), 1264–1273. https://doi.org/10.1111/pan.2015.25.issue- Journal of Cleaner Production.
1210.1111 / pan.12790 .

274

https://translate.googleusercontent.com/translate_f 9/9

Você também pode gostar