Escolar Documentos
Profissional Documentos
Cultura Documentos
Página 1
Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, meio
ponto e preferências do entrevistado
ARTICLEINFO RESUMO
Palavras-chave: Este estudo buscou analisar diferentes escalas de classificação utilizadas em pesquisas, incluindo duas escalas ordinais com numerais, e
Análise de item escala ordinal com imagens de rosto e uma escala de proporção. Em primeiro lugar, as análises estatísticas foram realizadas, como média de
Questionário
parison, skewness e curtose. Posteriormente os pontos críticos das escalas, como os níveis extremos e médios
Escala de classificação
pontos, foram analisados. Finalmente, as preferências de escala foram comparadas de acordo com sexo, idade e escolaridade. o
Likert
estudo foi realizado com 595 pessoas, e os resultados mostraram uma tendência para escalas com menos itens de resposta para
Escala Visual Analógica
obter valores mais elevados. Além disso, houve uma maior incidência de respostas em níveis extremos, principalmente em níveis mais elevados
Escala Facial
Número de resposta níveis. Foi possível identificar diferenças entre as preferências de escala dentro dos grupos, e foi observado
que a escala mais fácil não tem necessariamente mais harmonia com os sentimentos do entrevistado.
* Autor para correspondência: Departamento de Engenharia de Produção, Av. da Arquitetura, s / n, Cidade Universitária, Recife, PE 50740-550, Brasil.
Endereço de e-mail: naia.rezende@ufpe.br (NA de Rezende).
https://doi.org/10.1016/j.jbusres.2021.09.031
https://translate.googleusercontent.com/translate_f 1/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Recebido em 2 de outubro de 2020; Recebido em forma revisada em 10 de setembro de 2021; Aceito em 12 de setembro de 2021
Disponível online em 22 de setembro de 2021
0148-2963 / © 2021 Elsevier Inc. Todos os direitos reservados.
Página 2
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274
escalas, para efetivamente fazer a melhor escolha em relação ao seu uso, e para escalas ( Dolnicar & Grün, 2013 ); como eles entendem o ponto médio
analisar os valores encontrados de forma correta e objetiva. respostas ( Iannario et al., 2017; Weathers et al., 2005) e como eles
O objetivo do estudo foi analisar as escalas de acordo com estatísticas entender a escala do item (Viswanathan, Sudman, & Johnson, 2004 ).
tendência, examine a frequência de valores extremos, identifique o meio Apesar desses estudos variados, ainda não há consenso sobre qual
apontar relevância em escalas simétricas, examinar a preferência do respondente escala é o melhor, ou que escala é a mais adequada para o uso. Algum
de acordo com a facilidade de uso e expressão de sentimentos, e para determinar pesquisadores sugerem que a escala deve ser escolhida para complementar o estudo
verificar se as preferências diferem de acordo com sexo, idade e conteúdo e propósito ( Shaftel, Nash, & Gillmor, 2012 ). Portanto, estudos
Educação. Portanto, esta pesquisa visa auxiliar acadêmicos não apenas em usaram diferentes tipos de escala para melhorar a validade do questionário
estudos acadêmicos, mas também nas áreas de medicina, marketing e negócios (Sarofim et al., 2018 ). Consequentemente, também é importante abordar o
pesquisa de qualidade. problema de comparar diferentes tipos de escalas sem análise detalhada
(Lim, 2008 ). Para este estudo, a escolha das escalas foi determinada com base em
2. Revisão da literatura seu amplo uso e características diferentes. Portanto, quatro escalas
com resposta diferente e características de análise foram investigados.
Nesta seção, uma breve revisão das pesquisas que estudaram
escalas de resposta são apresentadas. Embora uma revisão sistemática não fosse
conduzida, a revisão incluiu vários estudos com diferentes percepções 2.2. Escalas escolhidas
informações sobre o assunto. Houve a necessidade de selecionar as escalas a serem usadas para
realizar este estudo. Existem vários tipos de escala e cada estudo buscado Existem várias escalas utilizadas em pesquisas acadêmicas e de marketing.
usar a escala que melhor se adapte ao questionário e ao público-alvo. Para desenvolver um questionário conciso e não cansativo para
Portanto, neste estudo, foram escolhidas quatro escalas, cujos motivos respondentes, foi necessário escolher um pequeno intervalo de escalas para ser
são explicados em detalhes na Seção 2.2 . analisados. Portanto, neste estudo, quatro escalas com características diferentes
istics foram usados (ver Fig. 1 ), e a razão para escolher cada escala é
2.1. Estudos de escala explicado separadamente.
Muitos estudos de marketing usam o formato de pesquisa para entender o 2.2.1. Escala de 4 pontos
consumidores ( Bruner, 2013; Cena et al., 2017; Fombelle, Sirianni, Gold- A escala de 4 pontos é uma escala de opinião forçada. Não contém um
stein, & Cialdini, 2015; Sarofim, Chatterjee e Rose, 2018) Além disso, ponto neutro e isso força o entrevistado a escolher um ponto positivo ou
questionários com respostas predeterminadas são frequentemente usados na medicina opinião negativa. No entanto, alguns estudos apontam a influência
( Harland, Dawkin, & Martin, 2015; Sun et al., 2015; Voutilainen , que o ponto médio tem nas avaliações, o que falta nesta escala.
Pitkäaho, Kvist, & Vehviläinen-Julkunen, 2016 ) e na área acadêmica Por exemplo, os entrevistados podem ser neutros ou indiferentes ao
pesquisa ( Dolnicar & Grün, 2013; Preston & Colman, 2000) Eles são questão, eles podem ser "incertos" ou ambivalentes (depende da situação
também usado para compreender características específicas de grupos ( Adelson & ção), ou mesmo considerar que não há informações suficientes para fazer uma
McCoach, 2010; Hosany e Prayag, 2013; Ro & Olson, 2020) cisãoKulas e Stachowski, 2013; Nadler et al., 2015) Apesar disso,
Escalas são preferidas sempre que a pesquisa busca compreender um escalas com um número menor de opções podem fornecer melhor precisão.
percepções, atitudes ou sentimentos da pessoa. As respostas de classificação podem ser Eles também produzem menos fadiga do respondente, especialmente em perguntas longas.
analisados de forma mais objetiva, estatística e com um grande número de naires (Lozano, García-Cueto, & Mu˜niz, 2008; Viswanathan et al., 2004 ;
respostas. Existem vários estudos que compararam as escalas utilizadas em Weathers et al., 2005) A escala Likert é uma das escalas mais utilizadas na
levantamento de pesquisas, principalmente para fins de identificação da dor e outros pesquisar. A escala é ordinal, como é o caso de outras usadas neste
aspectos na área médica ( Cabooter et al., 2016; Funke & Reips, 2012 ; pesquisa, e é usado apesar das preocupações em relação à análise estatística
Funke, Reips e Thomas, 2011; Wakita et al., 2012) de escalas ordinais (Norman, 2010) Esta escala é totalmente rotulada, que
Vários fatores influenciam a escolha de uma escala específica. Por exemplo, auxilia na interpretação das respostas, e possui dois negativos
como os pesquisadores interpretam as respostas aos itens com uma escala Likert rótulos e dois rótulos positivos ( Friedman, Herskovitz, & Pollack, 1993 ;
( Wakita et al., 2012); como eles traduzem e comparam dois diferentes Weijters et al., 2010 ).
https://translate.googleusercontent.com/translate_f 2/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
267
Página 3
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274
2.2.2. Escala de 7 pontos Alguns estudos analisaram o índice de resposta para níveis extremos,
A escala de 7 pontos foi escolhida porque (juntamente com a escala de 5 pontos isto é, o primeiro eo último pontos de uma escala. Estes pontos podem ter um
escala) é uma das escalas mais utilizadas para a realização de questionários influência na análise da resposta. De acordo com alguns pesquisadores, o
( Bruner, 2013; Weijters et al., 2010 ). Esta escala também foi escolhida porque quanto menor o número de itens de resposta, maior será o extremo
contém um ponto médio, o que significa que foi possível analisar o frequência de resposta de nível (Cena et al., 2017; Chen et al., 1995; Wakita ,
influência de “nenhum” nas opiniões dos respondentes. Além disso, a escala Ueshima, & Noguchi, 2012; Weathers et al., 2005)
contém rótulos apenas nas extremidades, 1 e 7. Os outros valores variam para
Hipótese 4 . As respostas do ponto médio são distribuídas simetricamente
cada assunto e não têm qualquer valor qualitativo predeterminado (Kula s
em escalas forçadas.
& Stachowski, 2013; Nadler et al., 2015 ).
Há um debate sobre o ponto médio, que é considerado um
2.2.3. Escala Visual Analógica ponto neutro por alguns. De acordo comKulas e Stachowski (2013) , este
A Escala Visual Analógica (VAS) foi desenvolvida por Hayes & Pat- ponto é muitas vezes escolhido por entrevistados que não têm resposta para as perguntas
Terson, 1921. Consiste em uma linha horizontal de 100 mm com extremos ção, não entendeu a questão, ou mesmo não tem interesse em
rótulos. O entrevistado indica nesta linha o local mais adequado respondendo à pergunta. Portanto, este ponto muitas vezes atrapalha o
em relação à sua percepção. Depois que as respostas forem coletadas, análise de respostas (Chen et al., 1995; Nadler, Weston e Voyles ,
o pesquisador mede o comprimento referente à opinião de 0 a 100 2015) Em um estudo em escala Likert, observou-se que houve uma tendência
a fim de observar as opiniões dos entrevistados com base na influência sobre para avaliações negativas com uma escala forçada ( Garland, 1991 ). Por esta
essas classificações ( Cena et al., 2017) Esta é uma escala de intervalo; Portanto, é razão, este estudo analisou se há uma tendência para um lado
possível realizar mais operações estatísticas do que com a escala Likert da escala ou se houver uma distribuição igual da escala.
( Couper, Tourangeau, Conrad, & Singer, 2006; Funke, 2016; Sung &
Hipótese 5 . Preferência escala não diferiu entre os grupos de
Wu, 2018 ).
gênero, idade e escolaridade.
2.2.4. Escala de rosto Preston e Colman (2000) analisaram as preferências de escala entre
A escala de avaliação facial (escala facial) foi desenvolvida por Wong & Baker , entrevistados e apontou que poucos estudos estavam preocupados com o
1988 para identificar a dor em crianças, e é amplamente utilizado na área médica opiniões dos participantes sobre escalas. Eles também apontaram que quando par-
campo. Segundo os autores, esta escala possui a mesma confiabilidade que os participantes apreciam responder ao questionário, há mais
outras escalas, mas é mais aceitável para tais pesquisas, pois torna a avaliação consistência entre as respostas. Por esta razão, este estudo pretende
mais fácil e, portanto, foi usado em um estudo observando a preferência identificar se há preferências escala entre os entrevistados e
erência para ícones positivos (Cena et al., 2017) Embora para o entrevistado se as preferências variam de acordo com alguns grupos.
a escala tem rostos com emoções diferentes, para os pesquisadores, a escala
é analisado por valores ordinais de 1 a 6 (Hicks, von Baeyer, Spafford , 4. Metodologia
van Korlaar, & Goodenough, 2001; Sun et al., 2015; Wong & Baker ,
1988 ). Um fator importante a ser observado é a cultura e idade dos O estudo que inspirou esta pesquisa foi o Cunha et al. (2018)de
respondentes para os quais a escala será usada. Por exemplo, japonês revisão sistemática do Food Choice Questionnaire (FCQ), que mostrou
os entrevistados tendem a selecionar mais emoções positivas do que negativas, que diferentes autores escolheram escalas diferentes para usar nas mesmas questões
cating essas crianças preferem as escalas mais lúdicas ( Chen, Lee, & Ste- questionário: (18%) 4 pontos; (27%) 5 pontos; (54%) 7 pontos. Para apoiar o
Venson, 1995; Gharaibeh e Abu-Saad, 2002; Subhashini, Vatsa, & uso de uma escala diferente da original, os autores revisados apresentaram
Lodha, 2008) motivos diferentes: ponto neutro, mais opções de resposta e outros.
Portanto, considerou-se importante analisar essas diferenças em
3. Hipótese tipos de escala usando questionários semelhantes no estudo atual para identificar se
as razões apresentadas variam em uma pesquisa que usou diferentes
A partir da revisão da literatura, foi possível identificar vários inter- escalas de resposta.
avaliar questões sobre os assuntos de escala abordados na Seção 2. Depois de A fim de realizar este estudo, um produto alimentar bem conhecido pela
analisando algumas das questões incluídas nestas, foi possível o público-alvo, pizza, foi usado como base para a pesquisa, e todos os par-
determinar as hipóteses para este trabalho. os participantes confirmaram que já haviam consumido pizza. Como o original
questionário tem 39 questões, ele foi escolhido para trabalhar com apenas alguns
Hipótese 1 . A confiabilidade da escala diminui à medida que o número de respostas
itens do FCQ, já que a intenção era aplicar um não muito extenso
itens diminui.
pesquisa. Assim, cinco questões foram selecionadas aleatoriamente e, considerando
Vários estudos foram realizados sobre a análise de confiabilidade de a mesma pergunta foi feita quatro vezes, as cinco perguntas foram usadas para
escalas diferentes. Em geral, observou-se que menos itens de resposta cada escala ( Fig. 2)
irá fornecer menos confiabilidade para o questionário ( Lozano et al., 2008 ;
Preston e Colman, 2000; Weathers et al., 2005; Weng, 2004) Portanto,
este estudo analisa a afirmação em relação às escalas ordinais e
escalas de razão.
268
https://translate.googleusercontent.com/translate_f 3/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Página 4
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274
velho; esta assegurada a nossa pesquisa foi realizada de acordo com o 1 vez por semana 67 11,3
2 ou mais vezes por semana 12 2.0
permissões do comitê de ética. O questionário foi organizado e uma
estudo piloto foi realizado com 15 indivíduos com perfis semelhantes a
o público-alvo, a fim de confirmar sua aplicabilidade e corrigir e, para todos os itens do estudo, a hipótese nula (assumindo normalidade) foi
possíveis erros ou mal-entendidos. refutada (valor p < 0,001). No entanto, testes de normalidade são bastante sensíveis
O instrumento de pesquisa foi estruturado em três partes. Na primeira parte, e, portanto, vários autores sugerem outros testes para análise. Portanto,
houve dúvidas sobre o perfil do participante, como seu o teste de assimetria e curtose foram realizados ( Tabela 2) Foi encontrado
sexo, idade, escolaridade e frequência de consumo de pizza. Para o que não houve problemas na distribuição da amostra para os valores de referência:
segunda parte, determinou-se que cada participante deveria responder ao a assimetria foi superior a três e a curtose foi superior a dez
mesmas perguntas usando as quatro escalas diferentes, a fim de comparar o (Kline, 2015 ). Embora nenhuma variável seja considerada normal, a assimetria
resultado de quatro escalas, e eles foram solicitados a escolher uma das escalas em e os testes de curtose mostram que os desvios encontrados não terão resultados negativos
a terceira parte do questionário ( Preston & Colman, 2000) O segundo- efeito na análise de dados.
A segunda parte do questionário foi subdividida em quatro partes. Cada Após a análise da normalidade, foi realizada a análise alfa de Cronbach.
subdivisão tem as mesmas cinco perguntas sobre o produto, e o Para o número de perguntas do questionário (cinco), é desejável que
entrevistados marcaram com um X o nível de importância para cada aspecto em o valor seja maior que 0,5 ( Kehoe, 1995; Tavakol & Dennick,
o questionário. Além dessas perguntas sobre o produto, 2011) O alfa de Cronbach foi menor do que o esperado para a escala de 4 pontos.
existem duas questões sobre a percepção do entrevistado sobre a escala usada: No entanto, de acordo com vários autores, o valor alfa de Cronbach é
“Fácil de usar” e “expressa o que sinto” (de 0 a 10). Na terceira parte, menor quando há menos opções (Preston & Colman, 2000;
o entrevistado deve escolher entre as quatro escalas “Qual escala é a Weathers et al., 2005 ). Outra característica importante a ser observada é que
mais fácil de usar? ”; “Qual escala expressa melhor o que você sente?” E “O que cada item corresponde a uma construção diferente das questões gerais
escala é o melhor? ”. questionário, porque foi decidido avaliar diferentes construtos para
É possível observar uma maior frequência de alunos de graduação. obter respostas diferentes em toda a escala.
dentes, por causa da facilidade de aplicação da pesquisa em um ambiente acadêmico
ronment. A participação foi voluntária, e cada participante assinou um
Termo de Consentimento Livre e Esclarecido conforme Resolução 466/12 5,2 Análise de escala
do Conselho Nacional de Saúde - Brasil. Este termo garante que o
participante tem a liberdade para desistir a qualquer momento e apresenta o Para poder comparar diferentes escalas, todos os valores foram
riscos e benefícios do estudo. O único critério aplicado para participação transformado em uma escala de zero a um ( Dawes, 2008) Com isso
foi que o participante tinha pelo menos 18 anos. abordagem, foi possível comparar as médias da escala para cada questão.
ção NoFig. 3 , é possível observar que todas as escalas possuem o mesmo
5. Resultados padrão de resposta. No entanto, há uma diferença entre eles, que pode
também podem ser observados a partir dos resultados do teste estatístico t-pareado. Para a maioria
Foi obtido um total de 608 respostas. Treze foram descartados comparações calculadas entre escalas, o valor p é menor que 0,05.
por causa da falta de respostas, o que tornou impossível comparar o Portanto, as médias são consideradas estatisticamente diferentes. Um
escalas para os indivíduos. Havia então 595 respostas válidas (311 excepção foi a quarta questão, onde o valor de p era 0,565 para o 4-
mulheres e 284 homens). Ninguém respondeu “Never” em relação ao con- escalas de ponto e escala facial. Neste caso, as respostas médias podem ser
frequência Sumption; Portanto, cada participante poderia analisar o considerados estatisticamente iguais.
características do produto e, portanto, nenhum respondente foi removido do Outro aspecto analisado por este estudo foi a comparação entre
análise. A média de idade dos respondentes foi de 27,49, com um desvio padrão respostas extremas, “nada importante” e “muito importante”. Por esta
ção de 9,4. A maioria dos entrevistados, (56%), tinha entre 18 anos propósito, as frequências de resposta foram calculadas no nível mais baixo de
e 25 anos, seguido pelo grupo de 26 a 35 anos. Esses valores cada escala, valor 1 para escalas de 4, 7 pontos e escala facial. Para VAS,
estão de acordo com os dados demográficos da população do país quando foi definido que um centímetro seria a proporção para diferentes
tendo em consideração a idade mínima de participação de 18 anos. respostas dos participantes; portanto, o nível mais baixo ocorreu para
O nível de escolaridade foi dividido em grupos. Grupo A correspondeu a valores abaixo de 1,0 cm. Pode ser visto na Fig. 4 que todas as escalas têm
graduados do ensino médio ou menos, o Grupo B são alunos de graduação, e mantiveram o mesmo padrão de resposta no nível mais baixo. Observe que o 4-
O grupo C é formado por bacharelado ou superior. Como anteriormente escala de pontos tem os maiores resultados no nível mais baixo, atingindo 23% do
afirmou, o Grupo B teve a maior frequência de resposta, que foi de 70%, respostas na última pergunta. A escala de rosto tem valores mais baixos no
devido ao fato de que a aplicação foi maior nas áreas acadêmicas. Em relação a nível mais baixo, atingindo o máximo de 15,6%, também na última questão.
consumo, a maioria dos entrevistados (62,5%) afirmou que Para as respostas de nível mais alto (Fig. 5 ), os valores são divergentes: 4 em
consumiu o produto pelo menos uma vez por mês (tabela 1) a escala de 4 pontos, acima de 9,0 cm de EAV, 7 no ponto 7, e 6 na cara
Escala. Neste caso, havia uma maior variedade de frequência de resposta,
5.1. Verificações preliminares mantendo um padrão no nível mais alto em todas as escalas, porém com
maior divergências do que o nível mais baixo. Escala da cara e de 4 pontos foram
Antes de iniciar a análise das escalas, alguns testes de normalidade foram realizados as escalas com maior número de respondentes. Na quarta pergunta,
formado. O teste não paramétrico de Kolmogorov-Smirnov foi realizado os valores alcançaram 67,1% para 4 pontos e 62,0% para a Escala Facial.
269
https://translate.googleusercontent.com/translate_f 4/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Página 5
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274
mesa 2
Estatísticas da escala.
Estatisticas SE Estatisticas SE
* 4P: 4 pontos; VA: Escala Visual Analógica; 7P: 7 pontos; FS: escala facial.
Fig. 3. Escalas médias após transformação. Fig. 5. Porcentagem de respostas: nível mais alto.
270
Página 6
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274
https://translate.googleusercontent.com/translate_f 5/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Como pode ser visto em Tabela 4 , os homens selecionaram a escala de 4 pontos e a escala facial como
a escala mais fácil de usar. No entanto, o de 4 pontos foi escolhido como o mais fácil
e o melhor por mulheres. Os homens escolheram a escala facial como a melhor escala. Ac-
de acordo com as faixas etárias, há confirmação da preferência de 4 pontos
relacionado à facilidade de uso e a Escala Facial para o problema de "expressar meus sentimentos"
foi escolhido pela maioria. Em relação à melhor escala, houve um
divergência entre o grupo de 18 a 25 anos, que escolheu a Escala de Face,
enquanto o grupo com idade acima de 35 anos optou pelo 4 pontos. Para o grupo de 25
para 35, ambas as escalas foram empatadas como a melhor opção.
Em relação ao nível de escolaridade também houve concordância entre
o de 4 pontos é o mais fácil de usar e a escala de rosto é o que
melhor “expressa meus sentimentos”. Quanto à melhor escala, o Grupo A escolheu 4 pontos
e o Grupo B, alunos de graduação, escolheram a Escala de Face. Houve um empate
entre as duas escalas para o Grupo C.
6. Discussão
5.3. Preferências do entrevistado chamada Escala Visual Analógica (VAS). Com base na revisão da literatura,
foi possível propor cinco hipóteses para analisar alguns aspectos da
Para analisar as percepções dos entrevistados sobre as escalas, duas questões escalas escolhidas. Cada hipótese foi examinada com base na estatística
foram solicitados a cada pessoa que avaliasse de 0 a 10: “Quão fácil foi análise apresentada na Seção 5. O resumo dessas análises é pré-
usa a escala acima? ”, e“ Os níveis expressam bem o que você enviado na Tabela 5 .
sentir?" Depois de usar as quatro escalas, os participantes devem escolher qual escala Para Hipótese 1, o procedimento de análise de confiabilidade foi realizado
foi mais fácil de usar, qual escala expressou melhor os sentimentos, e o melhor e percebeu-se que quanto menos itens de resposta, menor era o Cron-
escala. alfa de Bach, que concorda com outras pesquisas (Kehoe, 1995; Tavako l
Primeiramente, foi analisada a média de percepção da escala; A Tabela 3 apresenta o & Dennick, 2011; Weng, 2004 ). Também foi possível observar que o
média e desvio padrão para cada escala. A média geral era quanto mais itens de resposta houver, maior será o padrão das respostas
maior que 8, o que pode ser considerado alto, uma vez que os valores são de desvios, mostrando que as respostas tendem a ser mais diversas com os
0 a 10. Para ambas as perguntas, mais de 60% das respostas foram notas vinco de itens de resposta. Assim, o maior desvio padrão foi encontrado
8, 9 ou 10; isso mostra boa aceitabilidade pelos respondentes em todas as escalas. em VAS e o menor desvio padrão na escala de 4 pontos ( Dawes,
escalas de acordo com a facilidade de uso. A escala de 4 pontos foi considerada Preferências de escala: porcentagem por grupos.
o mais fácil de usar, seguido pela escala de 7 pontos. A escala VAS foi considerada Item 4 pontos VAS 7 pontos Escala Facial
considerado o mais difícil de usar, provavelmente devido à falta de separação
Fácil de usar 37,5 16,3 16,3 29,9
entre as várias respostas possíveis. Em relação ao “expressar o Expressar meus sentimentos 20,0 17,8 15,8 46,4
questão de sentimentos, o teste t-pareado apresentou todas as comparações como > 0,05, Melhor 30,4 17,6 20,3 31,6
portanto, não é possível classificar as escalas de acordo com essa característica. Item Gênero 4 pontos VAS 7 pontos Escala Facial
No entanto, é interessante notar que para este estudo todas as escalas foram capazes Fácil de usar Fêmea 37,6 21,5 17,7 23,2
para expressar a opinião dos respondentes. Masculino 37,3 10,6 14,8 37,3
Expressar meus sentimentos Fêmea 19,0 23,2 19,3 38,6
No final do questionário, cada entrevistado pode escolher qual
Masculino 21,1 12,0 12,0 54,9
foi o mais fácil de usar entre as quatro escalas, escala que melhor expressa
Melhor Fêmea 29,3 24,4 21,9 24,4
seus sentimentos, e qual foi a melhor escala. Em geral, a escala escolhida Masculino 31,7 10,2 18,7 39,4
como o mais fácil de utilização foi a 4-ponto (37,5%); a escala que melhor ex- Item Era 4 pontos VAS 7 pontos Escala Facial
É importante notar que 62,4% dos entrevistados escolheram o mesmo Acima de 35 50,0 8,5 13,8 27,7
Expressar meus sentimentos 18 a 25 16,2 24,3 16,5 43,1
opção para todas as três questões, confirmando sua preferência. Para o
26 a 35 22,2 9,6 14,4 53,9
outros, 19,3% escolheram a escala mais fácil como a melhor e 9,9% escolheram a
Acima de 35 29,8 9,6 16,0 44,7
escala que melhor expressou seus sentimentos como a melhor; 8,4% escolheram um diferente Melhor 18 a 25 24,6 22,8 23,4 29,3
escala para cada questão. 26 a 35 35,3 12,6 16,2 35,9
Acima de 35 42,6 8,5 17,0 31,9
Item Nível de educação 4 pontos VAS 7 pontos Escala Facial
Tabela 3
Fácil de usar grupo A 48,3 10,3 8,6 32,8
Percepções de escala.
Grupo B 36,1 16,7 17,0 30,1
Escala Fácil de usar Expressar meus sentimentos Grupo C 37,0 17,6 17,6 27,7
Expressar meus sentimentos grupo A 17,2 8,6 17,2 56,9
Quer dizer SE Quer dizer SE
Grupo B 19,4 18,7 15,3 46,7
4 pontos 8,85 1.474 8,13 1.718 Grupo C 23,5 19,3 168 40,3
VAS 8,12 2.016 8,13 1.910 Melhor grupo A 39,7 12,1 12,1 36,2
7 pontos 8,54 1.669 8,09 1.843 Grupo B 29,4 19,1 19,9 31,6
Escala Facial 8,37 1.935 8.02 2.071 Grupo C 29,4 15,1 26,1 29,4
271
Página 7
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274
https://translate.googleusercontent.com/translate_f 6/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Hipótese Aceitar escolha das questões da escala, a de 4 pontos foi escolhida como a mais fácil
firmando Viswanathan et al. (2004) conclusões, a Escala de Face foi
H1 A confiabilidade da escala diminui à medida que o número de itens de resposta sim
escolhido como o melhor para expressar os sentimentos dos participantes, e as mesmas escalas
diminui.
H2 Para escalas diferentes, as tendências de resposta são as mesmas e tendem sim foram empatados em relação à melhor escala. Usando escalas diferentes do que no
para atingir o mesmo nível. estudar por Preston e Colman (2000) , os resultados foram diferentes, uma vez que o
H3 Todas as escalas têm a mesma frequência de respostas de nível extremo. Não
7 pontos foram escolhidos mais vezes do que 4 pontos e 6 pontos (Escala de Face
H4 Respostas de ponto médio são distribuídas simetricamente em forçadas Não
neste estudo). Em relação à escala que melhor “expressa sentimentos”, o 7º
escalas.
H5 A preferência de escala não difere entre grupos de gênero, idade e Não
ponto também foi escolhido com mais frequência, diferente do que foi encontrado em
Educação. o estudo anterior. No entanto, é importante ressaltar que prefere
as ocorrências variam de acordo com os aspectos culturais, portanto essa diferença pode ocorrer devido
às diferentes características dos respondentes.
2008; Dolnicar & Grün, 2009 ).
Para avaliar as diferenças entre os grupos neste estudo, o
A fim de verificar a Hipótese 2, foi analisado em relação ao
valores para as preferências foram novamente analisados de acordo com grupos de
assimetria negativa para todas as escalas nas primeiras quatro questões, e mostrou
gênero, idade e escolaridade. Não houve grandes diferenças em relação
uma maior tendência de respostas a avaliações positivas. Uma exceção foi o
qual escala foi mais fácil de usar e qual melhor expressou os sentimentos.
última questão, que teve uma ligeira tendência para os valores mais baixos de
Porém, houve diferenças em relação à melhor escala, com o 4-
a escala, exceto para a escala de rosto. Um fator a ser observado é o
ponto sendo escolhido pelas mulheres e a Escala Facial escolhida pelos homens. Enfrentar
maiores valores de assimetria negativa para Escala Facial, mostrando uma maior
A escala também foi escolhida pelo grupo de 18 a 25 anos; no entanto, o 4-
sensibilidade a valores positivos para tal escala. Para valores de curtose, há
ponto foi escolhido pelo grupo acima de 35 anos. Em relação à educação
não estava tão de acordo quanto com os outros testes. No entanto, é
nível, Grupo B (alunos de graduação) Escala Facial preferida, e
possível observar que a quarta questão para todas as escalas possui a maior
O Grupo A (com ensino médio ou menos) escolheu o 4 pontos como o melhor
valores positivos, mostrando uma distribuição nítida. Ou seja, as respostas dez-
escala.
deduzido para indicar o mesmo ponto; no entanto, as pequenas diferenças encontradas
não deve ser descartado (Hipótese 2) Além disso, a escala facial tem
mais perguntas com curtose positiva, mostrando que a maioria das respostas 6.1. Implicações gerenciais
convergem no mesmo ponto (Dawes, 2008; Kline, 2015)
Na análise da escala, foi realizada uma comparação das médias, então Esta pesquisa realizou várias análises de alguns questionários
que todas as escalas foram transformadas em valores de 0 a 1. É possível escalas amplamente utilizadas no mercado. Observou-se que essas quatro escalas
observe que quanto menos itens de resposta, maior será a resposta, são confiáveis e têm uma tendência semelhante, independentemente de seu tamanho e do
aumentando os resultados positivos (Dolnicar & Grün, 2013) Estes achados forma como foram apresentados. No entanto, houve um aumento
diferem de um estudo sobre classificações de filmes (Cena et al., 2017), que poderia nas respostas médias para a escala de 4 pontos e a escala de rosto, além disso
ser explicado pelo comportamento diferente dos entrevistados e o
ção, ambas as escalas tiveram uma série de respostas no nível mais extremo
questionário utilizado. ParaHipótese 3 , verificou-se que escalas com menos ("Muito importante"). A escala de rosto, no entanto, teve menos respostas no
itens de resposta também têm valores extremos mais altos devido à falta de op- nível menos extremo (“Nada importante”). Concluiu-se que o 4-
ções. Observou-se também que a escala facial apresenta maior frequência de
escala de pontos obteve valores mais positivos.
valores no nível mais alto e uma frequência mais baixa no nível mais baixo, Outro fator estudado nesta pesquisa foi a utilização do ponto médio,
mostrando que os entrevistados escolhem opções que expressam alegria. O VAS foi observado que este ponto não tem um impacto mediano na força forçada
obteve a menor frequência de valores no nível mais alto, mostrando respostas, ou seja, quando foi fornecida uma escala forçada (sem meio
que os entrevistados tendem a ser mais seletivos na escolha de valores mais altos para ponto), os entrevistados optaram por respostas mais positivas, especialmente quando
uma escala de razão, ao contrário da frequência no nível mais baixo ( Nadler et al., 2015 ; usando a escala de 4 pontos e a escala de rosto.
Weijters et al., 2010) As escalas preferidas dos entrevistados foram a escala de 4 pontos, escolhida por nós
Houve uma análise em relação às escalas focadas no meio habilidade e escala facial, selecionada por ser a escala que melhor expressa
categoria, para a Hipótese 4 . Para isso, os resultados foram analisados para re- os sentimentos das pessoas. Portanto, sugere-se que, se o público-alvo for o
espondentes que selecionaram o ponto médio na escala de 7 pontos. Era mesmo, essas escalas devem ser utilizadas para avaliar a opinião do cliente, como o
observaram que tais entrevistados tendiam a responder com níveis mais elevados em
as opiniões seriam mais confiáveis e confiáveis para refletir o
escalas sem ponto médio, também chamadas de escalas de escolha forçada. Este resultado sentimentos do respondente.
também foi encontrado em outro estudo, onde os autores indicam que o
os entrevistados podem dar uma resposta mais positiva para serem úteis ou para
7. Limitações da pesquisa
por favor, o entrevistador ( Garland, 1991 ). Esse aspecto foi reafirmado por
o aumento de avaliações positivas na escala Face, e também percebido em
Foi proposto analisar algumas características do tipo de escala utilizadas em
outro estudo comparando estrelas, considerado um ícone neutro, e representa
diferentes pesquisas nos contextos de marketing e acadêmico. O estudo foi
ícones sentativos ( Cena et al., 2017 ). Outro fato importante a ser observado é o
realizado no Brasil, pois apresenta características referentes a este
falta de rótulos. Isso leva o entrevistado a colocar o rótulo de acordo com
público e não pode afirmar as mesmas características podem ser vistas em
sua percepção, portanto não é possível determinar se a resposta seria
outra cultura ou contexto. Além disso, a fim de evitar um excesso
neutro ou nenhum. Também foi observado que nas respostas do ponto médio de VAS
número de questões, apenas quatro escalas foram escolhidas para serem utilizadas e a ana-
eram muito mais baixos. Isso mostra que apesar de apresentar um ponto médio, é
lisado, deixando várias escalas igualmente interessantes de lado, como o binário
não tão claro quanto em uma escala ordinal (Friedman et al., 1993; Kulas e Sta-
escala, escala de 5 pontos, escala com ícones de estrelas e escala de cores, entre
Chowski, 2013; Nadler et al., 2015; Weathers et al., 2005; Weijters et al. ,
outros. No entanto, esta foi uma decisão necessária para fornecer uma
2010 ).
uma gama de respostas capaz e relevante. Além disso, também era importante
A fim de analisar a hipótese 5, a última parte do questionário foi
para limitar as escalas para fornecer uma análise mais eficaz.
com base nas preferências dos respondentes. As perguntas feitas depois que eles
Outro fator importante a se observar é o produto alimentício analisado,
usaram as escalas não receberam respostas muito diferentes, com uma média
dadas as diferentes possibilidades de estudo, optou-se por este objeto de estudo
entre 8 e 9 para todas as escalas. No entanto, houve um ligeiro aumento
porque é tangível e bem conhecido do público, portanto, os resultados
valor para os 4 pontos quando as escalas foram comparadas para facilidade de uso, e
poderia ser diferente com outros questionários e objetos de estudo.
272
Página 8
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274
Ao desenvolver uma análise de escalas, a intenção do presente estudo foi Os autores declaram não ter conhecimento financeiro concorrente
contribuir para opiniões de medição, comportamento e preferência de escala interesses ou relações pessoais que possam ter parecido influenciar
pesquisar. Dawes (2008) observou especificamente a influência da escala na média o trabalho relatado neste artigo.
https://translate.googleusercontent.com/translate_f 7/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
e variância encontrada na pesquisa. Preston e Colman (2000) analisaram
preferência dos respondentes em relação a várias escalas utilizadas na pesquisa. Sediada Agradecimentos
nesses estudos, esta pesquisa buscou analisar diversos fatores que podem
análise de escala de influência. Portanto, é relevante para pesquisadores que buscam Este estudo foi financiado em parte pela Coordenaç˜ao de Aperfeiçoa-
uma escala que melhor se adapta às suas pesquisas. Código Financeiro 001 do mento de Pessoal de Nível Superior (CAPES) e o
Esta pesquisa comparou as escalas selecionadas de acordo com a média, Conselho Nacional de Desenvolvimento Científico e Tecnológico - Brasil
desvio padrão, assimetria e curtose, e, como em Dawes (2008) , (CNPq).
foi possível observar pontuações mais baixas para escalas com maior número de
itens de resposta. Em relação aos níveis extremos, foi possível observar Referências
que a escala com o menor número de respostas teve maiores respostas em
níveis extremos, especialmente no nível mais alto. O ponto médio, ana- Adelson, JL e McCoach, DB (2010). Medindo as atitudes matemáticas de
alunos do ensino fundamental: os efeitos de uma escala do tipo Likert de 4 ou 5 pontos. Educacional
lisado na escala de 7 pontos, empurra as opções para níveis mais altos quando
and Psychological Measurement, 70 (5), 796–807. https://doi.org/10.1177/
em comparação com escalas forçadas, levando à crença de que o alto nível 0013164410366694 .
as opções são escolhidas com mais frequência quando não há ponto médio, um caracter Wong, DL e Baker, CM (1988). Dor em crianças: comparação de escalas de avaliação.
Enfermagem pediátrica, 14 (1). https://pubmed.ncbi.nlm.nih.gov/3344163/ .
istic também observado por Weijters et al. (2010). Com essas observações, é
Bruner, G. (2013). Manual de escalas de marketing: medidas de vários itens para o consumidor
importante apontar que como Dolnicar e Grün (2013) mostraram, muito Insight Research (Vol. 7).
é necessário cautela ao comparar dois estudos com escalas diferentes. Cabooter, E., Weijters, B., Geuens, M., & Vermeir, I. (2016). Efeitos de formato de escala em
interpretação e uso da opção de resposta. Journal of Business Research, 69 (7),
Em relação à preferência de escala, é possível afirmar que as escalas
2574–2584. https://doi.org/10.1016/j.jbusres.2015.10.138 .
com uma quantidade menor de itens são preferidos pelos participantes do estudo, Cena, F., Gena, C., Grillo, P., Kuflik, T., Vernero, F., & Wecker, AJ (2017). Como escalas
que é diferente do que foi encontrado por Preston e Colman (2000). influenciar o comportamento de classificação do usuário em sistemas de recomendação. Comportamento e Informação
Technology, 36 (10), 985–1004. https://doi.org/10.1080/0144929X.2017.1322145 .
No entanto, como os autores apontaram, é importante ser cauteloso
Chen, C., Lee, S.-Y., & Stevenson, HW (1995). Estilo de resposta e multicultural
porque escalas diferentes são melhores para finalidades diferentes e, como pode ser comparações de escalas de avaliação entre estudantes do Leste Asiático e da América do Norte.
visto, para diferentes públicos-alvo, conforme confirmado pelas descobertas por Psychological Science, 6 (3), 170–175. http://www.jstor.org/stable/40063010 .
Shaftel et al. (2012). Por esse motivo, é importante ressaltar que este Couper, MP, Tourangeau, R., Conrad, FG, & Singer, E. (2006). Avaliando o
eficácia das escalas analógicas visuais: um experimento na web. Ciência Social da Computação
pesquisa focada em uma análise de produto de um país, e é interessante
Review, 24 (2), 227–245. https://doi.org/10.1177/0894439305281503 .
para avaliar como as percepções de diferentes culturas e nacionalidades estão em Cunha, LM, Cabral, D., Moura, AP, & de Almeida, MDV (2018). Aplicação do
relação a essas escalas. Questionário de escolha de alimentos entre culturas: revisão sistemática de cross-cultural e
estudos de um único país. Food Quality and Preference, 64 , 21-36. https://doi.org/
Nesta pesquisa, foi possível observar que escalas com menos
10.1016 / j.foodqual.2017.10.007 .
itens de resposta, como 4 pontos, têm uma maior convergência de respostas, Dawes, J. (2008). As características dos dados mudam de acordo com o número de pontos da escala
o que pode facilitar a visão geral dos respondentes. No entanto, escalas usado? Um experimento usando escalas de 5, 7 e 10 pontos. Jornal Internacional
of Market Research, 50 (1), 61–104. https://doi.org/10.1177/147078530805000106 .
com mais itens de resposta mostram mais detalhes e especificidades de
Dolnicar, S., & Grün, B. (2009). Será que um tamanho serve para todos? A adequação dos formatos de resposta para
opiniões dos respondentes. Portanto, sugere-se que se, na pesquisa, diferentes construtos medidos. Australasian Marketing Journal (AMJ), 17 (1), 58–64.
pretende-se compreender uma opinião mais simples e objetiva, ou mesmo se https://doi.org/10.1016/j.ausmj.2009.04.001 .
Dolnicar, S., & Grün, B. (2013). “Traduzindo” entre os formatos de resposta da pesquisa. Diário de
é o primeiro contato do público-alvo com a pesquisa, então é
Business Research, 66 (9), 1298-1306. https://doi.org/10.1016/j.
interessante fornecer menos itens de resposta para escolha. No entanto, se o jbusres.2012.02.029 .
o pesquisador pretende ver nuances de resposta, como bom, muito bom e Fombelle, PW, Sirianni, NJ, Goldstein, NJ, & Cialdini, RB (2015). Deixe todos eles comerem
Bolo: Fornecimento de serviços VIP sem o custo de exclusão para clientes não VIP.
extremamente bom, e as diferenças entre as respostas próximas são
Journal of Business Research, 68 (9), 1987–1996. https://doi.org/10.1016/j.
importante para a pesquisa, escalas com mais itens de resposta, 7 < , são jbusres.2015.01.018 .
indicado. Friedman, HH, Herskovitz, PJ, & Pollack, S. (1993). Os efeitos de polarização da escala
Outra questão abordada nesta pesquisa foi relacionada ao meio verificar estilos de resposta a uma escala Likert. Em Proceedings of the Joint Statistical
reunião (pp. 793–795) .
apontar; foi observado que a maioria das respostas de ponto médio quando colocadas
Funke, F. (2016). Um experimento da web que mostra os efeitos negativos das escalas do controle deslizante em comparação com
em uma escala forçada tendeu a respostas de alto nível, levando a escalas visuais analógicas e escalas de botão de rádio. Social Science Computer Review, 34 (2),
média para um valor mais alto. Portanto, sugere-se que a escolha de 244–254. https://doi.org/10.1177/0894439315575477 .
Funke, F., & Reips, U.-D. (2012). Por que diferenciais semânticos em pesquisas baseadas na web
usar um ponto médio leva em consideração se há um significado para
deve ser feito a partir de escalas visuais analógicas e não de escalas de 5 pontos. Campo
tal nível ou não, ou seja, os pesquisadores precisam compreender se Methods, 24 (3), 310-327. https://doi.org/10.1177/1525822X12444061 .
a resposta de um item 'nada bom e nada mau' tem um significado específico para eles Funke, F., Reips, U.-D., & Thomas, RK (2011). Controles deslizantes para o Smart: tipo de escala de avaliação
na web interage com o nível educacional. Social Science Computer Review, 29 (2),
pesquisar. Por fim, percebeu-se que existem preferências específicas para
221–231. https://doi.org/10.1177/0894439310376896 .
diferentes grupos de pessoas, tornando mais fácil para o público entender Garland, R. (1991). O ponto médio em uma escala de classificação: é desejável? Boletim de marketing, 2
e consequentemente responder ao questionário com mais confiança. Isto é (1), 66–70. http://marketing-bulletin.massey.ac.nz/V2/MB_V2_N3_Garland.pdf .
Gharaibeh, M., & Abu-Saad, H. (2002). Validação cultural da avaliação da dor pediátrica
acreditava que ao conhecer as preferências do público-alvo, o pesquisador
ferramentas: perspectiva jordaniana. Journal of Transcultural Nursing, 13 (1), 12–18. https: //
poderá escolher a melhor escala a ser usada e obter mais respostas doi.org/10.1177/104365960201300103 .
(ver Tabela 4) Harland, NJ, Dawkin, MJ, & Martin, D. (2015). Utilidade relativa de um análogo visual
escala vs uma escala Likert de seis pontos na medição do resultado global do assunto em
A análise feita neste estudo é um passo em direção a mais pesquisas
pacientes com lombalgia recebendo fisioterapia. Fisioterapia, 101 (1), 50–54.
relacionadas a escalas porque são tão frequentemente usadas na área acadêmica, médica, https://doi.org/10.1016/j.physio.2014.06.004 .
e ambientes de negócios. Portanto, sugere-se que mais Hicks, CL, von Baeyer, Spafford, PA, van Korlaar, I., & Goodenough, B. (2001). o
pesquisas sejam realizadas para que seja possível identificar mais Faces Pain Scale - Revisada: em direção a uma métrica comum na medição da dor pediátrica.
Pain, 93 (2), 173-183. https://doi.org/10.1016/s0304-3959(01)00314-1 .
características de cada escala e finalmente determinar a melhor escala para cada
Hayes, MHS e Patterson, DG (1921). Desenvolvimento experimental do gráfico
objetivo, objeto de estudo e questionário. método de classificação. Psychological Bulletin, 18 , 98-99. https://doi.org/10.1037/
h0064147 .
Hosany, S., & Prayag, G. (2013). Padrões de respostas emocionais, satisfação dos turistas,
e intenção de recomendar. Journal of Business Research, 66 (6), 730-737. https: //
doi.org/10.1016/j.jbusres.2011.09.011 .
273
Página 9
NA de Rezende e DD de Medeiros Journal of Business Research 138 (2022) 266-274
Iannario, M., Manisera, M., & Zuccolotto, P. (2017). Tratamento de “não sei” Sung, Y.-T., & Wu, J.-S. (2018). A escala visual analógica para classificação, classificação e
respostas na percepção dos consumidores sobre a sustentabilidade no setor agroalimentar. Comparação em pares (VAS-RRP): Uma nova técnica para medição psicológica.
Qualidade e quantidade, 51 (2), 765-778. https://doi.org/10.1007/s11135-016-0438-7 . Behavior Research Methods, 50 (4), 1694–1715. https://doi.org/10.3758/s13428-018-
Kehoe, J. (1995). Análise de itens básicos para testes de múltipla escolha. Avaliação Prática, 1041-8 .
Research & Evaluation, 4 (10), 3. https://doi.org/10.7275/07zg-h235 . Tavakol, M., & Dennick, R. (2011). Dando sentido ao alfa de Cronbach. Internacional
Kline, RB (2015). Princípios e prática da modelagem de equações estruturais (4ª ed.). o Journal of Medical Education, 2 , 53–55. https://doi.org/10.5116/ijme.4dfb.8dfd .
Guilford Press . Viswanathan, M., Sudman, S., & Johnson, M. (2004). Máximo versus significativo
Kulas, JT e Stachowski, AA (2013). Justificativa do entrevistado para não concordar nem discriminação na escala de resposta. Journal of Business Research, 57 (2), 108-124.
discordando: contribuintes de pessoas e itens para a intenção de endosso de categoria intermediária em https://doi.org/10.1016/S0148-2963(01)00296-X .
Indicadores de personalidade Likert. Journal of Research in Personality, 47 (4), 254–262. Voutilainen, A., Pitkäaho, T., Kvist, T., & Vehviläinen-Julkunen, K. (2016). Como perguntar
https://doi.org/10.1016/j.jrp.2013.01.014 . sobre a satisfação do paciente? A escala visual analógica é menos vulnerável a
https://translate.googleusercontent.com/translate_f 8/9
14/10/2021 20:01 Como as escalas de classificação influenciam a confiabilidade das respostas, pontos extremos, ponto médio e preferências …
Lim, H.-E. (2008). O uso de diferentes escalas de avaliação de felicidade: preconceito e comparação fatores de confusão e efeito teto do que uma escala de Likert simétrica. Diário de
problema? Social Indicators Research, 87 (2), 259–267. https://doi.org/10.1007/ Enfermagem Avançada, 72 (4), 946–957. https://doi.org/10.1111/jan.12875 .
s11205-007-9171-x . Wakita, T., Ueshima, N., & Noguchi, H. (2012). Distância psicológica entre
Lozano, LM, García-Cueto, E., & Mu˜niz, J. (2008). Efeito do número de respostas categorias na escala Likert: Comparando diferentes números de opções. Educacional
categorias sobre a confiabilidade e validade das escalas de avaliação. Metodologia, 4 (2), 73–79. and Psychological Measurement, 72 (4), 533-546. https://doi.org/10.1177/
https://doi.org/10.1027/1614-2241.4.2.73 . 0013164411431162 .
Nadler, JT, Weston, R., & Voyles, EC (2015). Preso no meio: o uso e Weathers, D., Sharma, S., & Niedrich, RW (2005). O impacto do número de escala
Interpretação de pontos médios em itens de questionários. The Journal of General pontos, fatores disposicionais e a heurística de decisão do status quo sobre a confiabilidade da escala
Psychology, 142 (2), 71-89. https://doi.org/10.1080/00221309.2014.994590 . e precisão de resposta. Journal of Business Research, 58 (11), 1516–1524. https: // doi.
Norman, G. (2010). Escalas Likert, níveis de medição e as “leis” das estatísticas. org / 10.1016 / j.jbusres.2004.08.002 .
Advances in Health Sciences Education, 15 (5), 625–632. https://doi.org/10.1007/ Weijters, B., Cabooter, E., & Schillewaert, N. (2010). O efeito do formato da escala de avaliação sobre
s10459-010-9222-y . estilos de resposta: o número de categorias de resposta e rótulos de categoria de resposta.
Preston, CC, & Colman, AM (2000). Número ideal de categorias de resposta na classificação International Journal of Research in Marketing, 27 (3), 236–247. https://doi.org/
escalas: confiabilidade, validade, poder discriminante e preferências do respondente. Acta 10.1016 / j.ijresmar.2010.02.004 .
Psychologica, 104 (1), 1-15. https://doi.org/10.1016/S0001-6918(99)00050-5 . Weng, L.-J. (2004). Impacto do número de categorias de resposta e rótulos âncora em
Ro, H., & Olson, ED (2020). Discriminação percebida por clientes gays e lésbicas e coeficiente alfa e confiabilidade teste-reteste. Educacional e psicológico
Gerenciamento de identidade. International Journal of Hospitality Management, 84 , 102319. Medição, 64 (6), 956–972. https://doi.org/10.1177/0013164404268674 .
https://doi.org/10.1016/j.ijhm.2019.102319 .
Salzberger, T., & Koller, M. (2013). Rumo a um novo paradigma de medição em
Naia Antunis de Rezende é Ph.D. estudante do Departamento de Engenharia de Produção,
marketing. Journal of Business Research, 66 (9), 1307–1317. https://doi.org/10.1016/
Universidade Federal de Pernambuco, UFPE - Brasil. Atualmente trabalha no PLANASP
j.jbusres.2012.02.030 .
Grupo com foco no desenvolvimento de escala e implantação da função de qualidade. Sra. Rezende
Sarofim, S., Chatterjee, P., & Rose, R. (2018). Quando os cartões de crédito da loja prejudicam os varejistas:
recebeu seu bacharelado (2012) e mestrado (2015) em Engenharia de Produção da
efeito diferencial do pagamento de taxas de cartão de crédito sobre o comportamento de compra dos consumidores.
Universidade Federal de Itajubá, suas pesquisas incluíram desenvolvimento e ergonomia de produtos.
Journal of Business Research . https://doi.org/10.1016/j.jbusres.2018.08.031 .
nomics. Seus interesses de pesquisa são desenvolvimento de produtos, comportamento do cliente e preferências.
Shaftel, J., Nash, BL, & Gillmor, S. (2012). Efeitos do número de resposta
cias, ergonomia, adaptabilidade.
Categorias nas escalas de classificação. Em mesa redonda apresentada na Conferência Anual do
Pesquisa Educacional Americana. Anais da conferência anual da American
associação de pesquisa educacional (pp. 1-24) . Denise Dumke de Medeiros é doutora. em Engenharia de Produção pelo Institut National
Subhashini, L., Vatsa, M., & Lodha, R. (2008). Comparação de duas escalas de dor na Índia Polytechnique de Grenoble, e ela foi pesquisadora visitante na Université du Québec. Ela
crianças. The Indian Journal of Pediatrics, 75 (9), 891-894. https://doi.org/10.1007/ é professora titular de Engenharia de Produção da Universidade Federal de Pernambuco e é
s12098-008-0096-4 . Chefe do PLANASP. A sua investigação centra-se na Gestão da Qualidade em vários assuntos, tais como
Sun, T., West, N., Ansermino, JM, Montgomery, CJ, Myers, D., Dunsmuir, D.,… como: competitividade, qualidade de serviço, planejamento estratégico. Seu trabalho de pesquisa tem sido
Lonnqvist, P.-A. (2015). Uma versão para smartphone da Faces Pain Scale-Revised e publicado em muitas revistas especializadas e anais de conferências, incluindo International
a Escala Analógica de Cores para avaliação da dor pós-operatória em crianças. Pediatra Journal of Business & Industrial Marketing, Journal of Fuzzy Systems, Quality & Quantity,
Anesthesia, 25 (12), 1264–1273. https://doi.org/10.1111/pan.2015.25.issue- Journal of Cleaner Production.
1210.1111 / pan.12790 .
274
https://translate.googleusercontent.com/translate_f 9/9