Você está na página 1de 29

CAPÍTULO 2

Tipos de Variáveis e Escalas de Mensuração


Todas as coisas são números.
PITÁGORAS

AO FINAL DESTE CAPÍTULO, VOCÊ SERÁ CAPAZ DE:

• Entender a importância da identificação dos tipos de variáveis para a elaboração de pesquisas e para o
tratamento e análise de dados .
• Diferenciar as variáveis métricas das não métricas.
• Estabelecer as circunstâncias a partir das quais cada um dos tipos de variáveis métricas e não métricas
pode ser utilizado, em função dos objetivos de pesquisa.
• Saber determinar o tratamento adequado para cada um dos tipos de variáveis.

2.1. INTRODUÇÃO

A célebre afirmativa de Pitágoras, embora dita em um contexto voltado ao desenvolvimento de um tipo


especial de misticismo matemático que introduziu o raciocínio lógico no domínio da religião, dá a entender
que determinado objeto ou coisa somente tem poder para ser avaliado se for definido por meio de números.
Porém, como sabemos, diversos tipos de objetos são mensurados de forma não numérica, em função de sua
própria natureza e de suas características inerentes. Na verdade, não é nosso objetivo discordar de Pitágo-
ras, mas talvez acrescentar um conceito mais amplo à sua frase, de modo a propiciar um melhor entendi-
mento sobre os mecanismos de avaliação dos objetos: "Todas as coisas são mensuráveis".
A mensuração de determinado objeto ou fenômeno é um processo por meio do qual números ou símbo-
los são "anexados" a uma característica ou propriedade, em função de determinadas regras ou procedi-
mentos (SHARMA, 1996). Por exemplo, indivíduos podem ser classificados ou especificados de acordo
com uma série de características, como sexo, idade, nível de escolaridade, renda, profissão, estado civil ou
perfil de consumo.
Como já discutimos no Capítulo 1, a definição apropriada das escalas de mensuração de qualquer ca-
racterística ou atributo deve ocorrer juntamente com o estabelecimento do plano de pesquisa. É muito
comum presenciarmos momentos de angústia ou desolação por parte de estudantes que percebem, dias
antes da data de conclusão do trabalho, que o questionário aplicado apresentava somente variáveis quali-
tativas, enquanto o principal objetivo de pesquisa relacionava-se à avaliação da correlação entre diversas
características que deveriam ter sido levantadas por meio de notas de ° aIO, por exemplo. E agora, o que
- -_ 5::: .:: DADOS ELSEVIER

:- 'oltar ao campo e aplicar o questionário modificado para uma nova amostra de 100 pessoas?
não forem pessoas, mas empresas? Como abordar novamente um grupo de 100 empresas? Qual
argumento utilizar para dizer que a pesquisa terá de ser efetuada novamente? Mas e o tempo de co-
tratamento e análise? E os prazos? Na verdade, isso é muito mais comum do que se imagina!
_-as disciplinas de Estatística, Métodos Quantitativos Aplicados, Microinformática, Análise de Da-
o . Tomada de Decisão e Modelos Multivariados dos cursos de graduação, pós-graduação stricto sensu
e lato sensu e MBAs, é muito comum percebermos que os participantes ficam ansiosos por aplicar as
mais diversas técnicas existentes, com vistas à modelagem de um problema real e à tomada de decisão
embasada. Mas, logo no início da disciplina, quando apresentamos os tipos de variáveis que existem, há
certo desânimo, muito relacionado à ansiedade de aplicar rapidamente as técnicas e à falta de percep-
ção de que o entendimento completo de todos os tipos de mensuração, logo no início da pesquisa, é tão
importante quanto compreender e utilizar as técnicas de modelagem. A ausência de conhecimento so-
bre as razões por meio das quais determinado tipo de mensuração foi adotado para certa variável, em de-
trimento de outro, pode representar o fracasso de uma pesquisa, gerando impossibilidade de utilização
de uma técnica específica ou até mesmo propiciando sua inadequada aplicação para a obtenção das res-
postas desejadas.
O mesmo ocorre quando estamos envolvidos em projetos de pesquisa ou consultoria. É frequente, em
reuniões iniciais para a definição do escopo do projeto, que se levantem questões em relação ao método
de tratamento e análise dos dados de forma proporcionalmente maior do que em relação à forma do ques-
tionário ou aos tipos de variáveis que deverão ser consideradas. No entanto, sabemos que a determinação
correta das escalas de mensuração, em um estágio preliminar do projeto, auxilia na melhor definição das
técnicas de modelagem, que, por sua vez, estão intimamente relacionadas aos objetivos da pesquisa.
De acordo com Stevens (1946), as escalas de mensuração podem ser classificadas em quatro tipos: no-
minal, ordinal, intervalar e de razão, sendo os dois primeiros relativos a variáveis não métricas, ou qualita-
tivas, e os dois últimos a variáveis métricas, ou quantitativas. As escalas de mensuração referem-se à
classificação que é proposta para descrever a natureza da informação contida em objetos ou fenômenos e,
portanto, em variáveis. Dependendo da escala de mensuração em que uma variável é avaliada, diferentes
operações matemáticas são possíveis. ....
A classificação de Stevens (1946) é, sem dúvida, bastante difundida e utilizada, porém já recebeu inú-
meras críticas de diversos autores que argumentam, entre outros pontos, que a escolha de determinado
teste estatístico a ser aplicado para um vetor de dados não depende da escala de mensuração. Entre al-
guns dos principais críticos de Stevens estão Baker, Hardycke Petrinovich (1966), Guttman (1977), Bor-
atta e Bohrnstedt (1980), Duncan (1984) e Michell (1986).
Outros autores ainda propuseram novas taxonomias para os tipos de dados, como forma de mostrar que
escalas propostas por Stevens não extinguiam as possibilidades de classificação. Entre eles, citamos
Hoaglin Mosteller e Tukey (1983) que apresentaram, de forma provo cativa, a seguinte lista de escalas de
e uração, embora não tivessem elaborado uma associação com os testes estatísticos:

ordenadas por rótulos como júnior, pleno e sênior);


H.2t.lli;ingo iniciando por 1, que representa o maior ou o menor);
entre O e I, incluindo percentuais);
Contagem (números inteiros não negativos);
'meros reais não negativos);
, eras negativos e positivos).
TIPOS DE VARIÁVEIS E ESC

Escala Nominal I
Variáveis não Métricas
(Qualitativas)
Escala Ordinal I

Variáveis Métricas
Escala Intervalar I
(Quantitativas)
Escala de Razão I

Figura 2.1: Tipos de variáveis e escalas de mensuração.

Porém, em nenhum momento, Hoaglin, Mosteller e Tukey sugeriram que essas categorias poderiam
restringir a análise ou mesmo a transformação dos dados.
Tendo em vista a maior simplicidade da classificação proposta por Stevens, a grande utilização em
ciências sociais e do comportamento e o uso de sua nomenclatura em softwares estatísticos, ela será uti-
lizada, de acordo com o apresentado na Figurã 2.1. É importante alertar, porém, que um debate consi-
derável, sem uma solução clara a respeito da utilização da tipologia de Stevens para a classificação de
escalas de mensuração, tem sido frequente na literatura estatística, de acordo com Velleman e Wilkin-
son (I993).
Como apresentado no Capítulo I, existe um número considerável de técnicas estatísticas multivaria-
das que podem ser utilizadas para analisar os dados. Obviamente, o objetivo da análise é extrair infor-
mação relevante contida nos dados que são utilizados para resolver determinado problema. Para que
seja possível uma melhor visualização das diferentes maneiras de tratá-Ios, apresentamos, também no
Capítulo I, uma classificação das técnicas estatísticas que são abordadas no livro. Porém, como pode-
mos perceber, essa classificação é embasada nas diferentes escalas de mensuração e no número de va-
riáveis utilizadas. Assim, iniciaremos com uma discussão das escalas de mensuração e, na sequência
apresentaremos os tipos de questões para obtenção de cada uma das escalas propostas por Stevens
(I946).

2.2. VARIÁVEIS NÃO MÉTRICAS E ESCALAS DE MENSURAÇÃO


As variáveis não métricas, também conhecidas por variáveis qualitativas, são aquelas que, segundo a
classificação de Stevens (I946), possuem dados em escala nominal ou ordinal.
Como estudaremos no Capítulo 3 (Estatística Descritiva), as variáveis podem apresentar medidas de po-
sição ou de dispersão, em função de suas escalas de mensuração e, como exemplos de medidas de posição.
podemos mencionar a média aritmética, a mediana, a moda ou o percentil. Já algumas das medidas de dis-
persão mais utilizadas referem-se ao desvio padrão, à variância, ao intervalo interquartil ou à amplitude.
Por definição, as variáveis qualitativas são aquelas que tornam possível a elaboração apenas de análises
de frequência, sem o cálculo de medidas de posição e de dispersão. Exceção a este fato fica por conta da
moda, que pode ser calculada para variáveis não métricas pelo fato de representar uma medida de fre-
quência.
Muitos afirmam que as variáveis qualitativas são aquelas que não apresentam números nos dado. E
afirmação gera uma série de confusões. Imagine um questionário que tem por intenção levantar dado re-
lativos a faixas etárias de uma amostra de indivíduos, de acordo como segue:
- - _ ==.~=.[) 005 ELSEVIER

etâria:
O a 19 anos
de 20 a 39 anos
de 40 a 59 anos
de 60 a 79 anos
) 8 O anos ou mais

Essa questão apresenta números em suas assertivas, mas a variável gerada no banco de dados por meio
da tabulação dos questionários provenientes dos respondentes que compõem a amostra é qualitativa, já
que temos condições de avaliar apenas a frequência, e não médias ou desvios.
Assim, podemos ter, por exemplo:

25% - de O a 19 anos
32% - de 20 a 39 anos
12% - de 40 a 59 anos
7% - de 60 a 79 anos
24% - 80 anos ou mais

Note que a ânsia por calcular a média de idade da amostra, por meio da utilização dos valores médios de
cada faixa, pode gerar um resultado incorreto:

Cálculo errado da média: M = O,25x9,5 + O,32x29,5 + O,12x49,5 + O,07x69,5


+ O,24x89,5 = 44,1 anos de idade

A aplicação desse cálculo está errada! É muito comum o pesquisador calcular a média ponderada
pelos percentuais, considerando a idade média de cada intervalo como a média das idades das pessoas si-
tuadas naquela faixa, o que não necessariamente é verdade, uma vez que a distribuição das idades em
cada faixa não precisa ser linear ou mesmo simétrica em torno da média. Será que de fato as pessoas da
amostra têm, em média, 44,1 anos de idade? Seria o mesmo que considerar que a média de idade das
pessoas que têm entre 20 e 39 anos nessa amostra sería aproximadamente 30 anos. Na verdade, precisa-
mos analisar a amostra e verificar suas condições para fazermos tal suposição. Ou será que não podemos
tomar uma amostra em que a grande maioria das pessoas que têm entre 20 e 39 anos possua idade
mais avançada, ou seja, valores mais próximos de 39 anos? E como fica a "média" para o último in-
tervalo? Consideramos no nosso cálculo precipitado um valor médio de 89,5 anos, mas será que de
fato isso está correto?
Se o pesquisador desejasse elaborar correlações entre as idades dos respondentes e outras característi-
cas quantitativas, deveria ter perguntado de forma métrica, e não em faixas. Porém, a inconveniência ou
mo a dificuldade de que algumas perguntas sejam elaboradas na forma quantitativa, como idade e
renda. cujas respostas possuem uma alta possibilidade de serem "maquiadas" para cima ou para baixo, de-
pe dendo da situação da entrevista e da relação entre pesquisador e pesquisado, podem fazer com que o
p e pe quisa seja inicialmente alterado, inclusive com redefiníções da técnica de tratamento a ser
u ruramente, para que os dados sejam coletados na forma qualitativa, como em faixas. Pode ha-
oortanto. um trade off entre a definição das escalas de mensuração dos dados e a utilização de deter-
écnica multivariada que tem por finalidade gerar informações que permitam ao pesquisador
obierivo
TIPOS DE VARIÁVEIS E ESCALAS Di:

im, cada variável não métrica estudada isoladamente, ou seja, na forma univariada, oferece
dor uma possibilidade de tratamento restrita à elaboração de frequências absolutas e relativ
. por exemplo, uma empresa de consultoria que possui 6 escritórios espalhados pelo Brasil de a
o segue:
Quadro 2.1: Localidades dos Escritórios de uma Consultoria

Escritório Localidade
01 São Paulo
02 Rio de Janeiro
03 Porto Alegre
04 Belém
05 Rio de Janeiro
06 - Porto Alegre

Como a variável localidade é obviamente não métrica (imagine como seria impossível tirarmos uma mé-
entre as localidades), conseguimos elaborar apenas um quadro de frequências absolutas e relativas.

Quadro 2.2: Frequências Absolutas e Relativas

Localidade Frequência Absoluta Frequência Relativa


Belém 1 16,67%
Porto Alegre 2 33,33%
Rio de Janeiro 2 33,33%
São Paulo 1 16,67%
Total 6 100,00%

odemos, assim, elaborar os gráficos de frequências absolutas e relativas.

Gráfico 2.1: Frequências Absolutas

2.-----------.---.----.~~----------_.

Belém Porto Alegre Rio de São Paulo


Janeiro

Gráfico 2.2: Frequências Relativas

Rio de Porto
Janeiro Alegre
ÁLlSE DE DADOS ELSEVIER

A.relação entre duas variáveis não métricas se dá por meio de associações entre as frequências das cate-
uorias que podem ser explicitadas, por exemplo, em uma tabela de contingência (também conhecida por
tabela cruzada ou cross tabulation). Assim, se quisermos associar as categorias da variável localidade (Be-
lém, Porto Alegre, Rio de Janeiro e São Paulo) às categorias relativas ao porte do escritório (por exemplo,
pequeno, médio e grande), definido segundo um critério previamente estabelecido, podemos elaborar a
seguinte tabela de contingência:

Tabela 2.1: Tabela de Contingência entre Localidade e Porte do Escritório

Porte
Localidade Total
Pe ueno Médio Grande
B elém I
Porto Ale re I 2
Rio de aneiro I 2
São Paulo I I
Total 2 3 6

Desta maneira, podemos verificar, por exemplo, se as associações entre as categorias das duas variáveis
ocorrem de forma aleatória ou não. Esses conceitos serão estudados de maneira mais aprofundada no Ca-
pítulo 8, na técnica de análise de correspondência. O estudo da existência de associação entre as categori-
as de três ou mais variáveis simultaneamente é feito por meio da técnica de análise de homogeneidade,
também apresentada no Capítulo 8.

2.2.1. Escala Nominal

Imagine uma variável relativa ao país de origem de um grupo de empresas. Tipicamente utilizamos nú-
meros, embora não seja necessário, para representar as categorias da variável. Podemos, arbitrariamente,
adotar 1 para o Brasil, 2 para a Alemanha, 3 para a Holanda, 4 para a Espanha e 5 para os Estados Unidos.
Como os números não possuem significado algum, já que não há sentido dizer que a Espanha é o dobro da
Alemanha sem que haja especificação de algum critério quantitativo (no caso, estamos apenas estudando
o país de origem das empresas), não podemos calcular médias ou desvios com os dados. Os números são
simplesmente utilizados para categorizar (rotular) objetos em diferentes grupos ou para propiciar uma
contagem (frequência) de quantos há em cada categorirà O banco de dados a seguir traz os países de ori-
gem de dez empresas multinacionais:

Tabela 2.2: Empresas e Países de Origem

Empresa País
Gerdau I
Citigroup 5
Santander 4
Volkswagen 2
Wal-Mart 5
Petrobras I
Vale I
Philips 3
Boeínz 5
Siemens 2
TIPOS DE VARIÁVEIS E ESCALAS DE MENSURAÇÁO 25

Essa escala de mensuração é conhecida como escala nominal, e os dados resultantes são conhecidos
orno dados nominais. As estatísticas para escalas nominais são baseadas em contagem. como moda e dis-
ibuição de frequência (SHARMA, 1996).
Por meio do software SPSS (Statistical Packag« for the Social Sciences), podemos criar os rótulo labe1.s)
variáveis com dados nominais, a fim de ser possível o cálculo de frequências absolutas e relativas.
Inicialmente, para inserirmos os dados da Tabela 2.2 no SPSS, é necessário, no ambiente Variable
lew, definirmos os tipos de variáveis, de acordo com a Figura 2.2.

lb
26
27
28

d
~
30

---
::01 "
:-:;. \ Data View ,{Variable View I
----
Figura 2.2: Ambiente Variable View - definição dos tipos de variáveis.

As variáveis empresa e país são nominais, porém a primeira também é string, ou seja, seus dados estão
na forma de caracteres ou letras. Sempre que tivermos nomes de pessoas, empresas, indivíduos, plantas
ou quaisquer outros objetos, devemos selecionar a opção string.

F<) fôj;t P, "l,o!"ISfç..,." . -


_.
;}.!I"J"... õJI _~-: .Aj ..•.
"--
.,..-.; "'Ir":
----
I-\(~\l

lOJ;iJw 1m" g bf.? •• >:l'ffi' ElillWi ~<0'


Name

Vl\fi.,ble Type
ONtrneric:
5" O('.crrm)
6 0001
7 OScieril'lC~
B Oüee
_~ 00""
tl 0SlTI;J I !

Figura 2.3: Seleção da opção string.

No nosso exemplo, optamos por um número máximo de 20 caracteres.


A Figura 2.4 mostra como devem estar classificadas as variáveis no ambiente Variable View. Note que
ambas foram classificadas como nominais.

File Edit View Data Transform Analyze Graphs Utilities Add-ons Window Help

Figura 2.4: Classificação das variáveis.

De volta ao ambiente Data View, podemos então lançar os dados da Tabela 2.2.
26 ANÁLISE DE DADOS ELSEVIER

b
26
27
28
29
30
31
~ \ Data View }. Variable View

Figura 2.5: Ambiente Data View - preenchimento do banco de dados.

File Edit View Data Transtorm Analy2e Graphs Utilit!es Add-ons Window Help

emcrese nais var var var var -


I
1 Gerdau 1 1001
-~ I
2 Citigroup 500 ~1----4
3 Santander 4.00 I
4 Volkswagen 2.00 I
5 Wa~Mart 5.00 1
6 Pelrobrás I 1.00 1
7 Vale 1.00 I
8 Philips 3.00 1
I
9 Boeing 5.00
10 Siemens 2.00 I
!
11 , ~~
1::
13 I
+I I

Figura 2.6: Banco de dados.

A variável país não é métrica, mas apresentada na forma de números. Portanto, é preciso que sejam cria-
dos os rótulos correspondentes a cada categoria, de modo que:

1 = Brasil
2 = Alemanha
3 = Holanda
4 = Espanha
5 = Estados Unidos
Logo, devemos clicar em Data Define Variable Properties e selecionar a variável país, de acordo com
as Figuras 2.7 e 2.8.

File Edit View Data Transform Analyze Graphs Utilities Add-ons Window Help

(ê.Q~r. Define Variable Properties ...


Copy Data Properties ...
~mW. ~~I
11 . país New Custorn Attribute, .
Define Dates, , ,
e var var var
DeFine r<J1ultiple Response Sets •• ,
1 Gerda I
2 Citigr
3 Santa
Validation

Identify Duplicate Cases ...



4 Volks Identify Unusual Cases, .'

5 Wal~h 50rt Cases".


6 Petro Transpose."
7 Vale Restructure., , I
--.ê.!Philip
g'BOeirl
Merge Files
Aggregate, , .
• I

10 Siem
11
Orthogonal Design

-,--- Copy Dataset
~ 13
-~-
Split File",
14 Select Cases, , ,

15 Weight C.ses"

I 5 I I
~ 17
I I
Figura 2.7: Criação de rótulos de uma variável nominal.
- 1ER TIPOS DE VARIÁVEIS E ESCALAS DE

Define vertabre prcpentes

ri\l- . Use this faciMy 10 label variable values and se! other pooetes aftel
~ scanning lhe data.

Select lhe verebles to scen Ihey shouId be ceteçorcet (nominal


or Ofdinal) fOI best rescâs. Vou can change the measurement levei
setting in the nest panel
veiebles: veriebles to Scan:

o lmt runber 01cases scemed to:


0lirnit oombet' ofvalues displayed to:

Figura 2.8: Seleção da variável nominal país.

'-
_ ote por meio da Figura 2.9, que a variável país já está definida como nominal, de acordo com o que foi
rminado no ambiente Variable View. A definição dos rótulos (labels) deve ser elaborada neste mo-
a e também pode ser visualizada na Figura 2.9.
,s a definição dos rótulos, é possível visualizar o banco de dados da forma apresentada na Figura
. ~Ias, para que isso ocorra, o pesquisador deverá clicar no ícone que se parece com uma etiqueta,
ado de Value Labels, localizado na barra de ferramentas. Esse ícone transforma os valores numéri-
de variáveis nominais ou ordinais nos respectivos rótulos, e vice-versa.

Define Variable Prcperties

.-J Lebel I
Scanned
U. M
Variable List
V••iable
~==~ [SUggest I Type: INumeric Iv)
"IQ] país
Unlabeled veloes: ~==-,....,-rl-:CAI-Ctllbut:--es-..-. 'I Vlidlh: O Decima~D

VaiJe Lebel grid:

Changed
eu Enter or edillabeIs ir>lhe grid You cen enter .~~

I
Missing Count Value
values et Ih;- boU~.

Label I
-!- 0 U 1 3 /' 1.00 Brasil <, I
3.-
~ f-~
fi2- -p
O
2
1
/ 2.00 A1em6nha
3.00 HoIand.
4.00 êspeoha
'I-i
----,
0
~5 f--0 1 L--...1

O 3 <, 5.00 Estados Unidos ~


i.L..... -.0__ ,--0 7-- »>
~
Rótulos definidos

Copy Prooetles-: UnlabeledVaJues

Eeses scemed 110 : FromAnotherVariable ... 1 1 To Othe< Variables. .. Automatic Lebeís

VaIue tis! Iinlt :200 :

Figura 2.9: Definição dos rótulos da variável país.

A1e Edit lliew Data Transform Analyze Graphs l..R:i1itiesAdd-ons Window Help

"'" Q ~ Illi ., ~ k b? HI -i EiE ~ m Wi ~~ ~


117 J ~
emoresa oals ver var
1 Gerdau Brasil
2 Citigroup
3 Santander
4 Volkswagen
Estados Unidos
Espanha
Alemanha
--
±=
I
5 Wal-Mart Estados Unidos
6 Petrobrás Brasil
7 Vale I Brasil
8 Philips Holanda
9 Boeing Estados Unidos
10 Siemens Alemanha
11
12
I n

Figura 2.10: Banco de dados com rótulos.


ISE DE DADOS ELSEVIER

Com a estruturação do banco de dados, é possível determinar a tabela de frequências absolutas e relativas
r meio do SPSS, bem como os respectivos gráficos. Para tanto, devemos clicar na opção Analyze ~ Des-
criptive Statistics ~ Frequencies e selecionar a variável país, como mostrado nas Figuras 2.11 e 2.12.

F~e Edit View Data Transform ,AMIy2e Graphs Utilities Add-óns Window HeJp I

C=;Q@lJ Iffi ~ J;i;J ~


am
Reports • \;; rr.:;;:)r:;,. I
_Stotlstics • Fr~ •••

117
---
1 Gerdau
smorasa
Tebles
Compare Means
General linear Mode!



Descrotíves. ,
Explore" ,
Crosstebs.. ,
~
~
2 Citigroup
Gener ellzed linear recdels
• Ratio.. I---

3 Santander
Mixed Models • p.p Plots. I---
Correlate
• Q-QPlots ... I---
4 Volkswagen Regression

5 Wal-Mart loglinear

6 Petrobrás dassify

7 Vale Data Reduction

8 Philips Scale

9 Boeing Nonpererretrk Tests

10 Siemens
Time Series •
11
Survival •
12
Multiple Response
Missing Value Analysts •.•

13 Complex Samples •
14
15
Quality Control
ROC Curve .. ,

.3li I

Figura 2.11: Procedimento para determinação das frequências absolutas e relativas.

Variable(s)"
~país

[}]

o Display frequency tables

[Statistics_.1 [Charts... I Format...


Figura 2.12: Seleção da variável nominal país para o cálculo de frequências.

o cálculo das frequências absolutas e relativas, bem como a definição dos respectivos gráficos, se dá
por meio das escolhas feitas no menu Charts.

frequencies: Charts frequencies: Cherts


Chart T~pe------, Chart Type------.,
I Continue I
O None O None
I 0 Bar charts
Cancel
I O Bar charts I Cancel

L
O Pie charts
O Histograms:
V/lth .:rmal curve _J
Help 0 Pie charts
1 O Histograms:
L_O_W_ith_n_om_-,a_1 CU_iV~
J Help

ChartValues - - ------l ChartValues------·-- I


o Frequencies
___ __..
O Percentages
.~_,_.----1
I [ O Frequencies 0 P~~ntage~_.J

Figura 2.13: Elaboração de tabela e gráficos de frequência.

~'::'~~:2Ç:ã-o do áfico de frequências absolutas, preferimos utilizar o tipo conhecido como gráfi-
. Já para as frequências relativas, optamos pelo gráfico de pizza (Pie charts). A op-
-R TIPOS DE VARIÁVEIS E ESCALAS DE MENSURAÇÃO 29

ção Frequencies apresentada no Chart Values refere-se às frequências absolutas e a opção Percentage
às frequências relativas.
Como outputs do procedimento apresentado, temos a tabela de frequências absolutas e relativas e os
gráficos de barra para as frequências absolutas e de pizza para as frequências relativas.

país

Cumulative
Frequency Percent Valid Percent Percent
Valid Brasil 3 30.0 30.0 30.0
Alemanha 2 20.0 20.0 50.0
Holanda 1 10.0 10.0 60.0
Espanha 1 10.0 10.0 70.0
Estados Unidos
Total - 10
3 30.0
100.0
30.0
100.0
100.0

Figura 2.14: Tabela de frequências absolutas e relativas.

A escala nominal, segundo Martins (2005), representa um nível restritivo de mensuração em ter-
mos do uso de técnicas estatísticas, já que não é possível a aplicação de operações aritméticas com
eus valores.

',.

>2
u
e
11)
;:, I~'
C"
~
u,


-
'i',
li>,

o
Brasil Alemanha Holanda Espanha Estados Unidos
País

Figura 2.15: Gráfico de barras: frequências absolutas,

País
• Brasil
~Alemanha
Holanda
C Espanha
== Estados Unidos

Figura 2.16: Gráfico de pizza: frequências relativas.


- .- _15:: DE DADOS ELSEVIER

Escala Ordinal

uponha agora que nosso objetivo seja medir subjetivamente a preferência de um grupo de consumido-
r em relação a cinco marcas de automóveis (A, B, C, D e E). Poderíamos pedir a cada entrevistado que
ordenasse as cinco marcas pelo grau de preferência, sendo 1 o valor atribuído para a mais desejada, 2 para
a egunda mais desejada, e assim sucessivamente, até que o valor 5 seja atribuído para a marca menos de-
ejada. Considere o ranking (ordenamento) estabelecido para determinado indivíduo:

Tabela 2.3: Ranking de Preferência de um Indivíduo a Marcas de Automóveis


Marca Ranking
A 1
D 2
C 3
E 4

B 5

Por meio da Tabela 2.3, podemos concluir que o indivíduo em questão prefere a marca A à marca D, a
marca D à marca C, a marca C à marca E e, por fim, a marca E à marca B. Porém, embora as diferenças
entre os valores numéricos sucessivos de cada posição do ranking sejam iguais, não podemos avaliar o
quanto esse indivíduo de fato prefere determinada marca a outra. Ou seja, categorias sucessivas não re-
presentam diferenças iguais do atributo mensurado. Essas escalas de mensuração são conhecidas como
escalas ordinais, e os dados resultantes são chamados de dados ordinais.
Exemplos de dados ordinais incluem opinião e escalas de preferência ..Como o número de tais escalas
tem apenas um significado de classificação, as estatísticas que podem ser calculadas a partir de dados or-
dinais são a moda e as distribuições de frequência (SHARMA, 1996; COOPER e SCHINDLER, 2003).
O procedimento para a classificação e para a definição dos rótulos de variáveis cujos dados estejam em
escala ordinal é o mesmo daqueles já discutidos para as variáveis nominais, não havendo necessidade de
apresentação específica.

2.2.3. Tipos de questões para obtenção de variáveis não métricas

Além das perguntas diretas ou estruturadas em faixas sobre determinadas características ou atributos
explicitados na forma qualitativa, para a obtenção de variáveís cujas escalas de mensuração sejam não mé-
tricas, existem algumas outras formas de perguntas que podem ser elaboradas quando da aplicação do
questionário. No Quadro 2.3, apresentamos diversos tipos de questões que têm como finalidade a coleta
de dados que entrarão na composição de variáveis qualitativas.
Das formas de pergunta apresentadas no Quadro 2.3, percebemos que há certa preferência por parte
quisadores pelo uso da escala Likert, pela possibilidade de o questionário ser montado com várias
perzuntas em sequência, todas com as mesmas alternativas de resposta, propiciando ao respondente uma
cilidade de interpretação e tornando menor o tempo total de entrevista.
C o podemos perceber, todos os demais tipos de questões também podem ser facilmente transfor-
a escala Likert. Porém, da mesma forma que para as faixas de respostas, as escalas Likert tam-
neamente utilizadas para o cálculo de médias.
TIPOS DE VARIÁVEIS E ESCALAS DE MENSURAÇÁO 31

Quadro 2.3: Tipos de Questões - Escalas Qualitativas

orne Descrição Exemplo

Dicotômicas Questões com duas "Eu gostei do curso de Estatística Aplicada".


respostas possíveis. Sim [ 1 Não [ 1

;\1últipla Questões com três ou mais "Com quem você pretende fazer este curso?"
Escolha respostas possíveis. Ninguém [ 1
Colegas de trabalho [ 1
Familiares / amigos [ 1
Escala Likert Afirmação na qual o "Este curso ajudou a aprimorar meus conhecimentos de estatística e me tornou mais
entrevistado mostra o apto a utilizar ferramentas para a tomada de decisão."
quanto concorda ou ..•
discorda. Discordo Discordo Nem concordo, Concordo Concordo
totalmente parcialmente nem discordo parcialmente totalmente
[ 1 [ 1 [ 1 [ 1 [ 1
Diferencial Escala inserida entre duas O professor, em sua opinião, é:
Semântico palavras antônimas e o
entrevistado seleciona o
Ágil _x__ :___ :___ :___ :___ :___ : Moroso
ponto que representa a
Experiente ___ :___ :___ :___ :_x_: ___ : Inexperiente
direção e a intensidade de
Cativante ___ :__ x_: ___ :___ :___ :___ : Não Cativante
seus sentimentos.

Escala de Escala que avalia a "Eu considero o conteúdo ministrado no curso...":


Importância importância de alguns
atributos, variando de "nada Extremamente Muito Razoavelmente Não muito Nada
importante" a importante importante importante importante importante
"extremamente importante". [ 1 [ 1 [ 1 [ 1 ( 1
I

Escala de Escala que avalia certos "Avariedade de alimentos no coffe break está":
Gradação atributos, de "fracos" a
u
excelentes". Excelente Muito boa Boa Razoável Fraca
[ 1 [ 1 [ 1 [ 1 [ 1
: Adaptado de Kotler e Armstrong (2003).

Imagine uma pesquisa que tenha por objetivo avaliar a qualidade da refeição de determinado restau-
rante e que uma das perguntas seja:

A higiene e a limpeza do recinto são adequadas.


Discordo Discordo Nem concordo, Concordo Concordo
totalmente parcialmente nem discordo parcialmente totalmente
() () () () ()

Imagine que, como respostas, obtivemos as seguintes frequências relativas:

A higiene e a limpeza do recinto são adequadas.


Discordo Discordo Nem concordo, Concordo Concordo
totalmente parcialmente nem discordo parcialmente totalmente
12% 7% 14% 42% 25%

Como já discutido, o máximo que o tratamento de uma variável em escala não métrica pode ofe
uma composição de frequências. Porém, muitas vezes nos deparamos com a atribuição arbitrária de
por parte dos pesquisadores para cada uma das categorias. Assim:
- -_ -= :::>EDADOS ELSEVIER

Pesos arbitrários -2 -1 O 2

Discordo Discordo Nem concordo, Concordo Concordo


totalmente parcialmente nem discordo parcialmente totalmente
Categoria 12% 7% 14% 42% 25%

E O pior: o pesquisador calcula a média ponderada pelos pesos arbitrários, da seguinte maneira:

Cálculo errado da média: M = O,12x(-2) + O,07x(-l) + 0,14x(0) + O,42x(1) + O,25x(2) = 0,61

E ainda marca a média no esquema de categorias:

-2 -1 O 2
Discordo Discordo Nem concordo, Concordo Concordo
totalmente parcialmente nem discordo parcialmente totalmente

+
Média = 0,61
ERRADO!

Mas por que esse procedimento está errado, já que parece tão lógico?
Esse procedimento está errado porque não há lógica que sustente a arbitrariedade adotada pelo pesqui-
sador, ou seja, não há o que justifique a adoção de determinados pesos em detrimento de outros. Por que se
adotou uma escala linear? Por que são simétricos em relação à categoria "nem concordo, nem dis-
cordo"? Por que não foram adotados outros pesos? Por mais que se tente, não há como comprovar que a
ponderação adotada está correta. E nem que há uma ponderação correta, já que qualquer pequena modifi-
cação nos valores dos pesos pode alterar significativamente o valor da "média" erroneamente calculada, de-
pendendo da frequência relativa de cada categoria.
No nosso exemplo, fica óbvio que a atribuição de um peso de (-2) para a discordância total em relação à
higiene e à limpeza do restaurante e de (+2) para a concordância total não é adequada, já que o fato de al-
guém discordar que determinado recinto em que são servidas refeições seja limpo e higiênico não pode ter
o mesmo impacto, em módulo, de uma situação em que alguém concorde. Na verdade, imaginamos que a
concordância em relação à limpeza e à higiene nada mais ressalta do que a obrigação do recinto em se
manter nessas condições. Pois bem, então qual seria uma nova atribuição de pesos? Fica realmente
difícil, senão impossível, chegarmos a um consenso, uma vez que o tipo de variável que é gerada por meio
dessa forma de questionamento é, em essência, qualitativo, tornando impraticável o cálculo de médias e
desvios.
Além das formas de questões apresentadas até o momento, consideradas fechadas, pelo simples fato de
as possíveis respostas estarem explicitadas na sequência da pergunta, existem as maneiras abertas. No
Quadro 2.4, são apresentados os tipos de questões abertas que podem ser elaboradas para se levantarem
variáveis qualitativas.
Os tipos de questões apresentadas no Quadro 2.4, embora interessantes, podem trazer certo grau de di-
ficuldade para o pesquisador em relação à tabulação, uma vez que uma pergunta feita a 1.000 pessoas
pode gerar, eventualmente, 1.000 respostas diferentes. O uso de questões abertas é recomendável, por
exemplo quando não se tem idéia de quais serão as possibilidades ou tendências de repostas, pelo desco-
nhecimento do pesquisador sobre aquele assunto ou até mesmo sobre as pessoas que estão sendo pesqui-
sadas (pessoas de outros países, com outras culturas ou com diferentes percepções sobre determinado
fenômeno). Assim, pode-se, com a elaboração prévia de perguntas abertas, chegar a uma quantidade pla-
usível de respostas similares para inclusão futura em possíveis perguntas fechadas.
TIPOS DE VARIÁVEIS E ESCA •S :E

Quadro 2.4: Tipos de Questões Abertas - Escalas Qualitativas

Nome Descrição Exemplo

Completamente Questão que o entrevistado "Qual é sua opinião sobre o curso de Estatísrica?"
desestruturada pode responder de várias
formas.
_ T_
Associação de Apresenta-se uma palavra de "Qual é a primeira palavra que vem à sua cabeça quando ouve o
palavras cada vez, e o entrevistado
deve mencionar a primeira, Dados
palavra que lhe vier à cabeça. Estatística
Tomada de Decisão

Completar a Apresenta-se uma frase "Quando escolho determinado curso, o mais importante para mim é-:
sentença incompleta de cada vez, e o ---
entrevistado deve completá-Ia.

Completar uma Apresenta-se uma história "Eu me matriculei em um curso de Estatística e, no primeiro dia de aula.
história incompleta e o entrevistado percebi que os demais alunos eram brilhantes. Isso despertou em mim os
deve completá-Ia. seguintes pensamentos: ..." Agora você completa a história.

Completar um Apresenta-se um quadro com


quadro personagens, sendo que um
deles faz uma declaração. O
Preencha o balão vazio.
entrevistado deve preencher
o balão vazio como se fosse o "~
personagem.

Testes de percepção Apresenta-se um quadro, e o


temática entrevistado deve dizer o que
Crie uma história
(TAT - Thematic acha que está ocorrendo ou o ~-~.~
Apperception Tests) que pode ocorrer na situação
sobre esta cena. ~;:':fD'
"
apresentada.
: Adaptado de Kotler e Armstrong (2003).

2.3. VARIÁVEIS MÉTRICAS E ESCALAS DE MENSURAÇÃO

As variáveis métricas, também conhecidas por variáveis quantitativas, são aquelas que, segundo a elas-
ificação de Stevens (1946), possuem dados em escala intervalar ou de razão.
s variáveis quantitativas são aquelas representadas por valores que podem ser tratados com o intuito
de se calcularem medidas de posição, como a média, ou de dispersão, como o desvio padrão. Essas variá-
-eis podem ser discretas ou contínuas, sendo que, para o primeiro grupo, os possíveis valores formam um
onjunto finito ou enumerável de números que são provenientes, frequentemente, de uma contagem,
. por exemplo, o número de filhos (0, 1,2, ... ). Já as variáveis quantitativas contínuas são aquelas eu-
o possíveis valores pertencem a um intervalo de números reais e que resultam de 'urna merisuração rnê-
trica, como, por exemplo, a estatura ou o salário de um indivíduo (BUSSAB e MORETTIN, 2006).
As medidas de posição e de dispersão serão estudadas no Capítulo 3 (Estatística Descritiva). Neste momen-
to, ficaremos restringidos à discussão dos tipos de variáveis e da elaboração das várias formas de gráficos.
Imagine um banco de dados composto de 15 pessoas e que pretende analisar a influência da idade na
renda mensal, de acordo com a Tabela 2.4.
Os dados encontram-se no arquivo VarMétrica.sav. Para montarmos esse banco de dados no P .é
preciso lembrar que a variável nome é qualitativa nominal e string. As demais (idade e renda jmensa
quantitativas, chamadas no software SPSS de Scale.
; _ISE DE DADOS ELSEVIER

Tabela 2.4: Banco de Dados para Idade e Renda Mensal de 15 Pessoas

Nome Idade Renda mensal (R$)


Patrícia 31 12.40000
Leonor 64 18.00000
Ovídio 57 16.20000
Mariana 37 7.20000
Roberto 52 20.80000
Letícia 18 2.100,00
Dalila 21 1.950,00
Luiz 34 15.60000
Paulo 30 3.40000
Rodolfo 62 13.30000
Renata 27 4.100,00
Antônio 39 15.60000
Ana 28 8.20000
Antonieta 44 9.52000
Túlia 51 11.300,00

File

fà,Q&
Edit View

1m
Data
., Transform

~
AnafYze Graphs . utilitles

};", g? It -fé Iilmm ~Iê


Add-ons w>ldOii

I'
HeIP 1

Name Type Width Decimais Label Values I ~ Columns Align Measure


1 nome String 20 O None Se"" 8 Left Nominal
2 idade Numeric 8 2 None Nono 8 Right Scale
3 renda men Numeric 8 2 None "one 12 Right Seale
4
5
6
7
8
,-.;
Figura 2.17: Classificação das variáveis,

Para as variáveis quantitativas, podemos elaborar um número bem maior de representações gráficas.
Por meio do banco de dados em questão, consideramos a utilização de gráficos de dispersão ou de linha,
por exemplo, de acordo com o passo-a-passo apresentado na Figura 2.18.

rue

(à.Q~
eoic VJeW

1m
Daca
., rrensroem

~ ~~?
I-Inaoyze ~,,~otlUCI"

14 Chllrt Builder ...

TrteI'adMJ ,':' •
kt:~~1
..••... Melp

26: I Legacy Dialogs ~


nome idade rend 'lar 'lar
Mllp • b..
1 Patrícia 31.00 Rbbon ...
2' Leonor 64.00 1800000 ~ Drop-tile ... gráfico de dispel são
30vídio 57.00 16200.00 ~M •.•
<,
, 4 Mariana 37.00 7200.00 Pie ~ gráfico de linha
L 5 Roberto 52.00 20800.00 BoxPot .. ·
6 Leticia 18.00 2100.00 Errar Bar ...
7 Dalila 21.00 1950.00
Histogram ..•
i 8 Luiz 34.00 15600.00
9 Paulo 30.00 3400.00 Scatterp/ot ...

10 Rodolfo 62.00 13300.00


11 Renata 27.00 4100.00
12 Antônio 39.00 15600.00
13 Ana 28.00 8200.00
14 Antonieta 44,00 9520.00
15 Júlia 51.00 11300.00
16
17

Figura 2.18: Menu para elaboração de gráficos.


TIPOS DE VARIÁVEIS E ESCAL' S 1E

irn, definimos as variáveis a serem incluídas nos eixos y (variável dependente) e x (variáve e3.lr-:::z:rj-
Figura 2.19).

'.6[c.re 110<0"1
'<6Co<.riI$cou"ot1
\APer~nll$pdl
t
AI""""" I<f I",""_mensol]
I
~r:;<f;::rod-:-'d:-:-.I----+
I legendVatibble~, ====--
I COOc I "
SIyIe I
50': r-I ----

ik===~
Perelveriebes -;=========;

Figura 2.19: Definição das variáveis x e y.

meio do gráfico de dispersão, é possível verificar que há certa correlação positiva entre idade e ren-
n aI, o que sugere que, se a amostra pesquisada for representativa da população em estudo, as pes-
m maior idade tendem a ganhar mais. Os conceitos relativos ao dimensionamento amostral serão
5~ados no Capítulo 5 (Inferência Estatística). O estudo da correlação será aprofundado no Capítulo
álise de Regressão).

20000.00
• DoVLines show Means


15000.00
• • •
(ij
e
li)

Q)
• •
E
Cll
I •
'O
e
10000.00

I!!
• •
5000.00
••
••
20.00 30.00 40.00 50.00 60.00

idade
Figura 2.20: Gráfico de dispersão.

, ico de linha também pode ser elaborado para auxiliar o pesquisador no estudo do comportamento
rrelações entre variáveis quantitativas, porém é mais frequentemente utilizado para avaliar tendênci-
-ariáveis métricas ao longo do tempo, ou seja, com a inserção de uma variável temporal no eixo x,
riação de novas variáveis a partir de variáveis previamente existentes também é possível por meio do
. Imagine que se deseje, por alguma razão, subtrair dos valores referentes à idade o valor da idade
íxa. Em outras palavras, que quiséssemos subtrair 18 anos de todas as idades das pessoas do banco
o ,a fim de que seja possível avaliar o impacto do crescimento da idade sobre a renda em que o Te-
~"",,,,,,,rialfosse 18 anos de idade. Desta forma, poderíamos criar uma nova variável, chamada de .
~;:ad:aa partir da variável idade. Por meio do menu Transform ~ Compute Variable aplica- e a
ção desejada.
':_ISE DE DADOS ELSEVIER

DoVLines show Means


20000.00

15000.00
'ia
11)
I:
GI
E
I
(li
'C 10000.00
I:
•..
GI

5000.00

20.00 30.00 40.00 50.00 60.00


idade

Figura 2.21: Gráfico de linha.

TOI""'Yariable: Nemedc Exn.ession;


= Jidade.18
I JypeUabel.. I
~b-==
u..;::..J
__--~~~~~~~~~~'
Function gfoup:

~__ ~
(----
O!J
~:I~
__ (oplional case
-
selection
~
condílion)
~~_,~,lvdl
'-----__ _ ~_~ __ L.. ....JI

Figura 2.22: Transformação de variáveis.

. .ote que a nova variável idade_O agora aparece no banco de dados (Figura 2.23).

File Edit

{ÕQ~
View

1m
Data
., Transform

!;i;;I tu. ~?
Analyze

~ -lIrh
Graphs Utilities

~m~
Add-ons Window Help

~<ê 11.
1
I
29 : J~ .
nome idade renda mensal idade O var var
1 Patrícia 31.00 12400.o~ 13.00
2 Leonor 64.00 18000.00 46.00
3 Ovídio 57.00 16200.00 39.00
4 Mariana 37.00 7200.00 19.00
5 Roberto 52.00 20800.00 34.00
6 Letícia 18.00 2100.00 00
7 Oalila 21.00 1950.00 3.00
8 Luiz 34.00 15600.00 16.00
9 Paulo 30.00 3400.00 12.00
TIl Rodolfo 62.00 13300.00 44.00
! 1f Renata 27.00 4100.00 9.00
12 Antônio 39.00 15600.00 21.00
'1:3Ana 28.00 8200.00 10.00
~,~IAntonieta 44.00 9520.00 26.00

'='i IJIm I

I
51.00 11300.00 33.00

.
....---. I

Figura 2.23: Banco de dados com nova variável.


TIPOS DE VARIÁVEIS E ESCALAS DE ME SU

_-1. análise simultânea de duas variáveis quantitativas permite ao pesquisador, por exemplo o cálc
e correlações e, como vimos, para cada tipo de variável, podem ser utilizadas técnicas mais apropria
ara resumir as informações. O tratamento simultâneo de variáveis qualitativas, por outro lado permi-
e a elaboração apenas de associações, por conta da inexistência de medidas de posição (exceto a moda
e de dispersão. Além da possibilidade apresentada de transformação, é possível criar variáveis qualita --
a partir de variáveis quantitativas, por meio da utilização de faixas. Voltando às variáveis originais.
uponha agora que nosso objetivo seja verificar se há associação entre as faixas de idade e de renda men-
de acordo com a seguinte estratificação:

Quadro 2.5: Criação de Faixas para Variáveis Quantitativas

Variável Conceito original Faixa (grupo)


menos de 29 anos 1
de 29 a 37 anos 2
idade
de 37 a 52 anos 3
mais de 52 anos 4
menos de R$ 5.600,00 1
de R$ 5.600,00 a R$ 11.300,00 2
renda
de R$ 11.300,00 a R$ 15.600,00 3
mais de R$ 15.600,00 4

. este caso, transformamos as variáveis quantitativas em variáveis qualitativas ordinais, chamadas ago-
de idade_quali e renda_quali. Obviamente não podemos nos esquecer de criar os rótulos para cada ca-
oria gerada. Essa estratificação foi sugerida sem um critério mais rígido, ou seja, sem que tivessem sido
culados, por exemplo, os percentis para a definição das faixas. Esses conceitos serão estudados no Ca-
tulo 3 (Estatística Descritiva).

File

~Q@i!
Edit View

m .,
Data Transform

~
Analyze

'1m, ~? ft
Grapns utmties

i!'1'il; Iiílimm
Add-ons Window

~~Ií
Help
- ~~ 1
I

.
128 : renda quafi

- 1 Patrícia
;I
31,00
renda mensal
12400,00
-,
idade O
13,00
ídade 'ouali
2,00
renda"'auaTI
3,00
var var "í

-2 Leonor 64,00 18000,00 46,00 4,00 4,00


3 Ovidio 57,00 16200.00 39,00 4.00 4,00
4' Mariana 37,00 7200.00 19,00 2.00 2,00
5' Roberto 52,00 20800.00 34,00 3.00 4,00
6 Letícia 18.00 2100.00 .00 1.00 1,00
1 Dalila 21,00 1950,00 3,00 1.00 1.00
8 Luiz 34.00 15600,00 16,00 2,00 3.00
9 Paulo 30,00 3400,00 12,00 2,00 1.00
'710 Rodolfo 62,00 13300,00 44,00 4,00 3,00
11 Renata 27,00 4100,00 9,00 1.00 1.00
12 Antônio 39,00 15600,00 21,00 2,00 3,00
13 Ana 28.00 8200.00 10,00 1.00 2,00
14 Antonieta 44.00 9520,00 26,00 3.00 2,00
'15 Júlia 51,00 11300.00 33.00 3.00 2,00
T6
~-.5

Figura 2.24: Criação de variáveis qualitativas a partir de variáveis quantitativas.

Embora o procedimento anterior seja aplicado com frequência, ressalta-se que esse artifício faz com
e se perca muito das informações inicialmente contidas nas variáveis métricas originais.
Os gráficos de barras para cada nova variável ordinal podem agora ser elaborados no SPSS.
:: :lE DADOS ELSEVIER

128
FIé Eift

t2;.Q~ - .,
renda quali
m
Data Transt'õrm

[;b,! k &? 1M

I
Analyze ~Uj!!1õS

00
Chart Builder ...

Interacllve
legacy Dialogs
Aõd'õns


tt~<êl
Bor .••
Dot ...
- HeJp -,
nome idade rend Une ... uali renda ouali var va
1 Patrícia 31.00
rl"lap
• Ribbon .. 2.00 3.00
2 Leonar 64.00 18000.00 nrco-uoe .. 4.00 4.00
3 Ovídia 57.00 16200.00 Atea.,. 4.00 4.00
4 Mariana 37.00 7200.00 Pie • 2.00 2.00
5 Roberto 52.00 20800.00 8oxplot ... 3.00 4.00
6 Letieia 18.00 2100.00 Error Bar •.. 1.00 1.00
7 Dalila 21.00 1950.00 1.00 1.00
+êstoç-ern ...
8 Luiz 34.00 15600.00 2.00 3.00
9 Paulo 30.00 3400.00 Scatterpltt ... 2.00 1.00
10 Rodolfo 62.00 13300.00 44.00 4.00 3.00
I 11 Renata 27.00 4100.00 9.00 1.00 1.00
12 Antônio 39.00 15600.00 21.00 2.00 3.00
13 Ana 28.00 8200.00 10.00 1.00 2.00
I 14 Antoniota 44.00 9520.00 26.00 3.00 2.00
I 15 Júlia 51.00 11300.00 33.00 3.00 2.00
I 16
u

Figura 2.25: Procedimento para elaboração de gráficos de frequência absoluta.

Create Bar Chart

Assign Variables Bar Chart Opbons EHor Bals TitJes O

1~~3.~t~~~~L_
'~Pereenl [$pet]
0100% stecked f:b ~
, [idade]
, [idade_O]
.d [idade_quali] ~Count [$eount]

!~
,
[nome]
[tendejnensel] n , ~--:;[lenda_qUaliJ...

Legend venebles

Color: rL-------
-
-==- __ -'
Style: I
PanelVariables --------

Figura 2.26: Escolha da variável qualitativa.

5 - 4 - r--- r---

4 -
3 -
E 3 - -
"o
U
2

o o
menos de de29a de3?a mais de menos de de RS5.600,OO de R$11.300,OO mais de
29 anos 37 anos 52 anos 52 anos RS5.600,OO a R$11.300,OO a RS15.600,OO RS15,600,OO

renda_quali

Figura 2.27: Gráficos de frequências absolutas - variáveis qualitativas.

Como temos agora duas novas variáveis qualitativas ordinais, podemos estruturar uma tabela de con-
tingência, ou cross tahulaiion; clicando no menu Analyze ~ Descriptive Statistics ~ Crosstabs, de
acordo como segue:
TIPOS DE VARIÁVEIS E ESCA AS :>::

Fie Edit \liew Ma Transform ~ Graphs Ltkies Add-ons Wondow Help I


e.Q~ 1m .., q > Repcrts • \; ~ r.o..
I
Oe:scriPtiVeStatistics
• frecuendes ...
[28 : renda_quali Iebles • oescronves ...
nome
1 Patrícia
2 Leonor
idade
31.G
64.0
Compare Means
General linear Mode!
Gener elaed linear Model:;:
·,
,
,
Explore ...
Cressta :s;".
Ratio,,,
uali
2.00
4.00
renda aual!
3.00
4.00
va

Plots ...
3 Ovídio 57.0
Mixed Models
, p-p
400 4.00
4 Mariana 37.0
Correlate
Reqression , Q·QPlots... 2.00 2.00
5 Roberto 52.0 toçtreer , 34.00 3.00 4.00
6 Letícia 18.0 Clessfv , .00 1.00 1.00
7Dalila 21.0 Data Reduction , 3.00 1.00 1.00
8 Luiz 34.0 Scale , 16.00 2.00 3.00
Nooperemetrk Tests , 12001 1.00
9 Paulo
10 Rodolfo
I
I
30.0
62.0
Tme Series , 44.00 2.00
4.00 3.00
I SUrvi .•••
el
• 9.00
11 Renala
12 Antônio
13 Ana
1
27.0
39.0
28.0
Multiple Response
to1issirrg "alue Analysis .• ,
Compíex Sempies
·• 21.00
10.00
1.00
2.00
1.00
1.00
3.00
2.00
14 Antoniets 44.0 Qua!ity Control • 26.00
33.00
3.00 2.00
15 Júlia 51.0 ROC Curve ... 3.00 2.00
16
17
I 18
19
20
21

Figura 2.28: Procedimento para elaboração de tabelas de contingência.

idade_quali * renda_quali Crosstabulation

Count
renda quali
de de
menos de R$5.600,00 R$11.300,00 mais de
R$ 5.600,00 a R$11.300,00 a R$15.600,00 R$15.600,00 Total
idade_qual i menos de 29 anos 3 1 O O 4
de 29 a 37 anos 1 1 3 O 5
de 37 a 52 anos O 2 O 1 3
mais de 52 anos O O 1 2 3
Total 4 4 4 3 15

Figura 2.29: Tabela de contingência entre faixas etárias e de renda.

o estudo das tabelas de contingência, o cálculo das frequências esperadas e dos resíduos e a aplicação
do teste estatístico X2 para verificar se a associação entre as categorias das variáveis ocorre de forma alea-
tória serão estudados em maior profundidade na técnica de análise de correspondência, no Capítulo 8.
O caminho inverso desse procedimento de transformação não é aplicável, ou seja, não é possível que
uma variável qualitativa original apresentada na forma de faixas seja transformada em quantitativa com
um valor exato, a não ser que já se conheça de antemão esse valor.

2.3.1. Escala Intervalar

As escalas de mensuração cujas categorias sucessivas representam níveis iguais da característica que
está sendo mensurada e cujos valores de referência sejam arbitrários são chamadas de escalas intervala-
res. Segundo Martins (2005), o nível de mensuração intervalar é aquele utilizado quando se designa arbi-
trariamente a uma categoria o valor zero e, a partir desse marco, constrói-se a escala. Segundo h
(I996), as propriedades da escala intervalar são preservadas com a seguinte transformação:

E' = aE + h
ISE DE DADOS ELSEVIER

que E e E' representam, respectivamente, os valores originais e transformados, e a e b são as constan-


da transformação e referem-se à escala de medida e à origem, respectivamente.
.m exemplo clássico é a temperatura, que pode ser medida, por exemplo, em graus Celsius ou em Fah-
renheit, sendo a escolha do zero feita de forma arbitrária, ou seja, não há sentido em dizer que o zero re-
presenta ausência de temperatura, já que ele representa uma categoria dessas duas escalas diferentes.
Assim, a diferença entre 15° e 20° graus Celsius é a mesma do que entre 30° e 35° graus Celsius, porém,
para esta escala, a origem e a unidade de medida são arbitrárias, o que permite a mudança para outra esca-
la por meio de uma transformação.
A escala intervalar apresenta a possibilidade de aplicação a todas as estatísticas paramétricas, sendo ex-
ceções aquelas baseadas na escala de razão, como o coeficiente de variação.

2.3.2. Escala de Razão

A escala de razão possui todas as propriedades da escala intervalar, porém apresenta como origem o
zero absoluto, cuja existência confere a característica de permitir ao pesquisador saber, por exemplo, se
um número é o dobro ou o triplo de outro. Em outras palavras, o zero absoluto significa que há um ponto
na escala em que não existe a propriedade em questão. Desta forma, qualquer transformação permite al-
terar a escala, mas não a origem. Assim:

E' = aE (2.2)

em que a representa a constante para a mudança de escala.


Muitos são os exemplos de variáveis cujos dados podem estar na escala de razão, como renda, idade,
quantidade produzida de determinado produto ou número de créditos cursados por alunos de graduação.

2.4. CARACTERíSTICAS DAS REGRAS DE MAPEAMENTO

Segundo Cooper e Schindler (2003), ao fazermos uma mensuração, planejamos algumas regras de ma-
peamento e, então, traduzimos a observação de indicadores de propriedade utilizando essas regras. Para
cada conceito ou constructo, é possível usar diversos tipos de dados, sendo que cada tipo de dado tem seu
próprio conjunto de suposições implícitas sobre como os símbolos numéricos correspondem às observa-
ções. As regras de mapeamento têm quatro características:

• Classificação: podem ser utilizados números para agrupar ou designar as respostas, porém sem que haja
uma ordem;
Ordem: podem ser utilizados números de acordo com uma ordenação;
- tância: as diferenças entre os números são ordenadas, ou seja, a diferença entre qualquer par de nú-
é maior que, menor que ou igual à diferença entre outro par de números;
: a érie de números tem uma origem única indicada pelo zero.

características das regras de mapeamento, podemos resumir as escalas de mensuração es-


capítulo de acordo com o apresentado no Quadro 2.6.
TIPOS DE VARIÁVEIS E ESCALAS DE

Quadro 2.6: Tipos de Dados e suas Características de Mensuração

FIpO de Dado Características dos dados Exemplo


'\ominal Classificação sem ordem, distância ou origem. Sexo (masculino, feminino)
Ordinal Classificação e ordem, mas sem Preparo de carnes (bem passada.
distância ou origem única. ao ponto, mal passada)
Intervalar Classificação, ordem e distância, mas sem origem única. Temperatura em graus
De razão Classificação, ordem, distância e origem única. Idade em anos
Cooper e Schindler (2003).

uando a mensuração for intervalar ou de razão e quando pudermos aceitar certas suposições sobre as
ibuições implícitas de dados com as quais estamos trabalhando, os testes paramétricos são apropria-
Os testes não paramétricos, por sua vez, normalmente envolvem suposições muito mais fracas sobre
" calas de mensuração nominal e ordinal (COOPER; SCHINDLER, 2003). Pode-se estudar mais sobre
testes no Capítulo 5 (Inferência Estatística).
ara a utilização das técnicas estatísticas e multivariadas, não faremos distinção, daqui para a frente
e as escalas intervalar e de razão, Como é comum, chamaremos as variáveis cujos dados estejam
s escalas de variáveis quantitativas ou métricas.

VARIÁVEIS DUMMY

e acordo com Sharma (1996), a determinação do número de variáveis necessárias para a investigação
nômeno em estudo é direta e simplesmente igual ao número de variáveis utilizadas para mensurar as
_ ctivas características. Entretanto, o procedimento para determinar o número de variáveis cujos da-
_ e tejam em escalas qualitativas é diferente. Considere, por exemplo, o caso em que um pesquisador
'a interessado em determinar o efeito do sexo, uma variável nominal, no consumo semanal de choco-
_-\5 duas possibilidades, feminino e masculino, podem ser numericamente representadas por uma va-
I dummy, também conhecida por variável binária, em que, por exemplo, pode ser atribuído o valor O
xo masculino e o valor 1 ao sexo feminino. Desta maneira, a variável nominal sexo é mensurada por
da utilização de uma variável dummy. Tomemos o banco de dados a seguir:

Tabela 2.5: Banco de Dados para Sexo e Consumo Semanal de Chocolate

Consumo de chocolate (gramas) Sexo


250 1
240 1
190 O
90 O
70 O
90 O
310 1
350 1
500 1
120 O
100 O
200 1
250 1
ELSEVIER

Gráfico 2.3: Relação entre Sexo e Consumo Semanal de Chocolate


600
500
400
300 :
200 •
100
O
O

Xote, neste exemplo, que o consumo médio semanal de chocolate é maior para as pessoas do sexo femi-
nino (D = 1). Uma equação poderia ser obtida por meio de uma regressão simples, que estudaremos em
profundidade no Capítulo 10, em que a variável dummy sexo seria explicativa e a quantidade semanal con-
sumida de chocolate (em gramas) seria a variável dependente. Assim, para este exemplo, temos:

Q=110+190.D (2.3)

o que resulta em um consumo médio semanal de chocolate, em gramas, de:

Q = 110 para os homens


Q = 300 para as mulheres

o pesquisador não precisa se preocupar com a referência, ou seja, com a determinação da característi-
ca que receberá o valor O, uma vez que, se isso for decidido da maneira inversa, isto é, se a referência for a
outra característica, a equação do modelo será alterada a fim de que os resultados finais não se modifi-
quem. Portanto, se o valor O fosse atribuído ao sexo feminino e o valor 1 ao sexo masculino, teríamos:

Gráfico 2.4: Inversão da Dummy de Referência

600
500
400
300
200 ~
100 •
O

O

em que:
Q = 300 - 190.D (2.4)

que resulta, igualmente, em:

Q = 110 para os homens


Q = 300 para as mulheres
Este simples exemplo demonstra a importância da variável dummy para a caracterização de variáveis
qualitativas, já que a categoria de referência é representada pela ausência do atributo da outra categoria.
Agora imagine que outro pesquisador esteja interessado em estudar um eventual efeito da profissão no
consumo semanal de chocolate, segundo o banco de dados visto na Tabela 2.6.
TER TIPOS DE VARIÁVEIS E ESCAL S D::: E SU AÇÃO 43

Alguém poderia sugerir que se atribuam valores 1, 2 e 3 para as profissões listadas na Tabela 2.6 (por
mplo, 1 para contador, 2 para engenheiro e 3 para médico), mas esse procedimento e tá errado por
n iderar que a influência no consumo semanal de chocolate por parte da profissão eneet heiro é o do-
da influência gerada pela profissão contador, e que essa diferença é a mesma entre as pro e11-
heiro e médico, o que não necessariamente é verdade. Em outras palavras, é um erro a a ibuição
itrária de valores (pesos) a cada uma das categorias da variável qualitativa, se o pesqui ado -er a
enção de criar um modelo e estudar o impacto gerado por tipo de profissão no consumo emanal
ocolate.
Tabela 2.6: Banco de Dados para Consumo de Chocolate e Profissão

Consumo de chocolate (gramas) Profissão


250 Contador
240 Engenheiro
190 Engenheiro
90 Médico
70 Médico
90 Engenheiro
310 Contador
350 Contador
500 Engenheiro
120 Contador
100 Médico
200 Médico
250 Engenheiro

A variável nominal profissão não pode ser representada por uma única variável cujos valores sejam arbi-
ários e nem tampouco por uma única dummy. Assim, duas dummies são necessárias para representar a
variável original profissão, de acordo com o Quadro 2.7.

Quadro 2.7: Criação de Dummies para a Variável Profissão

Dummies
Profissão DI D2
Contador O O
Engenheiro 1 O
Médico O 1

Logo, uma equação genérica que relaciona o consumo semanal de chocolate e a profissão pode ser defi-
nida:
(2_ -

em que:

U: constante que representa o consumo médio de chocolate de contadores (DI = O e D2 = O):


~I: diferença entre o consumo médio de chocolate de engenheiros e contadores (DI = 1 e D1 =
U + ~I: consumo médio de chocolate de engenheiros;
~2: diferença entre o consumo médio de chocolate de médicos e contadores (DI = O e D_ = :
44 ANÁLISE DE DADOS ELSEVIER

a + 132: consumo médio de chocolate de médicos;


132 - 13!: diferença entre o consumo médio de chocolate de médicos e engenheiros.

Com este procedimento, conseguimos estudar a influência separada de cada profissão no consumo de
chocolate. Da mesma forma que para duas características, a mudança da categoria de referência (neste
caso, a profissão contador) modifica os parâmetros da equação, mas não altera os resultados finais de con-
sumo médio de chocolate para cada profissão.
Para um número maior de categorias de uma variável qualitativa (por exemplo, religião, perfil socioeco-
nômico, cargo, entre outras), necessita-se também de um número maior de variáveis dummy. De maneira
geral, para uma variável qualitativa com n categorias, serão necessárias (n - 1) dummies.
O artifício das variáveis dummy, ou binárias, permite incluir o efeito de variáveis qualitativas categóri-
cas ou mesmo variáveis métricas, quando o importante for a distribuição em classes. Segundo Vasconcel-
los e Alves (2000), Rogers (2000) e Fávero (2005), a utilização de uma única variável que abrange
números inteiros representando quantidades, quando da construção do banco de dados, para cada variá-
vel que apresenta poucas possibilidades de ocorrência (como, por exemplo, a quantidade de dormitórios
ou banheiros de apartamentos, que são variáveis métricas, porém com um número pequeno de possibili-
dades), assume precipitadamente que as diferenças entre cada possibilidade provocam divergências de
mesma magnitude na variável dependente, o que também justifica a utilização de (n - 1) dummies para as
n possibilidades existentes.

2.6. CONSIDERAÇÕES FINAIS

Os dados estatísticos constituem a matéria-prima das pesquisas estatísticas, surgindo sempre quese
fazem mensurações ou se registram observações (FREUND, 2006). Podem ser pesos de animais, medidas
de características pessoais ou intensidade de terremotos; podem consistir em simples respostas do tipo
"sim ou não" ou indicação do estado civil da pessoa, como solteiro, casado, viúvo ou divorciado.
Muitos dados possuem determinadas escalas de mensuração em função das características da variável
pesquisada. Seria descabido, por exemplo, que uma variável nominal como sexo fosse hierarquizada ou
que suas categorias recebessem pesos diferenciados, sem que houvesse a adoção de algum critério arbi-
trário. O mesmo vale para variáveis como religião ou profissão. Por outro lado, um biólogo que estuda a
proliferação de amebas em determinado ambiente precisa saber qual o percentual de aumento do número
de indivíduos, sendo, para sua pesquisa, descabida a definição de categorias como alto número ou baixo
número. Ele precisa saber qual é este número!
Por outro lado, diversos dados podem ser levantados de mais de uma maneira. Um professor pode ser
avaliado por meio de notas de O a 10 em relação a determinados quesitos ou por meio de uma escala Li-
kert a partir de afirmações estabelecidas. A melhor decisão está longe de ser uma ciência exata e vai de-
pender de uma série de aspectos, entre os quais os objetivos de pesquisa, a modelagem a ser adotada
para que se atinjam esses objetivos, o tempo médio para aplicação do questionário e a forma de coleta. É
muito comum que se elaborem questionários anteriormente à definição da forma de tratamento dos da-
dos. Um grave erro! E às vezes também presenciamos a estruturação do questionário antes mesmo da
definição dos objetivos de pesquisa. Um erro ainda pior! Na verdade, todos esses aspectos precisam
ser determinados de forma conjunta e interativa, por meio da elaboração do que chamamos de plano de
pesquisa.
A escala de mensuração dos dados é inerente ao processo de coleta. O tempo para aplicação de um
questionário pode determinar (reduzir ou aumentar) o número de questões ou até mesmo alterar a escala
-::ER TIPOS DE VARIÁVEIS E ESCALAS DE ::: 5

e mensuração dos dados que serão obtidos. A forma de coleta, da mesma forma, tem influencia na,""",,,,,

ição dos tipos de questões (abertas ou fechadas), na escala de mensuração dos dados e no próprio aa~u

e coleta, já que perguntas elaboradas de forma presencial, por exemplo, podem ficar impossibilita
erem realizadas por meio telefônico ou auto-administrado.
Um banco de dados não precisa necessariamente apresentar variáveis em escalas exclusivamente q
itativas ou quantitativas. Uma pesquisa que coleta parte dos dados na forma não métrica pode, e é mui
omum, obter também dados em escala métrica. A combinação de variáveis cujos dados estejam em esc -
não métricas e métricas pode propiciar aplicações interessantes e modelagens bastante úteis para a e-
ração de informações voltadas à tomada de decisão.
A modelagem multivariada pode ser apresentada em diversos níveis de dificuldade matemática e oríen-
da para aplicação em vários campos de pesquisa. Desta forma, têm sido escritos não poucos textos sobre
o assunto para economia, administração, contabilidade, psicologia, educação, antropologia ou medicina.
Embora os problemas que surgem nessas diversas áreas por vezes exijam técnicas estatísticas especiais, o
onhecimento das classificações das variáveis auxilia consideravelmente o pesquisador na definição da
melhor técnica em função de cada problema específico. A importância da distinção apresentada neste ca-
ítulo e adotada no livro em relação a dados nominais, ordinais, intervalares e de razão decorre do fato de
ue a natureza de um conjunto de dados pode sugerir a utilização de técnicas estatísticas e multivariadas
articulares.

2.7. EXERCíCIOS - APLICAÇÃO DE BANCOS DE DADOS


1. O que são escalas de mensuração e quais os principais tipos? Quais as diferenças existentes?
2. Qual a relação entre as escalas de mensuração e a técnica adotada para a análise de dados?

3. Classificar as variáveis a seguir segundo a escala de mensuração: nominal, ordinal ou de razão.


a) Conhecimento sobre o faturamento de determinada empresa: 1 - Sim, 2 - Não.
b) Nota (O a 10) para a avaliação de um professor.
c) Ramo de atividade: Indústria, Comércio, Outros.
d) Número de vezes em que uma empresa emitiu debêntures nos últimos 15 anos.
e) Faixa de renda familiar mensal.
f) Tipo de organização (capital privado, capital aberto etc.).
g) Número de lojas de um varejista.
h) Escolaridade: 1 - ensino fundamental, 2 - ensino médio, 3 - ensino superior.
i) Número de computadores no domicílio.
j) Share de mercado de uma marca de refrigerante.
h) Avaliação de um produto em termos de ótimo, bom, regular, ruim ou péssimo.
i) Índice de disclosure de empresas de uma amostra - valores em faixas.
4. Sejam as variáveis relacionadas ao faturamento bruto em 2005 (R$), à área de vendas (m2) e ao
número de funcionários de 30 grupos supermercadistas do Brasil. Os dados encontram-se no ar-
quivo SupermercadosBrasileiros.sav (Fonte: Abras - Associação Brasileira de Supermercado
Pede-se:
a) Elabore um gráfico de dispersão para avaliar uma possível relação entre as variáveis referent
área de vendas (eixo x) e ao faturamento bruto (eixo y).
b) Idem entre o número de funcionários (eixo x) e o faturamento bruto (eixo y).
c) Elabore os gráficos de barra e de pizza para as frequências absolutas e relativas para ca
das três variáveis apresentadas, seguindo a estratificação a seguir:
ANÁLISE DE DADOS ELSEVIER

Variável Faixas Descrição


Faturamento bruto em 2005 (R$) Acima de 10.000.000.000 Faturamento alto
De 1.000.000.000 a 9.999.999.999 Faturamento médio
Abaixo de 999.999.999 Faturamento baixo
Área de vendas (mZ) Acima de 100.000 Área grande
De 50.000 a 99.999 Área média
Abaixo de 49.999 Área pequena
Número de funcionários Acima de 10.000 Efetivo grande
De 5.000 a 9.999 Efetivo médio
Abaixo de 4.999 Efetivo pequeno

5. Elabore um gráfico de linha para a série histórica do IGP-m de fev./05 a jan./08.

Índice do mês (em %)


janl08 1,09 janl07 0,50 jan/Oô 0,92
dez/O 7 1,76 dez/06 0.32 dez/O 5 -0,01
nov/O 7 0,69 nov/06 0.75 nov/05 0,40
outl07 1,05 outl06 0.47 outl05 0,60
setl07 1,29 setl06 0.29 setl05 -0,53
ago/07 0,98 ago/06 0.37 ago/05 -0,65
jull07 0,28 jull06 018 juliO 5 -0,34
jun/O? 0,26 junl06 I 0,75 junl05 -0,44
mai/07 0,04 mai/06 I 0.38 mai/05 -0,22
abr/O7 0,04 abr/06 -0.42 abr/O5 0,86
mar/O? 0,34 mar/O 6 -0,23 mar/O 5 0,85
fev/07 0,27 fev/06 I 0.01 fev/O5 0,30

Elabore os gráficos de frequência absoluta e relativa com a utilização da seguinte categorização:

Índice do mês (em %) I Categoria


Valor < ° I Índice negativo
Valor> ° I Índice positivo

6. Um pesquisador deseja estudar o impacto da religião nos hábitos de consumo de alimentos.


Como seria uma eventual descrição das variáveis dummy, para inclusão neste modelo, a fim de re-
presentar a variável nominal religião? _-\5 possíveis religiões neste estudo são: (a) catolicismo; (b)
judaísmo; (c) islamismo; (d) budismo.

7. O banco de dados a seguir apresenta para uma pequena amostra de 10 empresas, os respectivos lu-
cros líquidos e os setores de atuação.

Empresa Lucro líquido (R$ x 1.000) Setor


A 1.250,00 financeiro
B -377,00 logística e transportes
C 12.578,00 financeiro
D 1.887,00 telefonia
E -12,00 logística e transportes
F 477,00 varejista
G 579,00 varejista
H 1.478,00 telefonia
I 774,00 telefonia
J 15.870,00 financeiro
TIPOS DE VARIÁVEIS E ESCALAS DE MENSURAÇÃO 47

Pede-se:

a) Elabore um gráfico de dispersão com as variáveis lucro líquido (eixo y) e setor (eixo x), sendo se-
tor financeiro = 1 e outros = O.
b) Por meio da elaboração do gráfico anterior, é possível afirmar que a média dos lucros líquidos é
maior para empresas do setor financeiro?
c) Refaça o item (a), porém agora com setor varejista = 1 e outros = O. É possível afirmar que a mé-
dia dos lucros líquidos é maior para empresas varejistas?
d) Crie três variáveis dummy S 1, S2 e S3 para representar as categorias da variável nominal setor.
Como seria um modelo que pudesse avaliar o impacto do setor no lucro líquido das empresas?

2.8. RESUMO

Em procedimentos de pesquisa, diversos dados podem ser levantados de mais de uma maneira. A defi-
nição da escala de mensuração de determinada variável está longe de ser uma ciência exata e vai depender
de uma série de aspectos, entre os quais os objetivos de pesquisa, a modelagem a ser adotada para que se
atinjam esses objetivos, o tempo médio para aplicação do questionário e a forma de coleta. Todos esses as-
pectos precisam ser determinados de forma conjunta e interativa, por meio da elaboração do que chama-
mos de plano de pesquisa.
As variáveis podem ser divididas em não métricas (qualitativas) ou métricas (quantitativas), sendo que
não métricas se apresentam nas escalas de mensuração nominal ou ordinal, e as métricas nas escalas de
mensuração intervalar ou de razão. A escala nominal é aquela cujos dados apresentam-se classificados
em uma ordem, distância ou origem. Na escala ordinal, os dados apresentam-se classificados em ordem
mas sem a obediência a uma distância ou origem única. A escala intervalar refere-se aos dados que se
apresentam classificados com alguma ordem e distância, porém sem origem única. Por fim, na escala de
razão, os dados apresentam-se com classificação, ordem, distância e origem única.
As variáveis dummy, ou binárias, são frequentemente utilizadas quando o pesquisador deseja avaliar o
impacto da existência (atribuição de valor 1, por exemplo) ou da ausência (valor 0, por exemplo) de deter-
minado atributo qualitativo sobre algum fenômeno em questão. Para uma variável qualitativa cujo núme-
ro de categorias for maior que 2, necessita-se também de um número maior de variáveis dummy. De
maneira geral, para uma variável qualitativa com n categorias, serão necessárias (n -1) dummies. A utili-
zação de uma única variável métrica que abrange números inteiros representando quantidades, quando
da construção de determinado banco de dados, assume precipitadamente que as diferenças entre cada
possibilidade provocam diferenças de mesma magnitude em determinada variável dependente, o que
também justifica a utilização de (n - 1) dummies para as n categorias existentes.
Um banco de dados não precisa necessariamente apresentar variáveis em escalas exclusivamente nào
métricas ou métricas. Uma pesquisa que coleta parte dos dados na forma não métrica pode, e é muito co-
mum, obter também dados em escala métrica. A combinação de variáveis cujos dados estejam em escalas
não métricas e métricas pode propiciar aplicações interessantes e modelagens bastante úteis para a gera-
ção de informações voltadas à tomada de decisão.

Você também pode gostar