Você está na página 1de 16

ESTATÍSTICA

Juliane Silveira
Freire da Silva
Fundamentos, tipos e
aplicação de variáveis
estatísticas
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:

„„ Definir variável estatística.


„„ Identificar os tipos de variáveis.
„„ Utilizar os diferentes tipos de variáveis em situações aplicadas.

Introdução
Neste capítulo, você vai aprender o que significa uma variável em esta-
tística e irá verificar a importância delas para a estatística.
Você também estará apto a classificar os diferentes tipos de variáveis
e quais as aplicações que cada tipo de variável pode ter.

Variáveis estatísticas

Uma variável em estatística é a observação de uma característica em uma amostra ou


em uma população. É uma informação que pode variar de elemento para elemento.
Essa observação pode ser um atributo, uma contagem, uma classificação ou uma
medição. São essas características que definem os diferentes tipos de variáveis.
2 Fundamentos, tipos e aplicação de variáveis estatísticas

Essa é a primeira coisa a se observar quando estamos classificando os


tipos de variáveis. Verificar se a resposta a essa variável é um atributo ou
um número.
Quando fazemos um questionário para uma pesquisa, cada uma das per-
guntas realizadas do questionário será uma variável da pesquisa. Cada uma
delas será uma característica diferente da amostra ou da população; cada
uma delas pode variar para cada um dos elementos da minha amostra ou da
minha população.
Não obtemos variáveis de um questionário formal obrigatoriamente, po-
demos ter bancos de dados de empresas, de acompanhamentos financeiros,
dados que são levantados independentemente de questionários, como, por
exemplo: valores mensais de entrada e saída, controle de estoque, valor de
mercadorias, tipos de produtos em estoque, entre outros.
Para definir uma população não precisamos necessariamente de pessoas.
Uma população pode ser composta por pessoas, seres ou objetos, desde que
todos os elementos dela tenham pelo menos uma característica comum a todos
os elementos dessa população, e como consequência, a amostra que também
será composta por pessoas, por seres ou por objetos com a mesma característica
comum da população da qual ela foi retirada.
Para fins de análise, precisamos organizar os dados das variáveis em bancos
de dados. Esses bancos nos darão a oportunidade de realizar as estatísticas
descritivas dos dados e, em alguns casos, as inferências estatísticas. Sempre
que obtemos dados, sejam eles numéricos ou não, independentemente da clas-
sificação das variáveis, precisamos organizar esses dados para que possamos,
posteriormente, fazer resumos numéricos que facilitem a compreensão dos
resultados das variáveis estudadas.
Por exemplo, uma operadora de telefonia celular decide fazer uma pes-
quisa para investigar a satisfação dos consumidores desse tipo de serviço
e analisar a sua concorrência. Para isso, foi realizada uma pesquisa para
descobrir com que frequência as pessoas trocam de celular, qual é o tipo de
plano de telefonia móvel mais frequente entre elas, qual é o valor médio gasto
com esse tipo de serviço e a satisfação com a atual operadora de telefonia
móvel. Veja o Quadro 1.
Fundamentos, tipos e aplicação de variáveis estatísticas 3

Quadro 1. Banco de dados de uma pesquisa sobre uso do celular

Número de Valor Satisfa-


aparelhos gasto no Ope- ção com
Tipo de
Nome adquiridos último radora a ope-
conta
nos últimos mês (em atual radora
5 anos R$) atual

Mauro 1 Pré-pago 25,00 Cliente Satisfeito


feliz

Paula 3 Pós-pago 123,00 Telefonia Indiferente


ótima

Carlos 5 Pré-pago 15,00 Telefonia Insatisfeito


nova

Maicon 3 Pré-pago 10,00 Telefonia Indiferente


ótima

Juliana 2 Pré-pago 20,00 Cliente Muito


feliz satisfeito

Ricardo 4 Pós-pago 99,00 Cliente Satisfeito


feliz

Marluza 1 Pós-pago 42,00 Cliente Satisfeito


feliz

Caio 6 Pós-pago 199,00 Cliente Satisfeito


feliz

Patrícia 4 Pós-pago 149,00 Telefonia Satisfeito


nova

Renata 3 Pós-pago 153,00 Telefonia Satisfeito


ótima

Claudete 1 Pré-pago 40,00 Telefonia Indiferente


ótima

Vitória 5 Pós-pago 178,00 Cliente Muito


feliz satisfeito

Rui 4 Pós-pago 100,00 Telefonia Satisfeito


nova

Paulo 1 Pré-pago 60,00 Telefonia Indiferente


ótima

Raquel 1 Pré-pago 5,00 Telefonia Insatisfeito


ótima

(Continua)
4 Fundamentos, tipos e aplicação de variáveis estatísticas

(Continuação)

Quadro 1. Banco de dados de uma pesquisa sobre uso do celular

Número de Valor Satisfa-


aparelhos gasto no Ope- ção com
Tipo de
Nome adquiridos último radora a ope-
conta
nos últimos mês (em atual radora
5 anos R$) atual

Ana 2 Pré-pago 14,00 Telefonia Indiferente


ótima

Antônio 4 Pós-pago 120,00 Cliente Satisfeito


feliz

Marcos 3 Pós-pago 79,00 Cliente Satisfeito


feliz

Marcelo 5 Pós-pago 66,00 Telefonia Satisfeito


nova

Mirian 3 Pré-pago 30,00 Telefonia Satisfeito


nova

Com esses dados no banco de dados não conseguimos tirar muitas conclu-
sões dos resultados dessa pesquisa. Imagine que, em vez de 20 entrevistados,
tivéssemos 200. Não conseguiríamos ter ideia do perfil pesquisado. Com base
nessas variáveis, podemos obter resultados das estatísticas descritivas. Cada
uma dessas variáveis pode gerar tabelas e gráficos e também é possível calcular
algumas medidas de posição ou de variabilidade nas que forem numéricas.
No exemplo, temos seis variáveis: nome, quantidade de celulares adquiridos
nos últimos 5 anos, tipo de conta, valor pago (em R$) no último mês, operadora
atual e o nível de satisfação com ela.
A partir do banco de dados, podemos fazer a análise inicial estatística, a
qual chamamos de estatística descritiva. Como o próprio nome sugere, esse
tipo de estatística descreve os dados, resume as variáveis estudadas.
Poderíamos obter tabelas e gráficos para todas as variáveis do exemplo
do banco de dados sobre telefonia celular, como, por exemplo, a tabela e o
gráfico da variável “tipo de plano de telefonia”, demonstrados na Figura 1 e
no Quadro 2.
Fundamentos, tipos e aplicação de variáveis estatísticas 5

TIPO DE PLANO

pré-pago pós-pago
45% 55%

Figura 1. Tabela oriunda do banco de dados


para a variável “tipo de plano de telefonia móvel”.

Quadro 2. Quadro oriundo do bando de dados para a variável tipo de plano de telefonia
móvel

Tipo de plano fi %

Pós-pago 11 55

Pré-pago 9 45

Total geral 20 100

Poderíamos, também, obter a média do valor gasto no último mês e a sua


variabilidade. Para esses dados, o valor médio de gasto com telefonia móvel
foi de R$ 76,35 com uma variabilidade em torno da média de R$ 60,55.
Então, para as variáveis numéricas, podemos fazer tanto gráficos e tabelas
quanto calcular algumas estatísticas que sejam interessantes para a análise.
Segundo Doane e Seward (2015), um conjunto de dados pode ser constituído
por muitas variáveis. As questões que podem ser exploradas e as técnicas
analíticas usadas dependerão do tipo e do número de variáveis.
6 Fundamentos, tipos e aplicação de variáveis estatísticas

Estatística descritiva — análise que resume as variáveis, por meio de resumos ta-
bulares, gráficos e numéricos. Esse tipo de estatística permite organizar tabelas de
distribuição de frequências, elaborar gráficos e calcular algumas medidas numéricas
como médias e desvios padrão.
Estatística inferencial — quando temos as variáveis provenientes de amostras
representativas e, a partir dessa amostra, fazemos inferências para a população.

Tipos de variáveis
As variáveis se dividem em dois grandes grupos: as variáveis qualitativas
(também chamadas de variáveis categóricas ou variáveis por atributos), que são
atributos observados, e as variáveis quantitativas, que são valores numéricos.

Variáveis qualitativas
Dentro das variáveis qualitativas há mais uma divisão: nominais ou ordinais.
As variáveis qualitativas têm como resposta à variável os atributos.
As variáveis qualitativas nominais são as de nível de mensuração mais
simples. Elas são apenas um atributo associado a cada um dos resultados da
variável. Ou seja, a resposta dessa variável é apenas um nome associado. Nesse
tipo de variável não existe nenhum tipo de ordenação.
São exemplos de variáveis qualitativas nominais: sexo, raça de cachorros,
nomes de empresas, marcas de carros, entre outras.

Qual é seu sexo?


(  ) Masculino (  ) Feminino

Qual é a raça de seu cachorro?


(  ) Maltês (  ) Yorkshire (  ) Labrador
(  ) Buldogue (  ) Outra. Qual?

Qual é a montadora do seu veículo?


(  ) Ford (  ) Chevrolet (  ) Fiat (  )
Volkswagen (  ) Outra. Qual?
Fundamentos, tipos e aplicação de variáveis estatísticas 7

Quando temos um banco de dados, podemos codificar essas palavras para


facilitar a digitação dos dados obtidos. No nosso exemplo do Quadro 1, as
variáveis qualitativas nominais, são “nome” e “tipo de conta”. Poderíamos
codificar a variável do banco de dados: “tipo de conta”, por exemplo, colocando
o “0” para pré-pago e “1” para pós-pago. Isso serve apenas para facilitar a
digitação dos dados, na posterior análise é necessário que os números sejam
substituídos pelas palavras correspondentes.
Não é porque os dados foram codificados que podemos permitir que
uma média seja calculada, por exemplo, não podemos calcular média de
sexo, por mais que usemos “0” e “1” para os sexos masculino e feminino,
respectivamente.
As variáveis qualitativas nominais, quando possuírem apenas duas opções
de resposta, serão chamadas de variáveis qualitativas nominais dicotômicas,
ou simplesmente dicotômicas ou binárias. São exemplos: sexo (masculino/
feminino); respostas a um questionamento (sim/não), entre tantas outras.

Qual é seu sexo?


(  ) Masculino (  ) Feminino
Você votou nas últimas eleições?
(  ) Sim (  ) Não

As variáveis qualitativas ordinais, como o próprio nome sugere, têm


uma ordem nas respostas. Elas têm um atributo, assim como as qualitativas,
mas esse atributo possui uma ordem associada. Por exemplo, se a variável
estudada for porte de empresas (pequena, média ou grande), existe uma ordem
de grandeza. O nível de escolaridade também possui uma ordem que vai do
analfabeto ao pós-doutorado.

Qual é o porte da empresa em que você trabalha?


(  ) Microempresa (  ) Pequena (  ) Média (  ) Grande

Qual é o seu nível de escolaridade?


(  ) Analfabeto
(  ) Ensino Fundamental incompleto
(  ) Ensino Fundamental completo
(  ) Ensino Médio incompleto
(  ) Ensino Médio completo
(  ) Ensino Superior incompleto
(  ) Ensino Superior completo
8 Fundamentos, tipos e aplicação de variáveis estatísticas

(  ) Pós-graduação incompleta
(  ) Pós-graduação completa
(  ) Mestrado incompleto
(  ) Mestrado completo
(  ) Doutorado incompleto
(  ) Doutorado completo

Nas variáveis qualitativas ordinais, enquadramos as escalas do tipo Likert.


Esse tipo de variável precisa ter sempre uma quantidade ímpar de opções de
resposta, pois sempre teremos o ponto neutro, o mesmo número de pontos
favoráveis e desfavoráveis. Então podemos ter escalas Likert de 3, 5, 7, 9, 11
pontos. Podemos ter escalas Likert de satisfação, de concordância, de avaliação,
de frequência, de importância, entre outras. Veja alguns exemplos:

Escala de satisfação:
(  ) Muito satisfeito
(  ) Satisfeito
(  ) Indiferente
(  ) Insatisfeito
(  ) Muito insatisfeito

Escala de concordância:
(  ) Concordo plenamente
(  ) Concordo
(  ) Não concordo nem discordo
(  ) Discordo
(  ) Discordo plenamente

Escala de avaliação:
(  ) Excelente
(  ) Bom
(  ) Regular
(  ) Ruim
(  ) Péssimo

Escala de frequência:
(  ) Sempre
(  ) Muitas vezes
(  ) Às vezes
Fundamentos, tipos e aplicação de variáveis estatísticas 9

(  ) Raramente
(  ) Nunca

Escala de importância:
(  ) Muito importante
(  ) Importante
(  ) Indiferente
(  ) Pouco importante
(  ) Nada importante

Observe que também podemos codificar os dados para fins de tabulação.


Porém, temos que tomar cuidado que, por mais que possamos calcular médias
— isso é feito em larga escala em pesquisas —, não temos exatamente uma
média, pois se perguntarmos ao entrevistado um nível de satisfação categó-
rico, como podemos analisá-lo como um número? Podemos, nesse caso, estar
subestimando ou superestimando as respostas.
Se codificássemos a escala Likert dessa forma:

5 - Muito satisfeito
4 - Satisfeito
3 - Indiferente
2 - Insatisfeito
1 - Muito insatisfeito

Podemos calcular uma média com esses códigos, já que eles seguem uma
escala ordinal; porém, na hora de analisar, precisamos ter bastante cuidado
pois não estamos calculando uma média, uma variável em que coletamos
dados numéricos. Houve, na verdade, uma “transformação” nos dados, então,
na hora de mostrarmos essa resposta, precisamos encará-la como um índice
médio. Supondo que a média de satisfação resultasse em 3,8; afirmaríamos
que o índice médio de satisfação de 3,8 concentra os dados em média entre o
“indiferente” e o “satisfeito”.
Nas variáveis qualitativas ordinais, também podemos classificar as variáveis
intervalares. Por exemplo, se, em uma pesquisa, em vez de perguntarmos a
idade perguntarmos a faixa etária, não saberemos quantas pessoas há cada
uma das idades, mas saberemos o intervalo em que cada um dos entrevistados
está. Assim sendo, não poderemos calcular a média de idade, nem o desvio
padrão dessas variáveis, podemos apenas ter uma aproximação desses valores
considerando o ponto médio de cada um dos intervalos.
10 Fundamentos, tipos e aplicação de variáveis estatísticas

Qual é a sua faixa etária?


(  ) 15|25
(  ) 25|35
(  ) 35|45
(  ) 45|55

Qual é a sua faixa salarial?


(  ) De R$ 0,00 a R$ 1.000,00
(  ) De R$ 1.000,01 a R$ 2.000,00
(  ) De R$ 2.000,01 a R$ 4.000,00
(  ) De R$ 4.000,01 a R$ 5.000,00
(  ) Mais de R$ 5.000,01

Sempre que pudermos investigar os valores de forma quantitativa devemos contar


ou medir os valores correspondentes, pois perdemos muita informação quando
perguntamos variáveis que seriam quantitativas de forma intervalar.

Variáveis quantitativas
As variáveis quantitativas, a exemplo das variáveis qualitativas, também se
dividem em dois grupos: discretas ou contínuas. Ambas são representadas
por números.
As variáveis quantitativas discretas são variáveis que resultam de uma
contagem, portanto, podem assumir apenas valores inteiros. Segundo Doane
e Seward (2015) uma variável que assume um número contável de possíveis
valores que podem ser representados por um número inteiro é denominada
discreta.
Como exemplo, podemos usar a variável “número de aparelhos adquiridos
nos últimos 5 anos” (apresentada no Quadro 1), ela tem valores numéricos que
resultam em uma contagem de números inteiros. Para esse tipo de variável
podemos fazer cálculos matemáticos.
Já as variáveis quantitativas contínuas são resultantes de medição ou de
operações matemáticas. Nesse tipo de variável, podemos ter valores fracio-
Fundamentos, tipos e aplicação de variáveis estatísticas 11

nados, a variável pode assumir qualquer valor em um intervalo numérico. O


número de casas decimais dependerá no instrumento de medida utilizado para
a mensuração da variável. Mesmo que os dados da variável sejam apresentados
em forma de um número inteiro, precisamos analisar se a variável resultaria
em uma medição, independentemente de o número ser apresentado inteiro,
ele será considerado contínuo.
Segundo Doane e Seward (2015), em geral, tratamos dados financeiros
(dólares, euros, pesos) como contínuos, ainda que os preços no varejo variem
de 0,01 (por exemplo, vamos de US$1,25 para US$1,26).
Temos como exemplo, então, a variável “valor gasto no último mês (em
R$)”. Outros exemplos de variáveis quantitativas contínuas são: tempo de
abertura de uma empresa, velocidade de um veículo, peso de sacas de arroz, etc.

Utilização das variáveis


Todas as análises estatísticas partem das variáveis, elas são o instrumento
necessário para toda análise, seja descritiva ou inferencial. Como existem
diferentes tipos de variáveis, há também aplicações diferentes para cada tipo
de variável.
As variáveis qualitativas nominais, muitas vezes, servem para as estatísticas
descritivas. Com elas podemos montar tabelas de dados categóricos (tabelas
de frequência), podemos aplicar esses dados em gráficos que tornam a visu-
alização mais rápida e prática e podemos utilizá-las como modo de separar
outras variáveis por grupos.
Já com as variáveis qualitativas ordinais, podemos realizar alguns outros
procedimentos estatísticos além de tabelas e gráficos. Nesse caso também
existem análises numéricas, desde que observemos que não coletamos um
número e que o valor dessas operações deve ser considerado como um índice.
Para as variáveis ordinais também temos algumas técnicas inferenciais como
os testes não paramétricos.
As variáveis quantitativas nos permitem um maior número de análises.
Nas quantitativas discretas, podemos utilizar todas as técnicas descritivas,
podemos calcular as medidas numéricas, montar tabelas e gráficos, também
podemos utilizar da maioria das técnicas estatísticas inferenciais.
Nas quantitativas contínuas, nos utilizamos também de todas as análises
de estatística descritiva, além de poder fazer uso de quase todas as técnicas
de estatística inferencial disponíveis.
12 Fundamentos, tipos e aplicação de variáveis estatísticas

Vamos, então, de um atributo a uma mensuração e a quantidade de informa-


ções e análises cresce conforme a complexidade de informação das variáveis
cresce. Assim sendo, é nas variáveis que a magia da estatística acontece, são
elas que nos fornecem os argumentos necessários para as análises.
Utilizamos as variáveis para levantamentos de pesquisas de marketing, por
exemplo, quando elaboramos um questionário e investigamos um produto; ou
quando levantamos os dados contábeis de uma empresa e analisamos a sua
situação, além de podermos realizar correlações e análise de séries temporais.
Utilizamos as variáveis quando fazemos observações qualitativas em campo
ou quando coletamos dados ao longo do tempo. É com as variáveis que tudo
acontece.
É de suma importância saber classificar cada um dos tipos de variáveis para
que não sejam feitas análises estatísticas erradas. Muitas vezes, pesquisadores
perdem coletas inteiras pois não conseguem definir os tipos de variáveis
que sejam compatíveis com os objetivos de análises que eles desejam. Por
exemplo, um pesquisador deseja investigar a correlação entre valor investido
em previdência privada e o valor do salário. Essa correlação só será passível
de solução, caso essas duas variáveis sejam coletadas de forma quantitativa.
Como o objetivo é uma correlação, precisamos dos dados referentes a cada
um dos elementos das amostras, precisamos do valor exato. Não podemos,
em hipótese alguma, perguntar a renda e o valor investido em previdência em
uma escala intervalar, pois dessa maneira não conseguiremos utilizar a análise
de correlação e regressão que é feita com dados numéricos e não intervalares.
Muitos pesquisadores cometem esse erro, dispendem tempo e dinheiro sem
conseguir cumprir os objetivos delineados antes da coleta de dados.
Então, antes de iniciar qualquer levantamento ou amostra ,é preciso definir
as variáveis a serem estudadas e a maneira com que elas serão medidas. Uma
má escolha nesse momento pode arruinar todos os objetivos traçados.

Acesse o link ou o código a seguir para conhecer mais


sobre os tipos de variáveis estatísticas.

https://goo.gl/FshvEK
Fundamentos, tipos e aplicação de variáveis estatísticas 13

Referência

DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto


Alegre: AMGH, 2015.
Conteúdo:

Você também pode gostar