Você está na página 1de 6

Modelos de Respostas Qualitativas

Os modelos de respostas qualitativas são uma abordagem estatística usada para


analisar dados em que as respostas possíveis são limitadas a um conjunto de categorias
distintas. Eles são especialmente úteis quando os dados a serem analisados envolvem
variáveis categóricas, onde a resposta não é contínua, mas sim um valor discreto.
Existem diferentes tipos de modelos de respostas discretas, e cada um é
adequado para uma situação específica. Os modelos mais comuns são os Modelos de
Resposta Binária e os Modelos de Resposta Multinomial e de Resposta Ordenada.
Os Modelos de Resposta Binária são utilizados quando queremos modelar uma
variável de resposta que pode ter apenas dois resultados possíveis, como "sim" ou
"não", "1" ou "0", ou qualquer outra codificação de resposta binária. Nesse contexto, os
modelos Probit e Logit são duas abordagens comuns usadas para estimar a
probabilidade de uma resposta binária ocorrer com base em variáveis independentes.
O modelo Probit assume que a probabilidade de ocorrer a resposta positiva é
dada pela função de distribuição cumulativa da distribuição normal. Ele modela a
relação entre as variáveis independentes e a probabilidade de resposta positiva, usando a
função Probit:

(1)
Onde Φ é a função de distribuição cumulativa da distribuição normal padrão:

(2)
X representa a matriz de variáveis independentes e β é o vetor de coeficientes a
serem estimados.
A estimação dos parâmetros desse modelo é geralmente realizada por meio da
máxima verossimilhança.
Por outro lado, o modelo Logit assume que a probabilidade de ocorrer a resposta
positiva é dada pela função logística. Ele modela a relação entre as variáveis
independentes e a probabilidade de resposta positiva, usando a função Logit:
σ(z) = σ(Xβ) = 1 / (1 + exp(-Xβ)) (3)
Onde: σ(z) é a função de distribuição acumulada logística; X é a matriz de
preditores; β é o vetor de coeficientes a serem estimados.
Assim como o modelo Probit, a estimação dos parâmetros do modelo Logit é
geralmente feita por meio da máxima verossimilhança.
Tanto o modelo Probit quanto o modelo Logit são amplamente utilizados e têm
suas vantagens e desvantagens. O modelo Probit é baseado na distribuição normal, o
que pode ser apropriado em algumas situações em que a suposição de normalidade é
razoável. Por outro lado, o modelo Logit é mais flexível e não faz suposições sobre a
distribuição dos erros, tornando-o mais robusto em situações em que a normalidade não
é uma suposição razoável.
Quando se trata de testes de hipóteses nos modelos Probit e Logit, os
procedimentos são semelhantes. Geralmente, é comum testar a significância dos
coeficientes das variáveis independentes para avaliar sua importância na determinação
da resposta binária. Isso pode ser feito utilizando-se estatísticas de teste, como o teste t
ou o teste de Wald, comparando os coeficientes estimados com seus erros-padrão.
No entanto, esses modelos também apresentam alguns problemas. Um dos
problemas comuns é a colinearidade entre as variáveis independentes, o que pode
dificultar a interpretação dos coeficientes estimados e levar a resultados imprecisos.
Além disso, em algumas situações, os modelos podem apresentar dificuldades de
convergência durante o processo de estimação, especialmente quando as variáveis
independentes estão altamente correlacionadas.
Além disso, em alguns casos, tanto o modelo Probit quanto o Logit podem não
se ajustar bem aos dados, resultando em uma baixa capacidade preditiva. Nesses
casos, pode ser necessário explorar outras abordagens ou transformar as variáveis para
melhorar o ajuste do modelo. Ademais, esses modelos assumem uma relação linear
entre os preditores e a função de distribuição acumulada. Se a relação for não linear,
pode ser necessário considerar transformações dos preditores ou utilizar outras técnicas,
como modelos de regressão não linear. Os modelos de resposta binária também
assumem que as observações são independentes. Se houver dependência entre as
observações, como em dados longitudinais ou de painel, podem ser necessárias
abordagens alternativas, como modelos de regressão logística multinível.
Além disso, também pode ocorrer o problema de separação perfeita quando há
combinações específicas dos preditores que levam a uma separação completa das
categorias de resposta. Isso pode resultar em estimações imprecisas ou impossíveis de
serem obtidas, além de causar problemas na estimação dos parâmetros.
Outro desafio é a interpretação dos coeficientes estimados nos modelos Probit e
Logit. Ao contrário de modelos lineares, onde os coeficientes podem ser interpretados
diretamente como a mudança média na variável de resposta para uma unidade de
mudança na variável independente, nos modelos de resposta binária, os coeficientes
estimados representam as mudanças nas probabilidades. A interpretação precisa requer
cuidado e é importante considerar o contexto específico do problema em questão.
Uma extensão do modelo probit é o tobit. O modelo tobit é conhecido também
como um modelo de regressão censurado. O modelo Tobit assume que a relação linear
para a variável latente Y* (não observada) seja dada por:

(4)
Como Y* é não observado, os estimadores de β derivam-se das relações
observadas para (1) valores censurados de Y e (2) valores não censurados de Y. Caso,
por exemplo, a censura ocorra à esquerda de 0, a equação para os valores censurados de
Y será dada por:
(5)
A função não linear Φ define a relação entre os valores não censurados de Y e x.
A partir desta relação, obtemos um termo denominado Razão Inversa de Mills (RIM).
Por sua vez, a função para os valores não censurados de Y será definida por:
(6)
Assumindo essas duas equações, os estimadores são então obtidos por Máxima
Verossimilhança.
Há muitos fenômenos cujo regressando é do tipo contável para esses casos
utilizamos o modelo de regressão de Poisson. A regressão de Poisson é usada quando
queremos projetar o valor de uma variável de resultado calculada à partir de dados de
contagem ou tabelas de contingências.
A distribuição de Poisson é dada por:

(7)
em que f(Y) denota a probabilidade de que a variável Y assuma valores inteiros
não negativos e Y! é representado por Y! = Y × (Y - 1) × (Y - 2) × . .. × 2 × 1. Pode ser
demonstrado que:

(8)
(9)
O modelo de regressão de Poisson pode ser escrito como:
(10)
em que os Y são distribuídos independentemente como variáveis aleatórias de
Poisson com média μi para cada indivíduo expresso como:

(11)
em que os X são algumas das variáveis que poderiam afetar o valor médio.
Para fins de estimação, escrevemos o modelo como:

(12)
sendo μ substituído pela Equação (11). Como podemos ver, o modelo de
regressão resultante terá parâmetros não lineares, necessitando da estimação de uma
regressão não linear.
Já os Modelos de Resposta Multinomial (MRM) e os Modelos de Resposta
Ordenada (MRO) são técnicas estatísticas utilizadas para analisar dados de pesquisa
em que as respostas possíveis não são binárias (sim ou não), mas sim múltiplas
categorias ou ordens.
Os Modelos de Resposta Multinomial (MRM) são usados quando as respostas
possíveis se enquadram em várias categorias mutuamente exclusivas. Por exemplo, em
uma pesquisa de satisfação do cliente, as respostas podem ser "muito satisfeito",
"satisfeito", "neutro", "insatisfeito" e "muito insatisfeito". O objetivo é modelar a
probabilidade de cada resposta ocorrer em relação a um conjunto de variáveis
explicativas. Existem várias abordagens para ajustar modelos de resposta multinomial,
como o modelo logit multinomial e o modelo probit multinomial. Esses modelos
assumem diferentes distribuições subjacentes para as probabilidades das categorias e
usam diferentes funções de link para relacionar as variáveis explicativas às
probabilidades das categorias.
Por exemplo, no modelo logit multinomial, a função logit transforma as
probabilidades em uma escala logarítmica, permitindo a modelagem linear das variáveis
preditoras. A fórmula geral para o modelo logit multinomial é a seguinte:
log(pij / pR) = β0j + β1X1 + β2X2 + ... + βkXk (13)
Onde: pij é a probabilidade de ocorrência da categoria j da variável resposta; pR
é a probabilidade de ocorrência da categoria de referência; β0j é o coeficiente de
intercepção para a categoria j; β1, β2, ..., βk são os coeficientes de regressão para as
variáveis preditoras X1, X2, ..., Xk.
A categoria de referência é usada como base de comparação para as outras
categorias.
O modelo probit multinomial é uma alternativa ao modelo logit multinomial.
Enquanto o modelo logit multinomial usa a função logit como link entre as variáveis
independentes e a variável resposta, o modelo probit utiliza a função de distribuição
normal acumulada (função probit). A fórmula geral para o modelo probit multinomial é
semelhante à do modelo logit multinomial:
P(Y = j) = Φ(β0j + β1X1 + β2X2 + ... + βkXk) (14)
Onde: P(Y = j) é a probabilidade de ocorrência da categoria j da variável
resposta; Φ é a função de distribuição normal acumulada; β0j é o coeficiente de
intercepção para a categoria j; β1, β2, ..., βk são os coeficientes de regressão para as
variáveis preditoras X1, X2, ..., Xk.
Os Modelos de Resposta Ordenada (MRO) são adequados quando as respostas
estão em uma escala ordinal, ou seja, quando as categorias têm uma ordem natural. Ou
seja, as respostas têm um senso de graduação ou nível, como escala Likert com
categorias como "discordo totalmente", "discordo parcialmente", "neutro", "concordo
parcialmente" e "concordo totalmente". Nesse caso, a ordem das categorias é importante
e deve ser levada em consideração na análise. Os MRO assumem que existe uma
relação de ordenação nas categorias de resposta e modelam a probabilidade de uma
resposta cair em ou abaixo de cada categoria. Alguns exemplos de MRO incluem o
modelo logit ordenado e o modelo probit ordenado.
No modelo Logit Ordenado, a função logit cumulativa é usada para modelar as
probabilidades das categorias ordinais da variável resposta. Essa função considera a
ordem das categorias e modela as chances cumulativas de estar em uma categoria igual
ou abaixo da categoria atual. A fórmula geral para o modelo de resposta ordenada é a
seguinte:
log(p(Y ≤ j)) = β0j + β1X1 + β2X2 + ... + βkXk (15)
Onde: p(Y ≤ j) é a probabilidade de que a variável resposta Y esteja na categoria
j ou em uma categoria abaixo; β0j é o coeficiente de intercepção para a categoria j; β1,
β2, ..., βk são os coeficientes de regressão para as variáveis preditoras X1, X2, ..., Xk.
Essa formulação assume que as categorias são ordenadas em uma escala
crescente, onde j representa a categoria atual.
A fórmula geral para o modelo probit ordenado é semelhante à do modelo logit
ordenado:
P(Y ≤ j) = Φ(β0j + β1X1 + β2X2 + ... + βkXk) (16)
Onde: P(Y ≤ j) é a probabilidade de que a variável resposta Y esteja na categoria
j ou em uma categoria abaixo; Φ é a função de distribuição normal acumulada; β0j é o
coeficiente de intercepção para a categoria j; β1, β2, ..., βk são os coeficientes de
regressão para as variáveis preditoras X1, X2, ..., Xk.
Em conclusão, os modelos de resposta qualitativa representam uma abordagem
valiosa para entender e analisar fenômenos complexos, especialmente em áreas onde a
subjetividade desempenha um papel significativo.

Você também pode gostar