Você está na página 1de 16

Modelos lineares generalizados

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

Em 1972 os estatísticos J. A. Neder e R. W. M. Wedderburn publicaram um artigo, no Journal of the Royal


Statistical Society, em que propõe uma generalização do modelo de regressão linear a situações onde a
variável resposta não é quantitativa.

Naquele momento, regressão logística para a predição de probabilidade de uma classe – onde a resposta é
uma variável categórica – e a regressão de Poisson para predição de número de casos – onde a resposta é
a contagem de certo evento categórico – já eram bem conhecidas, porém a estatística ainda vivia o
predomínio de técnicas desenvolvidas para a análise de respostas quantitativas.

Será que eles intuíram o fabuloso crescimento por vir, onde finalmente respostas categóricas encontraram
seu espaço de enorme relevância na ciência da estatística? Afinal, não são elas preponderantes no mundo
que nos cerca: O mundo material da física e da química, o mundo da botânica, da biologia e das ciências
da vida, e o mundo das nossas civilizações, aquele das ciências sociais?
Texto elaborado pelo professor da disciplina na manhã do dia 16/05/2022.

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

NOSSO FOCO AQUI

Modelos de regressão linear simples e múltipla já fazem parte de outras disciplinas. Sua aplicação a
situações da área da saúde em nada alteram os fundamentos do modelo, apenas o contexto de aplicação.
Isto também se aplica a modelos de regressão logística, que são igualmente vistos em outras disciplinas.
Porém modelos de regressão de Poisson podem ser novidades. Para demostrar a ligação entre esses
modelos, decidiu-se abordá-los aqui dentro do contexto de modelos lineares generalizados.

Aplicações à área da saúde de modelos lineares generalizados:


i. regressão linear
ii. regressão logística
iii. regressão de Poisson

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

COMPONENTES DE UM MODELO LINEAR GENERALIZADO

COMPONENTE RANDÔMICO: Um modelo probabilístico que especifica a distribuição condicional da


variável resposta 𝑌 em função das variáveis explicativas 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑝

𝑃 𝑌 = 𝑦𝑖 𝑋 = 𝑥𝑖1 , 𝑥𝑖2 , … , 𝑥𝑖𝑝

PREDITOR LINEAR: Uma função linear das variáveis explicativas que é usada para a predição do valor da
função de ligação para cada conjunto de observações das variáveis explicativas

𝜂 = 𝛽0 + 𝛽1 𝑋1 + ⋯ + 𝛽𝑝 𝑋𝑝

FUNÇÃO DE LIGAÇÃO: Uma função suave e invertível chamada de função de ligação, que transforma o
valor esperado 𝜇 = 𝐸 𝑌 da variável resposta no preditor linear

𝑔 𝜇 = 𝜂 = 𝛽0 + 𝛽1 𝑋1 + ⋯ + 𝛽𝑝 𝑋𝑝

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

PASSO A PASSO

Para cada observação 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑝 = 𝑥1 , 𝑥2 , … , 𝑥𝑝 das variáveis preditivas você estima o valor


da função de ligação:
𝜂 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽𝑝 𝑥𝑝

A inversa da função de ligação fornece o valor esperado (a média) da variável resposta para esses dados de
entrada:
𝜇 = 𝑔−1 𝜂

O modelo probabilístico especifica a distribuição condicional da variável resposta 𝑌 em função das


variáveis preditivas 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑝 . Em outras palavras, especificados os valores de entrada das
variáveis preditivas, informa qual a probabilidade de se observar uma resposta 𝑌 = 𝑦𝑖 para esses dados de
entrada 𝑋 = 𝑥𝑖 = 𝑥𝑖1 , 𝑥𝑖2 , … , 𝑥𝑖𝑝 :

𝑃 𝑌 = 𝑦𝑖 𝑋 = 𝑥𝑖

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

Lembre que se 𝑌 é uma variável aleatória discreta escrevemos, para um dado valor especificado para as
variáveis preditivas 𝑥 = 𝑥1 , 𝑥2 , … , 𝑥𝑝 :

𝑝 𝑦𝑥 =𝑃 𝑌=𝑘𝑋=𝑥

𝜇 𝑥 =𝐸 𝑌=𝑘𝑋=𝑥 = 𝑘𝑝(𝑦|𝑥)
𝑘

E se 𝑌 é uma variável aleatória contínua escrevemos, para um dado valor especificado para as variáveis
preditivas 𝑥 = 𝑥1 , 𝑥2 , … , 𝑥𝑝 :

𝑓 𝑦𝑥 =𝑃 𝑌=𝑘𝑋=𝑥
+∞
𝜇 𝑥 =𝐸 𝑌=𝑦𝑋=𝑥 = 𝑦𝑓 𝑦 𝑥 𝑑𝑦
−∞

Aqui 𝑝 𝑦 𝑥 é uma função massa de probabilidade e 𝑓 𝑦 𝑥 é uma função densidade de probabilidade.

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

REGRESSÃO LINEAR

Observações 𝑋1𝑖 , 𝑋2𝑖 , … , 𝑋𝑝𝑖 , 𝑌𝑖 𝑖 = 1, … , 𝑛

Situação 𝑌 é uma variável quantitativa (contínua ou discreta)

𝑋1 , … , 𝑋𝑝 são variáveis quantitativas ou qualitativas

Exemplos Qual o índice glicêmico de uma pessoa em função da sua idade, do número de horas
dedicadas a atividades físicas por semana, se é ou não fumante, etc.

Qual o índice de massa corporal de uma pessoa em função da sua idade, do número de
horas dedicadas a atividades físicas por semana, se é fumante, se possui carro, etc.

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

REGRESSÃO LINEAR

Modelo linear 𝜂 = 𝛽0 + 𝛽1 𝑋1 + ⋯ + 𝛽𝑝 𝑋𝑝

Função de ligação 𝑔 𝜇 =𝜇=𝜂

Componente aleatório 𝑌 ~ 𝑁 𝜇, 𝜎 2 = 𝛽0 + 𝛽1 𝑋1 + ⋯ + 𝛽𝑝 𝑋𝑝 + 𝑁 0, 𝜎 2

Valor Esperado 𝐸 𝑌 =𝜇

Variância 𝑉 𝑌 = 𝜎2

Prof. Antonio Gomes de Mattos Neto - 2022


Problema 2

Distribuição normal

𝑋 ~ 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇, 𝜎 2 )

𝜇 = 𝑚é𝑑𝑖𝑎 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜

𝜎 2 = 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎

Função massa de probabilidade

1 𝑥−𝜇 2
𝑓 𝑥 = exp − − ∞ ≤ 𝑥 ≤ +∞
𝜎 2𝜋 2𝜎 2

Média e variância
𝜇=𝐸 𝑋

𝜎2 = 𝑉 𝑋

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

REGRESSÃO LOGÍSTICA

Observações 𝑋1𝑖 , 𝑋2𝑖 , … , 𝑋𝑝𝑖 , 𝑌𝑖 𝑖 = 1, … , 𝑛

Situação 𝑌 é uma variável binária

𝑋1 , … , 𝑋𝑝 são variáveis quantitativas ou qualitativas

Exemplos Se a pessoa é ou não hipertensa em função da quantidade de ingestão diária de sal,


idade e sexo

Se a pessoas foi ou não infectada por dengue em função da temperatura média do dia,
umidade relativa do ar, da estação do ano

Se o bebê é do sexo feminino a depender do tempo entre o horário do intercurso (𝑡) e o


horário da ovulação da mulher (𝑡0 )

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

REGRESSÃO LOGÍSTICA

Modelo linear 𝜂 = 𝛽0 + 𝛽1 𝑋1 + ⋯ + 𝛽𝑝 𝑋𝑝

𝜇
Função de ligação 𝑔 𝜇 = log =𝜂
1−𝜇

Componente aleatório 𝑌 ~ 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙 𝑛, 𝜇 𝑜𝑛𝑑𝑒 𝑌 = 𝑦 é 𝑎 𝑝𝑟𝑜𝑝𝑜𝑟çã𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑠𝑜𝑠

Valor Esperado 𝐸 𝑌 =𝜇

Variância 𝑉 𝑌 = 𝜇(1 − 𝜇) 𝑛

Prof. Antonio Gomes de Mattos Neto - 2022


Problema 2

Distribuição binomial (alternativa)

𝑋 ~ 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙 𝑛, 𝑝 𝑋 = 𝑝𝑟𝑜𝑝𝑜𝑟çã𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠

𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑡𝑒𝑛𝑡𝑎𝑡𝑖𝑣𝑎𝑠 𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑟𝑒𝑠𝑢𝑡𝑎𝑑𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜

𝑋 = 𝑥 = 𝑓𝑟𝑎çã𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 𝑒𝑚 𝑛 𝑡𝑒𝑛𝑡𝑎𝑡𝑖𝑣𝑎𝑠 (𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠)

Função massa de probabilidade


𝑛 0 1 2 𝑛−1 𝑛
𝑓 𝑥 = 𝑝𝑛𝑥 (1 − 𝑝)𝑛−𝑛𝑥 𝑥 = , , ,…, ,
𝑛𝑥 𝑛 𝑛 𝑛 𝑛 𝑛
Média e variância
𝜇=𝐸 𝑋 =𝑝
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝜎2 =𝑉 𝑋 = 𝑒 𝜎= 𝑉(𝑋) =
𝑛 𝑛

Prof. Antonio Gomes de Mattos Neto - 2022


Modelos lineares generalizados

REGRESSÃO DE POISSON

Observações 𝑋𝑖1 , 𝑋𝑖2 , … , 𝑋𝑖𝑝 , 𝑌𝑖 𝑖 = 1, … , 𝑛

Situação 𝑌 é uma contagem (número inteiro)

𝑋1 , … , 𝑋𝑝 são variáveis quantitativas ou qualitativas

Exemplos Número de fatalidades por trimestre devido à AIDS na Austrália (Janeiro de 1983 a
Junho de 1986)

Número diário de homicídios na cidade de São Paulo durante certo período

Número de cesarianas em hospitais em função do número total de partos

Número de casos de câncer entre fumantes em função da quantidade de cigarros


fumados
Prof. Antonio Gomes de Mattos Neto - 2021
Modelos lineares generalizados

REGRESSÃO DE POISSON

Modelo linear 𝜂 = 𝛽0 + 𝛽1 𝑋1 + ⋯ + 𝛽𝑝 𝑋𝑝

Função de ligação 𝑔 𝜇 = log 𝜇 = 𝜂

Componente aleatório 𝑌 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝜇 𝑜𝑛𝑑𝑒 𝑌 = 𝑦 é 𝑢𝑚𝑎 𝑐𝑜𝑛𝑡𝑎𝑔𝑒𝑚 𝑑𝑜𝑠 𝑒𝑣𝑒𝑛𝑡𝑜𝑠

Valor Esperado 𝐸 𝑌 =𝜇

Variância 𝑉 𝑌 =𝜇

Prof. Antonio Gomes de Mattos Neto - 2022


Problema 2

Distribuição de Poisson

𝑋 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆)

𝜆 = 𝑡𝑎𝑥𝑎 𝑑𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 𝑝𝑜𝑟 𝑎𝑙𝑔𝑢𝑚𝑎 𝑢𝑛𝑖𝑑𝑎𝑑𝑒 (𝑡𝑒𝑚𝑝𝑜, á𝑟𝑒𝑎, 𝑒𝑡𝑐)

𝑋 = 𝑥 = 𝑛º 𝑑𝑒 𝑜𝑏𝑗𝑒𝑡𝑜𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜𝑠 𝑛𝑎 𝑢𝑛𝑖𝑑𝑎𝑑𝑒

Função massa de probabilidade

𝑒 −𝜆 𝜆𝑥
𝑓 𝑥 = 𝑥 = 0, 1, 2, …
𝑥!
Média e variância
𝜇=𝐸 𝑋 =𝜆

𝜎2 = 𝑉 𝑋 = 𝜆

Prof. Antonio Gomes de Mattos Neto - 2022


Fim!

Prof. Antonio Gomes de Mattos Neto - 2022

Você também pode gostar